Научный журнал
Фундаментальные исследования
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,252

СТАТИСТИЧЕСКИЙ АНАЛИЗ ВЛИЯНИЯ ОБРАЗОВАНИЯ НА БЛАГОПОЛУЧИЕ СТАРШЕГО ПОКОЛЕНИЯ ТОМСКОЙ ОБЛАСТИ

Барышева Г.А. 1 Михальчук А.А. 1 Недоспасова О.П. 1 Беркалов С.В. 1 Задорожный В.Н. 1 Терехина Л.И. 1 Касати Ф. 1
1 Национальный исследовательский Томский политехнический университет
Настоящая статья посвящена изучению влияния уровня образования на благополучие старшего поколения граждан Томской области. Представленные региональные оценки имеют особую значимость, так как население Томской области, как в целом, так и пожилые люди, традиционно обладает высоким образовательным статусом. Связь образования с иными индикаторами благополучия старшего поколения позволяет оценить его влияние на качество жизни пожилого человека и выделить его особую роль среди приоритетных направлений, обеспечивающих непрерывное благополучие пожилых людей. Образование людей старшего поколения выявлялось на основе специально разработанной анкеты в ходе социологического опроса. В статье на основе применения методов математической статистики оценено различие в уровне образования по полу как незначимое, по месту проживания и по работе – как статистически значимое, выявлены значимые связи образования с 32 прочими ранговыми индикаторами благополучия, построена их 7-факторная модель, выделена высокозначимая связь между значениями индикатора образования и пятью факторными индикаторами, ранжированными по силе их связи с образованием: F6 (Умение использовать компьютер) > F7 (Чувство оптимизма) > F5 (Социальная активность) > F2 (Финансовые возможности) > F1 (Уровень навыка в использовании компьютернх технологий). Проведен сравнительный анализ по показателю образования пенсионеров Томской области исходной региональной базы данных с базой Федерального комплексного статистического наблюдения условий жизни населения Томской области (354 респондента старше 55 лет) и получена оценка их незначимого различия (на уровне p > 0,10) как по ранговому критерию Манна – Уитни, так и по параметрическому t-критерию.
старшее поколение
образование
благополучие
статистические данные
многомерный статистический (дисперсионный
корреляционный
кластерный
факторный
регрессионный) анализ
1. Концепция долгосрочного развития Российской Федерации [Электронный ресурс]. – URL: http://economy.gov.ru/minec/activity/sections/strategicPlanning/concept/ (дата обращения: 02.05.2017).
2. Комплексное обследование условий жизни по Томской области 2014 [Электронный ресурс]. – URL: http://disk.tom.ru/4vj7gat (дата обращения: 02.05.2017).
3. Крысанова О.А. Подготовка будущего учителя физики к инновационной методической деятельности в условиях реформирования образования: дисс. ... док. пед. наук: 13.00.02 / Крысанова Оксана Анатольевна. – М., 2013. – 529 с.
4. Образование в цифрах: 2014: краткий статистический сборник. – М.: Национальный исследовательский университет «Высшая школа экономики», 2014. – 80 с.
5. Пашинян И.А. Методология исследования проблем социологии информационной безопасности. – М.: Креативная Экономика, 2012. URL: http://bgscience.ru/lib/10411.
6. Россия – 2015: Стат. Справочник/Росстат. – М., 2015. – 62 c.
7. Стратегия социально-экономического развития Томской области до 2030 года [Электронный ресурс]. – URL: http://www.investintomsk.com/Files/doc/strategiya_ser_do_2030g.pdf (дата обращения: 02.05.2017).
8. Стратегия действий в интересах граждан старшего поколения в Российской Федерации до 2025 года от 5 февраля 2016 г. № 164-р [Электронный ресурс]. – URL: http://government.ru/docs/21692/ (дата обращения: 02.05.2017).
9. Статистика российского оборазования [Электронный ресурс]. – URL: http://stat.edu.ru/stat/soc_ek_obr.shtml (дата обращения: 02.05.2017).
10. Education at a Glance 2014. OECDIndicators [Электронный ресурс]. – URL: http://www.oecd.org/edu/eag.htm (дата обращения: 02.05.2017).
11. Education for all 2000-2015: achievements and challenges [Электронный ресурс]. – URL: http://unesdoc.unesco.org/images/0023/002322/232205e.pdf (дата обращения: 02.05.2017).
12. HillT., LewickiP.(2007). STATISTICS: Methods and Applications. StatSoft, Tulsa, OK.
13. StatSoft, Inc. (2013). Electronic Statistics Textbook. Tulsa, OK: StatSoft. [Электронный ресурс]. – URL: http://www.statsoft.com/textbook/ (дата обращения: 02.05.2017).
14. The Global Age Watch Index – 2015 [Электронный ресурс]. – URL: http://www.helpage.org/global-agewatch/ (дата обращения: 02.05.2017).
15. World Education Report UNESCO [Электронный ресурс]. – URL: http:unesco.org/education/inFormation/wer/index.htm (дата обращения: 02.05.2017).

В современном мире проблема измерения взаимосвязи между оценками населением своего уровня образования и субъективным представлением о благополучии является одной из основных при формировании надежной системы показателей, используемых для оценки непрерывного благополучия населения. Особенно остро этот вопрос стоит для людей пожилого возраста. Это связано с тем, что пожилые люди представляют в современном мире самую быстрорастущую возрастную группу. По оценкам ООН каждую секунду 2 человека достигают возраста 60 лет. В настоящее время пожилых – больше, чем детей до 5 лет, а к 2050 г. их количество превысит численность детей и подростков в возрасте до 15 лет [14]. По мировым меркам Россия относится к интенсивно стареющим сообществам: по данным за 1 квартал 2016 г. численность людей в возрасте выше трудоспособного составляет 24 % населения [6]. В Томской области в старшей возрастной группе находится каждый пятый житель, при этом доля лиц в возрасте старше 60 лет стабильно растет [4].

Оценка влияния уровня образования на благополучие граждан старшего поколения представляет особый интерес для Томской области, традиционно имеющей очень высокий образовательный статус населения в целом. Еще с советских лет область является одним из признанных российских лидеров по численности студентов вузов на 10 000 населения, уступая только федеральным городам. По данному показателю Томская область превышает средние по РФ значения более чем в полтора раза [7]. Доля населения с высшим образованием в Томской области составляет 32 %, что значительно превышает средний общероссийский показатель в 23 % [10].

Интерес исследователей к оценке взаимосвязи межу уровнем образования и субъективным представлением пожилых людей о своём благополучии вызван большим объемом статистических оценок и научных исследований в данной сфере, характерных как для ведущих стран ОЭСР [1], так и для России [15], а также для иных стран с догоняющей экономикой [11].

Исследования в данной области проводятся в основном на международном уровне, охватывая, как правило, большое количество государств, хотя статистические данные собираются также и по региональному принципу [8]. Для Российской Федерации в силу значительных различий в уровне жизни населения в целом и пожилых людей в частности чрезвычайно важен региональный аспект подобных исследований, позволяющий получать сопоставимые оценки для людей старших возрастных групп, проживающих в различных районах страны [3, 5, 9].

Изменение возрастной структуры современного общества, обусловленное неуклонным возрастанием доли пожилых людей в структуре населения, требует принципиальных изменений в социально-экономической политике, необходимости отражения в ней мер, ориентированных на удовлетворение особых потребностей людей старшего возраста. Новые социально-экономические решения, в том числе на региональном уровне, должны быть ориентированы на поддержку развития человека на протяжении всей его жизни, в том числе на создание условий для повышения благополучия пожилых людей.

Целью настоящей работы является установление характера и устойчивости связей между показателями, характеризующими уровень образования пенсионеров Томской области и субъективными оценками пожилыми людьми собственного благополучия. С учетом ограниченности фактической базы по параметрам благополучия пожилых людей в РФ, в том числе в региональном разрезе, сотрудниками Международной научно-образовательной лаборатории технологий улучшения благополучия пожилых людей, созданной при финансовой поддержке Министерства образования и науки Российской Федерации на базе Томского политехнического университета, было проведено специальное социологическое исследование.

Материалы и методы исследования

В ходе исследования было опрошено 400 пенсионеров Томской области, проживающих в пяти населенных пунктах и трех районах. Анкета включала 78 вопросов, отражающих социальные, экономические, психологические и физиологические характеристики пенсионеров. Список вопросов анкеты (с выбором только одного варианта индикатора), по которым проводится анализ данных, измеренных по ранговой шкале, представлен в табл. 1.

Таблица 1

Структура анкетных данных социологического опроса на примере образования

вопроса

Вопрос

Вариант ответа

(уровень образования)

Код ответа

Ранг

ответа

№ 68

Какое у Вас образование?

Имею ученую степень

О1

1

Высшее

О2

2

Среднее специальное

О3

3

Среднее

О4

4

Неполное среднее

О5

5

 

Для исследования данных социологического обследования используются методы статистического анализа (дисперсионного, корреляционного, кластерного, факторного, регрессионного) [2, 13].

Следует заметить, что совокупность статистических характеристик и методов, которые могут быть применены для обработки анкетных данных, определяется однозначно типом измеряемой шкалы (номинальные, порядковые, интервальные).

Для номинальных (категориальных) переменных, характеризующих значения качественных признаков (пол людей, названия населенных пунктов, и т.п.), используются следующие статистические операции: расчет частот (удельных весов) объектов данной категории; определение моды изучаемого признака; применение различных методов статистического анализа, основанных на оперировании частотами (таблицами сопряженности), – критерия согласия Хи-квадрат для анализа связей между номинальными признаками и др. [12].

Для наиболее распространенных порядковых (ранговых) переменных, характеризующих возрастание или убывание степени проявления измеряемого свойства и допускающих ранжирование (упорядочивание) категорий объектов, используют ранговые (непараметрические) характеристики: медиану в качестве средней оценки, процент или в качестве меры рассеяния, ранговый коэффициент корреляции Спирмена в качестве меры связи двух признаков; ранговые критерии в качестве критериев проверки статистических гипотез, например, ранговый критерий Манна – Уитни при проверке гипотезы об однородности двух выборок или критерий Краскела – Уоллиса для проверки гипотезы об однородности более двух выборок. Измеренные в ранговой (порядковой) шкале порядковые переменные позволяют ранжировать (упорядочить) объекты, указав, какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. Однако они не позволяют сказать «на сколько больше» или «на сколько меньше».

Для интервальных переменных, характеризующих количественно объекты с помощью общей для всех объектов единицы измерения (возраст респондента, его зарплата и т.п.), используется параметрические характеристики: среднее арифметическое в качестве средней оценки, дисперсия – для оценки разброса, коэффициент линейной корреляции Пирсона – для оценки величины статистической связи между переменными; а также параметрические критерии, основанные на сравнении параметрических характеристик: t-критерий Стьюдента, основанный на сравнении средних при проверке гипотезы об однородности двух выборок или F-критерий параметрического дисперсионного анализа, основанный на сравнении дисперсий, при проверке гипотезы об однородности более двух выборок; кластерный и факторный анализы системы корреляционно связанных признаков (переменных), кластеризация (кластерный анализ) респондентов по совокупности признаков на основании параметрического дисперсионного анализа и т.д.

Результаты исследования и их обсуждение

Общее распределение респондентов по уровню образования представлено на рис. 1.

Согласно рис. 1 имеют высшее или среднее специальное образования 69 % пенсионеров Томской области.

Числовые характеристики распределения образования по уровням (О1 – О5) представлены в табл. 2.

Таблица 2

Параметры распределения образования по уровням

Индикатор

Объем выборки

Среднее

Медиана

Мин

Макс

Станд. отклон.

Асимметрия

Эксцесс

№ 68

400

3,090

3

1

5

0,935

0,430

–0,516

 

barih1.wmf

Рис. 1. Гистограмма частот образования

Рассмотрим проверку гипотез об однородности образования по номинальным индикаторам, а также связи образования с прочими ранговыми индикаторами благополучия старшего поколения Томской области на основе непараметрических (ранговых) критериев.

H1: Образование мужчин (М) и женщин (Ж) различается.

Согласно распределениям образования по уровням для мужчин (36 %) и женщин (64 %) основное различие касается уровней О2 (высшее образование) и О3 (среднее специальное образование). Среди мужчин чаще встречаются с высшим образованием (35 % с О2 и 29 % с О3), а среди женщин – со средним специальным (25 % с О2 и 48 % с О3). Однако эти различия оцениваются незначимыми (на уровне p > 0,10) согласно ранговому критерию Манна – Уитни (рис. 2).

H2: Образование в разных местах проживания (МП) различается.

Непараметрический (ранговый) критерий Краскела – Уоллиса выделяет 3 группы мест проживания, однородные по образованию, Томск, Асино {ТА – 56 % респондентов}, Северск {Сев – 14 %}, Каргасок, Teгульдет, Томский, Асиновский, Каргасокский районы {Рн – 30 %} и оценивает различие между образованием в разных местах проживания как статистически значимое (на уровне 0,050 > p ≈ 0,007 > 0,005) за счет сильно значимого (на уровне 0,0050 > p ≈ 0,0009 > 0,0005) отличия образования Сев от Рн и слабо значимого (на уровне 0,10 > p > 0,05) отличия образования ТА от Рн и Сев (рис. 2).

H3: Образование работающих (Работа, Да – 33 %) и неработающих (Работа, Нет – 67 %) пенсионеров различается.

На основании рангового критерия Манна – Уитни эти различия оцениваются как статистически значимые (на уровне 0,050 > p ≈ 0,010 > 0,005) (рис. 2).

barih2a.wmf barih2b.wmf

barih2c.wmf barih2d.wmf

Рис. 2. Сравнение образования по номинальным индикаторам Пол, МП, Работа. Примечание. По ранговой шкале: квадраты – медианы, прямоугольники – 25–75 % квартильный размах, усы – полный размах

H4: Образование работающих и неработающих пенсионеров в разных местах проживания (МП*Раб) различается.

Непараметрический (ранговый) критерий Краскела – Уоллиса оценивает различие между образованием работающих и неработающих пенсионеров в разных местах проживания как сильно значимое (на уровне 0,0050 > p ≈ 0,0040 > 0,0005) за счет сильно значимого (на уровне 0,0050 > p ≈ 0,0013 > 0,0005) отличия образования работающих Томска и Асино (ТА*Да – 19 %) от неработающих в районах (Рн*Нет – 20 %), и статистически значимого (на уровне 0,050 > p ≈ 0,008 > 0,005) отличия образования работающих Северска (Сев*Да – 4 %) от Рн*Нет и статистически значимого (на уровне 0,050 > p ≈ 0,032 > 0,005) отличия образования работающих в районах (Рн*Да – 10 %) от Рн*Нет (рис. 2).

Таблица 3

Категории значимости парных коэффициентов корреляции

Категория

значимости

Незначимо

Слабо

значимо

Статистически значимо

Сильно

значимо

Высоко

значимо

Уровень

значимости

p > 0,10

0,10 > p > 0,05

0,05 > p > 0,005

0,005 > p > 0,0005

0,0005 > p

Коэффициент

корреляции

r, R < 0,08

0,08 < r,

R < 0,10

0,10 < r,

R < 0,14

0,14 < r,

R < 0, 17

r, R > 0, 17

 

Таблица 4

Матрица парных коэффициентов корреляций непараметрического (рангового) Спирмена R и параметрического Пирсона r между индикатором образования и прочими индикаторами благополучия старшего поколения

№ в анкете

Смысловое содержание индикатора

R

r

№ 1

С каким настроением Вы смотрите в будущее?

0,28

0,27

№ 6

Удовлетворены ли Вы жилищными условиями?

0,12

0,11

№ 7_2

Имеется ли у Вас в собственности компьютер (ноутбук)?

0,21

0,21

№ 7_3

Имеется ли у Вас в собственности смартфон (планшет)?

0,14

0,16

№ 13

Как Вы оцениваете Ваше здоровье?

0,14

0,12

№ 32_2

Использование банковских услуг

0,24

0,24

№ 32_5

Использование культурно-досуговых услуг

0,19

0,19

№ 32_7

Использование платных бытовых услуг

0,138

0,138

№ 34

Членство в каких-либо общественных организациях

0,16

0,143

№ 36_3

Участие в защите окружающей среды

0,16

0,16

№ 37_3

Общение с политиком или гос. чиновником

0,13

0,12

№ 53_1

Желание пользоваться информационными технологиями

0,13

0,12

№ 56_3

Общение с родными (друзьями) в социальных сетях

0,23

0,21

№ 60_1

Финансовые возможности путешествовать

0,29

0,31

№ 60_2

Финансовые возможности оплачивать мед. услуги

0,23

0,24

№ 60_4

Финансовые возможности покупать качественные продукты

0,20

0,20

№ 60_5

Финансовые возможности сменить бытовую технику

0,15

0,15

№ 61

Умение использовать современные компьютерные устройства и технологии

0,41

0,40

№ 62_1

Как часто Вы используете компьютер, ноутбук?

0,42

0,41

№ 62_2

Как часто Вы используете планшет, смартфон?

0,20

0,19

№ 62_3

Как часто Вы используете мобильный телефон?

0,19

0,18

№ 62_4

Как часто Вы используете интернет?

0,41

0,40

№ 63_1

Уровень Вашего навыка в общении в социальных сетях

0,32

0,32

№ 63_2

Уровень навыка в поиске нужной информации в Интернете

0,36

0,35

№ 63_3

Уровень навыка в интернет-покупках, оплачивании счета

0,24

0,25

№ 63_4

Уровень навыка в скачивании фильмов, музыки

0,25

0,26

№ 63_5

Уровень навыка в использовании электронной почты

0,32

0,32

№ 63_6

Уровень навыка в общении по скайпу

0,32

0,31

№ 63_7

Уровень навыка в игре в компьютерные игры

0,21

0,22

№ 63_8

Уровень навыка в отправлении смс сообщения по мобильному телефону.

0,31

0,29

№ 74

Доход Вашей семьи на одного члена в месяц

0,30

0,30

№ 75

Материальное положение

0,27

0,24

 

H5: Образование имеет значимые корреляционные связи с прочими ранговыми индикаторами благополучия старшего поколения Томской области.

Для переменных, измеренных в порядковой шкале, имеются свои типы корреляции, позволяющие оценить зависимости. Статистика R Спирмена для ранговых переменных может рассматриваться как прямой аналог статистики r Пирсона для переменных, измеренных в количественных шкалах. Рассмотрим основную гипотезу о корреляционной связи индикатора образования с прочими индикаторами благополучия старшего поколения. Корреляционный анализ этих показателей выявил разные уровни значимости (табл. 3) корреляционных связей разных пар показателей, один из которых – образование (табл. 4).

Следует заметить, что разница между R и r максимум в 0,03 оценивается в данном случае (400 респондентов) как незначимая (на уровне p > 0,10). Данное обстоятельство позволяет применить параметрический кластерный анализ индикаторов, имеющих значимую корреляционную связь с индикатором образования, на основе корреляционного расстояния (1 – r Пирсона) в качестве меры близости индикаторов. При этом в качестве правила объединения кластеров использован метод Варда на основе параметрического дисперсионного анализа. Графические результаты кластеризации таких индикаторов (табл. 4) представлены на дендрограмме (рис. 3). Устойчивыми относительно правила объединения кластеров (методы Варда, полной связи) можно считать формирование семи корреляционно связанных групп индикаторов, обозначенных F1 – F7.

Кластерный анализ позволяет выявлять значимые (1 – r ≤ 1 – 0,1 = 0,9 – критическое значение для группы из 400 респондентов при уровне значимости 0,05) кластеры индикаторов табл. 4, т.е. факторы для построения базиса пространства индикаторов табл. 4. С помощью факторного анализа методом главных компонент построена 7-факторная модель индикаторов табл. 5. Жирным шрифтом выделены наиболее значимые факторные нагрузки, которые позволяют по совокупности показателей интерпретировать значимые факторы. В нижней строке приведены весовые коэффициенты факторов.

barih3.tif

Рис. 3. Дендрограмма корреляционной матрицы индикаторов табл. 4

Таблица 5

Факторные нагрузки индикаторов табл. 4

Индикатор

F1

F2

F3

F4

F5

F6

F7

№ 74

0,233

0,477

–0,030

0,455

0,053

–0,019

0,268

№ 75

0,096

0,658

–0,009

0,268

0,057

0,088

0,122

№ 1

–0,062

0,188

0,097

–0,026

0,158

0,169

0,629

№ 6

–0,143

0,148

–0,086

0,297

0,050

0,041

0,482

№ 7_2

0,286

–0,054

0,400

0,133

0,036

0,452

0,075

№ 7_3

0,073

–0,031

0,156

0,681

0,033

0,244

–0,004

№ 13

0,126

–0,011

0,167

–0,068

–0,047

–0,002

0,708

№ 32_2

0,140

0,231

0,590

–0,112

0,095

0,050

0,194

№ 32_5

0,073

0,085

0,649

0,030

0,062

0,077

0,152

№ 32_7

0,146

0,108

0,556

0,256

0,225

–0,024

–0,042

№ 34

0,079

–0,046

0,086

0,055

0,703

–0,024

0,179

№ 36_3

–0,027

–0,134

–0,021

–0,280

0,588

0,246

0,018

№ 37_3

0,122

0,216

0,113

0,164

0,579

–0,105

–0,183

№ 53_1

0,140

0,066

0,594

–0,016

–0,110

0,204

0,004

№ 56_3

0,336

–0,103

0,492

0,256

0,013

0,364

0,023

№ 60_1

0,299

0,517

0,004

–0,023

0,046

0,267

0,179

№ 60_2

0,264

0,613

0,117

–0,034

–0,045

0,092

–0,015

№ 60_4

0,088

0,649

0,119

0,020

0,139

0,046

–0,039

№ 60_5

0,136

0,629

0,138

–0,156

–0,267

0,131

0,049

№ 61

0,572

0,109

0,078

0,051

0,039

0,679

0,091

№ 62_1

0,530

0,081

0,088

0,120

–0,004

0,743

0,058

№ 62_2

0,232

0,110

0,005

0,571

–0,054

0,420

–0,158

№ 62_3

0,053

0,259

0,090

–0,261

0,178

0,403

–0,113

№ 62_4

0,553

0,098

0,077

0,149

–0,017

0,719

0,026

№ 63_1

0,866

0,075

0,122

0,070

–0,013

0,227

0,009

№ 63_2

0,837

0,130

0,093

0,005

0,020

0,371

0,005

№ 63_3

0,872

0,067

0,013

0,027

0,000

–0,002

–0,009

№ 63_4

0,860

0,063

0,060

0,039

0,031

0,042

0,042

№ 63_5

0,861

0,048

0,066

0,091

0,026

0,173

–0,005

№ 63_6

0,824

0,056

0,073

0,054

–0,007

0,297

–0,045

№ 63_7

0,760

0,052

–0,064

–0,016

0,166

–0,015

0,052

№ 63_8

0,644

0,128

0,154

–0,134

–0,010

0,154

0,081

Expl.Var

6,965

2,569

2,064

1,605

1,529

3,008

1,537

Prp.Totl

0,211

0,078

0,063

0,049

0,046

0,091

0,047

 

Примененный метод главных компонент является обобщением корреляционно-регрессионного анализа на случай системы многих индикаторов, среди которых не все являются линейно независимыми друг относительно друга. Если существуют зависимые между собой (коррелированные) величины, то их можно исключить переходом к новым «главным» и «некоррелированным» переменным величинам (факторам Fk). На простейшем примере системы двух случайных величин зависимость между переменными можно обнаружить с помощью диаграммы рассеяния. Полученная путем подгонки линия регрессии дает графическое представление зависимости. Если определить новую переменную на основе линии регрессии, изображенной на этой диаграмме, то такая переменная будет включать в себя наиболее существенные черты обеих переменных. Фактически, происходит сокращение числа переменных и замена двух одной. Отметим, что новая переменная (фактор) в действительности является линейной комбинацией двух исходных переменных. Пример, в котором две коррелированные переменные объединены в один фактор, показывает главную идею анализа главных компонент. Если пример с двумя переменными распространить на большее число переменных, то вычисления становятся сложнее, однако основной принцип представления двух или более зависимых переменных одним фактором остается в силе. В том случае, когда имеются три коррелированные переменные, можно построить 3-х мерную диаграмму рассеяния точно так же, как в случае двух переменных плоскую диаграмму рассеяния. Снова можно построить прямую регрессии, но уже в трехмерном пространстве. Для случая более трех переменных становится невозможным представить точки на диаграмме рассеяния, однако логика вращения осей с целью максимизации дисперсии нового фактора остается прежней. После того, как вы нашли линию, для которой дисперсия максимальна, вокруг нее остается некоторый разброс данных, на основании которого повторяется процедура выделения направления максимальной остаточной дисперсии. В анализе главных компонент именно так и делается: после того, как первый фактор выделен, то есть после того, как первая линия проведена, определяется следующая линия, максимизирующая остаточную вариацию (разброс данных вокруг первой прямой), и т.д. Таким образом, последовательно выделяются факторы, один за другим. Так как каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, то факторы оказываются независимыми друг от друга, то есть некоррелированными или ортогональными. Результатом будет новый факторный набор переменных (главных компонент Fk), которые являются не коррелирующими и линейными комбинациями первоначальных индикаторов. В основном процедура выделения главных компонент подобна вращению, максимизирующему дисперсию (варимакс) исходного пространства индикаторов. Например, на диаграмме рассеяния можно рассматривать прямую регрессии как новую (факторную) ось. Этот тип вращения называется вращением, максимизирующим дисперсию, так как цель вращения заключается в максимизации дисперсии (изменчивости) новой переменной (фактора) и минимизации разброса вокруг нее. Новый набор факторных осей, проходящих через центр облака точек исходного пространства, получен в пространстве меньшей размерности. Геометрически цель состоит в том, чтобы получить набор ортогональных факторных векторов, где каждый вектор образует прямую линию в векторном пространстве исходных переменных. Эти векторы называются осями факторов и в дальнейшем используются для вычисления факторных координат точек наблюдений, что позволяет классифицировать наблюдения по категориям.

Факторный анализ является естественным обобщением и развитием метода главных компонент. Если объект описывается с помощью системы индикаторов, то в результате действия метода получается математическая модель, зависящая от меньшего числа переменных (факторов). При этом предполагается, что на исходные измеряемые данные оказывает влияние небольшое число латентных (скрытых) признаков (факторов). Цель факторного анализа заключается в выявлении этих скрытых характеристик (факторов) и оценивании их числа. Факторный анализ преследует две главные цели: сокращение числа индикаторов (редукция данных) и определение структуры взаимосвязей между индикаторами, т.е. классификация индикаторов. Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации. Факторный анализ как метод редукции данных основан на использовании зависимости между индикаторами: вводится новая переменная (фактор) на основе регрессии, то есть включающая в себя наиболее существенные черты исходных индикаторов, так что ее использование (замена нескольких старых коррелированных индикаторов одной новой переменной (фактором)) приводит к сокращению числа переменных. При этом новый фактор представляется линейной комбинацией исходных индикаторов. Принцип представления двух или более зависимых переменных одним фактором демонстрирует главную идею факторного анализа или, более точно, анализа главных компонент. После выделения первого фактора, то есть построения первой линии регрессии, для которой дисперсия максимальна, определяется следующая линия, максимизирующая остаточную вариацию (разброс данных вокруг первой прямой), то есть выделяется второй фактор, и т.д. Факторы выделяются один за другим так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, то есть оказываются независимыми друг от друга. Другими словами, некоррелированными или ортогональными. Отметим, что в процессе последовательного выделения факторов они включают в себя все меньше и меньше изменчивости. Решение о том, когда следует остановить процедуру выделения факторов, главным образом зависит от точки зрения на то, что считать малой «случайной» изменчивостью. Это решение достаточно произвольно, однако имеются некоторые общие рекомендации, позволяющие рационально выбрать число факторов: критерий накопленной или кумулятивной дисперсии, критерий Кайзера, критерий каменистой осыпи, содержательная интерпретация полученного решения. Поэтому обычно исследуется несколько решений с большим или меньшим числом факторов (факторных моделей), и затем выбирается одно наиболее «осмысленное». Факторный анализ как метод классификации основан на оценках корреляций (факторных нагрузок) между исходными индикаторами и факторами (или «новыми» переменными) в рамках выбранной факторной модели и позволяет узнать значимость факторов, то есть можно ли интерпретировать их разумным образом и как это сделать. Факторные нагрузки можно изобразить в виде диаграммы рассеяния, на которой каждая исходная переменная (индикатор) представлена точкой в координатах «факторные нагрузки». Можно повернуть оси в любом направлении без изменения относительного положения точек; однако действительные координаты точек, то есть факторные нагрузки, должны, без сомнения, меняться. Одним из типичных методов вращения является варимакс, описанный выше. Целью вращения является получение понятной (интерпретируемой) матрицы нагрузок, то есть факторов, которые ясно отмечены высокими нагрузками для некоторых переменных и низкими – для других, что и позволяет провести классификацию переменных.

Факторные индикаторы, построенные по индикаторам табл. 4, проинтерпретированы в табл. 6.

В результате проведения факторного анализа из 32 исходных индикаторов сформировано 7 значимых факторов.

Для оценки тесноты связи между стандартизированными значениями индикатора образования № 68ст и факторными индикаторами построим множественную регрессию:

№ 68cт = bar01.wmf

Оценки частных коэффициентов корреляции (bk) № 68ст и факторными индикаторами, а также значимости (pk) их отличия от ноля приведены в табл. 7.

Согласно табл. 7, № 68 ст связано высоко значимо (на уровне 0,00050 > p) только с 5 из 7 факторных индикаторов (F1, F2, F5, F6, F7) и незначимо (на уровне p > 0,10) – с 2-мя (F3, F4). Причем рассмотрение регрессии в стандартизированной шкале позволяет ранжировать факторы по силе их связи с образованием: F6 > F7 > F5 > F2 > F1.

Представляет интерес сравнительный анализ по показателю образования пенсионеров Томской области разных баз данных: выше рассмотренной Томск – 400 2015 г. (T15) и «Комплексное обследование условий жизни» по Томской области (К14) в рамках Федерального комплексного статистического наблюдение октября 2014 г. условий жизни населения Томской области, в котором участвовали 354 респондента старше 55 лет [2].

Таблица 6

Значимые взвешенные факторы, построенные по индикаторам табл. 4

Код фактора

Вес

Интерпретация факторов

F1

№ 63_1-8 + № 61 + № 62_1,4

0,211

Уровень навыка в использовании современных компьютерных устройств и технологий

F2

№ 75 + № 60_2,4,5 + № 60_1 + № 74

0,078

Наличие финансовых возможностей

F3

№ 32_2,5,7 + № 53_1 + № 56_3 + № 7_2

0,063

Использование финансовых возможностей

F4

№ 7_3 + № 62_2 + № 74

0,049

Использование собственного планшета, смартфона

F5

№ 34 + № 36_3 + № 37_3

0,046

Социальная активность

F6

№ 61 + № 62_1,4 + № 62_2,3 + № 7_2

0,091

Умение использовать компьютер, ноутбук, интернет, смартфон, мобильный телефон

F7

№ 1 + № 13 + № 6

0,047

Чувство оптимизма (на основе удовлетворенности здоровьем и жилищными условиями)

 

Таблица 7

Multiple Regression Results№ 68сt and Fk (k = 1, 2, …,7)

№ 68ст

bk

Std.Err.bk

tk(392)

pk-value

F1

0,235

0,038

6,247

0,000

F2

0,265

0,038

7,047

0,000

F3

0,010

0,038

0,257

0,797

F4

0,038

0,038

1,018

0,309

F5

0,282

0,038

7,476

0,000

F6

0,388

0,038

10,302

0,000

F7

0,294

0,038

7,808

0,000

 

Таблица 8

Структура анкетных данных социологического опроса на примере показателя образования базы данных К14

вопроса

Вопрос

Вариант ответа

(уровень образования )

Ранг

ответа

I07_01

Какое

образование Вы имеете?

Послевузовское

1

Высшее бакалавриат

2

Высшее специалитет, магистратура

3

Неполное высшее (незаконченное высшее) – оконченные 3 курса и более

4

Среднее профессиональное

5

Начальное профессиональное

6

Среднее общее

7

Основное общее

8

Не имеете основного общего

9

 

Так как опросы проводят разные научные группы и с разными целями, то различия в формулировках и ранжировании ответов в подобных случаях – обычное дело. Тем не менее, несмотря на указанные различия, а также годовую разницу проведения опросов, сделана попытка сравнить данные выборки по показателю образования. При этом шкала ответов на вопрос I07.01 (К14) приведена в соответствии с № 68 (T15) посредством объединения ответов 2-го + 3-го, 4-го + 5-го + 6-го и 8-го + 9-го (табл. 8).

Заметим, что, согласно теории измерительных шкал, оценочная шкала уровней образования относится к типу порядковых шкал, позволяющих ранжировать (упорядочить) объекты, оценить качественнорезультаты на уровне отношений «<», « > « и «=», но не допускающих возможности введения эталонной единицы измерений образования для количественного измерения различий объектов, то есть оценочная шкала не является числовой измерительной шкалой. Поэтому в оценочной шкале использование операции среднего арифметического (и прочих конкретных математических формул) для сравнения является некорректным. В оценочной шкале обоснованным является использование медианы в качестве средней оценки. В связи с этим для сравнения рассматриваемых выборок предлагается использовать ранговые (непараметрические) критерии, основанные на рангах, а не на средних значениях.Однако полностью игнорировать средние арифметические нецелесообразно из-за их привычности и распространенности. Поэтому представляется рациональным использовать одновременно оба метода – и метод средних арифметических рангов (баллов), и метод медианных рангов. Такая рекомендация находится в согласии с общенаучной концепцией устойчивости, рекомендующей применять различные методы для обработки одних и тех же данных с целью выделить выводы, получаемые одновременно при разных методах. Поэтому в данной работе проводится сопоставление результатов исследования непараметрическими и параметрическими критериями.

В данном случае различия между № 68 и I07.01 оцениваются незначимыми как по ранговому критерию Манна – Уитни (на уровне p ≈ 0,46 > 0,10), так и по параметрическому t-критерию Стьюдента (на уровне p ≈ 0,29 > 0,10).

Выводы

Проведен многомерный статистический анализ влияния уровня образования на благополучие старшего поколения Томской области. На основе непараметрических (ранговых) критериев дисперсионного анализа оценено различие образования по полу как незначимое, по месту проживания и по работе – как статистически значимое.Корреляционный анализ выявил значимые связи уровня образования пожилых людей с 32 прочими ранговыми индикаторами благополучия старшего поколения Томской области. С помощью факторного анализа методом главных компонентов построена 7-факторная модель индикаторов, имеющих значимую корреляционную связь с индикатором образования. Регрессионный анализ оценил как высоко значимую связь между значениями индикатора уровня образования и пятью факторными индикаторами, ранжированными по силе их связи с образованием: F6 (Умение использовать компьютер) > F7 (Чувство оптимизма) > F5 (Социальная активность) > F2 (Финансовые возможности) > F1 (Уровень навыка в использовании компьютерными технологиями). Проведен сравнительный анализ по показателю образования пенсионеров Томской областии сходной базы данных с базой Федерального комплексного статистического наблюдения октября 2014 г. условий жизни населения Томской области (354 респондента старше 55 лет) и получена оценка их незначимого различия (на уровне p > 0,10) как по ранговому критерию Манна – Уитни, так и по параметрическом уt-критерию.

Эта работа была выполнена авторами в сотрудничестве с Томским политехническим университетом в рамках проекта по оценке и повышению социального, экономического и эмоционального благополучия пожилых людей в соответствии с Соглашением № 14.Z50.31.0029.


Библиографическая ссылка

Барышева Г.А., Михальчук А.А., Недоспасова О.П., Беркалов С.В., Задорожный В.Н., Терехина Л.И., Касати Ф. СТАТИСТИЧЕСКИЙ АНАЛИЗ ВЛИЯНИЯ ОБРАЗОВАНИЯ НА БЛАГОПОЛУЧИЕ СТАРШЕГО ПОКОЛЕНИЯ ТОМСКОЙ ОБЛАСТИ // Фундаментальные исследования. – 2017. – № 8-2. – С. 357-367;
URL: http://www.fundamental-research.ru/ru/article/view?id=41674 (дата обращения: 17.10.2017).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.094