ВЫБОР МЕТОДА ОЦЕНКИ МАТРИЦЫ НАГРУЗОК В ФАКТОРНОМ АНАЛИЗЕ И АЛГОРИТМ ОЦЕНКИ ПРИ НУЛЕВЫХ НАГРУЗКАХ НА ЧАСТЬ СПЕЦИФИЧЕСКИХ ФАКТОРОВ

Орлова И.В. 1 Турундаевский В.Б. 2

1 Финансовый университет при Правительстве Российской Федерации

2 Московский государственный университет экономики

В статье делается выбор между двумя наиболее применяемыми на практике методами оценки матрицы нагрузок: методом главных осей и методом максимального правдоподобия Лоули. В силу ряда причин рекомендуется использовать метод максимального правдоподобия. Однако методом нельзя пользоваться, если дисперсии некоторых специфических факторов равны нулю. Предлагается метод решения задачи в этом случае. Смысл метода состоит в добавлении к исходным переменным искусственно сгенерированных специфических факторов, с тем, чтобы к преобразованным данным можно было применить метод максимального правдоподобия. Предлагаемый метод пригоден к использованию и в случае коллинеарности исходных признаков, что расширяет возможности применения факторного анализа. Статья содержит 6 подразделов: 1. Введение. 2. Выбор метода оценки матрицы нагрузок на общие факторы. 3. Получение оценок матриц L и V. 4. Оценка числа общих факторов. 5. Случай вырожденного распределения.

Статья в формате PDF

743 KB

наблюдаемые признаки

ковариационная матрица

корреляционная матрица

выборочная ковариационная матрица

факторный анализ

общие факторы

специфические факторы

матрица нагрузок на факторы

вырожденное распределение

метод максимального правдоподобия

распределение Уишарта

Дубров А.М., Турундаевский В.Б., Френкель А.А. О задачах факторного анализа при отсутствии части специфических факторов // Учёные записки по статистике. т. 33. Прикладной многомерный статистический анализ. – М.: Наука, 1978.

Окунь Я. Факторный анализ: пер. с польск. – М.: Статистика, 1974.

Харман Г. Современный факторный анализ. – М.: Статистика, 1972.

Lawley D.N., Maxwell A.E. Factor Analysis as a Statistical Method, 2nd ed. – London: Butterworths, 1971.

Lawley D.N. Some new results in maximum likelihood factor analysis. Proceeding of Royal Society of Edinburgh, 1966–1967, v. A67.

1. Пусть x₁, x₂, …, x_p – p наблюдаемых признаков, orlova01.wmf – результаты i-го наблюдения признаков, i = 1, 2, …, n, Х = (x_ij) – матрица наблюдений (исходных данных). В факторном анализе предполагается, что x_j является линейной комбинацией m линейно независимых факторов, так называемых «общих факторов» f₁, f₂, …, f_m, плюс «специфический» для данного признака фактор e_i, некоррелированный ни с общими факторами, ни с другими специфическими факторами,

orlova02.wmf (1)

Будем считать x_iцентрированными, а факторы – ортогональными:

M(x_i) = 0; M(f_j) = 0;

M(e_i) = 0; σ²(f_j) = 1;

σ²(e_i) = v_i; cov(f_i, f_j) = 0.

Общие факторы f_j являются «причиной» корреляций между признаками x_i. Эти факторы представляют собой непосредственно не измеряемые, скрытые (латентные) переменные, в той или иной мере связанные с исходными наблюдаемыми переменными. Ковариационная матрица ∑ исходных признаков x_i, в соответствии с моделью факторного анализа (1), может быть представлена в виде

orlova03.wmf (2)

где L = (l_ij) – матрица нагрузок на общие факторы, i = 1, 2, …, p, j = 1, 2, …, m; V – диагональная матрица дисперсий специфических факторов e_i. Диагональные элементы матрицы orlova04.wmf представляют собой дисперсии признаков, объясняемые m общими факторами. Эти элементы называются общностями, а сама матрица ∑⁺ – редуцированной корреляционной матрицей.

Выбор метода оценки матрицы нагрузок на общие факторы

Оценки матрицы нагрузок L обычно получают одним из двух способов: методом главных осей или методом максимального правдоподобия [1, 2, 4]. В методе главных осей в качестве оценок матрицы нагрузок выбирают первые m собственных векторов редуцированной корреляционной матрицы ∑⁺, соответствующие наибольшим собственным значениям матрицы ∑⁺. В методе максимального правдоподобия оценка матрицы нагрузок получается путём максимизации функции правдоподобия, считая, что вектор наблюдаемых признаков orlova05.wmf имеет многомерное нормальное распределение. Хотя оба метода направлены на максимальное приближение внедиагональных элементов корреляционной матрицы, тем не менее методы дают несколько различные результаты. При этом, как показали результаты численного моделирования, метод максимального правдоподобия приближает корреляционную матрицу немного лучше метода главных осей, даже если вектор наблюдаемых переменных orlova06.wmf не имеет многомерное нормальное распределение. При этом метод максимального правдоподобия имеет под собой строгое математическое обоснование и оценки максимального правдоподобия обладают рядом хороших свойств, как-то: состоятельность, асимптотическая эффективность и асимптотическая несмещённость. Поэтому выбор метода максимального правдоподобия является предпочтительным. Однако метод максимального правдоподобия для оценки матрицы нагрузок не может применяться в некоторых ситуациях, например когда дисперсии специфических факторов равны нулю. В этой ситуации нами предлагается добавить в процесс оценивания преобразование исходных данных, с тем чтобы к преобразованным данным можно было применить метод максимального правдоподобия. Рассмотрим подробнее метод решения задач факторного анализа в этих ситуациях.

При практическом использовании факторного анализа часто возникают следующие ситуации:

1) некоторые специфические факторы отсутствуют в факторной модели;

2) выборочная ковариационная матрица исходных переменных не является положительно определенной.

Пусть orlova07.wmf – выборка из р-мерной нормальной совокупности N (0, ∑).

Допустим, что вектор orlova08.wmf генеральной совокупности удовлетворяет модели факторного анализа (1)

orlova09.wmf (3)

где orlova10.wmf – вектор наблюдаемых переменных, orlova11.wmf orlova12.wmf – векторы общих и специфических факторов соответственно, не наблюдаемые непосредственно; L = (l_jk) – матрица нагрузок orlova13.wmf на общие факторы.

В модели (3) предполагается, что (m + p)-мерный вектор факторов orlova14.wmf имеет нулевое математическое ожидание и ковариационная матрица orlova15.wmf имеет вид

orlova16.wmf

где orlova17.wmf – единичная матрица; orlova18.wmf – диагональная матрица.

Из модели (3) вытекает, что ковариационная матрица вектора orlova19.wmf равна

orlova20.wmf (4)

В приложениях факторного анализа возникают следующие задачи [1]:

1. Получение оценок матриц L и V.

2. Оценка числа общих факторов m.

3. Решение первых двух задач в условиях сильной коррелированности переменных, когда некоторые из них являются линейными комбинациями остальных.

Обозначим через S выборочную ковариационную матрицу вектора orlova21.wmf .

Допустим, что ковариационная матрица ∑ не вырождена. Тогда матрица S имеет распределение Уишарта, и оценка максимального правдоподобия матриц L и V получается из условия максимизации функции Z₀ [4, 5]:

orlova22.wmf (5)

В литературе описаны два основных подхода к решению задачи максимизации функции Z₀ [2, 3, 4]. В обоих известных методах, основанных на них, предполагается, что все оценки дисперсий специфических факторов orlova23.wmf отличны от нуля. Однако в практических исследованиях встречаются такие матрицы S, для которых некоторые оценки orlova24.wmf близки к нулю. Это может явиться следствием одной из следующих причин:

a) в модели (3) некоторые дисперсии специфических факторов vj равны нулю, т.е. размерность вектора факторов orlova25.wmf меньше m + р. В данной ситуации при любом объеме выборки некоторые оценки orlova26.wmf могут быть близки к нулю;

б) в модели (3) некоторые v_jблизки к нулю; в этом случае, если объем выборки был бы достаточно велик, все оценки дисперсий orlova27.wmf были бы больше нуля.

В практических расчетах матрица S иногда не является положительно определенной. Это может быть вызвано тем, что

а) в модели факторного анализа (3) больше, чем m, специфических факторов имеют нулевую дисперсию ( orlova28.wmf имеет вырожденное распределение);

б) определитель |∑| близок к нулю, и вследствие недостаточно большого объема выборки или ошибок округления матрица S может оказаться не положительно определённой.

Если S не является положительно определенной, то плотность распределения Уишарта равна нулю и мы не можем воспользоваться для оценки матриц нагрузок L и V функцией максимального правдоподобия [4].

Поскольку проверка гипотез о числе общих факторов производится после того, как определены оценки orlova29.wmf и orlova30.wmf [4], то в рассматриваемых ситуациях мы не сможем проверить эти гипотезы. Если максимум функции правдоподобия (5) ищется методом Лоули [4], то число общих факторов m и начальные приближения оценок orlova31.wmf и orlova32.wmf часто находят центроидным методом. Следует отметить, что в рассматриваемых ситуациях мы не сможем оценить число общих факторов также и в центроидном методе.

Итак, в ряде случаев нельзя использовать разработанный аппарат оценок максимального правдоподобия матриц orlova33.wmf и orlova34.wmf и, соответственно, проверить гипотезы о числе общих факторов.

Для решения этих задач можно предложить искусственно увеличивать дисперсии специфических факторов.

Получение оценок матриц L и V

Пусть orlova35.wmf – случайная величина с диагональной ковариационной матрицей, не зависящая от orlova36.wmf . Обозначим через orlova37.wmf выборочную ковариационную матрицу случайного вектора orlova38.wmf и через orlova39.wmf – матрицу выборочных коэффициентов ковариации векторов orlova40.wmf и orlova41.wmf ,

orlova42.wmf

где orlova43.wmf , orlova44.wmf – векторы значений orlova45.wmf и orlova46.wmf в i-м наблюдении, n + 1 – объем выборки.

Для того, чтобы дисперсии всех специфических факторов сделать отличными от нуля, прибавим к обеим частям модели (2) вектор orlova47.wmf . Тогда модель (2) примет вид

orlova48.wmf (6)

где orlova49.wmf orlova50.wmf

Матрицы нагрузок на общие факторы L в моделях (3) и (6) совпадают.

Вектор orlova51.wmf имеет многомерное нормальное распределение N(0, Σ₀), где Σ₀ = Σ + Δ.

Выберем диагональную матрицу Δ таким образом, чтобы S₀ – выборочная ковариационная матрица вектора orlova52.wmf стала положительно определенной и оценки дисперсий всех специфических факторов модели (6) стали отличными от нуля.

Выборочная ковариационная матрица S₀вектора orlova53.wmf будет иметь распределение Уишарта w(Σ₀, n). Так как S₀ положительно определена, плотность распределения Уишарта в точке S₀ отлична от нуля [4]. Следовательно, для оценки матриц L и V₀ модели (6) применим метод максимального правдоподобия. Функцию максимального правдоподобия получим, заменив в (5) orlova54.wmf на orlova55.wmf , S на S₀ и orlova56.wmf на orlova57.wmf . В силу выбора Δ оценки дисперсий специфических факторов положительны. Поэтому для максимизации функции правдоподобия можно воспользоваться любым из двух описанных в литературе подходов. При этом мы получим состоятельные, асимптотически несмещенные и эффективные оценки матриц L и V₀. Оценка матрицы нагрузок V на специфические факторы в модели (3) определяется из соотношения

orlova58.wmf .

В практических задачах часто приходится рассматривать в качестве исходной выборочную корреляционную, а не ковариационную матрицу переменных. В этом случае полученную оценку матрицы нагрузок на общие факторы вектора orlova59.wmf необходимо преобразовать, чтобы получить оценку матрицы нагрузок на вектор orlova60.wmf .

Пусть orlova61.wmf – оценка матрицы нагрузок на общие факторы нормированного вектора orlova62.wmf , orlova63.wmf и orlova64.wmf – оценки корреляционных матриц нормированных векторов orlova65.wmf и orlova66.wmf соответственно.

Очевидно,

orlova67.wmf (7)

где orlova68.wmf

Из (7) получаем

orlova69.wmf

Считая orlova70.wmf не зависящей от выборки, легко показать, что

orlova71.wmf

где orlova72.wmf – оценка матрицы L модели (6).

Оценка orlova73.wmf вычисляется по формуле

orlova74.wmf

Оценка числа общих факторов

Для проверки гипотез о числе общих факторов используется статистика [4]

orlova75.wmf

Так как матрицы S₀ и orlova76.wmf не вырождены, то можно теперь для модели (6) проверить гипотезы о числе общих факторов.

Числа общих факторов в моделях (6) и (3) равны между собой.

Очевидно, при фиксированной матрице Δ, P_m → 1 по вероятности при n → ∞, где Р_m – вероятность принять гипотезу H₀ о числе общих факторов в модели (6), равном m.

Рассмотрим зависимость статистики Z₁ от выбора матрицы Δ при фиксированном объеме выборки.

Выборочная ковариационная матрица вектора orlova77.wmf равна

orlova78.wmf (8)

Оценка максимального правдоподобия матрицы V₀ связана с S₀ и orlova79.wmf соотношением [4]

orlova80.wmf (9)

Учитывая (8) и (9), нетрудно получить, что при orlova81.wmf .

orlova82.wmf orlova83.wmf (10)

orlova84.wmf (11)

по вероятности.

При Δ_jj → ∞ оценки orlova85.wmf по вероятности, откуда, с учетом соотношений (10) и (11), получаем, что статистика Z₁ при orlova86.wmf стремится к нулю по вероятности. Следовательно, в этом случае P₀ → 1 по вероятности, где P₀ – вероятность принять гипотезу H₀ о том, что число общих факторов равно нулю.

Поскольку статистика Z₁ с ростом дисперсии «шума» убывает, при решении практических задач оценка числа общих факторов вследствие недостаточного объема выборки может оказаться заниженной. Поэтому численные значения Δ_jjследует выбирать не слишком большими, лишь бы только новые оценки дисперсий специфических факторов в модели (6) не получились равными нулю. Поскольку дисперсии оценок зависят от объема выборки, то и выбор численных значений Δ_jj будет зависеть в этом случае от объема выборки.

Факторный анализ направлен на анализ структуры внедиагональных элементов ковариационных матриц. Чем меньшие значения Δ_jj будут выбраны, тем меньше будут отличаться внедиагональные элементы выборочных ковариационных матриц S и S₀ и, следовательно, тем меньшее влияние на оценку матрицы нагрузок L окажет наложенный на статистические данные «шум» (при фиксированном объеме выборки). Это также является аргументом в пользу выбора небольших значений Δ_jj.

Случай вырожденного распределения

В практических исследованиях может встретиться ситуация, когда какая-то компонента вектора orlova88.wmf , например х₁, является линейной комбинацией остальных. Рассмотрим, как и выше, вектор orlova89.wmf и допустим, что Δ₁₁ > 0 (Δ₁₁ – дисперсия u₁). Тогда, если независимые переменные х₂, х₃,…, х_p имеют невырожденное многомерное нормальное распределение, то и вектор orlova90.wmf будет иметь невырожденное нормальное распределение и можно, таким образом, включить х₁в факторную модель (6). Это дает большую свободу в отборе переменных для факторного анализа, а также может быть использовано при построении уравнения регрессии с помощью факторного анализа.

Рецензенты:

Кобелев Н.Б., д.э.н., профессор кафедры «Системный анализ и моделирование экономических процессов», Финансовый университет при Правительстве РФ, Президент НП «Ремесленная палата России», г. Москва;

Киселёва И.А., д.э.н., профессор кафедры «Прикладная математика», МЭСИ, г. Москва.

Библиографическая ссылка

Орлова И.В., Турундаевский В.Б. ВЫБОР МЕТОДА ОЦЕНКИ МАТРИЦЫ НАГРУЗОК В ФАКТОРНОМ АНАЛИЗЕ И АЛГОРИТМ ОЦЕНКИ ПРИ НУЛЕВЫХ НАГРУЗКАХ НА ЧАСТЬ СПЕЦИФИЧЕСКИХ ФАКТОРОВ // Фундаментальные исследования. – 2015. – № 6-1. – С. 161-165;
URL: https://fundamental-research.ru/ru/article/view?id=38413 (дата обращения: 24.04.2024).

Переводная версия журнала "Современные проблемы науки и образования"
"Modern Problems of Science and Education. Surgery» (ISSN - 2686-9101)

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»

(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Современные проблемы науки и образования» список ВАК ИФ РИНЦ = 1,006

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674

«Современные наукоемкие технологии» список ВАК ИФ РИНЦ = 0,940

«Успехи современного естествознания» список ВАК ИФ РИНЦ = 0,775

«Международный журнал прикладных и фундаментальных исследований» ИФ РИНЦ = 0,593

«Международный журнал экспериментального образования» ИФ РИНЦ = 0,425

«Научное Обозрение. Биологические Науки» ИФ РИНЦ = 0,400

«Научное Обозрение. Медицинские Науки» ИФ РИНЦ = 0,801

«Научное Обозрение. Экономические Науки» ИФ РИНЦ = 0,871

«Научное Обозрение. Педагогические Науки» ИФ РИНЦ = 0,733

«Научное Обозрение. Технические Науки» ИФ РИНЦ = 0,695

«European journal of natural history» ИФ РИНЦ = 0,301

«Международный студенческий научный вестник»

Издание научной и учебно-методической литературы ISBN РИНЦ DOI

РЕЦЕНЗИИ и ОТЗЫВЫ
кандидатов и докторов наук
на статьи, авторефераты, диссертации, монографии, учебники, учебные пособия

Академия Естествознания готовит к изданию реестр новых научных направлений, разработанных российскими учеными

Научный журнал
Фундаментальные исследования

ISSN 1812-7339

"Перечень" ВАК

ИФ РИНЦ = 1,674

Библиографическая ссылка

Фундаментальные исследования
Научный журнал | ISSN 1812-7339 | ПИ №77-63397