Учебники Онлайн


§ 25 Выделение факторов и определение их нагрузок

Исходным началом факторного анализа является составление корреляционной матрицы, а его целью - построение факторной матрицы. Итак, решается задача выделения факторов. Среди существующих способов решения. Этому ого задачи простой и общим методом выделения факторов является так называемый центроидное метод. При рассмотрении конкретного примера выделения факторов и определение их нагрузок будем пользоваться на называемым выше методом без преподавания его теоретических аспектов. Последние рассматриваются в специальной математической литературытурі.

На начальном этапе выделения факторов составляется матрица коэффициентов корреляции. Организовав редуцированную корреляционную матрицу, переходят к редуцированной факторной матрицы. Последняя должна показывать количество общих факторов, отражая корреляцию между переменными, которые изучаются. Здесь число общих факторов соответствует числу колонок редуцирован факторной матрицы. По этой же матрицы имеем погру аження каждого фактора для той или иной переменной. Это - строки факторной матрицтриці.

Согласно существующей теоремой, редуцирована матрица корреляции равен произведению редуцирован факторной матрицы на транспонированную. Схематически это выглядит так:

Из приведенной зависимости (Я =. РР ') следует уравнение, имеет важное практическое значение, позволяющее установить корреляцию на основании факторных нагрузок. Например, если есть п некорольованих факторов в. С, общих для переменных а и в то корреляция пределы а и в (г ав) равна сумме произведений нагрузок каждого из факторов на эти переменные:

Г ае =ГаСГе. СГаС 1ГеС 2 -ГаС пГеСп. ДЄ

гасгвс - нагрузка фактора. С1 при переменных а и в гас2твс2 - нагрузка фактора. С2 при переменных а и в;

ксп - нагрузка п - го фактора, общего для обоих

переменных

Приведенное выше уравнение позволяет определить корреляцию между двумя переменными, если известны нагрузки общих для этих переменных факторов. В практических расчетах всегда решается противоположная задача: опре значить факторные нагрузки на основании существующих корреляцийй.

Если предположить существование общего фактора. С1 при известных корреляциях переменнойа с тремя другими переменными е, с, и, то каждая из переменных будет характеризоваться нагрузкой общего фактора такими уравнениями r ao = (raC1) x (r0 Q);r ad = (TC,) x (r ^)

Как видим, в правой частые приведенных уравнений существует одинаковый параметрraCl в этой связи существующая теорема свидетельствует, что средняя корреляция переменной с другими переменными, розрахованаи из суммы всех корреляций (в столбце), пропорциональная корреляции этой переменной с общим факторомraCx.

в практических расчетах средняя корреляция рассчитывается путем деления суммы элементов одного столбца на корень квадратный из суммы всех столбцов матрицы в этом и заключается суть выделения факторов с по матрице парных корреляционных залежностей.

. Пример. В корреляционно-регрессионную модель урожайности зерновых культур (в) включено шесть факторов затраты труда на 1 га зерновых (xf); стоимость основных производственных фондов в расчете на 1 гектар пашни (х2) материально - денежные затраты производства в расчете на 1 гектар зерновых (х3), производство зерна на 1 человеко - час (х4) стоимость основных производственных фондов в расчете на одного работника растениеводства (х5) оплата 1 человеко - часа в зерновом хозяйстве (х6)

Как видим, поставленный аналитическая задача: получить количественную характеристику изменений урожайности под влиянием факторов интенсификации производства (х;, х3), фондооснащенности (х2) и фондовооруженности (Xj), производительности труда (х4) и ее оплаты (х6). В выборку включены 57 единиц наблюдения

В результате обработки исходной информации на. ПЭВМ получено корреляционная матрица (табл 111)

. Таблица 111

. Матрица исходных коэффициентов корреляции

Изменения

1

2

3

4

5

6

1

1000

0,175

0,136

-0,659

0,073

-0,191 1

2

1,000

0,045

-0,114

0,257

0,035 2

3

1,000

-0,152

0,117

0,164 3

4

1,000

-0,059

0,383 4

5

1,000

-0,088 5

6

1,000 6

Величина полученного множественного коэффициента корреляции (Я) по исследуемой модели составляет 0,761. Начала поиска общего для всех переменных фактора предшествует построение редуцированной корреляционной матрицы (т табл1111).

По главной диагонали этой матрицы заносятся величины максимальных значений коэффициентов корреляции в столбце (без учета алгебраических знаков). На следующем этапе рассчитывают нагрузки першог го общего фактора. С этой целью выполняют такие вычислительные операцииї:

а) отыскивают суммы параметров по колонкам с учетом алгебраических знаков;

б) определяют суммы сумм столбцов. В нашем случае эта величина (Т) составляет 2,623. Затем вычисляют ее корень квадратный: чит = 1,61957;

в) полученные по колонкам суммы делят на 4 ~. Т, имея, таким образом, нагрузку первого фактора для шести переменных, то есть - их корреляцию с исследуемым фактором. В символике нагрузки первого фактора аС1 для переменнойа выглядит так:

Vг

. Си ~ чит o

Эта характеристика записана в последней строке таблицы 111;

г) как критерий правильности расчетов используют дополнительно

исчисленную величину - ^ =. В нашем примере ее значение равно 0,61745. Как

ч /. Т

видим, при условии правильности расчетов. Т = 4т. В примере:

чит

2,623 х 0,61745 = 1,61957, что полностью совпадает с рассчитанной величиной чит.

Вторым критерием правильности расчетов есть сумма всех факторных нагрузок ее величина должна также равняться 4 ~. Т. В наших расчетах1 = 1,620 при чит = 1,61957. Расчетом рассмотренных критериев завершается анализ редуцирован корреляционной матрицы с целью определения нагрузок первого, общего для всех переменных фактора (табл112)

. Таблица 112

реду

Переменные

кованая ко

Р1

реляциини

Р2

и матрица

Р3

ис

Р4

ванных шсч

Р5

ТЫ ПЕРЕМЕННОЕ

Р6

-х (Р)

Ег

Р1

0,659

0,175

0,136

-0,659

0,073

-0,191

0,193

Р2

0,175

0,257

0,045

-0,114

0,257

0,035

0,655

Р3

0,136

0,045

0,164

-0,152

0,117

0,164

0,474

Р4

-0,659

-0,114

-0,152

0,659

-0,059

0,383

0,058

Р5

0,073

0,257

0,117

-0,059

0,257

-0,088

0,557

Р6

-0,191

0,035

0,164

0,383

-0,088

0,383

0,686

Ег

0,193

0,655

0,474

0,058

0,557

0,686

2,623

С1

0,119

0,404

0,293

0,036

0,344

0,424

1,620

Т = 2,623; чит = 1,61957; = 0,61745

'' ''. Чит

Критерий. Т - ^ = 1,61957. Критерий = 1,620

Для выделения нагрузок остальных факторов выходят из теоретической концепции (существует теорема) о том, что корреляция двух переменных, вызвана каким-либо общим для них фактором, равна произведению нагрузки. Ажене этого фактора для обеих переменных, т.е. произведению их корреляций с этим фактором. Так, корреляция между первой и второй переменнымиР4 и. Р2, обусловлена ??первым фактором, представляет собой произведение его нагрузок по первой и второй переменных. Исходя из приведенных выше расчетов, имеем:

г р, рг = г-с2 х гр2 с, = 0-119 х 0404 = 0048.

Получен по расчетам коэффициент корреляции между переменными. Р4 и. Р2 равна 0,175. Чтобы определить часть дисперсии, которая может быть обусловлена ??другими факторами, находят так называемый"остаток"путем вычитания из начального коэффициента корреляции между переменными (г рир5 = 0,175) величины коэффициента корреляции, обусловленной первым фактором (г = 0,048). Тогда имеем

0,175-0,048 = 0,127

В случае получения отрицательного остатка следует помнить, что нагрузка исследуемого фактора в соответствующих переменных имеют отрицательный знак

По данным нашего примера, для каждой пары переменных находим: разность между значением начальных коэффициентов корреляции и произведением факторных нагрузок:

г = 0659 - 0119 х 0119 = 0645;

. Ри. Ри3

г = 0175 - 0119 х 0404 = 0127;

г = 0136 - 0119 х 0293 = 0101 г = (-0659) - 0119 х 0036 = -0663 г = 0073 - 0119 х 0344 = 0,032 г = (-0191) - 0119 х 0424 = -0241

Подобные расчеты удобнее осуществлять в виде рабочих таблиц. При этом следует учитывать алгебраические знаки (табл. 113 и 114)

. Таблица 113

Матрица произведений факторных нагрузок

Переменные

Факторные нагрузки

Переменные

Ри

Р2

Р3

Р4

Р5

Р6

0,119

0,404

0,293

0,036

0,344

0,424

Ри

0,119

0,014

Р2

0,404

0,048

0,163

Р3

0,293

0,035

0,118

0,086

Р4

0,036

0,004

0,015

0,011

0,001

Р5

0,344

0,041

0,139

0,101

0,012

0,118

Р6

0,424

0,050

0,171

0,124

0,025

0,146

0,180

. Матрица первыми остатков корреляций

. Таблица 114

Переменные

Р1

Р2

Р3

Р4

Р5

Р6

Р1

0,645

0,127

0,101

-0,663

0,032

-0,241

Р2

0,127

0,094

-0,073

-0,129

0,118

-0,136

Р3

0,104

-0,073

0,078

-0,163

0,016

0,040

Р4

-0,663

-0,129

-0,163

0,658

-0,071

0,358

Р5

0,032

0,118

0,016

-0,071

0,139

-0,234

Р6

-0,241

-0,136

0,040

0,358

-0,234

0,203

Сумы

0,001

0,001

0,001

-0,010

0,000

-0,010

Для расчета нагрузок второго фактора необходимо определить среднюю корреляцию каждой переменной с другими переменными

С этой целью рассчитывают суммы по столбцам матрицы первыми остатков (табл114). Следует знать, что мерилом правильности расчетов критическая величина"0,010"Суммы по столбцам не должны превышать ее й уровень. В нашем случае расчеты, как видим, верно бачимо, вірні.

Поскольку положительные и отрицательные значения коэффициентов корреляции уравновешиваются, сумма всех столбцов матриц практически будет равна нулю. Расчет нагрузок второго фактора возможна только при наличии положительных сумм элементов столбцов матрицы. С этой целью необходимо преобразовать алгебраических знаков в матрице остатков корреляций (Эта математическая процедура не изменяет абсолютное зна чение коэффициента корреляции. С точки зрения графической интерпретации конфигурация векторов переменных сохраняет свой смысл, поскольку меняется только направление изменений переменныхних).

Расчет нагрузок второго фактора осуществляется в следующей последовательности:

1 определяет алгебраическую сумму элементов по столбцам, исключая элементы главной диагонали (в табл64 строка. В ^ г0). Найденные сумме добавляют по строке (ИИГ0). В рассматриваемом примере эта величина равна - 1,836

2. Отыскивают столбик с наибольшей отрицательной суммой (столбец. Р ^ - 0,668)

Эта сумма с положительным знаком записывается в строку с названием"Столбик 4"по вертикали данного столбца

Дальнейшие расчеты по строке осуществляют в следующей последовательности: к сумме колонки добавляют с противоположным знаком удвоенное значение элемента этого столбца, который находится на пересечении с"преобразований м строкой"Полученный результат записывают в строку с названием"Столбик 4"В нашем случае, например, величину 0,682 получаем: -0,644 -2 х 0,663; величину 0,165 имеем при расчете: - 0,093 -2 х 0,129 и тд. Вычисленные элементы (суммы) данной строки суммируем и заносим в графуємо і заносимо у графу 8

(1,262)

. Таблица 115

. Расчеты нагрузки второго фактора (преобразование знаков в матрице первыми остатков корреляции)

Переменные

Р1

Р2

Р3

Р4

Р5

Р6

2 0

Р1

0,645

0,127

0,101

+

-0,663

0,032

+

-0,241

0,001

Р2

0,127

0,094

+

-0,073

+

-0,129

0,118

+

-0,136

0,001

Р3

0,101

+

-0,073

0,078

+

-0,163

0,016

0,040

0,001

Р4

+

-0,663

+

-0,129

+

-0,163

0,658

+

-0,071

0,358

-0,010

Р5

0,032

0,118

0,016

+

-0,071

0,139

+

-0,234

0,000

Р6

+

-0,241

+

-0,136

0,040

0,358

+

-0,234

0,203

-0,010

0,001

0,001

0,001

-0,010

0,000

-0,010

-1,836

Е ч

-0,644

-0,093

-0,079

-0,668

-0,139

-0,213

Столбик 4

0,682

0,165

0,247

[-0,6681

0,003

-0,503

1,262

Далее находим следующий столбик с наибольшей отрицательной суммой. Последовательность расчета новой строки аналогична описанной выше получения элементов строк добавляем на столбцах, получая значениеx г -. Дальнейшие вычисления выполняют в последовательности, аналогичной описания расчетов по определению нагрузок первого фактора. Нагрузка второго фактора для переменной а определяют по уже известной фор рмулою:

С первые - нагрузка второго фактора для переменнойа;

^ га - сумма по колонке а;

Т - общая сумма всех коэффициентов матрицы

При исчислении факторных нагрузок возникают определенные математические тонкости, связанные с преобразованием знаков матрицы, расчетом определенных критериев, а также некоторыми методическими особенностями выделения фак кторого. Изложение математических основ этой стороны вычислительных действий выходит за рамки нашей работы. Здесь необходимо обращаться к специальной литературери.

Логическим завершением осуществляемых расчетов по делу вычленения факторов следует назвать этап прекращения выделения факторов. Среди множеств существующих методик. Я. Окунь ссылается на метод под названием"Крит терий. Саундерса"дерса" .

Суть и последовательность вычислительных операций по указанным методом такова:

1. Остатки, полученные после выделения. К-го фактора, подносят к квадрата и грустят, исключив элементы главной диагонали и обозначив число переменных п. Полученная сумма умножается на -2п - с

п -1

целью приведения ее в соответствие с полной матрицей. Полученная величина составляет значение. А

2. Разница между количеством переменных и уже выделенных факторов делиться на число переменных. Результат подносят к квадрату. Получают величину значения. В

3. Факторные нагрузки подносят к квадрата, включив нагрузки. К-го фактора, и грустят полученные величины. Число факторных нагрузок здесь равна. К х п. Результат отнимают от числа переменных (п) и полученное значение подносят к квадрата. Результат делят на количество единиц наблюдения. Получают значение. С

4. В случае. А в хс выявление факторов прекращают. При. А в. В х с вычленяет следующий фактор и осуществляется описана процедура проверки

. Пример. Рассмотрим изложенную выше методику последовательных операций на примере матрицы первыми остатков корреляции (табл. 116). Поднеся к квадрату. Первые остатки корреляций, находим их сумму, равную 1,583939 9. Далее находим производныедні:

. Таблица 116

Выходные и расчетные данные матрицы первыми остатков

Переменные

Ри

к

Р2

зреляцш III

Р3

ЕСТЫ ПЕРЕМЕННОЕ

Р4

[X

Р5

Р6

Ри

0,645

0,127

0,101

-0,663

0,032

-0,241

Р2

0,127

0,094

-0,073

-0,129

0,118

-0,136

Р3

0,101

-0,073

0,078

-0,163

0,016

0,040

Р4

-0,663

-0,129

-0,163

0,658

-0,071

0,358

Р5

0,032

0,118

0,016

-0,071

0,139

-0,234

Р6

-0,241

-0,136

0,040

0,358

-0,234

0,203

0,001

0,001

0,001

-0,010

0,000

-0,010

1,583939

0,525004

0,070519

0,036294

0,615984

0,075001

0,261137

Разница между числом переменных и числом уже выделенных факторов составляет 6-1 = 5 (В)

Дальнейшие вычислительные операции, изложенные выше в пункте 3, сводятся к нахождению значения. С. Исчисленная сумма квадратов факторных нагрузок составит 0,562634 (^. С-0) ее разница с числом переменных д равна 66-

0,563 = 5,437. Квадрат данной величины принимает значение 29,561. Находим

значение. С: 29,561: 57 = 0,519 (С). Произведение. В х. С равна 2,595. Как следует из

проведенных расчетов. А в. В х. С (3,801 -2,595). Итак по данной корреляционной

модели урожайности необходимо продолжить исследование, связанное с

вычленения следующего фактора

В той же монографии. ЯОкунь касается проблемы минимизации числа

переменных (п) для определения однозначного числа факторов (т)

","2т 1 V 8т 1. ИУТ автор приводит формулу иерстоуна:п = - ^ -

После преобразования формулы для получения числа факторов т имеем:

2п 1 -4 8п 1 п = -

2

Однозначное число факторов, вичленовуються для нашего случая

2 х 6 января-V 48 1"

составит: п = - = 3

2

Как видим, в рассматриваемой корреляционно - регрессионной модели урожайности с шестью переменными можно определить не более трех факторов

Стандартная таблица соотношений числа переменных (п) и факторов, вичленовуються имеет значение:

т

1

2

3

4

5

6

7

8

9

10

п

3

5

6

8

9

10

12

13

14

15