Учебники Онлайн


Анализ двумерных таблиц

Одной из важных задач анализа данных является поиск и оценка взаимосвязей отдельных признаков для определенной совокупности объектов. Первым шагом при решении этой задачи является построение корреляционных таблиц (их еще называют двумерными таблицами). Двумерные таблицы позволяют упорядочить информацию о распределении совокупности объектов по двум признакам. Такая таблица имеет прямоугольную форму. Количество строк в таблиц и равна количеству возможных значений одного признака, а количество колонок - количества возможных значений другой признаковнаки.

В таблице в ячейке, находящейся, например, на пересечении второй строки и четвертого цифрового колонки, стоит число 61 (число в центре ячейки). Это количество работниц (значение признаки"Пол"-"женщина"), которых не удовлетворяют условия труда (значение признака"Удовлетворенность условиями труда"-"полностью не удовлетворен"t; — "повністю не задоволений").

Признак 12. Удовлетворенность условиями труда. Вопрос:. Довольны ли. Вы условиями труда на. Вашем предприятии?

Признак 86 статей

Вопрос:. Интервьюер, укажите пол респондента

Стать полностью удовлетвореный Скорее да, чем ні Скорее нет, чем ик Полностью не доволенй Разом
Лицевойк 18,4%

39

86,6%
25,5%

54

61,4%
33,0%

70

66,7%
23,1%

49

44,5%
212

60,9%
женщинама 4,4%

6

13,3%
25,0%

34

38,6%
25,7%

35

33,3%
44,9%

61

55,5%
136

39,1%
Вместе группех 45

12,9%
88

25,3%
105

30,2%
110

81,6%

Кроме того, двумерная таблица, как правило, содержит еще один дополнительный столбик и еще один дополнительный строка - так называемые маргинальные столбик и строку. Каждая клеточка маргинального столбца содержит сумму у чисел соответствующей строки, а также процент, который составляет это число по отношению к общему количеству объектов. Так, из маргинального столбца таблицы видно, что на предприятии работают 136 женщин, а это составляет 39,1% общего количества рабочих. Маргинальный строка содержит соответствующие суммы столбцов таблициці.

Кроме того, в каждой ячейке таблицы, как правило, записывают два процента - процент, который составляет число, содержащееся в ячейке, по отношению к соответствующему значение в маргинальном колонке (это ей процент записывают над числом), и процент по отношению к соответствующему значение в маргинальном строке (записывается под числом). Так, если мы снова вернемся в ячейку во второй строке четвертой го столбца таблицы, то увидим, что количество недовольных условиями труда женщин (таких на предприятии 61) составляет 44,9% общего количества женщин (а всего на предприятии работает 136 женщин) и 5 5,5% общего количества недовольных условиями труда (всего условиями труда на предприятии не удовлетворены 110 рабочих).

Из таблицы также видно, что процент женщин, не удовлетворенных условиями труда на предприятии, значительно больше, чем мужчин. Следовательно, мы можем выдвинуть гипотезу, что пол работника и удовлетворенность условиями пр раке связаны между собою.

Умение читать двумерные таблицы дается опытом, однако искать закономерности в довольно больших по размеру таблицах очень трудно. Кроме того, далеко не всегда связь между признаками можно увидеть так глазах чно. Поэтому на практике факт наличия связи между двумя признаками устанавливается с помощью так называемого критерия ^-квадрат. Этот критерий основывается на анализе частот, записанных в ячейках таблицы, и д ае возможность ответить на вопрос, можно выдвигать и анализировать гипотезу о наличии связи между двумя признаками. Пакет. ОСА не только автоматически вычисляет коэффициент ^-квадрат для каждой двумерной таблицы, но и оценивает его на уровне надежности 1% и 5% (уровень надежности - это вероятность принять ошибочное решение). Если вычисленное значение ^-квадрат является надежным на уровне 1%, то факт существования связи в можно считать установленным с вероятностью 0,9 0,99.

Для оценки силы связи вычисляют коэффициенты. Чупрова и. Крамера. Они построены на основе ноль при статистической независимости двух признаков. Значение больше нуля можно интерпретировать так: чем значение ближе к единице, тем связь теснееший.