Задачи статистики в пакете SPSS

         

11.1 Создание таблиц сопряженности

  •  Загрузите файл studium.sav.
  •  Для создания таблиц сопряженности и вычисления меры связанности на их основе, выберите в меню команды Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Crosstabs... (Таблицы сопряженности) Откроется диалоговое окно Crosstabs (см. рис. 11.1).
Список исходных переменных содержит переменные открытого файла данных. Здесь можно выбрать переменные для строк и столбцов таблицы сопряженности. Для каждого сочетания двух переменных будет создана таблица сопряженности. Например, если в списке строк (Rows) находится три переменных, а в списке столбцов (Columns) — две, то мы получим 3*2 = 6 таблиц сопряженности. Сначала мы построим таблицу сопряженности из переменных sex (пол) и psyche (психическое состояние). Поступите следующим образом:



  •  Перенесите переменную sex в список строк, а переменную psyche — в список столбцов.

Рис. 11.1: Диалоговое окно Crosstabs (Таблицы cопряженности)

  •  Щелкните на ОК, и будет создана таблица сопряженности в стандартном формате. В окне просмотра будут показаны следующие таблицы:

Case Processing Summary (Обработанные наблюдения)

Cases (Случаи)

Valid (Допусти-мые)

Missing (Отсутству-ющие)

Total (Всего)

N

Percent

N

Percent

N

Percent

Пол* Психическое состояние

106

98,1%

2

1,9%

108

100,0%

Пол * Психическое состояние Crosstabulation (Таблица сопряженности)

Count (Число)

Психическое состояние

Total

 

Крайне неустой- чивое

Неустой-чивое

Устой-чивое Очень устойчивое
Пол

Женский

16

18

9 1

44

Мужской

3

22

32 5

62

Total

19

40

41 6

106

Первая таблица содержит информацию о числе самих наблюдений; два наблюдения содержат пропущенные значения по крайней мере в одной из двух участвующих переменных. Вторая таблица — это собственно таблица сопряженности. Переменная 'Психическое состояние" (psyche) является столбцовой переменной, так как каждое ее значение (крайне неустойчивое, устойчивое, ...) отображается в отдельном столбце. Переменная "Пол" (sex) — это переменная строк, так как каждое ее значение (женский, мужской) отображается в отдельной строке таблицы. Значение в каждой ячейке таблицы — количество наблюдений (частота). Так, например, здесь видно, что 16 респонденток оценивают свое психическое состояние как "крайне неустойчивое", а 5 респондентов-мужчин — как "очень устойчивое". Если для таблицы сопряженности приняты параметры по умолчанию, в каждой ячейке отображается только абсолютная частота. Метки переменных и значений в таблице соответствуют определениям переменных в файле данных SPSS. Числа в последней строке и в последнем столбце (Всего) показывают суммы значений соответственно по строкам и столбцам. В данном примере суммы по строкам указывают, что 44 (16+18+9+1) опрошенных — лица женского пола, а 62 — мужского. Суммы по столбцам показывают, что

19 опрошенных (16 + 3) оценивают свое психическое состояние как "крайне неустойчивое", 40 как неустойчивое, 41 как устойчивое и 6 как очень устойчивое. При анализе принимались в расчет 106 допустимых наблюдений. Полученные результаты мы можем интерпретировать следующим образом:

  •  Из 106 опрошенных, которые учитывались при анализе, — 44 женщины и 62 мужчины.
  •  16 женщин оценивают свою психику как "крайне неустойчивую", тогда как для мужчин это количество составляет только 3.
  •  Лишь одна женщина считает свое психическое состояние "очень устойчивым", а мужчин с таким состоянием пятеро.
Даже первое впечатление, которое возникает при анализе таблицы сопряженности, свидетельствует о том, что зависимость между переменными Пол и Психическое состояние существует. Женщины считают свое психическое состояние более неустойчивым, чем мужчины. Исследуем эту зависимость чуть более детально; для этого нам понадобится точно ответить на следующие вопросы:

  •  Существует ли зависимость вообще?
  •  Что можно сказать об интенсивности этой зависимости?
  •  Что можно сказать о направлении и характере этой зависимости?
Более тщательно исследовать существование зависимости позволяет вычисление значений ожидаемых частот. Чтобы определить эти значения, выполните следующие действия:

  •  Выберите в меню команды Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Crosstabs... (Таблицы сопряженности)
В списке строк у нас должна стоять переменная sex, а в списке столбцов — переменная psyche.

  •  Щелкните на кнопке Cells... (Ячейки). Откроется диалоговое окно Crosstabs: Cell Display (Таблицы сопряженности: Отображение ячеек).
По умолчанию в ячейках таблицы сопряженности отображаются только наблюдаемые значения частот. В группе Counts (Частоты) можно выбрать один или более следующих вариантов отображения:

  •  Observed (наблюдаемые): Будут отображаться наблюдаемые частоты. Это настройка по умолчанию.
  •  Expected (Ожидаемые): Если установить этот флажок, будут отображаться ожидаемые частоты. Они вычисляются как произведение сумм соответствующей строки и столбца, деленное на общую сумму частот.

Рис. 11.2: Диалоговое окно Crosstabs: Cell Display

  •  Установите флажок Expected.
  •  Щелкните на кнопке Continue, а затем на ОК. Вы получите следующую таблицу сопряженности.

Пол * Психическое состояние Crosstabulation (Таблица сопряженности)

Психическое состояние

Крайне неустой-чивое

Неусто- йчивое

Устой-чивое

Очень устой-чивое

Total

Пол

женский

Count

16

18

9

1

44

Expected Count (Ожида- емое число)

7,9

16,6

17,0

2,5

44,0

мужской

Count

3

22

32

5

62

Expected Count

11,1

23,4

24,0

3,5

62,0

"Total

Count

19

40

41

6

106

Expected Count

19,0

40,0

41,0

6,0

106,0

Теперь под наблюдаемыми частотами (Count) появились ожидаемые значения Expected Count). Эти данные мы можем интерпретировать так:

Для значений переменной "психическое состояние" "крайне неустойчивое" и "неустойчивое" абсолютная частота у опрашиваемых женщин выше, чем ожидаемая (16 и 7,9; j и 16,6), тогда как при значениях "устойчивое" и "очень устойчивое" она ниже (9 и ".0; 1 и 2,5).

У опрашиваемых мужчин мы находим противоположную тенденцию. Для значений ' крайне неустойчивое" и "неустойчивое" абсолютная частота ниже, чем ожидаемая (3 и ' 1.1; 22 и 23,4), тогда как для значений "устойчивое" и "очень устойчивое" она выше :2 и 24,0; 5и 3,5). Эти результаты мы можем объединить в следующую таблицу:

крайне неустойчивое; неустойчивое

очень устойчивое; устойчивое

Женщины абс. частота > ожидаемой частоты  абс. частота < ожидаемой частоты 
Мужщины

абс. частота < ожидаемой частоты

абс. частота > ожидаемой частоты

Таким образом, наше первоначальное впечатление, что женщины считают свое психическое состояние менее устойчивым, чем мужчины, подтверждается. Еще одну возможность выявления существования зависимости между переменными дает вычисление остатков. Эти остатки являются показателем того, насколько сильно наблюдаемые и ожидаемые частоты отклоняются друг от друга. Чтобы получить остатки частот, выполните следующие действия:

  •  Выберите в меню команды Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Crosstabs... (Таблицы сопряженности)
В списке переменных строк у нас должна стоять переменная sex, а в списке переменных столбцов — переменная psyche.

  •  Щелкните на кнопке Cells... Флажки Observed и Expected следует оставить помеченными.
В группе Residuals (Остатки) можно выбрать один или более следующих вариантов отображения:

  •  Unstandardized (Ненормированные): Отображаются ненормированные остатки, то есть разность наблюдаемых (f) и ожидаемых (f) частот.
  •  Standardized (Нормированные): Отображаются нормированные остатки. Для этого ненормированные остатки делятся на квадратный корень из ожидаемой частоты:

  •  Adj. standardized (Уточненные нормированные): Нормированные остатки вычисляются с учетом сумм по строкам и столбцам:

  •  Установите флажок Unstandardized.
  •  Щелкните на кнопке Continue, а в главном диалоговом окне — на ОК. Вы получите следующую таблицу сопряженности.

Пол * Психическое состояние Таблица сопряженности

9

Психическое состояние

Total
Крайне неустой-чивое Неустой-чивое Устой-чивое Очень устой-чивое
Пол жен-ский Count 16 18 1 44
Expected Count 7,9 16,6 17,0 2,5 44,0
Residual (Остаток) 8,1 1,4 -8,0 -1,5
муж-ской Count 3 22 32 5 62
Expected Count 11,1 23,4 24,0 3,5 62,0
Residual -8,1 -1,4 8,0 1,5
Total Count 19 40 41 6 106
Expected Count 19,0 40,0 41,0 6,0 106,0
Можно заметить, что каждый остаток равен разности наблюдаемой и теоретически ожидаемой частот в данной ячейке (например, в первой ячейке 16 - 7,9 = 8,1). Остатки делают еще более заметной противоположную тенденцию самооценки у мужчин и женщин.

Таблицы сопряженности, которые мы рассмотрели выше, имеют тот недостаток, что в них приводятся только абсолютные значения. Чтобы узнать, насколько эти значения важны по отношению к общему количеству, надо определить их процентную долю для вычисления процентных значений выполните следующие действия:

  •  Выберите в меню команды Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Cmsstabs... (Таблицы сопряженности)
  •  Не изменяя прежних настроек, щелкните на кнопке Cells... Откроется диалоговое окно Crosstabs: Cell Display (Таблицы сопряженности: Отображение ячеек). В группе Percentages (Проценты) можно выбрать один или более из нижеследующих вариантов отображения:
  •  Row (По строкам): Вычисляются процентные значения по строкам: количество наблюдений в каждой ячейке, отнесенное к сумме по строке.
  •  Column (По столбцам): Вычисляются процентные значения по столбцам: количество наблюдений в каждой ячейке в отношении к сумме столбца.
  •  Total (Полные): Вычисляются полные процентные значения: количество наблюдений в каждой ячейке, отнесенное к общей сумме наблюдений.

Пол * Психическое состояние Таблица сопряженности

    Психическое состояние Total
Крайне неустой-чивое Неустой-чивое Устой-чивое Очень устой-чивое
Пол жен-ский Count 16 18 9 1 44
Expected Count 7,9 16,6 17,0 2,5 44,0
% от Пол 36,4% 40,9% 20,5% 2,3% 100,0 %
% от Психическое состояние 84,2% 45,0% 22,0% 16,7% 41,5%
% of Total 15,1% 17,0% 8,5% ,9% 41.5%
Residual 8,1 1,4 -8,0 -1.5
муж-ской Count 3 22 32 5 62
Expected Count 11,1 23,4 24,0 3,5 62,0
% от Пол 4,8% 35,5% 51,6% 8.1% 100,0

%
% от Психическое состояние 15,8% 55,0% 78,0% 83,3% 56,5%
% of Total 2,8% 20,8% 30,2% 4,7% 58,5%
Residual -8,1 -1,4 8,0 1,5
Тotal Count 19 40 41 6 106
Expected Count 19,0 40,0 41,0 6,0 106,0
% от Пол 17,9% 37,7% 38,7% 5,7% 100.0

%
% от Психическое состояние 100,0% 100,0% 100,0 % 100.0% 100,0

%
% of Total 17,9% 37,7% 38,7% 5,7% 100,0

%
  •  Установите флажки Row, Column и Total.
  •  Щелкните на кнопке Continue, а в главном диалоговом окне — на ОК. В окне просмотра результатов будет получена таблица сопряженности, приведенная выше.
В ней дополнительно отображаются процентные значения частот по отношению к суммам строк, столбцов и общей сумме.

Возьмем для примера первую ячейку. Значения, содержащиеся в ней можно интерпретировать следующим образом:

  •  16 из 44 женщин-респонденток или 36,4% от общего числа опрашиваемых охарактеризовали свое психическое состояние как "крайне неустойчивое".
  •  Из 19 респондентов с "крайне неустойчивым" состоянием 16 — женщины, что составляет 84,2%.
  •  16 женщин-респонденток дали ответ "крайне неустойчивое", что по отношению ко всей таблице (общему количеству респондентов) составляет 15,1%.
Можно также сделать следующие общие выводы:

  •  36,4% женщин оценивают свою психику как "крайне неустойчивую", тогда как среди мужчин эта доля составляет только 4,8%.
  •  Среди опрашиваемых, оценивающих свою психику как "крайне неустойчивую", женщины составляют 84,2%, а мужчины — лишь 15,8%.
  •  77,3% (36,4% + 40,9%) женщин считают свое психическое состояние "крайне неустойчивым" или "неустойчивым", в то время, как только 40,3 % (4,8 % + 35,5 %) мужчин дают такую же оценку своего психического состояния.
  •  22,8% (20,5 %+ 2,3%) женщин и 59,7% (51,6% + 8,1%) мужчин оценивают свою психику как "устойчивую" или "очень устойчивую".
  •  2,3% женщин оценивают свое психическое состояние как "очень устойчивое", а среди мужчин эта доля составляет 8,1%.
  •  Среди опрашиваемых, оценивающих свою психику как "очень устойчивую", женщины составляют 16,7%, а мужчины — 83,3%.
На вопрос, существует ли зависимость между переменными sex и psyche, наиболее ясный ответ в данном примере дают процентные частоты по столбцам. Эти частоты сведены в следующую таблицу:

Крайне неустойчивое

Неустой-чивое

Устой-чивое

Очень устойчивое

Женский    84,2 45,0  22,0 16,7 
   Мужской    1 5,8

55,0

 78,0

83,3

Так как в нашем случае процентные распределения значительно различаются, мы можем сделать вывод о существовании статистической зависимости между признаками sex и psyche. Значительно больше женщин, чем мужчин, оценивают свое психическое состояние как "крайне неустойчивое", и значительно больше мужчин, чем женщин, оценивают свое психическое состояние как "очень устойчивое". Таким образом, наблюдается различие в оценках психического состояния, связанное с полом. Является ли это различие значимым, можно выяснить при помощи хи-квадрат-теста (см. раздел 11.3.1).

Форматы таблиц сопряженности

Можно изменить порядок сортировки переменных строк в таблице сопряженности, щелкнув в диалоговом окне Crosstabs на кнопке Formal... (Формат). Откроется диалоговое окно Crosstabs: Table Format (Таблицы сопряженности: Формат таблицы).

В группе Row Order (Порядок строк) можно выбрать один из следующих вариантов сортировки значений:

  •  Ascending (По возрастанию): Значения переменных строк отображаются в порядке возрастания от наименьшего к наибольшему. Это настройка по умолчанию.
  •  Descending (По убыванию): Значения переменных строк отображаются в порядке убывания от наибольшего к наименьшему.

Рис. 11.3: Диалоговое окно Crosstabs: Table Format

Применение переменных групп и слоев

Созданные выше таблицы сопряженности можно разделить по специальностям. Вполне может быть, что переменная fach (Специальность) оказывает влияние на зависимость между sex и psyche. Чтобы выявить возможные различия, следует создать отдельные таблицы, в нашем случае — по одной таблице для каждой специальности. Такие таблицы могут выявить интересные различия между отдельными специальностями. В рассматриваемом примере переменная fach играет роль переменной слоев. Анализ производится по группам, то есть для каждой группы — в нашем случае для каждой специальности — составляется отдельная таблица сопряженности.

Чтобы задать переменную слоев, поступите так:

  •  Выберите в меню команды Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Crosstabs... (Таблица сопряженности)
В списке строк у нас должна стоять переменная sex, а в списке столбцов — переменная psyche.

  • Перенесите переменную fach в список переменных слоев. В диалоговом окне это третий сверху список; он еще пуст. Диалоговое окно Crosstabs приобретет вид, показанный на рис. 11.4.

Рис. 11.4: Заполненное диалоговое окно Crosstabs

Можно выбрать другие уровни переменных слоев. Для каждой категории каждой из переменной слоев будет создана отдельная таблица сопряженности. Чтобы добавить новый слой, щелкните на кнопке Next (Следующий). Каждый последующий уровень делит таблицу сопряженности на меньшие подгруппы. Переходить от одного слоя к другому можно при помощи кнопок Next и Previous (Предыдущий).

  •  Щелкните на ОК. Вы получите таблицы сопряженности переменных sex и psyche отдельно для каждой специальности. Предоставляем вам самостоятельно интерпретировать их содержание.
Содержание раздела