Задание 1.

Отличается ли среднее количество лет обучения среди жителей Дании и Германии от среднего по всей Европе количества лет обучения, равного 12 годам?

Задача исследования: определить, отличается ли среднее количество лет обучения жителей Германии и Дании от среднего по Европе значения

Содержательная гипотеза: среднее количество лет обучения жителей Дании и Германии одинаково с средним значением по Европе

Для решения мы будем использовать T-test для одной выборки, т. к. нам нужно сравнить одну переменную с конкретным значением, которое неизменно.

Статистическая гипотеза: H0: μ1=12 (мат. ожидание количества лет обучения у жителей Германии и Дании равно мат. ожиданию количества лет обучения по всей Европе, а именно 12 годам)

С помощью SPSS проводим t-test для одной переменной

Уровень значимости равен 0,000 , соответственно значение меньше α, поэтому мы отвергаем нашу статистическую гипотезу H0, то есть с вероятностью 95% среднее количество лет обучения в Дании и Германии не равно среднему количеству в целом по Европе. Из полученных данных мы видим, что среднее значение для Дании и Германии составляет 13,2 лет, что заметно отличается от 12.

Вывод: с вероятностью 95% гипотеза о том, что среднее количество лет обучения в Германии и Дании одинаково с средним по Европе, не подтвердилась: средние значение отличаются, если точнее в Дании и Германии это значение в среднем выше на 1,2 лет.

Задание 2.

Различается ли средний уровень доверия полиции среди мужчин и женщин?

Задача исследования: определить, различается ли средний уровень доверия полиции среди мужчин и женщин Дании и Германии

Содержательная гипотеза: среди мужчин и женщин Дании и Германии средний уровень доверия одинаковый

Для решения мы будем использовать T-test для независимых выборок, т.к. процедура отбора единиц в первую выборку(мужчины) никак не связана с процедурой отбора единиц во вторую выборку(женщин).

Статистическая гипотеза: H0: μ1=μ2 (мат. ожидание уровня доверия полиции мужчин равно мат. ожиданию уровня доверия женщин)

С помощью SPSS проводим t-test для независимых переменных

Из полученных данных мы видим, что среди жителей Дании и Германии в опросе приняло участие 2 359 мужчин и 2 231 женщина. По шкале от «0» до «10», где «0»- абсолютное недоверие полиции и «10»-полное доверие, в среднем мужчины и женщины оценили в свой уровень доверия на чуть больше 7 (7,08 и 7,07 мужчины и женщины соответственно). Стандартное отклонение составило 2,214 у мужчин и 2,059 у женщин. Это означает, что разброс в оценках уровня доверия полиции среди мужчин несильно, но больше, чем таковой у женщин. Можно сделать вывод, что было много оценок, которые на чуть больше чем два, отличались от среднего значения в ту или иную сторону.

Далее делаем выводы относительно генеральной совокупности. Определим, одинаковы ли генеральные дисперсии.
H0: V.1=V.2 (среди жителей Дании и Германии дисперсия уровня доверия полиции у мужчин и женщин одинакова)
Коэффициент значимость в левой части таблицы составил 0,009. Это значение меньше α, поэтому можно сказать, что с вероятностью 95% мы отвергаем гипотезу о равенстве дисперсий, соответственно дисперсии уровня доверия среди жителей Дании и Германии у мужчин и женщин различаются.
Для того, чтобы сделать вывод о равенстве мат. ожиданий смотрим в правую часть таблицы, т. к. дисперсии различны, смотрим на строчку «Равенство дисперсий не предполагается» и находим уровень значимости. Он составляет 0,885 , данное значение больше α при вероятности 95%, поэтому с вероятностью 95% мы принимаем статистическую гипотезу о том, что мат. ожидания уровня доверия полиции мужчин равно мат. ожиданию уровня доверия женщин.

Вывод: для жителей Дании и Германии, которые были опрошены, характерен уровень доверия полиции у мужчин и женщин выше среднего (около 7 из 10), кроме того, с вероятностью 95% уровень доверия одинаков как у мужчин, так и у женщин, соответственно связи между полом респондентов и их уровнем доверия полиции нет.

Задание 3.

Одинаков ли уровень доверия политикам и политическим партиям среди жителей Дании и Германии?

Задача исследования: Определить, одинаков ли уровень доверия политикам и политическим партиям среди жителей Дании и Германии

Содержательная гипотеза: Среди жителей Дании и Германии уровень доверия политикам и политическим партиям одинаковый

Для решения мы будем использовать T-test для парных выборок, т.к. каждый объект из одной выборки (уровень доверия политикам) соответствует определенному объекту во второй выборке (уровень доверия политическим партиям).

Статистическая гипотеза: H0: μ1=μ2 (мат. ожидание уровня доверия политикам равно мат. ожиданию уровня доверия политическим партиям)

С помощью SPSS проводим t-test для парных выборок

Мы видим, что среднее значение доверия политикам и политическим партиям практически одинаково (3,89 и 3,91 соответственно). Также видно, что стандартное отклонение и соответственно дисперсия также практически равны. Это значит, что у жителей Германии и Дании разброс данных по уровню доверия политикам и политическим партиям примерно равный.

Далее необходимо сделать выводы относительно генеральной совокупности, чтобы определить равны ли мат. ожидания. В таблице Критерий парных выборок уровень значимости равен 0, 184, что больше α, поэтому принимаем гипотезу о равенстве мат. ожиданий. С вероятностью в 95% среди жителей Германии и Дании уровень доверия политикам и политическим партиям одинаковый. Учитывая, что шкала 10-ти балльная, можно сказать, что этот уровень ниже среднего.

Далее проверяем, есть ли связь между уровнем доверия политикам и политическим партиям. Статистическая гипотеза H0: corr.=0 (между доверием политикам и полит. партиям связи нет).
Из таблицы Корреляции парных выборок находим уровень значимости, который равен 0,000, что меньше α, поэтому с 95% вероятностью мы отвергаем гипотезу, соответственно связь между уровнем доверия политикам и партиям есть, коэффициент корреляции составил 0,862.

Вывод: с 95% вероятностью среди жителей Дании и Германии уровень доверия политикам и политическим партиям одинаковый, также между двумя этими параметрами есть прямая тесная связь.

Задание 4.

Различается ли средняя длительность рабочей недели среди работников, занятых на предприятиях разного размера?

Задача исследования: Определить, зависит ли длительность рабочей недели от размера предприятия

Содержательная гипотеза: с увеличением размера предприятия длительность рабочей недели растет

У нас есть 5 групп предприятий разного размера, которые мы должны сравнить, поэтому мы не можем использовать т-тест. Для сравнения 5 параметров мы будем использовать дисперсионный анализ.

Статистическая гипотеза:
H0: μ1=μ2= μ3=μ4= μ5 (мат. ожидание средней длительности рабочей недели не отличается в 5 группах предприятий)

Построим таблицу средних значений.
Из таблицы видно, что с ростом предприятия практически всегда среднее количество рабочих часов в неделю растет. Кроме того, мы видим, что большинство респондентов работают на предприятии с количеством работников до 10.

Проводим однофакторный дисперсионный анализ для проверки основной статистической гипотезы дисперсионного анализа.

Уровень значимости равен 0,000 ,поэтому с вероятностью 95% мы отвергаем статистическую гипотезу о равенстве всех пяти математических ожиданий. То есть, можно сделать вывод, что неравны мат. ожидания хотя бы в двух группах предприятий. Иными словами, среднее количество рабочих часов в неделю различается хотя бы в двух группах предприятий. Справедливо также сказать, что размер предприятия обуславливает количество рабочих часов в неделю, соответственно связь между двумя параметрами есть.

Теперь мы должны провести множественные сравнение, точнее применить post hoc критерии.

Критерий множественных сравнений выбирается, исходя из размера объемов сравниваемых групп и соотношений дисперсий в этих группах. Для этого проводим тест на равенство дисперсий. В этом тест проверяется статистическая гипотеза о равенстве дисперсий. Уровень значимости равен 0,000, поэтому с вероятностью 95% мы отвергаем гипотезу о равенстве дисперсий, то есть дисперсии для 5 групп предприятий различны. Из таблицы Отчет чуть выше мы видим, что эти группы также разного объема.

Отсюда следует, что мы должны использовать критерий множественного сравнения

Данный критерий проверяет стат. гипотезу о равенстве в генеральной совокупности средних значений во всех возможных сочетаниях двух размерах предприятия.
Среднее количество рабочих часов в неделю на предприятиях размера менее 10 с вероятностью 95% совпадает с количеством рабочих часов на предприятиях размером от 10 до 99 и не совпадает на предприятиях с количеством работников от 100.
Среднее количество рабочих часов в неделю на предприятиях размера 10-24 с вероятностью 95% совпадает с количеством рабочих часов на предприятиях до 10 и не совпадает на предприятиях с количеством работников от 25.
Среднее количество рабочих часов в неделю на предприятиях размера 25-99 с вероятностью 95% совпадает с количеством рабочих часов на предприятиях до 10 и не совпадает на предприятиях с количеством работников от 10.
Среднее количество рабочих часов в неделю на предприятиях размера 100-499 с вероятностью 95% совпадает с количеством рабочих часов на предприятиях от 500 и не совпадает на предприятиях с количеством работников до 100.
Среднее количество рабочих часов в неделю на предприятиях размера от 500 с вероятностью 95% совпадает с количеством рабочих часов на предприятиях от 100 до 499 и не совпадает на предприятиях с количеством работников до 100.

Вывод: среди жителей Дании и Германии среднее значение рабочих часов в неделю различается в зависимости от размера предприятия. Наша статистическая гипотеза о том, что с увеличением размера предприятия количество рабочих часов увеличивается подтвердилась. Кроме того, мы выяснили, что в генеральной совокупности с вероятностью в 95% среди некоторых пар размеров предприятий уровень рабочих часов в неделю совпадает.

Делаем выборку нужных стран (Германия и Дания)

SELECT IF (((cntry='DE')|(cntry='DK'))).
Задание 1.
Проводим T-test для одной переменной


Задание 2.
Проводим T-test для независимых выборок


Задание 3.
Проводим T-test для парных выброк


Задание 4.
Находим значение средних


Однофакторный дисперсионный анализ


Критерий однородности дисперсий


Множественные сравнения Геймса-Хоуэлла


