Практикум по анализу данных в социологии в программе SPSS
Шрифт:
В главе рассматриваются разные виды регрессионного анализа в зависимости от уровня измерения шкалы: простая и множественная регрессия (когда и независимые переменные, и зависимая переменная измерены в количественной шкале); линейная регрессия с фиктивными переменными для случаев, когда игрек количественный, а в качестве иксов есть необходимость ввести номинальные переменные; линейная регрессия с эффектами взаимодействия, когда исследователь предполагает, что характер связи переменных может быть неоднороден в зависимости от подгрупп; бинарная логистическая регрессия для ситуации, когда игрек может принимать только два значения, а иксы могут быть измерены по любой шкале; мультиномиальная регрессия – частный случай
Глава 9 посвящена обсуждению факторного анализа (ФА) и метода главных компонент (МГК). Приводится обсуждение различий метода ФА и МГК. Факторный анализ претендует на выявление некоторых латентных переменных, а метод главных компонент позволяет сократить размерность пространства. Таким образом, он может быть обоснованием создания индекса.
Глава 10 описывает методику проведения кластерного анализа, представляющего метод многомерной классификации данных, позволяющего находить группы похожих объектов в пространстве данных по заданным параметрам классификации. В главе также рассматривается метод классификации к-средних.
Глава 11 рассматривает метод деревьев решений (CHAID), который также относится к методам многомерной классификации. С помощью данного метода можно ответить на вопрос, какие из независимых переменных наиболее сильно связаны с зависимой переменной. В социологии данный метод часто применяется для построения социально-демографического портрета какой-либо из социальных групп. Метод очень нагляден, удобен в интерпретации и в использовании, поскольку позволяет осуществить применение любого вида шкал, а также он устойчив к выбросам, позволяет улавливать не только линейные, но и нелинейные связи.
Глава 12 описывает дискриминантный анализ. Данный метод многомерной классификации предполагает предсказание попадания объектов в определенный класс. Задача метода – узнать, отличаются ли друг от друга классы по заданным параметрам.
Перед прочтением данного учебного пособия рекомендуем повторить [1] базовые для социолога понятия, которые будут встречаться в тексте, такие как выборка, генеральная совокупность, статистическая гипотеза, доверительный интервал, ошибка первого и второго рода, нулевая и альтернативная гипотезы, статистическая значимость, нормальное распределение, мода, медиана, среднее значение и другие.
1
Например, по литературе: Пашкевич А. В. Теория вероятности и математическая статистика для социологов и менеджеров: Учебник для вузов / Под. ред. А. А. Макарова. Новое издание. – М.: МЦНМО, 2020. С 352.
Необходимо отметить, что при анализе данных в большинстве случаев мы имеем дело с выборками, а не с генеральной совокупностью. Практически никогда у нас нет в доступе генеральной совокупности. Поэтому за страницами данной книги останутся темы качества выборки, ее репрезентативности, правильного сбора данных, так как это темы для отдельного обсуждения.
Для исследовательских задач редко бывает необходимо получать результаты по конкретной нерепрезентативной выборке, обычно важно переносить результаты выборки на генеральную совокупность. Поэтому в учебном пособии большое внимание уделяется способам переноса данных с исследуемой выборки на генеральную совокупность, для этого осуществляется проверка статистических гипотез. Большинство методов анализа, которые мы будем обсуждать, предполагают генерализацию выводов (то есть статистическую
Автор книги – Наталья Сергеевна Воронина – кандидат социологических наук, старший научный сотрудник Института социологии ФНИСЦ РАН, доцент Государственного университета гуманитарных наук (где преподает дисциплину «Практикум по анализу данных в социологии» с 2017 года), автор более 50 научных публикаций по социологии, участник многочисленных научных грантов РНФ, РФФИ. Наталья Сергеевна Воронина окончила школу с золотой медалью, с 2005 по 2010 год обучалась в ГАУГН (получен диплом с отличием, специальность «социолог, преподаватель социологии»), затем продолжила освоение количественных методов в социологии с помощью ряда курсов повышения квалификации (2017 год – «Количественный анализ социальных данных на основе SPSS и R» НИУ ВШЭ, 2017 год – «Методы многомерной классификации» НИУ ВШЭ, 2019 год – «Математические методы в психологии» СПбГУ, 2019 год – «Эксперт IBM SPSS Statistics» МГТУ имени Баумана).
Автор хотел бы поблагодарить своих преподавателей количественных методов Г. Г. Татарову, Ю. Н. Толстову, А. В. Стрельникову, А. Ю. Кропачева, Ю. Б. Епихину, М. Ф. Черныша, которые оказали неоценимую поддержку автору на этапе приобретения исследовательских навыков, призывали аккуратно относиться к анализу данных, познакомили с количественными методами и привили любовь к аналитической деятельности. Автор благодарит рецензентов Д. С. Григорьева, А. В. Стрельникову и А. В. Кученкову, а также Практикум по анализу данных в социологии в программе SPSS А. В. Жаворонкова за ценные комментарии и научную редактуру, которые были учтены при доработке текста. Благодарю А. В. Андреенкову за возможность анализировать российские данные Европейского Социального Исслледования, Ю. А. Зубок за небезразличное отношение к проблемам молодых ученых, коллег из ИСФНИСЦ РАН, которые всегда помогали советом и вдохновляли личным примером. Благодарю Д. Колодинского за качественную верстку данного учебного пособия. А также благодарю всю свою семью за поддержку.
Автор отдельно хотел бы поблагодарить преподавателя курсов повышения квалификации в НИУ ВШЭ Воронину Наталью Дмитриевну, чьи лекции были полезными для освоения навыка анализа данных. Знания, полученные на этих курсах, были использованы автором в собственной преподавательской деятельности и при составлении данного учебного пособия.
Автор благодарит талантливую молодую художницу Галину Рачко, придумавшую и создавшую иллюстрации к этой книге, с помощью которых мир анализа данных, мы надеемся, станет еще увлекательнее.
Глава 1. Практическое применение навыка анализа данных
Перед начинающим исследователем часто стоит вопрос: как в действительности применить навыки использования анализа данных?
В практике руководства студенческими работами автор часто сталкивается с тем, что студенты, освоив некоторый набор методов анализа данных и включив в текст некоторую аналитику данных, ошибочно полагают, что они тем самым подготовили научную работу. Поэтому мы считаем необходимым начать обсуждение с того, какое место занимает анализ данных в структуре научной работы.
В методической литературе существует большое количество описаний того, как строится научная деятельность и как написать научную работу. Этот процесс всегда содержит творческий элемент, видение автора, однако работать в некоторой структуре всегда легче, чем без нее. В самом упрощенном виде логику написания научной работы можно представить таким образом:
1.1. Примерный план научной работы
• Введение (актуальность, проблема, цель, задачи).