Российское общество: потребление, коммуникация и принятие решений. 1967-2004 годы
Шрифт:
Уровни статистического анализа
Выше мы показали, как можно измерить активность людей на предметно-институциональных полях той или иной социальной подсистемы.
В сущности одна из огромных заслуг генпроекта «Общественное мнение», проведенного в условиях жесточайшего цейтнота, состояла в выявлении фундаментальной роли институциональной структуры массовых информационных и идеологических форм для процесса функционирования общества. Но не только в этом. Именно здесь была открыта возможность измерять активность личности на полюсе «деятельность» числом форм общественной жизни, в рамках которых развертывается индивидуальная жизнь. Оригинальность ситуации состояла в том, что, несмотря на очевидность скрытой переменной «время», стоящей за статистическим распределением людей по числу осваиваемых в жизненном цикле общественных форм, наше знание о поведении общественной системы в целом не является точным в физическом смысле. Социология на шкале исторического времени только подходит к той эпохе, которая в физике знаменовалась галилеевскими измерениями ускорения свободного падения. Да и до этого еще далеко. Мы можем только со среднестатистической ошибкой говорить о «средней» и «больше» или «меньше» «средней» активности, измеряемой, во-первых, числом освоенных форм деятельности относительно существующего в конкретные времена предела, во-вторых, числом присваиваемых продуктов труда, в-третьих, актами деятельности в отношении этих продуктов, в-четвертых, актами мыслительной деятельности, сопровождающей любые из названных типов активности. Если экспериментальные массивы обследованных превышают объемы в 2000 единиц, мы можем ввести показатель, усиливающий достоверность большего или меньшего отклонения,
Базы «INSYS» и «UNIVERSUM», созданные автором, удовлетворяют всем поставленным условиям. Этого достаточно для начала анализа.
Статистическими единицами измерения выступают: 1) индивидуумы и их распределения по тем или иным параметрам, 2) продукты деятельности индивидуумов – те же формы жизни, товары, сообщения, символы знания, нормы права, 3) акты деятельности по присвоению свойств этих предметов – суть свойств предметного социального мира. И при этом акты сознания людей фиксируются не только количественными методами (информированность о свойствах и предметах социального мира, знание имен – «номиналий» – лиц, представляющих определенную область, писаных норм различных секторов права – трудового, уголовного, конституционного), но и в оценочном, отношенческом и прогностическом планах, что позволяет воспроизвести тренды перехода различных уровней обыденного сознания в результирующую деятельность.
В принципе существует еще один уровень анализа и измерения движения форм социальной среды: выкристаллизовавшиеся в ней квазиобъекты, первые два из которых были показаны пока для примера в социальных картах. В ряде случаев эти «пульсирующие» образования были получены нами при исследовании оценок солидарности людей относительно эффективности принятых публично решений, материалов газеты, апеллирующих к властям, групп по присвоению рекламы товаров повседневного спроса. Они также получены при анализе профессиональной ориентации населения, отношения его к окружающему страну мировому сообществу и освещению жизни стран мира в информационном ряду. Это некие постоянно «горящие, вспыхивающие и гаснущие» в пространственно-временной фигуре социума аппликации деятельности и сознания. Именно эти квазиобъекты требуют от социологии свого изучения: измерения времени и условий существования, плотности своих характеристик при тех или иных экономических условиях обмена деятельностями. Однако представлять их надо по ходу изложения.
Методы интеграции информации
Уже в процессе реализации таганрогского проекта перед исследовательской группой остро стояла проблема статистического и математического аппарата, интегрирующего полученные данные. В общем данные проекта насчитывали около 12 млн частот социальных фактов и событий, которые невозможно было осмыслить, если не «сжать» информацию на один, а то и два порядка. Дальнейшая работа резко увеличила информационное поле. В базах данных, положенных в основу анализа, это поле частот в 5 раз объемнее.
Выше мы вывели инструмент анализа и синтеза на авансцену изложения на живых статистических примерах («Теория мертва, мой друг, но вечно зеленеет древо жизни», – говорит дух познания авторитетному профессору). Однако же, поступая и в дальнейшем таким же образом, мы остановимся здесь на методах, применявшихся в исследовании, для краткого обзора-резюме, облегчающего понимание дальнейшего описания.
В статистике широко апробированы применяемые нами методы. Наиболее сильным из них для исследований пилотажного типа на начальной стадии выступает комбинаторный метод группировки, когда из «связанных» признаков составляются новые. Сродни ему и метод логической классификации и кластерный анализ, широко применявшийся нами все эти годы для переструктурирования исходных данных наших объектов. После получения новых интегрированных признаков, качественных и количественных, начинается обычно традиционный дисперсионный (или энтропийный) анализ [35] . Трудность их применения долгое время была связана с отсутствием мощной вычислительной техники и статистического аппарата для быстрой работы с огромными базами данных и поиском взаимосвязей. Речь шла о диалоговом режиме работы с базами данных из нескольких сотен исследований.
35
Его пионерами являются И. Н. Таганов и О. И. Шкаратан (см.: Исследование социальных структур методом энтропийного анализа. – ВФ. № 5. 1969). О. И. Шкаратан впервые отметил в 1984 г. равноположенность различных форм жизни в распределениях: «У нас нет основания расценивать тот или иной род (а также вид внепроизводственной деятельности) как более или менее значимый. Для нас, например, „поездка за город“ и „просто пассивный отдых, ничегонеделание“ – равноценные характеристики соответствующего рода деятельности». То же самое, однако, можно сказать и о любом виде деятельности. Далее О. И. Шкаратан пишет: «...итоги расчетов (1982 – 1983 гг.) привели автора статьи к убеждению, что усилиями советской математической школы наконец успешно решены казавшиеся ранее неразрешимыми проблемы интерпретации результатов и высокой вычислительной трудоемкости методов классификации социальных объектов» (Советская этнография, № 6. 1984 г. – С. 16). Мы пошли несколько иным путем, применяя энтропийный анализ в основном не на начальной, а на конечной стадии перегруппировки, после получения типологических групп на основании показателей дисперсии и отклонений от основной массы. Мера неопределенности интерпретируется тут как мера концентрации или плотности распределения людей (актов, продуктов деятельности, элементов содержания текста, смысловых форм) по единицам, составляющим анализируемые параметры. Это хорошо согласуется с первичными данными счета (математическая модификация получения коэффициентов энтропии по Шеннону принадлежит В. А. Шведовскому, программная версия получения из результирующих данных пакета SPSS выполнена А. Л. Королевым).
В 1978 г. наметился было прорыв в этой области благодаря применению «DA-системы» С. В. Чеснокова на машинах типа PDP-11 [36] в Институте Системных исследований, но наше сотрудничество было прервано негативной позицией сотрудников, ставивших в этом институте промежуточную визу на решениях. Для анализа мнгогомиллионного поля частот нужна была «машинно-математическая драга», выясняющая и проявляющая силу связей в матрицах признаков параллельно и одновременно с выводом данных на экран дисплея. Такой подход, отсекающий все лишнее, был реализован в методе формализации серии логических выводов, о котором мы вкратце сказали выше. Поясним его простоту и очевидность.
36
Впервые эта система применялась в 1969 г. вручную в анализе первого исследования проекта «Общественное мнение» по экономреформе, выполненном под руководством ее автора С. В. Чеснокова А. А. Возьмителем и автором книги.
Анализируя двумерную матрицу частот, исследователь работает в понятиях «больше» – «меньше», рассматривая нормированное отклонение признака в градациях «подлежащего» от так же нормированного его значения в «сказуемом» по выборке в целом. Сила отклонения рассматривается, анализируется, оценивается, гипотеза выдвигается или отвергается. Это написано во многих учебных пособиях [37] .
Безумна затея – оценивать значимость отклонений по каждой клетке в десятках тысяч таблиц, проверяя то, что важно называется «гипотезой», а по-нашему – просто очередной логический вывод типа «больше» – «меньше». Все это может сделать компьютер, рассмотрев, сравнив, оценив, проставив знак с математической достоверностью. Если отклонение незначимо, программа проставляет в этой клетке знак «±», если частота в таблице непредставительна, программа ставит «·». Так, в табл. 1.7 мы сразу видим дифференциацию возрастных групп по включенности в политико-идеологический и информационный процессы и тут же полную их индифферентность в отклонении их оценок аккумуляции информации органами власти от средних по массиву. Дифференциация оценок в классовом и образовательном срезе и там и там очевидна. Мы сразу видим и лес
37
Все перечислить невозможно. Это азбука статистической оценки. Одну из хороших методически ясных разработок предложили В. И. Паниотто и В. О. Максименко в книге «Количественные методы в социологических исследованиях» (Киев, 1982. – С. 192 – 195). Мы, предварительно поработав с критерием Стьюдента, взяли за основу оценки подход и метод расчета именно этих авторов, так как стараемся никогда не пользоваться методом формализации серии логических выводов на выборках менее 500 единиц наблюдения. Указанные авторами методические рекомендации подсчета оценки были преобразованы в компьютерную программу А. Л. Королевым.
Коэффициенты сопряженности, основанные на критерии «хи-квадрат» имеют в анализе другие функции. Они показывают общую связь признаков, когда мы меряем сопряженность разных подсистем. Но не детали. Это хорошо видно на измерении взаимной связи связи в «активности» и «информированности» [38] .
Мы видим, что в первой из таблиц 3x3, где приводятся данные о распределении уровня знаний о «косыгинской» реформе у всего населения города, наибольший коэффициент взаимной сопряженности («хи-квадрат» составляет здесь 350,998). Однако, как только мы исключаем из анализа треть населения, не использующую никаких источников информации об экономической жизни города и не знающую ни одного элемента информации об экономической реформе на предприятиях, мы получаем в несколько раз меньшее значение «хи-квадрата»: 88,813, а отсюда и соответствующие коэффициенты сопряженности. В то же время перепады в долях процентов в 3 – 4 раза (!) от среднего значимы. Они говорят о прямой взаимозависимости знаний о происходящих экономических событиях и производственной и информационной активности. Здесь анализ, основанный на «хи-квадрате», может помочь только в интерпретации показателей энтропии. Она резко возрастает из-за расширения масштабов общности и концентрации массы населения или в области отчуждения от происходящего процесса, или в активной зоне происходящего. На предприятиях Ташкента энтропия по заполненным клеткам 0,738. Две клетки не выпадают. Нельзя быть высокоактивным в определенной области и мало знать об этой области. И наоборот: быть малоактивным и много знать [39] . Перед нами информационно-деятельностный синдром, точно такой же, кстати, как и в случае информационного приема (табл. 1.12). Ведь осознание объективных информационных потребностей – та же информированность на уровне рефлексии собственной деятельности. Но и там коэффициенты на основе «хи-квадрат» «зашкаливаются», и в плотной, и в разреженной аудитории и показывают одно и в плавно принимаемом, и в судорожно выхватываемом потоках сведений (табл. 1.13).
38
Автор принимал участие в нескольких попытках количественного замера информированности разными группами исследователей. Первая попытка относится к уже указанной работе с А. А. Возьмителеми С. В. Чесноковым при общем руководстве Б. А. Грушинав 1969 г. Однако проверка результативности метода, когда выделяется «полное», «половинное» и «частичное» знание (Грушин пишет об этом в статье «Массовое сознание: феномен информированности». – ВФ, № 6. 1971 г.), заставила отказаться от него. По остроумному замечанию. М. Н. Дымшица в интервью корреспонденту «Секрет фирмы» К. Бочарскому 03.04.2006 г.: «Человек не может находиться в состоянии „знание марки 20 %“, он ее или знает, или не знает». В 1976 г. А. С. Гречин, М. С. Мацковский, А. С. Клигер разработали методику выяснения правовых установок населения, где элементы информированности были взяты дихотомически именно так («знает» – «не знает»). Этот же подход использовал и Н. С. Мансуров в анализе информированности и активности в границах производственной общности. На стадии обработки подход был реализован Н. С. Мансуровым и мной и состоял в выделении той же «триады»: знают «средне», «мало», «много» по стандартному отклонению (±1) в предлагаемом предметном ряду. Именно этот подход сработал на многих исследованиях, особенно на вскрытии связей типов активности и правового сознания (См. по этому поводу примечание к описанию массивов №№ 105 и 106 в Приложении 1).
39
Аналогичная картина повторилась в массиве в 493 человека, обследованных на двух предприятиях Московской обл. в Климовске и Глухове. Исследование было проведено идентичной методикой, и его данные, объединенные с данными по УзбССР будут приведены в главе об информированности.
Между тем все три коэффициента и показатели энтропии работают вместе с оценками силы отклонений и дают достаточно надежную для аргументации картину [40] . Кроме того, здесь возникает фундаментальное предположение, косвенно подтверждаемое падением и возрастанием значений энтропии среди незанятого в народном хозяйстве населения города и среди двух типов производственных общностей (переходящих на новую систему работы и работающих по старой). Дело в том, что энтропия – линейная функция и ее значения, показывая своего рода меру рассеяния данного континуума предметностей по массе населения, позволяют предполагать, что метрика социального пространства ограничена функциональным горизонтом общностей. И чем меньше общность, тем меньше значение энтропии (при прочих равных условиях пронизывания систем деятельности формами силовых линий социальных институтов). Это предположение нуждается в соответствующей экспериментальной проверке.
40
В конце книги «работа» этих показателей будет упомянута и по отношению к маркетинговым исследованиям в последние годы, где, кстати, выявлен тот же синдром постоянной активной покупки и присвоения рекламных слоганов. Кто часто покупает, тот и видит рекламу, в том числе и конкурентов по отношению друг к другу.
Наконец, надо сказать об аппроксимации кривых распределений (кумулят, «гауссиан» и «огив»-кривых «Парето»). Первые полтора десятка из них были получены автором в начале 80-х гг. Тогда они были встречены коллегами «в штыки», но теперь многие говорят о нормальных распределениях в социологических замерах. Программная и электронная базы, однако, не были готовы в то время еще к такому анализу [41] . Однако появление новой серии машин «Pentium», последних версий программного пакета «SPSS», двух версий «TableCurve 2D» и «TableCurve 3D», позволяющих апробированно заниматься аппроксимацией кривых, зависимостей и построением форм пространственно-временной конфигурации общества в трехмерной графике, позволило, наконец, решить поставленные еще 30 лет назад задачи [42] .
41
Достаточно сказать, что база «UNIVERSUM», обработка которой требует быстрой сортировки, с целью получения оригинальных подвыборок и модифицированных показателей, занимает 1500 Мб и требует 2 Гб оперативной памяти компьютера. Аппроксимация кривых должна идти за доли секунды, так как их количество для качественного моделирования объекта превышает сотни. Их нужно «тасовать», как колоды карт. Специалисты, заявлявшие мне в 1990-м г., что IBM-486 справится с поставленными задачами, просто не представляли себе, о чем они говорят. Некоторые опции программ ведущих в отрасли корпораций только теперь, в последних версиях, реализуют те подходы, которые требовались тогда и осознавались в ясно поставленных для программистов задачах. Например опция подсчета коэффициентов сопряженности в 12 версии SPSS по выходным таблицам давно разработана нами на общедоступном языке программирования и применялась еще на выходных таблицах SPSS 6 в 90-е гг. Мы не думали об авторских правах. Наука в России гибнет в коммерческом поле.
42
Я выражаю признательность руководителю Центра социологического образования С. Е. Кухтерину за предоставленную возможность пользоваться в последние два года работы лицензионными версиями программ «TableCurve 2D» и «TableCurve 3D», а также представительству SPSS Inc. за предоставление последних лицензионных версий пакета по соглашению с ИС Рос АН. Первая лицензионная версия SPSS (6.0, успешно используемая до сих пор) была бесплатно предоставлена мне Майклом Сваффордом еще в 1991 г.