7. МЕТОДЫ АНАЛИЗА ИНФОРМАЦИИ

Анализ собранной информации – самый увлекательный этап исследования. Мы проверяем, насколько верны были исходные предположения, получаем ответы на заданные вопросы.

Цель этой главы – рассмотрение основных методов, но не техники анализа данных. Из технических средств мы используем наипростейшие, а при необходимости будем отсылать студентов-читателей к соответствующей литературе, которая указана в библиографии.

В современных исследованиях социальных явлений все чаще для получения информации применяются математико-статистические методы.  Нельзя говорить об этих методах по отдельности (математические и статистические), ибо они не могут быть строго разделены и чаще всего применяются вместе.  При обработке  материалов социальных исследований для того, чтобы извлечь из тех  количественных данных, которые получены в экспериментах, при опросе и наблюдениях, возможно больше полезной информации, используется  математико-статистический метод. В его пределах широко применяются следующие конкретные методики.

Регистрация — выявление определенного качества у явлений данного класса и подсчет количества по наличию или отсутствию данного качества (например, количество успевающих и неуспевающих учеников).

Ранжирование – расположение собранных данных в определенной последовательности (убывания или нарастания зафиксированных показателей), определение места в этом ряду изучаемых объектов (например, составление списка учеников в зависимости от числа пропущенных занятий).

Шкалирование – присвоение баллов или других цифровых  показателей исследуемым характеристикам. Этим достигается большая определенность. Известны четыре основные градации измерительных шкал: 1) шкалы наименований (или номинальные); 2) шкалы порядка (или ранговые); 3) интервальные шкалы; 4) шкалы отношений.

Шкалы наименований. Числа и другие обозначения в них используются чисто символически. Они, по сути, представляют собой наименования какого-либо класса объектов. Их единственная математическая характеристика – принадлежность: принадлежит ли исследуемый объект к данному классу или нет. Примеры номинальных шкал: список специальностей, перечисление характеристик учеников, причин неуспеваемости и т.д.

В порядковых  (ранговых) шкалах  устанавливается порядок следования, отношения «больше» и «меньше». Примерами их применения служит ранжирование типа «выше ростом», «больше пятерок», «меньше пропусков» и т.д.

Интервальная  шкала предусматривает определенные расстояния между отдельными (двумя любыми)  числами на шкале, а в шкале  отношений, кроме того, определена еще и нулевая точка (точка отсчета). Например, шкалы термометров, вольтметров.

Современная математическая статистика представляет собой большую и сложную систему знаний. Нельзя рассчитывать на то, что каждый исследователь овладеет этими знаниями. Между тем статистика нужна соционому постоянно в его повседневной работе. Специалисты-статистики разработали целый комплекс простых методов, которые совершенно доступны любому человеку, не забывшему то, что он выучил еще в средней школе.

В этой главе даются простейшие методы математической статистики. Уместное, грамотное применение этих методов позволит исследователю, проведя начальную обработку данных, получить общую картину того, что дают количественные результаты его научной работы, оперативно проконтролировать ход исследования.

Для лучшего усвоения материала рассмотрим основные  статистические понятия.

Описательная статистика – получение статистических показателей, с помощью которых обобщаются характеристики только наблюдаемой совокупности. Задача ее заключается в том, чтобы дать сжатую и концентрированную характеристику изучаемого явления. Единицы совокупности обладают определенными свойствами, качествами, которые могут быть наблюдаемы или измерены. Эти свойства принято называть признаками. Например, признаки человека: возраст, образование, занятие, рост, вес, семейное положение и т.д.

Понятие статистики – общественная наука, имеющая целью сбор, упорядочивание, анализ и сопоставление данных, относящихся к самым разнообразным массовым явлениям. Статистика изучает явления через их признаки: чем более однородна совокупность, тем больше общих признаков имеют ее единицы, тем меньше варьируют их значения. Признаки различаются способами их измерения и другими особенностями, влияющими на приемы статистического изучения. Это дает основание для классификации признаков (табл. 7.1).

Описательные признаки выражаются словесно: национальность человека, разновидность почв, материал стен здания. Описательные признаки подразделяются на номинальные и порядковые. Эти термины взяты из теории измерений. Отличия между ними в том, что номинальные – это описательные признаки, по которым нельзя ранжировать данные, тогда как порядковые - те, по которым можно ранжировать, упорядочивать данные.

Таблица 7.1

Классификация признаков в статистике

Основания классификации

по характеру  выражения

признаков

по способу

измерения

по отношению к характеризуемому объекту

по характеру вариации

по отношению ко времени

Описательные

Первичные

Прямые (не-посредственные

Альтернатив-ные

Моментные

Количественные

Вторичные или расчетные

Косвенные

Дискретные,

Непрерывные

Интервальные

Например, пользуясь оценками экспертов, ранжируют фигуристов по технике и артистичности  исполнения программы или работников по мастерству.

Количественные признаки выражены числами. Они играют преобладающую роль в статистике. Таковы возраст человека, заработная плата рабочих, население города и т.д.

Первичные признаки характеризуют единицу совокупности в целом. Это абсолютные величины. Они могут быть измерены, сосчитаны, взвешены. Они существуют сами по себе, независимо от их статистического изучения. Таковы численность населения города, число автомобилей, произведенных в стране, площадь дачного участка.

Вторичные, или расчетные, признаки не измеряются непосредственно, а рассчитываются. Они являются продуктами человеческого сознания, результатом познания изучаемого объекта. Например, производительность труда, себестоимость единицы продукции, урожайность и т.д. Вторичный – не означает второстепенный. Термин определяет только путь познания: сначала надо измерить значения первичных признаков, а уже потом, во вторую очередь, на основе первичных признаков рассчитать значения вторичных.

Прямые (непосредственные) признаки – это свойства, непосредственно присущие тому объекту, который ими характеризуется. Таковы возраст человека, численность студентов университета, объем продукции завода.

Косвенные признаки являются свойствами, присущими не самому объекту, а другим совокупностям, относящимся к объекту, входящему в него. Например, успеваемость студентов как косвенный признак университета. Хотя это успеваемость не университета, а студентов – это их прямой признак, но ведь успеваемость характеризует и университет, которому принадлежат эти студенты.

Альтернативные признаки могут принимать только два значения. Таковыми являются признаки обладания или необладания чем-то. Например, все садовые участки по признаку наличия посадок вишни можно разделить на имеющие посадки вишни и не имеющие их. Альтернативным признаком являются пол человека (мужчина – женщина), место проживания (город – село).  

Дискретные признаки – это количественные признаки, которые могут принимать только отдельные значения, без промежуточных значений между ними – чаще целочисленные. Например, число членов семьи, число комнат в квартире, число этажей в доме.

Непрерывные, точнее, непрерывно варьирующие признаки способны принимать любые значения, конечно, в определенных границах. К непрерывным относятся расчетные вторичные признаки. Ведь их значения – результат деления, а оно может приводить к любым числам – целым, дробным.         

Моментные признаки характеризуют изучаемый объект в какой-то момент времени, установленный планом исследования. Они существуют на любой момент времени и характеризуют наличие чего-либо: численность населения, размеры жилой площади семьи Х и т.д.         

Интервальные признаки – это признаки, характеризующие результаты процессов. Поэтому их значения могут возникнуть только за интервал времени: год, месяц, сутки, но не на момент времени. Например, число родившихся, умерших (за год).            

Рассмотрим отдельные приемы анализа эмпирической информации, позволяющие грамотно обрабатывать и организовывать материал.

Статистической совокупностью будем называть массовые социальные явления и процессы, изучаемые социономами. Эти совокупности состоят из отдельных единиц (объектов), свойства которых в статистике   описываются при помощи признаков, или переменных. Отдельные единицы статистической совокупности  объединяются в группы при помощи метода группировки. Это позволяет «сжать» информацию, полученную в ходе наблюдения, и на этой основе выявить закономерности, присущие изучаемому явлению.         

Группировка и классификация – элементарные процедуры упорядочения данных, предваряющие их анализ. С помощью этих действий мы «уплотняем» информацию, как бы  расширяем области подобия и устанавливаем новые границы различий в массе эмпирических данных, не выходя при этом за пределы индикативных свойств.         

Группировкой называют  распределение множества единиц изучаемой совокупности на группы по определенным существенным для них признакам. Приемы проведения статистических группировок весьма разнообразны. Это связано с разными задачами, которые в соответствии с целью исследования ставятся перед группировками. Группировка  лежит в основе всей дальнейшей работы с собранной информацией. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучения взаимосвязей между признаками. Если рассчитать сводные показатели только по совокупности, то мы не сможем уловить ее структуры, роли отдельных групп, их специфики.         

Таким образом, значение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном, обозримом виде; создает основу для последующей сводки и анализа данных.

Группировочным признаком называется признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки. В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (курс доллара в рублях, возраст человека, денежный доход семьи и т.д.), а вторые отражают состояние единицы совокупности (пол человека, его национальность, семейное положение и т.д.). После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака. При построении группировки по качественному признаку групп, как правило, будет столько, сколько имеется градаций, видов, состояний у этого признака. Например, в случае проведения группировки населения по полу можно образовать только две группы:  мужчины и женщины.

Группировка называется простой (монотетической), если для ее построения используется один группировочный признак. Перекрестная  группировка – это связывание данных, предварительно упорядоченных по двум признакам. Одна из задач перекрестной группировки – поиск устойчивых связей, выявляющих структурные свойства изучаемого явления. Например, выявление типических соотношений возрастов мужей и жен.  Если группировка проводится по нескольким признакам, она называется  сложной (политетической).

От группировок следует отличать классификацию. Классификацией называется  систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия.

Отличительной чертой классификации является, во-первых, то, что в ее основу кладется качественный признак. Во-вторых, классификации стандартны. Они устанавливаются органами государственной и международной статистики.