После определения группировочного признака и границ строится ряд распределения.
Статистический ряд распределения – это упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку. Он характеризует состав (структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границ варьирования единиц совокупности.
Ряды распределения, построенные по атрибутивным признакам, называются атрибутивными. Например, распределение населения по полу, занятости, национальности, профессии и т.д.
Построенные по количественному признаку (в порядке возрастания или убывания наблюденных значений), ряды распределения называются вариационными. Например, распределение населения по возрасту, семей – по среднедушевому доходу и т.д.
Вариационные ряды распределения состоят из двух элементов: вариантов и частот.
Числовые значения количественного признака в вариационном ряду распределения называются вариантами.
Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения.
Сумма этих частот называется объемом совокупности и определяет число элементов всей совокупности.
Частость – это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100 %.
Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные.
Дискретные вариационные ряды основаны на дискретных (прерывных) признаках, имеющих только целые значения (например, число детей в семье), на дискретных признаках, представленных в виде интервалов; интервальные – на непрерывных признаках (принимающих любые значения, в том числе и дробные).
Одинаковые варианты признака у отдельных единиц повторяются (f – частота повторения; п – объем изучаемой совокупности).
Способы построения дискретных и интервальных рядов различны.
Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака xi, а затем подсчитывается частота повторения варианта f i.
Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов («от-до»), необходимо установить оптимальное число групп (интервалов), на которое следует разбить все единицы изучаемой совокупности. При группировке внутри однокачественной совокупности появляется возможность применения равных интервалов, число которых зависит от вариации признака в совокупности и от количества обследованных единиц.
Рассмотрим построение интервального вариационного ряда на примере распределения рабочих по стажу работы. Стаж работы (годы) 22-х рабочих бригады характеризуется следующими данными: 2, 4, 5, 5, 6, 6, 5, 6, 6, 7, 7, 8, 8, 9, 10, 11, 4, 3, 3, 4, 4, 5. Согласно формуле Стерджесса, при N = 22, число групп п = 5 . Зная число групп, определим интервал:
.
В результате получим следующий ряд распределения рабочих по стажу работы (∑f = 22).
x |
2 — 4 |
4 — 6 |
6 — 8 |
8 — 10 |
10 — 12 |
f |
3 |
8 |
6 |
3 |
2 |
Как видно из данного распределения, основная масса рабочих имеет стаж работы от 4 до 8 лет.
Ряды распределения удобно изучать с помощью графического метода.