Как построить ряд распределения в статистике
Построение ряда распределения
Поможем написать любую работу на аналогичную тему
Признаки, изучаемые статистикой, варьируются (отличаются друг от друга) у различных единиц совокупности в один и тот же период или момент времени. Например, величина внешнеторгового оборота варьируется по подразделениям ФТС; величина экспорта (импорта) варьируется по направлениям экспорта (по разным странам-партнерам по внешней торговле), по видам товаров и т.п.
Причиной вариации являются разные условия существования разных единиц совокупности. Например, огромное число причин влияет на масштабы внешней торговли различных стран мира.
Для управления и изучения вариации статистикой разработаны специальные методы исследования вариации, система показателей, с помощью которой вариация измеряется, характеризуются ее свойства.
Первым этапом статистического изучения вариации является построение ряда распределения (или вариационного ряда) – упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.
Существует 3 вида ряда распределения:
1) ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака (например, таблица 11); если численность единиц совокупности достаточно велика ранжированный ряд становится громоздким, и в таких случаях ряд распределения строится с помощью группировки единиц совокупности по значениям изучаемого признака (ели признак принимает небольшое число значений, то строится дискретный ряд, а в противном случае – интервальный ряд);
2) дискретный ряд – это таблица, состоящая из двух столбцов (строк) – конкретных значений варьирующего признака Xi и числа единиц совокупности с данным значением признака fi – частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака;
3) интервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака Xi и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).
Построим ряд распределения внешнеторгового оборота (ВО) по таможенным постам России, для чего необходимо провести статистическое наблюдение, то есть собрать первичный статистический материал, который представляет собой величину ВО по таможенным постам.
Результаты наблюдения ВО по 35 таможенным постам региона за отчетный период представим в виде ранжированного по возрастанию величины ВО ряда распределения (таблица 11).
Таблица 11. Внешнеторговый оборот (ВО) по 35 таможенным постам, млн.долл.
Группировка данных и построение ряда распределения
Виды статистических группировок
Принципы построения статистических группировок
При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:
Длину частичных интервалов вычисляют как h=(xmax-xmin)/k
Построить вариационный ряд. По найденному ряду построить полигон распределения, гистограмму, кумуляту. Определить моду и медиану.
Скачать решение
Пример. По результатам выборочного наблюдения (выборка А приложение):
а) составьте вариационный ряд;
б) вычислите относительные частоты и накопленные относительные частоты;
в) постройте полигон;
г) составьте эмпирическую функцию распределения;
д) постройте график эмпирической функции распределения;
е) вычислите числовые характеристики: среднее арифметическое, дисперсию, среднее квадратическое отклонение. Решение
Требуется: ранжировать ряд, построить интервальный ряд распределения, вычислить среднее значение, колеблемость среднего значения, моду и медиану для ранжированного и интервального рядов.
На основе исходных данных построить дискретный вариационный ряд; представить его в виде статистической таблицы и статистических графиков. 2). На основе исходных данных построить интервальный вариационный ряд с равными интервалами. Число интервалов выбрать самостоятельно и объяснить этот выбор. Представить полученный вариационный ряд в виде статистической таблицы и статистических графиков. Указать виды примененных таблиц и графиков.
С целью определения средней продолжительности обслуживания клиентов в пенсионном фонде, число клиентов которого очень велико, по схеме собственно-случайной бесповторной выборки проведено обследование 100 клиентов. Результаты обследования представлены в таблице. Найти:
а) границы, в которых с вероятностью 0.9946 заключено среднее время обслуживания всех клиентов пенсионного фонда;
б) вероятность того, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине);
в) объем повторной выборки, при котором с вероятностью 0.9907 можно утверждать, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине).
2. По данным задачи 1, используя X 2 критерий Пирсона, на уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина Х – время обслуживания клиентов – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Скачать решение
Имеются следующие выборочные данные (выборка 10%-ная, механическая) о выпуске продукции и сумме прибыли, млн. руб. По исходным данным:
Задание 13.1.
13.1.1. Постройте статистический ряд распределения предприятий по сумме прибыли, образовав пять групп с равными интервалами. Постройте графики ряда распределения.
13.1.2. Рассчитайте числовые характеристики ряда распределения предприятий по сумме прибыли: среднюю арифметическую, среднее квадратическое отклонение, дисперсию, коэффициент вариации V. Сделайте выводы.
Задание 13.2.
13.2.1. Определите границы, в которых с вероятностью 0.997 заключена сумма прибыли одного предприятия в генеральной совокупности.
13.2.2. Используя x2-критерий Пирсона, при уровне значимости α проверить гипотезу о том, что случайная величина X – сумма прибыли – распределена по нормальному закону.
Задание 13.3.
13.3.1. Определите коэффициенты выборочного уравнения регрессии.
13.3.2. Установите наличие и характер корреляционной связи между стоимостью произведённой продукции (X) и суммой прибыли на одно предприятие (Y). Постройте диаграмму рассеяния и линию регрессии.
13.3.3. Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами X и Y, используя шкалу Чеддока.
Методические рекомендации. Задание 13.3 выполняется с помощью этого сервиса.
Скачать решение
Задача. Следующие данные представляют собой затраты времени клиентов на заключение договоров. Построить интервальный вариационный ряд представленных данных, гистограмму, найти несмещенную оценку математического ожидания, смещенную и несмещенную оценку дисперсии.
Решение:
Для построения группировка с равными интервалами воспользуемся сервисом Группировка статистических данных.
Построение рядов распределения
Учреждение образования
«ВЫСШИЙ ГОСУДАРСТВЕННЫЙ КОЛЛЕДЖ СВЯЗИ»
«ОБШАЯ ТЕОРИЯ СТАТИСТИКИ»
для студентов уровня ВО заочной формы обучения
1-26 02 03 – Маркетинг
1-25 01 07 – Экономика и управление на предприятии
Составитель Е.М. Колодная
Рецензент Л.Л. Гладков
Издание утверждено на заседании кафедры М и Ф
«20» марта 2007 г., протокол №8
Зав. кафедрой Л.Л. Гладков
ЛИТЕРАТУРА
1. Елисеева И. И., Юзбашев М. М. Общая теория статистики. – М.: Финансы и статистика, 2001.
2. Ефимова М. Р., Петрова Е. В., Румянцев В. Н. Общая теория статистики. – М.: ИНФРА-М, 1997.
3. Ряузов Н. Н. Общая теория статистики. – М.: Финансы и статистика, 1984.
4. Гусев Н. Ю. Статистика: основы методологии: Учебное пособие. – М.: Издательство АСВ, 1998.
5. Сиденко А. В., Попов Г. Ю., Матвеева В. М. Статистика: Учебник. – М.: Дело и Сервис, 2000.
РЯДЫ РАСПРЕДЕЛЕНИЯ. СРЕДНИЕ ВЕЛИЧИНЫ. ПОКАЗАТЕЛИ ВАРИАЦИИ И ДРУГИЕ ХАРАКТЕРИСТИКИ РЯДОВ РАСПРЕДЕЛЕНИЯ. СТАТИСТИЧЕСКИЕ ГРАФИКИ
Построение рядов распределения
Вариационные ряды распределения делятся на:
— дискретные (в качестве вариант выступают дискретные числа);
— интервальные (в качестве вариант выступают числовые интервалы).
Для построения дискретного ряда распределения необходимо перечислить все наблюдаемые значения признака (варианты) в порядке возрастания их числовых значение и соответствующие им частоты.
Для построения интервального ряда распределения необходимо записать последовательность интервалов и соответствующие им частоты (в качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал).
При построении интервальных вариационных рядов распределения предварительно требуется решить вопрос относительно:
а) числа образуемых групп;
б) интервалов групп.
,
где — число групп;
— число единиц совокупности.
Интервалы различают равные и неравные. Величина равного интервала определяется по формуле:
,
где — размер интервала;
— максимальное значение признака;
— минимальное значение признака;
— число образуемых групп.
Средние величины
Средней величиной называют обобщающий показатель, который характеризует типичный уровень варьирующего признака в расчете на единицу совокупности в конкретных условиях места и времени.
Кстепенным среднимотносятся средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая и средняя кубическая.
Средняя арифметическая:
;
,
где — веса (или частоты), показывающие число одинаковых значений признака (вариант).
Пример 1.1
По строительным предприятиям области получены данные об объеме выполненных строительных работ за год (см. табл. 1.1).
тий (n )
( )
x n
Вычислим средний объем выполненных работ на одно предприятие, используя формулу средней арифметической взвешенной.
Вначале закрываем интервалы. Исходя из того, что весь интервал второй группы равен 200, нижняя граница первого интервала будет исчислена: 500-200=300. Интервал предпоследней группы равен 300, тогда верхняя граница последнего интервала будет 1000+300=1300. В графе 3 все интервалы после этих расчетов записаны закрытыми. По формуле простой арифметической средней исчисленные центральные значения интервалов записаны в графе 4. Эти значения и будут служить вариантами ( ) для расчета средней арифметической взвешенной
=
=670 (млн. руб.).
Средняя гармоническая:
;
,
где .
Приведем пример расчета средней гармонической. Допустим, что трое рабочих работали по 8 часов (480 мин.) и затрачивали на отделку 1 кв. м стен: 1-й – 30 мин., 2-й – 40 мин., 3-й – 60 мин. Найти среднюю затрату времени на отделку 1 кв. м стен по формуле:
.
В этом расчете в числителе значится общее время работы трех рабочих (1440 мин.), а в знаменателе общее количество отделанных кв. м (36 кв. м). Средняя затрата времени на отделку 1 кв. м составляет 40 мин. В данном примере веса средней равные и поэтому можно записать:
.
Следовательно, при равных весах расчет может быть произведен по формуле:
.
Средняя квадратическая:
;
.
Эта средняя применяется при нахождении показателей вариации, которые рассматриваются далее, например, среднеквадратического отклонения.
Средняя геометрическая:
,
Эта средняя применяется, например, при нахождении средних темпов роста в рядах динамики.
К структурным средним относятся мода и медиана.
В дискретном ряду распределения моду исчислять не требуется, она находится как значение варианта ( ), у которого наибольшая частота (
).
Пример 1.2
Имеется следующий ряд распределения семей по числу членов семьи:
Число членов семьи ( | 2 | 3 | 4 | 5 | 6 |
Число семей ( | 300 | 500 | 260 | 100 | 40 |
Здесь мода =3 человека в семье, так как наибольшее число семей (500) в данном ряду имеют 3 человека в семье.
В интервальном ряду мода определяется по формуле:
,
где — мода;
— начальное значение модального интервала (интервала, содержащего наибольшую частоту);
— величина модального интервала;
— частота модального интервала;
— частота интервала, предшествующего модальному интервалу;
— частота интервала, следующего за модальным интервалом.
Рассмотрим нахождение моды в интервальном ряду распределения по условию табл. 1.1.
В этой задаче наибольшая частота (12) находится в интервале от 500 до 700. Это модальный интервал. Тогда мода:
.
Итак, модальная величина объема выполненных работ составляет 580 млн. руб.
Ранжированным называется ряд, в котором единицы совокупности расположены в возрастающем (или убывающем) порядке значений варианта.
В дискретном нечетном (нечетное число единиц) вариационном ряду распределения медианой будет значение — го варианта.
Например, при испытании прочности семи образцов стекла на силу удара в кг были получены результаты:
В середине ранжированного ряда находится четвертый вариант и его величина есть медиана. Итак, кг или медианное значение прочности стекла при испытании на силу удара составило 7 кг.
В дискретном четном (четное число единиц) вариационном ряду распределения медиана находится как средняя из двух вариантов, расположенных в середине ранжированного ряда, т.е. среднее значение — го и
— го вариантов.
Рассмотрим нахождение медианы в дискретном четном ряду распределения по условию табл. 1.2. Данный ряд имеет четное число элементов, так как
300+500+260+100+40=1200, тогда в середине ранжированного ряда будут находиться
-ый и (
)-ый варианты, или 600-ый и 601-ый. По суммам накопленных частот (см. табл. 1.3) видно, что и 600-ый и 601-ый варианты имеют значение 3. Значит медиана
=3 человека в семье.
Число членов семьи ( | 2 | 3 | 4 | 5 | 6 |
Число семей ( | 300 | 500 | 260 | 100 | 40 |
Сумма накопленных частот (S | 300 | 800 | 1060 | 1160 | 1200 |
Медиана интервального вариационного ряда определяется по формуле:
,
— начальное значение медианного интервала (интервала, содержащего медиану);
— величина медианного интервала;
— сумма частот ряда;
— сумма накопленных частот, предшествующих медианному интервалу;
— частота медианного интервала.
Правила построения дискретных и интервальных рядов распределения
Что такое группировка статистических данных, и как она связана с рядами распределения, было рассмотрено в первой части этой лекции, там же можно узнать, о том что такое дискретный и вариационный ряд распределения.
Ряды распределения одна из разновидностей статистических рядов (кроме них в статистике используются ряды динамики), используются для анализа данных о явлениях общественной жизни. Построение вариационных рядов вполне посильная задача для каждого. Однако есть правила, которые необходимо помнить.
Как построить дискретный вариационный ряд распределения
0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2
Решение:
Вторая колонка это частота – как часто встречается наша варианта в исследуемом явление – название колонки так же берем из задания — распределения семей – значит наша частота это число семей с соответствующим количеством детей.
В итоге макет нашей таблицы будет выглядеть так:
И расставим эти данные в первой колонке нашей таблицы в логическом порядке, в данном случае возрастающем от 0 до 4. Получаем
Число детей в семье — (х) | Количество семей (f) |
0 1 2 3 4 |
И в заключение подсчитаем, сколько же раз встречается каждое значение варианты.
0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2
В результате получаем законченную табличку или требуемый ряд распределения семей по количеству детей.
Число детей в семье — (х) | Количество семей (f) |
0 1 2 3 4 | 4 8 5 2 1 |
Итого | 20 |
Задание. Имеются данные о тарифных разрядах 30 рабочих предприятия. Построить дискретный вариационный ряд распределения рабочих по тарифному разряду. 2 3 2 4 4 5 5 4 6 3
1 4 4 5 5 6 4 3 2 3
4 5 4 5 5 6 6 3 3 4
Как построить интервальный вариационный ряд распределения
Построим интервальный ряд распределения, и посмотрим чем же его построение отличается от дискретного ряда.
Пример 2. Имеются данные о величине полученной прибыли 16 предприятий, млн. руб. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Построить интервальный вариационный ряд распределения предприятий по объему прибыли, выделив 3 группы с равными интервалами.
Общий принцип построения ряда, конечно же, сохраниться, те же две колонки, те же варианта и частота, но в здесь варианта будет располагаться в интервале и подсчет частот будет вестись иначе.
Вторая колонка это частота – как часто встречается наша варианта в исследуемом явление – название колонки так же берем из задания — распределения предприятий – значит наша частота это число предприятий с соответствующей прибылью, в данном случае попадающие в интервал.
В итоге макет нашей таблицы будет выглядеть так:
где i – величина или длинна интервала,
Хmax и Xmin – максимальное и минимальное значение признака,
n – требуемое число групп по условию задачи.
Рассчитаем величину интервала для нашего примера. Для этого среди исходных данных найдем самое большое и самое маленькое
23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 – максимальное значение 118 млн. руб., и минимальное 9 млн. руб. Проведем расчет по формуле.
В расчете получили число 36,(3) три в периоде, в таких ситуациях величину интервала нужно округлить до большего, чтобы после подсчетов не потерялось максимальное данное, именно поэтому в расчете величина интервала 36,4 млн. руб.
Обратим внимание если бы мы не округлили величину интервала до 36,4, а оставили бы ее 36,3, то последнее значение у нас бы получилось 117,9. Именно для того чтобы не было потери данных необходимо округлять величину интервала до большего значения.
При проведении обработки данных лучше всего отобранные данные обозначить условными значками или цветом, для упрощения обработки.
23 48 57 12 118 9 16 22
27 48 56 87 45 98 88 63
Первый интервал обозначим желтым цветом – и определим сколько данных попадает в интервал от 9 до 45,4, при этом данное 45,4 будет учитываться во втором интервале (при условии что оно есть в данных) – в итоге получаем 7 предприятий в первом интервале. И так дальше по всем интервалам.
По первому интервалу — 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 млн. руб.
По второму интервалу — 48 + 57 + 48 + 56 + 63 = 272 млн. руб.
По третьему интервалу — 118 + 87 + 98 + 88 = 391 млн. руб.
Объем полученной прибыли, млн. руб. — (х) | Число предприятий (f) | Общий объем прибыли, млн. руб. |
9,0 — 45,4 45,4 — 81,8 81,8 — 118,2 | 7 5 4 | 154 272 391 |
Итого | 16 | 817 |
Задание. Имеются данные о величине вклада в банке 30 вкладчиков, тыс. руб. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,
600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,
500, 520, 480, 630, 650, 670, 220, 140, 680, 320
Построить интервальный вариационный ряд распределения вкладчиков, по размеру вклада выделив 4 группы с равными интервалами. По каждой группе подсчитать общий размер вкладов.