Примеры решения задач по статистике

Примеры решения задач по статистике

Решаем задачи по статистике

Мода и медиана в статистике

Особый вид средних величин — структурные средние — применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен.
В качестве структурных средних чаще всего используют показатели моды — наиболее часто повторяющегося значения признака — и медианы — величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой — не меньше его.
Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется.
Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:
контрольная по статистике,
где XMe — нижняя граница медианного интервала;
hMe — его величина;
am/2- половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);
SMe-1 — сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;
mMe — число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).
При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интер­вального ряда с равными интервалами величина моды определяется как
контрольная по статистике,
где  ХMo — нижнее значение модального интервала;
mMo — число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);
mMo-1 — то же для интервала, предшествующего модальному;
mMo+1 — то же для интервала, следующего за модальным;
h — величина интервала изменения признака в группах.

Понятие об ошибке выборки. Методы расчета ошибки выборки

Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным способом. Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.
После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки.
Простая случайная выборка (собственно-случайная) есть отбор единиц из генеральной совокупности путем случайного отбора, но при условии вероятности выбора любой единицы из генеральной совокупности. Отбор проводится методом жеребьевки или по таблице случайных чисел.Типическая (стратифицированная) выборка предполагает разделение неоднородной генеральной совокупности на типологические или районированные группы по какому-либо существенному признаку, после чего из каждой группы производится случайный отбор единиц.
Для серийной (гнездовой) выборки характерно то, что генеральная совокупность первоначально разбивается на определенные равновеликие или неравновеликие серии (единицы внутри серий связаны по определенному признаку), из которых путем случайного отбора отбираются серии и затем внутри отобранных серий проводится сплошное наблюдение.
Механическая выборка представляет собой отбор единиц через равные промежутки (по алфавиту, через временные промежутки, по пространственному способу и т.д.). При проведении механического отбора генеральная совокупность разбивается на равные по численности группы, из которых затем отбирается по одной единице.
Комбинированная выборка основана на сочетании нескольких способов выборки.
Многоступенчатая выборка есть образование внутри генеральной совокупности вначале крупных групп единиц, из которых образуются группы, меньшие по объему, и так до тех пор, пока не будут отобраны те группы или отдельные единицы, которые необходимо исследовать.
Выборочный отбор может быть повторным и бесповторным. При повторном отборе вероятность выбора любой единицы не ограничена. При бесповторном отборе выбранная единица в исходную совокупность не возвращается.
Для отобранных единиц рассчитываются обобщенные показатели (средние или относительные) и в дальнейшем результаты выборочного исследования распространяются на всю генеральную совокупность.
Основной задачей при выборочном исследовании является определение ошибок выборки. Принято различать среднюю и предельную ошибки выборки. Для иллюстрации можно предложить расчет ошибки выборки на примере простого случайного отбора.
Расчет средней ошибки повторной простой случайной выборки производится следующим образом:
cредняя ошибка для средней
заказать контрольную по статистике
cредняя ошибка для доли
заказать контрольную по статистике
Расчет средней ошибки бесповторной случайной выборки:
средняя ошибка для средней
заказать контрольную по статистике
средняя ошибка для доли
заказать контрольную по статистике
Расчет предельной ошибки заказать контрольную по статистике повторной случайной выборки:
предельная ошибка для средней
Примеры решения задач по статистике
предельная ошибка для доли
Примеры решения задач по статистикегде t — коэффициент кратности;
Расчет предельной ошибки бесповторной случайной выборки:
предельная ошибка для средней
Примеры решения задач по статистике
предельная ошибка для доли
Примеры решения задач по статистике
Следует обратить внимание на то, что под знаком радикала в формулах при бесповторном отборе появляется множитель, где N — численность генеральной совокупности.
Что касается расчета ошибки выборки в других видах выборочного отбора (например, типической и серийной), то необходимо отметить следующее.
Для типической выборки величина стандартной ошибки зависит от точности определения групповых средних. Так, в формуле предельной ошибки типической выборки учитывается средняя из групповых дисперсий, т.е.
Примеры решения задач по статистике
При серийной выборке величина ошибки выборки зависит не от числа исследуемых единиц, а от числа обследованных серий (s) и от величины межгрупповой дисперсии:
Примеры решения задач по статистике
Серийная выборка, как правило, проводится как бесповторная, и формула ошибки выборки в этом случае имеет вид
Примеры решения задач по статистике
где Примеры решения задач по статистике— межсерийная дисперсия; s — число отобранных серий; S — число серий в генеральной совокупности.
Все вышеприведенные формулы применимы для большой выборки. Кроме большой выборки используются так называемые малые выборки (n < 30), которые могут иметь место в случаях нецелесообразности использования больших выборок.
При расчете ошибок малой выборки необходимо учесть два момента:
1) формула средней ошибки имеет вид
Примеры решения задач по статистике
2) при определении доверительных интервалов исследуемого показателя в генеральной совокупности или при нахождении вероятности допуска той или иной ошибки необходимо использовать таблицы вероятности Стьюдента, где Р = S (t, n), при этом Р определяется в зависимости от объема выборки и t.
В статистических исследованиях с помощью формулы предельной ошибки можно решать ряд задач.
1. Определять возможные пределы нахождения характеристики генеральной совокупности на основе данных выборки.
Доверительные интервалы для генеральной средней можно установить на основе соотношений
Примеры решения задач по статистике
где — Примеры решения задач по статистикегенеральная и выборочная средние соответственно; Примеры решения задач по статистике— предельная ошибка выборочной средней.
Доверительные интервалы для генеральной доли устанавливаются на основе соотношений
Примеры решения задач по статистике Примеры решения задач по статистике
2. Определять доверительную вероятность, которая означает, что характеристика генеральной совокупности отличается от выборочной на заданную величину.
Доверительная вероятность является функцией от t, где
Примеры решения задач по статистике
Доверительная вероятность по величине t определяется по специальной таблице.
3. Определять необходимый объем выборки с помощью допустимой величины ошибки:
Примеры решения задач по статистике
Чтобы рассчитать численность п повторной и бесповторной простой случайной выборки, можно использовать следующие формулы:
Примеры решения задач по статистике(для средней при повторном способе);
Примеры решения задач по статистике(для средней при бесповторном способе);
Примеры решения задач по статистике(для доли при повторном способе);
Примеры решения задач по статистике(для доли при бесповторном способе).

Задача 1

Определите индекс покупательской способности рубля, если в текущем году денежные средства на покупку товаров составили 860 млн. руб., денежные средства на оплату услуг 300 млн. руб. В планируемом году денежные средства на покупку товаров возрастут на 15% , денежные средства на оплату услуг увеличатся на 80 млн. рублей , цены на товары возрастут на 70% , ЦЕНЫ НА УСЛУГИ ВОЗРАСТУТ НА 20% Сделайте выводы.

Решение:

Рассчитаем планируемые показатели
Денежные средства на покупку товаров=860*1,15=989 млн. руб.
Денежные средства на оплату услуг=300+80=380 млн. руб.
Сведем все значения в таблицу.

Наименование

Денежные средства, млн. руб.

Цена

Текущий год

Планируемый год

Текущий год

Планируемый год

Товары

860

989

1

1,7

Услуги

300

380

1

1,2

Рассчитаем индекс цен.
примеры решения задач по статистике
Индекс покупательской способности рубля=1/Индекс цен
Индекс покупательской способности рубля=1/1,56=0,64

За счет повышения цены покупательская способность рубля снизилась  на 64%.

Задача 2

Рассчитайте среднюю выработку продавца по магазину по показателям:

секция Дневная выработка продавца тыс. руб. товарооборот тыс. руб.
1 3500 18600
2 4210 26000

Решение:
По формуле средней гармонической взвешенной:
примеры решения задач по статистике
Средняя выработка продавца по магазину равна 3878,26 тыс. руб.

Задача 3

Для определения сроков пользования краткосрочным кредитом в коммерческом банке города была проведена 5% случайная бесповторная выборка лицевых счетов, в результате которой получено следующее распределение клиентов по сроку пользования кредитом (таблица 1):

Срок пользования кредитом (дней)

Число вкладчиков (чел.)

До 30

60

30 – 45

40

45 – 60

120

60 – 75

80

Свыше 75

50

По данным таблицы постройте не менее трёх видов статистических графиков, возможных для этого исследования.

Решение:

1) На основе данных задачи построим гистограмму распределения числа вкладчиков в зависимости от срока пользования кредитом.
Срок пользования кредитом
Рис. 1. Гистограмма распределения числа вкладчиков
в зависимости от срока пользования кредитом

  

2) На основе данных задачи построим круговую диаграмму, отражающую число вкладчиков, имеющих различные сроки пользования кредитом, в общей их совокупности.

Число вкладчиков
Рис. 2. Круговая диаграмма, отражающая число вкладчиков,
имеющих различные сроки пользования кредитом, в общей численности вкладчиков обследуемой совокупности.

3) На основе данных задачи построим диаграмму фигур-знаков, отражающую распределения числа вкладчиков в зависимости от срока пользования кредитом.
Одна фигура-знак Примеры решения задач по статистике означает число вкладчиков от 10 человек.
Срок пользования кредитом до 30 дней: Примеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистике
Срок пользования кредитом от 30 до 45 дней: Примеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистике
Срок пользования кредитом от 45 до 60 дней:
Примеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистике
Срок пользования кредитом  от 60 до 75 дней: Примеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистике

Срок пользования кредитом более 75 дней: Примеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистике

Срок пользования кредитом до 30 дней: Примеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистикеПримеры решения задач по статистике

Рис. 3. Диаграмма фигур-знаков  распределения числа вкладчиков
в зависимости от срока пользования кредитом

Задача 4

В таблице 2 показано распределение рабочих монтажной бригады по уровню квалификации (разрядам).

Табельный номер

219

220

221

222

223

224

226

227

230

231

232

233

234

235

236

Разряд

4

4

7

6

4

6

4

5

2

4

2

5

2

5

6

Табельный номер

237

238

239

240

243

244

245

246

247

248

250

258

259

260

261

Разряд 2 5 4 6 7 3 7 6 4 6 3 5 4 6 5

Используя данные таблицы 2, выполните задания:

  1. Сгруппируйте рабочих по разрядам, постройте новую группировочную таблицу.
  2. Найдите моду, медиану и средний разряд рабочих данной бригады. Объясните, что означают полученные Вами значения средней величины, моды и медианы в данном исследовании.
  3. Постройте круговую диаграмму распределения рабочих по уровню квалификации.
  4. Найдите, какую долю составляют рабочие каждого разряда в общей численности рабочих бригады.

Решение:

1. Сгруппируем рабочих по разрядам:
Таблица 1

Разряд

2

3

4

5

6

7

Число рабочих

4

2

8

6

7

3

2. Модой (М0) в дискретном ряду распределения называется вариант, имеющий наибольшую частоту.
Варианты (хi) – разряды;
частоты (ni) – число рабочих, имеющих соответствующий разряд
В данном случае М0=4.
Медиана (Ме) – это значения варианта для которого значение накопленной частоты составляет не менее половины от общего числа наблюдений, а для следующего за ним варианта, значение накопленной частоты строго больше половины от общего числа наблюдений.
Рассчитаем накопленные частоты:
Таблица 2

Разряд (хi)

2

3

4

5

6

7

Число рабочих (ni)

4

2

8

6

7

3

Накопленная частота

4

6

14

20

27

30

Примеры решения задач по статистике
Ме=5
Средний разряд рабочих найдем по формуле средней арифметической взвешенной:
Примеры решения задач по статистике
Примеры решения задач по статистике
Полученные значения средней величины, моды и медианы означают следующее: в квалификация рабочего монтажной бригады в среднем соответствует разряду уровня 4,6; наибольшее число рабочих в бригаде имеет 4-ый разряд; половина рабочих бригады имеет разряд не выше 5-го и половина – не ниже 5-го разряда.
3. Построим круговую диаграмму распределения рабочих по уровню квалификации.
Диаграмма распределения рабочих
Рис. 4.  Круговая диаграмма распределения рабочих по уровню квалификации
4. Рассчитаем, какую долю составляют рабочие каждого разряда в общей численности рабочих бригады по формуле:
Примеры решения задач по статистике
Доля рабочих 2-го разряда в общей численности рабочих бригады составляет:
Примеры решения задач по статистике или 13,3%
Доля рабочих 3-го разряда в общей численности рабочих бригады составляет:
Примеры решения задач по статистике или 6,7%
Доля рабочих 4-го разряда в общей численности рабочих бригады составляет:
Примеры решения задач по статистике или 26,7%
Доля рабочих 5-го разряда в общей численности рабочих бригады составляет:
Примеры решения задач по статистике или 20%
Доля рабочих 6-го разряда в общей численности рабочих бригады составляет:
Примеры решения задач по статистике или 23,3%
Доля рабочих 7-го разряда в общей численности рабочих бригады составляет:
Примеры решения задач по статистике или 10%

Задача 5

В таблице  имеются данные об общей численности пенсионеров РФ в исследуемые годы.

год

1995

2000

2005

2007

2008

Численность пенсионеров (тыс. чел.)

37083

38411

38313

38467

38598

Используя данные таблицы 3, выполните задания:

  1. Определите вид статистического ряда, представленного в таблице.
  2. По данным таблицы определите основные показатели динамики.
  3. Определите среднюю численность пенсионеров в исследуемый период. Обоснуйте  применённую Вами формулу.
  4. По данным таблицы постройте динамический график численности пенсионеров в исследуемый период.
  5. Постройте парную линейную регрессию численности пенсионеров в исследуемый период.
  6. Используя построенную модель регрессии, сделайте прогноз на 2010  год и сравните с реальной ситуацией. Данные о численности пенсионеров в 2010 году можно найти в СМИ. Не забудьте указать источник информации.

Решение:

1. Статистического ряд, представленный в таблице представляет собой ряд динамики.
2. По данным таблицы определите основные показатели динамики.
Важнейшим статистическим показателем анализа динамики  яв­ляется абсолютный прирост (сокращение), т.е. абсолютное изменение, характеризующее увеличение или уменьшение уровня ряда за оп­ределенный промежуток времени. Абсолютный прирост с пере­менной базой называют скоростью роста.
Абсолютные приросты вычисляются по формулам:
Примеры решения задач по статистике (цепной)
Примеры решения задач по статистике (базисный)
где yi — уровень сравниваемого периода; yi-1— уровень предшествующего периода; У0уровень базисного периода.
Для оценки интенсивности, т. е. относительного изменения уровня динамического ряда за какой-либо период времени ис­числяют темпы роста (снижения).
Интенсивность изменения уровня оценивается отношением отчетного уровня к базисному.
Показатель интенсивности изменения уровня ряда, выра­женный в долях единицы, называется коэффициентом роста, а в процентах — темпом роста. Эти показатели интенсивности из­менения отличаются только единицами измерения.
Коэффициент роста (снижения) показывает, во сколько раз сравниваемый уровень больше уровня, с которым произ­водится сравнение (если этот коэффициент больше единицы) или какую часть уровня, с которым производится сравнение, составляет сравниваемый уровень (если он меньше единицы). Темп роста всегда представляет собой положительное число.
Коэффициент роста вычисляются по формулам:
Примеры решения задач по статистике(цепной)
Примеры решения задач по статистике  (базисный)
Темпы  роста:
Примеры решения задач по статистике (цепной)
Примеры решения задач по статистике  (базисный)
Темпы  прироста:
Примеры решения задач по статистике (цепной)
Примеры решения задач по статистике  (базисный)
Абсолютное значение одного процента прироста Ai . Этот показатель служит косвенной мерой базисного уровня. Представляет собой одну сотую часть базисного уровня, но одновременно представляет собой и отношение абсолютного прироста к соответствующему темпу роста.
Данный показатель рассчитывают по формуле
Примеры решения задач по статистике
Расчеты показателей оформим в таблице.
Таблица 3

Годы

Численность пенсионеров, тыс. чел.

Абсолютные приросты,                  тыс. чел.

Коэффициенты роста

Темпы роста, %

Темп прироста,      %

Абсолютное содержание 1% прироста, тыс. чел.

цеп

баз

цеп

баз

цеп

баз

цеп

баз

1995

37083

2000

38411

1328

1328

1,0358

1,0358

103,58

103,58

3,58

3,58

370,83

2005

38313

-98

1230

0,9974

1,0332

99,74

103,32

-0,26

3,32

384,11

2007

38467

154

1384

1,0040

1,0373

100,40

103,73

0,40

3,73

383,13

2008

38598

131

1515

1,0034

1,0409

100,34

104,09

0,34

4,09

384,67

3. Определим среднюю численность пенсионеров в исследуемый период. Средний уровень интервального ряда с разностоящими уровнями вычисляется по формуле средней арифметической взвешенной:
Примеры решения задач по статистике
Примеры решения задач по статистике(тыс.чел.)
4. По данным таблицы постройте динамический график численности пенсионеров в исследуемый период.
Численность пенсионеров
Рис. 4.  Динамический график численности пенсионеров в исследуемый период
5. Постройте парную линейную регрессию численности пенсионеров в исследуемый период.
Х – номер года; Y – численность пенсионеров
Для расчета параметров а и b  линейной регрессии Примеры решения задач по статистике решаем систему нормальных уравнений относительно а и b:
Примеры решения задач по статистике
Из системы коэффициенты линейной регрессии a и b определяются по формулам:
Примеры решения задач по статистике
Примеры решения задач по статистике
Расчеты оформим в таблице:
Таблица 4

№ п/п

Х

Y

ХY

X2

1

1995

37083

73980585

3980025

2

2000

38411

76822000

4000000

3

2005

38313

76817565

4020025

4

2007

38467

77203269

4028049

5

2008

38598

77504784

4032064

Итого

10015

190872

382328203

20060163

Среднее значение

2003

38174,4

76465640,6

4012033

Примеры решения задач по статистике
Примеры решения задач по статистике
Уравнение парной линейную регрессии численности пенсионеров определяется формулой:
Примеры решения задач по статистике
6. Используя построенную модель регрессии, сделаем прогноз на 2010  год
Данные о численности пенсионеров в 2010 году взяты из статистического сборника «Российский статистический ежегодник» — Стат.сб./Росстат. — М., 2011.
Численность пенсионеров в 2010 году составляла 39706 тыс. чел.
Прогноз численности пенсионеров на основе полученной модели составляет:
Примеры решения задач по статистике (тыс.чел.)
Сравним прогнозные данные с реальной ситуацией: реальная численность пенсионеров в 2010 году превышает численность, полученную при расчете по уравнению парной регрессии, на 2,15% или 834 тыс. чел.

Задача по выборочному наблюдению

Проведено выборочное тестирование студентов факультета по экономическим дисциплинам. Численность факультета 850 студентов, объем выборки, сформированной методом бесповторного отбора — 24 студента. Результаты тестирования приведены в таблице. По этим данным определить выборочные средний балл, дисперсию и стандартное отклонение. Вычислить ошибку выборки, найти границы доверительного интервала, в котором окажется средняя генеральной совокупности с вероятностью 0,866 и 0,997.

№ п/п Оценка  (в № п/п Оценка  (в

баллах)

№ п/п Оценка  (в № п/п Оценка  (в
баллах) баллах) баллах)
1 112 7 105 13 98 19 95
2 95 8 108 14 95 20 115
3 119 9 110 15 111 21 94
4 98 10 101 16 115 22 105
5 112 11 117 17 130 23 121
6 95 12 99 18 104 24 111

 

Пример решения задач по статистикерешение задачи по статистике

пример задачи по статистике