Домой / Безопасность / Для чего нужна статистическая обработка данных. Обработка статистических данных. Закрепление изученного материала

Для чего нужна статистическая обработка данных. Обработка статистических данных. Закрепление изученного материала

Атюшева Анна

В работе на примере обработки данных по успеваемости учащихся 7 класса рассмотрены основные статистические характеристики, проведен сбор и группировка статистических данных, наглядно представлена статистическая информация, проведен анализ полученных данных.

Работа содержит сопроводительную презентацию.

Скачать:

Предварительный просмотр:

Муниципальное автономное общеобразовательное учреждение «Гимназия № 24»

XXII научная конференция МАГНИ

Статистическая обработка данных

МАОУ «Гимназия №24» Атюшева Анна

Консультант: учитель математики

Щетинина Наталья Сергеевна

Магадан, 2016

Введение…………………………………………………………………………………………………3

  1. Основные понятия, используемые в статистической обработке данных……………………….5
  2. Исследовательская часть……………………………………………………..................................7

2.1.Статистическая обработка данных поуспеваемости учащихся 7 «В» класса…………………..7

2.2.Наглядное представление данных при помощигистограмм……………………………………18

2.3. Сравнительная характеристика учебной деятельности учащихся по результатам I и II четвертей………………………………………………………………………………………………..21

2.4. Анализ анкетирования учащихся 7 «В» класса на предмет контроля родителями за успеваемостью детей…………………………………………………………………………………...23

Заключение……………………………………………………………………………………………...27

Литература………………………………………………………………………………………………28

Введение

Любой из нас, открывая книгу или газету, включая телевизор или попадая на вокзал, постоянно сталкивается с табличной формой представления информации. Это расписание уроков, расписание движения поездов, таблица умножения и многое другое. Вся информация представляется в виде диаграмм или графиков.

Нужно уметь обрабатывать и анализировать такую информацию. Без обработки данных, сравнении событий нельзя проследить развитие той или иной проблемы.

В курсе алгебры нами были изучены статистические характеристики, имеющие широкое применение в различных исследованиях. Меня заинтересовало практическое применение изученных характеристик, и возможность обработать данные так чтобы представленная информация наглядно определяла ход развития той или иной проблемы и как следствие результат ее решение. В качестве такой проблемы я решила рассмотреть успеваемость своего класса по четвертям первого полугодия.

Объектная область исследования – алгебра

Объект исследования – статистические характеристики

Предмет исследования – успеваемость учащихся 7 «В» класса по четвертям I полугодия

Гипотеза: Мы полагаем, что на примере обработки данных по успеваемости учащихся 7В класса мы не только познакомимся с основными статистическими характеристиками, но и научимся самостоятельно:

  • проводить сбор и группировку статистических данных;
  • наглядно представлять статистическую информацию;
  • проводить анализ полученных данных.

Цель: научится обрабатывать, анализировать, наглядно представлять имеющуюся информацию.

Задачи:

  • изучить статистические характеристики;
  • собрать информацию об успеваемости учащихся 7 В класса по четвертям

первого полугодия;

  • обработать информацию;
  • провести наглядное представление информации при помощи гистограмм;
  • провести анализ полученных данных, сделать соответствующие выводы.

Основные понятия, используемые в статистической обработке данных

Статистика – наука, которая занимается получением, обработкой и анализом количественных данных о разнообразных массовых явлениях, происходящих в природе и обществе. Слово «статистика» происходит от латинского слова «status», которое означает «состояние, положение вещей».

Простейшие статистические характеристики это среднее арифметическое, медиана, размах, мода.

  • Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на число слагаемых. Обычно среднее арифметическое находят тогда, когда хотят определить среднее значение для некоторого ряда данных: среднюю урожайность пшеницы с 1 га в районе, среднюю выработку одного рабочего бригады за смену, средний балл аттестата, среднюю температуру воздуха в полдень в эту декаду и т.д.
  • Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с четным числом членов называется средней арифметической двух чисел, записанных посередине. Заметим, что удобнее и быстрее работать с числовым рядом, если он упорядоченный, т.е. такой ряд, в котором каждое последующее число не меньше (или не больше) предыдущего.
  • Модой ряда чисел называется число, наиболее часто встречающиеся в данном ряду. Ряд чисел может иметь более одной моды или не иметь моды совсем. Моду ряда данных обычно находят тогда, когда хотят выявить некоторый типичный показатель. Заметим, что среднее арифметическое ряда чисел может не совпадать ни с одним из этих чисел, а мода, если она существует, обязательно совпадает с двумя или более числами ряда. Кроме того, в отличие от среднего арифметического, понятие «мода» относиться не только к числовым данным.
  • Размахом ряда чисел называется разность между наибольшим и наименьшим из этих чисел. Размах ряда находят тогда, когда хотят определить как велик разброс данных в ряду.

Покажем определение каждой из характеристик на примере ряда чисел: 47,46,52,47,52,47,52,49,45,43,53,53,47,52.

Средним арифметическим 48,7.

Находится так: определяем сумму чисел и делим ее на их количество.

(47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7.

Медианой данного ряда чисел будет являться число 48.

Находится так: упорядочиваем ряд чисел, выбирая то, которое находится посередине. Если количество чисел четное, то находим среднее арифметическое двух, находящихся в середине ряда чисел.

43,45,46,47,47,47, 47,49 ,52,52,52,52,53,53

(47+49):2=48

Модой данного ряда чисел будут являться числа 47 и 52 . Эти числа повторяются чаще всего.

47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52 .

Размахом данного ряда чисел будет являться 10.

Находится так: выбираем самое большое и самое маленькое число ряда и находим разность между этими числами.

47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52

53-43=10

Исследовательская часть

Статистическая обработка данных по успеваемости учащихся 7 «В» класса

Перейдем к обработке информации. Составим таблицы по каждому из предметов, состоящие из трех строк, в первой будет ряд данных. Каждая варианта из этого ряда какое-то количество раз реально наблюдалась в выборке. Это количество и называют кратностью варианты. Вот и поставим во вторую строку кратности соответствующих вариант. Получим таблицу распределения выборки.

Если сложим все кратности, то получиться количество всех произведенных при выборке измерений – объем выборки (В нашем случае это число 24, что соответствует количеству учащихся в классе).

В третьей строке отношение, выраженное в процентах, называют частотой варианты.

Частота варианты =

Вообще, если по результатам исследования составлена таблица относительных частот, то сумма относительных частот равна 100%.

I четверть

Русский язык.

Упорядочим данные выборки (отметки): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,5.

Средний балл по предмету: (среднее арифметическое).

Таблица распределения частот

Варианта

Кратность варианты

Нет

Частота %

58.3%

37.5%

4.2%

Литература.

Упорядочим данные выборки (отметки): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5.

Средний балл по предмету: (среднее арифметическое).

Варианты оценок

кратность

нет

Частота %

37.5%

41.7%

20.8%

Алгебра.

Упорядочим данные выборки (отметки):3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,5,5.

Средний балл по предмету: (среднее арифметическое).

Наибольшее количество учеников по предмету имеют «4, 3» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

кратность

нет

Частота %

45.8%

45.8%

8.3%

История.

Упорядочим данные выборки (отметки):3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5

Средний балл по предмету: (среднее арифметическое).

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

45.8%

4.2%

Обществознание.

Упорядочим данные выборки (отметки):3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое).

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

37.5%

41.7%

20.8%

География.

Упорядочим данные выборки (отметки):3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5.5,5

Средний балл по предмету: (среднее арифметическое).

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

20.8%

41.7%

37.5%

Физика.

Упорядочим данные выборки (отметки):3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5

Средний балл по предмету: (среднее арифметическое).

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

37.5%

58.3%

4.2%

Биология.

Упорядочим данные выборки (отметки):3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4.4,5,5,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое).

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

45.8%

29.2%

ОБЖ.

Упорядочим данные выборки (отметки):4,4,4,4,4,4.4.5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое).

Варианты оценок

Кратность

нет

нет

Частота %

29.2%

70.8%

Упорядочим данные выборки (отметки):3,4,4,4.4,4,4,4,4,4,5,5,5,5,5,5,5.5,5,5.5,5,5,5

Средний балл по предмету: (среднее арифметическое).

Наибольшее количество учеников по предмету имеют «5» (мода)

Примерно половина учащихся по русскому языку учатся на 5 (медиана)

Варианты оценок

Кратность

нет

Частота %

4.2%

37.5%

58.3%

Английский язык.

Упорядочим данные выборки (отметки):3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5.5,5,5,5

Средний балл по предмету: (среднее арифметическое).

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

37.5%

41.7%

20.8%

Информатика.

Упорядочим данные выборки (отметки):3,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5,5,5.5.5,5,5,5,5

Средний балл по предмету: (среднее арифметическое).

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

4.2%

54.2%

41.7%

Технология.

Упорядочим данные выборки (отметки):3,3,3,3,3,4,4,4,4,4,4,5,5,5.5,5,5,55,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое).

Наибольшее количество учеников по предмету имеют «5» (мода)

Примерно половина учащихся по русскому языку учатся на 4.5 (медиана)

Варианты оценок

Кратность

нет

Частота %

20.8%

54.2%

Теперь соберем аналогичную информацию по результатам второй четверти.

Русский язык.

Упорядочим данные выборки (отметки):3,3,3.3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

кратность

Нет

нет

Частота %

41.7%

58.3%

Литература.

Упорядочим данные выборки (отметки):3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,5,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «3» (мода)

Примерно половина учащихся по русскому языку учатся на 3 (медиана)

Варианты оценок

кратность

нет

Частота %

41.7%

33.3%

Алгебра.

Упорядочим данные выборки (отметки):3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,5,5,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «3» (мода)

Примерно половина учащихся по русскому языку учатся на 3 (медиана)

Варианты оценок

кратность

нет

Частота %

37.5%

12.5%

История.

Упорядочим данные выборки (отметки):3,3,3,3,3,3,3,3,3,4.4,4,4,4,4,4,4,4,4,4,4,4,4,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

37.5%

58.3%

4.2%

Общество.

Упорядочим данные выборки (отметки):3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

16.7%

70.8%

12.5%

География.

Упорядочим данные выборки (отметки):3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

12.5%

58.3%

29.2%

Физика.

Упорядочим данные выборки (отметки):3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,44,5,5,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

33.3%

16.7%

12.5%

Биология.

Упорядочим данные выборки (отметки):3,3,3,4,4,4,4,4,4,4.4,4,4,4,4,4,4,4,5,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

12.5%

62.5%

ОБЖ.

Упорядочим данные выборки (отметки):3,4,4,5,5,5,5,5.5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «5» (мода)

Примерно половина учащихся по русскому языку учатся на 5 (медиана)

Варианты оценок

Кратность

нет

Частота %

4.2%

8.3%

87.5%

История и общество родного края.

Упорядочим данные выборки (отметки):3,3,3,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

12.5%

45.8%

41.7%

Английский язык.

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

20.8%

29.2%

Информатика.

Упорядочим данные выборки (отметки):3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «4» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

20.8%

29.2%

Технология.

Упорядочим данные выборки (отметки):3,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5

Средний балл по предмету: (среднее арифметическое)

Наибольшее количество учеников по предмету имеют «5» (мода)

Примерно половина учащихся по русскому языку учатся на 4 (медиана)

Варианты оценок

Кратность

нет

Частота %

4.2%

29.2%

66.7%

Наглядное представление данных при помощи гистограмм

Для наглядного представления данных, полученных в результате статистического исследования, широко используют различные способы их изображения.

Мы для наглядности данных будем использовать гистограммы. Гистограмма представляет собой ступенчатую фигуру, составленную из сомкнутых прямоугольников. Основание каждого прямоугольника равно длине интервала, а высота – кратности варианта или относительной частоте. Таким образом, в гистограмме, в отличие от обычной столбчатой диаграммы, основания прямоугольника выбираются не произвольно, а строго определены длиной интервала.

Сравнительная характеристика успеваемости учащихся по предметам первой четверти

Сравнительная характеристика успеваемости учащихся по предметам второй четверти

Выводы

По результатам первой четверти наглядно видно, что сложнее всего учащиеся справляются с такими предметами как: русский язык и алгебра, предметы по которым «тройка» - оценка, являющаяся приоритетной по отношению к другим отметкам. А значит качество по этим предметам ниже, чем по другим.

Так же видно, что высокий уровень троек по таким предметам, как литература, история, общество, физика, английский язык. Печально и наличие троек по таким предметам, как технология, биология, география.

По результатам второй четверти значительно уменьшилось количество троек и пятерок, то есть учащиеся распределили свои силы по всем предметам, а не по отдельно предпочитаемым.

Гистограмма распределения среднего балла по предметам первой четверти

Гистограмма распределения среднего балла по предметам второй четверти

Вывод

Для создания данных диаграмм мы использовали такую статистическую характеристику, как среднее арифметическое. Наглядно видно, что во II четверти ухудшились знания по русскому языку, истории и обществу родного края, информатики. Улучшились по истории, обществу, физике, биологии, ОБЖ, английскому языку. Но при этом по диаграммам видно, что более существенные изменения в лучшую сторону произошли только по физикеи английскому языку.

Сравнительная характеристика учебной деятельности учащихся по результатам I и II четвертей

Гистограмма качества знаний по предметам первой четверти

Гистограмма качества знаний по предметам второй четверти

Объединив обе гистограммы в одну гораздо проще увидеть картину успеваемости класса в сравнении. А по отдельности проще увидеть по каким предметам качество выше. Например в первой четверти качество менее 60 % по предметам - алгебра, русский язык, история, во второй – русский язык, литература, алгебра, физика. Уже видно, что наиболее сложно учащимся даются русский язык, алгебра. А процент качества по всем предметам не особо отличается 66% - первая четверть, 68% - вторая. То есть скачкообразное качество по предметам, которое наглядно видно на диаграмме сравнения, наводит на мысль о том, что учащиеся не особо стараются повысить уровень своих знаний, и не удерживают своих позиций в том или ином предметном направлении.

Диаграмма сравнения всех предметов по качеству за 1 и 2 четверти

За II четверть значительно увеличилось количество хорошистов и отличников по русскому языку, обществу, биологии, английскому языку, технологии. Незначительно уменьшилось количество по литературе, алгебре, ОБЖ, ИОРК и по информатике. И видно сильное падение качества по физике, что связано с неготовностью учащихся к урокам.

И опять мы приходим к выводу, что дети учатся «скачкообразно», и нет особых предпочтений в направленности обучения (гуманитарные предметы, физико-математические, предметы естественного цикла).

Анализ анкетирования учащихся 7 «В» класса на предмет контроля родителями за успеваемостью детей

По результатам вышеописанного исследования, мы решили провести анкетирование среди учащихся 7 «В» класса на предмет контроля родителей за обучением детей (анкеты, см.приложение)

Объем выборки -22 человека.

Проверка домашнего задания родителями

Вывод

Практически четверть учащихся по данному вопросу без контроля родителей, что конечно же отражается на их успеваемости.

Количество проверок в неделю домашнего задания

Медиана = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3+3):2 = 3

Среднее арифметическое = 3

Вывод

В среднем задание проверяется три раза в неделю. С учетом скачкообразности в обучении, этого не достаточно.

Медиана = 0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,5,5,6,7,7,7 = (2+2):2 = 2

Среднее арифметическое = 3(в среднем дневники родителями проверяются 3 раза в неделю)

Количество времени затрачиваемое учащимися на выполнение домашнего задания

Варианты

Меньше 1

Частота %

  • Размах R=x(max) – x(min)= 3,5 – 0,5 = 3часа

(характеризует величину разброса наблюдаемых значений, т.е. показывает разницу между наибольшим и наименьшим временем)

  • Мода M(0) = 2,5часа (показывает значение, встречающиеся чаще других, т.е. показывает время, которое учащиеся затрачивают чаще всего)

Гистограмма Затраченного времени учащимися на выполнение домашнего задания

Вывод

В среднем на выполнение домашнего задания уходит в день 2,5 часа. Что для возраста учащихся считается нормальным показателем.

Заключение

В результате проделанной работы я научилась обрабатывать и анализироватьимеющуюся информацию

Знание статистических характеристик помогли мне определить средний бал по разным предметам, а также моду и размах в тех показателях успеваемости, где, казалось бы,их определитьневозможно. Без обработки данных, сравнении событий нельзя проследить развитие той или иной проблемы. Мы постарались не только проследить за создавшейся проблемой – снижение уровня качества знаний и успеваемости по предметам, но и попробовать выяснить причину, которая на наш взгляд крылась в недостаточном контроле родителей за успеваемостью их детей. Анкетирование и результаты успеваемости показали, что учащиеся 7 «В» класса не достаточно имеют навык в самоконтроле за своим обучением, а родители считают обратное.

Проделанная работа думаю, будет полезнакак классному руководителю в работе с родителями, так и моим одноклассникам для улучшения в дальнейшем своих результатов по отдельным предметам.

Статистика - наука, изучающая, обрабатывающая и анализирующая количественные данные о самых разнообразных массовых явлениях в жизни. Мы только немного раскрыли для себя ее характеристики, а впереди еще много неизведанного и интересного.

Список литературы:

  1. http://www.nado5.ru/e-book/naibolshii-obzchii-delitel
    Предварительный просмотр:

    Чтобы пользоваться предварительным просмотром презентаций создайте себе аккаунт (учетную запись) Google и войдите в него: https://accounts.google.com


    Подписи к слайдам:

    Статистическая обработка данных Подготовила: ученица 7 класса «В» МАОУ «Гимназии № 24» Атюшева Анна Консультант: учитель математики Щетинина Наталья Сергеевна

    Цель: научится обрабатывать, анализировать, наглядно представлять имеющуюся информацию. Задачи: изучить статистические характеристики; собрать информацию об успеваемости учащихся 7 В класса по четвертям первого полугодия; обработать информацию; провести наглядное представление информации при помощи гистограмм; провести анализ полученных данных, сделать соответствующие выводы.

    Гипотеза на примере обработки данных по успеваемости учащихся можно не только познакомимся с основными статистическими характеристиками, но и научится проводить сбор и группировку статистических данных; наглядно представлять статистическую информацию; анализировать полученные данные.

    Статистика – наука, которая занимается получением, обработкой и анализом количественных данных о разнообразных массовых явлениях, происходящих в природе и обществе. Слово «статистика» происходит от латинского слова « status », которое означает «состояние, положение вещей ». Простейшие статистические характеристики: Среднее арифметическое Медиана Размах Мода

    О пределение каждой из характеристик на примере ряда чисел: 47,46,52,47,52,47,52,49,45,43,53,53,47,52. Средним арифметическим данного ряда чисел будет являться число 48,7 . (47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7. Медианой данного ряда чисел будет являться число 48. 43,45,46,47,47,47, 47 , 49 ,52,52,52,52,53,53 (47+49):2=48 Модой данного ряда чисел будут являться числа 47 и 52 . 47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52. Размахом данного ряда чисел будет являться 10. 47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52 53-43=10

    Проблемы с успеваемостью в 7 «В» классе

    Варианта 2 3 4 5 Кратность варианты нет 14 9 1 Частота % 0% 58.3% 37.5% 4.2% Русский язык. Упорядочим данные выборки (отметки): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,5. Средний балл по предмету: 14∙3+9∙4+5∙124=8324≈3,5 (среднее арифметическое). Наибольшее количество учеников по предмету имеют «3» (мода) Примерно половина учащихся по русскому языку учатся на 3 (медиана)

    Для наглядного представления данных, полученных в результате статистического исследования, широко используют различные способы их изображения.

    Сравнительная характеристика успеваемости учащихся по предметам I четверти

    Сравнительная характеристика успеваемости учащихся по предметам II четверти

    Гистограмма распределения среднего балла по предметам I и II четверти

    Диаграмма сравнения всех предметов по качеству за I и II четвертях

    Анкетирование среди учащихся 7 «В» класса на предмет контроля родителей за обучением детей АНКЕТА 1. Проверяют ли у вас родители домашнее задание? ___________________________________________________________ 2. Сколько раз в неделю? ___________________________________________________________ 3. Сколько раз в неделю родители смотрят ваш дневник? ___________________________________________________________ 4. Сколько времени в среднем вы уделяете каждый день на выполнение домашнего задания? ___________________________________________________________

    Проверка домашнего задания родителями

    Количество проверок в неделю домашнего задания Медиана = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3+3):2 = 3 Среднее арифметическое = 3

    Гистограмма з атраченного времени учащимися на выполнение домашнего задания

  • Слайд 2

    • Статистика - это точная наука, изучающая методы сбора, анализа и обработки данных, которые описывают массовые действия, явления и процессы
    • Математическая статистика – это раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений случайных массовых явлений с целью выявления существующих закономерностей.
  • Слайд 3

    Статистика изучает

    • численность отдельных групп населения страны и ее регионов,
    • производство и потребление разнообразных видов продукции,
    • перевозку грузов и пассажиров различными видами транспорта,
    • природные ресурсы и многое другое.
    • Результаты статистических исследований широко используются для практических и научных выводов.
    • В настоящее время статистика начинает изучаться уже в средней школе, в ВУЗах это обязательный предмет, потому что связан со многими науками и отраслями.
    • Чтобы увеличить количество продаж в магазине, чтобы улучшить качество знаний в школе, чтобы двигать страну по экономическому росту, надо проводить статистические исследования и делать соответствующие выводы. И это должен уметь каждый.
  • Слайд 4

    Главные цели изучения элементов статистики

    • Формирование умений первичной обработки статистических данных;
    • изображение и анализ количественной информации, представленной в разных формах (в виде таблиц, диаграмм, графиков реальной зависимостей);
    • формирование представлений о важных статистических идеях, а именно: идее оценивания и идее проверки статистических гипотез;
    • формирование умений сравнивать вероятности наступления случайных событий с результатами конкретных экспериментов.
  • Слайд 5

    • Ряд данных
    • Объем ряда данных
    • Размах ряда данных
    • Мода ряда данных
    • Медиана ряда
    • Среднее арифметическое
    • Упорядоченные ряды данных
    • Таблица распределения данных
    • Подведём итоги
    • Номинативный ряд данных
    • Частота результата
    • Процентная частота
    • Группировка данных
    • Способы обработки данных
    • Подведём итоги
  • Слайд 6

    Определение

    • Ряд данных – это ряд результатов каких-либо измерений.
    • Например:1) измерения роста человека
    • 2) Измерения веса человека (животного)
    • 3)Показания счетчика (электроэнергии, воды, тепла…)
    • 4) Результаты в беге на стометровку
    • И т.д.
  • Слайд 7

    • Объемомряда данных называется количество всех данных.
    • Например: дан ряд чисел 1; 3; 6; -4; 0
    • объём его будет равен 5. Почему?
  • Слайд 8

    Выполни задание

    • Определите объём данного ряда.
    • Ответ: 10
  • Слайд 9

    Определение

    • Размах – это разность между наибольшим и наименьшим числами из ряда данных.
    • Например: если дан ряд чисел 1; 3; 6; -4; 0; 2, то размах этого ряда данных будет равен 6 (т.к. 6 – 0 = 6)
  • Слайд 10

    Выполни задание

    • В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Определите размах данного ряда.
    • Ответ: 3
  • Слайд 11

    Определение

    • Модой ряда данных называетсячисло ряда, которое встречается в этом ряду наиболее часто.
    • Ряд данных может иметь или не иметь моду.
    • Так, в ряду данных 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 каждое из чисел 47 и 52 встречается два раза, а остальные числа - менее двух раз. В таких случаях условились считать, что ряд имеет две моды: 47 и 52.
  • Слайд 12

    Выполни задание

    • Так, в ряду данных
    • 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 каждое из чисел 47 и 52 встречается два раза, а остальные числа - менее двух раз. В таких случаях условились считать, что ряд имеет две моды: 47 и 52.
    • В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки:
    • 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Определите моду данного ряда.
    • Ответ: 4
  • Слайд 13

    Определение

    • Медиана с нечётным числом членов – это число, записанное посередине.
    • Медиана с чётным числом членов - это среднее арифметическое двух чисел, записанных посередине.
    • Например: определить медиану ряда чисел
    • 1) 6; -4; 5; -2; -3; 3; 3; -2; 3. Ответ: -3
    • 2) -1; 0; 2; 1; -1; 0;2; -1. Ответ: 0
  • Слайд 14

    Выполни задание

    • В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Определите медиану данного ряда.
    • Ответ: 4
  • Слайд 15

    Определение

    • Среднее арифметическое - ЭТО частное от деления суммы чисел ряда на их количество.
    • Например: дан ряд чисел -1; 0; 2; 1; -1; 0; 2; -1. Тогда среднее арифметическое будет равно: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0,25
  • Слайд 16

    Выполни задание

    • В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Определите среднее арифметическое данного ряда.
    • Ответ: 3,9
  • Слайд 17

    Практическая работа

    • Задание: охарактеризовать успеваемость ученика Иванова по математике за четвертую четверть.
    • ВЫПОЛНЕНИЕ РАБОТЫ:
    • 1.Сбор информации:
    • Выписаны оценки из журнала: 5,4,5,3,3,5,4,4,4.
    • 2.Обработка полученных данных:
    • объём = 9
    • размах = 5 - 3 = 2
    • мода = 4
    • медиана = 3
    • среднее арифметическое =(5+4+5+3+3+5+4+4+4) : 9 ≈ 4
    • Характеристика успеваемости: ученик не всегда готов к уроку.
    • В основном учится на «4». За четверть выходит «4».
  • Слайд 18

    Самостоятельно

    • Надо найти объём ряда, размах ряда, моду, медиану и среднее арифметическое:
    • Карточка 1. 22,5; 23; 21,5; 22; 23.
    • Карточка 2. 6; -4; 5; -2; -3; 3; 3; -2; 3.
    • Карточка 3. 12,5; 12; 12; 12,5; 13; 12,5; 13.
    • Карточка 4. -1; 0; 2; 1; -1; 0; 2; -1.
    • Карточка 5. 125; 130; 124; 131.
    • Карточка 6. 120; 100; 110.
  • Слайд 19

    Проверим

    • Карточка 1.
    • объём ряда = 5
    • размах ряда = 10
    • мода = 23
    • медиана = 21,5
    • среднее арифметическое = 13,3
    • Карточка 3.
    • объём ряда = 7
    • размах ряда = 1
    • мода = 12,5
    • медиана = 12,5
    • среднее арифметическое = 12,5
    • Карточка 2.
    • объём ряда = 9
    • размах ряда = 10
    • мода = 3
    • медиана = -3
    • среднее арифметическое = 1
    • Карточка 4.
    • объём ряда = 8
    • размах ряда = 3
    • мода = -1
    • медиана = 0
    • среднее арифметическое = 0,25
  • Слайд 20

    • Карточка 5.
    • объём ряда = 4
    • размах ряда = 7
    • мода = нет
    • медиана = 127
    • среднее арифметическое =127,5
    • Карточка 6.
    • объём ряда = 3
    • размах ряда = 20
    • мода = нет
    • медиана = 100
    • среднее арифметическое = 110
  • Слайд 21

    Определение

    • Упорядоченными рядами данных называются ряды, в которых данные расположены по какому то правилу
    • Как упорядочить ряд чисел? (Записать числа так, чтобы каждое последующее число было не меньше (не больше) предыдущего); или записать некоторые названия «по алфавиту»…
  • Слайд 22

    Выполни задание

    • Дан ряд чисел:
    • -1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1
    • Упорядочить его по возрастанию чисел.
    • Решение:
    • -3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3
    • Получился упорядоченный ряд. Сами данные в нем не изменились, изменился только порядок их следования.
  • Слайд 23

    Определение

    • Таблица распределения данных – это таблица упорядоченного ряда, в котором вместо повторений одного и того же числа записывается количество повторений.
    • И наоборот, если известна таблица распределения, то можно составить упорядоченный ряд данных.
    • Например:
    • Из нее получается такой упорядоченный ряд:
    • -3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8
  • Слайд 24

    Выполни задание

    • В женском обувном магазине провели статистические исследования и составили соответствующую таблицу по цене обуви и количества продаж:
    • Цена (руб.): 500 1200 1500 1800 2000 2500
    • Количество: 8 9 14 15 3 1
    • Для данных показателей надо найти статистические характеристики:
    • составить упорядоченный ряд данных
    • объем ряда данных
    • размах ряда
    • моду ряда
    • медиану ряда
    • среднее арифметическое ряда данных
  • Слайд 25

    И ответить на следующие вопросы

    • Из данных ценовых категорий, обувь за какую цену не следует продавать магазину?
    • Обувь, по какой цене следует распространять?
    • К какой цене лучше стремиться?
  • Слайд 26

    Подведём итоги

    • Мы познакомились с начальными понятиями того, как происходит статистическая обработка данных:
    • данные всегда являются результатом какого-либо измерения
    • у ряда некоторых данных можно найти:
    • объём, размах, моду, медиану и
    • среднее арифметическое
    • 3) любой ряд данных можно
    • упорядочить и составить
    • таблицу распределения данных
  • Слайд 27

    Определение

    • Номинативный ряд данных – это НЕ ЧИСЛОВЫЕ ДАННЫЕ, а например, имена; названия; номинации…
    • Например:список финалистов чемпионатов мира по футболу с 1930 года: Аргентина, Чехословакия, Венгрия, Бразилия, Венгрия, Швеция, Чехословакия, ФРГ, Италия, Нидерланды, Нидерланды, ФРГ, ФРГ,
    • Аргентина, Италия, Бразилия, Германия, Франция
  • Слайд 28

    Выполни задание

    • Найти из предыдущего примера:
    • объём ряда 2) моду ряда
    • 3) составьте таблицу распределения
    • Решение: объём =18; мода – немецкая команда.
  • Cлайд 1

    Cлайд 2

    Статистика - это точная наука, изучающая методы сбора, анализа и обработки данных, которые описывают массовые действия, явления и процессы Математическая статистика – это раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений случайных массовых явлений с целью выявления существующих закономерностей.

    Cлайд 3

    Статистика изучает: численность отдельных групп населения страны и ее регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и многое другое. Результаты статистических исследований широко используются для практических и научных выводов. В настоящее время статистика начинает изучаться уже в средней школе, в ВУЗах это обязательный предмет, потому что связан со многими науками и отраслями. Чтобы увеличить количество продаж в магазине, чтобы улучшить качество знаний в школе, чтобы двигать страну по экономическому росту, надо проводить статистические исследования и делать соответствующие выводы. И это должен уметь каждый.

    Cлайд 4

    Главные цели изучения элементов статистики Формирование умений первичной обработки статистических данных; изображение и анализ количественной информации, представленной в разных формах (в виде таблиц, диаграмм, графиков реальной зависимостей); формирование представлений о важных статистических идеях, а именно: идее оценивания и идее проверки статистических гипотез; формирование умений сравнивать вероятности наступления случайных событий с результатами конкретных экспериментов.

    Cлайд 5

    Содержание Ряд данных Объем ряда данных Размах ряда данных Мода ряда данных Медиана ряда Среднее арифметическое Упорядоченные ряды данных Таблица распределения данных Подведём итоги Номинативный ряд данных Частота результата Процентная частота Группировка данных Способы обработки данных Подведём итоги

    Cлайд 6

    Определение Ряд данных – это ряд результатов каких-либо измерений. Например:1) измерения роста человека 2) Измерения веса человека (животного) 3)Показания счетчика (электроэнергии, воды, тепла…) 4) Результаты в беге на стометровку И т.д.

    Cлайд 7

    Определение Объемом ряда данных называется количество всех данных. Например: дан ряд чисел 1; 3; 6; -4; 0 объём его будет равен 5. Почему?

    Cлайд 8

    Выполни задание: В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определите объём данного ряда. Ответ: 10

    Cлайд 9

    Определение Размах – это разность между наибольшим и наименьшим числами из ряда данных. Например: если дан ряд чисел 1; 3; 6; -4; 0; 2, то размах этого ряда данных будет равен 6 (т.к. 6 – 0 = 6)

    Cлайд 10

    Выполни задание: В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определите размах данного ряда. Ответ: 3

    Cлайд 11

    Определение Модой ряда данных называется число ряда, которое встречается в этом ряду наиболее часто. Ряд данных может иметь или не иметь моду. Так, в ряду данных 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 каждое из чисел 47 и 52 встречается два раза, а остальные числа - менее двух раз. В таких случаях условились считать, что ряд имеет две моды: 47 и 52.

    Cлайд 12

    Выполни задание: Так, в ряду данных 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 каждое из чисел 47 и 52 встречается два раза, а остальные числа - менее двух раз. В таких случаях условились считать, что ряд имеет две моды: 47 и 52. В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определите моду данного ряда. Ответ: 4

    Cлайд 13

    Определение Медиана с нечётным числом членов – это число, записанное посередине. Медиана с чётным числом членов - это среднее арифметическое двух чисел, записанных посередине. Например: определить медиану ряда чисел 1) 6; -4; 5; -2; -3; 3; 3; -2; 3. Ответ: -3 2) -1; 0; 2; 1; -1; 0;2; -1. Ответ: 0

    Cлайд 14

    Выполни задание: В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определите медиану данного ряда. Ответ: 4

    Cлайд 15

    Определение Среднее арифметическое - ЭТО частное от деления суммы чисел ряда на их количество. Например: дан ряд чисел -1; 0; 2; 1; -1; 0; 2; -1. Тогда среднее арифметическое будет равно: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0,25

    Cлайд 16

    Выполни задание: В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5. Определите среднее арифметическое данного ряда. Ответ: 3,9

    Cлайд 17

    ПРАКТИЧЕСКАЯ РАБОТА Задание: охарактеризовать успеваемость ученика Иванова по математике за четвертую четверть. ВЫПОЛНЕНИЕ РАБОТЫ: 1.Сбор информации: Выписаны оценки из журнала: 5,4,5,3,3,5,4,4,4. 2.Обработка полученных данных: объём = 9 размах = 5 - 3 = 2 мода = 4 медиана = 3 среднее арифметическое =(5+4+5+3+3+5+4+4+4) : 9 ≈ 4 Характеристика успеваемости: ученик не всегда готов к уроку. В основном учится на «4». За четверть выходит «4».

    Cлайд 18

    Самостоятельно: Надо найти объём ряда, размах ряда, моду, медиану и среднее арифметическое: Карточка 1. 22,5; 23; 21,5; 22; 23. Карточка 2. 6; -4; 5; -2; -3; 3; 3; -2; 3. Карточка 3. 12,5; 12; 12; 12,5; 13; 12,5; 13. Карточка 4. -1; 0; 2; 1; -1; 0; 2; -1. Карточка 5. 125; 130; 124; 131. Карточка 6. 120; 100; 110.

    Cлайд 19

    Проверим Карточка 1. объём ряда = 5 размах ряда = 10 мода = 23 медиана = 21,5 среднее арифметическое = 13,3 Карточка 3. объём ряда = 7 размах ряда = 1 мода = 12,5 медиана = 12,5 среднее арифметическое = 12,5 Карточка 2. объём ряда = 9 размах ряда = 10 мода = 3 медиана = -3 среднее арифметическое = 1 Карточка 4. объём ряда = 8 размах ряда = 3 мода = -1 медиана = 0 среднее арифметическое = 0,25

    Cлайд 20

    Проверим Карточка 5. объём ряда = 4 размах ряда = 7 мода = нет медиана = 127 среднее арифметическое =127,5 Карточка 6. объём ряда = 3 размах ряда = 20 мода = нет медиана = 100 среднее арифметическое = 110

    Cлайд 21

    Определение Упорядоченными рядами данных называются ряды, в которых данные расположены по какому то правилу Как упорядочить ряд чисел? (Записать числа так, чтобы каждое последующее число было не меньше (не больше) предыдущего); или записать некоторые названия «по алфавиту»…

    Cлайд 22

    Выполни задание: Дан ряд чисел: -1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1 Упорядочить его по возрастанию чисел. Решение: -3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3 Получился упорядоченный ряд. Сами данные в нем не изменились, изменился только порядок их следования.

    Cлайд 23

    Определение Таблица распределения данных – это таблица упорядоченного ряда, в котором вместо повторений одного и того же числа записывается количество повторений. И наоборот, если известна таблица распределения, то можно составить упорядоченный ряд данных. Например: Из нее получается такой упорядоченный ряд: -3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8

    Cлайд 24

    Выполни задание: В женском обувном магазине провели статистические исследования и составили соответствующую таблицу по цене обуви и количества продаж: Цена (руб.): 500 1200 1500 1800 2000 2500 Количество: 8 9 14 15 3 1 Для данных показателей надо найти статистические характеристики: составить упорядоченный ряд данных объем ряда данных размах ряда моду ряда медиану ряда среднее арифметическое ряда данных

    Cлайд 25

    И ответить на следующие вопросы: Из данных ценовых категорий, обувь за какую цену не следует продавать магазину? Обувь, по какой цене следует распространять? К какой цене лучше стремиться?

    Cлайд 26

    Подведём итоги: Мы познакомились с начальными понятиями того, как происходит статистическая обработка данных: данные всегда являются результатом какого-либо измерения у ряда некоторых данных можно найти: объём, размах, моду, медиану и среднее арифметическое 3) любой ряд данных можно упорядочить и составить таблицу распределения данных

    Cлайд 27

    Определение Номинативный ряд данных – это НЕ ЧИСЛОВЫЕ ДАННЫЕ, а например, имена; названия; номинации… Например: список финалистов чемпионатов мира по футболу с 1930 года: Аргентина, Чехословакия, Венгрия, Бразилия, Венгрия, Швеция, Чехословакия, ФРГ, Италия, Нидерланды, Нидерланды, ФРГ, ФРГ, Аргентина, Италия, Бразилия, Германия, Франция

    Cлайд 28

    Выполни задание: Найти из предыдущего примера: объём ряда 2) моду ряда 3) составьте таблицу распределения Решение: объём =18; мода – немецкая команда.

    Cлайд 29

    Лабораторная работа №3. Статистическая обработка данных в системе MatLab

    Общая постановка задачи

    Основной целью выполнения лабораторной работы является ознакомление с основами работы со статистической обработкой данных в среде MatLAB.

    Теоретическая часть

    Первичная статистическая обработка данных

    Статистическая обработка данных основывается на первичных и вторичных количественных методах. Цель первичной обработки статистических данных является структурирование полученных сведений, подразумевающее группировку данных в сводные таблицы по различным параметрам. Первичные данных должны быть представлены в таком формате, чтобы человек смог провести приближенную оценку полученной совокупности данных и выявить информацию о распределении данных полученной выборки данных, например, однородность или компактность данных. После первичного анализа данных применяются методы вторичной статистической обработки данных, на основании которых определяются статистические закономерности в имеющемся наборе данных.

    Проведение первичного статистического анализа над массивом данных позволяет получить знания о следующем:

    Какое значение наиболее характерно для выборки? Для ответа на данный вопрос определяются меры центральной тенденции.

    Велик ли разброс данных относительно этого характерного значения, т. е. какова «размытость» данных? В данном случае определяются меры изменчивости.

    Стоит отметить тот факт, что статистические показатели меры центральной тенденции и изменчивостиопределяются только на количественных данных.

    Меры центральной тенденции – группа величин, вокруг которых группируются остальные данные.Таким образом, меры центральной тенденции обобщают массив данных, что делает возможным формирование умозаключений как о выборке в целом, так и проведение сравнительного анализа разных выборок друг с другом.

    Допустим имеется выборка данных , тогда меры центральной тенденции оцениваются следующими показателями:

    1. Выборочное среднее – это результат деления суммы всех значений выборки на их количество.Определяется по формуле (3.1).

    (3.1)

    где - i -й элемент выборки;

    n – количество элементов выборки.

    Выборочное среднее позволяет получить наибольшую точность в процессе оценки центральной тенденции.

    Допустим имеется выборка из 20 человек. Элементами выборки являются сведения о среднем ежемесячном доходе каждого человека. Предположим, что 19 человек имеют средний ежемесячный доход в 20 т.р. и 1 человек с доходом в 300 т.р. Суммарный ежемесячный доход всей выборки составляет 680 т.р. Выборочное среднее в данном случае S=34.


    2. Медиана – формирует значение, выше и ниже которого количество отличающихся значений одинаково, т. е. это центральное значение в последовательном ряду данных. Определяется в зависимости четности/нечетности количества элементов выборке по формулам (3.2) или (3.3).Алгоритм оценки медианы для выборки данных :

    Первым делом данные ранжируются (упорядочиваются) по убыванию/возрастанию .

    Если в упорядоченной выборке нечетное число элементов, то медиана совпадает с центральным значением.

    (3.2)

    где n

    В случае четного числа элементов медиана определяется как как среднее арифметическое двух центральных значений.

    (3.3)

    где - средний элемент упорядоченной выборки;

    - элемент упорядоченной выборки следующий за ;

    Количество элементов выборки.

    В том случае, если все элементы выборки различны, то ровно половина элементов выборки больше медианы, а другая половина меньше. Например, для выборки {1, 5, 9, 15, 16} медиана совпадает с элементом 9.

    В статистическом анализе данных медиана позволяет определить элементы выборки, которые сильно влияют на значение выборочного среднего.

    Допустим имеется выборка из 20 человек. Элементами выборки являются сведения о среднем ежемесячном доходе каждого человека. Предположим, что 19 человек имеют средний ежемесячный доход в 20 т.р. и 1 человек с доходом в 300 т.р. Суммарный ежемесячный доход всей выборки составляет 680 т.р. Медиана, после упорядочивания выборки, определяется как среднеарифметическое десятого и одиннадцатого элементов выборки) и равняется Ме=20 т.р. Данный результат интерпретируется следующим образом: медиана делит выборку на две группу, таким образом, что можно сделать заключение о том, что в первой группе у каждого человека средний ежемесячный доход не более 20 т.р., а во второй группе не менее 20 т.р. В данном примере можно говорить о том, что медиана характеризуется тем, сколько зарабатывает «средний» человек. В то время как значение выборочного среднего значительно превышено S=34, что указывает на неприемлемость данной характеристики при оценке среднего заработка.

    Таким образом, чем больше различие между медианой и выборочным средним, тем больший разброс данных выборки (в рассмотренном примере, человек с заработком в 300 т.р. явно отличается от среднестатистических людей конкретной выборки и оказывает существенное влияние на оценку среднего дохода). Что делать с подобными элементами решается в каждом индивидуальном случае. Но в общем случае для обеспечения достоверности выборки они изымаются, так как оказывают сильное влияние на оценку статистических показателей.

    3. Мода (Мо) – формирует значение, наиболее часто встречающееся в выборке, т. е. значение с наибольшей частотой.Алгоритм оценки моды:

    В том случае, когда выборка содержит элементы, встречающиеся одинаково часто, то говорят, что мода в подобной выборке отсутствует.

    Если два соседних элемента выборки имеют одинаковую частоту, являющуюся больше частоты остальных элементов выборки, то мода определяется как среднее этих двух значений.

    Если два элемента выборки имеют одинаковую частоту, являющуюся больше частоты остальных элементов выборки, и при этом данные элементы не являются соседними, то говорят, что в данной выборке две моды.

    Мода в статистическом анализе используется в ситуациях, когда необходимо проведение быстрой оценки меры центральной тенденции и не требуется высокая точность. Например, моду (по показателю размер либо бренд) удобно применять для определения одежды и обуви, которая пользуется наибольшим спросом у покупателей.

    Меры разброса (изменчивости) – группа статистических показателей, характеризующих различия между отдельными значениями выборки. Основываясь на показателях мер разброса можно оценивать степень однородности и компактности элементов выборки. Меры разброса, характеризуются следующим набором показателей:

    1. Размах - это интервал между максимальным и минимальным значениями результатов наблюдений (элементов выборки). Показатель размаха указывает на разброс значений в совокупности данных. Если размах большой, то значения в совокупности сильно разбросаны, в противном случае (размах небольшой) говорится о том, что значения в совокупности лежат близко друг к другу. Размах определяется по формуле (3.4).

    (3.4)

    Где - максимальный элемент выборки;

    - минимальный элемент выборки.

    2.Среднее отклонение – среднеарифметическая разница (по абсолютной величине) между каждым значением в выборке и ее выборочным средним. Среднее отклонение определяется по формуле (3.5).

    (3.5)

    где - i -й элемент выборки;

    Значение выборочного среднего, рассчитанное по формуле (3.1);

    Количество элементов выборки.

    Модуль необходим в связи с тем, что отклонения от среднего по каждому конкретному элементу могут быть как положительными так и отрицательными. Следовательно, если не взять модуль, то сумма всех отклонений будет близка к нулю и невозможно будет судить о степени изменчивости данных (скученности данных вокруг выборочного среднего). При проведении статистического анализа могут быть взяты мода и медиана вместо выборочного среднего.

    3. Дисперсия - мера рассеяния, описывающая сравнительное отклонение между значениями данных и средней величиной. Вычисляется как сумма квадратов отклонений каждого элемента выборки от средней величины. В зависимости от размера выборки дисперсия оценивается разными способами:

    Для больших выборок (n>30) по формуле (3.6)

    (3.6)

    Для малых выборок (n<30) по формуле (3.7)

    (3.7)

    где X i - i-й элемент выборки;

    S – среднее значение выборки;

    Количество элементов выборки;

    (X i – S) - отклонение от средней величины для каждого значения набора данных.

    4. Стандартное отклонение -мера того, насколько широко разбросаны точки данных относительно их среднего.

    Процесс возведения в квадрат отдельных отклоненийпри вычислении дисперсии усиливает степень отклонения полученной величины отклонения от первоначальных отклонений, что в свою очередь вносит дополнительные погрешности. Таким образом, с целью приближения оценки разброса точек данных относительно их среднего к значению среднего отклонения, из дисперсии извлекают квадратный корень. Извлеченный корень из дисперсии характеризует меру изменчивости, именуемую среднеквадратическим или стандартным отклонением (3.8).

    (3.8)

    Допустим вы руководитель проекта по разработке программного обеспечения. У вас в подчинении пять программистов. Управляя процессом выполнения проекта, вы распределяете задания между программистами. Для простоты примера будем исходить из того факта, что задания равнозначны по сложности и времени выполнения. Вы решили проанализировать работу каждого программиста (число выполненных заданий в течении недели) за последние 10 недель, в результате чего вами получены следующие выборки:

    Неделя ФИО

    Проведя оценку среднего числа выполненных задач, вы получили следующий результат:

    Неделя ФИО S
    22,3
    22,4
    22,2
    22,1
    22,5

    Исходя из показателя S все программисты в среднем работают с одинаковой эффективностью (около 22 заданий в неделю). Однако, показатель вариабельности (размах) очень высок (от 5 заданий четвертого программиста до 24 заданий у пятого).

    Неделя ФИО S P
    22,3
    22,4
    22,2
    22,1
    22,5

    Оценим стандартное отклонение, показывающее как распределены значения в выборках относительно среднего, а именно в нашем случае оценить на сколько велик разброс выполнения заданий от недели к неделе.

    Неделя ФИО S P SO
    22,3 1,56
    22,4 1,8
    22,2 2,84
    22,1 1,3
    22,5 5,3

    Полученная оценка стандартного отклонения говорит о следующем (оценим два крайних случая 4 и 5 программисты):

    Каждое значение в выборке 4 программиста в среднем отклоняется на 1,3 задания от среднего значения.

    Каждое значение в выборке 5 программиста в среднем отклоняется на 5,3 задания от среднего значения.

    Чем ближе стандартное отклонение к 0, тем надежнее среднее, так как это указывает на то, что каждое значение выборки практически равно среднему (в нашем примере это 22,5 задания). Следовательно, 4 программист наиболее последователен в отличии от 5-го. Вариабельность выполнения заданий от недели к неделе 5-го программиста составляет 5,3 задания, что говорит о значительном разбросе. В случае с 5-м программистом нельзя доверять среднему, а, следовательно,трудно спрогнозировать число выполненных заданий на следующую неделю, что в свою очередь затрудняет процедуру планирования и соблюдения графиков выполнения работ. Какое управленческое решение вы примете в данном курсе неважно. Важно, что вы получили оценку, на основании которой можно принять соответствующие управленческие решения.

    Таким образом, можно сделатьобщий вывод, говорящий о том, что среднее значение не всегда правильно оценивает данные. Об корректности оценки среднего можно судить по значению стандартного отклонения.