Краткая теория, примеры решения задач
Вложение | Размер |
---|---|
statisticheskaya_obrabotka_dannykh.pptx | 923.3 КБ |
Слайд 1
Выполнили: Александр Пруцев Богунов Илья Енютин Сергей Статистическая обработка данныхСлайд 2
В жизни каждому из нас приходится участвовать в опросах ,выборах , переписи населения и др.В связи с этим появляется определённая информация. Задача статистики- отражение этой информации и её обработка. Для этого необходимо ввести некоторые статистические характеристики.
Слайд 3
Рассмотрим пример. № 1 В финал конкурса «Мисс факультета» вышли 10 студенток за которых болели и проголосовали 90 студентов. Результаты голосования изобразили с помощью таблицы: Данные результаты голосования можно отобразить графически. № участницы 1 2 3 4 5 6 7 8 9 10 Число голосов 7 3 14 15 7 4 3 7 20 10
Слайд 4
Применяют три вида графического отражения информации- диаграммы. I вид диаграммы- линейная диаграмма(или многоугольник распределения) строится как обычный график. По оси абсцисс отложим номера участниц, по оси ординат – число голосов, отданных за данную участницу, т.е. точки (1 ; 7) , (2 ; 3) и т.д.
Слайд 5
II вид диаграммы- столбчатая диаграмма ( или гистограмма распределения) строится следующим образом. В окрестности каждой отмеченной точки по оси абсцисс строят прямоугольник, высота которого равна соответствующей координате
Слайд 6
III вид диаграммы- круговая диаграмма, представляет собой круг разделённый на 10 секторов с различными центральными углами, т.к. Всего голосов было 90, то каждому голосу соответствует 360˚:90 =4 ˚ Например, для первой участницы строим сектор 4˚ x 7=28 ˚.Каждый угол соответствует номеру участницы.
Слайд 7
Мы на конкретном примере разобрали основные этапы простейшей статистической обработки. Сначала данные измерений упорядочивают и группируют ; Составляют таблицы распределения данных ; Строят графики распределения данных в виде многоугольника распределений , гистограммы распределения или круговой диаграммы; Получение паспорта данных , который состоит из небольшого количества основных числовых характеристик.
Слайд 8
Числовые характеристики для нашего примера: Объём измерения. В нашем случае он равен 90, так как голосовало 90 студентов. Размах измерения – разница между наибольшим и наименьшим значениями результатов 20-3=17 Мода измерения – наиболее часто встречающийся результат, это 9, т.к. За участницу №9 было отдано 20 голосов. Среднее арифметическое .Это частное деления суммы всех результатов измерения на объем измерения:
Слайд 9
Всякое число встретившееся в конкретном измерении, называют вариантой измерения. Если записать все варианты измерения в некотором порядке, то получится ряд данных измерений. Запишем полученные варианты в порядке возрастания:
Слайд 10
Мы получили сгруппированный ряд данных. Если в сгруппированном ряде нечётное количество чисел, то среднюю варианту называют медианой. А если чётное то медиана будет равна среднему арифметическому двух стоящих посередине вариант. В нашем примере всего вариант 90, средние 45-я и 46-я варианты, каждая из них равна 5, тогда медиана будет равна За участницу 1 проголосовали 7 человек. Поэтому говорят, что абсолютная частота( или кратность) варианты 1 равна 7.Тогда таблица будет иметь вид : Графа Сумма добавляется для контроля, число в этой графе обязательно равняется объёму измерения. Варианта 1 2 3 4 5 6 7 8 9 10 Сумма Кратность 7 3 14 15 7 4 3 7 20 10 90
Слайд 11
Частное от деления кратности варианты на объём измерения, называется частотой данной варианты . Например, для варианты 1 находим частоту ,её можно выразить в процентах: 100%=7,8 Пример: Итак, среднее арифметическое голосов, поданных за финалистку равна 5,9.Но 5,9 голосов подать невозможно , поэтому медиана измерений даёт среднюю характеристику середину упорядоченного ряда чисел. Мода измерений позволяет выбрать победительнице конкурса ,т.е финалистку, набравшую наибольшее количество голосов. Варианта 1 2 3 4 5 6 7 8 9 10 Сумма Кратность 7 3 14 15 7 4 3 7 20 10 90 Частота, % 7,8 3,3 15,6 16,7 7,8 4,4 3,3 7,8 22,2 11,1 100
Слайд 12
На практике придерживаются измерений средних величин. Например , животные одного вида в среднем имеют одинаковый рост. Слоны ростом ниже 1 метра и выше 5 метров встречаются крайне редко. Поэтому полезно ввести характеристики , отвечающие за разброс данных вокруг их среднего значения .
Слайд 13
Числовую характеристику данных измерения, отвечающую за разброс данных вокруг их среднего значения называют дисперсией и обозначают – D . Число называют средним квадратичным отклонением.
Слайд 14
Алгоритм вычисления дисперсии , Для нахождения дисперсии D данных Х1, Х2,…Х n измерения следует вычислить: Среднее значение Отклонение данных от M , т.е. Х1-М, Х2-М, … Х n -М; Квадраты отклонений найденных в Средне значение всех квадратов отклонений –это и есть дисперсия - Среднее квадратичное отклонение
Слайд 15
Пример. Для отбора почётного караула измерили рост (в см) двух групп солдат по пять человек и получили результаты : Группа А – 178,182,180,183,177 Группа Б – 183,186,180,182,184 Найдём для каждой группы дисперсию D и среднее квадратное отклонение , также найдём группу , более однородную по росту.
Слайд 16
Группа А Среднее арифметическое Составим таблицу : Найдём дисперсию Среднее квадратичное отклонение: Солдат 1 2 3 4 5 Рост 178 182 180 183 177 Отклонение -2 2 0 3 -3 Квадрат отклонения 4 4 0 9 9
Слайд 17
Группа Б Среднее арифметическое M= Составим таблицу: Найдём дисперсию Среднее квадратное отклонение: Солдат 1 2 3 4 5 Рост 183 186 180 182 184 Отклонение 0 3 -3 -1 1 Квадрат отклонения 0 9 9 1 1
Слайд 18
Сравнивая полученные результаты, определим , что более однородной по росту является группа Б и её следует назначить в караул.
Сверчок
Мастер-класс "Корзиночка"
"Морская болезнь" у космонавтов
Четыре художника. Осень
Рисуем одуванчики гуашью (картина за 3 минуты)