Алгоритм статистической обработки данных о качестве знаний по математике учащихся основных и средних общеобразовательных школ

Белый Вячеслав Сергеевич
В данной статье предлагается методика статистической обработки информации о качестве знаний по предмету математика учащихся основных и средних общеобразовательных школ.
 

Скачать:

ВложениеРазмер
Microsoft Office document icon chetvyortaya_statya.doc240 КБ

Предварительный просмотр:

Алгоритм статистической обработки данных о качестве знаний по математике учащихся основных и средних общеобразовательных школ

Белый В.С.

Аннотация. В данной статье предлагается методика статистической обработки информации о качестве знаний по предмету математика учащихся основных и средних общеобразовательных школ.

Ключевые слова: качество знаний, статистическая обработка экспериментальных данных, оптимальная оценка параметров распределения случайной величины, статистические характеристики.

Введение. Данная работа является частью исследования эффективности работы образовательных учреждений и качества подготовки выпускников основных и средних общеобразовательных школ. Особенностью исследования является то, что изучение характеристик и параметров существующих педагогических моделей осуществляется по результатам педагогических экспериментов, проводимых на базе реальных учебных заведений (школ). Исследованию подлежат результаты контроля уровня знаний учащихся общеобразовательных школ, осуществляемого в плановом порядке и в сроки, определяемые требованиями ФГОС, учебных планов и рабочих программ.

Цель исследования – оптимальная оценка вида и параметров распределения качества знаний учащихся основных и средних общеобразовательных школ.

Достижение этой цели возможно в случае успешного решения двух взаимосвязанных между собой задач:

1. Определение количественных значений величин, характеризующих качество знаний экспериментальных групп учащихся по результатам педагогического эксперимента.

2. Определение вида и оценка параметров распределения качества знаний учащихся, а также проверка оптимальности выполненной оценки.

Автор выражает глубокую благодарность и признательность руководству и педагогическому составу МБОУ ООШ №3 городского округа Коломна за помощь, оказанную на всех этапах проведения исследований.

Постановка задачи. Предварительно определяется показатель качества знаний экспериментальной группы школьников (класса) по результатам выполнения ими любого проверочного задания, например, контрольной работы. Определение количественного значения показателя качества знаний осуществляется в соответствии с методикой, изложенной в [1]. Задача статистической обработки информации о качестве знаний учащихся школ решается с учётом ряда допущений, связанных с особенностями проведения педагогического эксперимента.

Исходными данными для решения поставленной задачи являются:

 – количество групп (классов) школьников принимающих участие в педагогическом эксперименте;

,  – количественное значение показателя качества знаний школьников рассматриваемой экспериментальной группы (класса).

Для удобства и наглядности все перечисленные выше исходные данные сводятся в таблицу 1.

Таблица 1

№ п/п

Значение показателя качества знаний

1

Требуется определить вид распределения дискретной случайной величины  и выполнить оценку параметров данного распределения. Оценка параметров статистического распределения случайной величины  должна быть, по возможности, оптимальной.

Алгоритм статистической обработки данных о качестве знаний учащихся включает в себя следующую последовательность действий [2]:

1. Сначала на основании имеющихся данных о качестве знаний школьников составляется вариационный ряд значений случайной величины:

, , … , .                                                                        (1)

В выражении (1):

 – фиксированное количество экспериментально полученных значений качества знаний (или количество групп обучаемых);

 – количественное значение качества знаний, полученное в результате  -й, , проверки в ходе педагогического эксперимента.

Согласно правилам составления вариационного ряда для каждого значения  обязательно выполнение условия

.                                                                        (2)

2. Весь диапазон значений  … , в который входят числа вариационного ряда (1), разбивается на  равных интервалов. Шаг дискретизации диапазона  равен

.                                                                        (3)

По результатам подсчёта количества n попаданий чисел из (1) в те или иные интервалы заполняется таблица 2.

Таблица 2

Интервал

В таблице 2 используются следующие обозначения:

 – количество чисел ωi из ряда (1), принадлежащих интервалу , .

 – вероятность попадания числа  в интервал .

Важно отметить, что значения  и  желательно брать не из ряда (1), а выбирать по результатам выполнения полного комплекса проверок знаний учащихся, предусмотренного методикой проведения эксперимента. Таблица заполнена правильно, если выполняются следующие соотношения:

                                                                (4)

,                                                        (5)

.                                                        (6)

3. На основании данных таблицы 2 строится гистограмма вида

                     …  

Рисунок 1 – Гистограмма распределения.

По гистограмме осуществляется предварительная оценка вида и параметров распределения случайной величины качества знаний , экспериментальных групп школьников.

Оптимальная оценка параметров распределения при условии, что имеет место достаточное количество статистических данных о параметре , должна быть несмещённой, состоятельной и эффективной.

Любая точечная оценка является несмещённой, если её математическое ожидание численно равно значению оцениваемого параметра. Другими словами, при бесконечном увеличении количества измерений  точечная  оценка должна удовлетворять условию вида [2]

.                                                                        (7)

Признаком состоятельности точечной оценки является её сходимость по вероятности к оцениваемому значению параметра

.                                                                (8)

В выражении (8) символом ε обозначено бесконечно малое положительное число, обозначающее величину некой окрестности, в пределах которой находится значение оцениваемого параметра.

Точечная оценка считается эффективной, если значение её дисперсии стремится к нулю.

.                                                                        (9)

Таким образом, при достаточном количестве статистических данных, экспериментально полученная точечная оценка параметра распределения случайной величины является оптимальной оценкой, если данная оценка удовлетворяет условиям (7), (8) и (9).

Пример. Результаты выполнения итоговых контрольных работ по математике учащимися 6-х классов 12-ти общеобразовательных школ городского округа "Х", представлены в таблице 3.

Таблица 3

Показатель качества знаний

№ п/п

Значение показателя качества знаний

1

0.58

2

0.34

3

0.50

4

0.57

5

0.44

6

0.54

7

0.63

8

0.48

9

0.57

10

0.81

11

0.78

12

0.99

Пусть по опыту проведения педагогических экспериментов по определению качества знаний известны минимальное и максимальное значения  и =1.

Задача статистической обработки имеющихся данных сводится к определению вида и параметров распределения случайной величины качества знаний .

1. На основании имеющихся данных о качестве знаний в соответствии с (1) и (2) составим вариационный ряд значений:

0.34; 0.44; 0.48; 0.50; 0.54; 0.57; 0.57; 0.58; 0.63; 0.78; 0.81; 0.99.

2. Весь диапазон значений, в который входят числа вариационного ряда (1), разбивается на равные интервалы. По результатам подсчёта количества попаданий чисел из (1) в те или иные интервалы заполняется таблица 4.

Таблица 4

Интервал

[0.2;0.5)

[0.5;0.8)

[0.8;1.0)

3

7

2

0.25

0.58

0.17

При заполнении таблицы учтены минимально-  и максимально =1 возможные значения случайной величины качества знаний, определённые по результатам эксперимента.

Шаг дискретизации  в соответствии с (3) равен

=(1.0-0.2)/3≈0.3 единицы.

Таблица 4 заполнена верно, т. к. выполняются условия (4), (5) и (6):

,                                                (4)

,                                                                (5)

.                                                        (6)

3. На основании данных таблицы 4 строится гистограмма вида

Рисунок 2 – Распределение качества знаний  учащихся.

На рисунке 2 прерывистой линией показан результат одного из возможных вариантов аппроксимации полученных статистических данных. По результату аппроксимации видно, что распределение случайной величины влагопоглощения имеет признаки гауссовского нормального распределения с математическим ожиданием  и среднеквадратическим отклонением .

В силу свойств нормального распределения [2], а также на основании правила «трёх сигм» можно утверждать, что с вероятностью 0.997 истинное значение качества знаний  находится в интервале , а именно

или

,

причём относительная погрешность измерения  составляет

,

что оставляет желать лучшего в части касающейся точности измерений. Для повышения точности  измерения необходимо доверительный интервал  уменьшать.

Например, если доверительный интервал ограничить в пределах двух «сигм» , т.е.

,

тогда, согласно [2], с доверительной вероятностью 0.955 истинное значение качества знаний  находится в интервале , причём относительная погрешность не превысит

,

что показывает увеличение точности измерений по сравнению с попыткой ограничения доверительного интервала в пределах трёх сигм.

Если к доверительной вероятности не предъявляется жёстких требований, например, допускается её значение порядка 0.7, тогда доверительный интервал можно сузить до пределов одной «сигмы». При этом с вероятностью 0.683 истинное значение  будет находиться в интервале , а относительная погрешность определения влагосодержания не превысит . Такая достигнутая точность результата педагогического эксперимента для объёма выборки  является довольно высокой.

Является ли оценка параметров распределения оптимальной? Если считать количество статистических данных о качестве знаний  достаточным, тогда оптимальная оценка должна быть несмещённой, состоятельной и эффективной.

Для проверки выполнения условий (7), (8) и (9), на основании имеющейся статистики (1) определяются математическое ожидание и дисперсия случайной величины .

Математическое ожидание:

.

Дисперсия:

.

Проверку условий (7), (8) и (9) будем проводить с двумя сделанными автором статьи допущениями:

1. Количество измерений показателя качества знаний  даёт достаточное количество статистических данных.

2. Оценка параметров нормального распределения, представленного на рисунке 2, выполнена независимо от результатов экспериментального определения значений качества знаний .

Таким образом, значение предела математического ожидания левой части выражения (7)  и значение независимой оценки математического ожидания нормального распределения , представленного на рисунке 2, отличаются третьим знаком после запятой. Это говорит о том, что разница математических ожиданий не существенна, поскольку она по своему модулю более чем на два порядка ниже значения самого математического ожидания. На основании данного факта можно сделать заключение о несмещённости выполненной автором оценки.

Поскольку модуль разницы  по своему значению является величиной второго порядка малости, то его можно сравнить с бесконечно малым отличным от нуля числом . Следовательно, справедливо соотношение

,

подтверждающее выполнение условия (8). Данный факт говорит о состоятельности оценки.

Разница независимой оценки дисперсии

и дисперсии, вычисленной на основании имеющихся статистических данных , составляет 0.0016 единиц. Такое значение разницы подходит под определение величины второго порядка малости и, следовательно, эквивалентно нулю. Поэтому

,

что практически не противоречит выражению (9).

Выводы:

1. Распределение случайной величины качества знаний  учащихся общеобразовательных школ является нормальным.

2. Оценка параметров распределения случайной величины качества знаний , выполненная по алгоритму, предложенному в данной статье, является оптимальной.

Список литературы:

  1. Ефремова Н.Ф., Звонников В.И., Челышкова М.Б. Педагогические измерения в системе образования. Педагогика. №2. 2006. – С. 14-22.
  2. Вентцель Е.С. Теория вероятностей. – 10-е изд., стер. – Москва: Academia, 2005. – 576 С. – ISBN 5-7695-2311-5.