Технологии информационного моделирования
план-конспект занятия на тему
Рассмотрим способ нахождения зависимости частоты заболеваемости жителей города бронхиальной астмой от качества воздуха (третий пример из сформулированных в начале предыдущего параграфа). Любому человеку понятно, что такая зависимость существует. Очевидно, чем хуже воздух, тем больше больных астмой. Но это качественное заключение. Его недостаточно для того, чтобы управлять уровнем загрязненности воздуха. Для управления требуются более конкретные знания. Нужно установить, какие именно примеси сильнее всего влияют на здоровье людей, как связана концентрация этих примесей в воздухе с числом заболеваний. Такую зависимость можно установить только экспериментальным путем: посредством сбора многочисленных данных, их анализа и обобщения.
При решении таких проблем на помощь приходит:
Статистика — наука о сборе, измерении и анализе массовых количественных данных.
Скачать:
Вложение | Размер |
---|---|
glava_6_tema_6.1.doc | 142.5 КБ |
glava_6_tema_6.2.doc | 578.5 КБ |
Предварительный просмотр:
Глава 6 Технологии информационного моделирования
Тема 6.1 Компьютерное моделирование
Курс: 1
Вид занятия: Занятие теоретического обучения
Тип занятия: Лекция
Форма проведения занятия: Индивидуальная и групповая
Место проведения занятия: Кабинет информатики и ИКТ
Цель занятия: Изучить компьютерные моделирование
Задачи занятия:
- Учебная – создать условия для обобщения и систематизации знаний, проверка ЗУН. Формирование мотивации и опыта учебно познавательной и практической деятельности.
- Воспитательная - способствовать развитию умению анализировать, выдвигать гипотезы, предложения. Развить логическое мышление и умение выражать речью результаты собственной мыслительной деятельности.
- Развивающая - способствовать формированию научного мировоззрения, памяти, находчивости
- Методическая - методика использования оптимальных способов повторения изученного материала
Оборудование: Интерактивная доска, канцелярские принадлежности, карточки с заданием.
План занятия:
1.Организационный момент 2. Актуализация знаний 3. Изучение нового материала 4 Система основных понятий 5. Закрепление 6. Итог и задание для самостоятельной работы | 4-5 минут 10-15 минут 40-45 минут 25-30 минут 22-25 минут 8-10 минут |
Ход занятия:
1.Организационный момент
Преподаватель и студенты, здороваются, проводится инструктаж по безопасной работе за компьютерами, студент расписывается за рабочее место за которое он несет ответственность в течении всей пары.
2. Актуализация знаний
- Какие вам известны формы представления зависимостей между величинами?
- Что такое математическая модель?
- Может ли математическая модель включать в себя только константы?
Величины и зависимости между ними
Содержание данного раздела учебника связано с компьютерным математическим моделированием. Применение математического моделирования постоянно требует учета зависимостей одних величин от других. Приведем примеры таких зависимостей:
- время падения тела на землю зависит от его первоначальной высоты;
Если значение величины не изменяется, то она называется постоянной величиной или константой. Пример константы — число Пифагора п = 3,14259... . Величина, значение которой может меняться, называется переменной. Например, в описании процесса падения тела переменными величинами являются высота Н и время падения t.
Третьим свойством величины является ее тип. С понятием типа величины вы также встречались, знакомясь с программированием и базами данных. Тип определяет множество значений, которые может принимать величина. Основные типы величин: числовой, символьный, логический. Поскольку в данном разделе мы будем говорить лишь о количественных характеристиках, то и рассматриваться будут только величины числового типа.
А теперь вернемся к примерам 1-3 и обозначим (поименуем) все переменные величины, зависимости между которыми нас будут интересовать. Кроме имен укажем размерности величин. Размерности определяют единицы, в которых представляются значения величин.
- t (с) — время падения; Н (м) — высота падения. Зависимость будем представлять, пренебрегая учетом сопротивления воздуха; ускорение свободного падения g (м/с[1]) будем считать константой.
- Р (н/м2) — давление газа (в единицах системы СИ давление измеряется в ньютонах на квадратный метр); t °С — температура газа. Давление при нуле градусов Р0 будем считать константой для данного газа.
- Загрязненность воздуха будем характеризовать концентрацией примесей (каких именно, будет сказано позже) — С (мг/м[2]). Единица измерения — масса примесей, содержащихся в 1 кубическом метре воздуха, выраженная в миллиграммах. Уровень заболеваемости будем характеризовать числом хронических больных астмой, приходящихся на 1000 жителей данного города — Р (бол./тыс.).
Отметим важное качественное различие между зависимостями, описанными в примерах 1 и 2, с одной стороны, и в примере 3, с другой. В первом случае зависимость между величинами является полностью определенной: значение Н однозначно определяет значение t (пример 1), значение t однозначно определяет значение Р (пример 2). Но в третьем примере зависимость между значением загрязненности воздуха и уровнем заболеваемости носит существенно более сложный характер; при одном и том же уровне загрязненности в разные месяцы в одном и том же городе (или в разных городах в один и тот же месяц) уровень заболеваемости может быть разным, поскольку на него влияют и многие другие факторы. Отложим более детальное обсуждение этого примера до следующего параграфа, а пока лишь отметим, что на математическом языке зависимости в примерах 1 и 2 являются функциональными, а в примере 3 — нет.
Математические модели
Если зависимость между величинами удается представить в математической форме, то мы имеем математическую модель.
Математическая модель — это совокупность количественных характеристик некоторого объекта (процесса) и связей между ними, представленных на языке математики.
Хорошо известны математические модели для первых двух примеров. Они отражают физические законы и представляются в виде формул:
Это примеры зависимостей, представленных в функциональной форме. Первую зависимость называют корневой (время пропорционально квадратному корню высоты), вторую — линейной.
В более сложных задачах математические модели представляются в виде уравнений или систем уравнений. В конце данной главы будет рассмотрен пример математической модели, которая выражается системой неравенств. еще более сложных задачах (пример 3 — одна из них) зависимости тоже можно представить в математической форме, но не функциональной, а иой.
Табличные и графические модели
Рассмотрим примеры двух других, не формульных, способов представления зависимостей между величинами: табличного и графического. Представьте себе, что мы решили проверить закон свободного падения тела экспериментальным путем. Эксперимент организуем следующим образом: будем бросать стальной шарик с 6-метровой высоты, 9-метровой и т. д. (через 3 метра), замеряя высоту начального положения шарика и время падения. По результатам эксперимента составим таблицу и нарисуем график.
Н, м | t, с |
6 | 1Д |
9 | 1,4 |
12 | 1,6 |
15 | 1,7 |
18 | 1,9 |
21 | 2,1 |
24 | 2,2 |
27 | 2,3 |
30 | 2,5 |
Если каждую пару значений Н и £ из данной таблицы подставить в приведенную выше формулу зависимости высоты от времени, то формула превратится в равенство (с точностью до погрешности измерений). Значит, модель работает хорошо. (Однако если сбрасывать не стальной шарик, а большой легкий мяч, то равенство не будет достигаться, а если надувной шарик, то значения левой и правой частей формулы будут различаться очень сильно. Как вы думаете, почему?)
В этом примере мы рассмотрели три способа моделирования зависимости величин: функциональный (формула), табличный и графический. Однако математической моделью процесса падения тела на землю можно назвать только формулу. Формула более универсальна, она позволяет определить время падения тела с любой высоты, а не только для того экспериментального набора значений Н, который отображен на рис. 6.1. Имея формулу, можно легко создать таблицу и построить график, а наоборот — весьма проблематично.
Точно так же тремя способами можно отобразить зависимость давления от температуры. Оба примера связаны с известными физическими законами — законами природы. Знания физических законов позволяют производить точные расчеты, они лежат в основе современной техники.
Информационные модели, которые описывают развитие систем во времени, имеют специальное название: динамические модели. В примере 1 приведена именно такая модель. В физике динамические информационные модели описывают движение тел, в биологии — развитие организмов или популяций животных, в химии — протекание химических реакций и т. д.
Моделирование корреляционных зависимостей
Регрессионные математические модели строятся в тех случаях, когда известно, что зависимость между двумя факторами существует и требуется получить ее математическое описание. А сейчас мы рассмотрим задачи другого рода. Пусть важной характеристикой некоторой сложной системы является фактор А. На него могут оказывать влияние одновременно многие другие факторы: В, С, D и т. д. Мы рассмотрим два типа задач:
- определить, оказывает ли фактор В какое-либо заметное регулярное влияние на фактор А?
- какие из факторов В,С, D и т. д. оказывают наибольшее влияние на фактор А1
В качестве примера сложной системы будем рассматривать школу. Пусть для первого типа задач фактором А является средняя успеваемость учащихся школы, фактором В — финансовые расходы школы на хозяйственные нужды: ремонт здания, обновление мебели, эстетическое оформление помещения и т. п. Здесь влияние фактора В на фактор А не очевидно. Наверное, гораздо сильнее на успеваемость влияют другие причины: уровень квалификации учителей, контингент учащихся, уровень технических средств обучения и др.
Специалисты по статистике знают, что для того, чтобы выявить зависимость от какого-то определенного фактора, нужно максимально исключить влияние других факторов. Проще говоря, собирая информацию из разных школ, нужно выбирать такие школы, в которых приблизительно одинаковый контингент учеников, квалификация учителей и пр., но хозяйственные расходы разные (у одних школ могут быть богатые спонсоры, у других — нет).
Итак, пусть хозяйственные расходы школы выражаются количеством рублей, отнесенных к числу учеников в школе (руб./чел.), потраченных за определенный период времени (например, за последние 5 лет). Успеваемость же пусть оценивается средним баллом учеников школы по результатам окончания последнего учебного года. Еще раз обращаем ваше внимание на то, что в статистических расчетах обычно используются относительные и усредненные величины.
Итоги сбора данных по 20 школам, введенные в электронную таблицу, представлены на рис. 6.6. На рис. 6.7 приведена точечная диаграмма, построенная по этим данным.
А | В | С |
№ п/п | Затраты (руб./чел.) | Успеваемость (средний балл) |
1 | 50 | 3,81 |
2 | 345 | 4,13 |
3 | 79 | 4,30 |
4 | 100 | 3,96 |
5 | 203 | 3,87 |
6 | 420 | 4,33 |
7 | 210 | 4 |
8 | 137 | 4,21 |
9 | 463 | 4,4 |
10 | 231 | 3,99 |
11 | 134 | 3,9 |
12 | 100 | 4,07 |
13 | 294 | 4,15 |
14 | 396 | 4,1 |
15 | 77 | 3,76 |
16 | 480 | 4,25 |
17 | 450 | 3,88 |
18 | 496 | 4,50 |
19 | 102 | 4,12 |
20 | 150 | 4,32 |
Рис. 6.6. Статистические данные
Значения обеих величин: финансовых затрат и успеваемости учеников — имеют значительный разброс и, на первый взгляд, взаимосвязи между ними не видно. Однако она вполне может существовать.
Зависимости между величинами, каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционными зависимостями.
Раздел математической статистики, который исследует такие зависимости, называется корреляционным анализом. Корреляционный анализ изучает усредненный закон поведения каждой из величин в зависимости от значений другой величины, а также меру такой зависимости.
Оценку корреляции величин начинают с высказывания гипотезы о возможном характере зависимости между их значениями. Чаще всего допускают наличие линейной зависимости. В таком случае мерой корреляционной зависимости является величина, которая называется коэффициентом корреляции. Как и прежде, мы не будем писать формулы, по которым этот коэффициент вычисляется; их написать нетрудно, гораздо труднее понять, почему они именно такие. На данном этапе достаточно знать следующее:
- коэффициент корреляции (обычно обозначаемый греческой буквой р) есть число из диапазона от -1 до +1;
- если это число по модулю близко к 1, то имеет место сильная корреляция, если к 0, то слабая;
- близость р к +1 означает, что возрастанию значений одного набора соответствует возрастание значений другого набора, близость к -1 означает, что возрастанию значений одного набора соответствует убывание значений другого набора;
- значение р легко найти с помощью Excel, так как в эту программу встроены соответствующие формулы.В Excel функция вычисления коэффициента корреляции называется KOPPEJI и входит в группу статистических функций. Покажем, как ею воспользоваться. На том же листе Excel, где находится таблица, представленная на рис. 6.6, надо установить курсор на любую свободную ячейку и запустить функцию KOPPEJI. Она запросит два диапазона значений. Укажем, соответственно, В2:В21 и С2:С21. После их ввода будет выведен ответ: р = 0,500273843. Эта величина говорит о среднем уровне корреляции.
Наличие зависимости между хозяйственными затратами школы и успеваемостью нетрудно понять. Ученики с удовольствием ходят в чистую, красивую, уютную школу, чувствуют там себя, как дома, и поэтому лучше учатся.
В следующем примере проводится исследование по определению зависимости успеваемости учащихся старших классов от двух факторов: обеспеченности школьной библиотеки учебниками и оснащения школы компьютерами. И та, и другая характеристика количественно выражается в процентах от нормы. Нормой обеспеченности учебниками является их полный комплект, т. е. такое количество, когда каждому ученику выдаются из библиотеки все нужные ему для учебы книги. Нормой оснащения компьютерами будем считать такое их количество, при котором на каждых четырех старшеклассников в школе приходится один компьютер. Предполагается, что компьютерами ученики пользуются не только на информатике, но и на других уроках, а также во внеурочное время.
В таблице, изображенной на рис. 6.8, приведены результаты измерения обоих факторов в 11 разных школах. Напомним, что влияние каждого фактора исследуется независимо от других (т. е. влияние других существенных факторов должно быть приблизительно одинаковым).
Обеспечение учебного процесса | ||||
№ | Обеспеченность учебниками (%) | Успеваемость (средний балл) | Обеспеченность компьютерами (%) | Успеваемость (средний балл) |
1 | 50 | 3,81 | 10 | 3,98 |
2 | 78 | 4,15 | 25 | 4,01 |
3 | 94 | 4,69 | 19 | 4,34 |
4 | 65 | 4,37 | 78 | 4,41 |
5 | 99 | 4,53 | 45 | 3,94 |
6 | 87 | 4,23 | 32 | 3,62 |
7 | 100 | 4,73 | 90 | 4,6 |
8 | 63 | 3,69 | 21 | 4,24 |
9 | 79 | 4,08 | 34 | 4,36 |
10 | 94 | 4,2 | 45 | 3,99 |
11 | 93 | 4,32 | 67 | 4,5 |
р= 0,780931 | р = 0,572465 |
Рис. 6.8. Сравнение двух корреляционных зависимостей
Для обеих зависимостей получены коэффициенты линейной корреляции. Как видно из таблицы, корреляция между обеспеченностью учебниками и успеваемостью сильнее, чем корреляция между компьютерным обеспечением и успеваемостью (хотя и тот, и другой коэффициенты корреляции не очень большие). Отсюда можно сделать вывод, что пока еще книга остается более значительным источником знаний, чем компьютер.
р близко к нулю — слабая корреляция
4.Система основных понятий
Моделирование зависимостей между величинами | |||
Величина — | количественная характеристика исследуемого объекта | ||
Характеристики величины | |||
Имя: | Тип: | Значение | |
отражает смысл величины | определяет возможные значения величины | константа | переменная |
Виды зависимостей: | |||
Функциональные | Иные | ||
Способы отображения зависимостей | |||
Математическая модель | Табличная модель | Графическая модель | |
Описание развития систем во времени — динамическая модель |
Корреляционные зависимости | |
Это зависимости между величинами, каждая из которых подвергается неконтролируемому разбросу | |
Корреляционный анализ дает возможность: | |
определить, оказывает ли один фактор существенное влияние на другой фактор | выбрать из нескольких факторов наиболее существенный |
Коэффициент корреляции р : количественная мера корреляции | |
р по модулю близко к единице — сильная корреляция | р близко к нулю — слабая корреляция |
Расчет р возможен в Microsoft Excel с помощью программы K0PPEJI |
5.Закрепление
Вопросы и задания
- Какие вам известны формы представления зависимостей между величинами?
- Что такое математическая модель?
- Может ли математическая модель включать в себя только константы?
- Приведите пример известной вам функциональной зависимости (формулы) между характеристиками какого-то объекта или процесса.
- Обоснуйте преимущества и недостатки каждой из трех форм представления зависимостей.
- ) Что такое корреляционная зависимость?
- Что такое корреляционный анализ?
- Какие типы задач можно решать с помощью корреляционного анализа?
- Какая величина является количественной мерой корреляции? Какие значения она может принимать?
- С помощью какого средства табличного процессора Excel можно вычислить коэффициент корреляции?
- Для данных из таблицы, представленной на рис. 6.8, постройте две линейные регрессионные модели.
- Для этих же данных вычислите коэффициенты корреляции. Сравните с приведенными на рис. 6.8 результатами.
6. Итог и задание для самостоятельной работы
Самостоятельная работа №21
Представить в виде семантической сети систему высших органов власти Российской Федерации.
Органы власти РФ
Согласно конституции 1993 г. в России существуют следующие высшие органы власти:
- президент;
- правительство, состоящее из председателя и членов правительства;
- Государственная Дума;
- Совет Федерации;
- Верховный суд;
- Конституционный суд;
- Высший арбитражный суд;
Взаимоотношения между ними регулируются следующими положениями:
- Президент предлагает кандидатуры на должность судей Верховного, Конституционного и Высшего арбитражного
- Судей всех трех названных судов назначает Совет Федерации.
- Президент предлагает кандидатуру председателя правите
- льства.
- Государственная Дума утверждает кандидатуру председа
- теля правительства.
- Председатель правительства предлагает кандидатуры на
- должности членов правительства.
- Президент назначает министров и освобождает их от должности.
- Президент может отправить правительство в отставку.
- Государственная Дума может выразить правительству недоверие (после чего президент либо отправляет в отставку правительство, либо распускает Государственную Думу).
- Председатель правительства может поставить перед Государственной Думой вопрос о доверии правительству.
- Правительство может подать в отставку, которая принимается или отклоняется президентом.
- Президент может (в определенных условиях) распустить Государственную Думу.
- Государственная Дума может обвинить президента в тяжких преступлениях и предложить Совету Федерации отрешить его от должности.
- Конституционный суд дает Совету Федерации заключение о соблюдении закона при выдвижении обвинений против президента.
- Верховный суд дает Совету Федерации заключение о справедливости выдвинутых против президента обвинений.
- Совет Федерации может отрешить президента от власти.
Предварительный просмотр:
Тема 6.2. Модели статистического прогнозирования и оптического планирования
Курс: 1
Вид занятия: Занятие теоретического обучения
Тип занятия: Лекция
Форма проведения занятия: Индивидуальная и групповая
Место проведения занятия: Кабинет информатики и ИКТ
Цель занятия: Изучить модели статистического прогнозирования и оптического планирования
Задачи занятия:
- Учебная – формироввание мотивации и опыта учебно познавательной и практической деятельности. Создать условия для обобщения и систематизации знаний, проверка ЗУН.
- Воспитательная - развить логическое мышление и умение выражать речью результаты собственной мыслительной деятельности. Способствовать развитию умению анализировать, выдвигать гипотезы, предложения.
- Развивающая - способствовать формированию памяти, находчивости, научного мировоззрения
- Методическая - методика использования оптимальных способов повторения изученного материала
Оборудование: Интерактивная доска, канцелярские принадлежности, карточки с заданием.
План занятия:
1.Организационный момент 2. Актуализация знаний 3. Изучение нового материала 4 Система основных понятий 5. Закрепление 6. Итог и задание для самостоятельной работы | 4-5 минут 10-15 минут 40-45 минут 25-30 минут 22-25 минут 8-10 минут |
Ход занятия:
1.Организационный момент
Преподаватель и студенты, здороваются, проводится инструктаж по безопасной работе за компьютерами, студент расписывается за рабочее место за которое он несет ответственность в течении всей пары.
2. Актуализация знаний
- Какие вам известны формы представления зависимостей между величинами?
- Что такое математическая модель?
- Может ли математическая модель включать в себя только константы?
- Приведите пример известной вам функциональной зависимости (формулы) между характеристиками какого-то объекта или процесса.
- Обоснуйте преимущества и недостатки каждой из трех форм представления зависимостей.
- Что такое корреляционная зависимость?
- Что такое корреляционный анализ?
- Какие типы задач можно решать с помощью корреляционного анализа?
- Какая величина является количественной мерой корреляции? Какие значения она может принимать?
- С помощью какого средства табличного процессора Excel можно вычислить коэффициент корреляции?
О статистике и статистических данных
Рассмотрим способ нахождения зависимости частоты заболеваемости жителей города бронхиальной астмой от качества воздуха (третий пример из сформулированных в начале предыдущего параграфа). Любому человеку понятно, что такая зависимость существует. Очевидно, чем хуже воздух, тем больше больных астмой. Но это качественное заключение. Его недостаточно для того, чтобы управлять уровнем загрязненности воздуха. Для управления требуются более конкретные знания. Нужно установить, какие именно примеси сильнее всего влияют на здоровье людей, как связана концентрация этих примесей в воздухе с числом заболеваний. Такую зависимость можно установить только экспериментальным путем: посредством сбора многочисленных данных, их анализа и обобщения.
При решении таких проблем на помощь приходит:
Статистика — наука о сборе, измерении и анализе массовых количественных данных.
Существуют медицинская статистика, экономическая статистика, социальная статистика и другие. Математический аппарат статистики разрабатывает наука под названием математическая статистика.
Рассмотрим пример из области медицинской статистики.
Известно, что наиболее сильное влияние на бронхиально-легочные заболевания оказывает угарный газ — оксид углерода. Поставив цель определить эту зависимость, специалисты по медицинской статистике проводят сбор данных. Они собирают сведения из разных городов о средней концентрации угарного газа в атмосфере и о заболеваемости астмой (число хронических больных на 1000 жителей). Полученные данные можно свести в таблицу, а также представить в виде точечной диаграммы (рис. 6.2 ). Рис. 6.2. Табличное и графическое представление статистических данных
Статистические данные всегда являются приближенными, усредненными. Поэтому они носят оценочный характер, но верно отражают характер зависимости величин. И еще одно важное замечание: для достоверности результатов, полученных путем анализа статистических данных, этих данных должно быть много.
Из полученных данных можно сделать вывод, что при концентрации угарного газа до 3 мг/м3 его влияние на заболеваемость астмой несильное. С дальнейшим ростом концентрации наступает резкий рост заболеваемости.
А как построить математическую модель данного явления? Очевидно, нужно получить формулу, отражающую зависимость количества хронических больных Р от концентрации угарного газа С. На языке математики это называется функцией зависимости Р от С: Р(С). Вид такой функции неизвестен, ее следует искать методом подбора по экспериментальным данным.
Понятно, что график искомой функции должен проходить близко к точкам диаграммы экспериментальных данных. Строить функцию так, чтобы ее график точно проходил через все данные точки (рис. 6.3, а), не имеет смысла. Во-первых, математический вид такой функции может оказаться слишком сложным. Во-вторых, уже говорилось о том, что экспериментальные значения являются приближенными.
Отсюда следуют основные требования к искомой функции:
• она должна быть достаточно простой для использования ее в дальнейших вычислениях;
* Приводимые в примере данные не являются официальной статистикой, однако правдоподобны
• график этой функции должен проходить вблизи экспериментальных точек так, чтобы отклонения этих точек от графика были минимальны и равномерны (рис. 6.3, б).
а б
Рис. 6.3. Два варианта построения графической зависимости по экспериментальным данным
Полученную функцию, график которой приведен на рис. 6.3, б, в статистике принято называть регрессионной моделью.
Метод наименьших квадратов
Получение регрессионной модели происходит в два этапа:
- подбор вида функции;
- вычисление параметров функции.
Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и «слепой» перебор из конечного числа функций и выбор лучшей из них.
Чаще всего выбор производится среди следующих функций:
у = ах + b — линейная функция;
у = ах2 + Ьх + с — квадратичная функция;
у = а 1п(х) + b — логарифмическая функция;
у — аеЬх — экспоненциальная функция;
у — ахь — степенная функция.
Квадратичная функция называется в математике полиномом второй степени. Иногда используются полиномы и более высоких степеней, например полином третьей степени имеет вид: у = ах3 + bx2 + сх + d.
Во всех этих формулах х — аргумент, у — значение функции, а, Ь, с, d — параметры функции, 1п(лг) — натуральный логарифм, е — константа, основание натурального логарифма.
Если вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (а, Ь, с и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Что значит «располагалась как можно ближе»? Ответить на этот вопрос значит предложить метод вычисления параметров. Такой метод был предложен в XVIII веке немецким математиком К. Гауссом. Он называется методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у-координат всех экспериментальных точек от «/-координат графика функции была минимальной.
Мы не будем здесь производить подробное математическое описание метода наименьших квадратов. Достаточно того, что вы теперь знаете о существовании такого метода. Он очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую (в том числе и из рассмотренных выше) функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 6.4 изображены три функции, построенные методом наименьших квадратов по приведенным экспериментальным данным.
в
Рис. 6.4. Три функции, построенные по МНК
Данные рисунки получены с помощью табличного процессора Microsoft Excel. График регрессионной модели называется трендом. Английское слово «trend» можно перевести как «общее направление», или «тенденция».
Уже с первого взгляда хочется отбраковать вариант линейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста заболеваемости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квадратичный и экспоненциальный тренды правдоподобны. Теперь пора обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции - регрессионные модели:
линейная функция: у = 46,361х - 99,881;
экспоненциальная функция: у = 3,4302 е0'7555*;
квадратичная функция: у = 21,845х2 - 106,97х + 150,21.
На графиках присутствует еще одна величина, полученная в результате построения трендов. Она обозначена как R2. В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэффициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если 0, то выбранный вид регрессионной модели предельно неудачен. Чем R2 ближе к 1, тем удачнее регрессионная модель.
Из трех выбранных моделей значение R2 наименьшее у линейной. Значит, она самая неудачная (нам и так это было понятно). Значения же R2 у двух других моделей достаточно близки (разница меньше 0,01). Если определить погрешность решения данной задачи как 0,01, по критерию R2 эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные соображения. Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при больших величинах, то, глядя на графики, предпочтение следует отдать квадратичной модели. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси.
Интересный факт: опыт показывает, что если человеку предложить на данной точечной диаграмме провести «на глаз» прямую так, чтобы точки были равномерно разбросаны вокруг нее, то он проведет линию, достаточно близкую к той, что дает МНК.
Прогнозирование по регрессионной модели
Мы получили регрессионную математическую модель и можем прогнозировать процесс путем вычислений. Теперь можно оценить уровень заболеваемости астмой не только для тех значений концентрации угарного газа, которые были получены путем измерений, но и для других значений. Это очень важно с практической точки зрения. Например, если в городе планируется построить завод, который будет выбрасывать в атмосферу угарный газ, то, рассчитав его возможную концентрацию, можно предсказать, как это отразится на заболеваемости астмой жителей города.
Существует два способа прогнозов по регрессионной модели. Если прогноз производится в пределах экспериментальных значений независимой переменной (в нашем случае это концентрация угарного газа С), то это называется восстановлением значения.
Прогнозирование за пределами экспериментальных данных называется экстраполяцией.
Имея регрессионную модель, легко прогнозировать, производя расчеты с помощью электронных таблиц. Выберем для нашего примера в качестве наиболее подходящей квадратичную зависимость. Построим следующую электронную таблицу:
А | В | |
1 | Концентрация угарного газа (мг/куб. м ) | Число больных астмой на 1 тыс. жителей |
2 | =21,845*А2*А2-106,97*А2+150,21 |
Подставляя в ячейку А2 значение концентрации угарного газа, в ячейке В2 будем получать прогноз заболеваемости. Вот пример восстановления значения:
А | В | ||
1 | Концентрация угарного газа | Число больных | астмой на 1 тыс. |
( мг/куб. м ) | жителеи | ||
2 | 3 | 25 |
Заметим, что число, получаемое по формуле в ячейке В2, на самом деле является дробным. Однако не имеет смысла считать число людей, даже среднее, в дробных величинах. Дробная часть удалена — в формате вывода числа указано О цифр после запятой.
Экстраполяционный прогноз выполняется аналогично.
Табличный процессор дает возможность производить экстраполяцию графическим способом, продолжая тренд за пределы экспериментальных данных. Как это выглядит при использовании квадратичного тренда для С = 7, показано на рис. 6.5.
Рис. 6.5. Квадратичный тренд с экстраполяцией
500 j 450 400 350 - 300 250 200 - 150 - 100 - 50 - 0 - 0
В ряде случаев с экстраполяцией надо быть осторожным. Применимость всякой регрессионной модели ограничена, особенно за пределамиэкспериментальной области. В нашем примере при экстраполяции не следует далеко уходить от величины 5 мг/м3. Вполне возможно, что далее характер зависимости существенно меняется. Слишком сложной является система «экология — здоровье человека», в ней много различных факторов, которые связаны друг с другом. Полученная регрессионная функция является всего лишь моделью, экспериментально подтвержденной в диапазоне концентраций от 2 до 5 мг/м3. Что будет вдали от этой области, мы незнаем. Всякая экстраполяция держится на гипотезе: «предположим, что за пределами экспериментальной области закономерность сохраняется». А если не сохраняется?
Квадратичная модель в данном примере в области малых значений концентрации, близких к 0, вообще не годится. Экстраполируя ее на С = 0 мг/м3, получим 150 человек больных, т. е. больше, чем при 5 мг/м3. Очевидно, это нелепость. В области малых значений С лучше работает экспоненциальная модель. Кстати, это довольно типичная ситуация: разным областям данных могут лучше соответствовать разные модели.
Модели
Проблема, к обсуждению которой мы теперь переходим, называется оптимальным планированием. Объектами планирования могут быть самые разные системы: деятельность отдельного предприятия, отрасли промышленности или сельского хозяйства, региона, наконец государства. Постановка задачи планирования выглядит следующим образом:
- имеются некоторые плановые показатели: X, Y, и др.;
- имеются некоторые ресурсы: Rl, R2 и др., за счет которых эти плановые показатели могут быть достигнуты. Эти ресурсы практически всегда ограничены;
- имеется определенная стратегическая цель, зависящая от значений X, Y и др. плановых показателей, на которую следует ориентировать планирование.
Нужно определить значение плановых показателей с учетом ограниченности ресурсов при условии достижения стратегической цели. Это и будет оптимальным планом.
Приведем примеры. Пусть объектом планирования является детский сад. Ограничимся лишь двумя плановыми показателями: количеством детей и количеством воспитателей. Основными ресурсами деятельности детского сада являются объем финансирования и площади помещения. А каковы стратегические цели? Естественно, одной из них является сохранение и укрепление здоровья детей. Количественной мерой такой цели является минимизация заболеваемости воспитанников детского сада.
Другой пример: планирование экономической деятельности государства. Безусловно, это слишком сложная задача для того, чтобы нам с ней полностью разобраться. Плановых показателей очень много: это производство различных видов промышленной и сельскохозяйственной продукции, подготовка специалистов, выработка электроэнергии, размер зарплаты работников бюджетной сферы и многое другое. К ресурсам относятся: количество работоспособного населения, бюджет государства, природные ресурсы, энергетика, возможности транспортных систем и пр. Как вы понимаете, каждый из этих видов ресурсов ограничен. Кроме того, важнейшим ресурсом является время, отведенное на выполнение плана. Вопрос о стратегических целях довольно сложный. У государства их много, но в разные периоды истории приоритеты целей могут меняться. Например, в военное время главной целью является максимальная обороноспособность, военная мощь страны. В мирное время в современном цивилизованном государстве приоритетной целью должно быть достижение максимального уровня жизни населения.
Если мы хотим использовать компьютер для решения задачи оптимального планирования, то нам снова нужно построить математическую модель. Следовательно, все, о чем говорилось в примерах, должно быть переведено на язык чисел, формул, уравнений и других средств математики. В полном объеме для реальных систем эта задача очень сложная. Как и раньше, мы пойдем по пути упрощения. Рассмотрим очень простой пример, из которого вы получите представление об одном из подходов к решению задачи оптимального планирования.
Пример. Школьный кондитерский цех готовит пирожки и пирожные. В силу ограниченности емкости склада за день можно приготовить в совокупности не более 700 штук изделий. Рабочий день в кондитерском цехе длится 8 часов. Поскольку производство пирожных более трудоемко, то если выпускать только их, за день можно произвести не более 250 штук, пирожков же можно произвести 1000 штук (если при этом не выпускать пирожных). Стоимость пирожного вдвое выше, чем стоимость пирожка. Требуется составить такой дневной план производства, чтобы обеспечить наибольшую выручку кондитерского цеха.
Разумеется, это чисто учебный пример. Вряд ли существует такой кондитерский цех, который выпускает всего два вида продукции, да и наибольшая выручка — не единственная цель его работы. Но зато математически формулировка задачи будет простой. Давайте ее выработаем.
Плановыми показателями являются:
- х — дневной план выпуска пирожков;
- у — дневной план выпуска пирожных.
Что в этом примере можно назвать ресурсами производства? Из того, о чем говорится в условии задачи, это:
- длительность рабочего дня — 8 часов;
- вместимость складского помещения — 700 мест.
Предполагается для простоты, что другие ресурсы (сырье, электроэнергия и пр.) не ограничены. Формализацию цели (достижение максимальной выручки цеха) мы обсудим позже.
Получим соотношения, следующие из условий ограниченности времени работы цеха и вместимости склада, т. е. суммарного числа изделий.
Из постановки задачи следует, что на изготовление одного пирожного затрачивается в 4 раза больше времени, чем на выпечку одного пирожка. Если обозначить время изготовления пирожка как t мин, то время изготовления пирожного будет равно 41 мин. Значит, суммарное время на изготовление х пирожков и у пирожных равно
tx + 4ty = (х + 4 y)t.
Но это время не может быть больше длительности рабочего дня. Отсюда следует неравенство:
(х + 4y)t <8-60,
или
(х + 4y)t < 480.
Легко посчитать t — время изготовления одного пирожка. Поскольку за рабочий день их может быть изготовлено 1000 штук, то на один пирожок тратится 480/1000 = 0,48 мин. Подставляя это значение в неравенство, получим:
(х + 4у)х0,48 < 480.
Отсюда
х + 4у < 1000.
Ограничение на общее число изделий дает совершенно очевидное неравенство:
х + у< 700.
К двум полученным неравенствам следует добавить условия положительности значений величин х и у (не может быть отрицательного числа пирожков и пирожных). В итоге получим систему неравенств:
х + 4у <1000;
* + У < 700;
у> 0.
А теперь перейдем к формализации стратегической цели: получению максимальной выручки. Выручка — это стоимость всей проданной продукции. Пусть цена одного пирожка — г рублей. По условию задачи, цена пирожного в два раза больше, т. е. 2г рублей. Отсюда стоимость всей произведенной за день продукции равна
гх + 2 гу = г(х + 2 у).
Целью производства является получение максимальной выручки. Будем рассматривать записанное выражение как функцию от х, у:
F(x, у) = г(х + 2у).
Она называется целевой функцией.
Поскольку значение г — константа, то максимальное значение F(x, у) будет достигнуто при максимальной величине выражения (х + 2у). Поэтому в качестве целевой функции можно принять
fix, у) - х + 2у. (2)
Следовательно, получение оптимального плана свелось к следующей математической задаче:
Требуется найти значения плановых показателей х и у, удовлетворяющих данной системе неравенств (1) и придающих максимальное значение целевой функции (2).
Итак, математическая модель задачи оптимального планирования для школьного кондитерского цеха построена.
Теперь следующий вопрос: как решить эту задачу? Вы уже догадываетесь, что решать ее за нас будет компьютер с помощью табличного процессора Excel. А мы обсудим лишь подход к решению, не вникая в подробности метода.
Математическая дисциплина, которая посвящена решению таких задач, называется математическим программированием. А поскольку в целевую функцию f(x, у) величины хну входят линейно (т. е. в первой степени), то наша задача относится к разделу этой науки, который называется линейным программированием.
Система написанных выше неравенств представляется на координатной плоскости четырехугольником, ограниченным четырьмя прямыми, соответствующими линейным уравнениям:
х + 4 у = 1000, х + у = 700, х = 0 (ось Y), у = 0 (ось X).
На рис. 6.9 эта область представляет собой четырехугольник ABCD и выделена заливкой. Любая точка четырехугольника является решением системы неравенств (1). Например, х = 200, у = 100. Этой точке соответствует значение целевой функции /(200, 100) = 400. А другой точке (* = 600, у = 50) соответствует /(600, 50) = 700. Но, очевидно, искомым решением является та точка области ABCD, в которой целевая функция максимальна. Нахождение этой точки производится с помощью методов линейного программирования.
800 " | Y | |
600 | ||
400 | А \ | |
200 | ||
п | ^ X | |
D „„„ С\ 200 4Q0 600 | ®0 1 000 1200 |
Рис. 6.9. Область поиска оптимального плана
В математическом арсенале Excel имеется средство Поиск решения. Как решать данную задачу с помощью этого средства, вы узнаете из компьютерного практикума.
В результате решения задачи получается следующий оптимальный план дневного производства кондитерского цеха: нужно выпускать 600 пирожков и 100 пирожных. Эти плановые показатели соответствуют координатам точки В на рис. 6.9. В этой точке значение целевой функции /(600, 100) = 800. Если один пирожок стоит 5 рублей, то полученная выручка составит 4000 рублей.
4. Система основных понятий
Модели статистического прогнозирования | |||
Статистика: наука о сборе, измерении и анализе массовых количественных данных | |||
Статистические данные | |||
Приближенный характер | Требуют многократных измерений | ||
Регрессионная модель | |||
Описывает зависимость между количественными характеристиками сложных систем | Вид регрессионной функции определяется подбором по экспериментальным данным | Может использоваться для прогнозирования | |
Метод наименьших квадратов | |||
Используется для вычисления параметров регрессионной модели | Вид регрессионной модели задает пользователь | Содержится в математическом арсенале электронных таблиц |
Модели оптимального планирования | |||
Оптимальное планирование — определение значений плановых показателей с учетом ограниченности ресурсов при условии достижения заданной цели | |||
Ограниченность ресурсов описывается: | |||
системой неравенств | Системой равенств | Смешанной системой | |
Цель описывается функцией, для которой требуется | |||
наити максимум | Найти максимум | ||
Microsoft Excel имеет специальное средство Поиск решения для решения задач оптимального планирования |
Система основных понятий
Вопросы и задания
- Для чего используется метод наименьших квадратов?
- Что такое тренд?
- Как располагается линия тренда, построенная по МНК, относительно экспериментальных точек?
- Может ли тренд, построенный по МНК, пройти выше всех экспериментальных точек?
- В чем смысл параметра R[1]? Какие значения он принимает?
- Какое значение примет параметр R2, если тренд точно проходит через экспериментальные точки?
- Что подразумевается под восстановлением значения по регрессионной модели? б) Что такое экстраполяция?
- Соберите данные о средней дневной температуре в вашем городе за последнюю неделю (10 дней, 20 дней). Оцените (хотя бы на глаз), годится ли использование линейного тренда для описания характера изменения температуры со временем. Попробуйте путем графической экстраполяции предсказать температуру через 2-5 дней.
- Придумайте свои примеры практических задач, для которых имело бы смысл выполнение восстановления значений и экстраполяционных расчетов.
- Вопросы и задания
- а) В чем состоит задача оптимального планирования?
- б) Что такое плановые показатели, ресурсы, стратегическая цель? Приведите примеры.
- а) Попробуйте сформулировать содержание оптимального планирования для своей учебной деятельности.
- Что такое математическое программирование, линейное программирование? Сформулируйте задачу оптимального планирования для школьного кондитерского цеха, в котором выпускается три вида продукции: пирожки, пирожные и коржики.
- Внесите изменение в постановку задачи оптимального планирования из этого параграфа для двух видов продукции с учетом еще одного ограничения: число пирожных должно быть не меньше числа пирожков. На координатной плоскости постройте область поиска решения
- Что такое статистика?
- Являются ли результаты статистических расчетов точными?
- Что такое регрессионная модель?
6. Итог и задание для самостоятельной работы
Самостоятельная работа №22
1.Как изменится семантическая сеть, если первую фразу про петуха (см. пример 2) заменить на следующую: «Курица является птицей и она несет яйца»?
2. В примере 2 фразу про попугая заменить на следующую: «Попугай Кеша живет у моего одноклассника Васи и умеет разговаривать». Построить соответствующую семантическую сеть.
3. По семантической сети дайте ответы на следующие вопросы:
- Какие общие свойства есть у Пушинки и Джонни?
- Каким образом Пушинка вскармливает своих детей?
- Что общего у слонов и у кошек?
- В чем разница между Муркой и Костей?
4. Построить семантическую сеть, отражающую следующую информацию:
«У мельника было три сына. Мельник оставил наследство. Оно состояло из мельницы, осла и кота. Старший сын взял мельницу. Средний сын взял осла. Младшему сыну дали кота».
Самостоятельная работа №23
1. Построить семантическую сеть, отражающую следующую информацию:
Мария работает в дневную смену.
Сергей работает в вечернюю смену.
Борис работает в вечернюю смену.
Валентина работает в вечернюю смену.
2. Два служащих знают друг друга, если они работают в одну
смену.
Определить:
- Знает ли Сергей Бориса?
- Кого знает Валентина?
- Кого знает Мария?
3.Будем считать, что система «Школьный урок» состоит из следующих элементов: ученик, учитель, учебник, тетрадь, классный журнал, классная доска, мел, парта, учительский стол, классная комната. Построить семантическую сеть, в которой вершинами будут перечисленные объекты, а дугами — отношения между ними.
разбила
4.Будем считать, что система «Хлебный магазин» состоит из следующих элементов: хлеб, продавец, покупатель, прилавок, автомобиль, шофер, грузчик, деньги, чек. Построить семантическую сеть, в которой вершинами будут перечисленные объекты, а дугами — отношения между ними.
5.Определить сказку, для которой следующий граф отражает отношения между персонажами:
6. Изобразите в виде графа взаимосвязи между персонажами и
различными предметами из сказки про Царевну-Лягушку.
Иван Царевич пустил стрелу.
Стрела прилетела к лягушке.
Иван Царевич нашел лягушку.
Лягушка сбросила лягушачью кожу.
Лягушка превратилась в Василису Премудрую.
Иван Царевич сжег лягушачью кожу.
Василиса Премудрая превратилась в лебедя.
Лебедь улетела к Кощею Бессмертному.
Баба Яга указала дорогу Ивану Царевичу.
Иван Царевич нашел Кощея Бессмертного.
Иван Царевич победил Кощея Бессмертного.
По теме: методические разработки, презентации и конспекты
Авторская программа. Технологии. Информационные технологии.
Преимущества авторской программы: в отличии от предмета « Технологии» , «Технологии. Информационные технологии» позволяют учащимся приобрести навыки необходимые им в дальнейшей...
Лекция с использованием информационных технологий: Информационное обеспечение анализа финансово-хозяйственной деятельности
Лекция с использованием информационных технологий...
Применение здоровье сберегающих технологий в моделировании и макетировании а также при занятиях техническим творчеством.
Нам всем необходимо помнить, что состояние здоровья подрастающего поколения - важнейший индикатор благополучия общества и государства, отражающий настоящую ситуацию и дающий прогноз на будущее....
Рабочая программа учебной дисциплины информационные технологии в профессиональной деятельности по специальности конструирование, моделирование и технология швейных изделий
Рабочая программа расчитана на 126ч (82ч. аудиторной и 42ч. внеаудиторной нагрузки).При разработке программы основной упор делался на практическую составляющую и применение полученных навыков в дальне...
2018-2019 РАБОЧАЯ ПРОГРАММА учебной дисциплины ЕН.03 «ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ» по специальности СПО 29.02.04 «Конструирование, моделирование и технология швейных изделий»
РАБОЧАЯ ПРОГРАММА учебной дисциплины ЕН.03 «ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ» по специальности СПО 29.02.04 «Конструирование, моделирован...
2019-2020 РАБОЧАЯ ПРОГРАММА учебной дисциплины ЕН.03 «ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ» по специальности СПО 29.02.04 «Конструирование, моделирование и технология швейных изделий»
РАБОЧАЯ ПРОГРАММА учебной дисциплины ЕН.03 «ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ» по специальности СПО 29.02.04 «Конструирование, модел...