"Системы оптического распознавания документов"
презентация к уроку по информатике и икт (9 класс) на тему
Презентация к уроку
Скачать:
Вложение | Размер |
---|---|
sistemy_opticheskogo_raspoznavaniya_dokumenta.ppt | 1.93 МБ |
Предварительный просмотр:
Подписи к слайдам:
Необходимость в системах распознавания символов С помощью сканера достаточно просто получить изображение страницы текста в графическом файле. Однако работать с таким текстом невозможно: как любое сканированное изображение, страница с текстом представляет собой графический файл - обычную картинку. Текст можно будет читать и распечатывать, но нельзя будет его редактировать и форматировать. Для получения документа в формате текстового файла необходимо провести распознавание текста, то есть преобразовать элементы графического изображения в последовательности текстовых символов.
Программы распознавания текста Преобразованием графического изображения в текст занимаются специальные программы распознавания текста ( Optical Character Recognition - OCR ). Наиболее распространенные системы оптического распознавания символов: A BBYY FineReader CuneiForm от Cognitive
Получение электронного документа Отсканировать изображение (с помощью ПО сканера); Распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и т.д. Выделенные текстовые фрагменты графического изображения страницы необходимо преобразовать в текст; Проверка орфографии (если необходимо); Сохранение в файл или передача текста в другое приложение, например в Word .
Методы распознавания символов Если исходный документ имеет типографское качество то задача распознавания решается методом сравнения с растровым шаблоном . При распознавании документов с низким качеством печати используется метод распознавания символов по наличию в них определенных структурных элементов (отрезков, колец, дуг и др.).
ABBYY FineReader FineReader - омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати.
Оптимальное разрешение при сканировании обычный текст - 300 dpi мелкий шрифт (9 и менее пунктов)- 400-600 dpi Сканирование в сером режиме осуществляется автоматический подбор яркости. Сканирование цветных элементов (картинки, цвет букв и фона) – следует выбрать цветной тип изображения.
Системы распознавания рукописного текста преобразуют текст, созданный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.
Системы оптического распознавания форм При заполнении документов большим количеством людей (например, при сдаче (ЕГЭ)) используются бланки с пустыми полями. Данные вводятся в поля печатными буквами от руки. Затем эти данные распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.
Вопросы: Зачем нужны программы распознавания текста? Как происходит распознавание текста? Какие программы распознания текста вы знаете? Какими пользовались? Какое разрешение является оптимальным для сканирования текста, изображений?
Домашнее задание: §2.8, вопросы.
По теме: методические разработки, презентации и конспекты
Экспертные системы распознавания удобрений
Конспект урока для 11 класса с профильным изучением информатики по теме "Экспертные системы распознавания химических веществ"....
Презентация к уроку в 9 классе "Системы оптического распознавания документов"
Презентация к уроку информатики в 9 классе "Системы оптического распознавания документов". УМК Угринович Н.Д....
урок изучения нового материала Тема: «Оптические приборы. Глаз как оптическая система. Дефекты зрения» 8 класс
Урок комбинированный. Общая дидактическая цель - формирование представлений о глазе как оптической системе....
План по предупреждению развития дисграфии на почве нарушения фонемного распознавания с элементами оптической дисграфии (30 часов)
Подготовительная группа...
Системы оптического распознавания документов
Комбинированный урок, урок-игра. Изучение нового материала и контроль знаний раздела «Кодирование и обработка текстовой информации». (к учебнику Угринович Н.Д. Информатика и ИКТ. Базовый уровень: учеб...
Распознавание текста и системы компьютерного перевода. Пр/р №10 «Распознавание текстовых документов»
выработать навыки работы с программным оптического распознавания документов, компьютерными словарями и программами-переводчиками...