Что такое ocr


ocr-системи. Призначення, види та використання Что такое ocr-системы

Модуль 2

Заняття___

Системы оптического распознавания символов (Optical Character Recognition - OCR) предназначены для автоматического ввода печатных документов в компьютер.

FineReader — омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии "целостного целенаправленного адаптивного распознавания".

Процесс ввода документа в компьютер можно подразделить на два этапа:

  1. Сканирование. На первом этапе сканер играет роль "глаза" Вашего компьютера: "просматривает" изображение и передает его компьютеру. При этом полученное изображение является не чем иным, как  набором черных, белых или цветных точек, картинкой, которую невозможно отредактировать ни в одном текстовом редакторе.

  2. Распознавание. Обработка изображения OCR-системой.

Остановимся на втором шаге более подробно.

Обработка изображения системой FineReader включает в себя анализ графического изображения, переданного сканером, и распознавание каждого символа. Процессы анализа макета страницы (определение областей распознавания, таблиц, картинок, выделение в тексте строк и отдельных символов) и распознавания изображения тесно связаны между собой: алгоритм поиска блоков использует информацию о распознанном тексте для более точного анализа страницы.

Как уже упоминалось, распознавание изображения осуществляется на основе технологии "целостного целенаправленного адаптивного распознавания".

  • Целостность- объект описывается как целое с помощью значимых элементов и отношений между ними.

  • Целенаправленность- распознавание строится как процесс выдвижения и целенаправленной проверки гипотез.

  • Адаптивность- способность OCR-системы к самообучению.

В соответствии с этими тремя принципами система сначала выдвигает гипотезу об объекте распознавания (символе, части символа или нескольких склеенных символах), а затем подтверждает или опровергает ее, пытаясь последовательно обнаружить все структурные элементы и связывающие их отношения. В каждом структурном элементе выделяются части, значимые для человеческого восприятия: отрезки, дуги, кольца и точки. Следуя принципу адаптивности, программа самостоятельно "настраивается", используя положительный опыт, полученный на первых уверенно распознанных символах. Целенаправленный поиск и учет контекста позволяют распознавать разорванные и искаженные изображения, делая систему устойчивой к возможным дефектам письма.

В результате работы в окне FineReader появится распознанный текст, который Вы можете отредактировать и сохранить в наиболее удобном для Вас формате.

Форматы, в которых FineReader сохраняет распознанный текст FineReader сохраняет результаты распознавания в следующих форматах:

  • Microsoft Word Document (*.DOC)

  • Rich Text Format (*.RTF)

  • Microsoft Word XML Document (*.XML) (только для Microsoft Word 2003)

  • Adobe Acrobat Format (*.PDF)

  • HTML

  • Microsoft PowerPoint Format (*. PPT)

  • Comma Separated Values File (*.CSV)

  • Простой текст (*.TXT). FineReader поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодировку Unicode.

  • Microsoft Excel Speadsheet (*.XLS)

  • DBF

studfiles.net

Что такое ocr-системы

Системы оптического распознавания символов (Optical Character Recognition - OCR) предназначены для автоматического ввода печатных документов в компьютер.

FineReader — омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии "целостного целенаправленного адаптивного рас­познавания".

Процесс ввода документа в компьютер можно подразделить на два этапа:

1. Сканирование. На первом этапе сканер играет роль "глаза" Вашего компьютера: "просматривает" изображение и передает его компьютеру. При этом полученное изображение является не чем иным, как набором черных, белых или цветных точек, картинкой, которую невозможно от­редактировать ни в одном текстовом редакторе.

2. Распознавание. Обработка изображения OCR-системой.

Остановимся на втором шаге более подробно.

Обработка изображения системой FineReader включает в себя анализ графического изо­бражения, переданного сканером, и распознавание каждого символа. Процессы анализа макета страницы (определение областей распознавания, таблиц, картинок, выделение в тексте строк и отдельных символов) и распознавания изображения тесно связаны между собой: алгоритм поиска блоков использует информацию о распознанном тексте для бо­лее точного анализа страницы.

Как уже упоминалось, распознавание изображения осуществляется на основе техноло­гии "целостного целенаправленного адаптивного распознавания".

• Целостность - объект описывается как целое с помощью значимых эле­ментов и отношений между ними.

• Целенаправленность - распознавание строится как процесс выдвиже­ния и целенаправленной проверки гипотез.

• Адаптивность - способность OCR-системы к самообучению.

В соответствии с этими тремя принципами система сначала выдвигает гипотезу об объ­екте распознавания (символе, части символа или нескольких склеенных символах), а за­тем подтверждает или опровергает ее, пытаясь последовательно обнаружить все струк­турные элементы и связывающие их отношения. В каждом структурном элементе выде­ляются части, значимые для человеческого восприятия: отрезки, дуги, кольца и точки.

Следуя принципу адаптивности, программа самостоятельно "настраивается", используя положительный опыт, полученный на первых уверенно распознанных символах. Целе­направленный поиск и учет контекста позволяют распознавать разорванные и искажен­ные изображения, делая систему устойчивой к возможным дефектам письма.

В результате работы в окне FineReader появится распознанный текст, который Вы може­те отредактировать и сохранить в наиболее удобном для Вас формате.

Новые возможности abbyy FineReader 7.0

Точность распознавания

• Точность распознавания улучшена на 25%. Лучше анализируются и рас­познаются документы сложной верстки, в частности, содержащие участ­ки текста на цветном фоне или фоне, состоящем из мелких точек, доку­менты со сложными таблицами, в том числе таблицами с белыми разде­лителями, таблицами с цветными ячейками

• В новую версию добавлены специализированные словари для английско­го и немецкого языка, включающие наиболее часто используемые юри­дические и медицинские термины. Это позволяет достичь качественно нового уровня при распознавании документов юридической и медицин­ской тематики.

Поддержка формата XML и интеграция с Microsoft Office

• В FineReader появился новый формат сохранения - Microsoft Word XML. Теперь пользователи новой версии Microsoft Office 2003 смогут работать с документами, распознанными FineReader, используя все преимущества формата XML!

• Интеграция FineReader с Microsoft Word 2003 позволяет объединить мощ­ные возможности этих двух приложений для обработки распознанного текста. Вы сможете проверять и редактировать результаты распознавания с помощью привычных инструментов Word, одновременно сверяя пере­данный в Word текст с оригинальным изображением - окно Zoom FineReader открывается прямо в окне Word.

• Новые возможности сделают Вашу работу более удобной. При создании документа Word можно вызвать FineReader, распознать текст и вставить его в то место документа, где находится курсор, то есть Вы сможете легко собрать в одном документе информацию из разных бумажных источни­ков или PDF-файлов. Результаты распознавания теперь можно отправить по электронной почте как вложение в любом из поддерживаемых форма­тов сохранения.

Улучшена работа FineReader с PDF документами

• Качество распознавания PDF-файлов значительно улучшилось. Большин­ство документов, помимо изображения страницы, содержат текст. FineReader 7.0 умеет извлекать этот текст и использовать его для провер­ки результатов и улучшения качества распознавания.

• Теперь Вы можете редактировать распознанные PDF-документы в окне редактора FineReader: внесенные изменения будут сохранены в любом из поддерживаемых в программе режимов сохранения PDF-файлов.

• Формат PDF-файлов, создаваемых программой FineReader, оптимизи­рован для их публикации в Интернете - пользователь сможет просмат­ривать содержание первых страниц, пока скачивается остальная часть документа.

Новые возможности сохранения

• Новый формат сохранения результатов распознавания - Microsoft PowerPoint - позволяет быстро создавать новые презентации или редактировать уже существующие.

• При сохранении в Microsoft Word уменьшился размер получаемого файла, улучшилось сохранение форматирования документов с различны­ми разделителями, появились новые опции сохранения картинок.

• Улучшено отображение сложных элементов верстки при сохранении

в HTML, например, обтекание непрямоугольных картинок текстом. Кро­ме того, уменьшился размера HTML-файла, что очень важно для публика­ции документов в Интернете.

Удобство использования

• Обновленный интуитивно-понятный пользовательский интер­фейс. Стало удобнее работать с профессиональными настройками. Па­нели инструментов редактирования перенесены в окно, в котором отоб­ражаются результаты распознавания. Появились удобные инструменты управления окнами FineReader: например, можно поставить удобную сте­пень увеличения в каждом из окон.

• Обновленное практическое руководство по улучшению качества распознавания поможет начинающему пользователю быстро начать работу, а более опытному - наилучшим образом настроить программу для получения отличного результата при работе с любыми типами до­кументов.

Профессиональные возможности

Теперь в версии FineReader Professional Edition стали доступны те возможности, которые раньше были доступны только пользователям версии Corporate Edition:

• Улучшено распознавание штрих-кодов, поддержано распознавание двухмерного штрих-кода PDF-417.

• Инструмент для разбиения изображения. С помощью него Вы смо­жете разделить изображения на области и сохранить каждую область как отдельную страницу пакета. Таким образом удобно распознавать не­сколько визитных карточек, отсканированных вместе, книги, или распе­чатки слайдов презентаций PowerPoint.

• Морфологический поиск. Любой пакет, созданный в программе FineReader, можно использовать в качестве небольшой базы данных

с возможностью полнотекстового морфологического поиска. Среди всех распознанных страниц пакета можно найти те страницы, которые содер­жат заданные слова во всех их грамматических формах (для 34 языков со словарной поддержкой).

• Поддержка процессоров Intel, использующих технологию Hyper-Threading. Использование этой технологии позволяет заметно увеличить производительность, что особенно важно, если стоит задача распознавания большого числа документов.

В версии FineReader 7.0 также появились и другие профессиональные возможности:

• Двухстороннее сканирование. Сканируя документ с напечатанным

с двух сторон текстом с помощью поддерживающего эту опцию сканера, Вы получите изображения содержимого каждой стороны в виде двух от­дельных страниц пакета. Если нужно отсканировать только одну сторону документа, эту опцию можно отключить.

• Поддержано открытие графических файлов формата JPEG 2000 и сохра­нение в этот формат.

Сетевые возможности версии FineReader Corporate Edition

Подробно все особенности установки и использования FineReader Corporate Edition в корпоративной сети описаны в Руководстве системного администратора, который Вы можете найти в подпапке Administrator's Guide папки сервера, куда был установлен FineReader.

Основные улучшения по сравнению с предыдущей версией:

• Поддержка основных способов автоматической установки с сер­вера на рабочие станции. FineReader Corporate Edition поддерживает все основные способы автоматической установки в локальной сети: с по­мощью Active Directory, Microsoft Systems Management Server или с помо­щью командной строки.

• Работа с многофункциональными устройствами, в том числе се­тевыми. Многофункциональные устройства, совмещающие в себе функ­ции сканера, принтера, копира и факса, становятся все более популярны­ми. Теперь необязательно ставить каждому сотруднику свой сканер - до­статочно одного мощного устройства, с которым работают все пользова­тели организации. FineReader умеет работать с такими устройствами, как подключенными к рабочей станции, так и сетевыми. Специальные наст­ройки программы позволяют пользователю автоматически открывать и отсканированные изображения с любого места в локальной сети или с ftp сервера и распознавать их

• Различные модели корпоративного лицензирования. Кроме ли­цензирования по числу одновременного работающих пользователей, ста­ли доступны также другие способы лицензирования. Вы сможете выбрать тот вариант, который в большей степени отвечает Вашим потребностям.

• License Manager - средство управления лицензиями в сети. В FineReader Corporate Edition появилась удобная утилита управления лицензиями (Менеджер лицензий). С помощью нее осуществляется от­слеживание использования FineReader на рабочих станциях, резервиро­вание лицензий за рабочими станциями, добавление новых лицензий.

19

studfiles.net

5 бесплатных программ для сканирования и распознавания текста

Программы для распознавания текста позволяют конвертировать сфотографированные или отсканированные документы непосредственно в предложения.

Дело в том, что текст на изображении представлен в виде растра, набора точек. Упомянутый софт осуществляет превращение набора точек в полноценный текст, доступный для редактирования и сохранения.

Содержание:

Распознавание букв призвано оптимизировать процесс оцифровки бумажных печатных или рукописных книг, документов.

Такой метод оцифровки на порядки превосходит скорость ручного набора с изображения. Широко применяется при оцифровке библиотек и архивов. Далее рассмотрим пятерку лучших представителей семейства подобных программ.

FineReader безоговорочный лидер среди всех программ, распознающих текст на изображении. В частности, софта, более четко обрабатывающего кириллицу нет. Вообще в активе FineReader 179 языков, текст на которых распознается чрезвычайно успешно.

Единственное обстоятельство, которое может разочаровать пользователей, состоит в том, что программа платная. Бесплатно распространяется только пробная версия на 15 дней. За этот период разрешено сканирование 50-ти страниц.

Дальше за пользование программой придется платить. FineReader легко «кушает» любое более-менее качественное изображение. Источник при этом совершенно неважен. Будь то фотография, скан страницы или любая картинка с буквами.

Достоинства:

  • точное распознавание;
  • огромное количество языков чтения;
  • толерантность к качеству изображения-источника.

Недостаток:

  • пробная версия на 15 дней.
вернуться к меню ↑

Бесплатная программа для считывания текстовой информации с изображений. Точность распознавания на порядок ниже, чем у предыдущей рассматриваемой программы. Но как для бесплатной утилиты, функционал все-таки на высоте.

Интересно! CuneiForm распознает блоки текста, графические изображения и даже различные таблицы. Более того, считыванию поддаются даже неразлинованные таблицы.

Программа может прочитать и сохранять шрифт и кегль распознаваемого текста. В базе шрифтов содержится большинство используемых печатных шрифтов. Поддерживается даже распознавание текста вышедшего из печатной машинки.

Для обеспечения точности к процессу распознавания подключаются специальные словари, которые пополняют словарный запас из сканируемых документов.

Достоинства:

  • бесплатное распространение;
  • использование словарей для проверки правильности текста;
  • сканирование текста с ксерокопий плохого качества.

Недостатки:

  • относительно небольшая точность;
  • небольшое количество поддерживаемых языков.
вернуться к меню ↑

WinScan2PDF

Это даже не полноценная программа, а утилита. Установка не потребуется, а исполнительный файл весит всего в несколько килобайт. Процесс распознавания происходит предельно быстро, правда, полученные в его результате документы сохраняются исключительно в формате PDF.

Фактически весь процесс выполняется при нажатии трех кнопок: выбор источника, места назначения и, собственно, запуска программы.

Утилита предназначена для быстрой пакетной обработки множества файлов. Для удобства пользователей предусмотрен большой языковой пакет интерфейса.

Достоинства:

  • портативность;
  • быстрая работа;
  • простота в использовании.

Недостатки:

  • минимальный размер;
  • единственный формат файлов на выходе.
вернуться к меню ↑

Отличная небольшая программа для распознавания текстов с изображений. Поддерживает даже чтение рукописей. Беда в том, что русский не входит ни в языковой пакет интерфейса, ни в список поддерживаемых для распознавания языков.

Однако если необходимо отсканировать английский, датский или французский, то лучшего бесплатного варианта не найти.

В своей области программа обеспечивает точную расшифровку шрифтов, удаление шума и извлечение графических изображений. К тому же в интерфейс программы встроен текстовый редактор, практически идентичный WordPad, что значительно повышает удобство использования программы.

Достоинства:

  • точное распознавание текста;
  • удобный текстовый редактор;
  • удаление шума с изображения.

Недостатки:

  • полное отсутствие русского языка.
вернуться к меню ↑

Программа позволяет оперативно извлекать текст и графику с изображений. Софт поддерживает работу с несколькими сканерами без потери производительности. Извлеченный текст может быть сохранен в формате текстового документа или документа MS Office.

Кроме того предусмотрена функция многостраничного распознавания.

Распространяется Freemore OCR бесплатно, однако, интерфейс только на английском. Но это обстоятельство никак не влияет на удобство пользования, потому как организованы элементы управления интуитивно понятным образом.

Достоинства:

  • бесплатное распространение;
  • возможность работы с несколькими сканерами;
  • достойна точность распознавания.

Недостатки

  • Отсутствие русского языка в интерфейсе;
  • Необходимость загрузки русского языкового пакета для распознавания.

geek-nose.com

Что такое технология оптического распознавания символов, или OCR

Представьте, вам надо оцифровать журнальную статью или распечатанный договор. Конечно, вы можете провести несколько часов, перепечатывая документ и исправляя опечатки. Либо вы можете перевести все требуемые материалы в редактируемый формат за несколько минут, используя сканер (или цифровую камеру) и программу для оптического распознавания символов (OCR).

Оптическое распознавание символов (англ. Optical Character Recognition – OCR) – это технология, которая позволяет преобразовывать различные типы документов, такие как отсканированные документы, PDF-файлы или фото с цифровой камеры, в редактируемые форматы с возможностью поиска.

Предположим, у вас есть бумажный документ, например, статья в журнале, брошюра или договор в формате PDF, присланный вам партнером по электронной почте. Очевидно, для того чтобы получить возможность редактировать документ, его недостаточно просто отсканировать. Единственное, что может сделать сканер, – это создать изображение документа, представляющее собой всего лишь совокупность черно-белых или цветных точек, то есть растровое изображение.

Для того чтобы копировать, извлекать и редактировать данные, вам понадобится программа для распознавания символов, которая сможет выделить в изображении буквы, составить их в слова, а затем объединить слова в предложения, что в дальнейшем позволит работать с содержимым исходного документа.

Наиболее совершенные системы распознавания символов, такие как ABBYY FineReader OCR, делают акцент на использовании механизмов, созданных природой. В основе этих механизмов лежат три фундаментальных принципа: целостность, целенаправленность и адаптивность (принципы IPA).

Изображение, согласно принципу целостности, будет интерпретировано как некий объект, только если на нем присутствуют все структурные части этого объекта и эти части находятся в соответствующих отношениях. Иначе говоря, ABBYY FineReader не пытается принимать решение, перебирая тысячи эталонов в поисках наиболее подходящего. Вместо этого выдвигается ряд гипотез относительно того, на что похоже обнаруженное изображение. Затем каждая гипотеза целенаправленно проверяется. И, допуская, что найденный объект может быть буквой А, FineReader будет искать именно те особенности, которые должны быть у изображения этой буквы. Как и следует поступать, исходя из принципа целенаправленности. Принцип адаптивности означает, что программа должна быть способна к самообучению, поэтому проверять, верна ли выдвинутая гипотеза, система будет, опираясь на накопленные ранее сведения о возможных начертаниях символа в данном конкретном документе.

Какая технология лежит в основе OCR?

Компания ABBYY, опираясь на результаты многолетних исследований, реализовала принципы IPA в компьютерной программе. Система оптического распознавания символов ABBYY FineReader – единственная в мире система OCR, действующая в соответствии с вышеописанными принципами на всех этапах обработки документа. Эти принципы делают программу максимально гибкой и интеллектуальной, предельно приближая ее работу к тому, как распознает символы человек. На первом этапе распознавания система постранично анализирует изображения, из которых состоит документ, определяет структуру страниц, выделяет текстовые блоки, таблицы. Кроме того, современные документы часто содержат всевозможные элементы дизайна: иллюстрации, колонтитулы, цветной фон или фоновые изображения. Поэтому недостаточно просто найти и распознать обнаруженный текст, важно с самого начала определить, как устроен рассматриваемый документ: есть ли в нем разделы и подразделы, ссылки и сноски, таблицы и графики, оглавление, проставлены ли номера страниц и т. д. Затем в текстовых блоках выделяются строки, отдельные строки делятся на слова, слова на символы.

Важно отметить, что выделение символов и их распознавание также реализовано в виде составных частей единой процедуры. Это позволяет в полной мере использовать преимущества принципов IPA. Выделенные изображения символов поступают на рассмотрение механизмов распознавания букв, называемых классификаторами.

В системе ABBYY FineReader применяются классификаторы следующих типов: растровый, признаковый, контурный, структурный, признаково-дифференциальный и структурно-дифференциальный. Растровый и признаковый классификаторы анализируют изображение и выдвигают несколько гипотез о том, какой символ на нем представлен. В ходе анализа каждой гипотезе присваивается определенная оценка (так называемый вес). По итогам проверки мы получаем список гипотез, проранжированный по весу (то есть по степени уверенности в том, что перед нами именно такой символ). Можно сказать, что в данный момент система уже «догадывается», на что похож рассматриваемый символ.

После этого в соответствии с принципами IPA ABBYY FineReader проводит проверку выдвинутых гипотез. Это делается с помощью дифференциального признакового классификатора.

Кроме того, следует отметить, что ABBYY FineReader поддерживает 192 языка распознавания. Интеграция системы распознавания со словарями помогает программе при анализе документов: распознавание происходит более точно и упрощает дальнейшую проверку результата с учетом данных об основном языке документа и словарной проверки отдельных предположений. После подробной обработки огромного числа гипотез программа принимает решение и предоставляет пользователю распознанный текст.

Изображения, полученные при помощи цифровой камеры, отличаются от отсканированных документов или PDF, представляющих собой изображение.

У них зачастую могут быть определенные дефекты, например искажения перспективы, засветки от фотовспышки, изгибы строк. При работе с большинством приложений такие дефекты могут существенно усложнить процесс распознавания. В связи с этим последние версии ABBYY FineReader содержат технологии предварительной обработки изображения, которые успешно выполняют задачи по подготовке изображений к распознаванию.

Технология ABBYY FineReader OCR проста в использовании – процесс распознавания в целом состоит из трех этапов: открытие (или сканирование) документа, распознавание и сохранение в наиболее подходящем формате (DOC, RTF, XLS, PDF, HTML, TXT и т. д.) либо перенос данных напрямую в офисные программы, такие как Microsoft® Word®, Excel® или приложения для просмотра PDF.

Кроме того, последняя версия ABBYY FineReader позволяет автоматизировать задачи по распознаванию и конвертации документов с помощью приложения ABBYY Hot Folder. С помощью него можно настраивать однотипные или повторяющиеся задачи по обработке документов и увеличить производительность работы.

Высокое качество технологий распознавания текста ABBYY OCR обеспечивает точную конвертацию бумажных документов (сканов, фотографий) и PDF-документов любого типа в редактируемые форматы. Применение современных OCR-технологий позволяет сэкономить много сил и времени при работе с любыми документами. С ABBYY FineReader OCR вы можете сканировать бумажные документы и редактировать их. Вы можете извлекать цитаты из книг и журналов и использовать их без перепечатывания. С помощью цифровой фотокамеры и ABBYY FineReader OCR вы можете моментально сделать снимок увиденного постера, баннера, а также документа или книги, когда под рукой нет сканера, и распознать полученное изображение. Кроме того, ABBYY FineReader OCR можно использовать для создания архива PDF-документов с возможностью поиска.

Весь процесс преобразования из бумажного документа, снимка или PDF занимает меньше минуты, а сам распознанный документ выглядит в точности как оригинал!

mobility.abbyy.com


Смотрите также