OCR (оптическое распознавание текста)

Появилась необходимость в распознавании текста. Надо перевести один документ в электронный вид, а печатать не очень хочется. ((( Когда-то, лет несколько назад пользовался ABBYY FineReader. Полез искать ее в интернет. Платная. ((( Качать пиратку? (((
Помимо ABBYY FineReader попалась еще одна программа — OCR CuneiForm. Может попробовать? Бесплатная, открытая …

OCR CUNEIFORM — это система оптического распознавания ведущего российского разработчика программного обеспечения Cognitive Technologies. OCR CuneiForm обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов в редактируемый текст для последующей работы с ним.

OCR CuneiForm отличается от других программ этого класса высоким уровнем распознавания, особенно текстов низкого качества и наличием встроенных мастеров — помощников в работе; мощным встроенным текстовым редактором.

Компания Cognitive Technologies, созданная в 1993 году на базе лаборатории искусственного интеллекта Института Системного Анализа РАН, сочетает в системе распознавания текстов CuneiForm передовые технологии и результаты многолетних исследований и разработок отечественных ученых и программистов. Благодаря этому OCR CuneiForm стал одной из самых популярных в мире систем распознавания текстов. В России CuneiForm всегда задавал стандарты и новые направления развития и для других OCR-систем.

Основные возможности OCR CuneiForm

1. ИНТЕРФЕЙС
Интерфейс программы содержит выпадающие контекстные меню, панели быстрого доступа, контекстную помощь.

2. СКАНИРОВАНИЕ

  • Автоматический подбор оптимальных параметров сканирования.
  • Возможность импортирования отсканированных или полученных через факс-модем графических файлов во многих форматах.
  • Обработка изображений: печать образа, инвертирование, поворот.

3. ФРАГМЕНТАЦИЯ

  • Автоматический и полуавтоматический режимы поиска блоков текста, таблиц и графики, который обеспечивает большую гибкость при работе с многоколоночными текстами и текстами сложной структуры и с графическими элементами.
  • Режим ручной фрагментации для работы с текстами особо сложной структуры.

4. РАСПОЗНАВАНИЕ

  • CuneiForm распознает любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, печатной машинки, плохих ксерокопий и факсов.
  • Самообучающиеся адаптивные алгоритмы распознавания повышают вероятность распознавания низкокачественных документов.

5. ЯЗЫКОВАЯ ПОДДЕРЖКА
Система распознает русский, английский, смешанный русско-английский, украинский, немецкий, французский, испанский, португальский, итальянский, голландский, датский, шведский, финский, сербский, хорватский, польский, казахский, узбекский и другие языки.

6. СЛОВАРНЫЙ КОНТРОЛЬ

  • Словарь общеупотребительной лексики каждого поддерживаемого языка для контекстной проверки и повышения качества результатов распознавания.
  • Возможность создания и пополнения пользовательского словаря, а также возможность экспорта/импорта словаря в/из текстовых файлов.

7. РЕАЛИЗАЦИЯ ПРИНЦИПА «What You Scan Is What You Get» («Что Вы сканируете, то и получаете»).
CuneiForm позволяет получить полную копию вводимого документа, включая:

  • Шрифтовое оформление и форматирование.
  • Расположение текста, иллюстраций и таблиц.
  • Колонки, абзацы, отступы, стили и размеры шрифтов.
  • Черно-белые, 256-градационные серые и цветные 24-битные иллюстрации в выходном RTF-файле.

8. РАБОТА С ТАБЛИЦАМИ

  • Распознавание таблиц различной структуры, в том числе и без линий разграфки.
  • Редактирование таблиц (уменьшение/увеличение, удаление/создание колонок и т.д.)
  • Сохранение результатов в распространенных табличных форматах.

9. РЕДАКТИРОВАНИЕ
В программу встроен многофункциональный редактор, не уступающий по своим возможностям популярным текстовым процессорам.

  • Одновременная подсветка распознанного текста и исходного изображения, снабженная функцией «следующий/предыдущий сомнительно распознанный».
  • Поддержка иллюстраций, таблиц, колонок, колонтитулов, сложного форматирования и различных шрифтов.
  • Возможность редактирования текстовых документов популярных форматов.

10. ИНТЕГРАЦИЯ С ДРУГИМИ ПРИЛОЖЕНИЯМИ
Опции командной строки и поддержка Drag&Drop для вызова из внешних приложений, сканирования, распознавания и сохранения результатов в автоматическом режиме.

OCR CuneiForm — free-ware. Загрузить систему OCR CuneiForm V.12.

Понравилась информация? Поделись с друзьями:

Максим Ремезов

Смотрите вверху ссылку "Обо мне"

OCR (оптическое распознавание текста): 1 комментарий

Добавить комментарий

Войти с помощью: 

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.