Программа для распознавания документов. Распознавание лиц по фото онлайн

09.09.2019 Звуковые устройства

Оптическое распознавание текста – процесс, при котором сфотографированный или отсканированный текст, с помощью специальной программы, переводится в формат документа.

То есть, вместо картинки вы будете иметь стандартный набранный текст, который можно редактировать.

В данном материале мы обсудим, какая программа для распознавания текста лучше (ТОП-7 утилит приведены ниже).

Выбор

Как же выбрать наиболее подходящую программу, и какие основные особенности имеет такой софт?

Отличаться он может по разным показателям – точности распознавания, способности работать с тем или иным языком, возможности сохранять исходную структуру текста и т. п.

Такой софт может распространяться платно и бесплатно, и быть реализован как онлайн (в виде особых сервисов), так и в форме предустанавливаемых программ.

Алгоритм работы заключается в том, что для каждой буквы алфавита составляется база вариантов того, как она может выглядеть на фото, выделяются и сохраняются ее основные элементы. Как только такие элементы обнаруживаются на фото, программа распознает соответствующую букву. В зависимости от того, насколько качественно и подробно была составлена такая база, зависит качество распознавания материала в итоге.

Потому важно, чтобы софт был рассчитан на работу именно с русским языком (некоторые программы могут работать с текстом, написанным сразу на двух языках, другие – нет).

Кроме того, некоторые утилиты и сервисы способны сохранять даже изначальную структуру текста ( , списки), тип его оформления (отступы и т. п.) и даже .

В каких же случаях такой софт необходим?

  • При создании документов, когда имеется только распечатанный вариант;
  • При составлении рефератов, докладов и необходимости процитировать в них большой отрывок текста из книги;
  • Для редакторских работ, когда текст имеется лишь в формате фото и т. д.

На самом деле сфера использования софта очень велика, и правильно выбранный, он способен облегчить и ускорить работу с текстом.

Технические характеристики

Софт отличается по многим параметрам: способу реализации (онлайн или в виде утилиты), лицензии на использование (платно или бесплатно), списку распознаваемых языков, качеству распознавания и другое.

Для того, чтобы пользователь мог сделать правильный выбор максимально быстро, ниже в таблице приведены основные характеристики таких программ.

Названия Лицензия Сканирование Проверка орфографии Перевод Обработка текста в редакторе Работа с рукописным текстом Работа с изображениями плохого качества
Abbyy Fine Reader Платно, с бесплатным пробным периодом на 10 дней да да да частично частично да
OCR Cunei Form Бесплатно да да нет да нет да
Readiris Pro нет да нет да да да
OCR Freemore Бесплатно да нет нет да нет да
Abbyy Screenshot Reader Платно, с бесплатным пробным периодом на 14 дней нет да да нет нет частично
Adobe Acrobat Платно, с бесплатным пробным периодом на 7 дней да нет нет частично нет частично
Free Online OCR Бесплатно нет нет нет нет частично да

Все утилиты, перечисленные в таблице, ниже описаны подробно, и размещены в порядке ТОПа, от лучшей к худшей.

Abbyy Fine Reader

Это наиболее качественный и многофункциональный софт в данном ТОПе. Он отличается высокой точностью распознавания и имеет целый ряд преимуществ, распространяется платно.

Программа успешно работает со множеством языков, в ходе распознавания способна сохранять структуру текста и тип его форматирования.

Предназначена для профессионалов, потому, по мнению большинства пользователей, своих денет стоит.

  • Большое количество поддерживаемых языков;
  • Способность сохранять стиль форматирования и особенности структуры документа достаточно точно;
  • Наличие бесплатной пробной версии на 10 дней;
  • Отсутствие снижения качества работы даже при больших объемах текста (что нередко наблюдается у других программ, которые хуже и хуже распознают текст с каждой последующей загруженной фотографии, и проблема устраняется только после перезапуска).

Отзывы о данном софте различны: «Хорошая программа, очень помогает в работе», «Не стоит своих денег – есть и бесплатные программы с таким же качеством распознавания».

OCR Cunei Form

OCR Cunei Form – пожалуй, одна из наиболее функциональных и удобных программ, среди тех, что распространяются бесплатно.

Обеспечивает достаточно высокое качество распознавания, работает даже с фотографиями плохого качества.

Программа позволяет редактировать фото прямо в процессе работы с ним, достаточно хорошо распознает шрифты и структуры (хотя и не работает с рукописным текстом).

Способна напрямую, и отправлять их в редактор в текстовом виде.

Имеет достаточно удовлетворительную скорость работы.

  • Высокое качество распознавания;
  • Поддержка большого количества языков;
  • Бесплатное распространение;
  • Довольно высокая скорость работы.
  • Отсутствие встроенного переводчика;
  • Никое качество проверки на орфографию;
  • Отсутствие возможности работы с рукописным текстом.

Отзывы юзеров об этой программе таковы: «Неплохой софт», «Учитывая, что программа бесплатная, работает просто отлично».

Readiris Pro

Readiris Pro – еще один платный софт, обеспечивающий достаточно разнообразную и стабильную работу по распознаванию и редактированию теста.

Программы для распознавания текста позволяют конвертировать сфотографированные или отсканированные документы непосредственно в предложения.

Дело в том, что текст на изображении представлен в виде растра, набора точек. Упомянутый софт осуществляет превращение набора точек в полноценный текст, доступный для редактирования и сохранения.

Распознавание букв призвано оптимизировать процесс оцифровки бумажных печатных или рукописных книг, документов.

Такой метод оцифровки на порядки превосходит скорость ручного набора с изображения. Широко применяется при оцифровке библиотек и архивов. Далее рассмотрим пятерку лучших представителей семейства подобных программ.

ABBYY FineReader 10

FineReader безоговорочный лидер среди всех программ, распознающих текст на изображении. В частности, софта, более четко обрабатывающего кириллицу нет. Вообще в активе FineReader 179 языков, текст на которых распознается чрезвычайно успешно.

Единственное обстоятельство, которое может разочаровать пользователей, состоит в том, что программа платная. Бесплатно распространяется только пробная версия на 15 дней. За этот период разрешено сканирование 50-ти страниц.

Дальше за пользование программой придется платить. FineReader легко «кушает» любое более-менее качественное изображение. Источник при этом совершенно неважен. Будь то фотография, скан страницы или любая картинка с буквами.

Достоинства:

  • точное распознавание;
  • огромное количество языков чтения;
  • толерантность к качеству изображения-источника.

Недостаток:

  • пробная версия на 15 дней.

OCR CuneiForm

Бесплатная программа для считывания текстовой информации с изображений. Точность распознавания на порядок ниже, чем у предыдущей рассматриваемой программы. Но как для бесплатной утилиты, функционал все-таки на высоте.

Интересно! CuneiForm распознает блоки текста, графические изображения и даже различные таблицы. Более того, считыванию поддаются даже неразлинованные таблицы.

Для обеспечения точности к процессу распознавания подключаются специальные словари, которые пополняют словарный запас из сканируемых документов.

Достоинства:

  • бесплатное распространение;
  • использование словарей для проверки правильности текста;
  • сканирование текста с ксерокопий плохого качества.

Недостатки:

  • относительно небольшая точность;
  • небольшое количество поддерживаемых языков.

WinScan2PDF

Это даже не полноценная программа, а утилита. Установка не потребуется, а исполнительный файл весит всего в несколько килобайт. Процесс распознавания происходит предельно быстро, правда, полученные в его результате документы сохраняются исключительно в формате PDF.

Фактически весь процесс выполняется при нажатии трех кнопок: выбор источника, места назначения и, собственно, запуска программы.

Утилита предназначена для быстрой пакетной обработки множества файлов. Для удобства пользователей предусмотрен большой языковой пакет интерфейса.

Достоинства:

  • портативность;
  • быстрая работа;
  • простота в использовании.

Недостатки:

  • минимальный размер;
  • единственный формат файлов на выходе.

SimpleOCR

Отличная небольшая программа для распознавания текстов с изображений. Поддерживает даже чтение рукописей. Беда в том, что русский не входит ни в языковой пакет интерфейса, ни в список поддерживаемых для распознавания языков.

Однако если необходимо отсканировать английский, датский или французский, то лучшего бесплатного варианта не найти.

В своей области программа обеспечивает точную расшифровку шрифтов, удаление шума и извлечение графических изображений. К тому же в интерфейс программы встроен текстовый редактор, практически идентичный WordPad, что значительно повышает удобство использования программы.

Достоинства:

  • точное распознавание текста;
  • удобный текстовый редактор;
  • удаление шума с изображения.

Недостатки:

  • полное отсутствие русского языка.

Freemore OCR

Программа позволяет оперативно извлекать текст и графику с изображений. Софт поддерживает работу с несколькими сканерами без потери производительности. Извлеченный текст может быть сохранен в формате текстового документа или документа MS Office.

Кроме того предусмотрена функция многостраничного распознавания.

Распространяется Freemore OCR бесплатно, однако, интерфейс только на английском. Но это обстоятельство никак не влияет на удобство пользования, потому как организованы элементы управления интуитивно понятным образом.

Достоинства:

  • бесплатное распространение;
  • возможность работы с несколькими сканерами;
  • достойна точность распознавания.

Недостатки

  • Отсутствие русского языка в интерфейсе;
  • Необходимость загрузки русского языкового пакета для распознавания.

1. Выберите один PDF файл или файл изображения для распознавания.
2. Нажмите кнопку Распознать .




7. Пользуйтесь на здоровье

1. Выберите один ZIP файл содержащий изображения для распознавания. Только 20 файлов могут быть распознаны одновременно.
2. Нажмите кнопку Распознать .
3. Файл отсылается на наш сервер и распознавание начинается немедленно.
4. Скорость распознавания зависит от размера файла, скорости Вашего интернет соединения и доступных ресурсов на наших серверах.
5. Когда распознавание закончено, файл возвращается в то же самое окно браузера (не закрывайте Ваш браузер).
6. В случае невозможности распознавания, причина будет указана красным цветом.
7. Пользуйтесь на здоровье

Выберите PDF или файл изображение для распознавания Поддерживаются только PDF/JPG/JPEG/PNG/BMP/GIF/TIF/TIFF файлы

Русский English German French Spanish Italian Belgium Arabic Chinese Simplified Chinese Traditional Hindi Indonesian Tamil Telugu Portuguese Malaysian Ukranian

Идет распознавание


Это может занять несколько минут

На данной странице возможно распознавание только PDF JPG JPEG PNG BMP GIF TIF .

  • Для конвертирования MS Word (DOC DOCX) в PDF воспользуйтесь ссылкой Word в PDF .
  • Для конвертирования RTF ODT MHT HTM HTML TXT FB2 DOT DOTX XLS XLSX XLSB ODS XLT XLTX PPT PPTX PPS PPSX ODP POT POTX в PDF воспользуйтесь ссылкой Другие документы в PDF .
  • Для конвертирования JPG JPEG PNG BMP GIF TIF TIFF в PDF воспользуйтесь ссылкой Изображение в PDF .
  • Для извлечения текста из PDF документа воспользуйтесь ссылкой PDF в TXT .
  • Для конвертирования DOC DOCX RTF ODT MHT HTM HTML TXT FB2 DOT DOTX в DOC DOCX DOT ODT RTF TXT или XLS XLSX XLSB XLT XLTX ODS в XLS XLSX или PPT PPTX PPS PPSX ODP POT POTX в PPT PPTX PPS PPSX JPG TIF PNG GIF BMP воспользуйтесь ссылкой Другие форматы .
  • Для конвертирования DOC DOCX DOT DOTX RTF ODT MHT HTM HTML TXT в FB2 воспользуйтесь ссылкой Документы в FB2 .
  • Для конвертирования JPG JPEG JFIF PNG BMP GIF TIF ICO в другие форматы, воспользуйтесь ссылкой Конвертировать изображение .
  • Для конвертирования PDF в MS Word (DOC, DOCX), воспользуйтесь ссылкой Конвертировать PDF в Word .
  • Для конвертирования PDF в JPG, воспользуйтесь ссылкой Конвертировать PDF в JPG .
  • Для конвертирования DJVU в PDF, воспользуйтесь ссылкой Конвертировать DJVU в PDF .

Выберите ZIP архив для распознавания Поддерживаются только ZIP файлы

Русский English German French Spanish Italian Belgium Arabic Chinese Simplified Chinese Traditional Hindi Indonesian Portuguese Malaysian Ukranian

В недавнем времени, программы распознавания лиц были исключительно на службе у государственных ведомств. Они помогают идентифицировать человека беря за основу черты лица. Сейчас применение подобного программного обеспечения чаще всего замечено в системах безопасности, в коммерческой деятельности, связанной с рекламой и продвижением различных услуг.

Также некоторое подобие таких онлайн сервисов и программ доступно и для простых пользователей, их можно найти в сети интернет. В качестве примера можно привести программу Lenovo Veriface. Это фирменная встроенная утилита, которая позволяет разблокировать устройство проводя анализ по лицу.

Как работает поиск по лицам

В некоторых сервисах поиск по лицам работает на основе технологии нейросетей . Поиск происходит исходя из определенных базовых признаков: вес изображения, разрешение, цветокоррекция, экспозиция, разрешение и т.д. Сейчас, технология нейросетей развивается, помимо базовых признаков, определение происходит с помощью дополнительных особенностей : текстура кожи, форма рта, ушей, цвета волос, расположение глаз и т.д.

Чтобы отыскать похожего человека, необходимо загружать четкие фотографии, в противном случае поиск будет неудачный. Также стоит сказать о том, что социальные сети защищают информацию о своих пользователях. В большинстве соцсетей встроены функции защиты профиля, позволяющие скрывать фотографии человека.

Программы распознавания лиц

Системы (программы) распознавания лиц по фото и видео используют более продвинутые алгоритмы. Подобных систем нет в открытом доступе , они используются в службах безопасности, для контроля и предотвращения чрезвычайных происшествий в крупных городах и в местах массового скопления людей.

Подобное ПО чаще всего использует алгоритм распознавания Виолы-Джонса. Программа, при помощи данного метода распознает лица даже при повороте на 30 градусов. Метод основывается на признаках Хаара , которые представляют собой набор черно-белых масок различной формы и размера. Происходит наложение масок на изображение и происходит расчет яркостей пикселей путем сложения, после чего рассчитывает разность значений.

Далее система сравнивает результаты с накопленными данными, и определив лицо на изображении продолжает его отслеживать для выбора оптимального ракурса. После этого запускается процесс считывания и ПО находит опорные точки на лице. Далее изображение анализируется с теми данными, которые находятся в базах. Если они совпадают, человек идентифицируется.

FindFace

FindFace – российская программа распознавания лиц, мощное решение, которое позволит распознать лицо на фотографии. FindFace предлагает не только инструменты для обычных пользователей, но и для государственных корпораций и бизнеса. С его помощью можно найти человека, зарегистрированного в Вконтакте.

С 1 сентября общедоступный сервис Финд Фейс останавливает работу, пользоваться некоторое время им смогут только те пользователи, которые приобрели ПРО-аккаунт. Затем авторы полностью откажутся от общедоступной версии в пользу своего коммерческого продукта.

Google Images

Поиск Google.Картинки позволяет найти идентичные фотографии на основе данных поисковых систем, в том числе осуществить поиск человека по лицу. Больше ориентирован на поиск в зарубежных ресурсах :


Яндекс Картинки

Отечественный аналог предыдущего сервиса, который поможет найти человека по фотографии в интернете и произвести поиск по фото в соц.сетях:


Pictriev

Англоязычный сервис, позволяющий пользователям найти похожего человека и распознать лицо по фото онлайн. В первую очередь он ориентирован на сравнение со знаменитостями, поэтому результаты могут быть не совсем корректные:


Иногда бывает так, что у вас есть только фотография человека и больше ничего вы о нем не знаете. Допустим, вам необходимо идентифицировать его, чтобы проверить, действительно ли он был очевидцем событий или работал в определенном месте. в интернете позволит найти человека, если о нем известно хоть что-то. А если у вас есть только фотография? В этом случае на помощь придут сервисы распознавания фотографий и поиска людей. Такие онлайн-инструменты умеют «узнавать», кто изображен на фотографиях. В некоторых случаях сервис прямо ответит на ваш вопрос, с указанием имени и фамилии того, кто на фотографии. Но такой ответ можно получить далеко не всегда. А вот найти похожие снимки или даже точный профайл в социальной сети современные инструменты распознавания вполне способны.

В некоторых случаях распознавание по лицам помогает идентифицировать людей на групповой фотографии, сравнивать два лица.

Некоторые из поисковых систем позволяют найти похожие лица, а некоторые – узнать знаменитостей, изображенных на фото.

Pictriev — это поисковый сервис с функцией распознания лиц, который предоставит вам основную информацию о человеке на фото, путем сканирования лица на фотографии. Кроме того, сервис покажет, кто из знаменитостей похож на человека, изображенного в поисковом запросе.

Здесь, как и в сервисе Google, можно загрузить фото для анализа либо предоставить ссылку на фото, опубликованное в интернете.

Правда, на наших контрольных примерах работа сервиса была странной – сервис не узнал Петру Квитову, а среди похожих на нее знаменитостей назвал еще одну теннисистку Анну Иванович.

В то же время, на другом примере фотографии Анны Иванович теннисистка была узнана сразу же с точностью 52%, что довольно много для этого сервиса.

Betaface http:// betaface. com/ demo. html

Betaface представляет собой профессиональное программное обеспечение для распознавания лиц, ориентированное на медиа-компании, позволяющее им автоматически распознавать лица и находить информацию о них. Чтобы изучить работу этого платного продукта, можно воспользоваться его демо-версией.

Пользователям предлагается загрузить фото на сайт, после чего сервис большой список данных о лице, изображенном на нем. Эти детали включают возраст, расу, выражение лица, наличие бороды и очков, цвет волос и бороды, наличие усов, размер подбородка, цвет и положение глаз, положение, цвет и толщину бровей, длину волос, форму головы, форму и размер рта и носа, зубы и другие более мелкие детали.