Android

Сканирование и редактирование графического текста с помощью бесплатного OCR

whatsaper ru Недетские анекдоты про Вовочку

whatsaper ru Недетские анекдоты про Вовочку
Anonim

Технология оптического распознавания символов (OCR) позволяет редактировать текст на графическом изображении или отсканированном документе. Он широко используется для преобразования книг и документов в электронные файлы, для компьютеризации системы учета в офисе или для публикации текста на веб-сайте.

OCR позволяет редактировать текст, искать слово или фразу и применять к ней такие методы, как машинный перевод, преобразование текста в речь и текстовый поиск.

Microsoft Office включает в себя Microsoft Document Imaging OCR, однако существует и ряд других бесплатных альтернатив, которые также выполняют эту работу, включая прикладное программное обеспечение, которое поставляется с вашим сканером или устройством «все-в-одном». По существу, для сканирования и последующего преобразования изображения в текст с помощью OCR вам необходимо выполнить стандартные шаги:

  • Поместить документ на кровать сканера.
  • На компьютере используйте прикладное программное обеспечение сканера и OCR как тип.
  • Выберите выделенную область для сканирования OCR и проверьте предварительный просмотр.
  • Сканирование, а затем сохраните текстовый файл, и вы можете редактировать его в любом текстовом приложении.

Вы также можете установить приложение для выполнения OCR вместо программы по умолчанию для сканера.

FreeOCR может сканировать с большинства сканеров TWAIN и WIA, а также может открывать отсканированные PDF-файлы и многостраничные изображения TIFF. Бесплатное OCR включает в себя скомпилированный Windows Tesseract бесплатный движок OCR, также известный как графический интерфейс Tesseract. FreeOCR является бесплатным, в том числе для коммерческого использования. Для FreeOCR требуется.NET Framework v2.0. FreeOCR v4 скоро будет выпущен.

В Интернете есть несколько бесплатных онлайн-сервисов, которые позволяют вам выполнять OCR на изображении или отсканированном документе в вашем браузере.

  • NewOCR.com - бесплатная онлайн-служба OCR. NewOCR.com анализирует текст в любом загружаемом файле изображения, а затем преобразует текст из изображения в текст. Услуга предоставляет неограниченные загрузки и компоновку (многоколоночное распознавание текста). Дружественный сервис не требует регистрации и поддерживает 29 языков, хотя сайт довольно простой и дилетантский. Служба принимает любые JPEG, PNG, GIF, BMP и многостраничные TIFF до 5 МБ, а также многостраничные документы PDF до 20 МБ.
  • Free-OCR.com - еще один бесплатный онлайн-инструмент OCR. Вы можете загружать свои файлы изображений (JPG, GIF, TIFF BMP или PDF) не более 2 МБ, не более или более 5000 пикселей, и есть ограничение на 10 загрузок изображений в час. Free-OCR может обрабатывать изображения с многоколоночным текстом, а также поддерживает 29 языков. Одно нечетное ограничение состоит в том, что при выполнении OCR требуется только первая страница PDF-документа.
  • Бесплатная онлайн-служба OCR позволяет распознавать текст и символы из PDF-документов (включая многостраничные файлы), фотографии и снимки с цифровой камерой. Он позволяет пользователям выбирать 32 языка для распознавания многоязычных документов и преобразовывать их непосредственно в несколько форматов, таких как PDF, DOC, XLS, RTF, HTML и TXT. Вы можете хранить файлы OCRed онлайн в безопасном рабочем пространстве или загружать их на свой компьютер.

Я уверен, что этот список не является исчерпывающим. Почему бы вам не добавить больше таких сервисов и приложений, как комментарии к этому сообщению, если вы знаете больше?