- Распознавание текста онлайн — ТОП-9 сервисов
- Как пользоваться
- Abbyy Finereader
- Как пользоваться
- Распознавание текста онлайн без регистрации
- Online OCR
- Как пользоваться
- Free Online OCR
- Как пользоваться
- OCR Convert
- Как пользоваться
- Free OCR
- Как пользоваться
- I2OCR
- Как пользоваться
- Яндекс OCR
- Convertio
- Как пользоваться
- Заключение
- Распознавание текста онлайн — ТОП-9 сервисов: 5 комментариев
- Сервисы для распознавания текста — подборка лучших
- Finereaderonline.com
- Sodapdf.com
- WinScan2PDF
- Free Online OCR
- Microsoft OneNote
- Readiris
- Img2txt.com
- OCR CuneiForm
- TextGrabber 6
- Лучшие программы для распознавания текста
- Обзор программ
- CuneiForm
- F reemore OCR
- FreeOCR
- Видео: распознаем текст с картинки
- SimpleOCR
- RiDoc
- img2txt
- SunnyPage
- Программа для сканирования и распознавания текста Abbyy Finereader
- Capture2Text
- Google Документы
- Видео
Распознавание текста онлайн — ТОП-9 сервисов
Распознавание текста с картинки, OCR (optical character recognition), то есть превращение картинки в текст доступно бесплатно на многих сайтах в режиме онлайн. Но везде свое качество и свои ограничения на количество распознаваемых картинок.
Я проверила с десяток онлайн-сервисов и составила рейтинг лучших.
Для примера распознавала фотографию документа, который есть у каждого – свидетельство ИНН физического лица (разрешением 1275×1750 пикселей).
Сервис | Нужна регистрация | Рейтинг | Адрес |
---|---|---|---|
да | 3 | https://drive.google.com/drive | |
Abbyy Finereader | да | 5 | https://finereaderonline.com/ru-ru |
Online OCR2 | — | 5 | http://www.onlineocr.net |
Free Online OCR | — | 2 | https://www.newocr.com |
OCR Convert | — | 4 | http://www.ocrconvert.com |
Free OCR | — | 1 | www.free-ocr.com |
I2OCR | — | 4 | http://www.i2ocr.com |
Яндекс ОCR | Распознает и переводит. | 5 | https://translate.yandex.ru/ocr |
Convertio | Работает своеобразно | 3 | https://convertio.co/ru/ocr/ |
В Google можно распознавать неограниченное количество картинок, лишь бы они поместились на Google Drive. Нужно просто открыть картинку с Google диска с помощью Google Документов, и она автоматически распознается.
Качество исходника рекоменовано не меньше 10 пикселей по высоте для строки.
Как пользоваться
Abbyy Finereader
В Abbyy Finereader Online самый удобный интерфейс, хорошее качество, но доступна только ознакомительная версия – можно распознать не более 10 страниц за две недели. (200 страниц в месяц стоят 299р). Для использования сервиса нужно зарегистрироваться (можно войти через аккаунты социальных сетей). Кроме того, полученный текст можно там же перевести на другой язык с помощью машинного перевода.
Входные форматы | PDF, TIF, JPEG, BMP, PCX, PNG |
Выходные форматы | Word, Excel, Power Point, Open Document, RTF, Adobe PDF, Text Plain, Fb2, Epub |
Размер файла | До 100Мб |
Ограничения | 10 картинок на две недели |
Качество | Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Online OCR – какие-то части документа лучше распознались тем сервисом, а какие-то – этим. |
Результат распознавания Finereader. (ФИО и город распознаны, но стерты вручную)
Как пользоваться
Распознавание текста онлайн без регистрации
Online OCR
Online OCR http://www.onlineocr.net/ – единственный наряду с Abbyy Finereader сервис, который позволяет сохранять в выходном формате картинки вместе с текстом. Вот как выглядит распознанный вариант с выходным форматом Word:
Результат распознавания в Online OCR (ФИО и дата распознаны, но стерты вручную)
Входные форматы | PDF, TIF, JPEG, BMP, PCX, PNG, GIF |
Выходные форматы | Word, Excel, Adobe PDF, Text Plain |
Размер файла | До 5Мб без регистрации и до 100Мб с ней |
Ограничения | Распознает не более 15 картинок в час без регистрации |
Качество | Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Abbyy Finereader – какие-то части документа лучше распознались тем сервисом, а какие-то – этим. |
Как пользоваться
Внизу появится ссылка на выходной файл (текст с картинками) и окно с текстовым содержимым
Free Online OCR
Free Online OCR https://www.newocr.com/ позволяет выделить часть изображения. Выдает результат в текстовом формате (картинки не сохраняются).
Входные форматы | PDF, DjVu JPEG, PNG, GIF, BMP, TIFF |
Выходные форматы | Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок). |
Размер файла | До 5Мб без регистрации и до 100Мб с ней |
Ограничения | Ограничения на количество нет |
Качество | Качество распознавания свидетельства инн плохое. |
Можно распознавать как все целиком, так и выделить часть изображения для распознавания.
Как пользоваться
OCR Convert
OCR Convert http://www.ocrconvert.com/ txt
Входные форматы | Многостраничные PDF, JPG, PNG, BMP, GIF, TIFF |
Выходные форматы | Text Plain |
Размер файла | До 5Мб общий размер файлов за один раз. |
Ограничения | Одновременно до 5 файлов. Сколько угодно раз. |
Качество | Качество распознавания свидетельства инн среднее. (ФИО распознано частично). Лучше, чем Google, хуже, чем Finereader |
Как пользоваться
Free OCR
Free OCR www.free-ocr.com распознал документ хуже всех.
Входные форматы | PDF, JPG, PNG, BMP, GIF, TIFF |
Выходные форматы | Text Plain |
Размер файла | До 6Мб |
Ограничения | У PDF-файла распознается только первая страница |
Качество | Качество распознавания свидетельства инн низкое – правильно распознано только три слова. |
Как пользоваться
I2OCR
I2OCR http://www.i2ocr.com/ неплохой сервис со средним качеством выходного файла. Отличается приятным дизайном, отсутствием ограничений на количество распознаваемых картинок. Но временами зависает.
Входные форматы | JPG, PNG, BMP, TIF, PBM, PGM, PPM |
Выходные форматы | Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок). |
Размер файла | До 10Мб |
Ограничения | нет |
Качество | Качество распознавания свидетельства инн среднее – сравнимо с OCR Convert. Замечено, что сервис временами не работает. |
Как пользоваться
Яндекс OCR
Недавно обнаружила этот сервис, и он мне очень понравился качеством и простотой использования. Вообще то он предназначен для перевода загруженной картинки, но его можно использоваться и для распознавания текста с картинки. Регистрации не требует, ограничений на количество изображений нет. В данный момент находится в стадии бета-тестирования.
Просто перейдите на https://translate.yandex.ru/ocr, загрузите картинку (можно перетащить) и щелкните “Открыть в Переводчике”. Откроется как текст с картинки, так и перевод в правом поле.
Перетащите картинку
Результат распознавания
Convertio
Convertio hhttps://convertio.co/ru/ocr/ работает своеобразно, поэтому сравнивать его тяжело. В целом не понравился. Свидетельство ИНН, загруженное целиком, он не распознал совсем, так как плохо выделяет текст среди картинок. Не распозналось ни одного слова! Для его проверки я вырезала текстовый кусочек из ИНН и распознала его – это удалось сделать.
К тому же временами он зависает в попытках что-либо распознать.
Замечено, что при распознавании сервис временами зависает, возможно ваши картинки ставятся в большую очередь на бесплатном тарифе.
Как пользоваться
Вырезанный и распознанный кусок (целиком не распознается):
Результат работы Convertio
Заключение
Лучше всего документ распознал Abbyy Finereader и Online OCR. Кроме того, эти сервисы сохраняют форматирование файла: где нет текста, оставляют картинки и компонуют их с распознанным текстом. Из новых сервисов хорош Яндекс OCR.
Хуже всего сработал Free OCR – он распознал всего три слова.
Распознавание текста онлайн — ТОП-9 сервисов: 5 комментариев
СПАСИБО! И меня очень выручили… по поиску в яндексе мои попытки тоже были безуспешные, а статья помогла и выбрала отличный ресурс, который преобразовал все 30 страниц) к слову, нужно было очень быстро и срочно!)))
если есть такая возможность то напишите пожалуйста
есть страничка
на ней картинки с текстом
конкретно адреса электронной почты
https://www.math.fsu.edu/People/faculty.php
вопрос можно ли вытащить каким то средствами текст этих адресов
согласен что это не хорошо но увы нужно
сделайте скриншот, да распознайте картинку. Правда, качество там не очень
спасибо admin за относительно свежую статью и рейтинг про
«OCR сервис онлайн»
мне для научной статьи на англ. только изображения бесплатно нашлись. pdf/doc нет.
Здравствуйте, предлагаю протестировать сервис распознавания текста https://onlineocr.org/ru и по возможности добавить в свой список https://itlang.ru/raspoznavanie-teksta-onlajn/
1. Сервис распознает текст на изображениях лучше, чем 80% других аналогичных сервисов.
2. Абсолютно бесплатный сервис, неограниченное количество распознаваний текста.
Надеюсь, ваши посетители останутся довольны качеством распознавания текста в дальнейшем.
Сервисы для распознавания текста — подборка лучших
Заказчик прислал сканы рабочих документов, в университете скинули фотку конспекта? Когда-то тексты умели распознавать только сканеры и то далеко не все. Сейчас же даже приложения на смартфоне могут перевести визуальный текст в редактируемый документ. А в этом материале ищем лучшие сервисы по распознаванию текста для вашего компьютера и смартфона тоже.
Finereaderonline.com
Компания ABBYY идет в плане распознавания текстов и обработки цифровых документов впереди всех. В арсенале их софта даже цифровые подписи, которые почти невозможно отличить от настоящих. Finereaderonline поддерживает почти 200 языков, работает быстро и онлайн — ничего не надо устанавливать. Можно выбрать разные форматы для сохранения текста, обработка текста происходит очень быстро и достаточно точно. Единственный нюанс — лимит на загрузку файлов до 100 Мб. Но никто не запрещает вам загрузить несколько документов подряд. Сервис работает полностью онлайн, русифицирован и интуитивно понятен в управлении.
Sodapdf.com
Еще один неплохой сервис, хотя тут нам предлагают скачать прогу отдельно. Правда, чуть менее обученный, чем софт от ABYYY — Sodapdf знает только 46 языков. Впрочем, если вам не нужно переводить с ацтекского или зулу, то проблем не возникнет. Программа условно бесплатная — есть триальная версия, полный функционал стоит от 7 до 17 евро в месяц в зависимости от пакета. Soda умеет конвертировать разные форматы, распознавать тексты, ставить электронные подписи и имеет большой набор инструментов для работы с PDF файлами и изображениями.
WinScan2PDF
Элементарная, простая маленькая утилита, которая состоит из трех кнопок: «выбрать источник», «сканировать» и подтвердить или отменить операцию. Поддерживает 23 языка, работает с многостраничными файлами и сохраняет обработанный файл в формате PDF. У этой программы есть одна особенность — она не работает с готовыми файлами и считывает документы только с подключенного сканера.
Free Online OCR
Не такой симпатичный, как Finereader, но тоже вполне умелый онлайн-сервис. Англоязычный, слегка устаревший интерфейс, в котором, впрочем, несложно разобраться. Free Online OCR поддерживает 106 языков и распознает текст с большинства самых популярных форматов файлов: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu. Сохранять готовые доки может не только в PDF, но и в стандарных doc и txt. Кроме текста, может распознать математические уравнения, правильно форматировать текст в колонках и столбцах или обработать только выделенный фрагмент. Качество распознавания довольно высокое даже c картинок низкого качества.
Microsoft OneNote
Распознавание текста здесь скорее дополнительная фича, а не основная задача. Вы можете вставить картинку в текущую запись OneNote и правой кнопкой мыши выбрать «Копировать текст из рисунка». Цифровая записная книжка от Microsoft однозначно не подойдет для обработки больших файлов, документов и постоянной работы с файлами. Но может помочь в мелких повседневных задачах — перевести небольшой текст с картинки, скриншота, рекламного макета, чтобы не вводить вручную. Качество распознавания у OneNote не очень высокое, а добавлять в файл многостраничные документы неудобно. Но OneNote и не для этого все-таки.
Readiris
Мощный и удобный конкурент ABBYY FineReader. Быстро и очень чисто распознает даже едва различимые тексты, при этом поддерживает 137 языков, включая русский. Работает очень быстро и легко обрабатывает даже большие объемы текста. Сохраняет исходное форматирование, не игнорируя кавычки, размеры шрифта и стиль написания. Может почистить текст от помарок и предложить исправления в словах. Знает символы, уравнения. Контактирует со сканерами, облачными сервисами, поддерживает кучу форматов. В общем, полноценный и удобный сервис, который не умеет разве что редактировать итоговый файл PDF. Правда, за полный инструментарий придется платить, но есть бесплатная триальная версия.
Img2txt.com
Приятный дизайн, понятный интерфейс и высокая скорость обработки текста — что еще нужно для работы? Продвинутые алгоритмы распознавания помогают считывать документы даже плохого качества. Молниеносно конвертирует большие объемы текста, но при желании можно выбрать отдельную область файла для работы. Есть интеграция с Google Documents, хороший инструментарий для работы с документами PDF. Маловато языков — всего 35, но для основных задач этого может вполне хватить.
OCR CuneiForm
Шустро и тщательно распознает сфотографированные или отсканированные тексты, графические файлы. Старается сохранить исходную структуру текста, элементов и шрифты. Переводит все в редактируемые форматы на выбор. В общем, стандартный набор функционала. И, что самое главное, полностью бесплатный.
TextGrabber 6
Полностью бесплатное приложение для смартфонов за авторством компании ABBYY. Собственно, этим все сказано — в TextGrabber 6 все хорошо с распознаванием текста, есть встроенный модуль переводчика. Программа работает с помощью камеры и на распознавание, и на перевод. Поддерживает кучу языков, работает быстро и выглядит приятно.
Лучшие программы для распознавания текста
Необходимость работы с текстом, представленным в виде графических файлов, появляется довольно часто. Будь то картинка, отсканированный документ или фотокопия, ручной набор информации, представленной в них, может занять довольно продолжительное время.
Чтобы избавиться от ненужной работы и сохранить свое время, и было создано большое количество программ, способных распознать текст и преобразовать его в более удобный формат, готовый для редактирования и копирования.
Обзор программ
Программ для этой цели существует большое количество. Для начала работы с ними достаточно иметь изображение или отсканированный документ, который нужно перевести в текст. Большинство из них похожи своими функциями, но в то же время обладают и уникальными инструментами, подходящими для конкретных целей. Как не потеряться в их разнообразии, и на какие из них стоит обратить свое внимание? Это мы рассмотрим далее.
CuneiForm
Первой и программ, на которой мы остановимся, является CuneiForm. Это свободно распространяемый софт от компании Cognitive Technologies. Его основное предназначение – оптическое распознавание текстов, представленных в виде электронных копий или картинок. Он быстро переводит графический файл в текст, с которым можно работать в любом офисном приложении.
Основные особенности программы:
F reemore OCR
Подобной по своим функциям является и Freemore OCR. Это простая и находящаяся в свободном доступе программа, с помощью которой можно извлечь текст из изображений в разных форматах и PDF документов. После завершения сканирования полученный результат можно сохранить в файле, который открывается блокнотом или Word.
Freemore OCR – это:
Обратите внимание! Работа подобных приложений с документами в формате PDF может занимать больше времени, чем с обычным графическим файлом, что объясняется большим объемом исходного материала.
FreeOCR
FreeOCR – еще одно удобное приложение для оптического распознавания текста. Обладает интуитивно понятным интерфейсом и содержит набор всех необходимых для этого инструментов. Стоит заметить, что меню программы на английском языке, но благодаря необычному подходу к его дизайну, оно понятно каждому пользователю. Утилита поддерживает работу с множеством изображений в разных форматах и PDF-файлами.
Особенности FreeOCR:
Важно! Для установки FreeOCR необходимо подключение к сети Интернет. После запуска программа в автоматическом режиме обновит свою базу данных и скачает недостающие словари из онлайн-хранилища. Во время работы, при обнаружении незнакомых символов или языка, FreeOCR также может предложить обновление.
Видео: распознаем текст с картинки
SimpleOCR
SimpleOCR – аналогичная программа для распознавания текста после сканирования. Она отлично подходит для работы с иностранными языками, так как обладает большим и постоянно совершенствующимся словарем. Помимо стандартного набора функций, обладает возможностью поиска слова или сочетания в полученном тексте и расширенными опциями форматирования. Хорошо подходит для обработки объемных текстов.
Отличительные черты SimpleOCR:
RiDoc
RiDoc – приложение, основной функцией которого является работа с отсканированными копиями документов и их конвертации в обычный текст. В нем все готово для сканирования – достаточно подключить принтер и начать работу, после чего программа начнет обработку выбранных файлов.
Кроме этого, оно позволяет уменьшить размер документа без потери качества исходного материала. Функции RiDoc:
img2txt
img2txt – стандартное приложение, преобразующее различные виды графических файлов в текстовый материал. Программа поддерживает большинство известных форматов, легка в использовании и находится в свободном доступе.
Основные функции и особенности:
Обратите внимание! img2txt, как и другие подобные приложения, имеет свою онлайн-версию, на разработке и улучшении которой сейчас сосредоточили свое внимание ее создатели.
SunnyPage
SunnyPage – удобная утилита, позволяющая загружать и конвертировать различные виды изображений, будь то отсканированная копия документа, картинка или же фото в хорошем качестве. Поддерживает она и работу с PDF-документами. В состав программы входит обширный словарь и функция автоматического распознавания языка.
Помимо этого, SunnyPage:
Программа для сканирования и распознавания текста Abbyy Finereader
ABBYY FineReader – заслуженно лучшая в своем роде программа для распознавания текста. Ее популярность обусловлена наличием всех необходимых функций, которые пользователь ищет в подобных приложениях. Она полностью совместима с Microsoft Office, что позволяет начать работу с документом сразу поле окончания процесса конвертации.
Что может ABBYY FineReader?
Capture2Text
Capture2Text – портативное приложение, обладающее большим набором функций для работы с документами. Его отличительной особенностью является возможность создания снимка экрана или его части и сохранение в виде изображения. После этого можно приступать к работе, перенося полученную информацию в документ традиционных форматов.
Capture2Text не требует установки и может запускаться с флеш-накопителя. Это делает ее применимой во многих сферах и просто незаменимой для тех, кому всегда необходимо иметь под рукой простой и мощный конвертер.
Capture2Text обладает множеством интересных функций:
Google Документы
Помимо всех вышеперечисленных утилит, функция оптического распознавания текстовых фрагментов присутствует в Google Документах. Данный сервис поддерживает работу как с файлами в форматах JPG, PNG и GIF, так и многостраничными PDF –документами. Исходниками могут служить изображения, полученные с помощью сканеров, а также обычные фотографии.
Стоит заметить, что при использовании данного сервиса, в результате не всегда сохраняется оригинальное форматирование. Некоторые структуры, как, например, списки, колонки и сноски, могут быть утеряны.
На это в значительной степени влияет качество загружаемого графического файла. Полученные документы могут быть сохранены на сервисе Google Диск, затем скачаны на компьютер или отосланы на электронную почту.
Каждая из рассмотренных программ обладает достаточным инструментарием для выполнения своего первоначального предназначения – конвертации файлов различных форматов в текстовые документы. Однако они отличаются своим набором дополнительных функций, интерфейсом и поддерживаемыми языками. Для работы стоит выбрать то приложение (или несколько), которое отвечает вашим нуждам и способно наиболее точно справиться с поставленной задачей.
Видео
Распознавание текста. Перевести картинку и пдф в ворд. Лучшие методыСкачать
Распознавание текста с изображения на Python | EasyOCR vs Tesseract | Компьютерное зрениеСкачать
Учим программу распознавать текст на картинках, видео, играх ▲ Python + OpenCV + TesseractСкачать
Распознавание ТекстаСкачать