Всем нам рано или поздно приходится сталкиваться с необходимостью распознать текст изображения. Причины для этого разные: нужно скачать конспект, перевести написанный вами от руки текст в электронный формат, перевести напечатанную книгу в формат PDF. В этом вам помогут онлайн-ресурсы для распознавания текста.
Сайты, на которых можно распознать текст онлайн
На большинстве сайтов бесплатно можно распознать только некоторое количество страниц, а за полноценное пользование придётся заплатить (например, FineReader Online поддерживает многие форматы, 10 страниц без регистрации, после регистрации вам добавляются 5 бесплатных страниц в месяц). Такие сервисы обычно обладают высокой точностью и прекрасно подойдут вам, если вам нужно разово распознать несколько страниц.
Если вам приходится часто распознавать текст, советуем воспользоваться сервисами из нашего списка:
- Online OCR – воспользоваться им можно без регистрации, но она потребуется, если вы хотите загружать на распознавание сразу несколько файлов.
- OCR Convert – позволяет загружать одновременно пять документов объемом не более 5 МБ. Поддерживает форматы PDF, GIF, BMP и JPEG. Сохраняет в виде ссылки, которую нужно вставить в документ. Регистрация не требуется.
- Free Online OCR (http://www.newocr.com/) – поддерживает много языков, позволяет распознавать сразу несколько файлов. Напрямую JPEG в нём распознать нельзя, понадобится вставить картинку в документ Microsoft Word.
- OnlineOcr – распознаёт 15 страниц в час, приходится каждый раз вводить капчу. Распознаёт текст с файлов в формате PEG, BMP, TIFF и GIF.
- FreeOcr – одна страница за раз, не более 10 документов в час (размер файла – не более 5000 пикселей и не более 2 МБ). Придётся каждый раз вводить капчу. Поддерживает форматы: PDF, JPG, GIF, TIFF или BMP.
По запросу “OCR free” (Optical Character Recognition – Оптическое распознавание символов) можно найти бесплатные приложения в Google.play.
Как скопировать текст с сайта, который защищен?
Стоит сказать, что сайты защищены не просто так – это означает, что администратор сайта, предположительно, владелец статей, выложенных на ресурсе, против того, чтобы их труд копировали.
Лучше спросить разрешения у администратора сайта. В конце концов, напечатать что-то своё, используя информацию, можно вручную, а полностью скопированный текст мало где может вам пригодиться, так как не пройдёт проверку антиплагиатом.
Но если вам срочно понадобилось распознать текст, это делается так:
- Вы делаете скрин страницы.
- Сохраняете его (если ваш компьютер поддерживает такую функцию – то напрямую, иначе – вставив его, скажем, в Paint) в формате JPEG (не в PNG: многие распознавалки не поддерживают его).
- Загружаете в любую распознавалку.
- Получаете готовый текст.
Качество извлечения текста с изображений
Во всех нормальных программах не должно возникнуть никаких проблем с распознанием печатного текста, если скриншот нормального качества. Текст должен быть распознан точь-в-точь. Если речь идёт о фотографии рукописного текста, могут возникнуть сложности – всё зависит от почерка.
Хорошие утилиты (как правило, они платные), как Adobe Reader, могут довольно точно распознать страницу, написанную разборчивым почерком, однако вычитывать и корректировать текст всё равно придётся. Если же почерк неразборчивый, программе будет очень сложно распознать написанное.
По сути, распознавать придётся вам, но с помощью сервиса. Помощь программы нужна для того, чтобы подсказать, на что похоже слово, которое вы совсем не можете прочесть. Возможно, программа увидит несколько букв (в редких случаях – всё слово сразу), что подтолкнёт вас в верном направлении.
Простая альтернатива
Не хотите заморачиваться с распознаванием текста и поиском подходящих для этого ресурсов? Вставьте скриншот нужной вам статьи в Word. Если вы не пытаетесь выдать написанную информацию за свою, это будет хорошим вариантом: и текст читается, и долго возиться с этим не нужно.
Бесплатные онлайн-ресурсы, описанные в нашей статье, помогут вам успешно распознавать тексты. Преобразовать изображение в текст не станет сложной задачей, если воспользоваться приведенными выше советами.