OCRopus

OCRopus
OCRopus
Тип	Оптическое распознавание символов
Разработчики	Thomas Breuel, DFKI
Написана на	C++ и Python
Операционные системы	FreeBSD, Linux, macOS и Windows 10
Первый выпуск	9 апреля 2007
Последняя версия	1.3.3 (16 декабря 2017)[…];
Репозиторий	github.com/tmbdev/ocropy; github.com/ocropus/ocrop…
Создаваемые форматы файлов:
Создаваемые форматы файлов:
	HOCR
Лицензия	Apache License v2.0
Сайт	github.com/tmbdev… (англ.); github.com/ocropu… (англ.)
	Медиафайлы на Викискладе

OCRopus — OCR-система для распознавания текстов на базе tesseract. Использует код для языка моделирования из проекта OpenFST, поддерживаемого Google. Доступна FreeBSD, Linux, Mac OS X.

Использование

В настоящее время OCRopus использует только интерфейс командной строки, принимая на вход изображения с текстом, и выводя данные в формате hOCR (открытый формат на основе HTML). Опции командной строки позволяют выполнять отдельно конкретные операции (например, распознание одной строки).

История развития

0.1.0 alpha — 22 октября 2007
0.1.1 alpha – 14 декабря 2007 - Улучшенная система сборки
0.2 alpha 2 — 31 мая 2008
0.3 alpha 3 – 16 октябрь 2008
pre-0.4 alpha 4 – май 2009
0.4.3 – июль 2009
0.4.4 – март 2010
0.5 – июнь 2012
0.6 23 – август 2012
0.7 6 – апрель 2013
1.0 - ноябрь 2014

См. также

Примечания

↑ Release 1.3.3 — 2017.
↑ Release 1.3.3 — 2017.

Ссылки

OCRopus (официальная страница на Google Code)
IUPR Publication Server (описание алгоритмов, используемых в OCRopus)
OpenFST Официальный сайт

[_0b49127b74f428fa-1] Release 1.3.3 — 2017.

[_969acff3223e4d7d-2] Release 1.3.3 — 2017.

[1]

[2]