tesseract

Я следую Этому учебнику для компиляции этой вилки Tesseract (пакета оптического распознавания символов) для Android. Я нахожусь на том этапе, когда я использую Cygwin для создания NDK для проекта Tesseract Android. Я получаю следующую ошибку при вызове ndk-build (из каталога tess-two): c:/android-ndk-r...

Я пытаюсь запустить программу на C++, которая основана на Tesseract API, и я использую QtCreator в качестве IDE на Ubuntu, чтобы выполнить анализ макета страницы: int main(void) { int left, top, right, bottom; tesseract::TessBaseAPI tessApi; tessApi.InitForAnalysePage(); cv::Mat img = cv::imread("document...

Я сканирую изображение с помощью библиотеки tesseract. Я получаю вывод из библиотеки в виде строки . Действительно ли можно получить позицию x и y вместе с текстом ?...

Im работает в динамическом веб-проекте в eclipse, Я создал класс TesseractOCR, который содержит: public class TesseractOCR { public TesseractOCR() { } public String doOCR(String file) { System.setProperty("jna.library.path", "32".equals(System.getProperty("sun.arch.data.model"...

Я пытаюсь прочитать некоторые денежные значения с помощью OCR, проблема в том, что я хочу сказать ему, какие символы он должен распознать. Это мой текущий белый список Version : Tesseract from Charles Weld v3.0.2 tessedit_char_whitelist "0123456789,.$" Как включить цент ( ¢ )? Обновление ...

Я использую Тессеракт и python для считывания цифр (из счетчика энергии). Все работает хорошо, за исключением числа "1". Тессеракт не может прочитать цифру" 1". Это фотография, которую я посылаю тессеракту. : И Тессеракт читает "0000027". Как я могу сказать Тессеракту, что вертикальный стержень - это "1...

У меня уже есть последние сборки для лептоники и Тессеракта tesseract 4.00.00alpha-365-gcf0b378 leptonica-1.74.1 libjpeg 8d (libjpeg-turbo 1.3.0) : libpng 1.2.50 : libtiff 4.0.3 : zlib 1.2.8 Я также установил все зависимости, такие как python-dev Это ошибка, которую я получаю, когда делаю pip ...

Я новичок в Тессеракте, и я делаю проект класса, в котором мне нужно сканировать матрицы чисел. Мне удалось прочитать цифры из файла изображения, но я еще не нашел, как распознать расстояние между цифрами. Например, в настоящее время я получаю 14610 за 1 4 6 10. Изображение: Код, который я сейчас использ...

Я использую tesseract для преобразования документов в текст. Качество документов колеблется дико, и я ищу советы о том, какая обработка изображений может улучшить результаты. Я заметил, что текст с высокой пикселизацией - например, сгенерированный факсимильными аппаратами - особенно трудно обрабатывать тессер...

можно ли ограничить набор символов, которые Тессеракт ищет (например, поиск только для букв a-z)? Это значительно улучшило бы мои результаты....