ocr
В настоящее время я работаю в проекте на языке python-django. Пользователю необходимо ввести некоторые данные, в настоящее время это делается путем ввода текста. Мне нужен альтернативный метод ввода данных, я предпочитаю конвертер изображений в текст. Кто-нибудь, пожалуйста, помогите мне реализовать метод в d...
Я пытаюсь прочитать некоторые денежные значения с помощью OCR, проблема в том, что я хочу сказать ему, какие символы он должен распознать. Это мой текущий белый список Version : Tesseract from Charles Weld v3.0.2 tessedit_char_whitelist "0123456789,.$" Как включить цент ( ¢ )? Обновление ...
Я использую ImageJ для обработки изображений документов (бизнес-документов) и ищу хорошую библиотеку OCR для извлечения текста из некоторых регионов. В настоящее время я использую Asprise, но результаты не очень надежны. Некоторые символы часто путаются (0 становится O, 8 - > B, % - > 0, ...), то есть...
Я использую Тессеракт и python для считывания цифр (из счетчика энергии). Все работает хорошо, за исключением числа "1". Тессеракт не может прочитать цифру" 1". Это фотография, которую я посылаю тессеракту. : И Тессеракт читает "0000027". Как я могу сказать Тессеракту, что вертикальный стержень - это "1...
У меня есть более 30 000 pdf-файлов. Некоторые файлы уже являются OCR, а некоторые нет. Есть ли способ узнать, какие файлы уже распознаны, а какие PDF - файлы-только изображения? Это займет целую вечность, если я прогоню каждый файл через OCR-процессор....
У меня есть это изображение таблицы (см. ниже). И я пытаюсь получить данные из таблицы, аналогичной этой форме (первая строка изображения таблицы): rows[0] = [x,x, , , , ,x, ,x,x, ,x, ,x, , , , ,x, , , ,x,x,x, ,x, ,x, , , , ] Мне нужно число x, а также количество пробелов. Кроме того, будут и другие табли...
Я пытаюсь реализовать "распознавание цифр OCR" в OpenCV-Python (cv2). Это просто для учебных целей. Я хотел бы изучить функции KNearest и SVM в OpenCV. у меня есть 100 образцов (т. е. изображения) каждой цифры. Я хотел бы тренироваться с ними. есть пример letter_recog.py это поставляется с образцом OpenCV....
Я использую tesseract для преобразования документов в текст. Качество документов колеблется дико, и я ищу советы о том, какая обработка изображений может улучшить результаты. Я заметил, что текст с высокой пикселизацией - например, сгенерированный факсимильными аппаратами - особенно трудно обрабатывать тессер...
У меня есть веб-сайт, который позволяет пользователям загружать изображения автомобилей, и я хотел бы поставить фильтр конфиденциальности для выявления регистрационных знаков на транспортном средстве и стирают их. размытие не является проблемой, но есть ли библиотека или компонент (предпочтительный с открыты...
можно ли ограничить набор символов, которые Тессеракт ищет (например, поиск только для букв a-z)? Это значительно улучшило бы мои результаты....