c# - tesseract получить распознавание пространства в цифрах
Я новичок в Тессеракте, и я делаю проект класса, в котором мне нужно сканировать матрицы чисел. Мне удалось прочитать цифры из файла изображения, но я еще не нашел, как распознать расстояние между цифрами. Например, в настоящее время я получаю 14610 за 1 4 6 10.
Изображение:
Код, который я сейчас использую:
Bitmap myBmp = new Bitmap(file);
var image = myBmp;
var ocr = new Tesseract();
ocr.SetVariable("tessedit_char_whitelist", "0123456789"); // If digit only
ocr.Init(@"C:UsersMuhammadShahrozDocumentsVisual Studio 2013ProjectsConsoleApplication3tessdata", "eng", false);
var results = ocr.DoOCR( image, Rectangle.Empty);
foreach (Word word in results)
{
Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
mystring = String.Format("{0 } ",word.Text);
}
1 ответ:
Я думаю, что вам нужно будет установить переменную
preserve_interword_spaces=1
(см. doc)