c# - tesseract получить распознавание пространства в цифрах


Я новичок в Тессеракте, и я делаю проект класса, в котором мне нужно сканировать матрицы чисел. Мне удалось прочитать цифры из файла изображения, но я еще не нашел, как распознать расстояние между цифрами. Например, в настоящее время я получаю 14610 за 1 4 6 10.

Изображение:

Введите описание изображения здесь

Код, который я сейчас использую:

Bitmap myBmp = new Bitmap(file);
var image = myBmp;
var ocr = new Tesseract();
ocr.SetVariable("tessedit_char_whitelist", "0123456789"); // If digit only 

ocr.Init(@"C:UsersMuhammadShahrozDocumentsVisual Studio 2013ProjectsConsoleApplication3tessdata", "eng", false);
var results = ocr.DoOCR( image, Rectangle.Empty);

foreach (Word word in results)
{
    Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
    mystring = String.Format("{0 } ",word.Text);
}
1 8

1 ответ:

Я думаю, что вам нужно будет установить переменную preserve_interword_spaces=1 (см. doc)