Форум программистов, компьютерный форум, киберфорум
C# Windows Forms
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.54/13: Рейтинг темы: голосов - 13, средняя оценка - 4.54
5 / 5 / 1
Регистрация: 29.03.2018
Сообщений: 19

Emgu и Tesseract. Не распознается небольшое количество символов

29.03.2018, 15:14. Показов 2893. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день ! помогите с кодом разобраться...
с вебкамеры получаю картинку и пытаюсь ее распознать. и проблема в том, что 3 и больше цифр распознает без проблем.
но если меньше 3-х символов то уже текст не видит

C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using System.IO;
using Emgu.CV;
using Emgu.CV.CvEnum;
using Emgu.CV.OCR;
using Emgu.CV.Structure;
using Emgu.CV.Text;
using Emgu.CV.Util;
 
 
namespace CasinoCam
{
    public partial class OCRForm : Form
    {
        Tesseract _ocr;
        Mat img_mat;
        public VideoCapture capture;
        public Image img;
 
        public OCRForm()
        {
            InitializeComponent();
            // InitOcr("", "eng", OcrEngineMode.TesseractLstmCombined);
            InitOcr("", "letsgodigital", OcrEngineMode.TesseractLstmCombined);
            //ocrOptionsComboBox.SelectedIndex = 0;
            _ocr.SetVariable("tessedit_char_whitelist", "0123456789");
           // _ocr.PageSegMode = PageSegMode.SingleChar;
 
 
            Mat img_mat = new Mat(800, 800, DepthType.Cv8U, 3); //Create a 3 channel image of 800x800
           // Mat img_mat = new Mat(200, 400, DepthType.Cv8U, 3); //Create a 3 channel image of 400x200
            img_mat.SetTo(new Bgr(255, 0, 0).MCvScalar); // set it to Blue color
 
            Run();
        }
 
        private void OCRForm_Load(object sender, EventArgs e)
        {
 
        }
 
        private void Run()
        {
            capture = new VideoCapture();
            capture.FlipHorizontal = false;
            
            Application.Idle += ProcessFrame;
        }
 
        private void ProcessFrame(object sender, EventArgs e)
        {
 
            pictureBox1.Image = capture.QueryFrame().Bitmap;
            img_mat = capture.QueryFrame();
        }
 
        private void btnCapture_Click(object sender, EventArgs e)
        {
            OcrImage(img_mat);
        }
 
 
        private static void TesseractDownloadLangFile(String folder, String lang)
        {
            //String subfolderName = "tessdata";
            //lang = "rus";
            String folderName = @"d:/4d/eng";
            if (!System.IO.Directory.Exists(folderName))
            {
                System.IO.Directory.CreateDirectory(folderName);
            }
            String dest = System.IO.Path.Combine(folderName, String.Format("{0}.traineddata", lang));
            if (!System.IO.File.Exists(dest))
                using (System.Net.WebClient webclient = new System.Net.WebClient())
                {
                    String source =
                        String.Format("https://github.com/tesseract-ocr/tessdata/blob/4592b8d453889181e01982d22328b5846765eaad/{0}.traineddata?raw=true", lang);
 
                    Console.WriteLine(String.Format("Downloading file from '{0}' to '{1}'", source, dest));
                    webclient.DownloadFile(source, dest);
                    Console.WriteLine(String.Format("Download completed"));
                }
        }
 
        private void InitOcr(String path, String lang, OcrEngineMode mode)
        {
            try
            {
                if (_ocr != null)
                {
                    _ocr.Dispose();
                    _ocr = null;
                }
 
                if (String.IsNullOrEmpty(path))
                    path = ".";
                lang = "eng";
                TesseractDownloadLangFile(path, lang);
                TesseractDownloadLangFile(path, "osd"); //script orientation detection
                String pathFinal = @"d:/4d/eng";
 
                _ocr = new Tesseract(pathFinal, lang, mode);
 
              //  languageNameLabel.Text = String.Format("{0} : {1}", lang, mode.ToString());
            }
            catch (Exception e)
            {
                _ocr = null;
                MessageBox.Show(e.Message, "Failed to initialize tesseract OCR engine", MessageBoxButtons.OK);
              //  languageNameLabel.Text = "Failed to initialize tesseract OCR engine";
            }
        }
 
 
        private enum OCRMode
        {
            /// <summary>
            /// Perform a full page OCR
            /// </summary>
            FullPage,
 
            /// <summary>
            /// Detect the text region before applying OCR.
            /// </summary>
            TextDetection
        }
 
        private OCRMode Mode
        {
            get { return 0 == 0 ? OCRMode.TextDetection : OCRMode.TextDetection; }
        }
 
        private static Rectangle ScaleRectangle(Rectangle r, double scale)
        {
            double centerX = r.Location.X + r.Width / 2.0;
            double centerY = r.Location.Y + r.Height / 2.0;
            double newWidth = Math.Round(r.Width * scale);
            double newHeight = Math.Round(r.Height * scale);
            return new Rectangle((int)Math.Round(centerX - newWidth / 2.0), (int)Math.Round(centerY - newHeight / 2.0),
               (int)newWidth, (int)newHeight);
        }
 
        private static String OcrImage(Tesseract ocr, Mat image, OCRMode mode, Mat imageColor)
        {
            Bgr drawCharColor = new Bgr(Color.Red);
 
            if (image.NumberOfChannels == 1)
                CvInvoke.CvtColor(image, imageColor, ColorConversion.Gray2Bgr);
            else
                image.CopyTo(imageColor);
 
            if (mode == OCRMode.FullPage)
            {
                ocr.SetImage(imageColor);
 
                if (ocr.Recognize() != 0)
                    throw new Exception("Failed to recognizer image");
                Tesseract.Character[] characters = ocr.GetCharacters();
                if (characters.Length == 0)
                {
                    Mat imgGrey = new Mat();
                    CvInvoke.CvtColor(image, imgGrey, ColorConversion.Bgr2Gray);
                    Mat imgThresholded = new Mat();
                    CvInvoke.Threshold(imgGrey, imgThresholded, 65, 255, ThresholdType.Binary);
                    ocr.SetImage(imgThresholded);
                    characters = ocr.GetCharacters();
                    imageColor = imgThresholded;
                    if (characters.Length == 0)
                    {
                        CvInvoke.Threshold(image, imgThresholded, 190, 255, ThresholdType.Binary);
                        ocr.SetImage(imgThresholded);
                        characters = ocr.GetCharacters();
                        imageColor = imgThresholded;
                    }
                }
                foreach (Tesseract.Character c in characters)
                {
                    CvInvoke.Rectangle(imageColor, c.Region, drawCharColor.MCvScalar);
                }
 
                return ocr.GetUTF8Text();
 
            }
            else
            {
                bool checkInvert = true;
 
                Rectangle[] regions;
 
                using (
                   ERFilterNM1 er1 = new ERFilterNM1("trained_classifierNM1.xml", 8, 0.00025f, 0.13f, 0.4f, true, 0.1f))
                using (ERFilterNM2 er2 = new ERFilterNM2("trained_classifierNM1.xml", 0.5f))
                {
                    int channelCount = image.NumberOfChannels;
                    UMat[] channels = new UMat[checkInvert ? channelCount * 2 : channelCount];
 
                    for (int i = 0; i < channelCount; i++)
                    {
                        UMat c = new UMat();
                        CvInvoke.ExtractChannel(image, c, i);
                        channels[i] = c;
                    }
 
                    if (checkInvert)
                    {
                        for (int i = 0; i < channelCount; i++)
                        {
                            UMat c = new UMat();
                            CvInvoke.BitwiseNot(channels[i], c);
                            channels[i + channelCount] = c;
                        }
                    }
 
                    VectorOfERStat[] regionVecs = new VectorOfERStat[channels.Length];
                    for (int i = 0; i < regionVecs.Length; i++)
                        regionVecs[i] = new VectorOfERStat();
 
                    try
                    {
                        for (int i = 0; i < channels.Length; i++)
                        {
                            er1.Run(channels[i], regionVecs[i]);
                            //er2.Run(channels[i], regionVecs[i]);
                        }
                        using (VectorOfUMat vm = new VectorOfUMat(channels))
                        {
                            regions = ERFilter.ERGrouping(image, vm, regionVecs, ERFilter.GroupingMethod.OrientationHoriz,
                               "trained_classifier_erGrouping.xml", 0.5f);
                        }
                    }
                    finally
                    {
                        foreach (UMat tmp in channels)
                            if (tmp != null)
                                tmp.Dispose();
                        foreach (VectorOfERStat tmp in regionVecs)
                            if (tmp != null)
                                tmp.Dispose();
                    }
 
                    Rectangle imageRegion = new Rectangle(Point.Empty, imageColor.Size);
                    for (int i = 0; i < regions.Length; i++)
                    {
                        Rectangle r = ScaleRectangle(regions[i], 1.1);
 
                        r.Intersect(imageRegion);
                        regions[i] = r;
                    }
 
                }
 
 
                List<Tesseract.Character> allChars = new List<Tesseract.Character>();
                String allText = String.Empty;
                foreach (Rectangle rect in regions)
                {
                    using (Mat region = new Mat(image, rect))
                    {
                        ocr.SetImage(region);
                        if (ocr.Recognize() != 0)
                            throw new Exception("Failed to recognize image");
                        Tesseract.Character[] characters = ocr.GetCharacters();
 
                        //convert the coordinates from the local region to global
                        for (int i = 0; i < characters.Length; i++)
                        {
                            Rectangle charRegion = characters[i].Region;
                            charRegion.Offset(rect.Location);
                            characters[i].Region = charRegion;
 
                        }
                        allChars.AddRange(characters);
 
                        //   allText += ocr.GetUTF8Text() + Environment.NewLine;
                        allText = ocr.GetUTF8Text();
                    }
                }
 
                Bgr drawRegionColor = new Bgr(Color.Red);
                foreach (Rectangle rect in regions)
                {
                    CvInvoke.Rectangle(imageColor, rect, drawRegionColor.MCvScalar);
                }
                foreach (Tesseract.Character c in allChars)
                {
                    CvInvoke.Rectangle(imageColor, c.Region, drawCharColor.MCvScalar);
                }
 
                return allText;
 
            }
 
        }
 
        private void OcrImage(Mat source)
        {
            pictureBox2.Image = null;
            textBox1.Text = String.Empty;
           // textBox.Text = String.Empty;
#if !DEBUG
         try
#endif
            {
 
                Mat result = new Mat();
                String ocredText = OcrImage(_ocr, source, Mode, result);
                pictureBox2.Image = result.Bitmap;
              //  textBox1.Text = ocredText;
                if (Mode == OCRMode.TextDetection)
                {
                    textBox1.Text = ocredText;
                   // textBox1.Text = _ocr.GetHOCRText();
                }
            }
#if !DEBUG
         catch (Exception exception)
         {
            MessageBox.Show(exception.Message);
         }
#endif
        }
 
 
        
 
    }
}
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
29.03.2018, 15:14
Ответы с готовыми решениями:

Найти номер строки,содержащей небольшое количество отрицательных элементов
В матрице Z(5,5) найти номер строки, в которой содержится наибольшее количество отрицательных элементов. Количеством отрицательных...

Дана последовательность символов, в начале которой имеется некоторое количество одинаковых символов. Определить это количество
8.10.2. Помогите, пожалуйста, решить задачу в С++. Дана последовательность символов, в начале которой имеется некоторое...

Найти количество символов всех строк файла и количество символов в определенной строке
Здравствуйте! Я хотел бы попросить помощи в решении задачки! У меня не получается найти количество символов всех строчек и количество...

5
5 / 5 / 1
Регистрация: 29.03.2018
Сообщений: 19
11.04.2018, 09:43  [ТС]
и тишина блин
0
 Аватар для Sanya_sa
912 / 816 / 333
Регистрация: 03.02.2015
Сообщений: 5,276
Записей в блоге: 9
11.04.2018, 09:46
Seledkin, так, а что Вы конкретно хотите, в чем проблема, как и что Вы распознаете.
0
5 / 5 / 1
Регистрация: 29.03.2018
Сообщений: 19
11.04.2018, 10:38  [ТС]
Sanya_sa, я хочу, что бы распознавало одну цифру. Т.е. если на фото белый лист и одна цифра на всем листе - то не работает,
если на листе 3 и более цифр - то все работает прекрасно.
0
 Аватар для Sanya_sa
912 / 816 / 333
Регистрация: 03.02.2015
Сообщений: 5,276
Записей в блоге: 9
11.04.2018, 14:23
Seledkin, а что у Вас там за файлы? Вы как распознаете?
0
5 / 5 / 1
Регистрация: 29.03.2018
Сообщений: 19
11.04.2018, 15:28  [ТС]
Просто с вебкамеры. подношу листок и нажимаю кнопку снять
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
11.04.2018, 15:28
Помогаю со студенческими работами здесь

Найти количество символов в строке, найти заданные буквы, разделить количество букв на количество символов
Написать код который сперва подсчитывает количество символов в строке а потом из этих находит буквы (a,e,y,u,i) и делит количество букв на...

Посчитать количество пробелов, количество букв, количество знаков пунктуации и количество всех символов
дан файл, в файле содержатся буквы лат. алфавита, знаки пунктуации, пробелы и цифры. по нажатию на кнопку, посчитать количество пробелов ,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
Вывод данных через динамический список в справочнике
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Функция заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
10 пpимет, которые всегда сбываются
Maks 31.03.2026
1. Чтобы, наконец, пришла маршрутка, надо закурить. Если сигарета последняя, маршрутка придет еще до второй затяжки даже вопреки расписанию. 2. Нaдоели зима и снег? Не надо переезжать. Достаточно. . .
Перемещение выделенных строк ТЧ из одного документа в другой
Maks 31.03.2026
Реализация из решения ниже выполнена на примере нетипового документа "ВыдачаОборудованияНаСпецтехнику" с единственной табличной частью "ОборудованиеИКомплектующие" разработанного в конфигурации КА2. . . .
Functional First Web Framework Suave
DevAlt 30.03.2026
Sauve. IO Апнулись до NET10. Из зависимостей один пакет, работает одинаково хорошо как в режиме проекта так и в интерактивном режиме. из сложностей - чисто функциональный подход. Решил. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru