0 / 0 / 1
Регистрация: 12.11.2014
Сообщений: 118
1
.NET 4.x

Транскрипции слов составления словаря для распознавания речи

21.01.2017, 16:58. Показов 2012. Ответов 4

Author24 — интернет-сервис помощи студентам
Всем привет!
Есть незамысловатая программка распознавания русской речи на C#.
Это оф-лайн распознавание.
Для этого соответственно нужен словарь ***.di, где слова транскрибируются (арест a rr ee s t, бюро bb u r oo)
В файл с расширение .JSGF (Java Speech Grammar Format) записываются слова без грамматики (арест | бюро|)
В ручную это делать затрудненно.
Поэтому появился вопрос генерации таких транскрипций (арест a rr ee s t).
Здесь описывается пример на Java классом PhonMapper.java

https://github.com/Morfeusys/v... apper.java

Как реализовать такое же только на C#?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
21.01.2017, 16:58
Ответы с готовыми решениями:

Программа для составления словаря иностранных слов по тексту, находящегося в некотором файле
Здравствуйте. Нужна помощь в решении задачи: Составить программу для составления словаря...

ПО для распознавания речи
Понадобилась прога по сабжу. По указанным ссылка на ifolder скачать прогу не удалось(( У кого...

API для распознавания речи
Доброго времени суток. Вообщем пытаюсь найти API с возможностью обучения на своём словаре. Можете...

Рекуррентная НС для распознавания речи
Доброго времени суток. Стоит задача написать классификатор для кластеризации языка голоса. Языка...

4
Администратор
Эксперт .NET
17764 / 13885 / 5321
Регистрация: 17.03.2014
Сообщений: 28,405
Записей в блоге: 1
21.01.2017, 17:30 2
imel, вариант переписать с Java на C# не предлагать?
0
0 / 0 / 1
Регистрация: 12.11.2014
Сообщений: 118
21.01.2017, 17:48  [ТС] 3
возможно, но это не для моего уровня и времени

Добавлено через 4 минуты
Ув. программисты, перепишите пожалуйста c java на C#
Кликните здесь для просмотра всего текста
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
package com.example.recognizer;
 
import android.text.TextUtils;
import android.util.Log;
 
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashMap;
import java.util.LinkedHashMap;
import java.util.Map;
import java.util.Map.Entry;
import java.util.regex.Pattern;
 
public class PhonMapper {
 
    private static final String TAG = "PhonMapper";
 
    private static final String[] GARBAGE = {"а","е","ё","и","о","у","э","ю","я"};
 
    private static final Map<Pattern, String> PATTERNS = new LinkedHashMap<Pattern, String>() {{
        put(Pattern.compile("б([аоуэырлнвзмдг])"), "P$1");
        put(Pattern.compile("г([аоуэырлнвзмдб])"), "Q$1");
        put(Pattern.compile("в([аоуэырлнгзмдб])"), "W$1");
 
        put(Pattern.compile("б([еиюёяь])"), "B$1");
        put(Pattern.compile("г([еиюёяь])"), "G$1");
        put(Pattern.compile("к([еиюёяь])"), "K$1");
        put(Pattern.compile("л([еиюёяь])"), "L$1");
        put(Pattern.compile("в([еиюёяь])"), "V$1");
        put(Pattern.compile("м([еиюёяь])"), "M$1");
        put(Pattern.compile("н([еиюёяь])"), "N$1");
        put(Pattern.compile("р([еиюёяь])"), "R$1");
        put(Pattern.compile("х([еиюёяь])"), "H$1");
        put(Pattern.compile("т([еиюёяь])"), "T$1");
        put(Pattern.compile("д([еиюёяь])"), "D$1");
        put(Pattern.compile("ф([еиюёяь])"), "F$1");
        put(Pattern.compile("с([еиюёяь])"), "S$1");
 
        put(Pattern.compile("ей"), "J");
        put(Pattern.compile("^е"), "E");
        put(Pattern.compile("^я"), "Y");
        put(Pattern.compile("^ю"), "'");
        put(Pattern.compile("([аоуеэы])ю"), "$1'");
        put(Pattern.compile("(у|ю)(к)$"), "U$2");
        put(Pattern.compile("ой$"), "I");
    }};
 
    private static final Map<String, String> phons = new LinkedHashMap<String, String>() {{
        put("E", "j e");
        put("Y", "j ae");
        put("U", "uu");
        put("W", "v");
        put("J", "ee j");
        put("I", "oo j");
        put("'", "j u");
 
        put("P", "b");
        put("Q", "g");
        put("B", "bb");
        put("R", "rr");
        put("G", "gg");
        put("K", "kk");
        put("L", "ll");
        put("V", "vv");
        put("M", "mm");
        put("H", "hh");
        put("N", "nn");
        put("T", "tt");
        put("D", "dd");
        put("F", "ff");
        put("S", "ss");
 
        put("а", "a");
        put("б", "p");
        put("в", "f");
        put("г", "k");
        put("д", "d");
        put("е", "e");
        put("ё", "j oo");
        put("ж", "zh");
        put("з", "z");
        put("и", "i");
        put("й", "j");
        put("к", "k");
        put("л", "l");
        put("м", "m");
        put("н", "n");
        put("о", "ay");
        put("п", "p");
        put("р", "r");
        put("с", "s");
        put("т", "t");
        put("у", "u");
        put("ф", "f");
        put("х", "h");
        put("ц", "c");
        put("ч", "ch");
        put("ш", "sh");
        put("щ", "sch");
        put("ы", "y");
        put("э", "ay");
        put("ю", "u");
        put("я", "a");
    }};
 
    private Map<String, ArrayList<String>> mPhons = new HashMap<String, ArrayList<String>>();
 
    public PhonMapper() {
    }
 
    public PhonMapper(InputStream is) {
        try {
            BufferedReader bis = new BufferedReader(new InputStreamReader(is));
            String line;
            while ((line = bis.readLine()) != null) {
                line = line.trim();
                if(line.length() > 0) {
                    String[] data = line.split("  ");
                    ArrayList<String> list = new ArrayList<String>(Arrays.asList(data[1].split(" ")));
                    mPhons.put(data[0], list);
                }
            }
            bis.close();
        } catch (IOException e) {
            Log.e(TAG, "Can't read phonemes", e);
        } finally {
            try {
                is.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
 
    public String[] getGarbage() {
        return GARBAGE;
    }
 
    public String getPronoun(String str) {
        ArrayList<String> phons = getPhons(str);
        return TextUtils.join(" ", phons);
    }
 
    public ArrayList<String> getPhons(String str) {
        ArrayList<String> phons = new ArrayList<String>();
 
        str = str.toLowerCase();
 
        if(mPhons.containsKey(str)) {
            return mPhons.get(str);
        }
 
        for (Entry<Pattern, String> entry : PATTERNS.entrySet()) {
            str = entry.getKey().matcher(str).replaceAll(entry.getValue());
        }
 
        for (String ch : str.split("")) {
            String phon = getPhon(ch);
            if (phon != null) {
                phons.add(phon);
            }
        }
 
        return phons;
    }
 
 
    private String getPhon(String str) {
        return phons.get(str);
    }
 
}
0
Администратор
Эксперт .NET
17764 / 13885 / 5321
Регистрация: 17.03.2014
Сообщений: 28,405
Записей в блоге: 1
22.01.2017, 13:02 4
imel, лови. Это не 100% перевод т.к. в .NET нет встроенного аналога LinkedHashMap (хотя наверное можно было использовать System.Collections.Specialized.ListDictionary).
Кликните здесь для просмотра всего текста
Disclaimer: переведено на коленке™, правильность не проверял.
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
public class PhonMapper {
 
    const string TAG = "PhonMapper";
 
    static readonly string[] GARBAGE = {"а","е","ё","и","о","у","э","ю","я"};
    static readonly Dictionary<Regex, string> PATTERNS = new Dictionary<Regex, string>()
    {
        { new Regex("б([аоуэырлнвзмдг])"), "P$1" },
        { new Regex("г([аоуэырлнвзмдб])"), "Q$1" },
        { new Regex("в([аоуэырлнгзмдб])"), "W$1" },
 
        { new Regex("б([еиюёяь])"), "B$1" },
        { new Regex("г([еиюёяь])"), "G$1" },
        { new Regex("к([еиюёяь])"), "K$1" },
        { new Regex("л([еиюёяь])"), "L$1" },
        { new Regex("в([еиюёяь])"), "V$1" },
        { new Regex("м([еиюёяь])"), "M$1" },
        { new Regex("н([еиюёяь])"), "N$1" },
        { new Regex("р([еиюёяь])"), "R$1" },
        { new Regex("х([еиюёяь])"), "H$1" },
        { new Regex("т([еиюёяь])"), "T$1" },
        { new Regex("д([еиюёяь])"), "D$1" },
        { new Regex("ф([еиюёяь])"), "F$1" },
        { new Regex("с([еиюёяь])"), "S$1" },
 
        { new Regex("ей"), "J" },
        { new Regex("^е"), "E" },
        { new Regex("^я"), "Y" },
        { new Regex("^ю"), "'" },
        { new Regex("([аоуеэы])ю"), "$1'" },
        { new Regex("(у|ю)(к)$"), "U$2" },
        { new Regex("ой$"), "I" },
        
    };
 
    static readonly Dictionary<string, string> phons = new Dictionary<string,string>()
    {
        {"E", "j e"},
        {"Y", "j ae"},
        {"U", "uu"},
        {"W", "v"},
        {"J", "ee j"},
        {"I", "oo j"},
        {"'", "j u"},
 
        {"P", "b"},
        {"Q", "g"},
        {"B", "bb"},
        {"R", "rr"},
        {"G", "gg"},
        {"K", "kk"},
        {"L", "ll"},
        {"V", "vv"},
        {"M", "mm"},
        {"H", "hh"},
        {"N", "nn"},
        {"T", "tt"},
        {"D", "dd"},
        {"F", "ff"},
        {"S", "ss"},
 
        {"а", "a"},
        {"б", "p"},
        {"в", "f"},
        {"г", "k"},
        {"д", "d"},
        {"е", "e"},
        {"ё", "j oo"},
        {"ж", "zh"},
        {"з", "z"},
        {"и", "i"},
        {"й", "j"},
        {"к", "k"},
        {"л", "l"},
        {"м", "m"},
        {"н", "n"},
        {"о", "ay"},
        {"п", "p"},
        {"р", "r"},
        {"с", "s"},
        {"т", "t"},
        {"у", "u"},
        {"ф", "f"},
        {"х", "h"},
        {"ц", "c"},
        {"ч", "ch"},
        {"ш", "sh"},
        {"щ", "sch"},
        {"ы", "y"},
        {"э", "ay"},
        {"ю", "u"},
        {"я", "a"},
    };
 
    Dictionary<string, List<string>> mPhons = new Dictionary<string, List<string>>();
 
    public PhonMapper(Stream stream)
    {
        try {
            using (StreamReader bis = new StreamReader(stream))
            {
                string line;
                while ((line = bis.ReadLine()) != null) {
                    line = line.Trim();
                    if(line.Length > 0) {
                        string[] data = line.Split(new []{"  "}, StringSplitOptions.None);
                        List<string> list = data[1].Split(' ').ToList();
                        mPhons.Add(data[0], list);
                    }
                }
            }
        } catch (IOException e) {
            // TDOD Log.e(TAG, "Can't read phonemes", e);
        }
    }
 
    public string[] getGarbage() {
        return GARBAGE;
    }
 
    public string getPronoun(string str) {
        List<string> phons = getPhons(str);
        return string.Join(" ", phons);
    }
 
    public List<string> getPhons(string str) {
        List<string> phons = new List<string>();
 
        str = str.ToLower();
 
        if(mPhons.ContainsKey(str)) {
            return mPhons[str];
        }
 
        foreach (KeyValuePair<Regex, string> entry in PATTERNS) {
            str = entry.Key.Replace(str, entry.Value);
        }
 
        foreach (char ch in str) {
            string phon = getPhon(ch.ToString());
            if (phon != null) {
                phons.Add(phon);
            }
        }
 
        return phons;
    }
 
 
    private string getPhon(string str) {
        return phons[str];
    }
}


Добавлено через 12 часов 28 минут
imel, не забудь отписаться о результате. Если будут какие-то ошибки, то выложи рабочую версию.
1
0 / 0 / 1
Регистрация: 12.11.2014
Сообщений: 118
15.02.2017, 00:00  [ТС] 5
Собрать что-то подобное пока что не удалось, сам проект под android.

Добавлено через 1 минуту
Да и это больше голосовое управление. Я не думаю , что можно собрать приложение для сборки словаря и морфем
0
15.02.2017, 00:00
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
15.02.2017, 00:00
Помогаю со студенческими работами здесь

Существует ли бесплатная платформа для распознавания речи
для с#, но только чтобы определяла не из ограниченных вариантов а полное распознавание Добавлено...

Базы русской речи для синтеза и распознавания
Здравствуйте форумчане,есть у кого нибудь базы русского языка для распознавания? куски тимит,...

Программа для распознавания речи и записи в текстовый файл
Всем доброго дня! Посоветуйте программу и, если есть возможность, поделитесь ссылкой на нее. ...

Требуется С/С++ программист для работы с библиотекой распознавания речи
Есть интересная задача для опытного С/С++ программиста со знаниями в области обработки speech,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Опции темы

Новые блоги и статьи
Интеграция Arduino и ChatGPT: Практическое руководство
InfoMaster 16.01.2025
В современную эпоху технологических инноваций интеграция искусственного интеллекта с микроконтроллерами открывает принципиально новые возможности для создания умных устройств и автоматизированных. . .
Как создать робота, управляемого ChatGPT
InfoMaster 16.01.2025
Концепция проекта В современную эпоху искусственный интеллект и робототехника становятся все более доступными для энтузиастов и разработчиков. Создание роботизированной руки, управляемой ChatGPT,. . .
Как создать ChatGPT бота в Telegram на Python
InfoMaster 16.01.2025
В современном мире технологии искусственного интеллекта становятся все более доступными для разработчиков, открывая новые возможности для создания умных и интерактивных приложений. Одним из самых. . .
Машинное обучение с помощью Python
InfoMaster 16.01.2025
Машинное обучение стало неотъемлемой частью современных технологий, позволяя компьютерам учиться на основе данных и принимать решения без явного программирования. В сочетании с языком. . .
Использование связки C# и PHP в корпоративной разработке и микросервисной архитектуре
InfoMaster 16.01.2025
Введение в интеграцию C# и PHP В современной корпоративной разработке все чаще возникает потребность в создании гибких и масштабируемых решений, способных эффективно решать широкий спектр. . .
Как использовать Kerio дома для управления сетью и пользователями
InfoMaster 16.01.2025
Использование технологий для улучшения повседневной жизни стало неотъемлемой частью современного быта. Одной из таких технологий является Kerio — мощный инструмент для управления сетью и. . .
Есть ли будущее у DVD и Blu-ray?
InfoMaster 16.01.2025
В эпоху стремительного развития цифровых технологий и повсеместного распространения потоковых сервисов вопрос о будущем физических носителей информации становится все более актуальным. Особенно остро. . .
Как проводить научные вычисления на Python
InfoMaster 15.01.2025
Python стал одним из наиболее востребованных языков программирования в области научных вычислений благодаря своей простоте, гибкости и обширной экосистеме специализированных библиотек. Научные. . .
Создание игры типа Minecraft на PyGame/Python: пошаговое руководство
InfoMaster 15.01.2025
В данном руководстве мы рассмотрим процесс создания игры в стиле Minecraft с использованием библиотеки PyGame на языке программирования Python. Этот проект идеально подходит как для начинающих. . .
Как создать свою первую игру в стиле Doom на Unreal Engine
InfoMaster 15.01.2025
Разработка шутера от первого лица в стиле классического Doom представляет собой увлекательное путешествие в мир игрового программирования, где сочетаются творческий подход и технические навыки. . . .
Параллельное программировани­е: основные технологии и принципы
InfoMaster 15.01.2025
Введение в параллельное программирование Параллельное программирование представляет собой фундаментальный подход к разработке программного обеспечения, который позволяет одновременно выполнять. . .
Как написать микросервис на C# с Kafka, MediatR, Redis и GitLab CI/CD
InfoMaster 15.01.2025
В современной разработке программного обеспечения микросервисная архитектура стала стандартом де-факто для создания масштабируемых и гибких приложений. Этот подход позволяет разделить сложную систему. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru