Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.55/11: Рейтинг темы: голосов - 11, средняя оценка - 4.55
0 / 0 / 1
Регистрация: 25.06.2017
Сообщений: 69

Составить регулярное выражение

02.12.2018, 11:48. Показов 2266. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Уважаемые специалисты. Помогите с регулярным выражением. Составил такую регулярку, она находит большую часть нужной инфы, но не всё. Нужно добить её до конца.

Разбирается файл-словарь с ударениями. Все слова в нём идут сплошняком вот так:

абляция $абля'ция аркебуза $аркебу'за бонасье $бо насье ванга $ва'нга королек $ко ро лёк

Моя регулярка хорошо находит пары 1,2,4, но из пар 3 и 5 берёт только первое слово (бонасье $бо и королек $ко).

C#
1
[а-яА-Я]+\x20\$[а-яА-Я]+\'[а-яА-Я]+
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
02.12.2018, 11:48
Ответы с готовыми решениями:

Составить регулярное выражение
Есть текст вот такого вида...

Составить регулярное выражение
Есть строка типа "sometextDocs/sometext"надо получить всё что после Docs/

Составить регулярное выражение
Здравствуйте, помогите пожалуйста написать регулярку чтобы она делала следующее: есть массив строк, если в строке встречается сочетание...

5
1123 / 794 / 219
Регистрация: 15.08.2010
Сообщений: 2,185
02.12.2018, 12:49
Цитата Сообщение от Alexandrus2017 Посмотреть сообщение
о из пар 3 и 5
с чего вдруг там оказались пробелы?
для начала опишите правила регулярного языка, на которых составлен словарь
0
Эксперт JS
6496 / 3907 / 2006
Регистрация: 14.06.2018
Сообщений: 6,781
02.12.2018, 13:50
Лучший ответ Сообщение было отмечено Alexandrus2017 как решение

Решение

C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
using System;
using System.Text.RegularExpressions;
 
namespace Question2362748
{
    class Program
    {
        static void Main(string[] args)
        {
            var str = @"абляция $абля'ция аркебуза $аркебу'за бонасье $бо насье ванга $ва'нга королек $ко ро лёк";
            var pattern = @"[а-яё]+\s\$(?:[а-яё]+')?[а-яё]+(?>\s[а-яё]+)*(?!\s\$)";
            var matches = Regex.Matches(str, pattern, RegexOptions.IgnoreCase);
            foreach (Match match in matches)
            {
                Console.WriteLine(match.Value);
            }
            Console.ReadKey();
        }
    }
}
1
0 / 0 / 1
Регистрация: 25.06.2017
Сообщений: 69
02.12.2018, 13:50  [ТС]
Пробелы там могут быть, а могут и не быть. Нужно просто иметь это в виду. Без пробелов я и сам уже зацепил все слова, это делает моя регулярка из первого сообщения.

описываю тогда ещё раз. есть слово, после него идут два символа (\x20\x01), которые отделяют слово от этого же слова, но уже с ударением или его же, но разделённого на слоги. Вот и всё. Символов табуляции и возврата каретки нет. Весь словарь одной строкой. Для наглядности символ \x01 (выглядящий как пробел) я заменил на $.

то есть в словаре может быть вот так:

гидроэлектростанция $гидроэлектроста'нция

а может быть так:

гидроэлектростанция $ги дро э лек тро стан ци я

а ещё может и вот так:

гидроэлектростанция $ги дро э лек тро ста'н ци я

незыблимым всегда остаётся только искомое слово [а-яА-Я]+ ло и два идущих за ним символа \x20\x01, а дальше может быть как слово с ударением, так и слово без ударения, так и слово, разделённое пробелами на слоги.
0
Эксперт JS
6496 / 3907 / 2006
Регистрация: 14.06.2018
Сообщений: 6,781
02.12.2018, 14:49
Лучший ответ Сообщение было отмечено Alexandrus2017 как решение

Решение

Alexandrus2017,
Цитата Сообщение от Alexandrus2017 Посмотреть сообщение
гидроэлектростанция $ги дро э лек тро ста'н ци я
Про этот сложный вариант надо было изначально сообщить.
Никто бы не догадался.

Добавлено через 49 минут
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
using System;
using System.Text.RegularExpressions;
 
namespace Question2362748
{
    class Program
    {
        static void Main(string[] args)
        {
            var str = @"абляция $абля'ция аркебуза $аркебу'за бонасье $бо насье ванга $ва'нга королек $ко ро лёк гидроэлектростанция $ги дро э лек тро ста'н ци я";
            var pattern = @"[а-яё]+\s\$[а-яё']+(?>\s[а-яё']+)*(?!\s\$)";
            var matches = Regex.Matches(str, pattern, RegexOptions.IgnoreCase);
            foreach (Match match in matches)
            {
                Console.WriteLine(match.Value);
            }
            Console.ReadKey();
        }
    }
}
Имхо, в данной задаче регулярное выражение не обязано проверять посимвольное совпадение слов и считать количество ударений.
Ударения посчитали раньше до нас. И посимвольно разбили слово до нас.
0
0 / 0 / 1
Регистрация: 25.06.2017
Сообщений: 69
03.12.2018, 04:46  [ТС]
[удалено]
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
03.12.2018, 04:46
Помогаю со студенческими работами здесь

Составить регулярное выражение
Есть текст: size=5.33 2фв>6 фыф33>отв. Избитая поисковая фраза: Regex r = new Regex(Regex.Escape(start) + "(.*?)" +...

Составить регулярное выражение
Друзья, помогите составить регулярное вырежение буду рад любым примерам есть html-страница, записанная в переменную string ...

Составить регулярное выражение
Добрый день! Есть массив строк телефонных номеров. Не могу придумать правильные регулярки к нему. Телефоны выглядят примерно так ...

Составить регулярное выражение
Всем привет. Подскажите как добраться до значения -21 ?(нужно все что между |и| может быть в третьем блоке). Спасибо! ...

Составить регулярное выражение нахождения атрибута
<%@ Page Title="some text" Description="sometext" MetaDescription ="sometext" MasterPageFile="~/Doc.master" %> надо найти значение...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
BOINC: 22 года — и всё ещё работает
Programma_Boinc 12.03.2026
BOINC: 22 года — и всё ещё работает Дэвид Андерсон написал ретроспективу. Кратко: в 2001 году он ушёл из United Devices, где был CTO, и за несколько месяцев написал ядро BOINC — клиент, сервер,. . .
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru