С Новым годом! Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/6: Рейтинг темы: голосов - 6, средняя оценка - 5.00
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5

Грамотное построение регулярки

31.01.2013, 21:20. Показов 1308. Ответов 16
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Собственно сабж. До этого как-то особо этим не интересовался, находились другие дела, а тут прям проперло. Пример: есть строка
+xz\a7ывмывмы---(4-95--)sda777-77d7++7+sa^%&ds-()ыпывпывпывп-
Я пытаюсь получить из нее все, что между семеркой и четверкой, пишу
C#
1
\d+.*\(\d+
получаю
7ывмывмы---(4
Дальше, хочу убрать мусор, чтобы осталось 7(4
пишу
C#
1
\d+(?=.*)\(\d+
После этого он не находит ни одного совпадения. Вопрос: почему и как грамотно это написать?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
31.01.2013, 21:20
Ответы с готовыми решениями:

Регулярки
Народ,помогите кто чем как говориться,пишу парсер,никак не могу посреди ночи темной додумать как описать подстроку внутри которой может...

Регулярки
Прошу помощи, не могу понять как правильно написать регулярку на парсинг строк Имеем вот такую строку: Accepted amount: 24000.00 RUR...

StringBuilder и регулярки
Подскажите, можно ли на StringBuilder использовать RegEx.Replace? Если да, то как?

16
Темная сторона .Net
 Аватар для Noob.net
592 / 489 / 39
Регистрация: 21.07.2012
Сообщений: 1,668
31.01.2013, 21:32
Psilon, после того как нашли нужно убрать все символы кроме граничных. [^47]
С регулярками знаком плоховато,но мне это помогло)
0
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
31.01.2013, 21:33  [ТС]
Noob.net, в идеале мне надо получить номер в том виде, в котором он есть Просто я привык быть последовательным. Сейчас завтык в этом )
0
Темная сторона .Net
 Аватар для Noob.net
592 / 489 / 39
Регистрация: 21.07.2012
Сообщений: 1,668
31.01.2013, 21:45
Psilon,
Code
1
\d*[^a-z+а-я+\W]
У меня получилось только с пробелами,прости
0
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
01.02.2013, 01:42  [ТС]
Noob.net, и? результат:
Match
7
4
95
777
77
7
7
С тем же успехом можно было написать \d+

Добавлено через 3 часа 35 минут
Предложения будут, почему не работает ? Где же все эксперты?
0
62 / 62 / 5
Регистрация: 05.01.2013
Сообщений: 235
01.02.2013, 02:20
C#
1
2
string str="+xz\a7ывмывмы---(4-95--)sda777-77d7++7+sa^%&ds-()ыпывпывпывп-";
Console.WriteLine(Regex.Match(Regex.Replace(str,@"[^\d\(\)]",""),@"\d\(\d+\)\d+"));
возвращает
Code
1
7(495)7777777
без + в начале кода города. его можно и в ручную добавить

Добавлено через 15 минут
C#
1
\d+.*\(\d+
получаю

Дальше, хочу убрать мусор, чтобы осталось 7(4
пишу
C#
1
\d+(?=.*)\(\d+
После этого он не находит ни одного совпадения. Вопрос: почему и как грамотно это написать?
а что это вообще-
C#
1
\d+(?=.*)\(\d+
в скобках первым идет знак вопроса - зачем? потом идет знак равенства - тоже для чего? конечно не найдет, потому что знака равенства в твоей строке нет -
Code
1
7ывмывмы---(4
0
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
01.02.2013, 07:36  [ТС]
Цитата Сообщение от Winhttp Посмотреть сообщение
в скобках первым идет знак вопроса - зачем? потом идет знак равенства - тоже для чего? конечно не найдет, потому что знака равенства в твоей строке нет
Посмотрели бы - зачем, прежде чем посмеяться, что "равенства в строке нет и зачем первый знак вопроса"
http://msdn.microsoft.com/ru-r... constructs
0
01.02.2013, 15:37

Не по теме:

Psilon, да я почитал уже :)

0
Higher
 Аватар для diagon
1953 / 1219 / 120
Регистрация: 02.05.2010
Сообщений: 2,925
Записей в блоге: 2
06.02.2013, 12:58
Это ведь просто проверка, причем атомарная, то есть она не изменяет состояние парсинга. То есть здесь
C#
1
\d+(?=.*)\(\d+
Мы ищем группу цифр, проверяем, есть ли дальше .*, и, если проверка успешна, то начинаем искать скобку сразу после уже найденной группы цифр.
Т.е. такой текст заматчится
C#
1
1(2
0
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
07.02.2013, 00:22  [ТС]
diagon, ну тогда нужно жадный квантификатор задать, чтобы он взял как можно больше подходящего под этот паттерн

Добавлено через 54 секунды
в общем задача стоит так - есть некоторая последовательность из цифр и скобок, есть формат номера телефона: 7(/d/d/d)/d/d/d/d/d/d/d, требуется убрать ряд скобок так, чтобы мы могли выделить в исходной последовательности корректные телефонные номера.

Добавлено через 9 часов 32 минуты
Попробовал вот такое
C#
1
\d+(?>[^(]*)\(\d+
То есть цифра, сколько угодно символов-нескобок, скобка, цифра. Возвращает
7ывмывмы---(4
Почему, если группа - невыделяемая (если верить документации)?????
0
Эксперт Java
 Аватар для turbanoff
4094 / 3828 / 745
Регистрация: 18.05.2010
Сообщений: 9,331
Записей в блоге: 12
07.02.2013, 07:54
Цитата Сообщение от Psilon Посмотреть сообщение
очему, если группа - невыделяемая (если верить документации)?????
Покажите где такое написано?

Что мешает вам просто взять и написать так:
Code
1
(\d+)[^(]*(\(\d+)
И после этого брать в качестве результата 1-ю и 2-ю группы результата?
0
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
07.02.2013, 14:01  [ТС]
turbanoff, То, что у меня в результате будет штук 10 групп с таким выделением. Мне потом писать
C#
1
match[1] + match[2] + ...
?
0
Эксперт Java
 Аватар для turbanoff
4094 / 3828 / 745
Регистрация: 18.05.2010
Сообщений: 9,331
Записей в блоге: 12
07.02.2013, 14:34
Это вас смущает? Как по мне, нужно упрощать самую сложную часть программы, пусть даже чуть усложняя остальные.
А самая сложное в использовании регулярок - сама регулярка.
0
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
07.02.2013, 14:38  [ТС]
turbanoff, есть такое понятие, как "Невыделяемая группа". Что мешает сделать контекст неизвестной длины?
0
Эксперт Java
 Аватар для turbanoff
4094 / 3828 / 745
Регистрация: 18.05.2010
Сообщений: 9,331
Записей в блоге: 12
07.02.2013, 15:28
Под невыделяемой группой подразумевается то, что результирующая часть выражение, для данной группы не будет присутствовать в списке групп.
Однако это не означает, что оно не будет частью всего совпадения в регулярке.
Code
1
\d+(?>[^(]*)\(\d+
Здесь первой группы не будет, только нулевая.
0
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
07.02.2013, 16:17  [ТС]
turbanoff, если я напишу
для стоки $50 100 $30
регулярку
(?<=$)\d+
то будут совпадения
50 30
а не $50 $30
такое поведение тут мне и нужно

Добавлено через 2 минуты
То есть мне нужен контекст неизвестной длины, который долежен учитываться, но не должен включаться в match
0
Эксперт Java
 Аватар для turbanoff
4094 / 3828 / 745
Регистрация: 18.05.2010
Сообщений: 9,331
Записей в блоге: 12
07.02.2013, 16:47
Я понял, что вы имели ввиду. Я не знаю такого способа, и всегда считал, что его нет в регулярках за ненадобностью. Если найдете - обязательно напишите.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
07.02.2013, 16:47
Помогаю со студенческими работами здесь

Увеличение скорости парсинга регулярки,возможно ли?
Собственно есть регулярка,нужно парсить id и имя клана Впринципе он парсит,но на странице окло 40 кланов, всего 13 страниц и в среднем на...

Грамотное использование контекста
Есть приложуха, которая лезет в SQL сервер (путём использования строки подключения, заданной программно и Entity Framework классов), делает...

Построение регулярки для html
Помогите составить регулярку для получения значения Значение выделено красным &lt;div class=&quot;ii _temp&quot;&gt;&lt;div...

Грамотное использование переменных, get() и set()
Подскажите как грамотней использовать переменные в классе и вызывать их из других классов? И в чем разница: using System; using...

Портирование регулярки
Здравствуйте! Есть одна регулярка, которую мне помог написать один хороший человек. Она прекрасно работает -...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
17
Ответ Создать тему
Новые блоги и статьи
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru