Форум программистов, компьютерный форум, киберфорум
C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.62/29: Рейтинг темы: голосов - 29, средняя оценка - 4.62
 Аватар для GoldenId
142 / 143 / 64
Регистрация: 11.11.2010
Сообщений: 877
Записей в блоге: 10

Объясните, как работает грамматика регулярных выражений ECMAScript

13.02.2024, 14:26. Показов 6549. Ответов 6

Студворк — интернет-сервис помощи студентам
Читаю раздел Alternatives документации по грамматике ECMAScript и не понимаю ни описание механизма работы данной реализации регулярных выражений, ни выдачи примера:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#include <cstddef>
#include <iostream>
#include <regex>
#include <string>
 
void show_matches(const std::string& in, const std::string& re)
{
    std::smatch m;
    std::regex_search(in, m, std::regex(re));
    if (!m.empty())
    {
        std::cout << "input=[" << in << "], regex=[" << re << "]\n  "
                     "prefix=[" << m.prefix() << "]\n  smatch: ";
        for (std::size_t n = 0; n < m.size(); ++n)
            std::cout << "m[" << n << "]=[" << m[n] << "] ";
        std::cout << "\n  suffix=[" << m.suffix() << "]\n";
    }
    else
        std::cout << "input=[" << in << "], regex=[" << re << "]: NO MATCH\n";
}
 
int main()
{
    show_matches("abcdef", "abc|def");
    show_matches("abc", "ab|abc"); // left Alernative matched first
 
    // Match of the input against the left Alternative (a) followed
    // by the remained of the regex (c|bc) succeeds, which results
    // in m[1]="a" and m[4]="bc".
    // The skipped Alternatives (ab) and (c) leave their submatches
    // m[3] and m[5] empty.
    show_matches("abc", "((a)|(ab))((c)|(bc))");
}
выдача:
Code
1
2
3
4
5
6
7
8
9
10
11
12
input=[abcdef], regex=[abc|def]
  prefix=[]
  smatch: m[0]=[abc]
  suffix=[def]
input=[abc], regex=[ab|abc]
  prefix=[]
  smatch: m[0]=[ab]
  suffix=[c]
input=[abc], regex=[((a)|(ab))((c)|(bc))]
  prefix=[]
  smatch: m[0]=[abc] m[1]=[a] m[2]=[a] m[3]=[] m[4]=[bc] m[5]=[] m[6]=[bc]
  suffix=[]
По крайней мере в последнем ( из 3 ) случае выдача ( по идее логики идеального автомата ) должна быть ( с точностью до порядка и повторений ) следующей:
Code
1
abc
,
Со следующим порядком работы:
Code
1
2
3
4
a+c - нет,
a+bc - в выдачу,
ab+c - в выдачу, повтор
ab+bc - нет.
Текст раздела прочитал несколько раз, в том числе с переводом на русский - - всё равно логика работы алгоритма не ясна.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
13.02.2024, 14:26
Ответы с готовыми решениями:

Объясните алгоритм действия регулярных выражений
Здравствуйте. Насколько я понял, регулярные выражения служат для поиска определенной части символов в тексте по средствам маски. Не могли...

Объясните принцип работы регулярных выражений
class Program { static void Main(string args) { String e_mail = &quot;acsfhghghhghh&quot;; ...

Механизм регулярных выражений не работает
Имеется следующий код: var RegularExpression = @&quot;^*&quot;; var text = &quot;выекаыва&quot;; var result =...

6
 Аватар для GoldenId
142 / 143 / 64
Регистрация: 11.11.2010
Сообщений: 877
Записей в блоге: 10
14.02.2024, 12:39  [ТС]
Собственно текст раздела Alternatives документации по грамматике ECMAScript:

   «A regular expression pattern is sequence of one or more Alternatives, separated by the disjunction operator | (in other words, the disjunction operator has the lowest precedence)

   Pattern ::

      Disjunction
      Disjunction ::

   Alternative
      Alternative | Disjunction


   The pattern first tries to skip the Disjunction and match the left Alternative followed by the rest of the regular expression (after the Disjunction).

   If it fails, it tries to skip the left Alternative and match the right Disjunction (followed by the rest of the regular expression).

   If the left Alternative, the right Disjunction, and the remainder of the regular expression all have choice points, all choices in the remainder of the expression are tried before moving on to the next choice in the left Alternative. If choices in the left Alternative are exhausted, the right Disjunction is tried instead of the left Alternative.

   Any capturing parentheses inside a skipped Alternative produce empty submatches.».
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
14.02.2024, 17:41
Что именно не ясно?
0
 Аватар для GoldenId
142 / 143 / 64
Регистрация: 11.11.2010
Сообщений: 877
Записей в блоге: 10
14.02.2024, 19:51  [ТС]
nmcf,

Что такое choice points?

Что такое choices?

Почему вызов:

C++
1
show_matches("abc", "((a)|(ab))((c)|(bc))");
даёт ( в частности ) вывод:

Code
1
 smatch: m[0]=[abc] m[1]=[a] m[2]=[a] m[3]=[] m[4]=[bc] m[5]=[] m[6]=[bc]
,

а не

Code
1
smatch: m[0]=[abc], m[1]=[abc]
по логике, описанной в конце заглавного поста?
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
14.02.2024, 19:59
Ну как я понял, слева направо смотрит. m[0] - это весь шаблон. А дальше идут группы по вложенности.
m[1]: ((a)|(ab))
m[2], m[3]: (a), (ab)
Так же с ((c)|(bc)).

Добавлено через 1 минуту
Т. е. скобки эти дерево образуют.
1
 Аватар для GoldenId
142 / 143 / 64
Регистрация: 11.11.2010
Сообщений: 877
Записей в блоге: 10
18.02.2024, 12:00  [ТС]
nmcf, но ведь должна быть канкатенация?
Из "(a|ab)(c|bc)" есть два узла:
"(a|ab)" и "(c|bc)" - - две дизъюнкции, из каждой из которых должна быть выбрана одна альтернатива:
"(a|ab)" -> "a" либо "ab"
"(c|bc)" -> "c" либо "bc",
и дальше сканкатенировать их варианты так, чтобы в обрабатываемый сиквенс укладывалось, там было.
Разве не так?
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
18.02.2024, 12:35
Не очень понимаю, о чём ты. Почему не получается ab+c? Потому что слева направо. Если найдено совпадение с левой частью, то правая уже не рассматривается.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
18.02.2024, 12:35
Помогаю со студенческими работами здесь

Форма регистрации. Проверка данных с помощью регулярных выражений не работает.
Здравствуйте, написал форму регистрации &lt;?php if (!empty($_POST)) { $login = htmlspecialchars($_POST); ...

Как оптимизировать применение регулярных выражений
Как оптимизировать следующий код? string a2 = Regex.Replace(x, p, @&quot;$4&quot;, RegexOptions.IgnoreCase); string a3 = Regex.Replace(x, p,...

Как происходит проверка регулярных выражений в Regex.IsMatch?
Не разберусь что-то никак. Вот простой пример: public bool IsCyrillic(string pattern) { Regex rgx =...

Как найти и заменить подстроку - как есть, без регулярных выражений
Как найти и заменить подстроку - как есть, без регулярных выражений? Уже неделю копаю, но ничего толкового не накопал... Прошу помощи. ...

Delphi 10.3 Community Edition как установить библиотеку регулярных выражений
Полазав по интернету с горем-пополам поставил чтоб Delphi видел библиотеку но оказалось этого мало нужно в папку с прогой добавить сам...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
Символьное дифференцирование
igorrr37 13.02.2026
/ * Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2). Унарный минус обозначается как ! */ #include <iostream> #include <stack> #include <cctype>. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru