Форум программистов, компьютерный форум, киберфорум
C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/6: Рейтинг темы: голосов - 6, средняя оценка - 4.67
Нарушитель
 Аватар для bodya_men
54 / 55 / 8
Регистрация: 01.07.2014
Сообщений: 1,021

Различия использования регулярных выражений и генераторов парсеров в GCC и MSVC

29.05.2016, 00:34. Показов 1478. Ответов 12
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Я слышал что G++ и MSVC используют lex и bison для построения дерева токенов и парсинга. А клэнг свой какой то язык, который обрабатывает бэкэнд. Недавно со знакомыми кодерами возник интересный разговор: Правда ли что регулярки и генераторы парсеров медленее чем обычный нативный код. На деле оказалось что нет, и даже FPC быстрее кланга оказался.
Собственно и вопрос, правда ли что оба эти компилятора используют генераторы парсеров и несмотря на совсем незначительные потери произв-сти, работают медленее чем если бы парсились на лету(как в TCC к примеру) а не компилировались сначала регулярки а потом уже проводился анализ.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
29.05.2016, 00:34
Ответы с готовыми решениями:

компиляция gcc и MSVC
Привет всем. Объясните, почему один и тот же код #include "stdafx.h" #include <vector> #include <iostream> #include...

Портирование ассемблерной функции с MSVC на GCC
Мои попытки не привели ни к чему вразумительному. Так что прошу помощи... bool IsMemoryOnStack( LPVOID pVoid ) { LPVOID...

Объясните устройство сложных вложенных выражений-генераторов
Здравствуйте. Может кто объяснить, как работают сложные выражения-генераторы, вроде представленного ниже? Я понимаю, что таким лучше...

12
Evg
Эксперт CАвтор FAQ
 Аватар для Evg
21281 / 8305 / 637
Регистрация: 30.03.2009
Сообщений: 22,660
Записей в блоге: 30
29.05.2016, 10:00
Если под словом "используют" подразумевается "сам компилятор написан с использованием", то можно поглядеть на исходники gcc, там есть какие-то файлы с расширением *.l, а в старых версиях были и файлы с расширением *.y (если я ничего не путаю). Когда-то я их изучал и сложилось впечатление, что там реализовано лишь некоторое подмножество языка. Да и не было полной уверенности, что оно входит именно в состав компилятора, а не в состав какой-нибудь утилиты, которая используется при сборке компилятора

Но тут есть два момента

1. Парсер в компиляторе занимает дай бог 1% времени исполнения. А потому скорость работы парсера в пределах +-100% роли не играет, а потому пофигу на чём его писать
2. lex/bison годны для написания примитивных парсеров. Синтаксис таких монстров как Си++ слишком сложен, для того, чтобы с ними работать на lex/bison. Парсер ведь не только должен распарсить, но ещё и грамотно выдать пользовательские ошибки, причем после выдачи ошибки современные компиляторы продолжают парсить (т.е. выдают несколько ошибок за раз). На lex/bison, думается, опухнешь это делать (правда не уверен в этом на все 100%)

Добавлено через 2 минуты
Что касается MSVC, то я более чем уверен, что тем не может быть никаких lex/bison тупо по политическим соображениям
1
Нарушитель
 Аватар для bodya_men
54 / 55 / 8
Регистрация: 01.07.2014
Сообщений: 1,021
29.05.2016, 12:33  [ТС]
Evg, есть один компилятор PHP в Java - JPHP, там все на регулярках, и работает вполне быстро. А как известно PHP имеет много общего с обычным C и немного C++(ООП в PHP не полное, шаблонов нет)

Добавлено через 49 секунд
В википедии так и написано что MSVC и GCC используют лекс и бизон.
0
Evg
Эксперт CАвтор FAQ
 Аватар для Evg
21281 / 8305 / 637
Регистрация: 30.03.2009
Сообщений: 22,660
Записей в блоге: 30
29.05.2016, 13:26
Слабо понимаю, каким боком сюда относятся регулярные выражения

Про MSVC я могу только догадываться, т.к. у них исходник закрытый. Википедия - это не то место, чему можно слепо доверять. На месте микрософтеров я бы не использовал gnu'тый софт по политическим соображениям

В исходниках gcc действительно есть файл от lex'а (gengtype-lex.l). Но файлов для bison'а я не вижу. Файл от lex'а довольно маленький, вряд ли он относится к самомУ компилятору. Судя по названию, он парсит какой-то из файлов *.def

Я исходники смотрел тут https://github.com/gcc-mirror/gcc
Более предметно можно скачать какой-нибудь исходник и собрать его. По логам сборки будет видно, для чего используется lex

Парсер для Си, судя по названию - это файл gcc/c/c-parser.c, для Си++ - gcc/cp/parser.c
1
Нарушитель
 Аватар для bodya_men
54 / 55 / 8
Регистрация: 01.07.2014
Сообщений: 1,021
29.05.2016, 14:18  [ТС]
Evg, парсер C там фронтэнд только. Остальное за бэкэндом спрятано.

Добавлено через 2 минуты
Охренеть. Метр кода на парсер. Готовый генератор анализаторов и парсеров для Java(ANTLR) и то меньше весит(около 700кб)
0
Evg
Эксперт CАвтор FAQ
 Аватар для Evg
21281 / 8305 / 637
Регистрация: 30.03.2009
Сообщений: 22,660
Записей в блоге: 30
29.05.2016, 14:57
Цитата Сообщение от bodya_men Посмотреть сообщение
Evg, парсер C там фронтэнд только. Остальное за бэкэндом спрятано
В очередной раз нифига не понял
0
29.05.2016, 20:18

Не по теме:

Цитата Сообщение от Evg Посмотреть сообщение
На месте микрософтеров я бы не использовал gnu'тый софт по политическим соображениям
Пока, вроде, только один раз их в этом уличили. Года два назад кто-то дотошный путем анализа кода обрнаружил в закрытой проге MS код распространяемый под GPL. MS, надо сказать, повел себя достойно. Оправдались тем, что это сделали нанятые сторонние кодеры без ведома компании. И, как того требует лицензия, открыли код всего своего продукта по лицензией ГПЛ.

0
Нарушитель
 Аватар для bodya_men
54 / 55 / 8
Регистрация: 01.07.2014
Сообщений: 1,021
29.05.2016, 21:18  [ТС]
Evg, GCC делится на несколько этапов: фронтэнд и бэкэнд.
Фронтэнд анализирует код и выстраивает дерево токенов, а бэкэнд уже генерирует листинг на асм и пинает его в GAS
0
Evg
Эксперт CАвтор FAQ
 Аватар для Evg
21281 / 8305 / 637
Регистрация: 30.03.2009
Сообщений: 22,660
Записей в блоге: 30
30.05.2016, 08:51
Я прекрасно знаю, что такое фронтенд и бэкенд. Я не понимаю, к чему эти фразы вообще были написаны

Цитата Сообщение от bodya_men Посмотреть сообщение
и выстраивает дерево токенов
Это не так, но не важно
0
Нарушитель
 Аватар для bodya_men
54 / 55 / 8
Регистрация: 01.07.2014
Сообщений: 1,021
30.05.2016, 10:59  [ТС]
Evg, черт его знает, не каждую же строку парсить?
0
Игогошка!
 Аватар для ct0r
1801 / 708 / 44
Регистрация: 19.08.2012
Сообщений: 1,367
30.05.2016, 11:23
Цитата Сообщение от bodya_men Посмотреть сообщение
Я слышал что G++ и MSVC используют lex и bison для построения дерева токенов и парсинга.
VC - я не в курсе. GCC использовал когда-то давно, но сейчас, понятное дело, нет.

Цитата Сообщение от bodya_men Посмотреть сообщение
А клэнг свой какой то язык, который обрабатывает бэкэнд.
У Clang ручной парсер. А язык (точнее IR), который идет на вход бэкенду, тут вообще не в тему.

Цитата Сообщение от bodya_men Посмотреть сообщение
Правда ли что регулярки и генераторы парсеров медленее чем обычный нативный код.
Все зависит от того, какая грамматика, как написан код, насколько подробные сообщения об ошибках, и тд.

Цитата Сообщение от Evg Посмотреть сообщение
На lex/bison, думается, опухнешь это делать
Факт, грамматика С++ не подходит для адекватного разбора и диагностики flex/bison'ом.
0
Нарушитель
 Аватар для bodya_men
54 / 55 / 8
Регистрация: 01.07.2014
Сообщений: 1,021
30.05.2016, 11:49  [ТС]
ct0r, на них же разбирают пыху, бэйсик и кучу других ЯП
0
Игогошка!
 Аватар для ct0r
1801 / 708 / 44
Регистрация: 19.08.2012
Сообщений: 1,367
30.05.2016, 13:19
Цитата Сообщение от bodya_men Посмотреть сообщение
на них же разбирают пыху, бэйсик и кучу других ЯП
А еще калькуляторы . Но тема вроде про С++, а не про что-то еще.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
30.05.2016, 13:19
Помогаю со студенческими работами здесь

Различия в yasm и gcc assembler
Добрый день. Взял код с http://ru.wikibooks.org/wiki/Ассемблер_в_Linux_для_программистов_C .data /*...

Формула регулярных выражений
Программа выводит строку string s, которая содержит текст: Файл РО№121.19 Требуется считать ее с помощью регулярных выражений,...

Тестер регулярных выражений
Решил попробовать написать тестер регулярных выражений по типу как на этом сайте, только на порядок проще. Но проблема в том, что никак не...

Шаблон регулярных выражений
Приветствую всех. Читаю книгу и столкнулся с неточностью. В главе регулярные выражения , приведен пример $pattern = /##isu/; ...

Несколько регулярных выражений
Извиняюсь за такой вопрос, но всё таки сам не смог составить этого Мне нужно фильтровать ввод в поле, чтобы вводились только нужные...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
13
Ответ Создать тему
Новые блоги и статьи
Автоматическое создание документа при проведении другого документа
Maks 29.03.2026
Реализация из решения ниже выполнена на нетиповых документах, разработанных в конфигурации КА2. Есть нетиповой документ "ЗаявкаНаРемонтСпецтехники" и нетиповой документ "ПланированиеСпецтехники". В. . .
Настройка движения справочника по регистру сведений
Maks 29.03.2026
Решение ниже реализовано на примере нетипового справочника "ТарифыМобильнойСвязи" разработанного в конфигурации КА2, с целью учета корпоративной мобильной связи в коммерческом предприятии. . . .
Автозаполнение реквизита при выборе элемента справочника
Maks 27.03.2026
Программный код из решения ниже на примере нетипового документа "ЗаявкаНаРемонтСпецтехники" разработанного в конфигурации КА2. При выборе "Спецтехники" (Тип Справочник. Спецтехника), заполняется. . .
Сумматор с применением элементов трёх состояний.
Hrethgir 26.03.2026
Тут. https:/ / fips. ru/ EGD/ ab3c85c8-836d-4866-871b-c2f0c5d77fbc Первый документ красиво выглядит, но без схемы. Это конечно не даёт никаких плюсов автору, но тем не менее. . . всё может быть. . .
Автозаполнение реквизитов при создании документа
Maks 26.03.2026
Программный код из решения ниже размещается в модуле объекта документа, в процедуре "ПриСозданииНаСервере". Алгоритм проверки заполнения реализован для исключения перезаписи значения реквизита,. . .
Команды формы и диалоговое окно
Maks 26.03.2026
1. Команда формы "ЗаполнитьЗапчасти". Программный код из решения ниже на примере нетипового документа "ЗаявкаНаРемонтСпецтехники" разработанного в конфигурации КА2. В качестве источника данных. . .
Кому нужен AOT?
DevAlt 26.03.2026
Решил сделать простой ланчер Написал заготовку: dotnet new console --aot -o UrlHandler var items = args. Split(":"); var tag = items; var id = items; var executable = args;. . .
Отправка уведомления на почту при создании или изменении элементов справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере типового справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной записи электронной. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru