Форум программистов, компьютерный форум CyberForum.ru

Регулярное выражение для парсинга слов, заключенных в звездочки - C++

Восстановить пароль Регистрация
 
ЛеЖиК)
 Аватар для ЛеЖиК)
157 / 60 / 1
Регистрация: 29.04.2011
Сообщений: 630
08.01.2013, 12:35     Регулярное выражение для парсинга слов, заключенных в звездочки #1
помогите составить регулярное.
Необходимо, чтобы оно выдергивало из текста слова, расположенных между звездочек
например:
текст : abs *ult* ghf *stk*. Fhht *ghfgh*, *fghfgh*.
должно вернуть: ult,stk,ghfgh,fghfgh

я думаю в регулярке должно проверяться, что бы слово находилось между звездочек, и в нем не было переводов строки и пробелов
сам не знаю как это написать
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
08.01.2013, 12:35     Регулярное выражение для парсинга слов, заключенных в звездочки
Посмотрите здесь:

C++ Поиск и вывод слов, заключенных в скобки
C++ Регулярное выражение
Составить регулярное выражение C++
C++ Не работает регулярное выражение
C++ Регулярное выражение
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Kastaneda
Модератор
Эксперт С++
 Аватар для Kastaneda
4236 / 2769 / 218
Регистрация: 12.12.2009
Сообщений: 7,104
Записей в блоге: 1
Завершенные тесты: 1
08.01.2013, 12:52     Регулярное выражение для парсинга слов, заключенных в звездочки #2
Думаю для данного случая проще использовать split()
http://www.cplusplus.com/faq/sequences/strings/split/
ЛеЖиК)
 Аватар для ЛеЖиК)
157 / 60 / 1
Регистрация: 29.04.2011
Сообщений: 630
08.01.2013, 13:06  [ТС]     Регулярное выражение для парсинга слов, заключенных в звездочки #3
Kastaneda, спасибо.
Можно пример кода, по русски не могу ничего найти про эту функцию, а по Вашей ссылке мало что понимаю
Kastaneda
Модератор
Эксперт С++
 Аватар для Kastaneda
4236 / 2769 / 218
Регистрация: 12.12.2009
Сообщений: 7,104
Записей в блоге: 1
Завершенные тесты: 1
08.01.2013, 13:18     Регулярное выражение для парсинга слов, заключенных в звездочки #4
Ну например вот http://liveworkspace.org/code/tBtGc
Там осталось от точек и запятых избавиться.

Добавлено через 2 минуты
Не, лучше вот http://liveworkspace.org/code/tBtGc
Осталось только от пустых строк избавиться.

Добавлено через 1 минуту
ссылки однинаковые, потому что я на сайте тот же код правил.

Добавлено через 1 минуту
если интересно вот что было по первой ссылке http://liveworkspace.org/code/45AYij
ЛеЖиК)
 Аватар для ЛеЖиК)
157 / 60 / 1
Регистрация: 29.04.2011
Сообщений: 630
08.01.2013, 13:23  [ТС]     Регулярное выражение для парсинга слов, заключенных в звездочки #5
так код выводит все слова, то есть " ghf " он тоже считает за слово
получается мы просто разбили текст на части, по звездочкам...
Мне придется еще раз перебрать массив, и исключить слова с пробелами?
Kastaneda
Модератор
Эксперт С++
 Аватар для Kastaneda
4236 / 2769 / 218
Регистрация: 12.12.2009
Сообщений: 7,104
Записей в блоге: 1
Завершенные тесты: 1
08.01.2013, 13:28     Регулярное выражение для парсинга слов, заключенных в звездочки #6
Цитата Сообщение от ЛеЖиК) Посмотреть сообщение
так код выводит все слова, то есть " ghf " он тоже считает за слово
А, я не правильно задание понял, да тут тогда лучше регулярки использовать.
diagon
Higher
 Аватар для diagon
1920 / 1186 / 49
Регистрация: 02.05.2010
Сообщений: 2,925
Записей в блоге: 2
08.01.2013, 14:36     Регулярное выражение для парсинга слов, заключенных в звездочки #7
Разве что как-то так
http://liveworkspace.org/code/1Nmxd1
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
#include <iostream>
#include <boost/regex.hpp>
 
int main()
{
   namespace reg = boost;
 
    reg::regex regex("\\*.*?\\*");
    std::string text = "abs *ult* ghf *stk*. Fhht *ghfgh*, *fghfgh*";
 
    reg::sregex_token_iterator it(text.begin(), text.end(), regex);
    for (; it != reg::sregex_token_iterator(); ++it)
    {
        std::cout << *it << std::endl;
    }
}
Но в плюсах нету нормальной поддержки регексов, к сожалению(по крайней мере в бусте и STL).
Да и сама задача плохо решается регексами.
ЛеЖиК)
 Аватар для ЛеЖиК)
157 / 60 / 1
Регистрация: 29.04.2011
Сообщений: 630
08.01.2013, 14:54  [ТС]     Регулярное выражение для парсинга слов, заключенных в звездочки #8
да, спасибо, я как раз просил эту строку regex("\\*.*?\\*");
XRuZzz
Антикодер
577 / 478 / 23
Регистрация: 15.09.2012
Сообщений: 2,429
08.01.2013, 15:43     Регулярное выражение для парсинга слов, заключенных в звездочки #9
Цитата Сообщение от diagon Посмотреть сообщение
Но в плюсах нету нормальной поддержки регексов, к сожалению(по крайней мере в бусте и STL).
Да и сама задача плохо решается регексами.
а как же <regex> из C++11?

Добавлено через 2 минуты
составил свою регулярку '\*\b([a-zA-Z]+?)\b\*' но чего то не доходит как в perl-регулярках не выделять звёздочки в поиске, а только слово между ними.

Добавлено через 9 минут

# grep -P '\*\b([a-zA-Z]+?)\b\*' 'tst'
asfdsad *234sx* *asdas* * sds* sad
** ssd *sd-* *ddfg*dfg*
* * sdf *g*
*ЮЮ><* *ntvn* *слово*
diagon
Higher
 Аватар для diagon
1920 / 1186 / 49
Регистрация: 02.05.2010
Сообщений: 2,925
Записей в блоге: 2
08.01.2013, 16:02     Регулярное выражение для парсинга слов, заключенных в звездочки #10
Цитата Сообщение от XRuZzz Посмотреть сообщение
а как же <regex> из C++11?
Он пока что только в стандарте рабочий. Ну и в clang'е возможно. В студии постоянно крашится, в гцц попросту не реализован.
В бусте есть более-менее рабочий вариант, но он плохо оптимизирован и имеет ужасный синтаксис.

Цитата Сообщение от XRuZzz Посмотреть сообщение
в perl-регулярках не выделять звёздочки в поиске
Есть lookaround'ы, однако с ними будет захватываться все, что стоит между звездочками, т.е. в примере ТСа будет выведено abs, ult, ghf...
Avazart
 Аватар для Avazart
6893 / 5133 / 250
Регистрация: 10.12.2010
Сообщений: 22,560
Записей в блоге: 17
08.01.2013, 16:15     Регулярное выражение для парсинга слов, заключенных в звездочки #11
std::regex и boost::regex

Добавлено через 2 минуты
Цитата Сообщение от diagon Посмотреть сообщение
Но в плюсах нету нормальной поддержки регексов, к сожалению(по крайней мере в бусте и STL).
А чем плох бустовский рЭгекс ?

Добавлено через 3 минуты
Цитата Сообщение от diagon Посмотреть сообщение
Есть lookaround'ы, однако с ними будет захватываться все, что стоит между звездочками, т.е. в примере ТСа будет выведено abs, ult, ghf...
Если вы про "жадность" выражения то .* нужно заменить на .*?
diagon
Higher
 Аватар для diagon
1920 / 1186 / 49
Регистрация: 02.05.2010
Сообщений: 2,925
Записей в блоге: 2
08.01.2013, 16:18     Регулярное выражение для парсинга слов, заключенных в звездочки #12
Цитата Сообщение от Avazart Посмотреть сообщение
А чем плох бустовский рЭгекс ?
Я же писал выше.

Цитата Сообщение от Avazart Посмотреть сообщение
Если вы про "жадность" выражения то .* нужно заменить на .*?
Оно и так нежадное. Я про то, что в примере ТСа " ghf" тоже является словом, находящимся между звездочек.
Avazart
 Аватар для Avazart
6893 / 5133 / 250
Регистрация: 10.12.2010
Сообщений: 22,560
Записей в блоге: 17
08.01.2013, 16:21     Регулярное выражение для парсинга слов, заключенных в звездочки #13
Странно я считал boost/regex быстрым .... да и синтаксис не понимаю чем ужасен...
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
08.01.2013, 16:22     Регулярное выражение для парсинга слов, заключенных в звездочки
Еще ссылки по теме:

Регулярное выражение C++
Регулярное выражение для получения списка файлов определенного расширения C++
C++ Написать регулярное выражение для поиска слов заканчивающихся на –ing

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
diagon
Higher
 Аватар для diagon
1920 / 1186 / 49
Регистрация: 02.05.2010
Сообщений: 2,925
Записей в блоге: 2
08.01.2013, 16:22     Регулярное выражение для парсинга слов, заключенных в звездочки #14
А, черт, теперь я дочитал до конца условие.
Тогда такой регекс будет правильным.
C++
1
(?<=\\*)\w+?(?=\\*)
Yandex
Объявления
08.01.2013, 16:22     Регулярное выражение для парсинга слов, заключенных в звездочки
Ответ Создать тему
Опции темы

Текущее время: 08:17. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru