Форум программистов, компьютерный форум CyberForum.ru
Наши страницы

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
ЛеЖиК)
157 / 60 / 1
Регистрация: 29.04.2011
Сообщений: 633
#1

Регулярное выражение для парсинга слов, заключенных в звездочки - C++

08.01.2013, 12:35. Просмотров 649. Ответов 13
Метки нет (Все метки)

помогите составить регулярное.
Необходимо, чтобы оно выдергивало из текста слова, расположенных между звездочек
например:
текст : abs *ult* ghf *stk*. Fhht *ghfgh*, *fghfgh*.
должно вернуть: ult,stk,ghfgh,fghfgh

я думаю в регулярке должно проверяться, что бы слово находилось между звездочек, и в нем не было переводов строки и пробелов
сам не знаю как это написать
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
08.01.2013, 12:35
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Регулярное выражение для парсинга слов, заключенных в звездочки (C++):

Написать регулярное выражение для поиска слов заканчивающихся на –ing - C++
Необходимо написать регулярное выражение для поиска слов заканчивающихся на –ing и имеющие в первой части слова хотя бы одну гласную. Вот...

Регулярное выражение для выбора email - C++
написать программу, используя регулярное выражения, которая с текста выбирает и выводит только электронные адреса. объясните пожалуйста...

Написать регулярное выражение для поиска строки - C++
Доброго времени суток. Изучаю регулярные выражения. Столкнулся с проблемой. Как написать рег выр для поиска строки "port=1234" или " port...

Поиск и вывод слов, заключенных в скобки - C++
парни, помогите плз с программой. подправьте пожалуйста #include<iostream.h> #include<conio.h> #include<string.h> void main() { ...

Напишите новичку регулярное выражение для HEX ввода с разделителем :-) - C++
Привет! Нужно регулярное выражение для того, что бы можно было бы вводить только HEX символы и после каждых двух ставился бы пробел, то...

Регулярное выражение для получения списка файлов определенного расширения - C++
На С++ нужно из всех файлов выбрать те, которые, к примеру с раширением .txt, или .html Так вот, как мне сравнить регулярное выражение...

13
Kastaneda
Форумчанин
Эксперт С++
4655 / 2863 / 228
Регистрация: 12.12.2009
Сообщений: 7,273
Записей в блоге: 2
Завершенные тесты: 1
08.01.2013, 12:52 #2
Думаю для данного случая проще использовать split()
http://www.cplusplus.com/faq/sequences/strings/split/
1
ЛеЖиК)
157 / 60 / 1
Регистрация: 29.04.2011
Сообщений: 633
08.01.2013, 13:06  [ТС] #3
Kastaneda, спасибо.
Можно пример кода, по русски не могу ничего найти про эту функцию, а по Вашей ссылке мало что понимаю
0
Kastaneda
Форумчанин
Эксперт С++
4655 / 2863 / 228
Регистрация: 12.12.2009
Сообщений: 7,273
Записей в блоге: 2
Завершенные тесты: 1
08.01.2013, 13:18 #4
Ну например вот http://liveworkspace.org/code/tBtGc
Там осталось от точек и запятых избавиться.

Добавлено через 2 минуты
Не, лучше вот http://liveworkspace.org/code/tBtGc
Осталось только от пустых строк избавиться.

Добавлено через 1 минуту
ссылки однинаковые, потому что я на сайте тот же код правил.

Добавлено через 1 минуту
если интересно вот что было по первой ссылке http://liveworkspace.org/code/45AYij
1
ЛеЖиК)
157 / 60 / 1
Регистрация: 29.04.2011
Сообщений: 633
08.01.2013, 13:23  [ТС] #5
так код выводит все слова, то есть " ghf " он тоже считает за слово
получается мы просто разбили текст на части, по звездочкам...
Мне придется еще раз перебрать массив, и исключить слова с пробелами?
0
Kastaneda
Форумчанин
Эксперт С++
4655 / 2863 / 228
Регистрация: 12.12.2009
Сообщений: 7,273
Записей в блоге: 2
Завершенные тесты: 1
08.01.2013, 13:28 #6
Цитата Сообщение от ЛеЖиК) Посмотреть сообщение
так код выводит все слова, то есть " ghf " он тоже считает за слово
А, я не правильно задание понял, да тут тогда лучше регулярки использовать.
0
diagon
Higher
1929 / 1195 / 49
Регистрация: 02.05.2010
Сообщений: 2,925
Записей в блоге: 2
08.01.2013, 14:36 #7
Разве что как-то так
http://liveworkspace.org/code/1Nmxd1
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
#include <iostream>
#include <boost/regex.hpp>
 
int main()
{
   namespace reg = boost;
 
    reg::regex regex("\\*.*?\\*");
    std::string text = "abs *ult* ghf *stk*. Fhht *ghfgh*, *fghfgh*";
 
    reg::sregex_token_iterator it(text.begin(), text.end(), regex);
    for (; it != reg::sregex_token_iterator(); ++it)
    {
        std::cout << *it << std::endl;
    }
}
Но в плюсах нету нормальной поддержки регексов, к сожалению(по крайней мере в бусте и STL).
Да и сама задача плохо решается регексами.
1
ЛеЖиК)
157 / 60 / 1
Регистрация: 29.04.2011
Сообщений: 633
08.01.2013, 14:54  [ТС] #8
да, спасибо, я как раз просил эту строку regex("\\*.*?\\*");
0
XRuZzz
Антикодер
680 / 582 / 29
Регистрация: 15.09.2012
Сообщений: 2,525
08.01.2013, 15:43 #9
Цитата Сообщение от diagon Посмотреть сообщение
Но в плюсах нету нормальной поддержки регексов, к сожалению(по крайней мере в бусте и STL).
Да и сама задача плохо решается регексами.
а как же <regex> из C++11?

Добавлено через 2 минуты
составил свою регулярку '\*\b([a-zA-Z]+?)\b\*' но чего то не доходит как в perl-регулярках не выделять звёздочки в поиске, а только слово между ними.

Добавлено через 9 минут

# grep -P '\*\b([a-zA-Z]+?)\b\*' 'tst'
asfdsad *234sx* *asdas* * sds* sad
** ssd *sd-* *ddfg*dfg*
* * sdf *g*
*ЮЮ><* *ntvn* *слово*
0
diagon
Higher
1929 / 1195 / 49
Регистрация: 02.05.2010
Сообщений: 2,925
Записей в блоге: 2
08.01.2013, 16:02 #10
Цитата Сообщение от XRuZzz Посмотреть сообщение
а как же <regex> из C++11?
Он пока что только в стандарте рабочий. Ну и в clang'е возможно. В студии постоянно крашится, в гцц попросту не реализован.
В бусте есть более-менее рабочий вариант, но он плохо оптимизирован и имеет ужасный синтаксис.

Цитата Сообщение от XRuZzz Посмотреть сообщение
в perl-регулярках не выделять звёздочки в поиске
Есть lookaround'ы, однако с ними будет захватываться все, что стоит между звездочками, т.е. в примере ТСа будет выведено abs, ult, ghf...
0
Avazart
Эксперт С++
7213 / 5385 / 286
Регистрация: 10.12.2010
Сообщений: 23,790
Записей в блоге: 17
08.01.2013, 16:15 #11
std::regex и boost::regex

Добавлено через 2 минуты
Цитата Сообщение от diagon Посмотреть сообщение
Но в плюсах нету нормальной поддержки регексов, к сожалению(по крайней мере в бусте и STL).
А чем плох бустовский рЭгекс ?

Добавлено через 3 минуты
Цитата Сообщение от diagon Посмотреть сообщение
Есть lookaround'ы, однако с ними будет захватываться все, что стоит между звездочками, т.е. в примере ТСа будет выведено abs, ult, ghf...
Если вы про "жадность" выражения то .* нужно заменить на .*?
0
diagon
Higher
1929 / 1195 / 49
Регистрация: 02.05.2010
Сообщений: 2,925
Записей в блоге: 2
08.01.2013, 16:18 #12
Цитата Сообщение от Avazart Посмотреть сообщение
А чем плох бустовский рЭгекс ?
Я же писал выше.

Цитата Сообщение от Avazart Посмотреть сообщение
Если вы про "жадность" выражения то .* нужно заменить на .*?
Оно и так нежадное. Я про то, что в примере ТСа " ghf" тоже является словом, находящимся между звездочек.
0
Avazart
Эксперт С++
7213 / 5385 / 286
Регистрация: 10.12.2010
Сообщений: 23,790
Записей в блоге: 17
08.01.2013, 16:21 #13
Странно я считал boost/regex быстрым .... да и синтаксис не понимаю чем ужасен...
0
diagon
Higher
1929 / 1195 / 49
Регистрация: 02.05.2010
Сообщений: 2,925
Записей в блоге: 2
08.01.2013, 16:22 #14
А, черт, теперь я дочитал до конца условие.
Тогда такой регекс будет правильным.
C++
1
(?<=\\*)\w+?(?=\\*)
2
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
08.01.2013, 16:22
Привет! Вот еще темы с ответами:

Регулярное выражение - C++
Пишу под Qt и получил такую проблему. Почему данный код не выводит чего либо в консоль?: QString data(&quot;&lt;div class=\&quot;text\&quot;&gt;xxx:&lt;br&gt;ну...

Регулярное выражение - C++
Добрый день! Помогите расшифровать регулярное выражение, что оно ищет. (;.*|.*|)+

Регулярное выражение - C++
Дана последовательность (-1.2+3.0)+2-8/6. Надо разбить строку на символы и числа. Как нужно отредактировать этот шаблон, чтобы число с...

Составить регулярное выражение - C++
Здравствуйте, помогите пожалуйста составить регулярное выражение для поиска фамилии и инициалов, например: Иванов И. И. Всё, что я смог...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
14
Yandex
Объявления
08.01.2013, 16:22
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru