Форум программистов, компьютерный форум, киберфорум
Boost C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.57/7: Рейтинг темы: голосов - 7, средняя оценка - 4.57
5 / 5 / 0
Регистрация: 16.05.2012
Сообщений: 178

boost::regex_search - что-то не разберусь

23.05.2012, 18:36. Показов 1481. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Привет!
Хочу найти анкерные тексты всех ссылок и вернуть их в векторе. Не подскажите как лучше сделать? Мой не работающий вариант:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
std::vector<UnicodeString> TForm1::getGenres(UnicodeString content) {
 
    boost::wregex pattern(L".*<a href=\".+?\">(.+?)</a>.*", boost::regex::perl | boost::regex::icase);
    boost::wcmatch result;
 
    std::vector<UnicodeString> result_1;
    while (boost::regex_search(content.w_str(), result, pattern)) {
        result_1.push_back(UnicodeString(result[1].first, result[1].second - result[1].first));
    }
    return result_1;
 
}
 
Спасибо.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
23.05.2012, 18:36
Ответы с готовыми решениями:

Регулярные выражения в boost - что-то не разберусь
Привет! Глянул примеры использования boost по части регулярных выражений. Написал следующий код: void...

Снова про boost::regex_search
Привет! Хочу найти анкерные тексты всех ссылок и вернуть их в векторе. Не подскажите как лучше сделать? Мой не работающий вариант: ...

Boost::asio клиет-сервер - есть ощущение, что где-то что-то блокируется, не знаю как это дебажить
Привет! Область эта для меня новая, поэтому такие вопросы. Смотрите - есть асинхронный сервер(работает на одной io_service) и много...

3
Эксперт С++
 Аватар для Avazart
8484 / 6151 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
23.05.2012, 18:59
Не суйте туда UnicodeString используйте std::wstring и только на выходе ковертуйте.

Да и ошибки стоило бы выложить

Добавлено через 7 минут
https://www.cyberforum.ru/cpp-... 36710.html
Взять значения из сайта
1
5 / 5 / 0
Регистрация: 16.05.2012
Сообщений: 178
24.05.2012, 09:12  [ТС]
Avazart, Ошибок компиляции нет, было зацикливание. С таким вариантом находит только первый анкерный текст, остальные в вектор не попадают. vector нормально работает с UnicodeString.

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
std::vector<UnicodeString> TForm1::getGenres(UnicodeString content) {
 
    std::wstring _content(content.w_str());
    boost::wregex pattern(L".*<a href=\".+?\">(.+?)</a>.*", boost::regex::perl | boost::regex::icase);
    boost::match_results<std::wstring::const_iterator> result;
    std::wstring::const_iterator start, end;
    start = _content.begin();
    end = _content.end();
    std::vector<UnicodeString> result_1;
 
    while(regex_search(start, end, result, pattern)) {
        result_1.push_back(UnicodeString(std::wstring(result[1].first, result[1].second).c_str()));
        start = result[1].second;
    }
    return result_1;
 
}
Добавлено через 19 минут
Работающий вариант:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
std::vector<UnicodeString> TForm1::getGenres(UnicodeString content) {
 
    std::wstring _content(content.w_str());
    boost::wregex pattern(L"<a href=\".+?\">(.+?)</a>"/*, boost::regex::perl | boost::regex::icase*/);
    boost::match_results<std::wstring::const_iterator> result;
    std::wstring::const_iterator start, end;
    start = _content.begin();
    end = _content.end();
    std::vector<UnicodeString> result_1;
 
    while(boost::regex_search(start, end, result, pattern)) {
        result_1.push_back(UnicodeString(std::wstring(result[1].first, result[1].second).c_str()));
        start = result[0].second;
    }
    return result_1;
 
}
Добавлено через 6 минут
А как можно улучшить код? Например, не использовать такую громоздкую конструкцию, как:

C++
1
result_1.push_back(UnicodeString(std::wstring(result[1].first, result[1].second).c_str()));
Вносить строку в вектор без дополнительных преобразований.
0
Эксперт С++
 Аватар для Avazart
8484 / 6151 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
24.05.2012, 13:39
Не использовать Unicode в основновном коде, только при выводе в компоненты,использовать стандартный std::wstring
что бы не было путаници и код был более переносим и понятен
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
24.05.2012, 13:39
Помогаю со студенческими работами здесь

regex_search
Вообщем есть примерно такой код. Как мне записать в переменную string допустим все html теги.. Такая штука, записывает в xResults только...

Std::regex_search
Есть задача разобрать http заголок. Беру голову: std::cmatch head_parts; std::regex_search(head.c_str(), head_parts,...

Segmentation Fault regex_match и regex_search
Есть html страницы сайта, которые я паршу регулярками. Иногда происходит ошибка сегментации при определенном html коде. Как защититься...

Boost начало работы: Undefined reference to `boost::system::generic_category() '
Добрый день Собственно говоря возникла необходимость использовать boost в работе. Поставил так: sudo apt-get install boostlib-all-dev ...

Boost Log - undefined reference to `boost::system::system_category()'
Пытаюсь скомпилировать код из примеров Boost Log:#include &lt;boost/log/trivial.hpp&gt; int main(int, char*) { ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru