С Новым годом! Форум программистов, компьютерный форум, киберфорум
Boost C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/12: Рейтинг темы: голосов - 12, средняя оценка - 4.75
5 / 5 / 0
Регистрация: 16.05.2012
Сообщений: 178

Регулярные выражения в boost - что-то не разберусь

20.05.2012, 17:21. Показов 2238. Ответов 13
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Привет!
Глянул примеры использования boost по части регулярных выражений.
Написал следующий код:

C++
1
2
3
4
5
6
7
8
9
10
void TForm1::processingContent(UnicodeString content) {
 
    boost::regex xRegEx("<meta name=\"keywords\" content=\"(.*)\">");
    boost::wcmatch xResult;
    const wchar_t *in = content.c_str();
    if (boost::regex_match(in, xResult, xRegEx)) {
        ShowMessage("t");
    }
 
}
Компилятор RAD Studio C++ (C++ Builder) выдаёт ошибку:

[BCC32 Error] parser.cpp(48): E2285 Could not find a match for 'boost::regex_match<BidiIterator,Allocat or,charT,traits>(const wchar_t *,boost::wcmatch,boost::regex)'
Full parser context
parser.cpp(43): parsing: void TForm1:rocessingContent(UnicodeString)

Не подскажите как побороть такую проблему? Спасибо.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
20.05.2012, 17:21
Ответы с готовыми решениями:

boost::regex_search - что-то не разберусь
Привет! Хочу найти анкерные тексты всех ссылок и вернуть их в векторе. Не подскажите как лучше сделать? Мой не работающий вариант: ...

Boost и регулярные выражения
Добр день. У меня возникла проблема с регулярными выражениями на C++, среда RAD 2010, C++ Builder, библиотека Boost. В Memo имеется...

Регулярные выражения.Boost.
Суть вопроса такова.Я установил boost, убил на это 3 часа,но все же установил :) Так вот,все работает,никак не нарадуюсь привычным из php...

13
Эксперт С++
 Аватар для Avazart
8484 / 6151 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
20.05.2012, 18:36
Проблема в том что нехочит он почему то с wchar_t не с std::wstring в то время как с std::string работает...
Может версия boost устарелая.

Добавлено через 8 минут
Проблема в неоднозначности как подсказала VisualStudio ( wregex )

C++
1
2
3
4
5
6
7
void processingContent(UnicodeString content)
{
boost::wregex xRegEx(L"<meta name=\"keywords\" content=\"(.*)\">"); //  wregex !!!
boost::wcmatch xResult;
const wchar_t *in = content.w_str();   // w_str() !!!
if (boost::regex_match(in, xResult, xRegEx)) ShowMessage("t");
}
1
5 / 5 / 0
Регистрация: 16.05.2012
Сообщений: 178
20.05.2012, 18:59  [ТС]
Avazart, Вот так работает, но ничего не находит, хотя строка '<html><head>' присутствует. Не подскажите как исправить?

C++
1
2
3
4
5
6
7
8
void TForm1::processingContent(UnsignedString content) {
 
    boost::wregex pattern(L"<html><head>");
    boost::wcmatch result;
    if (boost::regex_match(content.w_str(), result, pattern)) ShowMessage("E");
    else ShowMessage("N");
 
}
0
Эксперт С++
 Аватар для Avazart
8484 / 6151 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
20.05.2012, 19:05
Неправильно задано регулярное выражение

http://regexpr.ru/?pattern=%2F... %3Chead%3E
http://www.boost.org/doc/libs/... yntax.html

Пробуй к примеру
C++
1
boost::wregex pattern(L"<html>(.*)<head>");
Миниатюры
Регулярные выражения в boost - что-то не разберусь  
1
5 / 5 / 0
Регистрация: 16.05.2012
Сообщений: 178
20.05.2012, 19:29  [ТС]
Текст, в котором производится поиск:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html><head><meta... и. т. д.

C++
1
2
3
4
5
6
7
8
void TForm1::processingContent(UnicodeString content) {
 
    boost::wregex pattern(L"<html>(.*)<head>");
    boost::wcmatch result;
    if (boost::regex_match(content.w_str(), result, pattern)) ShowMessage("E");
    else ShowMessage("N");
 
}
Совпадений 0. Ничего не понимаю.
0
Эксперт С++
 Аватар для Avazart
8484 / 6151 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
20.05.2012, 19:57
Так что надо найти?
И приведите пример текста?

HTML5
1
<html> тут пусто так что правильно<head>
1
5 / 5 / 0
Регистрация: 16.05.2012
Сообщений: 178
20.05.2012, 20:05  [ТС]
Avazart, Да найти то много чего надо. Сейчас хоть бы что-то найти. Вышепривёдёный код должен был поидее отработать ветку с ShowMessage("E"), но этого почему-то не происходит. Значит ничего по паттерну не найдено. Но в тексте присутствует подстрока, которая соответствует паттерну. Поэтому непонятно, почему ничего не нашёл (не нашёл <html><head>).

Добавлено через 2 минуты
Ну, к примеру, найти подстроку '<html>.*<head>'.
0
Эксперт С++
 Аватар для Avazart
8484 / 6151 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
20.05.2012, 20:06
Что при
C++
1
processingContent(L"<html>что-то<head>");
Мессадж не вылетает?
1
5 / 5 / 0
Регистрация: 16.05.2012
Сообщений: 178
20.05.2012, 20:22  [ТС]
[CPP]
processingContent(L"<html>что-то<head>");
[CPP]

Сейчас всё нормально. Отработала Ветка с ShowMessage("E"). Если даже делаю так:

[CPP]
UnicodeString str = "<html>что-то<head>";
processingContent(str);
[CPP]

Добавлено через 8 минут
Значит неудобоваримую строку возвращает:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
UnicodeString TForm1::getContent(UnicodeString url) {
 
    UnicodeString result;
    try {
        result = IdHTTP1->Get(url);
    }
    catch (EIdSocketError &exception) {
        IdHTTP1->Connected();
        result = "";
    }
    return result;
 
}
А именно IdHTTP1. Что же он с ней делает такое. В компоненте Мемо всё отображается натурально. О_о
0
Эксперт С++
 Аватар для Avazart
8484 / 6151 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
20.05.2012, 20:31
неудобоваримую
не понял.

Почитайте о том что такое регулярные выражения.
И определитесь с тем что конкретно вам надо проверить на совпадение, по тому как без этого не о чем разговаривать...
0
5 / 5 / 0
Регистрация: 16.05.2012
Сообщений: 178
20.05.2012, 20:44  [ТС]
Avazart, Строку для разбора я получаю от TForm1::getContent. Её же я отображаю для визуального просмотра в компоненте Memo1. В Memo1 полученный текст отображается как положено:

HTML5
1
2
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html><head><meta... и. т. д.
А в функцию TForm1:rocessingContent приходит кривой, раз boost::regex_match ничего не находит по паттерну "<html>(.*)<head>".

Добавлено через 5 минут
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
UnicodeString TForm1::getContent(UnicodeString url) {
 
    UnicodeString result;
    try {
        result = IdHTTP1->Get(url);
    }
    catch (EIdSocketError &exception) {
        IdHTTP1->Connected();
        result = "";
    }
    return result;
 
}
 
 
void TForm1::processingContent(UnicodeString content) {
 
    boost::wregex pattern(L"<html>(.*)<head>");
    boost::wcmatch result;
    if (boost::regex_match(content.c_str(), result, pattern)) ShowMessage("E");
    else ShowMessage("N");
 
}
 
 
void __fastcall TForm1::Button1Click(TObject *Sender) {
 
    StatusBar1->Panels->Items[0]->Text = "Статус: работа";
    run = true;
    while (run) {
        StatusBar1->Panels->Items[2]->Text = "Url: ";
        StatusBar1->Panels->Items[2]->Text += (url + entrance_point);
        Memo1->Lines->Text = getContent(url + entrance_point);
        if (Memo1->Lines->Text.Length() != 0) processingContent(Memo1->Lines->Text);
        entrance_point++;
        StatusBar1->Panels->Items[1]->Text = "Обработано: ";
        StatusBar1->Panels->Items[1]->Text += (entrance_point - start_entrance_point);
        StatusBar1->Panels->Items[1]->Text += " страниц";
    }
 
}
0
Эксперт С++
 Аватар для Avazart
8484 / 6151 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
20.05.2012, 21:23
А в функцию TForm1:rocessingContent приходит кривой, раз boost::regex_match ничего не находит по паттерну "<html>(.*)<head>".
Вообщето все правильно - совпадений нет.
Все потому что вы не понимаете что делаете... читайте про регулярки материал.
regex_match ищит точное совпадение в данном случае, а не частичное...

Добавлено через 12 минут
Пробуй использовать флаг boost::match_partial, либо измени соответсвующие регулярку.
C++
1
2
//Пример
boost::regex_match(input, what, e, boost::match_default | boost::match_partial))
1
5 / 5 / 0
Регистрация: 16.05.2012
Сообщений: 178
20.05.2012, 21:28  [ТС]
Avazart, Да, действительно, про флаги я что-то забыл. Ещё нужно же флаг поиска по всему тексту поставить, а не между двумя переводами строк. Спасибо! Думаю, завтра всё заработает. )
0
Эксперт С++
 Аватар для Avazart
8484 / 6151 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
20.05.2012, 21:34
Вы сравниваете или ищите? определитесь...

Добавлено через 1 минуту
Можно впринципи обойтись и
C++
1
boost::wregex pattern(L".*<html>(.*)<head>.*");
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
20.05.2012, 21:34
Помогаю со студенческими работами здесь

Регулярные выражения Boost::regex
Всем привет! Юзаю библиотеку boost. В частности boost::regex. Столкнулся с такой проблемой. Как заставить библиотеку обрабатывать...

Регулярные выражения Boost::regex
Всем привет, разбирал пример с учебника (регулярные выражения) и столкнулся не понятным явлением. Задание: Выбрать номера только такого...

ЧПУ. Замена строк, регулярные выражения. Как правильно использовать переменную в регулярные выражения ?
Здравствуйте! Решил реализовать ЧПУ на своем сайте. Первый этап это замена всех реальных ссылок на чпу ссылки. Так вот при замене я...

Регулярные выражения. Что почитать?
Регулярные выражения. Что почитать лучше по этой теме? Критерии выбора: 1. вменяемость описания 2. полнота информации Понятно, что...

Регулярные выражения: что значит (.*)
всем привет! объясните что значит (.*) в след строке: string pattern = &quot;Просмотров - (.*)&quot;; Match res = Regex.Match(html,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
14
Ответ Создать тему
Новые блоги и статьи
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru