Форум программистов, компьютерный форум, киберфорум
C++ Builder
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск  
 
 
Рейтинг 5.00/18: Рейтинг темы: голосов - 18, средняя оценка - 5.00
11 / 11 / 9
Регистрация: 26.08.2011
Сообщений: 177

Применение регулярных выражений для парсинга email-ов получателей из emf-файла

16.06.2016, 13:52. Показов 3758. Ответов 22
Метки нет (Все метки)

Подскажите как применять регулярные выражения к нескольким строкам (заранее количество не известно)
Например есть текст:
C++
1
2
3
4
5
6
7
8
9
Если регулярное выражение используется для замены текста, то результатом работы будет новая текстовая строка,
Не нужная строка "текст", "Текст"...
представляющая из себя исходный текст, из которого удалены найденные подстроки (сопоставленные образцу), а вместо них подставлены строки замены (возможно, модифицированные запомненными при разборе группами символов из исходного 
нужная строка "текст2", "Текст2"...
какой-то текст "Текст2"
какой-то текст "текст2"
 
текста). Частным случаем модификации текста является удаление всех вхождений найденного образца — для чего строка замены указывается пустой.
Не нужная строка "текст3", "Текст3"...
Как не трогая остальные получить только текст2, Текст2
При этом заранее количество строк, которые будут содержать "Текст2" не известно.
Я определяю нужную строку ("нужная строка "текст2", "Текст2"...) используя Pos(), выбераю из нее первые текст2, а вот как разобрать следующие строки и вытащить из них остальные текст2?
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
16.06.2016, 13:52
Ответы с готовыми решениями:

Применение регулярных выражений для фильтра тегов
Всем доброго дня! Мне нужно реализовать функцию, которая преобразует входной текст в безопасный html-текст и разрешает использовать...

Применение регулярных выражений
Имеется список listPet = ,] нужно анализировать числа и названия животных. Сейчас все это делаю в циклах, перебирая значения...

Применение регулярных выражений к файлу
Мне нужно осуществить поиск по текстовому файлу (этак 15000 слов), можно ли не создавая переменные применить регулярку к файлу? просто...

22
11 / 11 / 9
Регистрация: 26.08.2011
Сообщений: 177
18.06.2016, 20:23  [ТС]
Кажется у меня все получилось! Спасибо вам за помощь! Сейчас буду тестировать.... если все будет хорошо покажу чего я там накрутил

Добавлено через 2 часа 21 минуту
Ну вот как-то так:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
    if(FindFirst(s_Dir+"*.eml", faAnyFile, sr)==0)   
    {
        do{
            if(!(sr.Name=="."||sr.Name=="..")){
                //int fsize = sr.Size;
                if(sr.Size > 0){
                    int atr = FileGetAttr(s_Dir+sr.Name.c_str());
                    if(atr & faHidden){}
                    else{
                        ReadedFrom="";
                        ReadedTo="";
                        ReadedData="";
                        ReadedTime="";
                        TStringList* list = new TStringList;  
                        list->LoadFromFile(s_Dir+sr.Name.c_str()); 
                        int count_string = 0; 
                        while (count_string<list->Count-1){
                            if(list->Strings[count_string].Pos("Date")>0&&list->Strings[count_string].Pos("Date")<2) {
                                re->Expression = L"((\\d+)\\s(Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)\\s(\\d+))";
                                re->Compile();
                                String s = list->Strings[count_string];
                                if(re->Exec(s)){
                                    TFormatSettings fs = TFormatSettings::Create("en-US");
                                    ReadedData = String().sprintf(L"%s-%02d-%02d", re->Match[4], IndexStr(re->Match[3], fs.ShortMonthNames, 11) + 1, re->Match[2].ToInt());
 
                                }
                                 re->Expression = L"\\d+\\S\\d+\\S\\d+";
                                 re->Compile();
                                 if(re->Exec(s)){
                                    ReadedTime=re->Match[0];
                                }
                            }
                            if(list->Strings[count_string].Pos("From")>0&&list->Strings[count_string].Pos("From")<2) {
                                re->Expression = L"(([A-Za-z0-9_-]+\\\.)*[A-Za-z0-9_-]+@[A-Za-z0-9_-]+(\\\.[A-Za-z0-9_-]+)*\\\.[A-Za-z]{2,6})";
                                re->Compile();
                                String s = list->Strings[count_string];
                                if(re->Exec(s))
                                    ReadedFrom=re->Match[1];
                            }
                            count_string++;
                        }
    std::auto_ptr<TRegExpr> rex (new TRegExpr);
    std::auto_ptr<TStringList>lst(new TStringList);
    String flag="";
    int tmp_c=0;
    lst->LoadFromFile(s_Dir+sr.Name.c_str());
 
    while (tmp_c<lst->Count-1){
        if(lst->Strings[tmp_c].Pos("To")>0&&lst->Strings[tmp_c].Pos("To")<2) {
        break;
        }
        tmp_c++;
        }
        rex->Expression = L"(([A-Za-z0-9_-]+\\\.)*[A-Za-z0-9_-]+@[A-Za-z0-9_-]+(\\\.[A-Za-z0-9_-]+)*\\\.[A-Za-z]{2,6})";
        rex->Compile();
        metka:
            if(rex->Exec(lst->Strings[tmp_c]))
                do  {
                    flag=rex->Match[0];
                    if(flag!=NULL){
                    ReadedTo+=flag+", ";
                    if(lst->Strings[tmp_c+1].Pos("Message-ID:")>0||lst->Strings[tmp_c+1].Pos("Message-ID:")>0||lst->Strings[tmp_c+1].Pos("From:")>0||lst->Strings[tmp_c+1].Pos("Reply-to:")>0)
                    break;
                    tmp_c++;
                    goto metka;
                    }
                    else
                    break;
    }
    while(rex->ExecNext());
                        ReadedTo=StringReplace(ReadedTo,"<","", TReplaceFlags()<<rfReplaceAll);
                        ReadedTo=StringReplace(ReadedTo,">","", TReplaceFlags()<<rfReplaceAll);
                        ReadedFrom=StringReplace(ReadedFrom,"<","", TReplaceFlags()<<rfReplaceAll);
                        ReadedFrom=StringReplace(ReadedFrom,">","", TReplaceFlags()<<rfReplaceAll);
                        ReadedTo.Delete(ReadedTo.Length(),1);
                        ReadedTo.Delete(ReadedTo.Length(),1);
Осталось два случая когда я не получаю адреса получателей: В письме отсутствует директива To:, либо после директивы To: не содержится адреса (но он может содержаться в следующей строке)...

Добавлено через 38 минут
Еще вопрос по регулярным выражениям: можно ли с их помощью заменить подстроку в файле.
Например текстовый файл следующего содержания:
Кликните здесь для просмотра всего текста
Разнообразный и богатый опыт[слово1] начало повседневной работы по формированию позиции влечет за собой процесс внедрения и модернизации систем массового участия. Значимость этих проблем настолько очевидна, что новая модель организационной деятельности позволяет оценить значение новых предложений. Таким образом укрепление и развитие структуры в значительной степени обуславливает создание существенных финансовых и административных условий. Повседневная практика показывает, что постоянный количественный рост и сфера нашей активности позволяет выполнять важные задания по разработке позиций, занимаемых участниками в отношении поставленных задач.

Не следует, однако забывать, что сложившаяся структура организации представляет собой интересный эксперимент проверки существенных финансовых и административных условий. Разнообразный и богатый опыт постоянный количественный рост и сфера нашей активности способствует подготовки и реализации соответствующий условий активизации.

Значимость этих проблем настолько очевидна, что укре[слово2]пление и развитие структуры требуют определения и уточнения систем массового участия. Разнообразный и богатый опыт постоянное информационно-пропагандистское обеспечение нашей деятельности позволяет выполнять важные задания по разработке существенных финансовых и административных условий. Равным образом новая модель организационной деятельности влечет за собой процесс внедрения и модернизации дальнейших направлений развития. Задача организации, в особенности же кон[слово3]сультация с широким активом позволяет выполнять важные задания по разработке позиций, занимаемых участниками в отношении поставленных задач. Задача организации, в особенности же сложившаяся структура организации требуют от нас анализа дальнейших направлений развития.

И есть 3 строковые переменные.
Возможно ли используя регулярные выражения заменить соответственно [слово1], [слово2] и [слово3] на значения имеющихся переменных?
0
191 / 52 / 19
Регистрация: 18.02.2013
Сообщений: 508
Записей в блоге: 9
18.06.2016, 21:17
Цитата Сообщение от rozalski Посмотреть сообщение
Возможно ли
возможно.
Синонимайзер
0
Супер-модератор
Эксперт Pascal/DelphiАвтор FAQ
 Аватар для volvo
33444 / 21545 / 8247
Регистрация: 22.10.2011
Сообщений: 36,995
Записей в блоге: 12
18.06.2016, 21:27
Лучший ответ Сообщение было отмечено rozalski как решение

Решение

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#include <System.IOUtils.hpp>
 
// ...
 
int ix = -1;
String st[3] = {L"раз", L"два", L"три"}; // замены
 
// не забудь объявить прототип в классе формы
String __fastcall TForm1::myReplaceFunc(TRegExpr *re)
{
    return st[++index];
}
 
// ---------------------------------------------------------------------------
void __fastcall TForm1::Button1Click(TObject *Sender)
{
    std::auto_ptr<TRegExpr>re(new TRegExpr);
    re->Expression = L"\\[слово\\d\\]";
    TFile::WriteAllText("output.txt", re->ReplaceEx(TFile::ReadAllText("input.txt"), myReplaceFunc));
}
Это нужно было?
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
18.06.2016, 21:27

Как оптимизировать применение регулярных выражений
Как оптимизировать следующий код? string a2 = Regex.Replace(x, p, @&quot;$4&quot;, RegexOptions.IgnoreCase); string a3 = Regex.Replace(x, p,...

Парсинг файла с использованием регулярных выражений
Доброго времени суток уважаемые форумчане! Есть такая тема: нужно выдернуть из определенного формата информацию. Формат файла следующий: ...

Парсинг файла с применением регулярных выражений
Приветствую всех! Ребята, подскажите. Есть файл со следующим содержимым. Необходимо с помощью регулярных выражений извлечь значения ...

Задача по обработке файла с использованием регулярных выражений
Пытаюсь решить задачу: Задан log-file с описанием четырёхдневных курсов в следующем виде: 09:20 Введение 11:00 Упражнения ...

С помощью регулярных выражений осуществить очистку файла от тегов
Написать консольное приложение, принимающее на вход путь к файлу, содержащему xhtml разметку. Приложение с помощью регулярных выражений...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
23
Ответ Создать тему
Новые блоги и статьи
[golang] Конкурентный fetcher с ограничением максимального количества одновременных HTTP запросов.
alhaos 10.06.2026
Задача Реализовать конкурентный fetcher с ограничением максимального количества одновременных HTTP запросов. Сигнатура func Fetch(urls string, maxConcurrent int) Result Пример urls :=. . .
[golang] Состояние гонки (race condition)
alhaos 10.06.2026
Состояние гонки (race condition) Состояние гонки (Race Condition) — это ошибка, возникающая при одновременном доступе нескольких горутин к одним и тем же данным без должной синхронизации. При этом. . .
Взрослые отношения, и почему они не получаются
kumehtar 09.06.2026
Когда в детстве ребёнок не получает от родителей чего-то важного, он лишается не просто приятных переживаний, а основы для формирования определённых внутренних качеств и навыков. Если ребёнок не. . .
[golang] Worker Pool
alhaos 09.06.2026
Worker Pool Worker Pool — паттерн конкурентной обработки задач в Go. Суть: фиксированное количество горутин-воркеров читают задачи из общего канала и пишут результаты в общий канал результатов. . . .
[golang] Pipeline
alhaos 08.06.2026
Pipeline Pipeline — паттерн конкурентной обработки данных в Go. Суть: данные проходят через цепочку независимых стадий, каждая из которых работает в своей горутине и общается с соседями через. . .
Свет внутри себя
kumehtar 07.06.2026
Пусть это будет здесь lIs4oanZS9Y
Программа для com-порта
Uhbif79 05.06.2026
Всем привет, давно хотел изучить Qt, начинал, бросал, потом снова начинал. И сейчас вот смог написать свою первую программу. До этого имел опыт программирования микроконтроллеров, писал прошивки на. . .
Транскрипция 55-минутного видео через Whisper: WhisperDesktop облажался, спас Google Colab[
anaschu 01.06.2026
Понадобилось получить текст из свежезагруженного видео на YouTube. Казалось бы, задача на пять минут. Заняла полтора часа. Делюсь опытом — может кому пригодится последовательность решений. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru