-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
.NET 4.x

Регулярное выражение для выборки имен из html

25.11.2017, 14:53. Показов 841. Ответов 9

Студворк — интернет-сервис помощи студентам
Добрый день .
Есть код странички.
Нужна регулярка чтобы взять :
Валерий Москаленко,Виталий Петров и др. имена.
На примере этого кода подскажите пожалуйста как это реализовать:
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
<table><tbody><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=3' target='_blank'>Валерий Москаленко</a>
                        </td>
                        <td>
                            кол-во рассылок (2)
                        </td>
                        <td align='right'> <a href='autor.php?autor=3' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=6' target='_blank'>Виталий Петров</a>
                        </td>
                        <td>
                            кол-во рассылок (2)
                        </td>
                        <td align='right'> <a href='autor.php?autor=6' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=7' target='_blank'>Сергей</a>
                        </td>
                        <td>
                            кол-во рассылок (1)
                        </td>
                        <td align='right'> <a href='autor.php?autor=7' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=10' target='_blank'>Виталий Петров</a>
                        </td>
                        <td>
                            кол-во рассылок (1)
                        </td>
                        <td align='right'> <a href='autor.php?autor=10' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=11' target='_blank'>Андрей Демидов</a>
                        </td>
                        <td>
                            кол-во рассылок (3)
                        </td>
                        <td align='right'> <a href='autor.php?autor=11' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=12' target='_blank'>Сергей Комаров</a>
                        </td>
                        <td>
                            кол-во рассылок (1)
                        </td>
                        <td align='right'> <a href='autor.php?autor=12' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=14' target='_blank'>Елена</a>
                        </td>
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
25.11.2017, 14:53
Ответы с готовыми решениями:

Регулярное выражение для html
Здравствуйте. Начал изучать регулярные выражения... Хотелось бы увидеть пример...Не абы какой :) Дана строка: &lt;div...

Регулярное выражение для разбора html
помогите написать регулярку разбора хтмл тега

Регулярное выражение для html формы
&lt;form id=1 method=&quot;post&quot;&gt; &lt;input type=&quot;submit&quot; name=&quot;clear&quot; value=&quot;Очистить корзину&quot;&gt; &lt;table bgcolor=&quot;#696969&quot;...

9
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18308 / 14232 / 5368
Регистрация: 17.03.2014
Сообщений: 28,904
Записей в блоге: 1
25.11.2017, 15:18
AXLlow, autor=\d+' target='_blank'>([^<]+)</a>

Регулярки плохо подходят для работы с html. Лучше использовать специализированную библиотеку для парсинга html - HtmlAgilityPack или AngleSharp.
1
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
25.11.2017, 15:26  [ТС]

Я по видео туториалам начал изучать, там пока что используют регулярки, для решения моей задачи думаю хватит. Но большое спасибо за подсказку буду изучать.
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18308 / 14232 / 5368
Регистрация: 17.03.2014
Сообщений: 28,904
Записей в блоге: 1
25.11.2017, 15:31
AXLlow, к чему скриншот? Я знаю что регулярка захватывает часть html - это было сделано специально чтобы можно было найти именно имя автора. Само имя нужно брать из нумерованной группы. Именно для этого вокруг [^<]+ стоят круглые скобки.
0
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
25.11.2017, 15:37  [ТС]
я тоже знаю что вы знаете) но я нет) мне ваши комментарии относительно этого выражения и дальнейшего его обработки комплексно до получения чистого имени очень помогут А как обработать эту группу далее?
я пока не совсем владею навыками по регуляркам, правильно ли это?

C#
1
MatchCollection m1 = Regex.Matches(str, "autor=\d+' target='_blank'>([^<]+)</a>",RegexOptions.Singleline);
где str адрес нашей страницы откуда взял код, далее ваша регулярка. Дальше с m1 нужно уже имя искать или как?
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18308 / 14232 / 5368
Регистрация: 17.03.2014
Сообщений: 28,904
Записей в блоге: 1
25.11.2017, 15:44
Цитата Сообщение от AXLlow Посмотреть сообщение
где str адрес нашей странице откуда взял код
Адрес страницы? Может её html код все-таки?

Цитата Сообщение от AXLlow Посмотреть сообщение
Дальше с m1 нужно уже имя искать или как?
C#
1
2
3
4
5
6
MatchCollection matches = Regex.Matches(str, "autor=\d+' target='_blank'>([^<]+)</a>");
foreach (Match m in matches)
{
    string name = m.Groups[1].Value; // Получаем имя автора из нумерованной группы
 
}
Цитата Сообщение от AXLlow Посмотреть сообщение
я тоже знаю что вы знаете) но я нет)
Дело не в знаниях. Просто ты выложил скриншот и не написал ни слова о нем и не задал никакого вопроса. Не надо заставлять людей гадать что ты имел в виду. Лучше ясно об этом написать.
0
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
25.11.2017, 15:49  [ТС]
По скриншоту.. хотел сказать что так и не достал имя.. но ниже стало ясно что это от незнания моего.

Спасибо теперь становится ясно,

Таких групп в скобках может быть сколько угодно? и нумерация группы начинается с 1?
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18308 / 14232 / 5368
Регистрация: 17.03.2014
Сообщений: 28,904
Записей в блоге: 1
25.11.2017, 15:50
Цитата Сообщение от AXLlow Посмотреть сообщение
Таких групп в скобках может быть сколько угодно?
Да

Цитата Сообщение от AXLlow Посмотреть сообщение
и нумерация группы начинается с 1?
Да, потому что группа с индексом 0 это вся найденная строка.
1
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
25.11.2017, 15:51  [ТС]
Разобрался с вашей помощью , благодарю!
0
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
25.11.2017, 16:59  [ТС]
Все решено)
Миниатюры
Регулярное выражение для выборки имен из html  
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
25.11.2017, 16:59
Помогаю со студенческими работами здесь

Регулярное выражение для выборки даты из ЧПУ
У меня есть строка ЧПУ которую я разбиваю с помощью explode. Как из этой строки можно выбрать дату, а то мой вариант никуда не годится так...

Регулярное выражение для html
Доброго времени суток! Уважаемые знатоки, подскажите пожалуйста регулярку, которая уберет из строки все спецсимволы, кроме html тэгов (и...

Регулярное выражение для парсинга HTML
Есть текст: Код: &lt;li&gt;&lt;a...

Регулярное выражение для парсинга HTML-страницы
&lt;a href=&quot;javascript:&quot; onclick=&quot;openWindow('/public/action/organization/view?organizationId=776721','_blank', 900, 500);return...

Составить регулярное выражение для парсинга HTML
Помогите составить регулярное выражение. Нужно вытащить имя проекта из данного html текста: &lt;a class=&quot;item&quot;...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Опции темы

Новые блоги и статьи
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: показать затраченные материалы за определенный период, с возможностью вывода печатной формы отчёта с шапкой и подвалом. В качестве. . .
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru