Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/4: Рейтинг темы: голосов - 4, средняя оценка - 4.75
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
.NET 4.x

Регулярное выражение для выборки имен из html

25.11.2017, 14:53. Показов 813. Ответов 9

Студворк — интернет-сервис помощи студентам
Добрый день .
Есть код странички.
Нужна регулярка чтобы взять :
Валерий Москаленко,Виталий Петров и др. имена.
На примере этого кода подскажите пожалуйста как это реализовать:
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
<table><tbody><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=3' target='_blank'>Валерий Москаленко</a>
                        </td>
                        <td>
                            кол-во рассылок (2)
                        </td>
                        <td align='right'> <a href='autor.php?autor=3' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=6' target='_blank'>Виталий Петров</a>
                        </td>
                        <td>
                            кол-во рассылок (2)
                        </td>
                        <td align='right'> <a href='autor.php?autor=6' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=7' target='_blank'>Сергей</a>
                        </td>
                        <td>
                            кол-во рассылок (1)
                        </td>
                        <td align='right'> <a href='autor.php?autor=7' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=10' target='_blank'>Виталий Петров</a>
                        </td>
                        <td>
                            кол-во рассылок (1)
                        </td>
                        <td align='right'> <a href='autor.php?autor=10' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=11' target='_blank'>Андрей Демидов</a>
                        </td>
                        <td>
                            кол-во рассылок (3)
                        </td>
                        <td align='right'> <a href='autor.php?autor=11' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=12' target='_blank'>Сергей Комаров</a>
                        </td>
                        <td>
                            кол-во рассылок (1)
                        </td>
                        <td align='right'> <a href='autor.php?autor=12' target='_blank'><b>Перейти</b></a> </td>
                      </tr><tr>
                        <td> <div class='open_icon_humen'></div> </td>
                        <td>
                            <a href='autor.php?autor=14' target='_blank'>Елена</a>
                        </td>
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
25.11.2017, 14:53
Ответы с готовыми решениями:

Регулярное выражение для html
Здравствуйте. Начал изучать регулярные выражения... Хотелось бы увидеть пример...Не абы какой :) Дана строка: &lt;div...

Регулярное выражение для разбора html
помогите написать регулярку разбора хтмл тега

Регулярное выражение для html формы
&lt;form id=1 method=&quot;post&quot;&gt; &lt;input type=&quot;submit&quot; name=&quot;clear&quot; value=&quot;Очистить корзину&quot;&gt; &lt;table bgcolor=&quot;#696969&quot;...

9
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18288 / 14211 / 5368
Регистрация: 17.03.2014
Сообщений: 28,889
Записей в блоге: 1
25.11.2017, 15:18
AXLlow, autor=\d+' target='_blank'>([^<]+)</a>

Регулярки плохо подходят для работы с html. Лучше использовать специализированную библиотеку для парсинга html - HtmlAgilityPack или AngleSharp.
1
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
25.11.2017, 15:26  [ТС]

Я по видео туториалам начал изучать, там пока что используют регулярки, для решения моей задачи думаю хватит. Но большое спасибо за подсказку буду изучать.
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18288 / 14211 / 5368
Регистрация: 17.03.2014
Сообщений: 28,889
Записей в блоге: 1
25.11.2017, 15:31
AXLlow, к чему скриншот? Я знаю что регулярка захватывает часть html - это было сделано специально чтобы можно было найти именно имя автора. Само имя нужно брать из нумерованной группы. Именно для этого вокруг [^<]+ стоят круглые скобки.
0
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
25.11.2017, 15:37  [ТС]
я тоже знаю что вы знаете) но я нет) мне ваши комментарии относительно этого выражения и дальнейшего его обработки комплексно до получения чистого имени очень помогут А как обработать эту группу далее?
я пока не совсем владею навыками по регуляркам, правильно ли это?

C#
1
MatchCollection m1 = Regex.Matches(str, "autor=\d+' target='_blank'>([^<]+)</a>",RegexOptions.Singleline);
где str адрес нашей страницы откуда взял код, далее ваша регулярка. Дальше с m1 нужно уже имя искать или как?
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18288 / 14211 / 5368
Регистрация: 17.03.2014
Сообщений: 28,889
Записей в блоге: 1
25.11.2017, 15:44
Цитата Сообщение от AXLlow Посмотреть сообщение
где str адрес нашей странице откуда взял код
Адрес страницы? Может её html код все-таки?

Цитата Сообщение от AXLlow Посмотреть сообщение
Дальше с m1 нужно уже имя искать или как?
C#
1
2
3
4
5
6
MatchCollection matches = Regex.Matches(str, "autor=\d+' target='_blank'>([^<]+)</a>");
foreach (Match m in matches)
{
    string name = m.Groups[1].Value; // Получаем имя автора из нумерованной группы
 
}
Цитата Сообщение от AXLlow Посмотреть сообщение
я тоже знаю что вы знаете) но я нет)
Дело не в знаниях. Просто ты выложил скриншот и не написал ни слова о нем и не задал никакого вопроса. Не надо заставлять людей гадать что ты имел в виду. Лучше ясно об этом написать.
0
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
25.11.2017, 15:49  [ТС]
По скриншоту.. хотел сказать что так и не достал имя.. но ниже стало ясно что это от незнания моего.

Спасибо теперь становится ясно,

Таких групп в скобках может быть сколько угодно? и нумерация группы начинается с 1?
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18288 / 14211 / 5368
Регистрация: 17.03.2014
Сообщений: 28,889
Записей в блоге: 1
25.11.2017, 15:50
Цитата Сообщение от AXLlow Посмотреть сообщение
Таких групп в скобках может быть сколько угодно?
Да

Цитата Сообщение от AXLlow Посмотреть сообщение
и нумерация группы начинается с 1?
Да, потому что группа с индексом 0 это вся найденная строка.
1
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
25.11.2017, 15:51  [ТС]
Разобрался с вашей помощью , благодарю!
0
-22 / 1 / 2
Регистрация: 18.12.2015
Сообщений: 120
25.11.2017, 16:59  [ТС]
Все решено)
Миниатюры
Регулярное выражение для выборки имен из html  
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
25.11.2017, 16:59
Помогаю со студенческими работами здесь

Регулярное выражение для выборки даты из ЧПУ
У меня есть строка ЧПУ которую я разбиваю с помощью explode. Как из этой строки можно выбрать дату, а то мой вариант никуда не годится так...

Регулярное выражение для html
Доброго времени суток! Уважаемые знатоки, подскажите пожалуйста регулярку, которая уберет из строки все спецсимволы, кроме html тэгов (и...

Регулярное выражение для парсинга HTML
Есть текст: Код: &lt;li&gt;&lt;a...

Регулярное выражение для парсинга HTML-страницы
&lt;a href=&quot;javascript:&quot; onclick=&quot;openWindow('/public/action/organization/view?organizationId=776721','_blank', 900, 500);return...

Составить регулярное выражение для парсинга HTML
Помогите составить регулярное выражение. Нужно вытащить имя проекта из данного html текста: &lt;a class=&quot;item&quot;...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru