Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.86/7: Рейтинг темы: голосов - 7, средняя оценка - 4.86
1 / 1 / 0
Регистрация: 24.02.2012
Сообщений: 19

Как и чем распарсить код Html-страницы

04.03.2012, 01:03. Показов 1526. Ответов 9
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброе время суток!
Вот допустим, в html документе есть слово Транспорт, после которого идет такая строка <span class="paste_cat_reset">(9690)</span>
как мне вытащить цифры 9690?
Огромное спасибо за помощь!
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
04.03.2012, 01:03
Ответы с готовыми решениями:

Как распарсить строку с HTML-страницы
Здравствуйте форумчанены =) Подскажите, нужно из строки html файла, примерного вида &lt;area href=&quot;http://site.com/p2&quot;...

Как распарсить код интернет-страницы
Использовал такой код Dim URL As String Dim XMLHTTP Dim strTxt As String URL$ =...

Распарсить код HTML
Нужна помощь в реализации поиска в html документе. Например кусок кода &lt;/div&gt;&lt;span...

9
87 / 85 / 10
Регистрация: 04.04.2011
Сообщений: 221
04.03.2012, 01:12
Получить код страницы в текстовую переменную. Найти там позицию текста <span class="paste_cat_reset">(, затем позицию текста )</span> и между ними взять подстроку.

Или регулярку использовать.
0
1 / 1 / 0
Регистрация: 24.02.2012
Сообщений: 19
04.03.2012, 01:13  [ТС]
Цитата Сообщение от shapod Посмотреть сообщение
Получить код страницы в текстовую переменную. Найти там позицию текста <span class="paste_cat_reset">(, затем позицию текста )</span> и между ними взять подстроку.

Или регулярку использовать.
набросай пожалуйста примерный код, и если программа там не найдет ничего, можно ли будет проверить условием переменную и вывести что-нибудь и т.д.?
0
87 / 85 / 10
Регистрация: 04.04.2011
Сообщений: 221
04.03.2012, 01:19
Как-то так. (может где-то опечатался, код не проверял)
C#
1
2
3
4
5
6
7
8
9
10
int StartPos = -1, FinishPos = -1;
string findText = "";
if ((StartPos = htmlText.IndexOf("<span class=\"paste_cat_reset\">(")) > -1)
{
if ((FinishPos = htmlText.IndexOf(")</span>"), StartPos+1)) > -1)
{
StartPos += ("<span class=\"paste_cat_reset\">(")).Length;
findText = htmlText.Substring(StartPos,  FinisPos - StartPos);
}
}
1
1 / 1 / 0
Регистрация: 24.02.2012
Сообщений: 19
04.03.2012, 01:25  [ТС]
Цитата Сообщение от shapod Посмотреть сообщение
Как-то так. (может где-то опечатался, код не проверял)
C#
1
2
3
4
5
6
7
8
9
10
int StartPos = -1, FinishPos = -1;
string findText = "";
if ((StartPos = htmlText.IndexOf("<span class=\"paste_cat_reset\">(")) > -1)
{
if ((FinishPos = htmlText.IndexOf(")</span>"), StartPos+1)) > -1)
{
StartPos += ("<span class=\"paste_cat_reset\">(")).Length;
findText = htmlText.Substring(StartPos,  FinisPos - StartPos);
}
}
объясни пожалуйста предпоследнюю строчку?)
0
87 / 85 / 10
Регистрация: 04.04.2011
Сообщений: 221
04.03.2012, 01:27
Предпоследняя строчка содержит закрывающую скобку. Как ее объяснять?
Зачем выделять весь код, если вопрос только к одной строке - цитируй то, к чему вопрос.
0
1 / 1 / 0
Регистрация: 24.02.2012
Сообщений: 19
04.03.2012, 01:32  [ТС]
Цитата Сообщение от shapod Посмотреть сообщение
StartPos += ("<span class=\"paste_cat_reset\">(")).Length;
вот это
и почему, в выделения апострофа попадают круглые ковычки?
0
87 / 85 / 10
Регистрация: 04.04.2011
Сообщений: 221
04.03.2012, 01:39
StartPos изначально будет содержать позицию первого символа искомой подстроки, а тебе нужно найти то, что будет после последнего. Для этого я к позиции первого символа прибавляю длину искомой строки.

ОФФ: Если учишь программирование, я бы посоветовал заняться основами алгоритмов и изучению хелпов по тому языку, на котором пишешь.
1
 Аватар для Mdh
1 / 1 / 0
Регистрация: 12.02.2012
Сообщений: 8
04.03.2012, 20:38
Цитата Сообщение от shapod Посмотреть сообщение
Как-то так. (может где-то опечатался, код не проверял)
C#
1
2
3
4
5
6
7
8
9
10
int StartPos = -1, FinishPos = -1;
string findText = "";
if ((StartPos = htmlText.IndexOf("<span class=\"paste_cat_reset\">(")) > -1)
{
if ((FinishPos = htmlText.IndexOf(")</span>"), StartPos+1)) > -1)
{
StartPos += ("<span class=\"paste_cat_reset\">(")).Length;
findText = htmlText.Substring(StartPos,  FinisPos - StartPos);
}
}
А какие библиотеки следует подключать?
0
87 / 85 / 10
Регистрация: 04.04.2011
Сообщений: 221
04.03.2012, 20:42
Mdh, куда подключать? В приведенном коде стандартные классы - все в пространстве System присутствует.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
04.03.2012, 20:42
Помогаю со студенческими работами здесь

Как сохранить HTML-код страницы?
Есть 200 ссылок в .txt, нужно сохранить все html страниц. Как сохранить html страницу целеком или отдельный код, например: &lt;div...

Как получить html-код страницы?
как получить html-код страницы методами js и потом его использовать в личных целях

Как изменить код HTML страницы
Проблема вполне простая в понимании, но трудна в реализации. В Joomla 3.4.8 создана статья, заголовок которой мне необходимо изменить. В...

Как получить код html-страницы
Здравствуйте. Знаю, что этот вопрос уже задавали на этом форуме, но я снова задаю, потому что там я не нашел своего ответа. И так. Я...

Как получить код HTML страницы?
КАК получить код HTML страницы в переменную, неиспользую OCX'ов Ну всмысле без Winsock msInet итп...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru