Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.69/13: Рейтинг темы: голосов - 13, средняя оценка - 4.69
24 / 23 / 3
Регистрация: 21.04.2012
Сообщений: 253

Html парсер: программно спарсить информацию между <div></div>

24.06.2012, 23:11. Показов 2659. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый вечер)
Помогите с html парсером
Есть форум на IPB, 3 страницы с постами. Мне надо программно спарсить инфу между <div></div>
HTML5
1
2
3
4
5
6
<div id="post-49" class="postcolor">
<b>SPEED VAULT</b>
<br>
<br>
Спид Волт (англ. Speed Vault) &mdash; опорный прыжок, исполняемый на одну руку, при прямом угле к перилке. В любом варианте, но без вращения.
</div>
(вырезал большую часть сообщения, оставив кусок, а то получилось бы очень много)
Я никогда не писал программы такого вида, не знаю, как работает XPath, и вообще не знаю примерного решения этой проблемы, кроме Viking.Engine, где это делается так(офф. пример с сайта):
C#
1
string avatar = doc.GetElementbyId("profile_photo_link").ChildNodes[0].Attributes["src"].Value;
Но тогда мне надо делать цикл, как-то точно узнавая количество post-**(* - номер, которые тоже надо будет тоже знать, а идей нету)

подскажите, как это сделать, пожалуйста (

Добавлено через 25 минут
Цитата Сообщение от Tweekaz Посмотреть сообщение
Мне надо программно спарсить инфу между <div></div>
Немного глупо написал: мне надо спарсить все посты , т.е. это div с атрибутом id = "post-Номерпоста", а номер поста может быть любым
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
24.06.2012, 23:11
Ответы с готовыми решениями:

Как спарсить div class из html
&lt;div class=&quot;_6a _6b&quot;&gt; &lt;div class=&quot;_21zr _50f5 _50f7&quot;&gt; == $0 &lt;a href=&quot;http://localhost.ru/&quot;&gt;Нужный мне текст&lt;/a&gt; ...

Как вытащить все что между <div и </div> в html коде страницы?
часть html кода страницы: ..................... &lt;div class=&quot;labeled name&quot;&gt;&lt;a href=&quot;/kartashov_dima&quot; onclick=&quot;return nav.go(this,...

Как динамически встроить дополнительный контейнер div в html с контейнерами div
Имеется HTML страница с контейнерами div ..... &lt;div class=&quot;col-sm-6&quot;&gt; &lt;div class=&quot;form-group...

3
 Аватар для sasha0192
51 / 51 / 7
Регистрация: 23.01.2012
Сообщений: 449
24.06.2012, 23:40
Пришлите более большой кусок! кода
0
24 / 23 / 3
Регистрация: 21.04.2012
Сообщений: 253
24.06.2012, 23:46  [ТС]
_http://parkourforum.ru/index.php?showtopic=5
я думаю, что Вам так будет проще )
Надеюсь, ссылки на такие сайты не запрещены

урок по парсингу, кусок кода которого, я выложил
0
 Аватар для Yukikaze
352 / 331 / 49
Регистрация: 12.12.2011
Сообщений: 563
25.06.2012, 01:43
C#
1
2
3
4
var nodes = doc.DocumentNode.SelectNodes("//div[starts-with(@id, 'post-')]");
if(nodes.Any())
   foreach(var node in nodes)
      Console.WriteLine(node.InnerText);
Должно вытащить все посты на странице, если я конечно нигде не ошибся

Добавлено через 25 минут
А лучше вот так
C#
1
var nodes = doc.DocumentNode.SelectNodes(@"//div[@id[translate(.,'0123456789','') = 'post-']]");
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
25.06.2012, 01:43
Помогаю со студенческими работами здесь

Вписать код html страницы в <div></div>
Доброго времени суток :) Т.к. я профан в JS, а скорей новичок :) У меня на сайте есть папка там есть html или txt (посоветуйте как...

Как изменить значения div в css, чтобы расстояния между блоками div не было?
Приветствую! Не могу решить такую задачу. Имеется общая обертка div (wrap). Внутри div-wrap имеется 3 div - header, content и foot. При...

Сдвигается верстка при добавлении DIV с Ajax-контентом (теряется связь между DIV)
Заказал я в общем дизайн и верстку на фрилансе, начал писать код и столкнулся с проблемкой: В цикле JS подгружается динамически контент....

Как отделить отдельный блок div со всем содержимым в нём html коде от всего кода, в котором этот div находится?
Здравствуйте. Есть много файлов html (70 штук) и в нём html код, такова плана: https://pastebin.com/LVSEx8em . Нужно автоматически отделить...

Вычисление выражения с=(a+b mod a*4+b div a) div 2-a div 160
Пожалуйста, посмотрите на код, уввжаемые! нужно вычислить такое выражение: с=(a+b mod a*4+b div a) div 2-a div 160 У меня неверно...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
YAFU@home — распределённые вычисления для математики. На CPU
Programma_Boinc 20.01.2026
YAFU@home — распределённые вычисления для математики. На CPU YAFU@home — это BOINC-проект, который занимается факторизацией больших чисел и исследованием aliquot-последовательностей. Звучит. . .
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит: токи, напряжения и их 1 и 2 производные при t = 0;. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru