Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/4: Рейтинг темы: голосов - 4, средняя оценка - 4.75
Эксперт .NET
 Аватар для Casper-SC
4434 / 2094 / 404
Регистрация: 27.03.2010
Сообщений: 5,657
Записей в блоге: 1

Какие-то странности с html, из-за этого трудности с парсингом в HtmlAgilityPack.dll

28.01.2012, 17:21. Показов 888. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Есть таблица в html коде:
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
<table cellspacing="0" cellpadding="0" width="100%" border="1">
        <tbody>
        <tr>
          <th>Время</th>
          <th>Этап</th>
          <th>Номер</th>
        </tr>
        <tr bgcolor="silver">
          <td>17:05:44</td>
          <td>Первый</td>
          <td>1</td>
        <tr bgcolor="silver">
          <td>17:09:44</td>
          <td>Второй</td>
          <td>1</td>
        <tr bgcolor="silver">
          <td>22:13:12</td>
          <td>Третий</td>
          <td>1</td>
        <tr>
          <td bordercolor="white"><strong>Что-то туту было</strong></td>
        </tr>
        </tr>
        </tr>
        </tr>
        </tbody>
</table>
Она же и на скриншоте, но открыта гугл хромом. И на нём видно, что там закрывающие теги </tr> расположены там, где по идее мне и нужно, а на реальном html коде они почему-то в самом низу, кроме заголовка таблицы. Вот из-за этой неправильной вложенности проблемы с парсингом значений из этой таблицы. Реальная таблица примерна такая же, только элементов в ней больше, так для краткости сократил. То есть я получаю во время парсинга узел содержащий html код, который я выложил в этой теме.
Миниатюры
Какие-то странности с html, из-за этого трудности с парсингом в HtmlAgilityPack.dll  
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
28.01.2012, 17:21
Ответы с готовыми решениями:

Трудности с HtmlAgilityPack
Добрый день, форумчане. Осваиваю HtmlAgilityPack. Пытаюсь из заранее загруженной страницы получить данные. А именно: Есть страница...

Чтение HTML-страницы с ее парсингом
как вернуть код интернет страницы средствами VB для дальнейшего вычленения нужных данных со страницы?

Парсинг HTML с HtmlAgilityPack
Всем привет! Я новичок в программировании. Очень нужна помощь по теме!! Суть проблемы: Пытаюсь парсить страницу...

1
Эксперт .NET
 Аватар для Casper-SC
4434 / 2094 / 404
Регистрация: 27.03.2010
Сообщений: 5,657
Записей в блоге: 1
28.01.2012, 17:22  [ТС]
Кое-что выяснил. На самом деле помоему в самом Html документе просто нету закрывающих тегов </tr> и видимо библиотека HtmlAgilityPack.dll умеет их добавлять, но добавляет не туда. Что делать? Как парсить такой кривой документ? Вот я скопировал код из самого документа, тот что выше я через HtmlAgilityPack.dll получал.

HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
  <TR>
    <TD>
      <TABLE cellSpacing=0 cellPadding=0 width="100%" border=1>
        <TBODY>
        <TR>
          <TH>Время</TH>
          <TH>Этап</TH>
          <TH>Номер</TH>
        </TR>
        <TR bgColor=silver>
          <TD>17:05:44</TD>
          <TD>Первый</TD>
          <TD>1</TD>
        <TR bgColor=silver>
          <TD>17:09:44</TD>
          <TD>Второй</TD>
          <TD>1</TD>
        <TR bgColor=silver>
          <TD>22:13:12</TD>
          <TD>Третий</TD>
          <TD>1</TD>
        <TR>
          <TD borderColor=white><STRONG>Тут что-то было</STRONG></TD>
        </TR>
       </TBODY>
      </TABLE>
    </TD>
  </TR>
Уже часа 2 убил на поиски, в чём же причина глюков с парсингом. Походу придётся парсить не как надо, а через одно место с всякими сплитами html кода, чтобы получить строки, проходиться по строкам, где разделителем строк таблицы будет <TR bgColor=silver>. Нда...
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
28.01.2012, 17:22
Помогаю со студенческими работами здесь

Парсинг HTML и htmlagilitypack
Здравствуйте, задался целью написать парсер расписания ВУЗ'a. Хочу достать элемент ,например. &lt;p&gt;Основы учения о полезных ископ...

HtmlAgilityPack.dll, не получается получить доступ к таблице
/// &lt;summary&gt;Получить информацию о документе включающую его тип&lt;/summary&gt; public DocumentInfo SearchSign(string fileName) ...

В файл HTML записан HTML код с выполнением скрипта. Сформировать новое окно из этого HTML кода (c php)
php используется для взятия переменной с сервера, поэтому требуется php переменная. Сейчас я поместил файлы в один каталог, просто для...

Странности какие-то прям...
Сегодня заметил порожающее глаз явление. Недавно у меня появился мой второй блог, никуда не добавлялся, нигде не фиксировался. Вообщем...

HtmlAgilityPack и Html страница со сложными таблицами
сложные эт примерно так table tr table tr table tr td Fr ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Подключение Box2D v3 к SDL3 для Android: физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
Влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru