Форум программистов, компьютерный форум, киберфорум
Наши страницы
C# .NET
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
Casper-SC
Эксперт .NET
4092 / 1942 / 381
Регистрация: 27.03.2010
Сообщений: 5,345
Записей в блоге: 1
1

Какие-то странности с html, из-за этого трудности с парсингом в HtmlAgilityPack.dll

28.01.2012, 17:21. Просмотров 570. Ответов 1
Метки нет (Все метки)

Есть таблица в html коде:
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
<table cellspacing="0" cellpadding="0" width="100%" border="1">
        <tbody>
        <tr>
          <th>Время</th>
          <th>Этап</th>
          <th>Номер</th>
        </tr>
        <tr bgcolor="silver">
          <td>17:05:44</td>
          <td>Первый</td>
          <td>1</td>
        <tr bgcolor="silver">
          <td>17:09:44</td>
          <td>Второй</td>
          <td>1</td>
        <tr bgcolor="silver">
          <td>22:13:12</td>
          <td>Третий</td>
          <td>1</td>
        <tr>
          <td bordercolor="white"><strong>Что-то туту было</strong></td>
        </tr>
        </tr>
        </tr>
        </tr>
        </tbody>
</table>
Она же и на скриншоте, но открыта гугл хромом. И на нём видно, что там закрывающие теги </tr> расположены там, где по идее мне и нужно, а на реальном html коде они почему-то в самом низу, кроме заголовка таблицы. Вот из-за этой неправильной вложенности проблемы с парсингом значений из этой таблицы. Реальная таблица примерна такая же, только элементов в ней больше, так для краткости сократил. То есть я получаю во время парсинга узел содержащий html код, который я выложил в этой теме.
0
Миниатюры
Какие-то странности с html, из-за этого трудности с парсингом в HtmlAgilityPack.dll  
QA
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
28.01.2012, 17:21
Ответы с готовыми решениями:

Трудности с HtmlAgilityPack
Добрый день, форумчане. Осваиваю HtmlAgilityPack. Пытаюсь из заранее загруженной страницы...

Чтение HTML-страницы с ее парсингом
как вернуть код интернет страницы средствами VB для дальнейшего вычленения нужных данных со...

В файл HTML записан HTML код с выполнением скрипта. Сформировать новое окно из этого HTML кода (c php)
php используется для взятия переменной с сервера, поэтому требуется php переменная. Сейчас я...

Парсинг HTML с HtmlAgilityPack
Всем привет! Я новичок в программировании. Очень нужна помощь по теме!! Суть проблемы: Пытаюсь...

Парсинг HTML и htmlagilitypack
Здравствуйте, задался целью написать парсер расписания ВУЗ'a. Хочу достать элемент ,например....

1
Casper-SC
Эксперт .NET
4092 / 1942 / 381
Регистрация: 27.03.2010
Сообщений: 5,345
Записей в блоге: 1
28.01.2012, 17:22  [ТС] 2
Кое-что выяснил. На самом деле помоему в самом Html документе просто нету закрывающих тегов </tr> и видимо библиотека HtmlAgilityPack.dll умеет их добавлять, но добавляет не туда. Что делать? Как парсить такой кривой документ? Вот я скопировал код из самого документа, тот что выше я через HtmlAgilityPack.dll получал.

HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
  <TR>
    <TD>
      <TABLE cellSpacing=0 cellPadding=0 width="100%" border=1>
        <TBODY>
        <TR>
          <TH>Время</TH>
          <TH>Этап</TH>
          <TH>Номер</TH>
        </TR>
        <TR bgColor=silver>
          <TD>17:05:44</TD>
          <TD>Первый</TD>
          <TD>1</TD>
        <TR bgColor=silver>
          <TD>17:09:44</TD>
          <TD>Второй</TD>
          <TD>1</TD>
        <TR bgColor=silver>
          <TD>22:13:12</TD>
          <TD>Третий</TD>
          <TD>1</TD>
        <TR>
          <TD borderColor=white><STRONG>Тут что-то было</STRONG></TD>
        </TR>
       </TBODY>
      </TABLE>
    </TD>
  </TR>
Уже часа 2 убил на поиски, в чём же причина глюков с парсингом. Походу придётся парсить не как надо, а через одно место с всякими сплитами html кода, чтобы получить строки, проходиться по строкам, где разделителем строк таблицы будет <TR bgColor=silver>. Нда...
0
Answers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
28.01.2012, 17:22

Странности какие-то прям...
Сегодня заметил порожающее глаз явление. Недавно у меня появился мой второй блог, никуда не...

HtmlAgilityPack.dll, не получается получить доступ к таблице
/// &lt;summary&gt;Получить информацию о документе включающую его тип&lt;/summary&gt; public...

Отпарсить html страницу (HtmlAgilityPack, xPath)
Всем привет. Может кто-нибудь подскажет, как с помощью HtmlAgilityPack и xPath отпарсить эту...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2020, vBulletin Solutions, Inc.