Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.50/8: Рейтинг темы: голосов - 8, средняя оценка - 4.50
Эксперт .NET
4353 / 2016 / 391
Регистрация: 27.03.2010
Сообщений: 5,492
Записей в блоге: 1
1

HtmlAgilityPack.dll, не получается получить доступ к таблице

18.01.2012, 03:42. Показов 1537. Ответов 3
Метки нет (Все метки)

C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
        /// <summary>Получить информацию о документе включающую его тип</summary>
        public DocumentInfo SearchSign(string fileName)
        {
            //если никакой признак найден не будет, то docType так и останется None
            DocumentType docType = DocumentType.None;            
            HtmlDocument htmlDoc = new HtmlDocument();
            htmlDoc.Load(fileName);
            HtmlNode htmlNode = htmlDoc.DocumentNode.SelectSingleNode(
                                          "html/body/form/div/table/tbody/tr/td/h2");
            if (htmlNode != null)
            {
                if (Regex.IsMatch(htmlNode.InnerText, @"бла - бла \d+"))
                    docType = DocumentType.BlaBla_Version1;
            }
            return new DocumentInfo(docType, fileName);
        }

На скриншоте показана структура html документа. И кто-нибудь знает какую-нибудь книгу или сайт, где на примерах показывают как пользоватьсяXPath? Ненагуглил ничего толкового, ну википедия, пара десятков сайтов, но нигде толково не объясняется. Вот та же ситуация с регулярными выражениями, вроде есть FAQ тут, а всё равно не ясно, что как работает, пока не нашёл книгу "Регулярные выражения. Дж. Фридл", так и не врубался, как же правильно их составлять, прочитал 41 страницу, уже кое-что понимаю и для большинства случаев могу составить без проблем регулярные выражения, тут та же ситуация с XPath, было бы толковое объяснение, небыло бы проблем. Это я всё написал для тех, у кого появилось желание послать меня гуглить и т.д.

Скриншот с HTML кодом приложил:
Миниатюры
HtmlAgilityPack.dll, не получается получить доступ к таблице  
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
18.01.2012, 03:42
Ответы с готовыми решениями:

Как получить доступ к таблице в .mdb-файле
Не получается изменить данные в таблице Access, получается только извлечение данных. Подскажите,...

Не получается получить доступ к базе данных
Изменил пароль к учётной записи root согласно инструкциям: mysql&gt; UPDATE user SET...

Получить доступ из dll к данным из программы
Есть dll к программме А на C++ и есть программа Б на C#. Необходимо получить доступ из dll к данным...

Не получается получить доступ к некоторым разделам Реестра
При помощи команд subinacl добился полного доступа для пользователя System (Разрешения...

3
Эксперт .NET
4353 / 2016 / 391
Регистрация: 27.03.2010
Сообщений: 5,492
Записей в блоге: 1
18.01.2012, 03:50  [ТС] 2
Если использовать такой способ:
C#
1
HtmlNode htmlNode = htmlDoc.DocumentNode.SelectSingleNode("html/body/form");
То в htmlNode.OuterHtml находится такой код:
<form id="Form1" name="Form1" action="PaspUnrs.aspx?heatno=3105152&amp;unrs=3&amp;heatid=3 72019" method="post">
Странно, я думал будет ещё что-то вложенное в form, ведь судя по структуре документа (см. скриншот), там есть вложенные элементы.
0
1267 / 968 / 113
Регистрация: 12.01.2010
Сообщений: 1,971
18.01.2012, 04:29 3
OuterHtml
Это же Outer, он же как раз и означает "код содержащий искомый элемент"
там еще есть InnerHtml вот в нем как раз будет что надо
1
Эксперт .NET
4353 / 2016 / 391
Регистрация: 27.03.2010
Сообщений: 5,492
Записей в блоге: 1
18.01.2012, 04:48  [ТС] 4
Ок, с этим ясно. Я оказывается смотрел один html документ (тот что на скриншоте), а парсил другой (путь к файлу забыл поменять). Вот у меня и не то находило. Ща всё исправил. Вот не могу получить доступ к
XML
1
<span id="lbUebHeat">
На скриншоте видно структуру документа и можно увидеть путь к span (хотя мне вроде видно путь, но как его строить в запросе, что-то не очевидно).

Пробую так:
C#
1
HtmlNode htmlNode = htmlDoc.DocumentNode.SelectSingleNode("html/body/span[@id=\"lbUebHeat\"]");
Пробовал и этот путь: "html/body/table/tbody/span[@id=\"lbUebHeat\"]". Что только не пробовал, никак не получается.

И так пробовал: "html/body/form/div/table/tbody/tr/td/h2" и ещё десятки варинатов наугад от безысходности

Добавлено через 13 минут
Ура! Нашёл рабочий путь:
C#
1
2
HtmlNode htmlNode = htmlDoc.DocumentNode.SelectSingleNode(
                               "html/body/div/table/tbody/tr/td/h2/span[@id=\"lbUebHeat\"]");
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
18.01.2012, 04:48

Не получается получить доступ из одного VLAN в другой
У меня не получается получить доступ из одного VLAN в другой. Из 10 в 20-ый и наоборот. Подскажите...

Не получается получить доступ к элементу внутри DataTemplate
В чем моя ошибка, подскажите пожалуйста. VisualTreeHelper.GetChildrenCount(parent) - данный метод...

Как получить доступ к функциям bass.dll
Подскажите как подключить dll bass скачал ее и как ее подключить в проекте что бы можно было...

Как получить доступ к содержимому ячеек в таблице на стороне сервера?
Таблица (HTML) построена так: &lt;% For i = 0 to N %&gt; &lt;TR&gt; &lt;TD&gt;&lt;asp:TextBox id='txtMeavteah'...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2022, CyberForum.ru