Форум программистов, компьютерный форум, киберфорум
C# Windows Forms
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.93/14: Рейтинг темы: голосов - 14, средняя оценка - 4.93
2 / 2 / 2
Регистрация: 03.07.2014
Сообщений: 277

Чем лучше парсить регулярками или HtmlAgility?

22.06.2015, 15:21. Показов 2887. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Имеется такой код
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
 <li class="proxy">212.82.126.32:80</li>
                    <li class="https">HTTP</li>
                    <li class="speed">1240kbit</li>
                    <li class="type">прозрачный</li>
                    <li class="country-city">
                      <div>
                        <span class="country" title="Switzerland"><span class="country-code"><span class="flag ch"></span><span class="name">CH Швейцария</span></span></span><!--
                     --><span class="city"><span>-</span></span>
                      </div>
                    </li>
                  </ul>
                  <div class="clear"></div>
                                    <ul>
                    <li class="proxy">120.197.234.166:80</li>
                    <li class="https">HTTP</li>
                    <li class="speed">134kbit</li>
                    <li class="type">прозрачный</li>
                    <li class="country-city">
                      <div>
                        <span class="country" title="China"><span class="country-code"><span class="flag cn"></span><span class="name">CN Китай</span></span></span><!--
                     --><span class="city"><span>-</span></span>
                      </div>
                    </li>
                  </ul>
                  <div class="clear"></div>
                                    <ul>
                    <li class="proxy">139.214.113.87:55336</li>
                    <li class="https">HTTP</li>
                    <li class="speed">197kbit</li>
                    <li class="type">прозрачный</li>
                    <li class="country-city">
                      <div>
                        <span class="country" title="China"><span class="country-code"><span class="flag cn"></span><span class="name">CN Китай</span></span></span><!--
                     --><span class="city"><span>Changchun</span></span>
                      </div>
                    </li>
                  </ul>
Чем его лучше спарсить регулярками или HtmlAgility ? Нужно спарсить все данные и распихать по колонкам.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
22.06.2015, 15:21
Ответы с готовыми решениями:

Как лучше парсить, из xml или json?
Вообщем посоветуйте чем лучше парсить? Есть 2 ссылки из которых нужно парсить: ...

Чем лучше парсить xml?
Лучше всего с этим справляется C++.

Чем лучше парсить Тwitter?
Подскажите пожалуйста чем лучше парсить твиттер. Хочу с помощью REST API получать данные, нужно будет собирать много данных, по этому хочу...

5
 Аватар для ksk
624 / 495 / 43
Регистрация: 05.07.2010
Сообщений: 1,589
22.06.2015, 19:45
Я бы через XElement спарсил. Он самый простой в испюльзовании парсер xml.
Регэкспы тут будут абсолютным мазохизмом. Особенно если через год захочется их прочитать.
1
2 / 2 / 2
Регистрация: 03.07.2014
Сообщений: 277
22.06.2015, 21:30  [ТС]
Цитата Сообщение от ksk Посмотреть сообщение
Я бы через XElement спарсил.
А можно документацию или парочку примеров, как пользоваться и где взять.
0
 Аватар для ksk
624 / 495 / 43
Регистрация: 05.07.2010
Сообщений: 1,589
22.06.2015, 22:16
Как читать из xml файла
https://msdn.microsoft.com/ru-... .110).aspx
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18263 / 14188 / 5366
Регистрация: 17.03.2014
Сообщений: 28,875
Записей в блоге: 1
23.06.2015, 14:14
inject, советую использовать библиотеки специально предназначенные для работы с HTML: Html Agility Pack, CsQuery и т.п. В принципе можно использовать и библиотеки предназначенные для XML, но они будут работать только если HTML следует всем правилам XML, а он не обязан этого делать. Поэтому атрибут без кавычек или тег <br> приведут к исключению. Поэтому надежнее использовать специализированные средства.
1
2 / 2 / 2
Регистрация: 03.07.2014
Сообщений: 277
24.06.2015, 19:45  [ТС]
Думал спарсить регулярками, но все сделать, как хочу не выходит. Пытался разобраться с HtmlAgility, что-то сложно все там. Ладно. Спасибо за советы. Буду пробовать.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
24.06.2015, 19:45
Помогаю со студенческими работами здесь

WCF Data Services. В чем плюсы? И чем лучше или хуже простого Web-API?
Пытаюсь разобраться с WCF Data Services. Не совсем понимаю, для чего это нужно. В интернете мало какого-то конкретного описания....

Как лучше учиться: писать консольные приложения или оконные? И если писать оконные, то на чём лучше?
На днях я узнал про Borland c++ builder и хочу воспользоваться им, но можно и писать код, что-бы было оконное приложение, так что-же лучше?...

На чем лучше писать игры - Java, C++ или C#?
Приветствую... Передо мною стоит выбор - изучать Java, C++ или C#? Хотел бы заняться игростроем.

В чем разница или что лучше (сеть)?
сеть:2 Г: GSM 850/900/1800/1900 МГц 3 Г: WCDMA: B1/2/5/8 4 Г: FDD-LTE: B1/B3/B7(U680A) 4 Г: FDD-LTE: B1/B3 (U680D) вопрос на...

Есть определенная задача. На чем лучше писать, C++ или C#
Прошу не пинать ногами, отличия C# от C++ я уже изучил. Интересует ваше мнение. Сам привык работать в Visual C++. Есть определенная задача:...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
Загрузка PNG-файла с альфа-каналом с помощью библиотеки SDL3_image на Android
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru