|
6 / 6 / 6
Регистрация: 09.12.2013
Сообщений: 104
|
|
RegExp парсинг сайта26.11.2016, 02:49. Показов 820. Ответов 2
Метки нет (Все метки)
Друзья, помогите реализовать одну штуку. Есть страница с товарами. Мне нужно заходить на каждый товар, распарсивать его , а после возвращаться к исходному списку продолжать так делать с каждым объектом. Как можно сделать так? Есть какой-то механизм? На входе в парсер одна общая страница с товарами.
Возможно распарсеные данные сразу запихивать в xlsx файл? Может есть какая-то библиотека для удобной работы с ексель-файлами? И самый главный вопрос чем лучше парсисить сайт: RegExp или HtmlAgilityPack? Желательно с пояснениями почему вы отдаёте голос за то или другое.
0
|
|
| 26.11.2016, 02:49 | |
|
Ответы с готовыми решениями:
2
regexp парсинг ссылок
Парсинг данных с сайта или страницы сайта |
|
979 / 874 / 350
Регистрация: 26.04.2012
Сообщений: 2,647
|
|
| 26.11.2016, 13:14 | |
|
Alex_DeaD, для запросов к сайту - класс HttpClient вам в помощь.
Для работы с экселем гуглится много библиотек, но я с ними не работал, так что какая лучше не скажу. На счет RegExp и HtmlAgilityPack: тут однозначно HtmlAgilityPack. Регулярки полностью игнорируют логику HTMLа, в результате распарсить ими некоторые вещи получается очень трудно, и HTML ими поэтому никто не парсит.
0
|
|
|
Администратор
|
|
| 29.11.2016, 14:24 | |
|
Alex_DeaD, советую еще посмотреть библиотеку abot. Она упростить код обхода страниц сайта.
0
|
|
| 29.11.2016, 14:24 | |
|
Помогаю со студенческими работами здесь
3
Парсинг сайта
Парсинг сайта Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
|
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма).
На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
|
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ *
Дана цепь(не выше 3-го порядка) постоянного тока с элементами R, L, C, k(ключ), U, E, J. Программа находит переходные токи
и напряжения на элементах схемы классическим методом(1 и 2 з-ны. . .
|
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым.
Но восстановить их можно так.
Для этого понадобится консольная утилита. . .
|
|
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11
Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
|
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
|