|
-27 / 0 / 1
Регистрация: 17.03.2012
Сообщений: 72
|
|
Как парсить страницы сайтов17.03.2012, 23:17. Показов 48470. Ответов 17
Метки нет (Все метки)
0
|
|
| 17.03.2012, 23:17 | |
|
Ответы с готовыми решениями:
17
Как парсить страницы с вебсокетами Как парсить html страницы? Как парсить фрейм веб-страницы |
|
474 / 337 / 36
Регистрация: 31.05.2011
Сообщений: 1,164
|
|
| 18.03.2012, 00:07 | |
|
pos, posex, copy
чо имено те надо спарсить то?
0
|
|
| 18.03.2012, 00:16 | ||||||
|
Рассмотрим конкретный пример с загрузкой веб-страницы и получения ее html-кода. Создадим новый проект. Нанесем на форму Memo1 (туда загрузим код веб-страницы), компонент IdHTTP1 с вкладки Indy Clients и кнопку. Опишем следующее действие кнопки:
1
|
||||||
|
|
||
| 18.03.2012, 03:06 | ||
|
вчера парсил таким методом 8515 ссылок , парсил справочник, задача можно сказать не легкая, столько нужной инфы вытянуть, но оказалась на 10 строк парсило около 4 часов эти 8515 ссылок, вырезало именно то, что нужно, я остался доволен. Перед этим я писал программу парса справочника, там код был в пару сотен строк, но писал я ее очень долго, 3 дня, и все равно было не учтено все.так как со мной поделились информацией, которая привела меня в довольное состояние - поделюсь и я http://www.w3schools.com/htmldom/default.asp даны примеры на ява скрипте, но тоже самое проделывает и обычный дельфовский ТWebBrowser так же, ко всему этому можно освоить регулярные выражения, займет на изучение 1-5 часов(в зависимости от соображаловки), я лично потратил 2 часа, но потом работа становится намного обоюдной вот что за информацию я использовал, это сайт с ознакомлением, справочник и Online редактор http://phpclub.ru/detail/article/regexp_1 http://javascript.ru/basic/regular-expression http://regexpr.ru/ примерно изучив вот это, можно спокойно парсить то, что некоторым даже не под силу!!! Удобно, просто, быстро удачи
3
|
||
| 18.03.2012, 10:46 | |||
|
0
|
|||
|
|
||||
| 18.03.2012, 11:01 | ||||
|
чем я буду
Добавлено через 1 минуту
0
|
||||
| 18.03.2012, 11:09 | ||
|
0
|
||
|
|
||
| 18.03.2012, 11:20 | ||
|
парсил я конечно в дельфи, но смотрел справочник по ява скрипту какие там методы и как использоватьрегулярное выражение - качается библиотека с офф сайта производителя этой библиотеки то что парсил на днях - через компонент WebBrowser
0
|
||
|
7 / 7 / 1
Регистрация: 10.05.2009
Сообщений: 56
|
|
| 18.03.2012, 11:28 | |
|
Привет! Можно парсить регексами, но по опыту скажу, что лучше найти готовую длл. Например в C# .NET я использовал сборку AgilityPack. По моему, видел, когда ее искал, решения и для делфи..
0
|
|
| 18.03.2012, 11:44 | ||||
|
Туманишь что то...
Не по теме: А я знал?
0
|
||||
|
|
|||||||||||
| 18.03.2012, 12:08 | |||||||||||
Сообщение было отмечено как решение
Решение
вот давай примером покажу
давайте отпарсим статистику нашего форума, для этого переходим на самую главную страницу этого сайта и листаем страницу вниз, итак нашли этот раздел? я на картинке выделил его. Теперь выделяем мышкой приблизительно это место, и смотрим исходный код выделенного фрагмента, ищем за что можно зацепиться, за теги, классы или другую какую информацию. Данный фрагмент не буду приводить сюда, думаю сами его увидите. Дальше заходим в дельфи, бросаем 2 кнопки на форму, мемо и веббраузер и начинаем программировать , особо тут и программировать то нечего ![]() я зацепился за тег tbody и Id collapseobj_forumhome_stats в этом теге располагая уже только этими данными я получаю полностью все что мне нужно
![]() сверестественного я тут ничего не использовал как вы видите, пользовался только справочником, который выше давал
9
|
|||||||||||
|
|
|||
| 18.03.2012, 12:17 | |||
|
1
|
|||
| 18.03.2012, 12:33 | |
|
Ну чисто логически, идшттп только загружает код страницы, а веббраузер получает код страницы и отображает. Ладно, спасибо.
0
|
|
|
|
|
| 18.03.2012, 13:00 | |
|
Модуль jsWebbrowser позволяет легко и просто использовать JavaScript страницы через стандартный компонент TWebbrowser
http://jqbook.narod.ru/delphi_js.html тема с примером парсинга. таблицы одного сайта. как подключить интернет таблицу Delphi
2
|
|
|
|
|||||||
| 18.03.2012, 13:16 | |||||||
3
|
|||||||
|
-27 / 0 / 1
Регистрация: 17.03.2012
Сообщений: 72
|
|
| 20.05.2012, 19:55 [ТС] | |
|
Народ, предположем есть сайт google.ru, как мне вывести одно лиж поле ввода?!
Добавлено через 6 минут И еще, вариант как нибудь картинки с ссылками спарсить? Добавлено через 5 минут Мне нужно не просто текст, а кусочек сайта, и что бы он кликался... в общем что бы все ссылки работали и т.д..
0
|
|
|
2 / 7 / 6
Регистрация: 13.10.2013
Сообщений: 249
|
||
| 12.10.2017, 00:25 | ||
|
Классно...
Пример в 11 посте запустил на D7 пришлось править DFM файл,выбросить отсутствующие в D7 методы(свойства) В итоге всё заработало. Спасибо! Теперь вопросы, 1.Как не отобюражать страничку на форме. 2. Как загрузить только текст (без картинок) 3. У меня вылетает ошибка сценариев раз 5,как это отключить ? Добавлено через 2 минуты это для какой версии Delphi ? в D7 не собирается проект
1
|
||
| 12.10.2017, 00:25 | |
|
Помогаю со студенческими работами здесь
18
Есть какой-то способ парсить музыку с сайтов? Как сделать, чтобы открывать страницы сайтов, как в браузере Node.js может парсить динамические страницы? При сохранении страницы парсить контент Парсить все ссылки по маске с определенного блока страницы Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Валидация и контроль данных табличной части документа перед записью
Maks 22.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в КА2.
Задача: контроль и валидация данных табличной части документа перед записью с учетом регламента компании. . .
|
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2.
Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом.
В. . .
|
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2.
Задача: отобразить спецтехнику, которая на данный момент находится в ремонте.
Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
|
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
|
|
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
|
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут
Суть:
- Группа наркоманов из 10 человек.
- Только один инфицирован ВИЧ.
- Колются одной иглой.
- Колются раз в день.
- Колются последовательно через. . .
|
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
|
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
|