|
-27 / 0 / 1
Регистрация: 17.03.2012
Сообщений: 72
|
|
Как парсить страницы сайтов17.03.2012, 23:17. Показов 48264. Ответов 17
Метки нет (Все метки)
0
|
|
| 17.03.2012, 23:17 | |
|
Ответы с готовыми решениями:
17
Как парсить страницы с вебсокетами Как парсить html страницы? Как парсить фрейм веб-страницы |
|
474 / 337 / 36
Регистрация: 31.05.2011
Сообщений: 1,164
|
|
| 18.03.2012, 00:07 | |
|
pos, posex, copy
чо имено те надо спарсить то?
0
|
|
| 18.03.2012, 00:16 | ||||||
|
Рассмотрим конкретный пример с загрузкой веб-страницы и получения ее html-кода. Создадим новый проект. Нанесем на форму Memo1 (туда загрузим код веб-страницы), компонент IdHTTP1 с вкладки Indy Clients и кнопку. Опишем следующее действие кнопки:
1
|
||||||
|
|
||
| 18.03.2012, 03:06 | ||
|
вчера парсил таким методом 8515 ссылок , парсил справочник, задача можно сказать не легкая, столько нужной инфы вытянуть, но оказалась на 10 строк парсило около 4 часов эти 8515 ссылок, вырезало именно то, что нужно, я остался доволен. Перед этим я писал программу парса справочника, там код был в пару сотен строк, но писал я ее очень долго, 3 дня, и все равно было не учтено все.так как со мной поделились информацией, которая привела меня в довольное состояние - поделюсь и я http://www.w3schools.com/htmldom/default.asp даны примеры на ява скрипте, но тоже самое проделывает и обычный дельфовский ТWebBrowser так же, ко всему этому можно освоить регулярные выражения, займет на изучение 1-5 часов(в зависимости от соображаловки), я лично потратил 2 часа, но потом работа становится намного обоюдной вот что за информацию я использовал, это сайт с ознакомлением, справочник и Online редактор http://phpclub.ru/detail/article/regexp_1 http://javascript.ru/basic/regular-expression http://regexpr.ru/ примерно изучив вот это, можно спокойно парсить то, что некоторым даже не под силу!!! Удобно, просто, быстро удачи
3
|
||
| 18.03.2012, 10:46 | |||
|
0
|
|||
|
|
||||
| 18.03.2012, 11:01 | ||||
|
чем я буду
Добавлено через 1 минуту
0
|
||||
| 18.03.2012, 11:09 | ||
|
0
|
||
|
|
||
| 18.03.2012, 11:20 | ||
|
парсил я конечно в дельфи, но смотрел справочник по ява скрипту какие там методы и как использоватьрегулярное выражение - качается библиотека с офф сайта производителя этой библиотеки то что парсил на днях - через компонент WebBrowser
0
|
||
|
7 / 7 / 1
Регистрация: 10.05.2009
Сообщений: 56
|
|
| 18.03.2012, 11:28 | |
|
Привет! Можно парсить регексами, но по опыту скажу, что лучше найти готовую длл. Например в C# .NET я использовал сборку AgilityPack. По моему, видел, когда ее искал, решения и для делфи..
0
|
|
| 18.03.2012, 11:44 | ||||
|
Туманишь что то...
Не по теме: А я знал?
0
|
||||
|
|
|||||||||||
| 18.03.2012, 12:08 | |||||||||||
Сообщение было отмечено как решение
Решение
вот давай примером покажу
давайте отпарсим статистику нашего форума, для этого переходим на самую главную страницу этого сайта и листаем страницу вниз, итак нашли этот раздел? я на картинке выделил его. Теперь выделяем мышкой приблизительно это место, и смотрим исходный код выделенного фрагмента, ищем за что можно зацепиться, за теги, классы или другую какую информацию. Данный фрагмент не буду приводить сюда, думаю сами его увидите. Дальше заходим в дельфи, бросаем 2 кнопки на форму, мемо и веббраузер и начинаем программировать , особо тут и программировать то нечего ![]() я зацепился за тег tbody и Id collapseobj_forumhome_stats в этом теге располагая уже только этими данными я получаю полностью все что мне нужно
![]() сверестественного я тут ничего не использовал как вы видите, пользовался только справочником, который выше давал
9
|
|||||||||||
|
|
|||
| 18.03.2012, 12:17 | |||
|
1
|
|||
| 18.03.2012, 12:33 | |
|
Ну чисто логически, идшттп только загружает код страницы, а веббраузер получает код страницы и отображает. Ладно, спасибо.
0
|
|
|
|
|
| 18.03.2012, 13:00 | |
|
Модуль jsWebbrowser позволяет легко и просто использовать JavaScript страницы через стандартный компонент TWebbrowser
http://jqbook.narod.ru/delphi_js.html тема с примером парсинга. таблицы одного сайта. как подключить интернет таблицу Delphi
2
|
|
|
|
|||||||
| 18.03.2012, 13:16 | |||||||
3
|
|||||||
|
-27 / 0 / 1
Регистрация: 17.03.2012
Сообщений: 72
|
|
| 20.05.2012, 19:55 [ТС] | |
|
Народ, предположем есть сайт google.ru, как мне вывести одно лиж поле ввода?!
Добавлено через 6 минут И еще, вариант как нибудь картинки с ссылками спарсить? Добавлено через 5 минут Мне нужно не просто текст, а кусочек сайта, и что бы он кликался... в общем что бы все ссылки работали и т.д..
0
|
|
|
2 / 7 / 6
Регистрация: 13.10.2013
Сообщений: 249
|
||
| 12.10.2017, 00:25 | ||
|
Классно...
Пример в 11 посте запустил на D7 пришлось править DFM файл,выбросить отсутствующие в D7 методы(свойства) В итоге всё заработало. Спасибо! Теперь вопросы, 1.Как не отобюражать страничку на форме. 2. Как загрузить только текст (без картинок) 3. У меня вылетает ошибка сценариев раз 5,как это отключить ? Добавлено через 2 минуты это для какой версии Delphi ? в D7 не собирается проект
1
|
||
| 12.10.2017, 00:25 | |
|
Помогаю со студенческими работами здесь
18
Есть какой-то способ парсить музыку с сайтов? Как сделать, чтобы открывать страницы сайтов, как в браузере Node.js может парсить динамические страницы? При сохранении страницы парсить контент Парсить все ссылки по маске с определенного блока страницы Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|