|
|
|
Чем вы пользуетесь при парсинге сложных сайтов?08.07.2012, 14:25. Показов 1924. Ответов 16
Метки нет (Все метки)
0
|
|
| 08.07.2012, 14:25 | |
|
Ответы с готовыми решениями:
16
Реализовать многопоточность при парсинге сайтов
|
|
|
|
| 08.07.2012, 15:06 | |
|
kzru_hunter, какое отношение это имеет к билдеру?
Собственно, ответ.
0
|
|
|
|
|
| 08.07.2012, 15:30 [ТС] | |
|
0
|
|
|
|
||
| 08.07.2012, 15:37 | ||
|
kzru_hunter, Правила, п.4.7.
0
|
||
|
|
|||||||||||
| 08.07.2012, 16:48 [ТС] | |||||||||||
|
ок,
мне просто интересно мнение тех, кто занимается этим делом (т.е. парсингом сайтов). спросил, потому что медленно развивается эта область и пока что, я не нашел нормального решения. Какие есть известные мне решения для билдера на данный момент: 1. регулярные выражения Достоинства: хороши для парсинга строк с непростой структурой Недостатки: не каждый сайт можно отпарсить (из-за закрывающих тегов) 2. Использование компонента CPPWebBrowser Достоинства: предоставляет интерфейс DOM Недостатки: тратится много времени на отрисовку (и похоже нельзя отключить) 3. Использование библиотеки libxml2 Достоинства: предоставляет интерфейс DOM Недостатки: необходимо носить с собой библиотеки, не понравилась документация У каждого решения есть также недочет: не всегда можно найти нужный тег с помощью одного вызова функции. Например, не получится в следующем html-тексте:
1
|
|||||||||||
|
|
|
| 08.07.2012, 17:26 | |
|
1
|
|
|
|
||||||||||||
| 08.07.2012, 17:46 | ||||||||||||
В крайнем случае можно воспользоваться boost/regex.
0
|
||||||||||||
|
|
|
| 08.07.2012, 17:56 | |
|
Avazart, а при чем тут 2009, если вы путь к файлу не указали ?
0
|
|
|
|
||
| 08.07.2012, 19:34 | ||
|
а инклюд - это что? Дух Святой?
и Boost HTML Library , я так понимаю, библиотека, которая не входит в стандартную проставку Boost
0
|
||
|
|
|
| 08.07.2012, 20:27 | |
|
я не думаю, оно мне не нужно, и не надо передергивать и использовать мой вопрос относительно первого сообщения в качестве аргумента относительно буст
0
|
|
|
|
|
| 08.07.2012, 20:31 | |
|
вам предоставить готовое решение ? извините...
0
|
|
|
|
|
| 08.07.2012, 23:16 | |
|
Ну хотя бы не подсовывать не решение.
Нашел libxml2 http://ckod-doc.narod.ru/doc/l... arser.html Скачать можно здесь http://garr.dl.sourceforge.net... -1-lib.zip Добавлено через 54 минуты Что хорошо - там уже есть lib-файл предназначенный для Buildera (libxml2-bcc.lib).Останится только скачать некоторые dll-ки. Если всё еще актуально можно могу попробывать состряпать и выложить пример.
0
|
|
|
|
|
| 08.07.2012, 23:24 | |
|
давай
0
|
|
|
|
|
| 09.07.2012, 00:39 | |
Сообщение было отмечено как решение
Решение
1
|
|
| 09.07.2012, 00:39 | |
|
Помогаю со студенческими работами здесь
17
Офис.Чем пользуетесь вы? ФТП клиент, чем вы пользуетесь? Чем пользуетесь для выбора значений из больших справочников? Напишите ваши среды разработки и то, чем пользуетесь сами Чем обоснована необходимость анализа однородности измерительных данных, характеризующих состояние сложных систем Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение:
В этой книге («Подход, основанный на вариантах использования») Ивар утверждает,
что архитектура программного обеспечения — это
структуры,. . .
|
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога
Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
|
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip
На первой гифке отладочные линии отключены, а на второй включены:. . .
|