Форум программистов, компьютерный форум, киберфорум
PHP: сети
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/4: Рейтинг темы: голосов - 4, средняя оценка - 4.75
 Аватар для Nebiros
41 / 40 / 16
Регистрация: 23.03.2010
Сообщений: 3,122

Парсинг ответов поисковика

05.06.2014, 17:54. Показов 868. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
подскажите что не так, вот я так парсирую гугл

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
$url='https://www.google.com/search?num=100&q=car';
$ch=curl_init();
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_SSL_VERIFYPEER,false);
curl_setopt($ch,CURLOPT_SSL_VERIFYHOST,false);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,30);
curl_setopt($ch,CURLOPT_USERAGENT,"Mozilla/5.0 (Windows; U; Windows NT 6.1; ru; rv:1.9.2) Gecko/20100115 Firefox/3.6");
curl_setopt($ch,CURLOPT_HEADER,true);
curl_setopt($ch,CURLOPT_FOLLOWLOCATION,true);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_ENCODING,"gzip,deflate");
$content=curl_exec($ch);
curl_close($ch);
echo $content;
ответ приходит но ссылки не те что если просто вбить адрес в браузер (половина ссылок не рабочих), как правильно к нему обращаться?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
05.06.2014, 17:54
Ответы с готовыми решениями:

TJSONObject, парсинг ответов VK.API
Добрый день. Нужно получить значение photo_604. Делаю так: TJSONObject *jObj4 =...

TJSONObject, парсинг ответов VK.API
Всем доброго времени суток :) Делаю так: #include "DBXJSON.hpp" REQUEST = IdHTTP1->Get(VK_API + METHOD_MSGGET +...

Тесты (несколько вариантов ответов, число правильных ответов, оценка)
Please, помогите написать тесты в QBasic чтоб было несколько вариантов ответов, еще чтоб в конце показывало сколько правельных ответов и...

3
 Аватар для Vas-e-na
420 / 417 / 79
Регистрация: 21.06.2010
Сообщений: 1,362
10.06.2014, 14:41
Тут все просто, это Гугл.
Поясню:
У гугла вся страница подгружается на js скриптах, и так просто получить контент страницы не получится, нужно эмулировать js
А js эмуляция в вашем броузере не проходит т.к. ссылки на скрипты относительные а не абсолютные.

PS рекомендую еще CURLOPT_HTTPHEADER устанавливать
0
 Аватар для Nebiros
41 / 40 / 16
Регистрация: 23.03.2010
Сообщений: 3,122
10.06.2014, 16:32  [ТС]
Цитата Сообщение от Vas-e-na Посмотреть сообщение
Тут все просто, это Гугл.
Поясню:
У гугла вся страница подгружается на js скриптах, и так просто получить контент страницы не получится, нужно эмулировать js
А js эмуляция в вашем броузере не проходит т.к. ссылки на скрипты относительные а не абсолютные.
PS рекомендую еще CURLOPT_HTTPHEADER устанавливать
обошелся без js эмуляции, там ко всем линкам одинаково присоединялась вот такая вещь &sa=.... ,
её я обрезал на всех линках и дело пошло, теперь все линки нормально работают...
0
 Аватар для Vas-e-na
420 / 417 / 79
Регистрация: 21.06.2010
Сообщений: 1,362
10.06.2014, 16:34
Nebiros, поздравляю
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
10.06.2014, 16:34
Помогаю со студенческими работами здесь

Функция обхода документов-ответов, ответов на ответы и т.д.
Вобщем нужна фунция, чтобы в одну коллекцию собирались все ответы, ответы их ответов и так далее. Наверняка у кого-нибудь есть такая,...

кодинг поисковика
кто-нибудь напишите кодинг поисковика, с комментами, плз!!!

??? пропал из поисковика
Доброе время! подскажите пожалуйста: сайт был на первом месте в Яне по определенному ключевику. три дня назад сайта по этому...

парсирование поисковика
раньше парсировал гугл к примеру вот таким методом $question="искомое слово"; $ch=curl_init(); ...

Замена поисковика в Opera 37.0
При вводе какого либо запроса в адресную строку, поиск производится через яндекс, при том что по умолчанию стоит гугл, но самое интересное...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru