Форум программистов, компьютерный форум, киберфорум
PHP: сети
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 08.08.2017
Сообщений: 1

Парсинг позиции в яндексе. (не могу отправить ответ на капчу) curl

08.08.2017, 01:35. Показов 1607. Ответов 0
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем привет.
Нужно сделать парсинг позиции в яндексе. А проблема в том что яндекс выдал капчу.
Я смог прописать автоскачивание фото с капчей, но не получается отправил три параметры для подтверждения капчи.
Немогу решить уже 8 часов, пожалуйста помогите.
Возможно есть готовый код, тоже прийму.

Вот код.
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
<?php 
include_once('phpquery.php');
$url=$_POST['domen'];
$hostsite = parse_url($url);
$key=$_POST['key'];
$num = 100;
$proxy = '78.24.41.100';
 
 
 
 
 
function gett_out_xml($url,$data=null,$options=null)
{
    $process = curl_init($url);
    curl_setopt($process, CURLOPT_HEADER,0);
    if(!is_null($data))
    {
        curl_setopt($process, CURLOPT_POST, 1);
        curl_setopt($process, CURLOPT_POSTFIELDS, $data);
    }
    if(!is_null($options))curl_setopt_array($process,$options);
    curl_setopt($process, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($process, CURLOPT_COOKIEFILE, dirname(__FILE__).'cookies_yandex.txt');
    curl_setopt($process, CURLOPT_COOKIEJAR, dirname(__FILE__).'cookies_yandex.txt');
    curl_setopt($process, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; ru; rv:1.9.0.5) Gecko/2008120122 Firefox/3.0.5');
    curl_setopt ($process , CURLOPT_REFERER , 'https://yandex.ru/search/');
    curl_setopt($process, CURLOPT_CONNECTTIMEOUT,20);
    @curl_setopt($process, CURLOPT_FOLLOWLOCATION, 1);
    curl_setopt($process, CURLOPT_PROXY, $proxy);
    $return = curl_exec($process);
    
//parser_sleep();
 
    $doc2 = phpQuery::newDocument($return);
    $s = $doc2->find('img.image.form__captcha');
    $e = $s->attr('src');
 
    $ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL, $e); 
curl_setopt($ch, CURLOPT_HEADER, 0); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt($ch, CURLOPT_USERAGENT, 'FIREFOX'); 
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); 
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false); 
curl_setopt($ch, CURLOPT_PROXY, $proxy);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
 
$d=curl_exec($ch); 
curl_close($ch); 
 
file_put_contents('captcha.png', $d);
 
 
    $doc2 = phpQuery::newDocument($return);
    $key = $doc2->find('input.form__key');
    $key1 = urlencode($key->attr('value'));
    echo $key1.'<br>';
    $retpath = $doc2->find('input.form__retpath');
    $retpath1 = urlencode($retpath->attr('value'));
    echo $retpath1.'<br>';
    curl_close($process);
    return $return;
}
    echo '
    <form method="get">
    <img src="captcha.png">
    <input type="text" name="rep"><br>
    <input type="text" name="key1" value="'.$key1.'"><br>
    <input type="text" name="retpath1" value="'.$retpath1.'"><br>
    <button>send</button>
    </form>
    ';
 
    if (!empty($_GET['rep'])) {
    $retpath1 = $_GET['retpath1']; 
    $key1 = $_GET['key1'];
    $rep = $_GET['rep'];
    echo $key1;
echo $rep;
$process1 = curl_init();  
    $header[0] = "Accept: text/xml,application/xml,application/xhtml+xml,";
    $header[0] .= "text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5";
    $header[] = "Cache-Control: max-age=0";
    $header[] = "Connection: keep-alive";
    $header[] = "Keep-Alive: 300";
    $header[] = "Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7";
    $header[] = "Accept-Language:ru-ru,ru;q=0.8,en-us;q=0.5,en;q=0.3";
    $header[] = "Pragma: ";
curl_setopt($process1, CURLOPT_URL, 'https://yandex.ru/checkcaptcha'); 
curl_setopt($process1, CURLOPT_POSTFIELDS, 'key='.$key1.'&retpath='.$retpath1.'&rep='.$rep);
    curl_setopt($process1, CURLOPT_COOKIEJAR, dirname(__FILE__).'cookies_yandex.txt');
    curl_setopt($process1, CURLOPT_COOKIEFILE, dirname(__FILE__).'cookies_yandex.txt');
curl_setopt($process1, CURLOPT_HEADER, 1); 
curl_setopt($process1, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt($process1, CURLOPT_PROXY, $proxy);
curl_setopt($process1, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($process1,CURLOPT_HTTPHEADER , $header);
curl_setopt($process1,CURLOPT_MAXREDIRS,1);
curl_setopt($process1, CURLOPT_ENCODING, 'gzip,deflate');
curl_setopt($process1,CURLOPT_CONNECTTIMEOUT,0);
curl_setopt($process1, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:13.0) Gecko/20100101 Firefox/13.0.1");
echo '<br>https://yandex.ru/checkcaptcha?key='.$key1.'&retpath='.$retpath1.'&rep='.$rep;
$res=curl_exec($process1); 
curl_close($process1); 
 
 if ($res->success) {
    
    echo "<br>Сработано";
} else {
    echo "<br>Не вышло";
}}else{
 
 
 
    $key2 = str_replace(' ', "%20", $key);
    $file5612=gett_out_xml("https://yandex.ru/search/?text=каша%20милупа&lr=143");
 
    $doc2 = phpQuery::newDocument($file5612);
    echo $doc2;
 
  }
Заранее спасибо за помощь.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
08.08.2017, 01:35
Ответы с готовыми решениями:

CURL и сессии - не могу передать капчу
Предистория есть страница проверки полисов ОСАГО http://dkbm-web.autoins.ru/dkbm-web-1.0/bsostate.htm Клиента не устраивает дизайн. API...

Отправить cURL запрос и вывести ответ
Я только начал вникать в C#, поэтому не судите строго. Мне необходимо отправить cURL запрос и вывести ответ. Нашёл я только это. ...

Как отправить капчу решенную капчу в VkNet
Вывел капчу, и хочу отправить решение при обычной кнопки отправить, но проблема в том что я не понимаю как это сделать читал про ...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
08.08.2017, 01:35
Помогаю со студенческими работами здесь

Не могу отправить curl
пишу в консоли фаербага. если отправить этот запрос то сайт считает что был переход по ссылке. ...

Авторизация на Яндексе используя curl
Доброго времени суток, появилась задача спарсить wordstat через curl. Но яндекс требует авторизации. Понимаю, что это достаточно большая...

Теряю позиции в яндексе
Подскажите пожалуйста, почему у меня сайт теряет позиции? Все вроде было нормально, потихонечку поднимался, а после последнего апа сразу по...

Позиции сайтов в яндексе
Недавно начал заниматься продвижением сайтов. Заинтересовался таким вопрос: почему по запросe в Яндексе &quot;копии vertu&quot; сайт...

Сайт потерял позиции в Яндексе
Доброго времени суток. Около месяца назад (может чуть меньше) сайт резко потерял все свои позиции в Яндексе. По некоторым запросам был на...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru