|
0 / 0 / 0
Регистрация: 03.01.2014
Сообщений: 13
|
|
Как получать легкую капчу от гугла (recaptcha в одно слово? (эмуляция js?)15.12.2014, 23:27. Показов 6880. Ответов 6
Метки нет (Все метки)
Делаю парсер на php, на целевом сайте гугловская каптча (рекапча), заметил такую особенность - в браузере, режиме noscript выводит сложные кракозябры из 2х слов, а если скрипты включить - то выводится одно, легкочитаемое слово!
Проверял много раз - все дело в исполнении скрипта браузером. В своем скрипте эмулировал работу браузера - загружал все пакеты из лога браузера (вт.ч. обращения к скриптам), подставляя новую сессию куков и случайный user-agent Капча выдирается без проблем, но все-такая же жуткая, я её сам с трудом разгадываю!(( В GET запросах вначале идет обращение: http://www.google.com/recaptch... ha_ajax.js если сессия новая, то куков нет, только реферер далее уже идет запрос к http://www.google.com/recaptcha/api/challenge?k=[идентификатор сайта] в ответ устанавливаются куки если скачать содержимое пакета, то там содержится строка challenge (что-то вроде 03AHJ_VusrCLeaM17vSCflm-UqIaXq01XkJwakZ1WjtsXz9hTus3id-aMcOeY6aCpkycWF2C_iLl7dt5XlJxpKNZsPPXJFb eXjUGd2ouHdHRFadn0qHuw1RoBlMQpefueIVQY7h gBim0zgHkDkK9-fmiHWc-Tola07ykOL7OKIOfxxAxrDhYpcKicfUICvgDuKu7 Zieh66ywyOTvqVts_ozIV0BtPRGi6AJg) , значение которой и дает картинку капчи, но "стремной" вот такой: А дальше браузер делает следующее: идет запрос на http://www.google.com/recaptch... captcha.js с передачей полученных куков потом запрос на адрес (также с куками и реферером): http://www.google.com/js/th/Iz... 6xxjtqw.js причем имя этого скрипта каждый раз разное, но раз оно в GET запросе, значит имя его генерится на стороне браузера. К тому же в "теле" скрипта первой строчкой идет коммент "Anti-spam" так что думаю, это и есть ключевой элемент. Дальше самое интересное: браузер отправляет запрос на обновление картинки капчи: http://www.google.com/recaptcha/api/reload?c= значение аналогичное challange &k= постоянный идентификатор сайта &reason=i&type=image&lang=ru&th=некий длинный идентификатор, уникальный для каждого запроса Если получить тело пакета, то там простой код, отдающий значение challange для новой картинки. Которое как само по себе, так и с приставкой значения &th отдает одну и ту же стемную капчу: А вот браузер делает следующий гет запрос на http://www.google.com/recaptcha/api/image?c= [challange]&th=[идентификатор] куда подставляется challange новой картинки и значение &th= такое же, как в запросе на релоад, и возвращает простую капчу из одного слова: Вот как так друзья?)) Что за несправедливость?!) думаю все дело в генерации этого идентификатора &th= , думаю он создается при выполнении скриптов! Еще раз говорю, повторял много раз - и всегда в браузере вызалиет простая капча, а вручную или через скрипт - сложная. Возможно кто сталкивался? Думаю решение данной проблемы будет полезно многим!
0
|
|
| 15.12.2014, 23:27 | |
|
Ответы с готовыми решениями:
6
Как поменять капчу на recaptcha на Bitrix? Как правильно получить капчу (recaptcha) Как вытянуть ссылку на капчу recaptcha? |
|
8 / 6 / 3
Регистрация: 11.01.2013
Сообщений: 22
|
|
| 24.02.2015, 16:36 | |
|
Тоже сильно интересует данный вопрос, может у кого появились наработки? За дельный совет мог бы отблагодарить в раёне 20-30 вмз. Как упомянул ТС, финальный гет запрос, который скачает капчу, выглядит так:
http://www.google.com/recaptcha/api/image?c= [challenge]&th=[идентификатор] например: [img]http://i.**********/WQDrv4s.png[/img] Единственный вопрос - как вытащить последний параметр, &th=[идентификатор] ? Видимо, он генерится в этих двух JS файлах: Первый файл: https://www.google.com/js/th/R... 2MkxN_s.js Содержимое: http://pastebin.com/AHckhaY3 Второй: https://www.google.com/recaptc... captcha.js Содержимое: http://pastebin.com/yBqfgM7s Опять, как упомянул ТС, решение данной проблемы будет полезно многим.
0
|
|
|
F́́́́́́́ŕ́́́́́́́é́́́ ́ak
260 / 224 / 109
Регистрация: 07.07.2014
Сообщений: 965
|
||||||
| 25.02.2015, 13:35 | ||||||
|
Там все довольно просто =)
Смысл в том, что разбирать это - довольно бесполезная задача (и трудоемкая, т.к. нужно отлавливать откуда оно берет свои параметры) - гугл может изменить этот алгоритм в любой момент без особых усилий. Почему бы просто не использовать PhantomJS ? Не по теме: PS: 100$
0
|
||||||
|
8 / 6 / 3
Регистрация: 11.01.2013
Сообщений: 22
|
|
| 25.02.2015, 13:48 | |
|
Tatikoma, благодарен за ответ. Т.к. с JS нет почти никакого опыта, пока непонятно, откуда берутся "ингредиенты" для этой чертовой переменной м, но надеюсь, разберусь. За PhantomJS тоже спасибо, посмотрю. Отблагодарить могу, но на данный момент нет вмз, может биткоины соидут?
Если да, кинь кошелек, если нет, поменяю на вмз.
0
|
|
|
F́́́́́́́ŕ́́́́́́́é́́́ ́ak
260 / 224 / 109
Регистрация: 07.07.2014
Сообщений: 965
|
|||
| 25.02.2015, 14:00 | |||
|
Не по теме:
Хотя в этом случае, я все же советовал бы использовать PhantomJS, - в перспективе более хорошее решение.
0
|
|||
|
8 / 6 / 3
Регистрация: 11.01.2013
Сообщений: 22
|
|
| 25.02.2015, 14:07 | |
|
Спс, пхп код ненужен, пишу десктопное приложение. Как упомянул, отблагодарить могу в районе $20-30
0
|
|
|
F́́́́́́́ŕ́́́́́́́é́́́ ́ak
260 / 224 / 109
Регистрация: 07.07.2014
Сообщений: 965
|
|
| 25.02.2015, 16:21 | |
|
Standard user, ну раз реверсить ничего не надо - то и благодарность не требуется :-)
0
|
|
| 25.02.2015, 16:21 | |
|
Помогаю со студенческими работами здесь
7
Как прикрутить капчу от гугла
ReCAPTCHA внедрение. Как подключить reCAPTCHA от Google Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2.
Задача: отобразить спецтехнику, которая на данный момент находится в ремонте.
Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
|
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
|
Запрет удаления строк ТЧ документа при определенном условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
|
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут
Суть:
- Группа наркоманов из 10 человек.
- Только один инфицирован ВИЧ.
- Колются одной иглой.
- Колются раз в день.
- Колются последовательно через. . .
|
|
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
|
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
|
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . .
а удачный момент так и не приходит.
|
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица.
Задача: зафиксировать три левых колонки в отчете.
Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка)
/ / . . .
|