|
0 / 0 / 0
Регистрация: 16.01.2017
Сообщений: 4
|
|
Как спарсить POST данные в Google Plus16.01.2017, 10:34. Показов 947. Ответов 6
Метки нет (Все метки)
Здравствуйте. В Google + (Plus) есть community (сообщества), необходимо вступить туда программно. (Пример группы: https://plus.google.com/commun... 4579059070)
Вопрос заключается в том, что я не могу понять откуда берутся POST данные, их нет в POST форме и нет в загружаемых файлах (JS, или другие подгружаемые файлы.) Есть догадка что они формируются с помощью Java Script. Я сделал breakpoint на XHR запрос с содержанием ссылки: В call стеке вот такой вот код, в котором я пока мало чего понимаю: Вот такие вот POST данные: Помню, как ковырял одноклассники там всегда передавался дополнительный токен и тоже казалось что он генерируется с помощью JS, но сразу после поста в форумы обнаружил что токен можно вытянуть с cookies. Это я к тому что данные возможно откуда то вытягиваются уже готовые, но я пока этого не нашел. Буду благодарен вам если поможете мне понят как это происходит здесь и можно ли вытянуть данные. Хотя бы помогите понять в каком направлении рыть, потому что ковырять код сжатый компрессором (особенно при поверхностных знаниях JS) кажется маленьким безумием. Для модераторов: Если я вдруг запостил тему не в тот раздел прошу не сносите топик, отпишите здесь и я создам там где нужно, или просто перенесите сами. Спасибо.
0
|
|
| 16.01.2017, 10:34 | |
|
Ответы с готовыми решениями:
6
Как спарсить данные из текста Как и чем спарсить данные |
|
2463 / 1769 / 625
Регистрация: 11.07.2016
Сообщений: 4,067
|
|
| 16.01.2017, 10:41 | |
|
0
|
|
|
0 / 0 / 0
Регистрация: 16.01.2017
Сообщений: 4
|
|
| 16.01.2017, 10:45 [ТС] | |
|
Верно. Google + Api не предоставляет. Я через Api и не работаю. Делаю приложение на Python, авторизоваться удалось без всяких проблем, нашел все данные которые отправляются в POST запросе для авторизации, спарсил и отправил, но вот при вступлении я не могу понять как спарсить данные которые передаются в POST запросе. Вы можете посмотреть скрины там есть эти данные, но откуда они берутся? Так же в первом посте есть ссылка на пример группы, вы можете запустить отладчик в хроме или в firefox, и вступить в группу, вкладка network высветит этот запрос с POST данными.
0
|
|
|
2463 / 1769 / 625
Регистрация: 11.07.2016
Сообщений: 4,067
|
|
| 16.01.2017, 10:47 | |
|
0
|
|
|
0 / 0 / 0
Регистрация: 16.01.2017
Сообщений: 4
|
|
| 16.01.2017, 10:57 [ТС] | |
|
Balanaar, я работаю напрямую с HTTP протоколом. Сниффером (встроенным дебагером) отслеживаю запросы и эмулирую их программно.
0
|
|
|
2463 / 1769 / 625
Регистрация: 11.07.2016
Сообщений: 4,067
|
||
| 16.01.2017, 11:03 | ||
|
Вам знакомо понятие REST API?
Те самые POST-запросы, которые вы отправляете - это ни что иное, как запрос к Google+ API методом POST. А теперь вернёмся на пост раньше:
0
|
||
|
0 / 0 / 0
Регистрация: 16.01.2017
Сообщений: 4
|
|
| 16.01.2017, 11:41 [ТС] | |
|
Дорогой Balanaar, конечно я знаком с REST API. Но здесь он не причем. Повторю в последний раз я работаю не с Google+ API, (хотя он предоставляет и REST API, и библиотеки для работы с приложениями гугл на разных языках и многие другие фичи), я работаю напрямую с HTTP протоколом, то есть так как это делают любой браузер с любым сайтом (не только гуглом.) Google+ API имеет много фич, но в основном лишь на чтение, на запись существуют платные подписки, но возможности вступить в комьюнити там нет именно поэтому я работаю поверх апи через HTTP протокол. Не было бы сложности спарсить данные которые вложены в форму, но здесь сама форма с данными генерируется через Javascript, я приложил скрины что бы эксперты сразу увидели суть проблемы, ПРИЧЕМ ТУТ API??????
Или вы имеете ввиду что это внутренний API который не документирован и существует для взаимодействия внутри Google+ ? В этом случае я согласен что это есть REST API, но тогда не согласен с высказыванием что он не поддерживает метод вступления в группу, так как с помощью браузера любой человек может вступить в группу. И так вернемся к главному вопросу, как спарсить данные которые передаются методом POST при вступлении в комьюнити. Добавлено через 25 минут Немного дополню основной вопрос пояснением своей задачи. Она заключается в том, что бы вступить в группу, а после собрать множество данных - это гигабайты данных. Но доступны они лишь после вступления. Есть возможность заюзать selenium webdriver, который поддерживает выполнение Javascript (потому что является браузером), соответственно необходимость парсить POST данные отпадает сама собой, потому что можно просто эмулировать клик на кнопку вступления и программа(~бот) вступит. Но такой метод требует открытия браузера в зависимости от драйвера (Firefox, Chrome), что само по себе грузит систему и не позволит работать в 1000 потоков. Можно заюзать драйвер Phantom JS, но меня ждет тоже самое разочарование с нагрузкой и невозможностью парсить многопоточно. Далее есть выход заюзать webkit инструмент встроенный в QT или PyQt, но опять же эмуляция множества браузеров приведет к проблеме с потоками, много их не создашь. Именно поэтому приходится работать с HTTP протоколом на низком уровне без браузеров (встроенных или сторонних), я лишь эмулирую его передавая заголовки с телом запроса. Авторизоваться удалось без проблем, организовать еще пару вещей тоже получилось без труда, но здесь запрос составляется с помощью Javascript кода и он сжат компрессором, с легкостью можно найти участок кода где генерируются эти данные, если ты владеешь отладчиком JS и знаешь Javascript, я его знаю поверхностно и с помощью breakpointa нашел список функций в последовательности которые в конечном счете делают XHR запрос к серверу, но вот что делают эти функции я без понятия. С этим и нужна помощь. Спасибо
0
|
|
| 16.01.2017, 11:41 | |
|
Помогаю со студенческими работами здесь
7
Как спарсить данные тега Как спарсить данные из ответа сервера? Как спарсить данные вот из этого файла?
Спарсить ссылки из поиска Google Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11
Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
|
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
|
|
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/
O1rJuneU_ls
https:/ / vkvideo. ru/ video-115721503_456239114
|
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ВВЕДЕНИЕ
Введу сокращения:
аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
|
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi
ветка по-частям.
коммит Create переделка под биомассу. txt
вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
|
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ *
Дана цепь постоянного тока с сопротивлениями и источниками (напряжения, ЭДС и тока). Найти токи и напряжения во
всех элементах. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и. . .
|