Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/8: Рейтинг темы: голосов - 8, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 23.12.2018
Сообщений: 3

Проблема с парсером

23.12.2018, 20:28. Показов 1648. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте, помогите пожалуйста с парсером.
Нужно с сайта http://spys.one/free-proxy-list/RU/ спарсить proxy сервера получается только 30, на сайте в таблице есть фильтры, можно отобразить 500 серверов, при нажатии выполняется post запрос с параметрами, не могу повторить это в python. И еще не понятно как генерируется параметр xx0.
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import requests
from bs4 import BeautifulSoup
 
def get_html(url, useragent=None, proxy=None):
    #param={'xx0': '91f191bf14ad97b2b8da69ef749bedef', 'xpp': '5', 'xf1': '0','xf2': '1','xf4': '0','xf5': '0'}
    dt='xx0=91f191bf12ad97b2b7da69ef749bedef&xpp=5&xf1=0&xf2=1&xf4=0&xf5=0'
    r=requests.post(url, data=dt) 
    #print(r.text)
    return r.text 
 
def findproxy(html):
    soup=BeautifulSoup(html,'lxml')
    #tds=soup.find('tbody', id='currencies-all').find_all('td', class_='currency-name') 
    proxys=soup.find_all('tr', class_='spy1xx')[1:]
    for proxy in proxys:
        pr=proxy.find('font', class_="spy14").text  
        print(pr)
 
def main():
    print(findproxy(get_html('http://spys.one/free-proxy-list/RU/')))
 
if __name__ == '__main__':
    main()
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
23.12.2018, 20:28
Ответы с готовыми решениями:

Проблема с парсером
В общем проблема в следующем. Есть сайт со списком тв программ. Парсить оттуда список не представляет сложности но список не совсем...

Проблема с парсером
Пишу парсер данных, так как данных очень много для каждого типа использую свою модель Проблема заключается в том , что когда мне надо...

Проблема с парсером
Здравствуйте, возникла необходимость получить некоторые данные с сайта. В программировании на уровне Привет, Мир. Но задачу нужно было...

1
 Аватар для __ALPHA__
302 / 160 / 87
Регистрация: 16.04.2018
Сообщений: 239
01.01.2019, 00:46
Лучший ответ Сообщение было отмечено leonidktoto как решение

Решение

Python
1
2
3
4
5
6
7
8
9
10
11
import requests
 
s = requests.session()
 
r = s.post('http://spys.one/free-proxy-list/RU/').text
x1 = r.find('xx0') + 12
x2 = x1 + 32
xx0 = r[x1:x2]
 
data = {'xx0': xx0, 'xpp': '5', 'xf1': '0', 'xf2': '1', 'xf4': '0', 'xf5': '0'}
r = s.post('http://spys.one/free-proxy-list/RU/', data=data).text
r - это html с 500 прокси.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
01.01.2019, 00:46
Помогаю со студенческими работами здесь

Проблема с парсером
Надо написать парсер на php, с яндексом работает нормально, но youtube.com, например не парсит. код: include 'curl_query.php'; ...

Проблема с парсером json
доброго времени суток, форумчане! проблема такого рода - пишу программу для работы с апи окдеск и наткнулся на новый рубеж в виде...

Проблема с парсером php - curl
Нашел квот такой код, парсинга информации с сайта. С использованием проксей. Все пашет, если пользую soks5 Если подключаю http прокси, то...

Проблема с парсером: как переделать ссылки
Делаю парсер сайтов. Через curl. В итоге, в адресной строке браузера получается mysite.ru/parser.php, а в ссылках на спарсенной странице -...

Помощь с парсером
Криво написал небольшой парсер.Нужно выдергивать с сайта описание товара.Работает, в принципе, как надо,но есть проблемы с кодировкой....


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 03.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru