Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.76/25: Рейтинг темы: голосов - 25, средняя оценка - 4.76
0 / 0 / 0
Регистрация: 08.08.2018
Сообщений: 34

Парсер html, вытащить текст класса

28.08.2018, 09:33. Показов 4955. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Вытаскиваю html, но не могу понять как забрать порт прокси, вроде нашёл нужный селектор, но когда беру текст этого тега и класса, то порта там нету. В Html видно что порт находиться ещё в одном классе внутре 'font.spy14', вопрос как мне туда добраться?



для селектор ('font.spy14')
Python
1
2
3
4
5
6
7
8
def getProxy():
    url_proxy='http://spys.one/en/socks-proxy-list/'
    html_url_proxy=requests.get(url_proxy)
 
    html_bs=bs4.BeautifulSoup(html_url_proxy.text, "html.parser"))
    
    list_html_proxy=html_bs.select('font.spy14')
    print(list_html_proxy[1].getText())

для селектора ('font.spy2'), всего лишь 9 элементов в листе, и это заголовки табилицы, а нужны порты
Python
1
2
3
4
5
6
7
8
9
def getProxy():
    url_proxy='http://spys.one/en/socks-proxy-list/'
    html_url_proxy=requests.get(url_proxy)
 
    html_bs=bs4.BeautifulSoup(html_url_proxy.text, "html.parser")
 
    list_html_proxy=html_bs.select('font.spy2')
    print(len(list_html_proxy))
    print(list_html_proxy[1].getText())
Миниатюры
Парсер html, вытащить текст класса   Парсер html, вытащить текст класса   Парсер html, вытащить текст класса  

Парсер html, вытащить текст класса  
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
28.08.2018, 09:33
Ответы с готовыми решениями:

Парсер html: вытащить весь текст, который в объявлениях
Всем привет! Нужна помощь в парсере нтмл Вот силка "http://vashmagazin.ua/nerukhomist/kvartyry/sykhivskyy-rayon/" ...

Как вытащить текст из html страницы?
Писал бота, столкнулся с проблемой, не понимаю, как вытащить sitekey из html страницы, вот сам html: <iframe...

Как вытащить текст из данного HTML с помощью Beautifulsoup
Всем добрый вечер! Не могу понять как вытащить значение True из данного HTML с помощью Beautifulsoup, если можно, то без использования...

1
1080 / 1007 / 107
Регистрация: 28.02.2010
Сообщений: 2,889
28.08.2018, 14:41
В инструментах разработчика показывается html-страничка, которая изменилась с учетом выполненых скриптов. Если же посмотреть исходной код странице с помощью, скажем, view-source:http://spys.one/en/socks-proxy-list/ то увидите, что пара вида хост:порт выглядит так:

HTML5
1
<font class=spy14>128.14.157.18<script type="text/javascript">document.write("<font class=spy2>:<\/font>"+(c3k1u1^q7x4)+(w3y5l2^z6l2)+(f6r8x4^w3g7)+(w3y5l2^z6l2))</script></font>
Такое парсить будет сложновато. Поэтому для решения задачи предлагаю смотреть в эту сторону: https://selenium-python.readth... mple-usage
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
28.08.2018, 14:41
Помогаю со студенческими работами здесь

Как вытащить текст со Html странички? Html Agility Pack
Всё очень просто как вытащить текст с Html странички с помощью Html Agility Pack? К примеру у нас есть страничка того же сайта ...

Вытащить текст из HTML
Дан HTML &lt;div class=&quot;answer&quot; dir=&quot;ltr&quot;&gt;какой- то текст&lt;/div&gt; Подскажите как вытащить текст из этого кода, причем он может...

Вытащить текст из html
Здравствуйте! Задача такая: есть множество файлов html. Из них нужно взять весь текст. Посоветовали делать с помощью javascript. ...

Вытащить текст с html-кода
Здравствуйте! У меня есть объект $('.address p:first-child').html() и его вместимое: ...

Подсобите вытащить текст из html
Привет. Задача такая: нужно вот из этого кода вытащить &quot;42:42&quot;, вставить это значение в код, например в: if...else и если это...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: реализовать контроль корректности заполнения дат назначения. . .
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru