Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.89/9: Рейтинг темы: голосов - 9, средняя оценка - 4.89
Модератор
Эксперт Python
 Аватар для Fudthhh
2695 / 1601 / 513
Регистрация: 21.02.2017
Сообщений: 4,210
Записей в блоге: 1

Парсинг страниц с python3

20.06.2018, 09:20. Показов 1929. Ответов 5

Студворк — интернет-сервис помощи студентам
Все в целях обучения. Есть страница, не могу понять как получить содержимое класса.



Python
1
2
3
4
5
6
7
browser = mechanicalsoup.Browser()
 
page = browser.get(#SITE#) 
    
obj = page.soup.find('div', {'class' : 'col s12 l6 minHeightOnePx'})
 
#obj = page.soup.find(id='listip')
Получается найти только этот класс, все остальные попытки не приносят успеха, если я правильно понял, то нужно попасть внутрь этого класса. Прошу вашей помощи.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
20.06.2018, 09:20
Ответы с готовыми решениями:

Парсинг и замена текста в html (python3)
Приветствую Друзья, если не затруднит, подскажите решение для python3. Есть некий html файл, вполне себе стандартный, в нем среди...

Парсинг всех страниц
На дамом сайте около 30 страниц 'https://stopgame.ru/review/izumitelno' как спарсить все название игр в карточках со всех страниц (при...

Парсинг таблицы с нескольких страниц
Доброго времени суток. Есть задача: с внутреннего сайта организации выгрузить таблицу. Сайт выглядет: - в начале 3 фильтра с...

5
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,667
Записей в блоге: 29
20.06.2018, 09:41
не понял почему используешь механикалсоуп а не BS4, который у него внутри, но ладно
чтобы найти что-то на странице можно использовать CSS селектор, для твоего элемента вроде как '#listip pre', но это если это единственный тег pre в блоке.
А вообще всегда полезно документацию изучить

Цитата Сообщение от Fudthhh Посмотреть сообщение
не могу понять как получить содержимое класса.
что именно надо получить?
0
Модератор
Эксперт Python
 Аватар для Fudthhh
2695 / 1601 / 513
Регистрация: 21.02.2017
Сообщений: 4,210
Записей в блоге: 1
20.06.2018, 09:48  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
что именно надо получить?
В pre находится обыный текст. Вот именно его нужно получить.

Добавлено через 1 минуту
Цитата Сообщение от Welemir1 Посмотреть сообщение
А вообще всегда полезно документацию изучить
Почитал, но я практик, и теорию пока что перевариваю, занялся этим буквально на днях, и так как я прошерстил литературу и не смог понять, решил, что вы добрые люди поделитесь опытом.
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,667
Записей в блоге: 29
20.06.2018, 09:51
Цитата Сообщение от Fudthhh Посмотреть сообщение
и так как я прошерстил литературу и не смог понять
какую литературу -просто открой их мануал на сайте)
получи вот этот элемент по цсс селектору и просто вызови на нем метод текст. правда он есть у beautiful soup у механикал скорее всего тоже есть аналог
0
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
24.06.2018, 16:32
Fudthhh, задача решается в пару строк
Python
1
2
3
4
5
6
7
import requests
import lxml.html as html
 
resp = requests.get("https://www.cyberforum.ru/python/thread2266797.html").text
parser = html.fromstring(resp)
data = parser.cssselect("#td_post_12489728 > h1 > a")
print(data[0].text)
0
 Аватар для FilArt97
37 / 36 / 16
Регистрация: 11.03.2018
Сообщений: 95
27.06.2018, 06:18
Используй Scraper, bs4 медленный
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
27.06.2018, 06:18
Помогаю со студенческими работами здесь

Парсинг документов со всех страниц сайта
В общем, суть такова. Мне нужно скачать из сайта https://fasie.ru/ документы. Они могут быть в любом формате: pdf или doc. Мне нужно...

Парсинг xml c кириличными тегами на Python3
Доброго времени суток, уважаемы питонисты! Мне нужно распарсить xml файлик. Для этого я использовал xml.etree.ElementTree из ET в...

Парсинг страниц(ы)
Добрый день, товарищи! Решил попробовать автоматизировать выкачивание данных с сайта АТС посредством Python (изучал в университете, решил...

парсинг страниц
как вырвать с этого сайта (https://sport-booking.ru/betting-odds/?q=%D1%87%D0%B5%D0%BC%D0%BF%D0%B8%D0%BE%D0%BD%D0%B0%D1%82+&s=) таблицу

Парсинг соседних страниц сайта и перебор их
import requests from bs4 import BeautifulSoup import csv def get_html(url): r = requests.get(url) r.encoding =...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит: токи, напряжения и их 1 и 2 производные при t = 0;. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru