|
0 / 0 / 0
Регистрация: 13.08.2016
Сообщений: 28
|
||||||
Парсинг BeautifulSoup13.04.2020, 14:53. Показов 1062. Ответов 6
Метки нет (Все метки)
Добрый день. Имеется веб страница из которой нужно спарсить даты, имена и комментарии в формате:
23 мар. UserName: комментарий 24 мар. UserName: комментарий и т.д Помогите настроить поиск BeautifulSoup. Пошуршал в документации модуля, похожего не нашел, ну или не сообразил. Как осуществить поиск только в определенном блоке, либо поиск в подродительском отделе. Так как все классы и атрибуты повторяются в других блоках. Могу в лс скинуть саму html страницу Для основы:
0
|
||||||
| 13.04.2020, 14:53 | |
|
Ответы с готовыми решениями:
6
Проблемы с парсингом BeautifulSoup Подключить модуль BeautifulSoup Python Найти больше трехсовпадений BeautifulSoup |
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 13.04.2020, 15:57 | |
|
Если дадите html или ссылку - посмотрю.
1
|
|
|
1 / 1 / 0
Регистрация: 11.02.2020
Сообщений: 24
|
||||||
| 13.04.2020, 16:21 | ||||||
|
Так ты же можешь взять подкласс и его значение когда уже получил родительский-класс, наподобие такого
1
|
||||||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 13.04.2020, 16:31 | |
|
Послал ответ в ЛС.
1
|
|
|
6 / 5 / 1
Регистрация: 25.03.2020
Сообщений: 36
|
||||||
| 13.04.2020, 17:00 | ||||||
|
Смотря чем будете пользоваться CSS или Xpath или HTML в запросах, проще всего наверно, HTML. Находите классы и атрибуты к нужной инфе. посмотрите образец ниже:
1
|
||||||
|
|
||
| 13.04.2020, 18:07 | ||
|
Но для этого есть lxml.
1
|
||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
||
| 13.04.2020, 18:43 | ||
|
1
|
||
| 13.04.2020, 18:43 | |
|
Помогаю со студенческими работами здесь
7
В Pycharm не получается установить библиотеку Beautifulsoup
Как получить определенную ячейку из таблицы с библ. beautifulsoup? Как вытащить значения из таблицы HTML используя BeautifulSoup Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net
REST сервисы временно не работают, только через Web.
Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
|
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
|
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
|
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма).
На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
|
|
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ *
Дана цепь(не выше 3-го порядка) постоянного тока с элементами R, L, C, k(ключ), U, E, J. Программа находит переходные токи
и напряжения на элементах схемы классическим методом(1 и 2 з-ны. . .
|
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым.
Но восстановить их можно так.
Для этого понадобится консольная утилита. . .
|
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|