|
1 / 1 / 0
Регистрация: 03.12.2015
Сообщений: 126
|
|
Парсинг html01.12.2020, 13:24. Показов 1710. Ответов 7
Метки нет (Все метки)
Доброго времени суток, столкнулся с такой проблемой, как парсить теги h2 которые находятся в классе post__content typeset, при этом точно такой-же тег игнорировать в классах uagb-post-grid, делать с помощью bs4
делаю так, но получаю вообще все h2 name_category = soup.find(class_="post__content typeset").find_all("h2")
0
|
|
| 01.12.2020, 13:24 | |
|
Ответы с готовыми решениями:
7
Парсинг html страницы Парсинг данных html |
|
Автоматизируй это!
|
||||||
| 01.12.2020, 13:39 | ||||||
|
soberfrog, погадать по картинке? или давай сайт или кусок верстки с обоими классами, чтобы попробовать, я бы через lxml сделал по xpath локатору
Добавлено через 6 минут а дивы не вложенные? вроде все норм
сам спросил и сам отвечаю по твоей картинке - вложенный же второй то див! конечно он тебе и его H2 дает, ты же сам просишь findAll то есть перебрать всех потомков первого дива, а второй див лежит внутри
0
|
||||||
|
1 / 1 / 0
Регистрация: 03.12.2015
Сообщений: 126
|
||||||||||||||||
| 01.12.2020, 13:46 [ТС] | ||||||||||||||||
|
Вот сайт: https://mobilelegends.metaplay.ru/geroi
Добавлено через 5 минут
0
|
||||||||||||||||
|
Автоматизируй это!
|
|
| 01.12.2020, 13:50 | |
|
вот как достать потомков и их контент https://www.crummy.com/softwar... d-children
Добавлено через 3 минуты берешь прямых потомков первого дива, отфильтровываешь только Н2 и достаешь их контент
0
|
|
|
1 / 1 / 0
Регистрация: 03.12.2015
Сообщений: 126
|
|
| 01.12.2020, 14:00 [ТС] | |
|
Как это сделать в коде?
0
|
|
|
Автоматизируй это!
|
||
| 01.12.2020, 14:14 | ||
|
0
|
||
|
1 / 1 / 0
Регистрация: 03.12.2015
Сообщений: 126
|
|
| 01.12.2020, 15:47 [ТС] | |
|
0
|
|
|
1 / 1 / 0
Регистрация: 03.12.2015
Сообщений: 126
|
||||||||||||||||
| 01.12.2020, 17:17 [ТС] | ||||||||||||||||
|
Фууух... все получилось, вот так:
Можно даже сократить:
0
|
||||||||||||||||
| 01.12.2020, 17:17 | |
|
Помогаю со студенческими работами здесь
8
Мой парсинг html в json Парсинг html страницы не работает Парсинг html
Парсинг HTML Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . .
а удачный момент так и не приходит.
|
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица.
Задача: зафиксировать три левых колонки в отчете.
Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка)
/ / . . .
|
Настройки VS Code
Loafer 13.04.2026
{
"cmake. configureOnOpen": false,
"diffEditor. ignoreTrimWhitespace": true,
"editor. guides. bracketPairs": "active",
"extensions. ignoreRecommendations": true,
. . .
|
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2.
Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива.
Было так:. . .
|
|
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: реализовать контроль корректности заполнения дат назначения. . .
|
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html
Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
|
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|