Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 23.04.2015
Сообщений: 4

Beautifulsoup как правильно спарсить

18.10.2017, 13:14. Показов 717. Ответов 0
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте.
Есть блок:
HTML5
1
2
3
4
5
6
7
8
9
10
<div class=content>
  <p>aaa</p>
  <p>sss</p>
  <img src="URL" alt="альтернативный текст" />
  <p>ddd</p>
    <div class=subheader>
        <p>subtext</p>
    </div>
  <p>fff</p>
</div>
Надо забрать из content все <p> и <img> при том чтобы все воспроизводилось в том порядке который есть и не было приязано в к текущей верстке, т.е. строки с тэгами могут "мешаться" от раза к разу.
Мои слабинькие познания помогли мне реализовать схему когда сначала в цикле выводятся все <p>, затем <img> и в конце концов то что в блоке subheader с заменой <p> на <h3>.
Уверен что почти каждый делал что-то подобное, пакажите свои примеры, пожалуйста
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
18.10.2017, 13:14
Ответы с готовыми решениями:

Как выделить текст из тега через BeautifulSoup?
Написал такой скрипт: #!/usr/bin/env python # -*- coding: utf-8 -*- import urllib2 from BeautifulSoup import BeautifulSoup ...

Как Парсить несколько одинаковых XML тегов? (BeautifulSoup)
Имеется XML по типу: &lt;players&gt; &lt;player&gt; &lt;level&gt;5&lt;/level&gt; &lt;kills&gt;5&lt;/kills&gt; &lt;deaths&gt;5&lt;/deaths&gt; &lt;assists&gt;7&lt;/assists&gt; ...

Спарсить название товара через beautifulsoup
Подскажите, пожалуйста, как на вайлдеррис получить названия товара &quot;SQL. Полное руководство&quot; через BeautifulSoup из строки &lt;h1...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
18.10.2017, 13:14
Помогаю со студенческими работами здесь

Парсинг Сайта(не могу понять как правильно спарсить сгенерированную php таблицу )
Добрый вечер Форумчане! Есть много сгенерированных html таблиц Вот один из них Код: &lt;TR CLASS=R1&gt; &lt;TD...

Как работать с BeautifulSoup?
Не могу понять эту конструкцию. print(soup.html.nextSibling == None) # True Полный код: doc = soup =...

Как решить проблему с установкой BeautifulSoup
привет всем подскажите как решить проблему с установкой BeautifulSoup выскакивает вот такая ошибка при установке через pip и через...

Как искать следующий элемент в BeautifulSoup
Спарсил страницу в ней таблица &lt;tbody _ngcontent-boerse-frankfurt-c136=&quot;&quot;&gt; &lt;tr _ngcontent-boerse-frankfurt-c136=&quot;&quot;...

Как убрать soup = BeautifulSoup (html) из кода?
Приветствую всех, только недавно начал изучать Python, дали задание: сделать парс расписания нашей группы в универе. Пользовался Beautiful...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Программный контроль заполнения реквизита табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать контроль заполнения реквизита табличной части. . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: при создании документов установить период списания автоматически. . .
Вывод данных в справочнике через динамический список
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Функция заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru