Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 09.03.2019
Сообщений: 1

Парсим страницу

09.03.2019, 14:37. Показов 462. Ответов 1

Студворк — интернет-сервис помощи студентам
У меня есть html код, вот его кусок:
<style>
.uclass_41{
font-weight: bold;
}

.uclass_82{
font-weight: bold;
}

.hid {display:none;}
</style><span class="uclass_12" >3589</span><span class="uclass_63" >7298</span><span class="uclass_91" >7487</span><span class="uclass_67" style=font-weight:normal>6061</span><span class="uclass_39" >1094</span><span class="uclass_91" >9135</span><span class="uclass_70" >6285</span><span class="uclass_18" >1235</span><span class="uclass_77" >7165</span><span class="uclass_75" >3201</span><span class="uclass_3" >2287</span><span class="uclass_49" >2387</span><span class="uclass_67" style=font-weight:normal>7559</span><span class="uclass_60" >5211</span><span class="uclass_4" >1516</span><span class="uclass_55" >5030</span><span class="uclass_75" >7226</span><span class="uclass_66" >1853</span><span class="uclass_12" >3847


Мне нужно, используя BeautifulSoup, импортировать данные в датафрейм и поместить содержимое каждого элемента span в отдельную строку, столбец "value" (он уже создан. есть еще столбец "is_bold").

На нулевой строке должно стоять значение из тэга span, который стоит первый, на первой строке - значение из тэга span, который стоит вторым и так далее.

Помогите, пожалуйста!
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
09.03.2019, 14:37
Ответы с готовыми решениями:

Парсим текст
Доброго всем! Получаю исходный код страницы и гружу его в текстовый файл: import requests as req fs = open('source.txt',...

Парсим баш (итхеппенс)
Здравствуйте! Нашел пример парсинга баша: import requests from lxml import html r = requests.get('http://bash.im/random') ...

Парсим HTML страницу
Ребят, так как я в этом не особо разбираюсь, очень нуждаюсь в вашей помощи. Готов немного финансово отблагодарить тех, кто мне поможет. ...

1
 Аватар для Andrey B
170 / 122 / 61
Регистрация: 06.02.2015
Сообщений: 300
09.03.2019, 15:48
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
from bs4 import BeautifulSoup
 
data = """
     <style> 
    .uclass_41{
    font-weight: bold;
    }
 
    .uclass_82{
    font-weight: bold;
    }
 
    .hid {display:none;}
    </style><span class="uclass_12" >3589</span>
    <span class="uclass_63" >7298</span>
    <span class="uclass_91" >7487</span>
    <span class="uclass_67" style=font-weight:normal>6061</span>
    <span class="uclass_39" >1094</span><span class="uclass_91" >9135</span>
    <span class="uclass_70" >6285</span><span class="uclass_18" >1235</span>
    <span class="uclass_77" >7165</span><span class="uclass_75" >3201</span>
    <span class="uclass_3" >2287</span><span class="uclass_49" >2387</span>
    <span class="uclass_67" style=font-weight:normal>7559</span>
    <span class="uclass_60" >5211</span>
    <span class="uclass_4" >1516</span><span class="uclass_55" >5030</span>
    <span class="uclass_75" >7226</span><span class="uclass_66" >1853</span>
    <span class="uclass_12" >3847</span>
"""
soup = BeautifulSoup(data, "lxml")
 
my_data = []
 
for line in soup.findAll('span'):
    my_data.append(line.text)
 
for i in range(len(my_data)):
    print(str(i+1)+"-span: "+my_data[i]+'\n')
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
09.03.2019, 15:48
Помогаю со студенческими работами здесь

Парсим сайт из 1с
Здравствуйте уважаемые, не кидайтесь кирпичами пожалуйста. ))) Есть сайт . Хочу выдернуть товары (название и ссылки на них) и...

Парсим xml
Здравствуйте. Такая проблема появилась при парсинге xml. Есть такой xml: &lt;response list=&quot;true&quot;&gt; &lt;audio&gt; ...

Парсим xml
Доброго времени суток! Необходимо пропарсить xml-документ, в котором содержится строка вида ...

Парсим SAP
Доброго времени суток! Ребят, подскажите пожалуйста, кто сталкивался с парсингом площадок SAP. Может есть у кого примеры из личного...

Парсим данные
Всем привет, возможно ли из такого вида данных, вывести только значение ? Array ( =&gt; Array ( ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru