Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.54/13: Рейтинг темы: голосов - 13, средняя оценка - 4.54
0 / 0 / 0
Регистрация: 19.03.2018
Сообщений: 84

Убрать все html-теги из кода

15.06.2018, 15:58. Показов 2723. Ответов 9
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
есть код и мне нужно убрать все html теги

например: он выводит это

[<b class="e-player_name">Шарыченков Александр</b>]
<td>30</td>
<td><a href="https://www.khl.ru/clubs/ak_bars/" title="Ак Барс (Казань)">АКБ</a></td>
<td>2</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>-</td>
<td class="sorting_1">0.00</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0:58</td>

а мне нужно вот это:

Шарыченков Александр
30
АКБ
2
0
0
0
0
0
0
-
0.00
0
0
0
0
0:58

код ниже подскажите как это сделать а то уже 2 день мучаюсь

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
import csv
import requests
import re
from bs4 import BeautifulSoup
 
page = open('Статистика : Личная статистика : 17_18 | плей-офф : Континентальная Хоккейная Лига (КХЛ).html').read()
soup = BeautifulSoup(page, "lxml")
 
divs = soup.find("table", id='goalies_dataTable').find('tbody')
 
table = divs.findAll('tr')
 
Info_player = csv.writer(open('Info_player.csv', 'w'))
Info_player.writerow(['Игрок', '№', 'Клуб', 'И', 'В', 'П', 'ИБ', 'Бр', 'ПШ', 'ОБ',
                      '%ОБ', 'КН', 'Ш', 'А', 'И"O"', 'Штр', 'ВП'])
 
for tesy in table:
 
    name = tesy.findAll('b')
    td = tesy.findAll('td')
 
    NumberPl= td[1]
    print(NumberPl)
    ClubPl= td[2]
    print(ClubPl)
    GamePl= td[3]
    print(GamePl)
    WinPl= td[4]
    print(WinPl)
    losPl= td[5]
    print(losPl)
    IBPl= td[6]
    print(IBPl)
    BrPl= td[7]
    print(BrPl)
    PHPl= td[8]
    print(PHPl)
    OBPl= td[9]
    print(OBPl)
    proOBPl= td[10]
    print(proOBPl)
    KNPl= td[11]
    print(KNPl)
    HPl= td[12]
    print(HPl)
    APl= td[13]
    print(APl)
    IOPl= td[14]
    print(IOPl)
    HtrPl= td[15]
    print(HtrPl)
    VPPl= td[16]
    print(VPPl)
    Info_player.writerow([name, NumberPl, ClubPl, GamePl, WinPl, losPl, IBPl, BrPl, PHPl, OBPl, proOBPl, KNPl, HPl,
                          APl, IOPl, HtrPl, VPPl])
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
15.06.2018, 15:58
Ответы с готовыми решениями:

Как удалить все теги img из html кода?
Ребят подскажите как удалить все теги img их html кода.

Конвертировать в html (убрать теги)
Здравствуйте. Имеется интернет магазин (пока на локалке). Дело в том, что использую символ рубля, обвернув стандартный его в админке в...

Конвертировать в html (убрать теги)
Здравствуйте. Имеется интернет магазин (пока на локалке). Дело в том, что использую символ рубля, обвернув стандартный его в админке в...

9
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,667
Записей в блоге: 29
15.06.2018, 16:02
JohoTIla, навскидку не скажу, но вроде там же у элемента есть метод get_text который как раз даст текст без тегов
0
963 / 718 / 276
Регистрация: 10.12.2016
Сообщений: 1,764
15.06.2018, 20:20
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
>>> htm = '''<b class="e-player_name">Шарыченков Александр</b>
<td>30</td>
<td><a href="https://www.khl.ru/clubs/ak_bars/" title="Ак Барс (Казань)">АКБ</a></td>
<td>2</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>-</td>
<td class="sorting_1">0.00</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0:58</td>'''
>>> from lxml import html
>>> tree = html.fromstring(htm)
>>> for i in tree.xpath("//*"):
    t =i.text
    if t: print(t)
 
    
Шарыченков Александр
30
АКБ
2
0
0
0
0
0
0
-
0.00
0
0
0
0
0:58
>>>
0
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
18.06.2018, 08:26
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
>>> from lxml import html
>>> html_string = '''<b class="e-player_name">Шарыченков Александр</b>
... <td>30</td>
... <td><a href="https://www.khl.ru/clubs/ak_bars/" title="Ак Барс (Казань)">АКБ</a></td>
... <td>2</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>-</td>
... <td class="sorting_1">0.00</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0:58</td>'''
>>>
>>> print(html.fromstring(s).text_content())
Шарыченков Александр
30
АКБ
2
0
0
0
0
0
0
-
0.00
0
0
0
0
0:58
>>>
0
0 / 0 / 0
Регистрация: 19.03.2018
Сообщений: 84
18.06.2018, 11:22  [ТС]
а в самом коде который я указал это как то можно сделать а не через вывод?? просто я работаю в PyCharm и мне нужно непосредственно в коде это сделать и + что бы это все сохранилась в csv файл
0
 Аватар для IRIP
514 / 146 / 28
Регистрация: 18.04.2015
Сообщений: 1,904
Записей в блоге: 16
18.06.2018, 11:33
делал что-то похожее, только не убирал теги, а выуживал из тегов нужные данные и сохранял их отдельно в csv - так правильнее, казалось
потом с csv можно делать что угодно, например, импортировать в базу данных и там уже обрабатывать

Добавлено через 1 минуту
Выборка данных из набора файлов XML
Поиск адреса электронной почты в 50000 файлов python3

Сравнить несколько csv файлов и удалить в них дубли
0
20 / 21 / 6
Регистрация: 30.06.2015
Сообщений: 431
20.06.2018, 20:59
https://stackoverflow.com/ques... g#12982689
0
 Аватар для IRIP
514 / 146 / 28
Регистрация: 18.04.2015
Сообщений: 1,904
Записей в блоге: 16
21.06.2018, 08:03
важно не просто почистить html
но и сформировать css
0
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
21.06.2018, 08:05
Цитата Сообщение от IRIP Посмотреть сообщение
но и сформировать css
csv?
0
21.06.2018, 08:19

Не по теме:

да, csv - очепятка =)

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
21.06.2018, 08:19
Помогаю со студенческими работами здесь

Убрать из html файла css, js и теги
Помогите пожалуйста разобраться. Этот код должен убирать из html файла css, js и теги. Результат должен быть выведен в файл. Вот два...

Как убрать html теги у функции?
Как убрать html теги у функции &lt;?php the_content('Читать далее &amp;raquo;'); ?&gt;

Как убрать html теги загруженной страницы?
Как убрать html теги загруженной страницы?

Проверка html кода на закрытые теги
Есть ли какая-нибудь программа или онлайн сервис который может проверить код html на закрытые теги. То есть два тега например...

Отключить все теги html
Добрый день, есть вопрос мой скрипт возвращает строку которую надо передать в виде ответа на запрос. Строка должна быть выведена в чистом...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Новые блоги и статьи
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь(не выше 3-го порядка) постоянного тока с элементами R, L, C, k(ключ), U, E, J. Программа находит переходные токи и напряжения на элементах схемы классическим методом(1 и 2 з-ны. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru