Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.54/13: Рейтинг темы: голосов - 13, средняя оценка - 4.54
0 / 0 / 0
Регистрация: 19.03.2018
Сообщений: 84

Убрать все html-теги из кода

15.06.2018, 15:58. Показов 2778. Ответов 9
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
есть код и мне нужно убрать все html теги

например: он выводит это

[<b class="e-player_name">Шарыченков Александр</b>]
<td>30</td>
<td><a href="https://www.khl.ru/clubs/ak_bars/" title="Ак Барс (Казань)">АКБ</a></td>
<td>2</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>-</td>
<td class="sorting_1">0.00</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0:58</td>

а мне нужно вот это:

Шарыченков Александр
30
АКБ
2
0
0
0
0
0
0
-
0.00
0
0
0
0
0:58

код ниже подскажите как это сделать а то уже 2 день мучаюсь

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
import csv
import requests
import re
from bs4 import BeautifulSoup
 
page = open('Статистика : Личная статистика : 17_18 | плей-офф : Континентальная Хоккейная Лига (КХЛ).html').read()
soup = BeautifulSoup(page, "lxml")
 
divs = soup.find("table", id='goalies_dataTable').find('tbody')
 
table = divs.findAll('tr')
 
Info_player = csv.writer(open('Info_player.csv', 'w'))
Info_player.writerow(['Игрок', '№', 'Клуб', 'И', 'В', 'П', 'ИБ', 'Бр', 'ПШ', 'ОБ',
                      '%ОБ', 'КН', 'Ш', 'А', 'И"O"', 'Штр', 'ВП'])
 
for tesy in table:
 
    name = tesy.findAll('b')
    td = tesy.findAll('td')
 
    NumberPl= td[1]
    print(NumberPl)
    ClubPl= td[2]
    print(ClubPl)
    GamePl= td[3]
    print(GamePl)
    WinPl= td[4]
    print(WinPl)
    losPl= td[5]
    print(losPl)
    IBPl= td[6]
    print(IBPl)
    BrPl= td[7]
    print(BrPl)
    PHPl= td[8]
    print(PHPl)
    OBPl= td[9]
    print(OBPl)
    proOBPl= td[10]
    print(proOBPl)
    KNPl= td[11]
    print(KNPl)
    HPl= td[12]
    print(HPl)
    APl= td[13]
    print(APl)
    IOPl= td[14]
    print(IOPl)
    HtrPl= td[15]
    print(HtrPl)
    VPPl= td[16]
    print(VPPl)
    Info_player.writerow([name, NumberPl, ClubPl, GamePl, WinPl, losPl, IBPl, BrPl, PHPl, OBPl, proOBPl, KNPl, HPl,
                          APl, IOPl, HtrPl, VPPl])
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
15.06.2018, 15:58
Ответы с готовыми решениями:

Как удалить все теги img из html кода?
Ребят подскажите как удалить все теги img их html кода.

Конвертировать в html (убрать теги)
Здравствуйте. Имеется интернет магазин (пока на локалке). Дело в том, что использую символ рубля, обвернув стандартный его в админке в...

Конвертировать в html (убрать теги)
Здравствуйте. Имеется интернет магазин (пока на локалке). Дело в том, что использую символ рубля, обвернув стандартный его в админке в...

9
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7392 / 4819 / 1246
Регистрация: 30.03.2015
Сообщений: 13,694
Записей в блоге: 29
15.06.2018, 16:02
JohoTIla, навскидку не скажу, но вроде там же у элемента есть метод get_text который как раз даст текст без тегов
0
963 / 718 / 276
Регистрация: 10.12.2016
Сообщений: 1,764
15.06.2018, 20:20
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
>>> htm = '''<b class="e-player_name">Шарыченков Александр</b>
<td>30</td>
<td><a href="https://www.khl.ru/clubs/ak_bars/" title="Ак Барс (Казань)">АКБ</a></td>
<td>2</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>-</td>
<td class="sorting_1">0.00</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0:58</td>'''
>>> from lxml import html
>>> tree = html.fromstring(htm)
>>> for i in tree.xpath("//*"):
    t =i.text
    if t: print(t)
 
    
Шарыченков Александр
30
АКБ
2
0
0
0
0
0
0
-
0.00
0
0
0
0
0:58
>>>
0
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
18.06.2018, 08:26
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
>>> from lxml import html
>>> html_string = '''<b class="e-player_name">Шарыченков Александр</b>
... <td>30</td>
... <td><a href="https://www.khl.ru/clubs/ak_bars/" title="Ак Барс (Казань)">АКБ</a></td>
... <td>2</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>-</td>
... <td class="sorting_1">0.00</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0:58</td>'''
>>>
>>> print(html.fromstring(s).text_content())
Шарыченков Александр
30
АКБ
2
0
0
0
0
0
0
-
0.00
0
0
0
0
0:58
>>>
0
0 / 0 / 0
Регистрация: 19.03.2018
Сообщений: 84
18.06.2018, 11:22  [ТС]
а в самом коде который я указал это как то можно сделать а не через вывод?? просто я работаю в PyCharm и мне нужно непосредственно в коде это сделать и + что бы это все сохранилась в csv файл
0
 Аватар для IRIP
514 / 146 / 28
Регистрация: 18.04.2015
Сообщений: 1,904
Записей в блоге: 16
18.06.2018, 11:33
делал что-то похожее, только не убирал теги, а выуживал из тегов нужные данные и сохранял их отдельно в csv - так правильнее, казалось
потом с csv можно делать что угодно, например, импортировать в базу данных и там уже обрабатывать

Добавлено через 1 минуту
Выборка данных из набора файлов XML
Поиск адреса электронной почты в 50000 файлов python3

Сравнить несколько csv файлов и удалить в них дубли
0
20 / 21 / 6
Регистрация: 30.06.2015
Сообщений: 431
20.06.2018, 20:59
https://stackoverflow.com/ques... g#12982689
0
 Аватар для IRIP
514 / 146 / 28
Регистрация: 18.04.2015
Сообщений: 1,904
Записей в блоге: 16
21.06.2018, 08:03
важно не просто почистить html
но и сформировать css
0
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
21.06.2018, 08:05
Цитата Сообщение от IRIP Посмотреть сообщение
но и сформировать css
csv?
0
21.06.2018, 08:19

Не по теме:

да, csv - очепятка =)

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
21.06.2018, 08:19
Помогаю со студенческими работами здесь

Убрать из html файла css, js и теги
Помогите пожалуйста разобраться. Этот код должен убирать из html файла css, js и теги. Результат должен быть выведен в файл. Вот два...

Как убрать html теги у функции?
Как убрать html теги у функции &lt;?php the_content('Читать далее &amp;raquo;'); ?&gt;

Как убрать html теги загруженной страницы?
Как убрать html теги загруженной страницы?

Проверка html кода на закрытые теги
Есть ли какая-нибудь программа или онлайн сервис который может проверить код html на закрытые теги. То есть два тега например...

Отключить все теги html
Добрый день, есть вопрос мой скрипт возвращает строку которую надо передать в виде ответа на запрос. Строка должна быть выведена в чистом...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Новые блоги и статьи
Уведомление о неверно выбранном значении справочника
Maks 06.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "НарядПутевка", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если в документе выбран неверный склад. . .
Установка Qt Creator для C и C++: ставим среду, CMake и MinGW без фреймворка Qt
8Observer8 05.04.2026
Среду разработки Qt Creator можно установить без фреймворка Qt. Есть отдельный репозиторий для этой среды: https:/ / github. com/ qt-creator/ qt-creator, где можно скачать установщик, на вкладке Releases:. . .
AkelPad-скрипты, структуры, и немного лирики..
testuser2 05.04.2026
Такая программа, как AkelPad существует уже давно, и также давно существуют скрипты под нее. Тем не менее, прога живет, периодически что-то не спеша дополняется, улучшается. Что меня в первую очередь. . .
Отображение реквизитов в документе по условию и контроль их заполнения
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеСпецтехники", разработанного в конфигурации КА2. Данный документ берёт данные из другого нетипового документа. . .
Фото всей Земли с борта корабля Orion миссии Artemis II
kumehtar 04.04.2026
Это первое подобное фото сделанное человеком за 50 лет. Снимок называют новым вариантом легендарной фотографии «The Blue Marble» 1972 года, сделанной с борта корабля «Аполлон-17». Новое фото. . .
Вывод диалогового окна перед закрытием, если документ не проведён
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать программный контроль на предмет проведения документа. . .
Программный контроль заполнения реквизитов табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: 1. Реализовать контроль заполнения реквизита. . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru