Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.54/13: Рейтинг темы: голосов - 13, средняя оценка - 4.54
0 / 0 / 0
Регистрация: 19.03.2018
Сообщений: 84
1

Убрать все html-теги из кода

15.06.2018, 15:58. Показов 2364. Ответов 9
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
есть код и мне нужно убрать все html теги

например: он выводит это

[<b class="e-player_name">Шарыченков Александр</b>]
<td>30</td>
<td><a href="https://www.khl.ru/clubs/ak_bars/" title="Ак Барс (Казань)">АКБ</a></td>
<td>2</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>-</td>
<td class="sorting_1">0.00</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0:58</td>

а мне нужно вот это:

Шарыченков Александр
30
АКБ
2
0
0
0
0
0
0
-
0.00
0
0
0
0
0:58

код ниже подскажите как это сделать а то уже 2 день мучаюсь

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
import csv
import requests
import re
from bs4 import BeautifulSoup
 
page = open('Статистика : Личная статистика : 17_18 | плей-офф : Континентальная Хоккейная Лига (КХЛ).html').read()
soup = BeautifulSoup(page, "lxml")
 
divs = soup.find("table", id='goalies_dataTable').find('tbody')
 
table = divs.findAll('tr')
 
Info_player = csv.writer(open('Info_player.csv', 'w'))
Info_player.writerow(['Игрок', '№', 'Клуб', 'И', 'В', 'П', 'ИБ', 'Бр', 'ПШ', 'ОБ',
                      '%ОБ', 'КН', 'Ш', 'А', 'И"O"', 'Штр', 'ВП'])
 
for tesy in table:
 
    name = tesy.findAll('b')
    td = tesy.findAll('td')
 
    NumberPl= td[1]
    print(NumberPl)
    ClubPl= td[2]
    print(ClubPl)
    GamePl= td[3]
    print(GamePl)
    WinPl= td[4]
    print(WinPl)
    losPl= td[5]
    print(losPl)
    IBPl= td[6]
    print(IBPl)
    BrPl= td[7]
    print(BrPl)
    PHPl= td[8]
    print(PHPl)
    OBPl= td[9]
    print(OBPl)
    proOBPl= td[10]
    print(proOBPl)
    KNPl= td[11]
    print(KNPl)
    HPl= td[12]
    print(HPl)
    APl= td[13]
    print(APl)
    IOPl= td[14]
    print(IOPl)
    HtrPl= td[15]
    print(HtrPl)
    VPPl= td[16]
    print(VPPl)
    Info_player.writerow([name, NumberPl, ClubPl, GamePl, WinPl, losPl, IBPl, BrPl, PHPl, OBPl, proOBPl, KNPl, HPl,
                          APl, IOPl, HtrPl, VPPl])
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
15.06.2018, 15:58
Ответы с готовыми решениями:

Как удалить все теги img из html кода?
Ребят подскажите как удалить все теги img их html кода.

Конвертировать в html (убрать теги)
Здравствуйте. Имеется интернет магазин (пока на локалке). Дело в том, что использую символ рубля,...

Конвертировать в html (убрать теги)
Здравствуйте. Имеется интернет магазин (пока на локалке). Дело в том, что использую символ рубля,...

Убрать из html файла css, js и теги
Помогите пожалуйста разобраться. Этот код должен убирать из html файла css, js и теги. Результат...

9
Автоматизируй это!
Эксперт Python
7107 / 4611 / 1215
Регистрация: 30.03.2015
Сообщений: 13,243
Записей в блоге: 29
15.06.2018, 16:02 2
JohoTIla, навскидку не скажу, но вроде там же у элемента есть метод get_text который как раз даст текст без тегов
0
930 / 691 / 270
Регистрация: 10.12.2016
Сообщений: 1,701
15.06.2018, 20:20 3
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
>>> htm = '''<b class="e-player_name">Шарыченков Александр</b>
<td>30</td>
<td><a href="https://www.khl.ru/clubs/ak_bars/" title="Ак Барс (Казань)">АКБ</a></td>
<td>2</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>-</td>
<td class="sorting_1">0.00</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0</td>
<td>0:58</td>'''
>>> from lxml import html
>>> tree = html.fromstring(htm)
>>> for i in tree.xpath("//*"):
    t =i.text
    if t: print(t)
 
    
Шарыченков Александр
30
АКБ
2
0
0
0
0
0
0
-
0.00
0
0
0
0
0:58
>>>
0
Эксперт по компьютерным сетям
5898 / 3355 / 1035
Регистрация: 03.11.2009
Сообщений: 10,003
18.06.2018, 08:26 4
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
>>> from lxml import html
>>> html_string = '''<b class="e-player_name">Шарыченков Александр</b>
... <td>30</td>
... <td><a href="https://www.khl.ru/clubs/ak_bars/" title="Ак Барс (Казань)">АКБ</a></td>
... <td>2</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>-</td>
... <td class="sorting_1">0.00</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0</td>
... <td>0:58</td>'''
>>>
>>> print(html.fromstring(s).text_content())
Шарыченков Александр
30
АКБ
2
0
0
0
0
0
0
-
0.00
0
0
0
0
0:58
>>>
0
0 / 0 / 0
Регистрация: 19.03.2018
Сообщений: 84
18.06.2018, 11:22  [ТС] 5
а в самом коде который я указал это как то можно сделать а не через вывод?? просто я работаю в PyCharm и мне нужно непосредственно в коде это сделать и + что бы это все сохранилась в csv файл
0
513 / 145 / 28
Регистрация: 18.04.2015
Сообщений: 1,879
Записей в блоге: 15
18.06.2018, 11:33 6
делал что-то похожее, только не убирал теги, а выуживал из тегов нужные данные и сохранял их отдельно в csv - так правильнее, казалось
потом с csv можно делать что угодно, например, импортировать в базу данных и там уже обрабатывать

Добавлено через 1 минуту
Выборка данных из набора файлов XML
Поиск адреса электронной почты в 50000 файлов python3

Сравнить несколько csv файлов и удалить в них дубли
0
20 / 21 / 6
Регистрация: 30.06.2015
Сообщений: 431
20.06.2018, 20:59 7
https://stackoverflow.com/ques... g#12982689
0
513 / 145 / 28
Регистрация: 18.04.2015
Сообщений: 1,879
Записей в блоге: 15
21.06.2018, 08:03 8
важно не просто почистить html
но и сформировать css
0
Эксперт по компьютерным сетям
5898 / 3355 / 1035
Регистрация: 03.11.2009
Сообщений: 10,003
21.06.2018, 08:05 9
Цитата Сообщение от IRIP Посмотреть сообщение
но и сформировать css
csv?
0
IRIP
21.06.2018, 08:19     Убрать все html-теги из кода
  #10

Не по теме:

да, csv - очепятка =)

0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
21.06.2018, 08:19

Как убрать html теги у функции?
Как убрать html теги у функции &lt;?php the_content('Читать далее &amp;raquo;'); ?&gt;

Как убрать html теги загруженной страницы?
Как убрать html теги загруженной страницы?

Проверка html кода на закрытые теги
Есть ли какая-нибудь программа или онлайн сервис который может проверить код html на закрытые теги....

Отключить все теги html
Добрый день, есть вопрос мой скрипт возвращает строку которую надо передать в виде ответа на...

в html 5 все теги будет закрыто ?
&lt;meta /&gt; ?

Как заменить все html теги в строке?
Всех приветствую. Я пытаюсь удалить все html теги из строки. Мой способ работает,кроме случая с...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru