Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.95/65: Рейтинг темы: голосов - 65, средняя оценка - 4.95
1 / 1 / 0
Регистрация: 14.10.2016
Сообщений: 67

Посчитать количество тегов на странице сайта

23.04.2017, 12:38. Показов 14969. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Как можно быстро и удобно посчитать количество тегов на странице сайта(как всех вообще, так и каждый вид тега по отдельности)? А вообще нужно найти частоту их появы на сайте. При чем у меня почему-то не подключается библиотека requests, приходится работать с urllib.request
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
23.04.2017, 12:38
Ответы с готовыми решениями:

Посчитать количество тегов и вывести их содержимое
Мне нужно посчитать количество тегов “p” на странице которые имеют класс “phrase” и вывести их содержимое при помощи цикла. С подсчетом...

Как посчитать количество одинаковых тегов в XML файле?
Добрый всем вечер. Помогите советом. Как посчитать количество тегов stop в теге times, при том, что тегов times будет сотня и тегов stop...

Посчитать кол-во слов на странице сайта
Необходимо посчитать кол-во слов на странице сайта. Подскажите как сделать, с ява вебом до этого не работал. Подключил библиотеки, затем...

3
145 / 113 / 31
Регистрация: 12.06.2011
Сообщений: 1,246
23.04.2017, 15:09
Так пойдет?

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
from xml.dom.minidom import parseString
 
html = """<html>
    <head>
        <title>Some Text</title>
    </head>
    <body>
        <p>Hello World</p>
        <p>Counting Elements is easy with DOM</p>
    </body>
</html>
"""
 
parsed_xml = parseString(html)
 
tags = parsed_xml.getElementsByTagName('*')
p_tags = parsed_xml.getElementsByTagName("p")
 
print (tags)
print(len(tags))
print (p_tags)
print(len(p_tags))
В общем, достать страницу, переконвертить в xml. Проблема в том, что если в xml удастся переконвертить из-за кривого html, то тут проблема.
1
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
23.04.2017, 17:52
Лучший ответ Сообщение было отмечено Sonico как решение

Решение

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import requests
from lxml import html
from collections import Counter
 
url = 'https://www.cyberforum.ru/python-web/thread1966556.html'
page = requests.get(url)
tree = html.fromstring(page.content)
 
all_elms = tree.cssselect('*')
all_tags = [x.tag for x in all_elms]
 
c = Counter(all_tags)
 
# print('all:', len(all_elms), 'span:', c['span'])
 
for e in c:
    print('{}: {}'.format(e, c[e]))
2
1 / 1 / 0
Регистрация: 14.10.2016
Сообщений: 67
23.04.2017, 18:56  [ТС]
Я смог подключить requests и пытался достать сайт несколькими способами:
Python
1
2
3
import urllib.request
response = urllib.request.urlopen('https://httpbin.org/get')
print(response.read())
Python
1
2
3
import requests
response = requests.get('https://httpbin.org/get')
print(response.content)
Python
1
2
3
import requests
response = requests.get('https://httpbin.org/get')
print(response.text)
и конвертировал в строку, но когда подставлял сюда parsed_xml = parseString(html), оно пишет,что синтаксическая ошибка. Засунул я все в свою переменную и ее уже и подставлял в parseString()

Добавлено через 38 минут
Jabbson, вроде все норм спасибо большое.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
23.04.2017, 18:56
Помогаю со студенческими работами здесь

Посчитать количество ссылок на странице
Подскажите, пожалуйста, как сделать, чтобы количество ссылок выводилось в поле для ввода при нажатии кнопки? Пока есть вот что ...

Посчитать количество латинских букв на странице текста
как посчитать число латинских букв на странице текста

Посчитать количество radiobutton на странице и проверить отмечены ли они
Здравствуйте! Помогите, пожалуйста, подсчитать на динамически созданной странице количество групп radio-буттонов и перед отправкой...

Посчитать количество посещений сайта
Понимаю, что вопрос смешной, но я только начинаю изучать Java Script, а в интернете такое видел, но разобраться не смог. Помогите! ...

Облако тегов на отдельной странице
Ребята подскажите плиз, как вывести облако тегов на отдельную страницу. Может можно сделать через статическую страницу? Только как? ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru