1 / 1 / 0
Регистрация: 14.10.2016
Сообщений: 67

Посчитать количество тегов на странице сайта

23.04.2017, 12:38. Показов 15034. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Как можно быстро и удобно посчитать количество тегов на странице сайта(как всех вообще, так и каждый вид тега по отдельности)? А вообще нужно найти частоту их появы на сайте. При чем у меня почему-то не подключается библиотека requests, приходится работать с urllib.request
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
23.04.2017, 12:38
Ответы с готовыми решениями:

Посчитать количество тегов и вывести их содержимое
Мне нужно посчитать количество тегов “p” на странице которые имеют класс “phrase” и вывести их содержимое при помощи цикла. С подсчетом...

Как посчитать количество одинаковых тегов в XML файле?
Добрый всем вечер. Помогите советом. Как посчитать количество тегов stop в теге times, при том, что тегов times будет сотня и тегов stop...

Посчитать кол-во слов на странице сайта
Необходимо посчитать кол-во слов на странице сайта. Подскажите как сделать, с ява вебом до этого не работал. Подключил библиотеки, затем...

3
145 / 113 / 31
Регистрация: 12.06.2011
Сообщений: 1,246
23.04.2017, 15:09
Так пойдет?

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
from xml.dom.minidom import parseString
 
html = """<html>
    <head>
        <title>Some Text</title>
    </head>
    <body>
        <p>Hello World</p>
        <p>Counting Elements is easy with DOM</p>
    </body>
</html>
"""
 
parsed_xml = parseString(html)
 
tags = parsed_xml.getElementsByTagName('*')
p_tags = parsed_xml.getElementsByTagName("p")
 
print (tags)
print(len(tags))
print (p_tags)
print(len(p_tags))
В общем, достать страницу, переконвертить в xml. Проблема в том, что если в xml удастся переконвертить из-за кривого html, то тут проблема.
1
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
23.04.2017, 17:52
Лучший ответ Сообщение было отмечено Sonico как решение

Решение

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import requests
from lxml import html
from collections import Counter
 
url = 'https://www.cyberforum.ru/python-web/thread1966556.html'
page = requests.get(url)
tree = html.fromstring(page.content)
 
all_elms = tree.cssselect('*')
all_tags = [x.tag for x in all_elms]
 
c = Counter(all_tags)
 
# print('all:', len(all_elms), 'span:', c['span'])
 
for e in c:
    print('{}: {}'.format(e, c[e]))
2
1 / 1 / 0
Регистрация: 14.10.2016
Сообщений: 67
23.04.2017, 18:56  [ТС]
Я смог подключить requests и пытался достать сайт несколькими способами:
Python
1
2
3
import urllib.request
response = urllib.request.urlopen('https://httpbin.org/get')
print(response.read())
Python
1
2
3
import requests
response = requests.get('https://httpbin.org/get')
print(response.content)
Python
1
2
3
import requests
response = requests.get('https://httpbin.org/get')
print(response.text)
и конвертировал в строку, но когда подставлял сюда parsed_xml = parseString(html), оно пишет,что синтаксическая ошибка. Засунул я все в свою переменную и ее уже и подставлял в parseString()

Добавлено через 38 минут
Jabbson, вроде все норм спасибо большое.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
23.04.2017, 18:56
Помогаю со студенческими работами здесь

Посчитать количество ссылок на странице
Подскажите, пожалуйста, как сделать, чтобы количество ссылок выводилось в поле для ввода при нажатии кнопки? Пока есть вот что ...

Посчитать количество латинских букв на странице текста
как посчитать число латинских букв на странице текста

Посчитать количество radiobutton на странице и проверить отмечены ли они
Здравствуйте! Помогите, пожалуйста, подсчитать на динамически созданной странице количество групп radio-буттонов и перед отправкой...

Посчитать количество посещений сайта
Понимаю, что вопрос смешной, но я только начинаю изучать Java Script, а в интернете такое видел, но разобраться не смог. Помогите! ...

Облако тегов на отдельной странице
Ребята подскажите плиз, как вывести облако тегов на отдельную страницу. Может можно сделать через статическую страницу? Только как? ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Опции темы

Новые блоги и статьи
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru