Аватар для Марс313
0 / 0 / 0
Регистрация: 23.12.2018
Сообщений: 55

Посчитайте распределение тематик новостей в файле

18.08.2022, 09:45. Показов 1399. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем привет! Есть задача по Python ,не могу доделать. Свой код представил ниже.
Спасибо большое.

Описание задания:
1Посчитайте распределение тематик новостей в файле URL.txt (то есть какое количество раз встречается страница с каждой темой). Тематикой можно считать первое слово между знаками '/' в URL новости.
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
from collections import Counter
import re
pattern = '.*/[0-9]{8}'
prog = re.compile( pattern )
a = []
o = open('urls.txt', 'r')
f = list(set(o))
st = str(f).split('/')
category_audience = zip( st )
for element in category_audience:
    a.append( element )
c = Counter(a)
print(c)
Вложения
Тип файла: txt URLs.txt (5.9 Кб, 5 просмотров)
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
18.08.2022, 09:45
Ответы с готовыми решениями:

Распределение новостей
Нужно убрать отступ слева от кнопки сортировки? Сайт http://torrentbest.org Если сортировать статьи, например по популярности, то...

Посчитайте количество цифр в файле
Создайте текстовый файл в который запишите и цифры. Выведите его содержимое на экран, посчитайте количество цифр и выведите их также на...

Посчитайте число единиц в файле
Посчитайте число единиц в файле формата csv. Первая строка файла содержит номера столбцов, первый столбец содержит индексы строк. ...

3
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
18.08.2022, 10:35
Лучший ответ Сообщение было отмечено Марс313 как решение

Решение

Не по теме:

Смешались вместе кони, люди...



Добавлено через 11 минут
Python
1
2
3
4
import re
 
with open('URLs.txt', 'r') as f:
    first_words = re.findall(r'(?m)(?<=^/)\w+', f.read())
1
 Аватар для Марс313
0 / 0 / 0
Регистрация: 23.12.2018
Сообщений: 55
18.08.2022, 13:32  [ТС]
Хотел бы уточнить, что значит
Python
1
first_words = re.findall(r'(?m)(?<=^/)\w+', f.read())
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
18.08.2022, 13:40
f.read() - прочитали весь файл
re.findall - ищем в нем все совпадения согласно регулярки
(?m) - флаг multiline, чтоб регулярка рассматривала текст как строки, а не как монолит (1 строка)
\w+ - непрерывная последовательность из букофф, цифер и подчеркивания. Слово то бишь, ...
(?<=^/) - ... непосредственно перед которым стоит начало строки (^) и слеш.

В итоге получаем список искомых слов - first_words
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
18.08.2022, 13:40
Помогаю со студенческими работами здесь

Распределение памяти в двоичном файле
Если содержимое двоичного файла при каждом запуске программы переписывается от начала до конца, то он всегда будет содержать только...

На сайте появилось много тематик
Вопрос такой! На сайте появилось слишком много тематик, сами понимаете что поднять в выдаче стало все сложнее. Сами понимаете сайт лицо...

Продвижение комерческих тематик ссылками
Здравствуйте! Как известно, яндекс пытается минимально сократить воздействие ссылок на продвижение. Вот хочу возобновить свой ИМ, как...

Вопрос о распозновании Яшей схожих тематик
Возможно, это обсуждалось - не нашел! Не могу взять в толк: Существует данное, что ссылки с сайтов схожей тематики имеют более высокий...

нормальна баннерная сеть игровых тематик???
кто знает такие обменники? :\&quot;&gt;


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Опции темы

Новые блоги и статьи
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru