Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.73/55: Рейтинг темы: голосов - 55, средняя оценка - 4.73
0 / 0 / 0
Регистрация: 24.01.2019
Сообщений: 37

Построить частотный словарь для выбранного пользователем текстового документа

21.03.2019, 22:56. Показов 10628. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Построить частотный словарь для выбранного пользователем текстового документа. Перед составлением частотного словаря, удалить из текста пунктуацию и стоп-слова.
1) Первые 5 слов, частота которых наибольшая, вывести пользователю как ключевые слова документа.
2) В результирующий файл вывести слова и вероятность их встречаемости в тексте по убыванию вероятности.
3) Слова, представляющие собой именованною сущность (имена, названия торговых марок и т.д.), вывести отдельным файлом .
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
21.03.2019, 22:56
Ответы с готовыми решениями:

Построить диаграмму выбранного пользователем вида из случайных чисел выбранного пользователем диапазона.
Сгенерировать последовательность десяти случайных чисел из выбранного пользователем диапазона и построить диаграмму с помощью компонента...

Составить частотный словарь содержимого текстового файла
3.Составить частотный словарь содержимого текстового файла. Известно что файл содержит текст состоящий из слов. Слова разделены пробелом,...

Построить алфавитно-частотный словарь
Напишите программу, которая строит алфавитно-частотный словарь для файла input.txt , в котором записаны слова, состоящие только из строчных...

2
3582 / 2182 / 571
Регистрация: 02.09.2015
Сообщений: 5,510
22.03.2019, 10:59
Лучший ответ Сообщение было отмечено mar324 как решение

Решение

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
import collections
import re
 
def main():
    filename1 = input("Введите имя текстового документа: ")
    filename2 = input("Введите имя результирующего файла: ")
    filename3 = input("Введите имя результирующего файла для именованных сущностей: ")
    with open(filename1) as fin, open(filename2, "w") as fout1, open(filename3, "w") as fout2:
        words = re.split(r"\W+", fin.read())
        counter = collections.Counter(words)
        print("Ключевые слова документа:", counter.most_common(5))
 
        for word in words:
            if not word.istitle():
                print(word, file = fout1)
            else:
                print(word, file = fout2)
 
if __name__ == "__main__":
    main()
1
 Аватар для Semen-Semenich
5222 / 3469 / 1173
Регистрация: 21.03.2016
Сообщений: 8,295
22.03.2019, 14:43
Arsegg, боюсь что в файл именованных сущностей попадут все слова с заглавными буквами то есть начальные слова предложений. пример входного файла:

Построить частотный словарь для выбранного пользователем текстового документа. Перед составлением частотного словаря, удалить из текста пунктуацию и стоп-слова.
Первые 5 слов, частота которых наибольшая, вывести пользователю как ключевые слова документа.
В результирующий файл вывести слова и вероятность их встречаемости в тексте по убыванию вероятности.
Слова, представляющие собой именованною сущность (имена, названия торговых марок и т.д.), вывести отдельным файлом .
работа кода
=
Введите имя текстового документа: test.txt
Введите имя результирующего файла: result.txt
Введите имя результирующего файла для именованных сущностей: name.txt
Ключевые слова документа: [('и', 3), ('слова', 3), ('вывести', 3), ('документа', 2), ('Построить', 1)]
>>>

результат файла name.txt:
Построить
Перед
Первые
В
Слова
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
22.03.2019, 14:43
Помогаю со студенческими работами здесь

Построить алфавитно-частотный словарь
Напишите программу, которая строит алфавитно-частотный словарь для файла input.txt , в котором записаны слова, состоящие из букв латинского...

Частотный словарь из слов текстового файла в виде дерева двоичного поиска
Задача: Построить частотный словарь из слов текстового файла в виде дерева двоичного поиска. Вывести его на экран в виде дерева....

Построить частотный словарь слов текста
Даны текстовый файл, в котором содержатся различные слова длиной от одного и более символов, отделенные произвольным числом пробелов....

Статистика выбранного пользователем документа
Разработать программу, которая выводит статистику выбранного пользователем документа. Статистические данные включают количество слов,...

Задане:частотный словарь символов слогов их двух производных символов (см.частотный словарь слов)
Задане:частотный словарь символов слогов их двух производных символов (см.частотный словарь слов) выручайте я вообще не бум-бум :wall:


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит переходные токи и напряжения на элементах схемы. . . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru