|
0 / 0 / 0
Регистрация: 15.03.2018
Сообщений: 2
|
|||||||||||
Новичок, очень хочу разобраться15.03.2018, 23:34. Показов 1354. Ответов 5
Метки нет (Все метки)
1)После открытия и прочтения файла требуется разбить текст на отдельные слова (именно слова, без знаков препинания).
2)Затем посчитать статистические данные: сколько в тексте слов длины 1, слов длины 2 и т.д. Статистику потребуется нормализовать, т.е. поделить количество слов в каждой категории на количество всех слов и выразить это отношение в процентах. После этого эти подсчитанные количества остаётся вывести на экран в порядке возрастания длин слов. 3)Описать готовый код в виде функции, принимающей текстовый файл и возвращающей статистику (в виде списка "[]" или словаря "{}", как будет удобнее). С её помощью провести сравнение нескольких разных текстов (например, новостной статьи, научной статьи и какой-нибудь прозы). 4) Для собранных данных вывести графики зависимости количества слов от длины слова (может помочь библиотека matplotlib). Как я поняла, начинать нужно примерно так:
Была идея удалить все символы кроме пробелов и букв, чтобы разбить текст на отдельные слова, но мне кажется, это совсем не то:
Буду рада любой помощи!
0
|
|||||||||||
| 15.03.2018, 23:34 | |
|
Ответы с готовыми решениями:
5
Хочу разобраться с выводом в консоль Напишите программу с объяснением каждого действия, очень хочу разобраться Очень простая проблема, просто я новичок( |
|
119 / 103 / 53
Регистрация: 13.04.2014
Сообщений: 233
|
|||||||||||
| 16.03.2018, 00:05 | |||||||||||
Сообщение было отмечено julymorningstar как решение
Решение
1
|
|||||||||||
|
0 / 0 / 0
Регистрация: 15.03.2018
Сообщений: 2
|
|
| 16.03.2018, 00:09 [ТС] | |
|
Спасибо большое за ответ!!!
0
|
|
|
|
|
| 16.03.2018, 01:14 | |
|
orAnd,
r'(?<=[\W])(\w+?)(?=[\W])' => r'\b(\w+?)\b' Работает по тому же принципу, но находит на 1 потерянный токен больше.
1
|
|
|
119 / 103 / 53
Регистрация: 13.04.2014
Сообщений: 233
|
|
| 16.03.2018, 10:25 | |
|
Garry Galler, спасибо за совет, я тоже только учусь.
Ещё, возможно надо произвести последующую фильтрацию полученного списка от слов типа '123', 'т', 'д', 'е' (если, конечно такие не нужны). Или заменить '\w' на группу типа '[А-Яа-я]'(это спасёт только от цифр)
0
|
|
|
963 / 718 / 276
Регистрация: 10.12.2016
Сообщений: 1,764
|
|||||||||||
| 16.03.2018, 21:27 | |||||||||||
|
orAnd, замените на
Добавлено через 2 минуты как вариант составить список исключений
0
|
|||||||||||
| 16.03.2018, 21:27 | |
|
Помогаю со студенческими работами здесь
6
Хочу разобраться с условием задачи Хочу разобраться в задаче на питоне.подкиньте идею
Я хочу разобраться в Python , но у меня произошла проблема с CMD Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
Установка Qt Creator для C и C++: ставим среду, CMake и MinGW без фреймворка Qt
8Observer8 05.04.2026
Среду разработки Qt Creator можно установить без фреймворка Qt. Есть отдельный репозиторий для этой среды: https:/ / github. com/ qt-creator/ qt-creator, где можно скачать установщик, на вкладке Releases:. . .
|
AkelPad-скрипты, структуры, и немного лирики..
testuser2 05.04.2026
Такая программа, как AkelPad существует уже давно, и также давно существуют скрипты под нее. Тем не менее, прога живет, периодически что-то не спеша дополняется, улучшается. Что меня в первую очередь. . .
|
Отображение реквизитов в документе по условию и контроль их заполнения
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеСпецтехники", разработанного в конфигурации КА2.
Данный документ берёт данные из другого нетипового документа. . .
|
Фото всей Земли с борта корабля Orion миссии Artemis II
kumehtar 04.04.2026
Это первое подобное фото сделанное человеком за 50 лет. Снимок называют новым вариантом легендарной фотографии «The Blue Marble» 1972 года, сделанной с борта корабля «Аполлон-17». Новое фото. . .
|
|
Вывод диалогового окна перед закрытием, если документ не проведён
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача: реализовать программный контроль на предмет проведения документа. . .
|
Программный контроль заполнения реквизитов табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача:
1. Реализовать контроль заполнения реквизита. . .
|
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение:
DISM / Online / Add-Capability / CapabilityName:WMIC~~~~
Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
|
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача: при создании документов установить период списания автоматически. . .
|