|
0 / 0 / 0
Регистрация: 15.03.2018
Сообщений: 2
|
|||||||||||
Новичок, очень хочу разобраться15.03.2018, 23:34. Показов 1351. Ответов 5
Метки нет (Все метки)
1)После открытия и прочтения файла требуется разбить текст на отдельные слова (именно слова, без знаков препинания).
2)Затем посчитать статистические данные: сколько в тексте слов длины 1, слов длины 2 и т.д. Статистику потребуется нормализовать, т.е. поделить количество слов в каждой категории на количество всех слов и выразить это отношение в процентах. После этого эти подсчитанные количества остаётся вывести на экран в порядке возрастания длин слов. 3)Описать готовый код в виде функции, принимающей текстовый файл и возвращающей статистику (в виде списка "[]" или словаря "{}", как будет удобнее). С её помощью провести сравнение нескольких разных текстов (например, новостной статьи, научной статьи и какой-нибудь прозы). 4) Для собранных данных вывести графики зависимости количества слов от длины слова (может помочь библиотека matplotlib). Как я поняла, начинать нужно примерно так:
Была идея удалить все символы кроме пробелов и букв, чтобы разбить текст на отдельные слова, но мне кажется, это совсем не то:
Буду рада любой помощи!
0
|
|||||||||||
| 15.03.2018, 23:34 | |
|
Ответы с готовыми решениями:
5
Хочу разобраться с выводом в консоль Напишите программу с объяснением каждого действия, очень хочу разобраться Очень простая проблема, просто я новичок( |
|
119 / 103 / 53
Регистрация: 13.04.2014
Сообщений: 233
|
|||||||||||
| 16.03.2018, 00:05 | |||||||||||
Сообщение было отмечено julymorningstar как решение
Решение
1
|
|||||||||||
|
0 / 0 / 0
Регистрация: 15.03.2018
Сообщений: 2
|
|
| 16.03.2018, 00:09 [ТС] | |
|
Спасибо большое за ответ!!!
0
|
|
|
|
|
| 16.03.2018, 01:14 | |
|
orAnd,
r'(?<=[\W])(\w+?)(?=[\W])' => r'\b(\w+?)\b' Работает по тому же принципу, но находит на 1 потерянный токен больше.
1
|
|
|
119 / 103 / 53
Регистрация: 13.04.2014
Сообщений: 233
|
|
| 16.03.2018, 10:25 | |
|
Garry Galler, спасибо за совет, я тоже только учусь.
Ещё, возможно надо произвести последующую фильтрацию полученного списка от слов типа '123', 'т', 'д', 'е' (если, конечно такие не нужны). Или заменить '\w' на группу типа '[А-Яа-я]'(это спасёт только от цифр)
0
|
|
|
963 / 718 / 276
Регистрация: 10.12.2016
Сообщений: 1,764
|
|||||||||||
| 16.03.2018, 21:27 | |||||||||||
|
orAnd, замените на
Добавлено через 2 минуты как вариант составить список исключений
0
|
|||||||||||
| 16.03.2018, 21:27 | |
|
Помогаю со студенческими работами здесь
6
Хочу разобраться с условием задачи Хочу разобраться в задаче на питоне.подкиньте идею
Я хочу разобраться в Python , но у меня произошла проблема с CMD Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Вывод диалогового окна перед закрытием, если документ не проведён
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача: реализовать программный контроль на предмет проведения документа. . .
|
Программный контроль заполнения реквизита табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача: реализовать контроль заполнения реквизита "ПричинаСписания". . .
|
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение:
DISM / Online / Add-Capability / CapabilityName:WMIC~~~~
Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
|
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача: при создании документов установить период списания автоматически. . .
|
|
Вывод данных в справочнике через динамический список
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2.
Задача: вывести данные из ТЧ нетипового документа. . .
|
Программное заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению.
На форме документа создается. . .
|
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
|
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
|