Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.82/11: Рейтинг темы: голосов - 11, средняя оценка - 4.82
0 / 2 / 1
Регистрация: 18.10.2013
Сообщений: 312

Статистика в тексте

17.12.2016, 19:11. Показов 2284. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Есть программа первого закона Ципфа.
Измерим количество вхождений каждого слова в текст и возьмем только одно значение из каждой группы, имеющей одинаковую частоту. Расположим частоты по мере их убывания и пронумеруем, порядковый номер частоты назовем рангом частоты Выделение ключевых слов в текстовых документах ранг слова Выделение ключевых слов в текстовых документах). Наиболее часто встречающиеся слова будут иметь ранг 1, следующие за ними – 2 и так далее. Ето первый закон.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import re
import sys
from collections import Counter
import numpy as np
import matplotlib.pyplot as plt
 
FILENAME = sys.argv[1][0:sys.argv[1].find('.')]
 
WORDS = []
 
with open(sys.argv[1], 'rb') as textFile:
    WORDS = (re.findall(re.compile(r'\w+'), (textFile.read()).lower()))
 
LABELS, VALUES = zip(*list(reversed(sorted(Counter(WORDS).items(), key=lambda x: x[1]))))
INDEXES = np.arange(len(LABELS))
 
plt.plot(INDEXES, VALUES)
 
plt.xlim(-(len(LABELS))*5/100)
plt.ylim(-(max(VALUES)*5)/100)
 
plt.xlabel('Rank')
plt.ylabel('Frequency')
 
plt.grid()
plt.savefig('figures/' + FILENAME + '_zipfs', dpi=500)
Нужно дописать второй закон: Первый закон не учитывает факт того, что разные слова могут входить в текст с одинаковой частотой. Ципф установил, что частота и количество слов, входящих в текст с этой частотой, также имеют зависимость. Если построить график, отложив по оси абсцисс частоту вхождения слова, а по оси ординат – количество слов в данной частоте, то получившаяся кривая будет сохранять свой вид для всех без исключения текстов.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
17.12.2016, 19:11
Ответы с готовыми решениями:

Статистика: определить, каких букв (строчных или прописных) в тексте больше
Помогите другу с курсачом плиззз. Статистика. Дан текст. Определите, каких букв (строчных или прописных) в нем больше, и преобразуйте...

Статистика биржевой деятельности и статистика спроса
Очень поджимают сроки, сдать нужно ЗАВТРА! Сам сделал 12 задач, думал и с этими справлюсь, но, к сожалению, совсем не выходит. Крайне...

В заданном тексте вычислить количество слов в тексте и распечатать их по одному в строку
Всем доброго вечера, заканчиваю практику в университете и осталась последняя задачка, которую надо решить на qbasic, pascal и turboC. ...

1
0 / 2 / 1
Регистрация: 18.10.2013
Сообщений: 312
18.12.2016, 03:19  [ТС]
Нужно допилить второй закон.

Добавлено через 8 часов 7 минут
хелп хелп
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
18.12.2016, 03:19
Помогаю со студенческими работами здесь

В заданном тексте указать, сколько раз встречается в тексте первое слово
помогите пожалуйста!!!!п

В тексте поменять местами 1ю и 2ю половины каждого слова. В тексте несколько строк
в тексте поменять местами 1ю и 2ю половины каждого слова и все слова в тексте состоят из четного числа букв,в тексте несколько строк

Слова в тексте разделены пробелами. Сколько разных букв встречается в тексте?
???

В данном тексте подсчитать количество слов. Слова в тексте отделены пробелами
В данном тексте подсчитать количество слов. Слова в тексте отделены пробелами.

Найти в тексте минимальное и максимальное слово в тексте и поменять местами
Найти в тексте минимальное и максимальное слово в тексте и поменять местами ( пожалуйста пример поиска минимального и максимального слова...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: при создании документов установить период списания автоматически. . .
Вывод данных через динамический список в справочнике
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Функция заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
10 пpимет, которые всегда сбываются
Maks 31.03.2026
1. Чтобы, наконец, пришла маршрутка, надо закурить. Если сигарета последняя, маршрутка придет еще до второй затяжки даже вопреки расписанию. 2. Нaдоели зима и снег? Не надо переезжать. Достаточно. . .
Перемещение выделенных строк ТЧ из одного документа в другой
Maks 31.03.2026
Реализация из решения ниже выполнена на примере нетипового документа "ВыдачаОборудованияНаСпецтехнику" с единственной табличной частью "ОборудованиеИКомплектующие" разработанного в конфигурации КА2. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru