Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.83/29: Рейтинг темы: голосов - 29, средняя оценка - 4.83
14 / 14 / 6
Регистрация: 17.02.2013
Сообщений: 54

Поиск наиболее часто встречающихся слов в файле

25.02.2013, 17:09. Показов 6244. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Дан символьный файл f, содержащий произвольный текст длиной более 5000 слов. Слова в тексте разделены пробелами и знаками препинания. Получить 100 наиболее часто встречающихся слов и число их появлений. Решить задачу без ограничения на длины слов.
Набросков нет, так как даже не могу понять какие функции использовать для этой задачи.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
25.02.2013, 17:09
Ответы с готовыми решениями:

Получить 10 наиболее часто встречающихся слов в файле
ребята, срочно нужна помощь в решении задачи!)) Жду , заранее спасибо:) Дан текстовый файл f, содержащий более 1000 слов. Получить 10...

20 наиболее часто встречающихся слов
дан файл. выписать 20 наиболее часто встречающихся слов в алфавитном порядке. (структуры использовать нельзя). помогите пожалуйста. заранее...

Получить 10 наиболее часто встречающихся слов
Написать программу на языке С++ Основные условия - исходная информация берется из текстового файла и после преобразования...

3
3178 / 1937 / 312
Регистрация: 27.08.2010
Сообщений: 5,131
Записей в блоге: 1
25.02.2013, 23:07
Составляете словарь из пар слово-счетчик. Считываете слово из файла. Если его нет в словаре - добавляете. Если есть - увеличиваете его счетчик на единицу. После окончания чтения файла сортируете словарь по полю "счетчик" и выводите первую сотню (если набралась).

Как вариант - с учетом "Решить задачу без ограничения на длины слов", храните не само слово, а его (подходящего размера) хэш (MurmurHash2, CityHash итп).
0
14 / 14 / 6
Регистрация: 17.02.2013
Сообщений: 54
04.03.2013, 18:41  [ТС]
up, прошу посмотреть, если не сложно
0
3178 / 1937 / 312
Регистрация: 27.08.2010
Сообщений: 5,131
Записей в блоге: 1
04.03.2013, 20:22
Цитата Сообщение от DIEZEL-man Посмотреть сообщение
up, прошу посмотреть, если не сложно
Посмотрите в этом топике: Словарь частоупотребимых слов - там решалась очень похожая задача.

Смущает фраза "текст длиной более 5000 слов". Если это число фиксировано, то даже 5000+ записей несложно хранить в массиве. Если же нет - вам потребуется динамическая структура, допускающая сортировку (SortedList, например).

Про CityHash читать здесь: http://code.google.com/p/cityhash/
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
04.03.2013, 20:22
Помогаю со студенческими работами здесь

Получить 10 наиболее часто встречающихся букв в файле
Дан символьный файл f, содержащий произвольный текст. Получить 10 наиболее часто встречающихся букв и число их появления.(данный вопрос уже...

Получить 10 наиболее часто встречающихся слов из файла
Дан символьный файл f, содержащий произвольный текст длиной более 50 слов. Слова в тексте разделены пробелами и знаками препинания....

Записать в конец файла таблицу с указанием трех наиболее часто встречающихся слов
2. Открыть текстовый файл в необходимом режиме (на чтение, на чтение и запись, на добавление). (В файле должно быть не менее 30 строк)....

Записать в конец текстового файла таблицу с указанием трех наиболее часто встречающихся слов и их количества
Открыть текстовый файл в необходимом режиме (на чтение, на чтение и запись, на добавление). (В файле должно быть не менее 30 строк)....

Перевод с C# на С++ (в заданном тексте найти 20 наиболее часто встречающихся слов с указанием количества использования каждого из них)
Помогите пожалуйста перевести с C# на С++.... Я не очень хорошо сейчас знаю библиотеку STL... Задание такое: В заданном тексте найти 20...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица. Задача: зафиксировать три левых колонки в отчете. Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка) / / . . .
Настройки VS Code
Loafer 13.04.2026
{ "cmake. configureOnOpen": false, "diffEditor. ignoreTrimWhitespace": true, "editor. guides. bracketPairs": "active", "extensions. ignoreRecommendations": true, . . .
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2. Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива. Было так:. . .
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: реализовать контроль корректности заполнения дат назначения. . .
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru