С Новым годом! Форум программистов, компьютерный форум, киберфорум
Наши страницы

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
Рейтинг: Рейтинг темы: голосов - 15, средняя оценка - 4.87
DIEZEL-man
13 / 13 / 0
Регистрация: 17.02.2013
Сообщений: 54
#1

Поиск наиболее часто встречающихся слов в файле - C++

25.02.2013, 17:09. Просмотров 2360. Ответов 3
Метки нет (Все метки)

Дан символьный файл f, содержащий произвольный текст длиной более 5000 слов. Слова в тексте разделены пробелами и знаками препинания. Получить 100 наиболее часто встречающихся слов и число их появлений. Решить задачу без ограничения на длины слов.
Набросков нет, так как даже не могу понять какие функции использовать для этой задачи.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
25.02.2013, 17:09
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Поиск наиболее часто встречающихся слов в файле (C++):

Получить 10 наиболее часто встречающихся слов в файле - C++
ребята, срочно нужна помощь в решении задачи!)) Жду , заранее спасибо:) Дан текстовый файл f, содержащий более 1000 слов. Получить 10...

20 наиболее часто встречающихся слов - C++
дан файл. выписать 20 наиболее часто встречающихся слов в алфавитном порядке. (структуры использовать нельзя). помогите пожалуйста. заранее...

Получить 10 наиболее часто встречающихся слов из файла - C++
Дан символьный файл f, содержащий произвольный текст длиной более 50 слов. Слова в тексте разделены пробелами и знаками препинания....

Перевод с C# на С++ (в заданном тексте найти 20 наиболее часто встречающихся слов с указанием количества использования каждого из них) - C++
Помогите пожалуйста перевести с C# на С++.... Я не очень хорошо сейчас знаю библиотеку STL... Задание такое: В заданном тексте найти 20...

C++ priority_queue< int , char*, CompareHeap1 > pqMax (создать очередь с приоритетом для поиска 10 наиболее и наименее часто встречающихся слов) - C++
Выполняю задачу &quot;Частотный словарь&quot;, необходимо создать очередь с приоритетом для поиска 10 наиболее и наименее часто встречающихся слов. ...

Вывести 10 наиболее часто встречающихся чисел - C++
Нужно написать функцию, которая находит в векторе(видел с использованием map, но не понимаю особо что к чему, вектор как то ближе) 10...

3
gazlan
3133 / 1909 / 285
Регистрация: 27.08.2010
Сообщений: 5,132
Записей в блоге: 1
25.02.2013, 23:07 #2
Составляете словарь из пар слово-счетчик. Считываете слово из файла. Если его нет в словаре - добавляете. Если есть - увеличиваете его счетчик на единицу. После окончания чтения файла сортируете словарь по полю "счетчик" и выводите первую сотню (если набралась).

Как вариант - с учетом "Решить задачу без ограничения на длины слов", храните не само слово, а его (подходящего размера) хэш (MurmurHash2, CityHash итп).
0
DIEZEL-man
13 / 13 / 0
Регистрация: 17.02.2013
Сообщений: 54
04.03.2013, 18:41  [ТС] #3
up, прошу посмотреть, если не сложно
0
gazlan
3133 / 1909 / 285
Регистрация: 27.08.2010
Сообщений: 5,132
Записей в блоге: 1
04.03.2013, 20:22 #4
Цитата Сообщение от DIEZEL-man Посмотреть сообщение
up, прошу посмотреть, если не сложно
Посмотрите в этом топике: словарь частоупотребимих слов - там решалась очень похожая задача.

Смущает фраза "текст длиной более 5000 слов". Если это число фиксировано, то даже 5000+ записей несложно хранить в массиве. Если же нет - вам потребуется динамическая структура, допускающая сортировку (SortedList, например).

Про CityHash читать здесь: http://code.google.com/p/cityhash/
0
04.03.2013, 20:22
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
04.03.2013, 20:22
Привет! Вот еще темы с ответами:

Найти количество элементов, наиболее часто встречающихся в массиве - C++
Найти кол-во элементов наиболее частых встречающихся в массиве. например массив: 123000 023400 023450 003456 0-не...

Получить 10 наиболее часто встречающихся букв и число их появления из текстового файла - C++
Дан символьный файл f, содержащий произвольный текст. Получить 10 наиболее часто встречающихся букв и число их появления. помогите плиз,...

Дан непустой массив из цифр. Вывести на экран цифру наиболее часто встречающихся в этом массиве. - C++
Доброго времени суток Помогите пжл с задачей Дан непустой массив из цифр. Вывести на экран цифру наиболее часто встречающихся в...

Наиболее часто встречающийся символ в текстовом файле - C++
считал символы из файла в строку, но не могу понять как найти наиболее часто встречающийся символ как в c++ проверить совпадение символа...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.