|
14 / 14 / 6
Регистрация: 17.02.2013
Сообщений: 54
|
|
Поиск наиболее часто встречающихся слов в файле25.02.2013, 17:09. Показов 6181. Ответов 3
Метки нет (Все метки)
Дан символьный файл f, содержащий произвольный текст длиной более 5000 слов. Слова в тексте разделены пробелами и знаками препинания. Получить 100 наиболее часто встречающихся слов и число их появлений. Решить задачу без ограничения на длины слов.
Набросков нет, так как даже не могу понять какие функции использовать для этой задачи.
0
|
|
| 25.02.2013, 17:09 | |
|
Ответы с готовыми решениями:
3
20 наиболее часто встречающихся слов Получить 10 наиболее часто встречающихся слов |
| 25.02.2013, 23:07 | |
|
Составляете словарь из пар слово-счетчик. Считываете слово из файла. Если его нет в словаре - добавляете. Если есть - увеличиваете его счетчик на единицу. После окончания чтения файла сортируете словарь по полю "счетчик" и выводите первую сотню (если набралась).
Как вариант - с учетом "Решить задачу без ограничения на длины слов", храните не само слово, а его (подходящего размера) хэш (MurmurHash2, CityHash итп).
0
|
|
|
14 / 14 / 6
Регистрация: 17.02.2013
Сообщений: 54
|
|
| 04.03.2013, 18:41 [ТС] | |
|
up, прошу посмотреть, если не сложно
0
|
|
| 04.03.2013, 20:22 | ||
|
Смущает фраза "текст длиной более 5000 слов". Если это число фиксировано, то даже 5000+ записей несложно хранить в массиве. Если же нет - вам потребуется динамическая структура, допускающая сортировку (SortedList, например). Про CityHash читать здесь: http://code.google.com/p/cityhash/
0
|
||
| 04.03.2013, 20:22 | |
|
Помогаю со студенческими работами здесь
4
Получить 10 наиболее часто встречающихся букв в файле
Записать в конец текстового файла таблицу с указанием трех наиболее часто встречающихся слов и их количества Перевод с C# на С++ (в заданном тексте найти 20 наиболее часто встречающихся слов с указанием количества использования каждого из них) Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2).
Унарный минус обозначается как !
*/
#include <iostream>
#include <stack>
#include <cctype>. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|