Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.56/18: Рейтинг темы: голосов - 18, средняя оценка - 4.56
Helter Skelter
 Аватар для hofmn
64 / 64 / 19
Регистрация: 19.09.2012
Сообщений: 133

Найти ключевые слова в тексте

14.05.2013, 08:59. Показов 3751. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Задача: дан файл с произвольным текстом. Найти первые 10 ключевых слов (т.е. таких, которые чаще всего встречаются).
Код, приведенный ниже, работает корректно.
Посоветуйте, что подправить/оптимизировать/улучшить.
Как данную задачу решили бы вы?
Листинг
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
#include <iostream>
#include <fstream>
#include <algorithm>
#include <map>
using namespace std;
 
bool filter (char c)
{
    return c == '.' || c == ','  || c == ':'  ||
           c == ';' || c == '-'  || c == '_'  ||
           c == '!' || c == '?'  || c == '\"' ||
           c == '(' || c == ')'  || c == '/'  ||
           c == '$' || c == '\\' || c == '%';
}
 
int main()
{
    ifstream infile  ("text.txt");
    string s;
    std::map<string, int>::iterator it;
    std::map<int, string>::reverse_iterator rit;
    std::map<string, int> dictionary;
    std::multimap<int, string> resultDictionary;
 
    while (infile >> s)
    {
        // Remove chars (.,-, etc)
        s.resize (remove_if(s.begin(), s.end(), filter) - s.begin());
 
        if (!s.empty() && s.length() > 3)
        {
            if (dictionary.find(s) != dictionary.end())
            {
                // Increment counter of words
                dictionary.at(s)++;
            }
 
            // Insert word in the map
            else
            {
                dictionary.insert (pair<string,int>(s, 1));
            }
        }
    }
 
    for (it = dictionary.begin(); it != dictionary.end(); ++it)
    {
        resultDictionary.insert(pair<int, string> (it->second, it->first));
    }
 
    int i;
 
    cout << "Top 10 keywords of the text:" << endl;
 
    for (rit = resultDictionary.rbegin(), i = 1;
         rit != resultDictionary.rend(), i < 11;
         rit++, i++)
    {
        cout << rit->second << " => " << rit->first << endl;
    }
 
    return 0;
}


Добавлено через 10 часов 40 минут
Актуально
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
14.05.2013, 08:59
Ответы с готовыми решениями:

Определить, встречаются ли ключевые слова в тексте
1. Заданы текст и три ключевых слова. Определить, встречаются или нет ключевые слова в тексте. 2. Сформировать список из...

Определить, встречаются или нет ключевые слова в тексте.
8.9.2. Помогите, пожалуйста, решить задачу в С++. Заданы текст и три ключевых слова. Определить, встречаются или нет ключевые...

Найти слова в заданном тексте, состоящие из цифр и сумму чисел, которые образуют эти слова
Помогите разобраться пожалуйста: 1. Дан текст. Найти слова, состоящие из цифр и сумму чисел, которые образуют эти слова. 2....

3
 Аватар для cyberbrain1000
23 / 23 / 14
Регистрация: 15.04.2013
Сообщений: 62
14.05.2013, 09:33
вместо
C++
1
2
3
4
5
6
7
8
9
10
11
 if (dictionary.find(s) != dictionary.end())
            {
                // Increment counter of words
                dictionary.at(s)++;
            }
 
            // Insert word in the map
            else
            {
                dictionary.insert (pair<string,int>(s, 1));
            }
так
C++
1
++dictionary[s];
вместо
C++
1
!s.empty() && s.length() > 3
так
C++
1
s.length() > 3
и вместо filter не лучше ли isalnum ?
1
Антикодер
Эксперт функциональных языков программирования
1888 / 870 / 48
Регистрация: 15.09.2012
Сообщений: 3,088
14.05.2013, 09:37
с помощью boost::regex
0
Helter Skelter
 Аватар для hofmn
64 / 64 / 19
Регистрация: 19.09.2012
Сообщений: 133
16.05.2013, 14:27  [ТС]
Цитата Сообщение от cyberbrain1000 Посмотреть сообщение
и вместо filter не лучше ли isalnum ?
Да, так более лаконично, спасибо.

Добавлено через 1 минуту
Цитата Сообщение от XRuZzz Посмотреть сообщение
с помощью boost::regex
boost нельзя использовать, к сожалению.

Жду еще предложений.

Добавлено через 6 часов 20 минут
Актуально

Добавлено через 12 часов 49 минут
Актуально

Добавлено через 10 часов 12 минут
Актуально

Добавлено через 1 час 54 минуты
up.

Добавлено через 15 часов 37 минут
up
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
16.05.2013, 14:27
Помогаю со студенческими работами здесь

В тексте, содержащем несколько (много) предложений, найти все вхождения заданного слова и распечатать все ключевые его предложения.
помогите решить 3 задачки. заранее большое спасибо всем! 1.P=\prod_{i=m}^{n}(2*i),где n и m заданные числа...

Подсчитать, какие ключевые слова Паскаля использованы в обрабатываемом тексте
пожалуйста, ! завтра сдавать контрольную, а у меня нет ничего( ПОЖАЛУЙСТА, НАДО написать программу!! Текст программы на Паскале...

Формировать в тексте исходного документа ключевые слова языков Visual Basic и Borland Pascal
Задание: Формировать в тексте исходного документа ключевые слова языков Visual Basic и Borland Pascal. Слова Visual Basic должны иметь...

Найти в файлах ключевые слова
Здравствуйте, нужно поискать слова из файла в других файлах, при этом файлов у нас много, и пути к этим файлам записаны в файле patch.txt,...

В тексте слова разделены пробелами, найти и вывести слова-палиндромы
Доброго времени суток! Хочу попросить вас о помощи в написании програмы с таким условием: Задан тест, в котором слова разделены...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица. Задача: зафиксировать три левых колонки в отчете. Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка) / / . . .
Настройки VS Code
Loafer 13.04.2026
{ "cmake. configureOnOpen": false, "diffEditor. ignoreTrimWhitespace": true, "editor. guides. bracketPairs": "active", "extensions. ignoreRecommendations": true, . . .
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2. Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива. Было так:. . .
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: реализовать контроль корректности заполнения дат назначения. . .
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru