Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.56/18: Рейтинг темы: голосов - 18, средняя оценка - 4.56
Helter Skelter
 Аватар для hofmn
64 / 64 / 19
Регистрация: 19.09.2012
Сообщений: 133

Найти ключевые слова в тексте

14.05.2013, 08:59. Показов 3737. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Задача: дан файл с произвольным текстом. Найти первые 10 ключевых слов (т.е. таких, которые чаще всего встречаются).
Код, приведенный ниже, работает корректно.
Посоветуйте, что подправить/оптимизировать/улучшить.
Как данную задачу решили бы вы?
Листинг
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
#include <iostream>
#include <fstream>
#include <algorithm>
#include <map>
using namespace std;
 
bool filter (char c)
{
    return c == '.' || c == ','  || c == ':'  ||
           c == ';' || c == '-'  || c == '_'  ||
           c == '!' || c == '?'  || c == '\"' ||
           c == '(' || c == ')'  || c == '/'  ||
           c == '$' || c == '\\' || c == '%';
}
 
int main()
{
    ifstream infile  ("text.txt");
    string s;
    std::map<string, int>::iterator it;
    std::map<int, string>::reverse_iterator rit;
    std::map<string, int> dictionary;
    std::multimap<int, string> resultDictionary;
 
    while (infile >> s)
    {
        // Remove chars (.,-, etc)
        s.resize (remove_if(s.begin(), s.end(), filter) - s.begin());
 
        if (!s.empty() && s.length() > 3)
        {
            if (dictionary.find(s) != dictionary.end())
            {
                // Increment counter of words
                dictionary.at(s)++;
            }
 
            // Insert word in the map
            else
            {
                dictionary.insert (pair<string,int>(s, 1));
            }
        }
    }
 
    for (it = dictionary.begin(); it != dictionary.end(); ++it)
    {
        resultDictionary.insert(pair<int, string> (it->second, it->first));
    }
 
    int i;
 
    cout << "Top 10 keywords of the text:" << endl;
 
    for (rit = resultDictionary.rbegin(), i = 1;
         rit != resultDictionary.rend(), i < 11;
         rit++, i++)
    {
        cout << rit->second << " => " << rit->first << endl;
    }
 
    return 0;
}


Добавлено через 10 часов 40 минут
Актуально
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
14.05.2013, 08:59
Ответы с готовыми решениями:

Определить, встречаются ли ключевые слова в тексте
1. Заданы текст и три ключевых слова. Определить, встречаются или нет ключевые слова в тексте. 2. Сформировать список из...

Определить, встречаются или нет ключевые слова в тексте.
8.9.2. Помогите, пожалуйста, решить задачу в С++. Заданы текст и три ключевых слова. Определить, встречаются или нет ключевые...

Найти слова в заданном тексте, состоящие из цифр и сумму чисел, которые образуют эти слова
Помогите разобраться пожалуйста: 1. Дан текст. Найти слова, состоящие из цифр и сумму чисел, которые образуют эти слова. 2....

3
 Аватар для cyberbrain1000
23 / 23 / 14
Регистрация: 15.04.2013
Сообщений: 62
14.05.2013, 09:33
вместо
C++
1
2
3
4
5
6
7
8
9
10
11
 if (dictionary.find(s) != dictionary.end())
            {
                // Increment counter of words
                dictionary.at(s)++;
            }
 
            // Insert word in the map
            else
            {
                dictionary.insert (pair<string,int>(s, 1));
            }
так
C++
1
++dictionary[s];
вместо
C++
1
!s.empty() && s.length() > 3
так
C++
1
s.length() > 3
и вместо filter не лучше ли isalnum ?
1
Антикодер
Эксперт функциональных языков программирования
1888 / 870 / 48
Регистрация: 15.09.2012
Сообщений: 3,088
14.05.2013, 09:37
с помощью boost::regex
0
Helter Skelter
 Аватар для hofmn
64 / 64 / 19
Регистрация: 19.09.2012
Сообщений: 133
16.05.2013, 14:27  [ТС]
Цитата Сообщение от cyberbrain1000 Посмотреть сообщение
и вместо filter не лучше ли isalnum ?
Да, так более лаконично, спасибо.

Добавлено через 1 минуту
Цитата Сообщение от XRuZzz Посмотреть сообщение
с помощью boost::regex
boost нельзя использовать, к сожалению.

Жду еще предложений.

Добавлено через 6 часов 20 минут
Актуально

Добавлено через 12 часов 49 минут
Актуально

Добавлено через 10 часов 12 минут
Актуально

Добавлено через 1 час 54 минуты
up.

Добавлено через 15 часов 37 минут
up
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
16.05.2013, 14:27
Помогаю со студенческими работами здесь

В тексте, содержащем несколько (много) предложений, найти все вхождения заданного слова и распечатать все ключевые его предложения.
помогите решить 3 задачки. заранее большое спасибо всем! 1.P=\prod_{i=m}^{n}(2*i),где n и m заданные числа...

Подсчитать, какие ключевые слова Паскаля использованы в обрабатываемом тексте
пожалуйста, ! завтра сдавать контрольную, а у меня нет ничего( ПОЖАЛУЙСТА, НАДО написать программу!! Текст программы на Паскале...

Формировать в тексте исходного документа ключевые слова языков Visual Basic и Borland Pascal
Задание: Формировать в тексте исходного документа ключевые слова языков Visual Basic и Borland Pascal. Слова Visual Basic должны иметь...

Найти в файлах ключевые слова
Здравствуйте, нужно поискать слова из файла в других файлах, при этом файлов у нас много, и пути к этим файлам записаны в файле patch.txt,...

В тексте слова разделены пробелами, найти и вывести слова-палиндромы
Доброго времени суток! Хочу попросить вас о помощи в написании програмы с таким условием: Задан тест, в котором слова разделены...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
10 пpимет, которые всегда сбываются
Maks 31.03.2026
1. Чтобы, наконец, пришла маршрутка, надо закурить. Если сигарета последняя, маршрутка придет еще до второй затяжки даже вопреки расписанию. 2. Нaдоели зима и снег? Не надо переезжать. Достаточно. . .
Перемещение выделенных строк ТЧ из одного документа в другой
Maks 31.03.2026
Реализация из решения ниже выполнена на примере нетипового документа "ВыдачаОборудованияНаСпецтехнику" с единственной табличной частью "ОборудованиеИКомплектующие" разработанного в конфигурации КА2. . . .
Functional First Web Framework Suave
DevAlt 30.03.2026
Sauve. IO Апнулись до NET10. Из зависимостей один пакет, работает одинаково хорошо как в режиме проекта так и в интерактивном режиме. из сложностей - чисто функциональный подход. Решил. . .
Автоматическое создание документа при проведении другого документа
Maks 29.03.2026
Реализация из решения ниже выполнена на нетиповых документах, разработанных в конфигурации КА2. Есть нетиповой документ "ЗаявкаНаРемонтСпецтехники" и нетиповой документ "ПланированиеСпецтехники". В. . .
Настройка движения справочника по регистру сведений
Maks 29.03.2026
Решение ниже реализовано на примере нетипового справочника "ТарифыМобильнойСвязи" разработанного в конфигурации КА2, с целью учета корпоративной мобильной связи в коммерческом предприятии. . . .
Автозаполнение реквизита при выборе элемента справочника
Maks 27.03.2026
Программный код из решения ниже на примере нетипового документа "ЗаявкаНаРемонтСпецтехники" разработанного в конфигурации КА2. При выборе "Спецтехники" (Тип Справочник. Спецтехника), заполняется. . .
Сумматор с применением элементов трёх состояний.
Hrethgir 26.03.2026
Тут. https:/ / fips. ru/ EGD/ ab3c85c8-836d-4866-871b-c2f0c5d77fbc Первый документ красиво выглядит, но без схемы. Это конечно не даёт никаких плюсов автору, но тем не менее. . . всё может быть. . .
Автозаполнение реквизитов при создании документа
Maks 26.03.2026
Программный код из решения ниже размещается в модуле объекта документа, в процедуре "ПриСозданииНаСервере". Алгоритм проверки заполнения реализован для исключения перезаписи значения реквизита,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru