Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/25: Рейтинг темы: голосов - 25, средняя оценка - 4.80
0 / 0 / 0
Регистрация: 13.03.2016
Сообщений: 23

Задача на файлы. Частотный словарь

01.12.2016, 23:10. Показов 4849. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Очень нужна помощь, уже просто не соображаю.
условие:
Напишите программу, которая составляет частотный словарь заданного
текста, пропуская при этом символы - разделители. Словом будем считать
непрерывную последовательность символов латинского алфавита. Слова,
различающиеся только регистром символов, считаются одинаковыми.
Элемент частотного словаря содержит слово и количество повторений этого
слова, разделенные одним пробелом. Слова, встречающиеся менее, чем K
раз, в словарь не включаются (параметр K вводится с консоли). Частотный
словарь должен быть упорядочен по убыванию количество повторений
слова. Исходный текст программа должна читать из файла input.txt, а
сформированный словарь – помещать в файл output.txt.

Работает всё кроме упорядочивания по убыванию, то есть сортировки. Не могу понять где и какая именно проблема!
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
#include <stdlib.h>
#include <iostream>
#include <string>
#include <stdio.h>
#include <algorithm>
using namespace std;
struct dictionary
    {
        int num;
        string word;
        dictionary(){num=1;}
    };
struct In{};
struct Out{};
struct Empty{};
struct Negativ{};
struct Div{};
struct No{};
int Sort(const void* one,const void* two)
{
    if (((dictionary*)(one))->num>(((dictionary*)(two))->num))
        return 1;
    if (((dictionary*)(one))->num==(((dictionary*)(two))->num))
        return 0;
    if (((dictionary*)(one))->num<(((dictionary*)(two))->num))
        return -1;
}
int main()
{
    setlocale (LC_ALL, ".1251");
    string s,l,x;
    const int nmax=301;
    const char *probel=" ";
    int n=50, K=0,count=0;
    char text[nmax-1];
    FILE *in=fopen("input.txt","rt");
    FILE *out=fopen("output.txt","w+");
    
    fgets(text,n,in);
    
    try
    {
        if (in==NULL) 
            throw In();
        if (feof(in))
            throw Empty();
        int i=0;
        do
        {
            if(text[strlen(text)-1]=='\n')
            {
                strcat(text,probel);
            }
            fgets(text,n,in);
        }       
        while(!feof(in)); 
        fseek(in,NULL,SEEK_SET);
 
            fclose(in);
            cout<<"Ведите минимальное количество раз: ";
            cin>>K;
            if (K<0)
                throw Negativ();
            for(i=1;i<257;i++)
                if ((i<65)||(i>90 && i<97)||(i>122 && i<256))
                    l+=(char)(i);
 
        fgets(text,n,in);
         while(!feof(in))
             {
 
             for(int i = 0; i < strlen(text); i++)
                text[i] = tolower(text[i]);
 
            fgets(text,n,in);
            }       
         fseek(in,NULL,SEEK_SET);
            fgets(text,n,in);
            string texts;
        int p(0),p2(0),z(0);
         while(!feof(in))
         {
             texts=text;
                while((p=texts.find_first_not_of(l,p2))!=-1)
                {
                    p2=texts.find_first_of(l,p);
                    x=texts.substr(p, p2-p);
                    z++;
                }
                p2=0;
            
                if (z==0)
                {
                    throw Div();
            
                }
                fgets(text,n,in);
            }
        dictionary *D=new dictionary[z];
        int j=0;
 
 
        fseek(in,NULL,SEEK_SET);
        fgets(text,n,in);
        while(!feof(in))
        {
            texts=text;
            //{     
                while((p=texts.find_first_not_of(l,p2))!=-1)
                {
                    p2=texts.find_first_of(l,p);
                    D[j++].word=texts.substr(p, p2-p);
                }
                p2=0;
                fgets(text,n,in);
            
        }
        
        for(int k=0;k<j;k++)
            for(i=k+1;i<j;i++)
                if(( D[k].word==D[i].word)&&(D[k].num!=-1))
                    {
                        D[k].num++;
                        D[i].num=-1;
                    }
        qsort(D,j, sizeof (dictionary),Sort);
        int v=0;    
        for(i=0;i<j;i++)
            {
                if ((D[i].num!=-1)&&(D[i].num>=K))
                {   
                    cout<<D[i].word<<" "<<D[i].num<<endl;
                    fputs(D[i].word.c_str(),out);
                    fprintf(out," %d\n",D[i].num);
                    v++;
                }
            }
        if (out==NULL) 
            throw Out();
        if (v==0) 
        {
            throw No(); 
            delete []D;
        }
        delete []D;
}
    catch (In)
    {
        cout<<"Входной файл не открывается!"<<endl;
    }
    catch (Out)
    {
        cout<<"Выходной файл не открывается!"<<endl;
    }
    catch (Empty)
    {
        cout<<"Входной файл пуст!"<<endl;
    }
    catch (Negativ)
    {
        cout<<"Введите неотрицательное число повторений!"<<endl;
    }
    catch (Div)
    {
        cout<<"В файле одни разделители!"<<endl;
    }
    catch (No)
    {
        cout<<"В файле нет слов, которые повторяются не меньше "<<K<<" раз."<<endl;
    }
    return 0;
}
Вложения
Тип файла: txt input.txt (3.1 Кб, 16 просмотров)
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
01.12.2016, 23:10
Ответы с готовыми решениями:

Частотный словарь без использования библиотечных функций. Файлы
Добрый день, товарищи!:senor: Помогите, пожалуйста, разобраться с программой. Уже ничего не соображаю.. Недавно стал изучать...

Частотный словарь.
здравствуйте помогите плиз решить последнюю задачу для зачета.вот условие: дан текст.получить сколько раз в нем присутствует каждое...

Алфавитно-частотный словарь
Напишите программу, которая строит алфавитно-частотный словарь для файла input.txt , в котором в столбик записаны слова, состоящие только...

4
 Аватар для Fixer_84
1505 / 969 / 812
Регистрация: 30.04.2016
Сообщений: 3,337
02.12.2016, 00:04
T_R_M, все, что я могу сделать - это показать вам мой частотный словарь. Он прекрасно работает и может быть с легкостью переделан под ваши запросы. Напишите, если вам интересно.

Добавлено через 39 минут
Вот словарь. Может кому-то еще будет интересно...

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
#include <iostream>
#include <cmath>
#include <string>
#include <fstream>
 
using namespace std;
 
int main()
{
setlocale(LC_ALL, "Russian");
ifstream fin("input.txt");
ofstream fout("output.txt");
int k, t, d, p = 0;
struct point
{
string x;
} res[450000]; 
p = 0;
while(!fin.eof()) 
{
string a, b;
getline(fin, a);
a = a + ' ';
for (int i = 0; i < a.length(); i++)
{
b += a[i]; 
if (!(isalpha(a[i]))) 
{
b.pop_back();
if (b != "")
{
res[p].x = b;
p++;
}
b = "";
}
}
}
//Сортировка массива
for (int i = 0; i < p; i++) 
{                          
for (int j = p - 1; j > i; j--) 
{                               
if (res[j].x <= res[j-1].x)    
{
swap(res[j-1].x, res[j].x); 
}
}
}
//Конец сортировки
fout << "PROCESSED WORDS:" << endl << endl;
k = 0;
t = 0;
d = 0;
for (int i = t; i < p; i++)
{
if (res[i].x == res[i+1].x) 
{
k++;
}
else 
{
t = k;
k = 0;
if (t >= 0) 
{
fout << res[i].x << ": " << t + 1 << endl; //Количество повторяющихся слов
d++;
}
}
}
fout << endl;
fout << "QUANTITY OF WORDS: " << d << endl; //Число обработанных слов
fin.close();
fout.close();
system("pause"); 
return 0;   
}
0
0 / 0 / 0
Регистрация: 13.03.2016
Сообщений: 23
02.12.2016, 00:06  [ТС]
Fixer_84, извините за такой вопрос, но я правильно понимаю, что здесь всё через потоки записано?
0
2784 / 1937 / 570
Регистрация: 05.06.2014
Сообщений: 5,602
02.12.2016, 00:33
Дальше сами.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
#include<iostream>
#include<string>
#include<fstream>
#include<map>
 
int main()
{
    std::map<std::string,int>dict;
    for(std::ifstream stream("input.txt");stream;)
    {
        std::string word;
        while(stream && !isalpha(stream.peek()))
            stream.get();
        while(stream && isalpha(stream.peek()))
            word.push_back(tolower(stream.get()));
        if(!word.empty())
            ++dict[word];
    }
 
    std::multimap<int,std::string,std::greater<int>>result;
    for(auto&pair:dict)
        result.emplace(pair.second,pair.first);
    for(auto&pair:result)
        std::cout<<pair.first<<" "<<pair.second<<std::endl;
    return 0;
}
PS Нужен C++11. Под более старый стандарт перепиливайте сами.
0
Эксперт С++
 Аватар для Mr.X
3225 / 1752 / 436
Регистрация: 03.05.2010
Сообщений: 3,867
02.12.2016, 00:57
T_R_M, что-то вы сишню написали какую-то!
Ежели на С++, то так можно:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
//Напишите программу, которая составляет частотный словарь заданного
//текста, пропуская при этом символы - разделители. Словом будем считать
//непрерывную последовательность символов латинского алфавита. Слова,
//различающиеся только регистром символов, считаются одинаковыми.
//Элемент частотного словаря содержит слово и количество повторений этого
//слова, разделенные одним пробелом. Слова, встречающиеся менее, чем K
//раз, в словарь не включаются (параметр K вводится с консоли). Частотный
//словарь должен быть упорядочен по убыванию количество повторений
//слова. Исходный текст программа должна читать из файла input.txt, а
//сформированный словарь – помещать в файл output.txt.
///////////////////////////////////////////////////////////////////////////////
#include <cctype>
#include <fstream>
#include <iostream>
#include <map>
#include <set>
#include <sstream>
#include <string>
#include <utility>
///////////////////////////////////////////////////////////////////////////////
const   char    SPACE_SYMB  {' '};
///////////////////////////////////////////////////////////////////////////////
typedef std::string                             T_str;
typedef std::map        < T_str,    int     >   T_count_of_word;
typedef std::pair       < T_str,    int     >   T_word_and_count;
///////////////////////////////////////////////////////////////////////////////
struct  T_word_and_count_compare
{
    //-------------------------------------------------------------------------
    bool    operator()
        (
            T_word_and_count    const   &   L,
            T_word_and_count    const   &   R
        )
    {
        return      std::make_pair  ( R.second,     L.first )
                <   std::make_pair  ( L.second,     R.first );
    }
    //-------------------------------------------------------------------------
};
///////////////////////////////////////////////////////////////////////////////
typedef std::set
    <
        T_word_and_count,
        T_word_and_count_compare
    >
    T_word_and_count_set;
///////////////////////////////////////////////////////////////////////////////
void    count_words_frequency
    (
        int                 min_count,
        std::istream    &   istr,
        std::ostream    &   ostr
    )
{
    T_count_of_word     count_of_word;
    T_str               line_cur;
 
    while   (
                getline     (
                                istr,
                                line_cur
                            )
            )
    {
        for( auto   &   symb    :   line_cur )
        {
            symb    =   std::isalpha( symb )
                            ?   std::tolower( symb )
                            :   SPACE_SYMB;
        }//for
 
        std::istringstream  ssin( line_cur );
 
        T_str   word_cur;
 
        while( ssin >> word_cur )
        {
            ++count_of_word[ word_cur ];
        }
    }//while
 
    T_word_and_count_set    word_and_count_set;
 
    for( auto   const   &   word_and_count  :   count_of_word )
    {
        word_and_count_set.emplace( word_and_count );
    }
 
    for( auto   const   &   word_and_count  :   word_and_count_set )
    {
        if  (
                    word_and_count.second
                >=  min_count
            )
        {
            ostr    <<  word_and_count.first
                    <<  SPACE_SYMB
                    <<  word_and_count.second
                    <<  std::endl;
        }//if
    }//for
}
///////////////////////////////////////////////////////////////////////////////
int     main()
{
    const   T_str   IFILE_NAME  { "input.txt"   };
    const   T_str   OFILE_NAME  { "output.txt"  };
 
    std::ifstream   ifile       ( IFILE_NAME    );
 
    if( !ifile )
    {
        std::cout   <<  "bad ifile"
                    <<  std::endl;
    }//if
 
    std::ofstream   ofile   ( OFILE_NAME );
    int     min_count{};
    std::cout   <<  "min count = ";
    std::cin    >>  min_count;
 
    count_words_frequency   (
                                min_count,
                                ifile,
                                ofile
                            );
 
    std::cout   <<  "finish"
                <<  std::endl;
}
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
02.12.2016, 00:57
Помогаю со студенческими работами здесь

Частотный словарь приставок
Помогите пожалуйста, нужно составить частотный словарь приставок, имеющегося текстового файла. Я написала программу, но сразу же при...

Построить алфавитно-частотный словарь
Напишите программу, которая строит алфавитно-частотный словарь для файла input.txt , в котором записаны слова, состоящие из букв латинского...

Частотный словарь с использованием дерева
Задача: определить понятие слово, прочитать текст и сформировать набор слов данного языка вместе с информацией о частоте их встречаемости,...

Составить частотный словарь слов
Дано предложение, состоящее из слов, разделенных запятой или пробелами. Составить частотный словарь слов, указав, сколько раз данное слово...

Составить частотный словарь вводимого текста
Составить частотный словарь вводимого текста (несколько строк) тоесть распечатать строку следующим образом: справа от каждого...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если. . .
Доступность команды формы по условию
Maks 07.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: сделать доступной кнопку (команда формы "ЗавершитьСписание") при. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru