Задача на файлы. Частотный словарь

@T_R_M · Регистрация: 13.03.2016

Студворк — интернет-сервис помощи студентам

Очень нужна помощь, уже просто не соображаю.
условие:
Напишите программу, которая составляет частотный словарь заданного
текста, пропуская при этом символы - разделители. Словом будем считать
непрерывную последовательность символов латинского алфавита. Слова,
различающиеся только регистром символов, считаются одинаковыми.
Элемент частотного словаря содержит слово и количество повторений этого
слова, разделенные одним пробелом. Слова, встречающиеся менее, чем K
раз, в словарь не включаются (параметр K вводится с консоли). Частотный
словарь должен быть упорядочен по убыванию количество повторений
слова. Исходный текст программа должна читать из файла input.txt, а
сформированный словарь – помещать в файл output.txt.

Работает всё кроме упорядочивания по убыванию, то есть сортировки. Не могу понять где и какая именно проблема!

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
#include <stdlib.h>
#include <iostream>
#include <string>
#include <stdio.h>
#include <algorithm>
using namespace std;
struct dictionary
    {
        int num;
        string word;
        dictionary(){num=1;}
    };
struct In{};
struct Out{};
struct Empty{};
struct Negativ{};
struct Div{};
struct No{};
int Sort(const void* one,const void* two)
{
    if (((dictionary*)(one))->num>(((dictionary*)(two))->num))
        return 1;
    if (((dictionary*)(one))->num==(((dictionary*)(two))->num))
        return 0;
    if (((dictionary*)(one))->num<(((dictionary*)(two))->num))
        return -1;
}
int main()
{
    setlocale (LC_ALL, ".1251");
    string s,l,x;
    const int nmax=301;
    const char *probel=" ";
    int n=50, K=0,count=0;
    char text[nmax-1];
    FILE *in=fopen("input.txt","rt");
    FILE *out=fopen("output.txt","w+");
    
    fgets(text,n,in);
    
    try
    {
        if (in==NULL) 
            throw In();
        if (feof(in))
            throw Empty();
        int i=0;
        do
        {
            if(text[strlen(text)-1]=='\n')
            {
                strcat(text,probel);
            }
            fgets(text,n,in);
        }       
        while(!feof(in)); 
        fseek(in,NULL,SEEK_SET);
 
            fclose(in);
            cout<<"Ведите минимальное количество раз: ";
            cin>>K;
            if (K<0)
                throw Negativ();
            for(i=1;i<257;i++)
                if ((i<65)||(i>90 && i<97)||(i>122 && i<256))
                    l+=(char)(i);
 
        fgets(text,n,in);
         while(!feof(in))
             {
 
             for(int i = 0; i < strlen(text); i++)
                text[i] = tolower(text[i]);
 
            fgets(text,n,in);
            }       
         fseek(in,NULL,SEEK_SET);
            fgets(text,n,in);
            string texts;
        int p(0),p2(0),z(0);
         while(!feof(in))
         {
             texts=text;
                while((p=texts.find_first_not_of(l,p2))!=-1)
                {
                    p2=texts.find_first_of(l,p);
                    x=texts.substr(p, p2-p);
                    z++;
                }
                p2=0;
            
                if (z==0)
                {
                    throw Div();
            
                }
                fgets(text,n,in);
            }
        dictionary *D=new dictionary[z];
        int j=0;
 
 
        fseek(in,NULL,SEEK_SET);
        fgets(text,n,in);
        while(!feof(in))
        {
            texts=text;
            //{     
                while((p=texts.find_first_not_of(l,p2))!=-1)
                {
                    p2=texts.find_first_of(l,p);
                    D[j++].word=texts.substr(p, p2-p);
                }
                p2=0;
                fgets(text,n,in);
            
        }
        
        for(int k=0;k<j;k++)
            for(i=k+1;i<j;i++)
                if(( D[k].word==D[i].word)&&(D[k].num!=-1))
                    {
                        D[k].num++;
                        D[i].num=-1;
                    }
        qsort(D,j, sizeof (dictionary),Sort);
        int v=0;    
        for(i=0;i<j;i++)
            {
                if ((D[i].num!=-1)&&(D[i].num>=K))
                {   
                    cout<<D[i].word<<" "<<D[i].num<<endl;
                    fputs(D[i].word.c_str(),out);
                    fprintf(out," %d\n",D[i].num);
                    v++;
                }
            }
        if (out==NULL) 
            throw Out();
        if (v==0) 
        {
            throw No(); 
            delete []D;
        }
        delete []D;
}
    catch (In)
    {
        cout<<"Входной файл не открывается!"<<endl;
    }
    catch (Out)
    {
        cout<<"Выходной файл не открывается!"<<endl;
    }
    catch (Empty)
    {
        cout<<"Входной файл пуст!"<<endl;
    }
    catch (Negativ)
    {
        cout<<"Введите неотрицательное число повторений!"<<endl;
    }
    catch (Div)
    {
        cout<<"В файле одни разделители!"<<endl;
    }
    catch (No)
    {
        cout<<"В файле нет слов, которые повторяются не меньше "<<K<<" раз."<<endl;
    }
    return 0;
}

@Fixer_84 · 02.12.2016, 00:04

T_R_M, все, что я могу сделать - это показать вам мой частотный словарь. Он прекрасно работает и может быть с легкостью переделан под ваши запросы. Напишите, если вам интересно.

Добавлено через 39 минут
Вот словарь. Может кому-то еще будет интересно...

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
#include <iostream>
#include <cmath>
#include <string>
#include <fstream>
 
using namespace std;
 
int main()
{
setlocale(LC_ALL, "Russian");
ifstream fin("input.txt");
ofstream fout("output.txt");
int k, t, d, p = 0;
struct point
{
string x;
} res[450000]; 
p = 0;
while(!fin.eof()) 
{
string a, b;
getline(fin, a);
a = a + ' ';
for (int i = 0; i < a.length(); i++)
{
b += a[i]; 
if (!(isalpha(a[i]))) 
{
b.pop_back();
if (b != "")
{
res[p].x = b;
p++;
}
b = "";
}
}
}
//Сортировка массива
for (int i = 0; i < p; i++) 
{                          
for (int j = p - 1; j > i; j--) 
{                               
if (res[j].x <= res[j-1].x)    
{
swap(res[j-1].x, res[j].x); 
}
}
}
//Конец сортировки
fout << "PROCESSED WORDS:" << endl << endl;
k = 0;
t = 0;
d = 0;
for (int i = t; i < p; i++)
{
if (res[i].x == res[i+1].x) 
{
k++;
}
else 
{
t = k;
k = 0;
if (t >= 0) 
{
fout << res[i].x << ": " << t + 1 << endl; //Количество повторяющихся слов
d++;
}
}
}
fout << endl;
fout << "QUANTITY OF WORDS: " << d << endl; //Число обработанных слов
fin.close();
fout.close();
system("pause"); 
return 0;   
}

@T_R_M · 02.12.2016, 00:06 **[ТС]**

Fixer_84, извините за такой вопрос, но я правильно понимаю, что здесь всё через потоки записано?

@Renji · 02.12.2016, 00:33

Дальше сами.

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
#include<iostream>
#include<string>
#include<fstream>
#include<map>
 
int main()
{
    std::map<std::string,int>dict;
    for(std::ifstream stream("input.txt");stream;)
    {
        std::string word;
        while(stream && !isalpha(stream.peek()))
            stream.get();
        while(stream && isalpha(stream.peek()))
            word.push_back(tolower(stream.get()));
        if(!word.empty())
            ++dict[word];
    }
 
    std::multimap<int,std::string,std::greater<int>>result;
    for(auto&pair:dict)
        result.emplace(pair.second,pair.first);
    for(auto&pair:result)
        std::cout<<pair.first<<" "<<pair.second<<std::endl;
    return 0;
}

PS Нужен C++11. Под более старый стандарт перепиливайте сами.

@Mr.X · 02.12.2016, 00:57

T_R_M, что-то вы сишню написали какую-то!
Ежели на С++, то так можно:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
//Напишите программу, которая составляет частотный словарь заданного
//текста, пропуская при этом символы - разделители. Словом будем считать
//непрерывную последовательность символов латинского алфавита. Слова,
//различающиеся только регистром символов, считаются одинаковыми.
//Элемент частотного словаря содержит слово и количество повторений этого
//слова, разделенные одним пробелом. Слова, встречающиеся менее, чем K
//раз, в словарь не включаются (параметр K вводится с консоли). Частотный
//словарь должен быть упорядочен по убыванию количество повторений
//слова. Исходный текст программа должна читать из файла input.txt, а
//сформированный словарь – помещать в файл output.txt.
///////////////////////////////////////////////////////////////////////////////
#include <cctype>
#include <fstream>
#include <iostream>
#include <map>
#include <set>
#include <sstream>
#include <string>
#include <utility>
///////////////////////////////////////////////////////////////////////////////
const   char    SPACE_SYMB  {' '};
///////////////////////////////////////////////////////////////////////////////
typedef std::string                             T_str;
typedef std::map        < T_str,    int     >   T_count_of_word;
typedef std::pair       < T_str,    int     >   T_word_and_count;
///////////////////////////////////////////////////////////////////////////////
struct  T_word_and_count_compare
{
    //-------------------------------------------------------------------------
    bool    operator()
        (
            T_word_and_count    const   &   L,
            T_word_and_count    const   &   R
        )
    {
        return      std::make_pair  ( R.second,     L.first )
                <   std::make_pair  ( L.second,     R.first );
    }
    //-------------------------------------------------------------------------
};
///////////////////////////////////////////////////////////////////////////////
typedef std::set
    <
        T_word_and_count,
        T_word_and_count_compare
    >
    T_word_and_count_set;
///////////////////////////////////////////////////////////////////////////////
void    count_words_frequency
    (
        int                 min_count,
        std::istream    &   istr,
        std::ostream    &   ostr
    )
{
    T_count_of_word     count_of_word;
    T_str               line_cur;
 
    while   (
                getline     (
                                istr,
                                line_cur
                            )
            )
    {
        for( auto   &   symb    :   line_cur )
        {
            symb    =   std::isalpha( symb )
                            ?   std::tolower( symb )
                            :   SPACE_SYMB;
        }//for
 
        std::istringstream  ssin( line_cur );
 
        T_str   word_cur;
 
        while( ssin >> word_cur )
        {
            ++count_of_word[ word_cur ];
        }
    }//while
 
    T_word_and_count_set    word_and_count_set;
 
    for( auto   const   &   word_and_count  :   count_of_word )
    {
        word_and_count_set.emplace( word_and_count );
    }
 
    for( auto   const   &   word_and_count  :   word_and_count_set )
    {
        if  (
                    word_and_count.second
                >=  min_count
            )
        {
            ostr    <<  word_and_count.first
                    <<  SPACE_SYMB
                    <<  word_and_count.second
                    <<  std::endl;
        }//if
    }//for
}
///////////////////////////////////////////////////////////////////////////////
int     main()
{
    const   T_str   IFILE_NAME  { "input.txt"   };
    const   T_str   OFILE_NAME  { "output.txt"  };
 
    std::ifstream   ifile       ( IFILE_NAME    );
 
    if( !ifile )
    {
        std::cout   <<  "bad ifile"
                    <<  std::endl;
    }//if
 
    std::ofstream   ofile   ( OFILE_NAME );
    int     min_count{};
    std::cout   <<  "min count = ";
    std::cin    >>  min_count;
 
    count_words_frequency   (
                                min_count,
                                ifile,
                                ofile
                            );
 
    std::cout   <<  "finish"
                <<  std::endl;
}

Новые блоги и статьи Все статьи Все блоги /
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий anaschu 08.04.2026 https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI	Блокировка документа от изменений, если он открыт у другого пользователя Maks 08.04.2026 Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .	Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка. Hrethgir 08.04.2026 Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .	Модель ЗдрввоСохранения 7: больше работников, больше ресурсов. anaschu 08.04.2026 работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики. Hrethgir 07.04.2026 Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .	Горе от ума kumehtar 07.04.2026 Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .	Использование значений реквизитов справочника в документе, с определенными условиями и правами Maks 07.04.2026 1. Контроль срока действия договора Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если. . .	Доступность команды формы по условию Maks 07.04.2026 Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: сделать доступной кнопку (команда формы "ЗавершитьСписание") при. . .

@T_R_M 0 / 0 / 0 Регистрация: 13.03.2016 Сообщений: 23
	02.12.2016, 00:06 [ТС]
	Fixer_84, извините за такой вопрос, но я правильно понимаю, что здесь всё через потоки записано? 0