С Новым годом! Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/25: Рейтинг темы: голосов - 25, средняя оценка - 4.80
0 / 0 / 0
Регистрация: 13.03.2016
Сообщений: 23

Задача на файлы. Частотный словарь

01.12.2016, 23:10. Показов 4762. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Очень нужна помощь, уже просто не соображаю.
условие:
Напишите программу, которая составляет частотный словарь заданного
текста, пропуская при этом символы - разделители. Словом будем считать
непрерывную последовательность символов латинского алфавита. Слова,
различающиеся только регистром символов, считаются одинаковыми.
Элемент частотного словаря содержит слово и количество повторений этого
слова, разделенные одним пробелом. Слова, встречающиеся менее, чем K
раз, в словарь не включаются (параметр K вводится с консоли). Частотный
словарь должен быть упорядочен по убыванию количество повторений
слова. Исходный текст программа должна читать из файла input.txt, а
сформированный словарь – помещать в файл output.txt.

Работает всё кроме упорядочивания по убыванию, то есть сортировки. Не могу понять где и какая именно проблема!
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
#include <stdlib.h>
#include <iostream>
#include <string>
#include <stdio.h>
#include <algorithm>
using namespace std;
struct dictionary
    {
        int num;
        string word;
        dictionary(){num=1;}
    };
struct In{};
struct Out{};
struct Empty{};
struct Negativ{};
struct Div{};
struct No{};
int Sort(const void* one,const void* two)
{
    if (((dictionary*)(one))->num>(((dictionary*)(two))->num))
        return 1;
    if (((dictionary*)(one))->num==(((dictionary*)(two))->num))
        return 0;
    if (((dictionary*)(one))->num<(((dictionary*)(two))->num))
        return -1;
}
int main()
{
    setlocale (LC_ALL, ".1251");
    string s,l,x;
    const int nmax=301;
    const char *probel=" ";
    int n=50, K=0,count=0;
    char text[nmax-1];
    FILE *in=fopen("input.txt","rt");
    FILE *out=fopen("output.txt","w+");
    
    fgets(text,n,in);
    
    try
    {
        if (in==NULL) 
            throw In();
        if (feof(in))
            throw Empty();
        int i=0;
        do
        {
            if(text[strlen(text)-1]=='\n')
            {
                strcat(text,probel);
            }
            fgets(text,n,in);
        }       
        while(!feof(in)); 
        fseek(in,NULL,SEEK_SET);
 
            fclose(in);
            cout<<"Ведите минимальное количество раз: ";
            cin>>K;
            if (K<0)
                throw Negativ();
            for(i=1;i<257;i++)
                if ((i<65)||(i>90 && i<97)||(i>122 && i<256))
                    l+=(char)(i);
 
        fgets(text,n,in);
         while(!feof(in))
             {
 
             for(int i = 0; i < strlen(text); i++)
                text[i] = tolower(text[i]);
 
            fgets(text,n,in);
            }       
         fseek(in,NULL,SEEK_SET);
            fgets(text,n,in);
            string texts;
        int p(0),p2(0),z(0);
         while(!feof(in))
         {
             texts=text;
                while((p=texts.find_first_not_of(l,p2))!=-1)
                {
                    p2=texts.find_first_of(l,p);
                    x=texts.substr(p, p2-p);
                    z++;
                }
                p2=0;
            
                if (z==0)
                {
                    throw Div();
            
                }
                fgets(text,n,in);
            }
        dictionary *D=new dictionary[z];
        int j=0;
 
 
        fseek(in,NULL,SEEK_SET);
        fgets(text,n,in);
        while(!feof(in))
        {
            texts=text;
            //{     
                while((p=texts.find_first_not_of(l,p2))!=-1)
                {
                    p2=texts.find_first_of(l,p);
                    D[j++].word=texts.substr(p, p2-p);
                }
                p2=0;
                fgets(text,n,in);
            
        }
        
        for(int k=0;k<j;k++)
            for(i=k+1;i<j;i++)
                if(( D[k].word==D[i].word)&&(D[k].num!=-1))
                    {
                        D[k].num++;
                        D[i].num=-1;
                    }
        qsort(D,j, sizeof (dictionary),Sort);
        int v=0;    
        for(i=0;i<j;i++)
            {
                if ((D[i].num!=-1)&&(D[i].num>=K))
                {   
                    cout<<D[i].word<<" "<<D[i].num<<endl;
                    fputs(D[i].word.c_str(),out);
                    fprintf(out," %d\n",D[i].num);
                    v++;
                }
            }
        if (out==NULL) 
            throw Out();
        if (v==0) 
        {
            throw No(); 
            delete []D;
        }
        delete []D;
}
    catch (In)
    {
        cout<<"Входной файл не открывается!"<<endl;
    }
    catch (Out)
    {
        cout<<"Выходной файл не открывается!"<<endl;
    }
    catch (Empty)
    {
        cout<<"Входной файл пуст!"<<endl;
    }
    catch (Negativ)
    {
        cout<<"Введите неотрицательное число повторений!"<<endl;
    }
    catch (Div)
    {
        cout<<"В файле одни разделители!"<<endl;
    }
    catch (No)
    {
        cout<<"В файле нет слов, которые повторяются не меньше "<<K<<" раз."<<endl;
    }
    return 0;
}
Вложения
Тип файла: txt input.txt (3.1 Кб, 16 просмотров)
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
01.12.2016, 23:10
Ответы с готовыми решениями:

Частотный словарь без использования библиотечных функций. Файлы
Добрый день, товарищи!:senor: Помогите, пожалуйста, разобраться с программой. Уже ничего не соображаю.. Недавно стал изучать...

Частотный словарь.
здравствуйте помогите плиз решить последнюю задачу для зачета.вот условие: дан текст.получить сколько раз в нем присутствует каждое...

Алфавитно-частотный словарь
Напишите программу, которая строит алфавитно-частотный словарь для файла input.txt , в котором в столбик записаны слова, состоящие только...

4
 Аватар для Fixer_84
1505 / 969 / 812
Регистрация: 30.04.2016
Сообщений: 3,337
02.12.2016, 00:04
T_R_M, все, что я могу сделать - это показать вам мой частотный словарь. Он прекрасно работает и может быть с легкостью переделан под ваши запросы. Напишите, если вам интересно.

Добавлено через 39 минут
Вот словарь. Может кому-то еще будет интересно...

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
#include <iostream>
#include <cmath>
#include <string>
#include <fstream>
 
using namespace std;
 
int main()
{
setlocale(LC_ALL, "Russian");
ifstream fin("input.txt");
ofstream fout("output.txt");
int k, t, d, p = 0;
struct point
{
string x;
} res[450000]; 
p = 0;
while(!fin.eof()) 
{
string a, b;
getline(fin, a);
a = a + ' ';
for (int i = 0; i < a.length(); i++)
{
b += a[i]; 
if (!(isalpha(a[i]))) 
{
b.pop_back();
if (b != "")
{
res[p].x = b;
p++;
}
b = "";
}
}
}
//Сортировка массива
for (int i = 0; i < p; i++) 
{                          
for (int j = p - 1; j > i; j--) 
{                               
if (res[j].x <= res[j-1].x)    
{
swap(res[j-1].x, res[j].x); 
}
}
}
//Конец сортировки
fout << "PROCESSED WORDS:" << endl << endl;
k = 0;
t = 0;
d = 0;
for (int i = t; i < p; i++)
{
if (res[i].x == res[i+1].x) 
{
k++;
}
else 
{
t = k;
k = 0;
if (t >= 0) 
{
fout << res[i].x << ": " << t + 1 << endl; //Количество повторяющихся слов
d++;
}
}
}
fout << endl;
fout << "QUANTITY OF WORDS: " << d << endl; //Число обработанных слов
fin.close();
fout.close();
system("pause"); 
return 0;   
}
0
0 / 0 / 0
Регистрация: 13.03.2016
Сообщений: 23
02.12.2016, 00:06  [ТС]
Fixer_84, извините за такой вопрос, но я правильно понимаю, что здесь всё через потоки записано?
0
2784 / 1937 / 570
Регистрация: 05.06.2014
Сообщений: 5,602
02.12.2016, 00:33
Дальше сами.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
#include<iostream>
#include<string>
#include<fstream>
#include<map>
 
int main()
{
    std::map<std::string,int>dict;
    for(std::ifstream stream("input.txt");stream;)
    {
        std::string word;
        while(stream && !isalpha(stream.peek()))
            stream.get();
        while(stream && isalpha(stream.peek()))
            word.push_back(tolower(stream.get()));
        if(!word.empty())
            ++dict[word];
    }
 
    std::multimap<int,std::string,std::greater<int>>result;
    for(auto&pair:dict)
        result.emplace(pair.second,pair.first);
    for(auto&pair:result)
        std::cout<<pair.first<<" "<<pair.second<<std::endl;
    return 0;
}
PS Нужен C++11. Под более старый стандарт перепиливайте сами.
0
Эксперт С++
 Аватар для Mr.X
3225 / 1752 / 436
Регистрация: 03.05.2010
Сообщений: 3,867
02.12.2016, 00:57
T_R_M, что-то вы сишню написали какую-то!
Ежели на С++, то так можно:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
//Напишите программу, которая составляет частотный словарь заданного
//текста, пропуская при этом символы - разделители. Словом будем считать
//непрерывную последовательность символов латинского алфавита. Слова,
//различающиеся только регистром символов, считаются одинаковыми.
//Элемент частотного словаря содержит слово и количество повторений этого
//слова, разделенные одним пробелом. Слова, встречающиеся менее, чем K
//раз, в словарь не включаются (параметр K вводится с консоли). Частотный
//словарь должен быть упорядочен по убыванию количество повторений
//слова. Исходный текст программа должна читать из файла input.txt, а
//сформированный словарь – помещать в файл output.txt.
///////////////////////////////////////////////////////////////////////////////
#include <cctype>
#include <fstream>
#include <iostream>
#include <map>
#include <set>
#include <sstream>
#include <string>
#include <utility>
///////////////////////////////////////////////////////////////////////////////
const   char    SPACE_SYMB  {' '};
///////////////////////////////////////////////////////////////////////////////
typedef std::string                             T_str;
typedef std::map        < T_str,    int     >   T_count_of_word;
typedef std::pair       < T_str,    int     >   T_word_and_count;
///////////////////////////////////////////////////////////////////////////////
struct  T_word_and_count_compare
{
    //-------------------------------------------------------------------------
    bool    operator()
        (
            T_word_and_count    const   &   L,
            T_word_and_count    const   &   R
        )
    {
        return      std::make_pair  ( R.second,     L.first )
                <   std::make_pair  ( L.second,     R.first );
    }
    //-------------------------------------------------------------------------
};
///////////////////////////////////////////////////////////////////////////////
typedef std::set
    <
        T_word_and_count,
        T_word_and_count_compare
    >
    T_word_and_count_set;
///////////////////////////////////////////////////////////////////////////////
void    count_words_frequency
    (
        int                 min_count,
        std::istream    &   istr,
        std::ostream    &   ostr
    )
{
    T_count_of_word     count_of_word;
    T_str               line_cur;
 
    while   (
                getline     (
                                istr,
                                line_cur
                            )
            )
    {
        for( auto   &   symb    :   line_cur )
        {
            symb    =   std::isalpha( symb )
                            ?   std::tolower( symb )
                            :   SPACE_SYMB;
        }//for
 
        std::istringstream  ssin( line_cur );
 
        T_str   word_cur;
 
        while( ssin >> word_cur )
        {
            ++count_of_word[ word_cur ];
        }
    }//while
 
    T_word_and_count_set    word_and_count_set;
 
    for( auto   const   &   word_and_count  :   count_of_word )
    {
        word_and_count_set.emplace( word_and_count );
    }
 
    for( auto   const   &   word_and_count  :   word_and_count_set )
    {
        if  (
                    word_and_count.second
                >=  min_count
            )
        {
            ostr    <<  word_and_count.first
                    <<  SPACE_SYMB
                    <<  word_and_count.second
                    <<  std::endl;
        }//if
    }//for
}
///////////////////////////////////////////////////////////////////////////////
int     main()
{
    const   T_str   IFILE_NAME  { "input.txt"   };
    const   T_str   OFILE_NAME  { "output.txt"  };
 
    std::ifstream   ifile       ( IFILE_NAME    );
 
    if( !ifile )
    {
        std::cout   <<  "bad ifile"
                    <<  std::endl;
    }//if
 
    std::ofstream   ofile   ( OFILE_NAME );
    int     min_count{};
    std::cout   <<  "min count = ";
    std::cin    >>  min_count;
 
    count_words_frequency   (
                                min_count,
                                ifile,
                                ofile
                            );
 
    std::cout   <<  "finish"
                <<  std::endl;
}
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
02.12.2016, 00:57
Помогаю со студенческими работами здесь

Частотный словарь приставок
Помогите пожалуйста, нужно составить частотный словарь приставок, имеющегося текстового файла. Я написала программу, но сразу же при...

Построить алфавитно-частотный словарь
Напишите программу, которая строит алфавитно-частотный словарь для файла input.txt , в котором записаны слова, состоящие из букв латинского...

Частотный словарь с использованием дерева
Задача: определить понятие слово, прочитать текст и сформировать набор слов данного языка вместе с информацией о частоте их встречаемости,...

Составить частотный словарь слов
Дано предложение, состоящее из слов, разделенных запятой или пробелами. Составить частотный словарь слов, указав, сколько раз данное слово...

Составить частотный словарь вводимого текста
Составить частотный словарь вводимого текста (несколько строк) тоесть распечатать строку следующим образом: справа от каждого...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её. Последовательность действий:. . .
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru