С Новым годом! Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.60/48: Рейтинг темы: голосов - 48, средняя оценка - 4.60
0 / 0 / 0
Регистрация: 15.11.2011
Сообщений: 44

Частотный анализ текста

22.10.2012, 20:18. Показов 9785. Ответов 8
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Вообщем задача, Есть текст в файле, необходимо определить, какие символы и сколько раз встречаются в тексте. Упорядочить их в порядке убывания частоты (количества) использования символов в тексте.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
22.10.2012, 20:18
Ответы с готовыми решениями:

Частотный анализ текста
Помогите решить задачу! Дана строка, содержащая текст, набранный заглавными русскими буквами. Провести частотный анализ текста, т.е....

Организовать частотный анализ текста
Здравствуйте, уважаемые! Решал задачу с сайта http://informatics.mccme.ru/ и на выходе всего один неправильный ответ (остальные тесты...

Частотный анализ текста (пословный)
24. Частотный анализ текста (пословный). (Подсчитывается относительная частота встречаемости каждого слова в тексте; границами слов...

8
28 / 26 / 14
Регистрация: 15.10.2012
Сообщений: 60
22.10.2012, 21:15
Если нужен совет КАК это делать, то вот как один из вариантов:
1. Открываем файл с помошью функции fopen().
2. Объявляем массив из элементов типа int, показывающий сколько раз встречался каждый символ.
3. Считываем файл посимвольно с помощью функции fscanf(), заполняя в процессе массив.
4. Выводим значения из массива необходимым образом.

Но, полагаю, нужен был готовый код)
0
0 / 0 / 0
Регистрация: 15.11.2011
Сообщений: 44
22.10.2012, 21:17  [ТС]
Да, ну или хотя бы момент где вся обработка текста идет
0
28 / 26 / 14
Регистрация: 15.10.2012
Сообщений: 60
22.10.2012, 22:08
Вот как пример. То есть код очевидно не оптимален. Просто так проще.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#include "stdio.h"
 
FILE *f;
char a;
int s[256];
 
main()
{
f=fopen("qwe.txt","r");
 
while (fscanf(f,"%c",&a)==1)
{
s[a]++;
}
 
fclose(f);
 
/*for (int i=0; i<256; i++)
{
printf("%c - %d\n", i, s[i]);
}*/
 
scanf("%c", &a); // чтобы увидеть результат
}
Открывается файл qwe.txt, находящийся в одной директории с программой.
Формируется массив из 256-и элементов типа int. Порядковый номер элемента - это его ASCII-код, а значение - сколько раз он встретился.
Массив заполняется в теле цикла while, пока функция fscan возвращает значение 1.
После этого в массиве содержится необходимая информация. Это можно наглядно увидеть, если разблокировать четыре строки с циклом for и оператором printf.
Останется лишь пройтись по массиву и найти максимальное значение, вывести его.
1
0 / 0 / 0
Регистрация: 15.11.2011
Сообщений: 44
25.10.2012, 22:55  [ТС]
Теперь возникла проблема с выводом по порядку, сортировкой не получится, а как еще не знаю.
0
Эксперт С++
 Аватар для Thinker
4267 / 2241 / 203
Регистрация: 26.08.2011
Сообщений: 3,802
Записей в блоге: 5
26.10.2012, 08:45
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
#include<stdio.h>
int Count(char *fname, int *count)
{
   FILE *f;
   char c;
   if ((f = fopen(fname, "r")) == NULL)
      return 1;
   while ((c = fgetc(f)) != EOF)
      ++count[c];
   fclose(f);
   return 0;
}
 
void IndSort(int *a, int *ind)
{
   int i, l, flag, buf;
   for(i = 0; i < 256; i++)
      ind[i] = i;
   l = 0;
   do
   {
      flag = 0;
      for(i = 255; i > l; i--)
         if (a[ind[i-1]] < a[ind[i]])
         {
             buf = ind[i-1]; ind[i-1] = ind[i]; ind[i] = buf;
             flag = 1;
         }
      l++;
   }while(flag);
}
 
int main()
{
   char *fname = "c:\\a.txt";
   int i, count[256] = {0}, ind[256];
   Count(fname, count);
   IndSort(count, ind);
   for(i = 0; i < 256 && count[ind[i]]; i++)
      if (ind[i] >= ' ')
         printf("%c  %d\n", ind[i], count[ind[i]]);
   return 0;
}
1
 Аватар для BlackVoiN69
0 / 0 / 0
Регистрация: 19.10.2012
Сообщений: 24
26.10.2012, 10:06
Привет. Возможно решить данную проблему с использованием STL библиотек. Вы знаете что это такое? Можно обяъвить следующее map<int,string> В ключе будете хранить сколько встретился символ, а значении буква(символ). Оюъявите массив map и все у вас получится
0
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
26.10.2012, 10:39
Загляните сюда, может подойдет: Определить, сколько строчных русских букв в наборе слов
0
28 / 26 / 14
Регистрация: 15.10.2012
Сообщений: 60
26.10.2012, 19:52
Как альтернатива, вот код, полностью совместимый с примером из моего предыдущего сообщения:
(вставить весь этот кусок на 22-у строку исходного кода, т.е. непосредственно перед scanf)
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
int k=1; // Максимальная замеченая частота
int n; // Номер этого элемента/символа в массиве
 
while (k!=0)    // Пока еще есть символы, которые встречались в тексте
{
k=0;
 for (int i=0; i<256; i++) // Пробегаемся по массиву и находим максимальную частоту
 {
 if (s[i]>k)
 {k=s[i];       // Если встретился символ с бОльшей частотой
 n=i;}         // сохраняем это значение и номер символа
 }
 
 if (k!=0)     // Если что-то найдена (частота символа больше 0)
 {
 printf("%c - %d\n", n, s[n]);  // Выводим информацию о нем
 s[n]=0;                        // И ставим его частоту в 0, чтобы больше не учитывался
 }
}
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
26.10.2012, 19:52
Помогаю со студенческими работами здесь

Частотный анализ текста (символьный)
Частотный анализ текста (символьный). (Подсчитывается относительная частота встречаемости каждого символа в тексте.) Текст вводится из...

Шифр Цезаря: провести частотный анализ текста, определить ключ
Здравствуйте, помогите пожалуйста. Дан в файле текс на русском языке,зашифрованный шифром Цезаря. Провести частотный анализ текста...

Подсчитать буквы в тексте и распределить их по частотным диапазонам (частотный анализ текста)
Задание: Провести частотный анализ текста на украинском языке. Программа должна подсчитать буквы в тексте и распределить их по частотным...

Частотный анализ
#include&lt;stdio.h&gt; int Count(char *fname, int *count) { FILE *f; char c; if ((f = fopen(fname, &quot;r&quot;)) == NULL) ...

Частотный анализ
у меня есть программа шифр лозунга с использованием в этой программы по шифрованию шифровать текст, и потом на его основе делать...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Новые блоги и статьи
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её. Последовательность действий:. . .
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru