Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.60/48: Рейтинг темы: голосов - 48, средняя оценка - 4.60
0 / 0 / 0
Регистрация: 15.11.2011
Сообщений: 44

Частотный анализ текста

22.10.2012, 20:18. Показов 9815. Ответов 8
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Вообщем задача, Есть текст в файле, необходимо определить, какие символы и сколько раз встречаются в тексте. Упорядочить их в порядке убывания частоты (количества) использования символов в тексте.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
22.10.2012, 20:18
Ответы с готовыми решениями:

Частотный анализ текста
Помогите решить задачу! Дана строка, содержащая текст, набранный заглавными русскими буквами. Провести частотный анализ текста, т.е....

Организовать частотный анализ текста
Здравствуйте, уважаемые! Решал задачу с сайта http://informatics.mccme.ru/ и на выходе всего один неправильный ответ (остальные тесты...

Частотный анализ текста (пословный)
24. Частотный анализ текста (пословный). (Подсчитывается относительная частота встречаемости каждого слова в тексте; границами слов...

8
28 / 26 / 14
Регистрация: 15.10.2012
Сообщений: 60
22.10.2012, 21:15
Если нужен совет КАК это делать, то вот как один из вариантов:
1. Открываем файл с помошью функции fopen().
2. Объявляем массив из элементов типа int, показывающий сколько раз встречался каждый символ.
3. Считываем файл посимвольно с помощью функции fscanf(), заполняя в процессе массив.
4. Выводим значения из массива необходимым образом.

Но, полагаю, нужен был готовый код)
0
0 / 0 / 0
Регистрация: 15.11.2011
Сообщений: 44
22.10.2012, 21:17  [ТС]
Да, ну или хотя бы момент где вся обработка текста идет
0
28 / 26 / 14
Регистрация: 15.10.2012
Сообщений: 60
22.10.2012, 22:08
Вот как пример. То есть код очевидно не оптимален. Просто так проще.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#include "stdio.h"
 
FILE *f;
char a;
int s[256];
 
main()
{
f=fopen("qwe.txt","r");
 
while (fscanf(f,"%c",&a)==1)
{
s[a]++;
}
 
fclose(f);
 
/*for (int i=0; i<256; i++)
{
printf("%c - %d\n", i, s[i]);
}*/
 
scanf("%c", &a); // чтобы увидеть результат
}
Открывается файл qwe.txt, находящийся в одной директории с программой.
Формируется массив из 256-и элементов типа int. Порядковый номер элемента - это его ASCII-код, а значение - сколько раз он встретился.
Массив заполняется в теле цикла while, пока функция fscan возвращает значение 1.
После этого в массиве содержится необходимая информация. Это можно наглядно увидеть, если разблокировать четыре строки с циклом for и оператором printf.
Останется лишь пройтись по массиву и найти максимальное значение, вывести его.
1
0 / 0 / 0
Регистрация: 15.11.2011
Сообщений: 44
25.10.2012, 22:55  [ТС]
Теперь возникла проблема с выводом по порядку, сортировкой не получится, а как еще не знаю.
0
Эксперт С++
 Аватар для Thinker
4267 / 2241 / 203
Регистрация: 26.08.2011
Сообщений: 3,802
Записей в блоге: 5
26.10.2012, 08:45
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
#include<stdio.h>
int Count(char *fname, int *count)
{
   FILE *f;
   char c;
   if ((f = fopen(fname, "r")) == NULL)
      return 1;
   while ((c = fgetc(f)) != EOF)
      ++count[c];
   fclose(f);
   return 0;
}
 
void IndSort(int *a, int *ind)
{
   int i, l, flag, buf;
   for(i = 0; i < 256; i++)
      ind[i] = i;
   l = 0;
   do
   {
      flag = 0;
      for(i = 255; i > l; i--)
         if (a[ind[i-1]] < a[ind[i]])
         {
             buf = ind[i-1]; ind[i-1] = ind[i]; ind[i] = buf;
             flag = 1;
         }
      l++;
   }while(flag);
}
 
int main()
{
   char *fname = "c:\\a.txt";
   int i, count[256] = {0}, ind[256];
   Count(fname, count);
   IndSort(count, ind);
   for(i = 0; i < 256 && count[ind[i]]; i++)
      if (ind[i] >= ' ')
         printf("%c  %d\n", ind[i], count[ind[i]]);
   return 0;
}
1
 Аватар для BlackVoiN69
0 / 0 / 0
Регистрация: 19.10.2012
Сообщений: 24
26.10.2012, 10:06
Привет. Возможно решить данную проблему с использованием STL библиотек. Вы знаете что это такое? Можно обяъвить следующее map<int,string> В ключе будете хранить сколько встретился символ, а значении буква(символ). Оюъявите массив map и все у вас получится
0
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
26.10.2012, 10:39
Загляните сюда, может подойдет: Определить, сколько строчных русских букв в наборе слов
0
28 / 26 / 14
Регистрация: 15.10.2012
Сообщений: 60
26.10.2012, 19:52
Как альтернатива, вот код, полностью совместимый с примером из моего предыдущего сообщения:
(вставить весь этот кусок на 22-у строку исходного кода, т.е. непосредственно перед scanf)
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
int k=1; // Максимальная замеченая частота
int n; // Номер этого элемента/символа в массиве
 
while (k!=0)    // Пока еще есть символы, которые встречались в тексте
{
k=0;
 for (int i=0; i<256; i++) // Пробегаемся по массиву и находим максимальную частоту
 {
 if (s[i]>k)
 {k=s[i];       // Если встретился символ с бОльшей частотой
 n=i;}         // сохраняем это значение и номер символа
 }
 
 if (k!=0)     // Если что-то найдена (частота символа больше 0)
 {
 printf("%c - %d\n", n, s[n]);  // Выводим информацию о нем
 s[n]=0;                        // И ставим его частоту в 0, чтобы больше не учитывался
 }
}
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
26.10.2012, 19:52
Помогаю со студенческими работами здесь

Частотный анализ текста (символьный)
Частотный анализ текста (символьный). (Подсчитывается относительная частота встречаемости каждого символа в тексте.) Текст вводится из...

Шифр Цезаря: провести частотный анализ текста, определить ключ
Здравствуйте, помогите пожалуйста. Дан в файле текс на русском языке,зашифрованный шифром Цезаря. Провести частотный анализ текста...

Подсчитать буквы в тексте и распределить их по частотным диапазонам (частотный анализ текста)
Задание: Провести частотный анализ текста на украинском языке. Программа должна подсчитать буквы в тексте и распределить их по частотным...

Частотный анализ
#include&lt;stdio.h&gt; int Count(char *fname, int *count) { FILE *f; char c; if ((f = fopen(fname, &quot;r&quot;)) == NULL) ...

Частотный анализ
у меня есть программа шифр лозунга с использованием в этой программы по шифрованию шифровать текст, и потом на его основе делать...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Новые блоги и статьи
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Символьное дифференцирование
igorrr37 13.02.2026
/ * Программа принимает математическое выражение в виде строки и выдаёт его производную в виде строки и вычисляет значение производной при заданном х Логарифм записывается как: (x-2)log(x^2+2) -. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru