Форум программистов, компьютерный форум CyberForum.ru
Наши страницы

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
Рейтинг: Рейтинг темы: голосов - 25, средняя оценка - 4.96
Vadikk
0 / 0 / 0
Регистрация: 15.11.2011
Сообщений: 44
#1

Частотный анализ текста - C++

22.10.2012, 20:18. Просмотров 3370. Ответов 8
Метки нет (Все метки)

Вообщем задача, Есть текст в файле, необходимо определить, какие символы и сколько раз встречаются в тексте. Упорядочить их в порядке убывания частоты (количества) использования символов в тексте.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
22.10.2012, 20:18
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Частотный анализ текста (C++):

Частотный анализ текста - C++
Помогите решить задачу! Дана строка, содержащая текст, набранный заглавными русскими буквами. Провести частотный анализ текста, т.е....

Частотный анализ текста (пословный) - C++
24. Частотный анализ текста (пословный). (Подсчитывается относительная частота встречаемости каждого слова в тексте; границами слов...

Частотный анализ текста (символьный) - C++
Частотный анализ текста (символьный). (Подсчитывается относительная частота встречаемости каждого символа в тексте.) Текст вводится из...

Подсчитать буквы в тексте и распределить их по частотным диапазонам (частотный анализ текста) - C++
Задание: Провести частотный анализ текста на украинском языке. Программа должна подсчитать буквы в тексте и распределить их по частотным...

Частотный анализ - C++
#include<stdio.h> int Count(char *fname, int *count) { FILE *f; char c; if ((f = fopen(fname, "r")) == NULL) ...

Частотный анализ строки - C++
Помогите пожалуйста дописать программу выполняющую частотный анализ строки, введенной пользователем (т. е. вычисляющей, сколько раз в...

8
De_N
28 / 26 / 9
Регистрация: 15.10.2012
Сообщений: 60
22.10.2012, 21:15 #2
Если нужен совет КАК это делать, то вот как один из вариантов:
1. Открываем файл с помошью функции fopen().
2. Объявляем массив из элементов типа int, показывающий сколько раз встречался каждый символ.
3. Считываем файл посимвольно с помощью функции fscanf(), заполняя в процессе массив.
4. Выводим значения из массива необходимым образом.

Но, полагаю, нужен был готовый код)
0
Vadikk
0 / 0 / 0
Регистрация: 15.11.2011
Сообщений: 44
22.10.2012, 21:17  [ТС] #3
Да, ну или хотя бы момент где вся обработка текста идет
0
De_N
28 / 26 / 9
Регистрация: 15.10.2012
Сообщений: 60
22.10.2012, 22:08 #4
Вот как пример. То есть код очевидно не оптимален. Просто так проще.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#include "stdio.h"
 
FILE *f;
char a;
int s[256];
 
main()
{
f=fopen("qwe.txt","r");
 
while (fscanf(f,"%c",&a)==1)
{
s[a]++;
}
 
fclose(f);
 
/*for (int i=0; i<256; i++)
{
printf("%c - %d\n", i, s[i]);
}*/
 
scanf("%c", &a); // чтобы увидеть результат
}
Открывается файл qwe.txt, находящийся в одной директории с программой.
Формируется массив из 256-и элементов типа int. Порядковый номер элемента - это его ASCII-код, а значение - сколько раз он встретился.
Массив заполняется в теле цикла while, пока функция fscan возвращает значение 1.
После этого в массиве содержится необходимая информация. Это можно наглядно увидеть, если разблокировать четыре строки с циклом for и оператором printf.
Останется лишь пройтись по массиву и найти максимальное значение, вывести его.
1
Vadikk
0 / 0 / 0
Регистрация: 15.11.2011
Сообщений: 44
25.10.2012, 22:55  [ТС] #5
Теперь возникла проблема с выводом по порядку, сортировкой не получится, а как еще не знаю.
0
Thinker
Эксперт С++
4226 / 2200 / 150
Регистрация: 26.08.2011
Сообщений: 3,802
Записей в блоге: 5
26.10.2012, 08:45 #6
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
#include<stdio.h>
int Count(char *fname, int *count)
{
   FILE *f;
   char c;
   if ((f = fopen(fname, "r")) == NULL)
      return 1;
   while ((c = fgetc(f)) != EOF)
      ++count[c];
   fclose(f);
   return 0;
}
 
void IndSort(int *a, int *ind)
{
   int i, l, flag, buf;
   for(i = 0; i < 256; i++)
      ind[i] = i;
   l = 0;
   do
   {
      flag = 0;
      for(i = 255; i > l; i--)
         if (a[ind[i-1]] < a[ind[i]])
         {
             buf = ind[i-1]; ind[i-1] = ind[i]; ind[i] = buf;
             flag = 1;
         }
      l++;
   }while(flag);
}
 
int main()
{
   char *fname = "c:\\a.txt";
   int i, count[256] = {0}, ind[256];
   Count(fname, count);
   IndSort(count, ind);
   for(i = 0; i < 256 && count[ind[i]]; i++)
      if (ind[i] >= ' ')
         printf("%c  %d\n", ind[i], count[ind[i]]);
   return 0;
}
1
BlackVoiN69
0 / 0 / 0
Регистрация: 19.10.2012
Сообщений: 24
26.10.2012, 10:06 #7
Привет. Возможно решить данную проблему с использованием STL библиотек. Вы знаете что это такое? Можно обяъвить следующее map<int,string> В ключе будете хранить сколько встретился символ, а значении буква(символ). Оюъявите массив map и все у вас получится
0
DiffEreD
1430 / 767 / 95
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
26.10.2012, 10:39 #8
Загляните сюда, может подойдет: Определить, сколько строчных русских букв в наборе слов
0
De_N
28 / 26 / 9
Регистрация: 15.10.2012
Сообщений: 60
26.10.2012, 19:52 #9
Как альтернатива, вот код, полностью совместимый с примером из моего предыдущего сообщения:
(вставить весь этот кусок на 22-у строку исходного кода, т.е. непосредственно перед scanf)
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
int k=1; // Максимальная замеченая частота
int n; // Номер этого элемента/символа в массиве
 
while (k!=0)    // Пока еще есть символы, которые встречались в тексте
{
k=0;
 for (int i=0; i<256; i++) // Пробегаемся по массиву и находим максимальную частоту
 {
 if (s[i]>k)
 {k=s[i];       // Если встретился символ с бОльшей частотой
 n=i;}         // сохраняем это значение и номер символа
 }
 
 if (k!=0)     // Если что-то найдена (частота символа больше 0)
 {
 printf("%c - %d\n", n, s[n]);  // Выводим информацию о нем
 s[n]=0;                        // И ставим его частоту в 0, чтобы больше не учитывался
 }
}
0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
26.10.2012, 19:52
Привет! Вот еще темы с ответами:

Частотный анализ байтов файла - C++
Помогите написать программу Вводятся имя файла произвольного содержания не длиннее 32 Кбайт и число k (k = 1...9) - см. ниже....

Частотный анализ. Криптоанализ шифра замены. С++ - C++
Доброго времени суток. Задача состоит в следующем: &quot;Дан зашифрованный файл, методом замены. Ключа и открытого текста нет. Надо...

Частотный анализ для шифра Цезаря - C++
Добрый день! Нужно было написать программу,которая кодирует шифр Цезаря. Это есть: #include &lt;iostream&gt; using namespace std; int...

Частотный анализ двухбуквенных сочетаний в русском языке - C++
Кто нибудь может провести частотный анализ двухбуквенных сочетаний в русском языке? например для какого нибудь технического текста? аа...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Yandex
Объявления
26.10.2012, 19:52
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru