Форум программистов, компьютерный форум, киберфорум
Наши страницы
Java SE (J2SE)
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.60/10: Рейтинг темы: голосов - 10, средняя оценка - 4.60
urrast
0 / 0 / 0
Регистрация: 28.05.2011
Сообщений: 9
1

частотный анализ слов встречающихся в файлах заданной директории

16.10.2011, 22:25. Просмотров 1906. Ответов 4
Метки нет (Все метки)

Здравствуйте,подскажите как лучше написать алгоритм подсчета слов всех файлов в заданной директории.

т.е. необходимо пройти по всем файлам в директории(или несколько директорий или директория + файл .на входе массив адресов относительно диска С) , разбить все файлы на слова, посчитать количество раз которое встречается каждое слово и вывести все слова с их счетчиками отсортировав по значению счетчика.

подскажите как лучше построить алгоритм, общие мысли), может советы, если что то более детальное еще больше благодарен буду) чтобы он получился наиболее оптимальным, быстрее работал
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
16.10.2011, 22:25
Ответы с готовыми решениями:

Частотный анализ, криптография
Здравствуйте! Пишу курсовую работу по алгоритму Шифрующие таблицы с двойной...

Сформировать массив из встречающихся более 1 раза слов
Ребята помогите пожалуйста, 3 часа уже сижу, мозг кипит и не могу додуматься!...

Поиск одинаковых файлов в заданной директории
здравствуйте. пишу программу, которая ищет все группы одинаковых файлов...

Список всех файлов и папок указанной директории по заданной маске.
Здравствуйте! Требуется написать программу, используя FileNameFilter которая...

Вывод слов встречающихся в обоих файлах
Имеются 2 файла, в каждом из них слова. Нужно вывести на экран консоли слова,...

4
_ViPeR_
579 / 465 / 163
Регистрация: 02.03.2010
Сообщений: 1,127
17.10.2011, 06:17 2
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
Vector<File> Files = new Vector();
public Vector<File> scan(File f) {
        File[] CSFC;
        CSFC = f.listFiles();
        for (int i = 0; i < CSFC.length; i++) {
            if (!CSFC[i].isDirectory()) {
                Files.add(CSFC[i]);
            } else {
                scan(CSFC[i]);
            }
        }
        return Files;
}
Это примерный метод сканирования директории и всех директорий, вложенных в нее, на предмет файлов.
В вектор файлов заносятся все объекты типа File. После этого можно с этими файлами делать что угодно. Например имя Files.get(i).getName() - имя i-го файла Files.get(i).getPath() - путь к i-му файлу.
Далее, можно пройтись по всем файлам в векторе и сохранить имена в массиве, и т.д.
Вместо Vector можно аналогично использовать ArrayList, будет экономия времени в несколько миллисекунд.
0
aleksandy
630 / 522 / 165
Регистрация: 01.04.2010
Сообщений: 1,843
17.10.2011, 07:57 3
Не это ли тебе нужно?
0
urrast
0 / 0 / 0
Регистрация: 28.05.2011
Сообщений: 9
17.10.2011, 15:05  [ТС] 4
кстати а что считается "словом" ?
вот если есть файл с кодом на java? что в нем слово а что не слово
0
_ViPeR_
579 / 465 / 163
Регистрация: 02.03.2010
Сообщений: 1,127
18.10.2011, 08:32 5
кстати а что считается "словом" ?
вот если есть файл с кодом на java? что в нем слово а что не слово
все что раделено пробелом, точкой, скобками, точкой с запятой, кавычками, апострофами и т.д.
0
18.10.2011, 08:32
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
18.10.2011, 08:32

Частотный анализ слов во входном потоке
Нужно при помощи sed на bash провести частотный анализ встречаемости слов во...

Как провести частотный анализ встречаемости слов в тексте?
Проведите при помощи sed и bash частотный анализ встречаемости слов в данном...

Анализ встречающихся слов в файле
Составить программу, анализирующую или обрабатывающую файл Input.txt(он должен...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru