|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
|
Поиск анаграмм в файле29.11.2013, 04:13. Показов 6809. Ответов 12
Метки нет (Все метки)
Здравствуйте! Такая задача:
Есть входной текстовой файл, в нем слова(какие попало и написаны как попало, а не красиво через пробел). Нужно в другой текстовый файл записать все найденные анаграммы(из одних и тех же букв, одинаковая длина, каждая буква 1 раз, регистр не учитывается): одна строка - одна группа анаграмм Пример: Вход: Мама дай мне меН йад Выход: дай йад мне меН Учитывая, что размер входного файла может быть большим и даже очень большим, хорошая ли идея: -Завести хешмапу <String, List<String>>, где String - слово, List<String> список всех анаграм для этого слова, включая его самого -Прочитать файл до конца, заполнив эту мапу -Переписывать из мапы в другой файл, если длина листа > 1 ? Может подскажете другую идею. Спасибо
0
|
|
| 29.11.2013, 04:13 | |
|
Ответы с готовыми решениями:
12
Поиск слова в файле Поиск ссылок в HTML файле Поиск в файле |
| 29.11.2013, 06:13 | ||
Составьте, к примеру, список для "никотинамидадениндинуклеотидфосфатгидрин" Задается словарь. Найти в нем все анаграммы
0
|
||
|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
||||
| 29.11.2013, 06:56 [ТС] | ||||
|
Добавлено через 1 минуту Добавлено через 3 минуты или я вас не понимаю
0
|
||||
|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
||||||
| 29.11.2013, 07:27 [ТС] | ||||||
|
вот я набросал код
Добавлено через 11 секунд
вы мне обьясните, пожалуйста, почему так как у меня плохо(в каком конкретно месте) Добавлено через 1 минуту еще вопрос: из файла все слова нужно же куда то сохранять в память, правильно? Не map дак list
0
|
||||||
|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
|
| 29.11.2013, 08:00 [ТС] | |
|
скачал я ради интереса мастера и маргариту ~ 0.8M, запустил прогу, читала/записывала минут 10, это долго?
0
|
|
|
462 / 462 / 71
Регистрация: 26.02.2013
Сообщений: 1,263
|
|
| 29.11.2013, 10:44 | |
Сообщение было отмечено как решение
Решение
Дошел вчера пешком до работы за 35 минут, это долго?
3
|
|
|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
|
| 29.11.2013, 22:45 [ТС] | |
|
0
|
|
| 30.11.2013, 02:14 | ||
Интереса ради, написал на С с сохранением промежуточных результатов на диск. Скачал M&M, конвертировал в Win-1251 (~747 Kb), обрабатывается примерно 10 сек по наручным часам. Если не использовать диск, а держать все в памяти, скорость должна вырасти минимум на порядок.
1
|
||
|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
|||||||||||
| 30.11.2013, 07:43 [ТС] | |||||||||||
|
да, свою ошибку с алгоритмом я понял, переделываю на другой
Добавлено через 51 минуту А подскажите пожалуйста, как из ArrayList<Parser> list1 получить ArrayList<ArrayList<String>>, где
Этот список list 1 отсортирован вот по этим строкам Например: list1 = {(pans, aups), (snap, aups), (pots, opst), (stop, opst), (tops, opst), (opt, opt)} Как мне из него получить список списков строк(списков анаграм), то есть: list2 = {<pans, snap>, <pots, stop, tops>} // если для слова не нашлась анаграмма в list1 то его не нужно заносить в список list2 Спасибо Добавлено через 59 минут разобрался, переписал алгоритм, теперь для 1М работает за 1 секундку.... Не по теме: а было 10 минут:-[ Добавлено через 3 часа 12 минут задам еще вопрос: когда я читаю из файла(предположим 10М ~1_000_000 слов) в память и использую сканер
это(сканер а не допустим BufferedReader) нормально в принципе это нормально только учитывая небольшой размер файла ну то есть, при чтении очень большого файла(ну пускай аж до 1Г) сканером нормально пользоваться или есть альтернативы лучше?(подскажите)
0
|
|||||||||||
| 30.11.2013, 10:15 | |||||||
Сканер должен просматривать входной поток и выдавать очередную лексему (при необходимости, вместе с ее позицией в потоке и размером). Все. Внутреннее устройство файла (и есть ли там вообще "строки") не имеет значения - точно так же, на вход программы можно подать EXE-файл.
Впрочем, для естественного языка можно ожидать словарь порядка 100,000 уникальных слов даже для произвольно больших файлов и, если при вставке в DB сразу проверять дубликаты, то, ценой некоторого замедления, вполне можно хранить все в RAM (считая среднюю длину слова 10 байт (не Unicode), это всего 1 Mb нетто).
1
|
|||||||
| 30.11.2013, 22:42 | |
|
Музыкой навеяло.
Словарь русских анаграмм. Составлен по большому (3,032,693) словарю лексем. В файле lexicon.469979.txt содержится отсортированный по алфавиту список всех уникальных слов. Может быть использован для быстрого просмотра/поиска. Если слово есть в лексиконе, то к нему существует анаграмма. Ex: ЯЩЕРИЦА -- ЦАРЯЩИЕ
0
|
|
| 30.11.2013, 22:42 | |
|
Помогаю со студенческими работами здесь
13
Поиск в файле Поиск слова в файле Поиск слова в файле Поиск чисел в текстовом файле
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут
Суть:
- Группа наркоманов из 10 человек.
- Только один инфицирован ВИЧ.
- Колются одной иглой.
- Колются раз в день.
- Колются последовательно через. . .
|
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
|
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
|
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . .
а удачный момент так и не приходит.
|
|
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица.
Задача: зафиксировать три левых колонки в отчете.
Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка)
/ / . . .
|
Настройки VS Code
Loafer 13.04.2026
{
"cmake. configureOnOpen": false,
"diffEditor. ignoreTrimWhitespace": true,
"editor. guides. bracketPairs": "active",
"extensions. ignoreRecommendations": true,
. . .
|
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2.
Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива.
Было так:. . .
|
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: реализовать контроль корректности заполнения дат назначения. . .
|