|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
|
Поиск анаграмм в файле29.11.2013, 04:13. Показов 6774. Ответов 12
Метки нет (Все метки)
Здравствуйте! Такая задача:
Есть входной текстовой файл, в нем слова(какие попало и написаны как попало, а не красиво через пробел). Нужно в другой текстовый файл записать все найденные анаграммы(из одних и тех же букв, одинаковая длина, каждая буква 1 раз, регистр не учитывается): одна строка - одна группа анаграмм Пример: Вход: Мама дай мне меН йад Выход: дай йад мне меН Учитывая, что размер входного файла может быть большим и даже очень большим, хорошая ли идея: -Завести хешмапу <String, List<String>>, где String - слово, List<String> список всех анаграм для этого слова, включая его самого -Прочитать файл до конца, заполнив эту мапу -Переписывать из мапы в другой файл, если длина листа > 1 ? Может подскажете другую идею. Спасибо
0
|
|
| 29.11.2013, 04:13 | |
|
Ответы с готовыми решениями:
12
Поиск слова в файле Поиск ссылок в HTML файле Поиск в файле |
| 29.11.2013, 06:13 | ||
Составьте, к примеру, список для "никотинамидадениндинуклеотидфосфатгидрин" Задается словарь. Найти в нем все анаграммы
0
|
||
|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
||||
| 29.11.2013, 06:56 [ТС] | ||||
|
Добавлено через 1 минуту Добавлено через 3 минуты или я вас не понимаю
0
|
||||
|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
||||||
| 29.11.2013, 07:27 [ТС] | ||||||
|
вот я набросал код
Добавлено через 11 секунд
вы мне обьясните, пожалуйста, почему так как у меня плохо(в каком конкретно месте) Добавлено через 1 минуту еще вопрос: из файла все слова нужно же куда то сохранять в память, правильно? Не map дак list
0
|
||||||
|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
|
| 29.11.2013, 08:00 [ТС] | |
|
скачал я ради интереса мастера и маргариту ~ 0.8M, запустил прогу, читала/записывала минут 10, это долго?
0
|
|
|
462 / 462 / 71
Регистрация: 26.02.2013
Сообщений: 1,263
|
|
| 29.11.2013, 10:44 | |
Сообщение было отмечено как решение
Решение
Дошел вчера пешком до работы за 35 минут, это долго?
3
|
|
|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
|
| 29.11.2013, 22:45 [ТС] | |
|
0
|
|
| 30.11.2013, 02:14 | ||
Интереса ради, написал на С с сохранением промежуточных результатов на диск. Скачал M&M, конвертировал в Win-1251 (~747 Kb), обрабатывается примерно 10 сек по наручным часам. Если не использовать диск, а держать все в памяти, скорость должна вырасти минимум на порядок.
1
|
||
|
31 / 31 / 6
Регистрация: 11.07.2013
Сообщений: 241
|
|||||||||||
| 30.11.2013, 07:43 [ТС] | |||||||||||
|
да, свою ошибку с алгоритмом я понял, переделываю на другой
Добавлено через 51 минуту А подскажите пожалуйста, как из ArrayList<Parser> list1 получить ArrayList<ArrayList<String>>, где
Этот список list 1 отсортирован вот по этим строкам Например: list1 = {(pans, aups), (snap, aups), (pots, opst), (stop, opst), (tops, opst), (opt, opt)} Как мне из него получить список списков строк(списков анаграм), то есть: list2 = {<pans, snap>, <pots, stop, tops>} // если для слова не нашлась анаграмма в list1 то его не нужно заносить в список list2 Спасибо Добавлено через 59 минут разобрался, переписал алгоритм, теперь для 1М работает за 1 секундку.... Не по теме: а было 10 минут:-[ Добавлено через 3 часа 12 минут задам еще вопрос: когда я читаю из файла(предположим 10М ~1_000_000 слов) в память и использую сканер
это(сканер а не допустим BufferedReader) нормально в принципе это нормально только учитывая небольшой размер файла ну то есть, при чтении очень большого файла(ну пускай аж до 1Г) сканером нормально пользоваться или есть альтернативы лучше?(подскажите)
0
|
|||||||||||
| 30.11.2013, 10:15 | |||||||
Сканер должен просматривать входной поток и выдавать очередную лексему (при необходимости, вместе с ее позицией в потоке и размером). Все. Внутреннее устройство файла (и есть ли там вообще "строки") не имеет значения - точно так же, на вход программы можно подать EXE-файл.
Впрочем, для естественного языка можно ожидать словарь порядка 100,000 уникальных слов даже для произвольно больших файлов и, если при вставке в DB сразу проверять дубликаты, то, ценой некоторого замедления, вполне можно хранить все в RAM (считая среднюю длину слова 10 байт (не Unicode), это всего 1 Mb нетто).
1
|
|||||||
| 30.11.2013, 22:42 | |
|
Музыкой навеяло.
Словарь русских анаграмм. Составлен по большому (3,032,693) словарю лексем. В файле lexicon.469979.txt содержится отсортированный по алфавиту список всех уникальных слов. Может быть использован для быстрого просмотра/поиска. Если слово есть в лексиконе, то к нему существует анаграмма. Ex: ЯЩЕРИЦА -- ЦАРЯЩИЕ
0
|
|
| 30.11.2013, 22:42 | |
|
Помогаю со студенческими работами здесь
13
Поиск в файле Поиск слова в файле Поиск слова в файле Поиск чисел в текстовом файле
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение:
В этой книге («Подход, основанный на вариантах использования») Ивар утверждает,
что архитектура программного обеспечения — это
структуры,. . .
|
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога
Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
|
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip
На первой гифке отладочные линии отключены, а на второй включены:. . .
|
|
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем.
. . .
|
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
|
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
|
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
|