Нужен алгоритм поиска дубликатов файлов06.11.2010, 02:42. Показов 3002. Ответов 2
Метки нет (Все метки)
Сразу скажут что один алгоритм я уже осуществил, но других алгоритмов я не знаю, просто интуитивно понял.
1. Имеется окно для drag-and-drop каталогов, куда перетягиваются каталоги и далее происходит поиск в цикле файлов по каждому добавленному каталогу. 2. Для того, чтоб не хэшировать все файлы, а только дубликаты, то сначала за первый проход создаётся массив (размер в байтах|путь) 3. Далее сортировка массива по размеру (время выполнения пропорционально квадрату кол. элементов). 4. Далее цикл проверяющий повтор размера, т.е. в цикле перебирается каждый элемент массива с хранением в цикле предыдущего элемента массива. При совпадении предыдущего и последующего элемента массива (совпадение размеров) происходит создание временного массива в который добавляется текущий и предыдущий элемент. За счёт тригеров происходит переключение состояния цикла "режим совпадения" при последующем совпадении добавляется только текущий элемент. Если последующий элемент несовпадает, то происходит переключение на временно созданный массив. 5. Временно созданный массив - это массив хэш MD5 (хэш MD5|путь). Предыдущий цикл прерывается на обработку временного цикла, который аналогичен с массивом размера/пути, т.е. в цикле проверяется совпадение MD5 и если оно происходит, то в ListView добавляется группы совпавших MD5, вернее пути с Checkbox. 6. Все дубликаты, кроме первого помечаются галочками. При тесте выяснил, что торможение создаёт обновление окна. В чистов виде (только поиск дубликатов без вывода чекбоксов и строки состояния) каталог Windows (12000 файлов) обрабатывается за 30 сек. После добавления стилей ListView (первый дубликат отличается по цвету и фону и расстановка галочек) и вывода в строку состояния статистику по каждому файлу в момент перебора в цикле (имя/всего файлов/кол. совп. по разм./кол. дубликатов/время) увеличилось время обработки до 2,5 минут. Интересуют другие варианты алгоритма или способ оптимизировать скорость выполнения.
0
|
|
| 06.11.2010, 02:42 | |
|
Ответы с готовыми решениями:
2
Алгоритм поиска дубликатов файлов Нужен алгоритм поиска кординат точки Утилита проверки целостности файлов и поиска дубликатов |
|
7176 / 3234 / 82
Регистрация: 17.06.2009
Сообщений: 14,164
|
|||
| 06.11.2010, 13:55 | |||
Сколько раз при этому вычисляется MD5 ? Вообще стоит наверное сделать отдельный поток вычисления дубликатов Чтобы GUI не подвисал на время счета
0
|
|||
| 06.11.2010, 16:17 [ТС] | |||
0
|
|||
| 06.11.2010, 16:17 | |
|
Помогаю со студенческими работами здесь
3
Разработка программы (процедуры) поиска дубликатов файлов на диске Нужен алгоритм поиска пути в этом лабиринте (будь то волновой алгоритм или алгоритм правой/левой руки ) Написал скрипт для поиска дубликатов файлов, как ёё можно улучшить Нужен Алгоритм поиска Алгоритм поиска файлов! Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога
Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
|
|
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога
Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
|
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога
Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
|
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
|
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога
В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
|