960 / 801 / 85
Регистрация: 21.07.2010
Сообщений: 3,522
|
|
1 | |
Удаление некоторых файлов с диска12.12.2013, 19:44. Показов 1358. Ответов 10
Метки нет (Все метки)
Возникла такая задача -
есть сервак с ~ 50 Т всякого рода медиа-файлов (.vob (в этом случае может быть папка VIDEO_TS), .avi, .mp3, .flv ...). Во всей этой куче есть одна нехорошесть - некоторые файлы повторяются (точнее, содержимое файлов), например, фильм "Thor" может быть как в формате .avi, так и .mpeg, у них разное качество, вес,... Необходимо удалить все не нужные (повторяющиеся) файлы. Желательно оставляя качественные. Узнать их можно по названиям, например - Thor.avi, Thor.vob, Тор.avi, ... Я вижу 2 решения: 1) Автоматом проходить по всем папкам (уровень вложений разный), если получится, по ходу их сравнивать (не всегда тяжелый файл означает качественный) и удалять худший. 2) Пробежаться по папкам, найти совпадающие по названию (лат., кирил.) файлы и предоставить админу сделать выбор, выставив список (в всплывающем окне, например) найденных файлов с их характеристиками. Кроме того, процесс работы проги не должно влиять на скорость и работоспособность системы. Есть ли такие проги, если нет можно ли такое написать и сколько примерно это будет стоить? да, забыл, исполнение может быть на любом языке
0
|
12.12.2013, 19:44 | |
Ответы с готовыми решениями:
10
Удаление файлов с жесткого диска Удаление некоторых файлов с диска 2 Почему надпись локального диска С и некоторых файлов стала отображаться синим цветом? Удаление файлов и папок кроме некоторых Ubuntu 16.04 |
14.12.2013, 04:19 | 3 |
Почти решением может быть (медийный) каталогизатор, умеюший извлекать характеристики видеофайлов: отсортировать в нем все найденное и удалить дубликаты вручную.
Посмотрите, например, WhereIsIt - таких немало, как вариант можно автоматически распарсить отчет программы итд. В любом случае, без создания полной базы файлов, дубликаты не найти, а хранение еще и параметров не так уж сильно скажется на общем размере и времени работы. Остальное можно сделать даже каким-нибудь скриптом.
1
|
14.12.2013, 19:01 | 5 |
Очевидно, речь идет о списке (базе) всех видеофайлов с их атрибутами. Полная задача может быть разбита на три:
1. Создание базы файлов 2. Поиск дубликатов 3. Выбор и удаление Каталогизатор оптимизирован для решения первой задачи и (в "ручном режиме") может быть использован для двух оставшихся.
0
|
960 / 801 / 85
Регистрация: 21.07.2010
Сообщений: 3,522
|
|
14.12.2013, 20:06 [ТС] | 6 |
так файлы уже есть, почти всю память занимают (~ 50 T)
так и без этой проги можно вручную находить, сравнивать и удалять файлы, но это такая ж. или я чего-то не понял? База файлов, это то же самое, что просто файлы на диске (например, на диске D: ) или что-то другое?
0
|
14.12.2013, 21:03 | 7 |
Другое. К тому же база имен будет на порядки меньше по размеру, чем набор дисковых медиафайлов.
То есть, файловая система - это, разумеется, DB, но DB каталогизатора обеспечивает другие удобные возможности, в частности сортировку по имени файла без учета пути, хранение атрибутов медиафайлов итп. Кроме того, каталогизатор уже оптимизирован под сканирование, поиск и хранение, нет нужды думать об этой части работы. Но поиск дубликатов, обычно, не предусмотрен, поэтому создав базу, придется сгенерировать текстовый отчет - сортированный список, с указанием нужных реквизитов, включая полный путь к файлу. Создание такого списка - первый этап любой обработки. Как именно вы его получите - неважно, но если воспользоваться готовым каталогизатором, то вам не придется писать и отлаживать этот код. Имея сортированный список, легко получить из него список дубликатов. Иными словами, готовая программа сканирования диска может избавить вас от большей части работы.
1
|
16.12.2013, 04:39 | 9 |
Смотря что найдете. Обычно, есть опции генерации отчета в ASCII/HTML... может быть еще с полдюжины других форматов. Читайте справку по выбранной программе, обычно, это либо пункт меню Report, либо Export.
1
|
5986 / 1995 / 323
Регистрация: 10.12.2013
Сообщений: 6,875
|
|
16.12.2013, 05:00 | 10 |
Если пришлёшь листинг каталогов, то задача по оценке сильно упростится А использовать, как советовали, каталогизатор с возможностью отчётов и последующее их распарсивание - здравая идея.
1
|
960 / 801 / 85
Регистрация: 21.07.2010
Сообщений: 3,522
|
|
16.12.2013, 11:37 [ТС] | 11 |
я вот, тоже думаю сначала попробовать каталогизатор, если не понравится, уже заказать прогу, которая решает эту проблему.
Не совсем пойму этот момент отчеты пишет и парсит (куда он их парсит и для чего) сам каталогизатор или я должен другую программу для этого использовать? Добавлено через 3 минуты не заметил последний комментарий gazlan
0
|
16.12.2013, 11:37 | |
16.12.2013, 11:37 | |
Помогаю со студенческими работами здесь
11
Восстановление Windows 7 после удаление некоторых системных файлов Запрет на удаление файлов с диска Удаление системных файлов с жесткого диска Запись и удаление файлов с гибкого магнитного диска Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |