Скрипт синхронизации файлов (зеркалирования)21.01.2020, 11:24. Показов 3086. Ответов 21
Метки нет (Все метки)
Продолжая тему данного повествования, решил перенести топег в более общий раздел, дабы не засорять профильный своим "белым шумом". Промежуточный итог - скрипт ищущий папки-клоны в заданной дирректории (MainPt) и выводящий их в текстовй файл CloneFold.txt в локации скрипта.
Что в нем не доработано это обход ошибок fso, еще некоторые мелочи, ну и качество выводимого результата конечно под вопросом. Проверить, в принципе, можно сделав подобный скрипт, но с использованием md5-хэширования..
1
|
||||||
| 21.01.2020, 11:24 | |
|
Ответы с готовыми решениями:
21
Скрипт умной синхронизации файлов (зеркалирования) Скрипт на проверку наличия файлов в каталоге и удаления файлов Создать скрипт для синхронизации файлов |
| 24.01.2020, 15:09 [ТС] | ||||||
|
Переработал этот скрипт на парсин потоковой выдачи (stdOut) команды dir. Работает более быстро, и главное более безотказно. Одна ошибка, не связанная с моей оплошностью, все-таки проскакивала, но связана была с особенностью выдачи командой инфы о скрытых папках, - показывает подпапку, обходя ее родителя. Но проблемма успешно решилась добавлением ключа /a в команду. Думаю еще добавить подсчет размера "клонов".
0
|
||||||
| 25.01.2020, 11:00 [ТС] | |||||||||||
|
Добавил размеры суммарные размеры папок-клонов и их сортировку их групп по этим размерам. Еще надо бы откинуть папки с нулевыми файлами из списка пустых папок.
Впервые рискнул сканернуть целый диск, но скрипт ругнулся на 32 строку, в принципе, подобное уже было из-за скрытых папок, наверное опять что-то скрытое/системное и т.п. Но, думаю, знаю как исправить..
0
|
|||||||||||
| 25.01.2020, 14:45 [ТС] | ||||||||
0
|
||||||||
| 26.01.2020, 19:08 [ТС] | ||||||
|
Добавил в сравнение имена файлов, упростил парсинг, работает быстрее и, главное, выше достоверность. Думаю уже ликвидный результат, с поиском клонов можно закончить, и что-нибудь думать по синхронизации.
0
|
||||||
| 29.01.2020, 05:21 [ТС] | ||||||
0
|
||||||
| 30.01.2020, 15:28 [ТС] | ||||||
|
Сделал отсеивание джунков и симлинков на этапе парсинга, с тем правилом, что ссылки идущие на внешний источник обрабатываются как папки (в единственном экземпляре). Т.е., допустим, обрабатывая папку профилей C:\Users\ скрипт обработает симлинк "C:\Users\All Users" ведущий на внешнее расположение (C:\ProgramData), и пропустит "C:\Users\Все пользователи", ведущий на то же расположение, также пропустит джунк C:\Users\User\Documents\мои рисунки, поскольку он ведет на внутреннее расположение и т.д. Но, кстати, dir сам "обходит" стандартные джунки ("Мои рисунки", "Моя музыка"..) будь то внутренние или внешние. Т.е. при листинге C:\Users\User\Documents дир не выдаст инфу по "C:\Users\User\Documents\мои рисунки" (C:\Users\User\Pictures), хотя было бы не плохо. При этом пользовательские джунки листит в любом случае, также любые. Симлинки листит любые в любом случае, таковы нюансы самого дира, которые впрочем не так уж и сложны. В любом случае можно добрать инфу можно добрать доп. коммандой по отдельному линку, если будет, допустим, такая необходимость..
0
|
||||||
| 30.01.2020, 15:54 [ТС] | |
|
Время первого прохода (по некэшированному диску) немного дольше (100 с чем-то сек.). Пик потребления памяти в пике нещадное, с этим ни чего не поделать.., и это самый главный контраргумент против таки методов работы с ф.с.
0
|
|
| 30.01.2020, 16:11 [ТС] | ||||||
|
Прикольдос
0
|
||||||
| 01.02.2020, 07:24 [ТС] | ||
|
C:\Windows\servicing\Packages C:\Windows\WinSxS\Manifests C:\Windows\WinSxS\Temp\PendingRenames
0
|
||
| 01.02.2020, 13:23 [ТС] | ||||||
|
Новый день, новая портянка
0
|
||||||
| 02.02.2020, 09:49 [ТС] | ||||||
|
Проценты групп клонов.
0
|
||||||
| 03.02.2020, 18:17 [ТС] | |
|
Немного о том, какие проблемы и задачи хотелось бы решить. В первую очередь - пожирание памяти, для этого надо добавить crc32 хеширование, самое лёгкое и быстрое. Но при всем, оно все же медленное, по этому следующий пункт - многопоточность, перенести это хеширование на паралельно запущенные процессы 3-4 копий отдельного (вспомогательного) скрипта. Задача не самая простая, но кое-что уже нашел..
0
|
|
| 05.02.2020, 16:49 [ТС] | ||||||||||||||||
|
Выявился еще один неучтенный прикол с симлинками - которые созданы в другой системе в текущей привязываются к текущим буквам дисков.. ...Многопоточность, или точнее параллельнопоточность, кое что реализовал, но вопрос, а нужно ли или, скажем так, целесообразно ли в моем случае.. Есть одна прикольная крутая штука, описанная на сером форуме, позволяющая разшаривать объекты из одного скрипта для других, и, главное открывает возможности или упрощает задачу по организации параллельно-поточности (или псевдо-параллельнопоточности, как угодно). У меня кое что получилось, надо сказать, не без труда. Пик воркинг-сет ~1700 Гб, в принципе не плохо, но другой момент - объекты перестают освобождать память при их уничтожении. К основному скрипту я добавил 2 доплнительных delegat.vbs - распределитель и execut.vbs - исполнитель. Пишут что можно все организовать на одном скрипте и запуске его копий с разными параметрами, но мне было проще расположить все на отдельных, хотябы чтоб не запутаться в общей логике.. Основной скрипт запускает скрипт-распределитель, и наполняет коллекцию с "заданиями". Скрипт-распределитель запускает несколько копий скрипта-исполнителя, и распределяет между ними задания по мере выполнения (как только скрипт освобождается, получает новое задание, либо ждет, либо завершается при опр. условии в общем все сложно..).. Что есть задания - коллекции строк которые должны пересчитать в crc32 чек-суммы и выдать "на базу" в основной скрипт. Фактически каждый "эксекут" обрабатывает какую-то отдельную, как бы папку, и если папка слишком большая (слишком ного файлов-строк), то один скрипт может зависнуть над обработкой значительно дольше других. Целесообразнее было бы обрабатывать такую папку несколькими скриптами, но это сложнее осуществить..
Основной скрипт.
0
|
||||||||||||||||
| 07.02.2020, 12:58 [ТС] | ||||||||||||||||
|
Переработал механизм хэширования. И вроде ничего, потребление памяти уменьшилось.. но есть один момент. Если запустить скрипт из notepad++ (с рабочей папкой notepad++) потребление памяти меньше, если запустить из проводника (с рабочей папкой скрипта) потребление больше. Еще один момент - 84 секунды (+-3) преодолеть не получилось. Ставишь больше параллельных процессов - толку ноль. Оптимальное максимальное колличество - 10-20.
0
|
||||||||||||||||
| 07.02.2020, 16:44 [ТС] | ||||||||
0
|
||||||||
| 08.02.2020, 16:38 [ТС] | ||||||||||||||||
|
Кликните здесь для просмотра всего текста
delegat.vbs Кликните здесь для просмотра всего текста
execut.vbs Кликните здесь для просмотра всего текста
Добавлено через 46 минут Вот она ошибка - подключение функции CalcCRC32 из главного файла "глобал контейнером". После того как встроил функцию в файл execut.vbs, сразу стала видна многопоточность, процессор заработал на максимуме! Т.е. одна функция работала как бы в один поток, и выдавала одну скорость, что при 20, что при 30 обращающихся к ней процессах.
0
|
||||||||||||||||
| 08.02.2020, 16:38 | |
|
Помогаю со студенческими работами здесь
20
Скрипт синхронизации папок Протокол для синхронизации файлов ПО для синхронизации локальных и удаленных файлов
Есть нормальная прога для синхронизации файлов смартфон-облако? Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога
Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
|