Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.57/7: Рейтинг темы: голосов - 7, средняя оценка - 4.57
 Аватар для tonchikp
0 / 0 / 0
Регистрация: 14.12.2014
Сообщений: 21

Борьба с нехорошими символами в именах файлов

25.07.2017, 08:23. Показов 1547. Ответов 1

Студворк — интернет-сервис помощи студентам
Уважаемые форумчане! Требуется ваша помощь!

Хочу разобраться с файловым хранилищем, удалить дубликаты файлов. Написал программу обходящую дерево директорий. Застрял на этапе вычисления хэшей, дело в том, что имена файлов содержат не только алфавитные символы и цифры, а также пробелы и спецсимволы. Сначала Python останавливался на первом же проблемном файле, позже я дописал try / except, и теперь он доходит до конца, пропуская проблемные файлы, но меня это не устраивает!

Язык: Python 3

Python
1
2
3
4
5
6
7
8
9
#! /usr/bin/env python3
 
import subprocess
 
try:
    hash = subprocess.check_output('md5sum -- "{}"'.format(file), universal_newlines=True, shell=True)[:32]
 
except Exception:
    print('Проблемный файл {}'.format(file))
С hashlib пока не получается, проблем много создаёт, поэтому пока пришлось воспользоваться стандартной утилитой md5sum. Может подскажете заодно как решить проблему с применением hashlib.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
25.07.2017, 08:23
Ответы с готовыми решениями:

Как удалить файлы с недопустимыми символами в именах?
Составьте скрипт, при помощи sed и bash удаляющий в текущем каталоге все файлы, содержащие недопустимые символы и/или пробелы в имени....

Как удалить файлы с недопустимыми символами в именах?
Необходимо составить скрипт, при помощи sed и bash удаляющий в текущем каталоге все файлы, содержащие недопустимые символы и/или пробелы в...

Преобразование файлов и перенос их в папки(названия папок содержится в именах файлов)
Доброй ночи! Тяжело быть глупой, помогите автоматизировать (пишу полную задачу, но если это слишком губасто, то важнее та часть кода,...

1
224 / 209 / 63
Регистрация: 26.05.2011
Сообщений: 363
26.07.2017, 02:59
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
import hashlib
 
def md5(fname):
    """ Возвращает контрольную сумму файла """
 
    result = hashlib.md5()
    with open(fname, "rb") as f:
        while True:
            d = f.read(8192)
            if not d:
                break
            result.update(d)
    return result.hexdigest()
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
26.07.2017, 02:59
Помогаю со студенческими работами здесь

Копирование файлов из разных каталогов в каталоги с именами, соответствующими номерам в именах файлов
Добрый день! Помогите решить проблему. Есть семь папок (cam_1, cam_2, cam_3 и.т.д) с фотографиями (cam_1_00052.JPG, cam_1_00053.JPG,...

Unicode в именах файлов
Содержимоe директории с файлом «…»‽.txt из-под консоли выдаёт следующее: Содержимое папки D:\dos\test 18.09.2017 17:18 <DIR> ...

Кракозябры в именах файлов
Кто может помочь? Как переименовать названия файлов, не их содержимое. Из кодировки Windows 1252 в UTF-8 ? Все декодеры, что я...

Проблема со ссылками в именах файлов.
Люди! Тут такая ситуация. Есть каталог, в котором лежат картинки. Есть огромное количество ссылок. Имена файлов состоят из чисел,...

Русские символы в именах файлов
Здравствуйте! Не уверен, что правильно выбрал ветку, но тем не менее вопрос. На хостинге есть папка с картинками, около 750 файлов. Часть...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Как я обхитрил таблицу Word
Alexander-7 21.03.2026
Когда мигает курсор у внешнего края таблицы, и нам надо перейти на новую строку, а при нажатии Enter создается новый ряд таблицы с ячейками, то мы вместо нервных нажатий Энтеров мы пишем любые буквы. . .
Krabik - рыболовный бот для WoW 3.3.5a
AmbA 21.03.2026
без регистрации и смс. Это не торговля, приложение не содержит рекламы. Выполняет свою непосредственную задачу - автоматизацию рыбалки в WoW - и ничего более. Однако если админы будут против -. . .
Программный отбор значений справочника
Maks 21.03.2026
Установка программного отбора значений справочника "Сотрудники" из модуля формы документа. В качестве фильтра для отбора служит предопределенное значение перечислений. Процедура. . .
Переходник USB-CAN-GPIO
Eddy_Em 20.03.2026
Достаточно давно на работе возникла необходимость в переходнике CAN-USB с гальваноразвязкой, оный и был разработан. Однако, все меня терзала совесть, что аж 48-ногий МК используется так тупо: просто. . .
Оттенки серого
Argus19 18.03.2026
Оттенки серого Нашёл в интернете 3 прекрасных модуля: Модуль класса открытия диалога открытия/ сохранения файла на Win32 API; Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru