|
48 / 45 / 7
Регистрация: 17.01.2021
Сообщений: 354
|
|
Windows Программа для каталогизации электронных книжек07.04.2022, 23:09. Показов 939. Ответов 13
Метки нет (Все метки)
Приветствую.
Задачка выглядит примерно так. У меня время от времени накапливаются электронные книжки в pdf и djvu файлах (названия файлов и в латинице, и на кириллице). Накапливаются порой сотнями, внутри нескольких десятков каталогов. Просто взять их и удалить - жалко, потому что потом могу не вспомнить автора и название какой-то книги. Есть конечно самый доступный способ для каталогизации через использование системной команды dir /s * > list.txt Однако недостатком такого способа является то, что в одном выходном файле смешиваются как и названия самих файлов, так и чисто системная информация, типа дат создания файлов и названий каталогов, в которых они лежат. Вот если бы команда dir умела ещё парсить выходную информацию, так чтоб удалять всё лишнее и отделять в названии файлов, скажем, авторов от названий книг - это было бы здорово. Порекомендуйте фриварные решения под Windows, которые умеют это делать. Заранее благодарю.
0
|
|
| 07.04.2022, 23:09 | |
|
Ответы с готовыми решениями:
13
Программа для каталогизации документов(док., пдф) Программа для создания электронных книг Программа учёта и каталогизации книг |
|
5042 / 1069 / 149
Регистрация: 29.01.2013
Сообщений: 6,248
|
|
| 08.04.2022, 10:33 | |
|
Novosedoff, PowerShell
0
|
|
|
6994 / 2880 / 1108
Регистрация: 06.06.2017
Сообщений: 9,775
|
|
| 08.04.2022, 11:10 | |
|
Novosedoff, создание списка не является каталогизацией, не путайте.
Вам нужно избавиться от файлов, сохранив информацию по ним? Так? Метаданных нет? Всё в названиях? Впрочем, если и есть, то даже Directory Lister Pro/Enterprise, Directory List & Print и т. п. с метаданными djvu точно не помогут. dir в сухом виде ничего не даст, парсинг достигается обработкой сценарием/скриптом либо заменой с регекспами в текстовом редакторе. ТЗ полностью составьте. С шаблоном исходных и выходных имён, разделителем, местом поиска, необходимостью в рекурсии и т. д.
1
|
|
|
5042 / 1069 / 149
Регистрация: 29.01.2013
Сообщений: 6,248
|
|
| 08.04.2022, 11:25 | |
|
Вот да, не хотел сразу это писать, но дело вы затеяли крайне трудоёмкое и в чём-то даже не выполнимое. По крайней мере я в своё время не смог сделать вменяемый автоматизированный каталогизатор. Проблемы которые передо мной возникли:
1. В названии файла имя автора и название книги могут быть в любом виде, любом порядке и могут отсутствовать вовсе (у меня откуда-то набралась целая папка на 2,5Гб всяких boock[i] и BestCoockBoock). 2. Электронные книги крайне редко содержат хоть как-то заполненные метаданные. 3. Поиск дублей. даже не возвращаясь к п 1., Есть книги за авторством Михаила Фленова, а есть от Michail Flenov, или Mikail Flenou. А это всё - одна и та же книга. Даже издание одно и то же. 4. Распарсить текстовый слой в надежде вытянуть информацию об авторе, названии и издании возможно не всегда. У меня есть чудесная "Библия Delphi" за авторством как раз Flenou, именно так написано в метаданных, и вот она отсканирована. Да ещё и в высоком разрешении, без артефактов сканирования. И весит это чудо почти гиг. Так что если вы думали про OCR, то раздумайте назад.
0
|
|
|
6994 / 2880 / 1108
Регистрация: 06.06.2017
Сообщений: 9,775
|
||
| 08.04.2022, 11:34 | ||
|
0
|
||
|
5042 / 1069 / 149
Регистрация: 29.01.2013
Сообщений: 6,248
|
|
| 08.04.2022, 11:37 | |
|
FlasherX, смотрите пункт первый моих стенаний о двух неделях разработки в никуда)
0
|
|
|
6994 / 2880 / 1108
Регистрация: 06.06.2017
Сообщений: 9,775
|
|
| 08.04.2022, 12:15 | |
|
Alli_Lupin, второй раз? Зачем. Я указал на конкретное условие для достижения цели.
0
|
|
| 08.04.2022, 12:22 | |
|
Не по теме: ладно, не буду в полемику
0
|
|
|
48 / 45 / 7
Регистрация: 17.01.2021
Сообщений: 354
|
|||
| 08.04.2022, 15:02 [ТС] | |||
|
https://drive.google.com/file/... R_IGs/view В выходном CSV либо TXT файле - 6 cтолбцов: 1) Авторы, 2) Название публикации, 3) Год издания, 4) Тематика публикации, 5) Формат файла (Pdf, djvu и тп), 6) Ссылка откуда скачано. Тематику можно определить по имени системного каталога, в котором файл (в примере выше - MATHS). Первые 3 столбца при скачивании с libgen - из имени файла. Формат файла - из его расширения. Столбец 6) Ссылка - пусть пустует. Если что-то невозможно определить из названия файла, то оставляем пустым с каким-нибудь маркером внутри (например, 5 звёздочек *****), чтобы поиском сразу же можно было найти все пустоты.
0
|
|||
|
5042 / 1069 / 149
Регистрация: 29.01.2013
Сообщений: 6,248
|
||
| 08.04.2022, 15:06 | ||
|
Но раз у вас с этим всё хорошо, то смотрите в сторону PS. Он не хуже линуксового шелла умеет парсить и преобразовывать.
0
|
||
|
48 / 45 / 7
Регистрация: 17.01.2021
Сообщений: 354
|
|||
| 08.04.2022, 15:18 [ТС] | |||
|
Как отделить имя автора от названия книги в названии файла?
1) Очень часто по инициалам с точкой, но не всегда. 2) По длине: названия публикаций обычно длинее имён авторов (но не всегда)
0
|
|||
|
6994 / 2880 / 1108
Регистрация: 06.06.2017
Сообщений: 9,775
|
|||
| 08.04.2022, 17:51 | |||
|
А так можно вообще работать с потоками. Например, таким плагином можно любые файлы метить как душе угодно.
1
|
|||
|
48 / 45 / 7
Регистрация: 17.01.2021
Сообщений: 354
|
||
| 08.04.2022, 18:27 [ТС] | ||
|
0
|
||
|
6994 / 2880 / 1108
Регистрация: 06.06.2017
Сообщений: 9,775
|
|||
| 08.04.2022, 19:02 | |||
|
Т. е. сперва фильтруются файлы по заданному критерию, а потом уже производится переименование. При таком списке нужен индивидуальный подход.
0
|
|||
| 08.04.2022, 19:02 | |
|
Помогаю со студенческими работами здесь
14
Программа для сканирования электронных плат Программа для создания электронных учебников Программа для продажи электронных билетов - нужна литература
Создание простой программы для каталогизации музыки Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
|
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
|
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . .
а удачный момент так и не приходит.
|
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица.
Задача: зафиксировать три левых колонки в отчете.
Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка)
/ / . . .
|
|
Настройки VS Code
Loafer 13.04.2026
{
"cmake. configureOnOpen": false,
"diffEditor. ignoreTrimWhitespace": true,
"editor. guides. bracketPairs": "active",
"extensions. ignoreRecommendations": true,
. . .
|
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2.
Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива.
Было так:. . .
|
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: реализовать контроль корректности заполнения дат назначения. . .
|
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html
Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
|