Форум программистов, компьютерный форум, киберфорум
C++ Builder
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 4.84/285: Рейтинг темы: голосов - 285, средняя оценка - 4.84
 Аватар для [XandeR]
31 / 31 / 3
Регистрация: 18.03.2009
Сообщений: 381
Записей в блоге: 2

Как написать простейший архиватор?

29.07.2010, 18:54. Показов 54142. Ответов 45
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Необходимо написать программу -архиватор, степень сжатия неважна, лишь бы работало. Ничего интересного и понятного в интернете не нашел, на форуме тоже. Может у кого нибудь есть простой и понятный исходник архиватора, или подскажите что и где почитать, пжл.
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
29.07.2010, 18:54
Ответы с готовыми решениями:

Как написать простейший калькулятор
Как написать простейший калькулятор?

Написать простейший текстовый редактор (есть код на Delphi)
Народ нужна ваша помощь, на Delphi делал ее, а на Builder C++ не получается, могу дать код с Delphi. Создать приложение, позволяющее: ...

Как написать свой простейший архиватор
Можно ли сделать свой "Архиватор"? То есть запустил прогу, там кнопочка "Выбрать файл", жмем на кнопку выбираем нужный файл, и он как...

45
Эксперт С++
 Аватар для MikeSoft
3956 / 1811 / 184
Регистрация: 21.11.2009
Сообщений: 2,540
29.07.2010, 18:59
[XandeR], вам нужно смотреть в сторону Кодирования по Хаффману или Арифметического кодирования.

Информации по этим методам предостаточно (собственно, исходники тоже можно найти).
1
 Аватар для radiohobbyt
192 / 190 / 15
Регистрация: 27.01.2009
Сообщений: 548
29.07.2010, 19:04
http://www.info-zip.org/Zip.html#Sources
итог гугления в течении 3 минут
0
 Аватар для [XandeR]
31 / 31 / 3
Регистрация: 18.03.2009
Сообщений: 381
Записей в блоге: 2
29.07.2010, 19:10  [ТС]
Цитата Сообщение от radiohobbyt Посмотреть сообщение
http://www.info-zip.org/Zip.html#Sources
итог гугления в течении 3 минут
хм, ничего тут не нашел
0
Покинул форум
3189 / 1368 / 109
Регистрация: 29.01.2010
Сообщений: 2,887
29.07.2010, 19:28
[XandeR], вам нужно написать все алгоритмы сжатия самому или же нет? Просто для архивации есть множество готовых библиотек, таких как ZLib или ZipForge.
2
 Аватар для [XandeR]
31 / 31 / 3
Регистрация: 18.03.2009
Сообщений: 381
Записей в блоге: 2
29.07.2010, 19:41  [ТС]
да, желательно самому, в худшем случае найти несложный пример, а вот сложные библиотеки и компоненты как раз мне не нужны, меня не интересует сильное или эффективное сжатие
0
Эксперт С++
 Аватар для odip
7176 / 3234 / 82
Регистрация: 17.06.2009
Сообщений: 14,164
30.07.2010, 11:29
Ну если самому, тогда ищи описание алгоритма Хаффмана
0
Покинул форум
3189 / 1368 / 109
Регистрация: 29.01.2010
Сообщений: 2,887
30.07.2010, 23:33
[XandeR], вот здесь есть исходник на C: Исходник алгоритма Хаффмана на C.
Также посмотрите вот здесь: Алгоритм Хаффмана или LWZ - сжатие

Добавлено через 2 минуты
Цитата Сообщение от XandeR Посмотреть сообщение
а вот сложные библиотеки и компоненты как раз мне не нужны, меня не интересует сильное или эффективное сжатие
Да там все просто работает. Устанавливаете компонент. Затем кидаете его на форму и пишите (просто пример - реальных функций не помню):
C++
1
2
3
Zip1->FileName="Test.zip"; //Создали архив
Zip1->Open(); //Открыли
Zip1->AddFile("FileName"); //Добавили файл
Что-то вроде этого.
2
Фрилансер
 Аватар для Black Fregat
3709 / 2082 / 567
Регистрация: 31.05.2009
Сообщений: 6,683
31.07.2010, 01:47
Давайте по порядку.

Во-первых. Исторически понятие "архивация" может означать 2 принципиально разные вещи:
1) Кодирование файла таким образом, чтобы он занимал меньше места (gzip)
2) Сохранение нескольких файлов (возможно, со структурой папок) в единый файл (tar)

Вам нужно реализовать оба этих функционала?

Во-вторых. Xаффман достаточно сложен для понимания и реализации. Есть более простые алгоритмы, тем более, если не требуется сильное сжатие. Вот, например, LZ77 с реализацией

Во-третьих. Главное, что непонятно - всё это можно найти в Гугле за несколько секунд. Поэтому не совсем понятно, какой именно помощи Вы ждете. Может быть, Вам на самом деле следует переместиться во фриланс?
0
Эксперт JavaЭксперт С++
 Аватар для M128K145
8384 / 3617 / 419
Регистрация: 03.07.2009
Сообщений: 10,709
31.07.2010, 12:49
[XandeR], знаете такую историю:
Проходила какая-то олимпиада по программированию. Задача была - написать архиватор, причём чем лучше сжимает, тем больше очков - но 0 очков, если нельзя распаковать. Выиграла команда, написавшая копирование файлов.
Это я к фразе
Цитата Сообщение от XandeR Посмотреть сообщение
степень сжатия неважна, лишь бы работало
Задумайтесь
0
31.07.2010, 17:31

Не по теме:

Цитата Сообщение от M128K145 Посмотреть сообщение
[XandeR], знаете такую историю:
А еще была история, как студент написал упаковщик, сжимающий любой файл в 2 байта. А на резонный вопрос преподавателя об обратном преобразовании ответил, что писать распаковщик задания не было..

0
 Аватар для [XandeR]
31 / 31 / 3
Регистрация: 18.03.2009
Сообщений: 381
Записей в блоге: 2
05.08.2010, 18:36  [ТС]
Цитата Сообщение от M128K145 Посмотреть сообщение
[XandeR], знаете такую историю:
забавно

я пишу архиватор для знакомого первокурсника, но сам с алгоритмами архивации никогда не сталкивался и не представляю как это работает, а вникать не очень то хочется, сейчас у меня есть задачи поважнее, поэтому я хотел бы написать простой архиватор но чтобы я сам врубался как он работает. спасибо за ссылки, они помогли
Black Fregat за помощь спасибо а умничать не стоит. если я пишу сюда значит есть причина. в гугле ничего полезного для себя не нашел
0
05.08.2010, 18:48

Не по теме:

Цитата Сообщение от [XandeR] Посмотреть сообщение
Black Fregat за помощь спасибо а умничать не стоит.
Вот и помогай после этого людям..

1
 Аватар для [XandeR]
31 / 31 / 3
Регистрация: 18.03.2009
Сообщений: 381
Записей в блоге: 2
05.08.2010, 21:32  [ТС]
Алгоритм нашел.. разобрался в теории кода Хаффмана, но никак не могу понять почему мы на выходе имеем файл в 119 раз больше чем кодируемый...
алгоритм взять отсюда Исходник алгоритма Хаффмана на C
нет ну понять то я конечно могу, туда записывается туча информации, но зачем?

Добавлено через 1 час 59 минут
и ещё возник вопрос( почему в двоичный файл хоть убей нельзя записать 1 бит информации?

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
void __fastcall TForm1::Button1Click(TObject *Sender)
{
 
TFileStream *out = new TFileStream("info", fmCreate); // создаем файл
if( out != NULL ) {
  AnsiString text = Memo1->Text; // исходная строка
  int size = text.Length();
  bool t=true;
 
  out->WriteBuffer(&t,  sizeof(t));
delete out;
}
 
}
записывает 1 байт, а зачем один байт под 1 бит выделять не понимаю!
0
Унылый школьник
 Аватар для Demihalf
126 / 60 / 10
Регистрация: 06.11.2009
Сообщений: 353
05.08.2010, 23:24
[XandeR],
Байт в современных x86-совместимых компьютерах — это минимально адресуемый набор фиксированного числа битов.
Википедия
0
 Аватар для [XandeR]
31 / 31 / 3
Регистрация: 18.03.2009
Сообщений: 381
Записей в блоге: 2
06.08.2010, 16:19  [ТС]
ладно, это понятно, но каким образом я смогу заархивировать текст если текстовый символ занимает 1 байт и цифра 1 или 0 тоже занимает 1 байт а после кодировки по хаффману цифр получается больше чем символов в исходном тексте, и в итоге мы получаем файл размером больше а не меньше..
0
Эксперт С++
 Аватар для MikeSoft
3956 / 1811 / 184
Регистрация: 21.11.2009
Сообщений: 2,540
06.08.2010, 16:36
Лучший ответ Сообщение было отмечено как решение

Решение

[XandeR], рассуждения неверны.

Расскажу вам принцип кодирования по Хаффману (простого, не адаптивного).

1. Собираем статистику появления символов в заданном тексте/файле.
2. В полученной последовательности символа с его частотой встречаемости выбираем два минимальных элемента, частоту их встречаемости слаживаем и объединяем в "новый элемент" (тем самым начинается построение дерева).
3. Для "родителей" нового объекта устанавливаем "0" и "1" соответственно.
4. Повторяем пункт 2 до тех пор, пока в последовательности не останется один элемент. Соответственно, при каждом проходе не забываем устанавливать "0" и "1".
5. Получаем последовательность бит, которыми будут закодированы символы. Для этого проходим дерево от нового (единственного) элемента к исходной последовательности.
6. Последовательность бит будет такой, что максимально повторяющийся элемент будет кодироваться минимальным количеством бит.
7. Делаем проход по тексту, заменяя символы на полученные биты, дополняем биты до байт (следующим набором бит) и записываем символ в новый файл. Последовательность из восьми бит даст один байт, который должен быть преобразован в символ.

Может теперь вы сможете увидеть, откуда берётся выигрыш в объёме.
3
 Аватар для [XandeR]
31 / 31 / 3
Регистрация: 18.03.2009
Сообщений: 381
Записей в блоге: 2
06.08.2010, 17:25  [ТС]
да, вижу,
но код приведенный здесь Исходник алгоритма Хаффмана на C работает неправильно, он выводит нам последовательность бит, это правильно в текстовый файл а в бинарный он выводит какую то ерунду которая занимает в 130 раз больше чем сам исходный файл. Мне достаточно того текстового файла, но ведь в него ещё надо вложить какую то информацию для раскодировки, да и вобще в алгоритме нет раскодировки..
0
Эксперт С++
 Аватар для MikeSoft
3956 / 1811 / 184
Регистрация: 21.11.2009
Сообщений: 2,540
06.08.2010, 17:40
[XandeR], мозможно, алгоритм неверный ...

Для интереса проверил... Взял файл в 50 кб.
Хаффман (не адаптивный) ужал его до 38 кб.
Арифметический метод (адаптивный) ужал до 34 кб.
WinRar ужал до 26 кб.
0
Фрилансер
 Аватар для Black Fregat
3709 / 2082 / 567
Регистрация: 31.05.2009
Сообщений: 6,683
06.08.2010, 17:52
Цитата Сообщение от Black Fregat Посмотреть сообщение
Xаффман достаточно сложен для понимания и реализации. Есть более простые алгоритмы, тем более, если не требуется сильное сжатие. Вот, например, LZ77 с реализацией
Я бы даже сказал, что LZ-77 и другие алгоритмы "скользящего окна" в разы проще для понимания и реализации, но опасаюсь очередных обвинений в умствовании.

Конечно, если Хаффман так зацепил - разбирайтесь.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
06.08.2010, 17:52
Помогаю со студенческими работами здесь

Как создать на Visual C++ Win 32 простейший Архиватор
Как создать на Visual C++ Win 32 простейший Архиватор Напишите пожалуста код, или дайте книгу или статью где - описано простой...

Простейший архиватор
Нужно написать простой архиватор. Который просто архивирует и разархивирует только файлы. Как его вообще писать?

Как написать архиватор.
Помогите написать архиватор, с чего начать?, какой метод архивирования лучше?

Как написать свой архиватор
Доброго времени суток. Собственно с помощью явы хочу написать простенький, может даже совершенно не оптимальный, но архиватор. Облазил весь...

Как написать простейший калькулятор?
я написал что то вроде этого: program calcus; uses crt; var a,b,c:integer; d:string; begin clrscr; writeln('vvedite cifru...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
20
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru