Форум программистов, компьютерный форум, киберфорум
Наши страницы
Etyuhibosecyu
Войти
Регистрация
Восстановить пароль
Оценить эту запись

Как создать идеальный компрессор?

Запись от Etyuhibosecyu размещена 04.06.2019 в 18:06

В настоящее время активно продолжается разработка моего авторского компрессора файлов. В последней фазе он улучшился существенно. Есть файлы (достоверно известен пока только один), которые он сжимает с впечатляющей степенью сжатия, на четверть лучше 7z. Но на главном "эталоне" - Властелине Колец - степень сжатия остается удовлетворительной. Зная, что в разделе "Обо всем" может писать, как правило, только Usaga, который может только критиковать и отсылать в учебники, а дельных и практически выполнимых советов дать не может, я пришел сюда, чтобы получить их. В своем компрессоре я стараюсь объединять проверенные временем технологии с инновационными. Относительно второй группы я ни у кого ничего не спрашиваю, авторские инновационные технологии - великая тайна, раскрытие которой опустит меня на полнейшее дно, а вот относительно первой группы хотелось бы знать: какие проверенные временем технологии сжатия информации открыты для массового пользователя (в Google можно найти подробный пошаговый алгоритм) и считаются одними из лучших удовлетворяющих предыдущему требованию по состоянию не раньше, чем на 1 января 2018 года? Вот список всех технологий, которые я либо уже применил, либо с высокой вероятностью применю. Ключевые выделены жирным, мертвые - зачеркнутым, плановые - курсивом, полуавторские - подчеркнутым, авторские - символом ©. Технологии упорядочены в порядке применения.
1. Хаффман
2. PseudoByte©
3. RLE
4. MaxLength (часть PseudoByte)
5. Лемпель-Зив
6. LZ-Buffer
7. Однобитная гарантия
8. ReducedOffset
9. ThresholdLength
10. DoNotEncodeVeryRare© (часть RLE)
11. SymbolDeltas
12. SpiralLengths©
13. E-RLE
14. ProgressBarsFillingOutFromLoops
15. Хаффман для слов
16. NoSquare
17. BWT
18. IndexCodes
19. MultiThreading
20. GetContexts
21. LinqJoin (часть NoSquare)
22. Арифметическое кодирование
23. Метод Этюгибосэкю©
24. PPM
25. PPM для слов
26. TrueSpaces
27. IncompleteDeletion
28. NaturalIo
29. RealTitle
30. NestedDistances (часть Лемпеля-Зива)
31. FlexRegimes
32. CompressImages
Надеюсь, выделение текста выше не настолько "кричащее", чтобы я заслуживал бана... Так все же - какие вы знаете лучшие публично доступные технологии сжатия информации?
Размещено в Без категории
Просмотров 712 Комментарии 51
Всего комментариев 51
Комментарии
  1. Старый комментарий
    Главное сразу декомпрессор написать
    Запись от ТабуретY размещена 04.06.2019 в 18:23 ТабуретY вне форума
  2. Старый комментарий
    ТабуретY, а по делу есть что написать?
    Запись от Etyuhibosecyu размещена 04.06.2019 в 18:32 Etyuhibosecyu вне форума
  3. Старый комментарий
    Аватар для Usaga
    Очередная пачка в хлам тупых вопросов? Почему бы вам не посмотреть ЛИЧНО СВОИМИ ГЛАЗАМИ на реализацию того же 7zip?

    https://sourceforge.net/projects/sevenzip/files/7-Zip/19.00/

    Или это опять считается за критику от злого Usaga и отправкой в учебники?

    zlib вы не осилили. Исходники 7zip найти не смогли. Что идеального вы можете написать? Или языком молоть не мешки ворочать?
    Запись от Usaga размещена 04.06.2019 в 19:03 Usaga вне форума
  4. Старый комментарий
    Аватар для Rius
    Уже всё создано:
    Цитата:
    Сам молодой гений описывает своё изобретение так:

    Алгоритм™ архивации таков: любой файл представляет собой HEX-последовательность символов, переводим этот HEX в DEC, получаем ****-большое число, дописываем перед этим число 0, — получаем число в диапазоне от 0 до 1 с огромным числом знаков после запятой, а дальше всё просто — подбираем 2 таких целочисленных числа, частное которых даст нам искомое число в диапазоне от 0 до 1 с точностью совпадений до последнего знака. Беда в подборе чисел, которое может идти и 2 часа, а может идти и 2 недели. Есть опытные образцы и работающая программа, и всё это работает.
    Позволяет сжать 2 ГБ в 2 КБ.
    Запись от Rius размещена 04.06.2019 в 19:15 Rius вне форума
    Обновил(-а) Rius 04.06.2019 в 19:17
  5. Старый комментарий
    Аватар для Usaga
    Что-то знакомое...
    Запись от Usaga размещена 04.06.2019 в 19:20 Usaga вне форума
  6. Старый комментарий
    Аватар для bedvit
    Цитата:
    Сообщение от Rius Просмотреть комментарий
    Уже всё создано:

    Позволяет сжать 2 ГБ в 2 КБ.
    Вот это тема!
    Даже не знал что так делают!
    Во народ пилит!
    Думаю, можно даже не переводить HEX в DEC, считать в 16й системе счисления, все равно пилить длинную арифметику!
    И главное что бы числитель и знаменатель были бы не больше исходной строки/получаемого результата! ))
    И желательно квантовый ПК для расчетов.
    Запись от bedvit размещена 04.06.2019 в 19:27 bedvit вне форума
    Обновил(-а) bedvit 04.06.2019 в 19:28
  7. Старый комментарий
    Аватар для Rius
    Цитата:
    Сообщение от Usaga
    Что-то знакомое...
    Это довольно известный в рунете программист. Ещё в школе он написал аудиоплеер, антивирус, брендмауэр, архиватор вот. Даже начал продавать. Попал в газеты, телевидение...
    Запись от Rius размещена 04.06.2019 в 19:29 Rius вне форума
  8. Старый комментарий
    Аватар для bedvit
    Свою ОС не писал? Тот человек еще более знаменит.
    А вообще, с такой подготовкой надо сразу за деньгами идти в RSA Factoring Challenge.
    Запись от bedvit размещена 04.06.2019 в 19:39 bedvit вне форума
  9. Старый комментарий
    Цитата:
    Сообщение от Usaga Просмотреть комментарий
    Очередная пачка в хлам тупых вопросов? Почему бы вам не посмотреть ЛИЧНО СВОИМИ ГЛАЗАМИ на реализацию того же 7zip?

    https://sourceforge.net/projects/sevenzip/files/7-Zip/19.00/

    Или это опять считается за критику от злого Usaga и отправкой в учебники?

    zlib вы не осилили. Исходники 7zip найти не смогли. Что идеального вы можете написать? Или языком молоть не мешки ворочать?
    Исходники 7zip я найти смог. Причем давно. И читал их. И компилировал. И отладчиком проходил. Только там гора ошибок, и код запутан настолько, что понять ничего невозможно. Вы сами хоть читали этот код? И поняли его?
    Запись от Etyuhibosecyu размещена 04.06.2019 в 19:47 Etyuhibosecyu вне форума
  10. Старый комментарий
    Аватар для bedvit
    Цитата:
    Сообщение от Etyuhibosecyu Просмотреть комментарий
    Исходники 7zip я найти смог. Причем давно. И читал их. И компилировал. И отладчиком проходил. Только там гора ошибок...
    А я пользовался этой программой, думал годная...
    Запись от bedvit размещена 04.06.2019 в 19:51 bedvit вне форума
  11. Старый комментарий
    Программа как раз годная, а вот исходники никуда не годятся...
    Запись от Etyuhibosecyu размещена 04.06.2019 в 20:02 Etyuhibosecyu вне форума
  12. Старый комментарий
    Аватар для Croessmah
    Цитата:
    Сообщение от Etyuhibosecyu Просмотреть комментарий
    Программа как раз годная, а вот исходники никуда не годятся...
    Мнение эксперта по исходникам?
    Цитата:
    Сообщение от bedvit Просмотреть комментарий
    А я пользовался этой программой, думал годная...
    И не говори. Всю жизнь испоганил прям...
    Запись от Croessmah размещена 04.06.2019 в 21:06 Croessmah на форуме
  13. Старый комментарий
    Аватар для Usaga
    Цитата:
    Исходники 7zip я найти смог. Причем давно. И читал их. И компилировал. И отладчиком проходил. Только там гора ошибок, и код запутан настолько, что понять ничего невозможно. Вы сами хоть читали этот код? И поняли его?
    Нет, не читали, ибо не нужно. Вы уверены, что именно код запутан, а не вам недостаёт знаний, чтобы понять, что там происходит?

    И ошибок что-то я не замечал за годы использования этого архиватора. В отличие от вашей поделки, 7z:
    * Сжимает
    * Сжимает быстро
    * Сжимает эффективно
    * Может распаковать то, что сам же и сжал

    Так, что не надо про ошибки говорить. В zlib тоже ошибки и всё запутано? В "Книге Дракона", которую я вам посоветовал, когда вы свой DCASFT создавали, тоже куча ошибок и всё запутано? Не находите, что это странные предъявы общеизвестным и хорошо себя зарекомендовавшим вещам?
    Запись от Usaga размещена 05.06.2019 в 06:20 Usaga вне форума
  14. Старый комментарий
    Аватар для bedvit
    Цитата:
    Сообщение от Etyuhibosecyu Просмотреть комментарий
    Программа как раз годная, а вот исходники никуда не годятся...
    Я просто думал, что релиз из исходников собирается.
    Цитата:
    Сообщение от Croessmah Просмотреть комментарий
    И не говори. Всю жизнь испоганил прям...
    Да, новость-то серьезная...
    Запись от bedvit размещена 05.06.2019 в 15:31 bedvit вне форума
  15. Старый комментарий
    Аватар для Croessmah
    У меня вопрос к ТС`у.
    Сколько по времени ты пишешь свой компрессор? Месяц, два?
    Вот 7-Zip разрабатывается 20 лет и, скорее всего, не одним программистом.
    А ты тут такой пришел со своим неработоспособным высером и что-то гонишь.
    Запись от Croessmah размещена 05.06.2019 в 20:10 Croessmah на форуме
    Обновил(-а) Croessmah 05.06.2019 в 20:12
  16. Старый комментарий
    Аватар для Usaga
    Проблема 7-zip'а в том, что его написал не ТС. А это очень серьёзный недостаток. Вот он и взялся это исправлять. Правда, почему-то взял убогий C# для реализации, когда мог воспользоваться нормальным построителем окон - DCASFT. Но ему, как гению, виднее.
    Запись от Usaga размещена 06.06.2019 в 06:46 Usaga вне форума
  17. Старый комментарий
    Аватар для Usaga
    Только сейчас обратил внимание на пункт №19:

    Цитата:
    19. MultiThreading
    ТС, многопоточность - разновидность алгоритма сжатия? Что у тебя в голове творится-то?
    Запись от Usaga размещена 06.06.2019 в 06:48 Usaga вне форума
  18. Старый комментарий
    Цитата:
    Сообщение от Rius Просмотреть комментарий
    Уже всё создано:
    Цитата:
    Сам молодой гений описывает своё изобретение так:

    Алгоритм™ архивации таков: любой файл представляет собой HEX-последовательность символов, переводим этот HEX в DEC, получаем ****-большое число, дописываем перед этим число 0, — получаем число в диапазоне от 0 до 1 с огромным числом знаков после запятой, а дальше всё просто — подбираем 2 таких целочисленных числа, частное которых даст нам искомое число в диапазоне от 0 до 1 с точностью совпадений до последнего знака. Беда в подборе чисел, которое может идти и 2 часа, а может идти и 2 недели. Есть опытные образцы и работающая программа, и всё это работает.
    Позволяет сжать 2 ГБ в 2 КБ.
    Цитата:
    Сообщение от Rius Просмотреть комментарий
    Это довольно известный в рунете программист. Ещё в школе он написал аудиоплеер, антивирус, брендмауэр, архиватор вот. Даже начал продавать. Попал в газеты, телевидение...
    Можете дать ссылку на творения этого программиста? Или на ходу придумали?
    Цитата:
    Сообщение от Usaga Просмотреть комментарий
    Вы уверены, что именно код запутан, а не вам недостаёт знаний, чтобы понять, что там происходит?

    И ошибок что-то я не замечал за годы использования этого архиватора. В отличие от вашей поделки, 7z:
    * Сжимает
    * Сжимает быстро
    * Сжимает эффективно
    * Может распаковать то, что сам же и сжал

    Так, что не надо про ошибки говорить. В zlib тоже ошибки и всё запутано? В "Книге Дракона", которую я вам посоветовал, когда вы свой DCASFT создавали, тоже куча ошибок и всё запутано? Не находите, что это странные предъявы общеизвестным и хорошо себя зарекомендовавшим вещам?
    Да, именно мне недостаёт знаний. Код написан профессионально, а я пока что не профессионал. Кроме того, он написан под очень старую Visual Studio. Может быть, сами напишете, какие библиотеки добавить и что изменить, чтобы он компилировался под Visual Studio 2019? А в "Книге Дракона" вообще код на Java.
    Цитата:
    Сообщение от Croessmah Просмотреть комментарий
    У меня вопрос к ТС`у.
    Сколько по времени ты пишешь свой компрессор? Месяц, два?
    Седьмой месяц. С декабря прошлого года.
    Цитата:
    Сообщение от Usaga Просмотреть комментарий
    Проблема 7-zip'а в том, что его написал не ТС. А это очень серьёзный недостаток. Вот он и взялся это исправлять. Правда, почему-то взял убогий C# для реализации, когда мог воспользоваться нормальным построителем окон - DCASFT. Но ему, как гению, виднее.
    DCASTF уже не в моде. Вместо него теперь C↑ᶜC. Кроме того, ни тот, ни другой язык в настоящее время для программирования непригодны.
    Цитата:
    Сообщение от Usaga Просмотреть комментарий
    Только сейчас обратил внимание на пункт №19:
    ТС, многопоточность - разновидность алгоритма сжатия? Что у тебя в голове творится-то?
    Это - не алгоритмы, а все возможные технологии, в которые входят методы представления информации, технологии редукции внутри одного алгоритма, технологии ускорения и, возможно, какие-либо другие. Многопоточность - технология ускорения.
    Запись от Etyuhibosecyu размещена 06.06.2019 в 09:40 Etyuhibosecyu вне форума
  19. Старый комментарий
    Аватар для bedvit
    Etyuhibosecyu, ваш козырь в обсуждении вашей темы - это работоспособный код, с хорошим алгоритмом (собственным?), который можно было прьедъявить и протестировать общественности. Соберитесь, выдайте код, ответьте беззапеляционно своим аппонентам!
    Запись от bedvit размещена 06.06.2019 в 09:47 bedvit вне форума
  20. Старый комментарий
    Аватар для Rius
    Цитата:
    Сообщение от Etyuhibosecyu Просмотреть комментарий
    Можете дать ссылку на творения этого программиста? Или на ходу придумали?
    Таких гениев, как вы, нарочно не придумаешь...
    Кликните здесь для просмотра всего текста
    Запись от Rius размещена 06.06.2019 в 09:51 Rius вне форума
 
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2019, vBulletin Solutions, Inc.
Рейтинг@Mail.ru