|
0 / 0 / 0
Регистрация: 30.05.2014
Сообщений: 32
|
||||||
Легкое сжатие данных (строки)17.12.2014, 01:56. Показов 3302. Ответов 5
Метки нет (Все метки)
есть строка. 30 символов. почти все цифры, есть пара латинских букв. нужно втиснуть эту строку в xs:long, т.е., вообще говоря, в строку из цифр длиной 18-19 символов.
понятно, что нельзя ужать 30 символов в 18 (да еще цифровых) без потерь, но наверняка можно с минимальными потерями - другими словами, с достаточной степенью соответствия. знаю, есть масса алгоритмов сжатия, но как-то я растерялся. не подскажет ли кто, хоть в какую сторону смотреть, чтобы я не лопатил их все? мне бы хотя бы идею. закодировать уж не проблема. спасибо заранее. Добавлено через 1 час 7 минут на этом же форуме нашел пример вычисления чек-суммы CRC16 и расширил его до 64 бит.
0
|
||||||
| 17.12.2014, 01:56 | |
|
Ответы с готовыми решениями:
5
Заменить многократное обращение к базе данных на что-то более легкое Сжатие строки символов путем удаления пробелов из исходной строки |
|
0 / 0 / 0
Регистрация: 30.05.2014
Сообщений: 32
|
|
| 17.12.2014, 17:14 [ТС] | |
|
пожалуй, задача больше на хэш. говоря простым языком, мне нужна функция, которая бы генерировала 64-битное целое число по заданной строке. мне не нужно обратное восстановление (что, по идее, должно предусматривать сжатие), но на одинаковые строки должны генерироваться одинаковые числа.
числа должны быть достаточно уникальными. т.е. вероятность, что две разные строки дадут одинаковые числа должна быть достаточно мала. я больше склоняюсь к алгоритму типа контрольной суммы. за ссылочку на CRC64 спасибо (я ее видел раньше, но тогда еще не созрел до правильности выбора алгоритма. мне нужна была идея). по поводу "4 бит" не пойму, чем мне это поможет. я не смогу "ужать" строку, состоящую из цифр, до числа с меньшим количеством цифр. к примеру, я могу обозначить (возьмем случай более тривиальный, когда входная строка состоит только из цифр) цифру в строке 4-мя битами. это значит, что 64 битами я могу обозначить всего 16 цифр. а мне нужно 30.
0
|
|
| 17.12.2014, 18:45 | |||
|
Если набор строк известен и фиксирован, лучшим решением будет perfect hash. В противном случае, почти любой хэш, подходящего размера (CRC64, половина от MD5 итд.)
0
|
|||
|
0 / 0 / 0
Регистрация: 30.05.2014
Сообщений: 32
|
||||
| 18.12.2014, 20:10 [ТС] | ||||
|
"уникальный" значит, что такой же не встретится нигде и никогда. "достаточно уникальный" значит, что такой же может встретиться, но с очень малой вероятностью. алгоритмы всяких чек-сумм и хешей не гарантируют уникальность (собственно, они для этого не предназначены), но все же дают достаточно хороший разброс результатов для разных входных данных. в этом и смысл чек-сумм - надежда на то, что разные данные дадут разные чек-суммы.
0
|
||||
| 18.12.2014, 20:41 | |||
|
Не по теме: "Уникальный", как и "тривиальный" - это "булевские переменные"
0
|
|||
| 18.12.2014, 20:41 | |
|
Помогаю со студенческими работами здесь
6
Сжатие строки
Задача на сжатие строки Сжатие данных Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
|
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/
O1rJuneU_ls
https:/ / vkvideo. ru/ video-115721503_456239114
|
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ВВЕДЕНИЕ
Введу сокращения:
аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
|
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi
ветка по-частям.
коммит Create переделка под биомассу. txt
вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
|
|
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ *
Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях.
Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её.
Последовательность действий:. . .
|
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
|
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение.
И на уровне агентов добавится между грибами или бактериями взаимодействий.
До того я пробовал подход через многомерные массивы,. . .
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|