Форум программистов, компьютерный форум, киберфорум
Наши страницы
Алгоритмы
Войти
Регистрация
Восстановить пароль
 
MarkBeras
0 / 0 / 1
Регистрация: 30.10.2013
Сообщений: 114
1

Поиск сходных блоков

21.04.2015, 22:06. Просмотров 222. Ответов 3
Метки нет (Все метки)

Какие есть алгоритмы поиска сходных блоков? именно сходных, а не одинаковых
то есть они могут отличаться на пару байтов и все такое
0
QA
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
21.04.2015, 22:06
Ответы с готовыми решениями:

Перемещение сходных значков на панели задач
Всем привет, есть вопрос, как перемещать значки одной программы между собой на панели задач? В...

Восприятие ПС статей сходных между собой?
Есть статьи с одной было зделано 30 рерайтов, ручных! Совпадений по ним по всем между собой...

Подсчитать количество пар сходных элементов массива
написать программу, которая подсчитывает кол-во пар сходных элементов массива,для которых...

Аякс поиск с скрытием блоков
есть конструкция: <input type="text" > <div class="accordion"> <section...

Поиск на странице с отключением блоков div
Добрый день! Как реализовать поиск на странице с DIV, внутри есть h2. При поиске divы которые не...

3
Shamil1
Модератор
2438 / 1650 / 367
Регистрация: 26.03.2015
Сообщений: 6,035
22.04.2015, 22:56 2
Нечеткий поиск.

"отличаться на пару байтов" -
если имеется ввиду только замена одного байта другим, то это "Расстояние Хемминга"
если так же допускаются вставка и удаление, то это "Расстояние Левенштейна"

Оптимальный алгоритм зависит от параметров поиска (размер алфавита, размер образца, возможность предобработки образца или текста, и т.п.)
0
MarkBeras
0 / 0 / 1
Регистрация: 30.10.2013
Сообщений: 114
22.04.2015, 23:17  [ТС] 3
допустим есть два файла/блока. считаем для обоих контрольную сумму. если они близки, то хотим знать один ли и тот же это файл/блок, но с небольшим изменением, или же совсем разные.
0
wingblack
281 / 255 / 45
Регистрация: 09.04.2013
Сообщений: 955
23.04.2015, 00:33 4
Контрольные суммы и хэши обычно используются для удостоверения что файлы разные (не зависимо насколько), при этом равенство хэшей все же не гарантирует идентичность файлов.
Если пытаться использовать это для оценки схожести файлов, то получится еще хуже - количество ложных срабатываний будет значительно больше чем при сравнении на равенство (где, правдо, для повседневных задач обычно принято считать вероятность ложного срабатывания ничтожным).

Добавлено через 13 минут
Из самых простых алгоритмов оценки схожести блоков/файлов можно взять достаточно длинный массив, данные в котором поблочно XOR-рить с данными в файле. Сравнение результатов по двум файлам покажет (теоретически) схожесть содержимого, но при учете, что вероятность изменения отдельных бит/байт достаточно мала и нет изменения со сдвигом данных (добавление/удаления подмножества).
Такой вид сравнения следует применять если требует провести сравнения между большим количеством файлов, и если сравнение показывает похожесть, то нужно проводить сравнение самих блоков/файлов.
0
23.04.2015, 00:33
Answers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
23.04.2015, 00:33

Поиск блоков в строке, заключенных в кавычки
Доброго дня. Имеется строка, считанная из текстового файла, в которой есть много значений,...

Почему Яндекс игнорирует один из двух сходных по тематике, но оригинальных по тексту сайтов?
Здравствуйте. У меня два похожих по тематике сайта. Первый сайт имеет тематику о телеприеме в...

Создать круг разделенный на 6 блоков, в центре логотип, при наведении на один из блоков он увеличивается
Доброго времени суток. Не знаю, как даже искать похожее. В общем нужно создать круг разделен на 6...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2019, vBulletin Solutions, Inc.