|
21 / 21 / 1
Регистрация: 28.05.2010
Сообщений: 67
|
|
Быстрый поиск k ближайших соседей16.09.2011, 23:50. Показов 4824. Ответов 6
Метки нет (Все метки)
Имеется 10000 точек в 20-мерном пространстве. Распределены более менее равномерно. Нужно по возможности быстро искать k ближайших соседей. Можно приближенно. Какой алгоритм посоветуете?
Заранее спасибо.
0
|
|
| 16.09.2011, 23:50 | |
|
Ответы с готовыми решениями:
6
метод k ближайших соседей Поиск ближайших точек Поиск соседей в изменяющихся точках |
|
7176 / 3234 / 82
Регистрация: 17.06.2009
Сообщений: 14,164
|
|
| 17.09.2011, 17:53 | |
|
Цикл на 10000 итераций чем не устраивает ?
Полностью как выглядит текст задачи ?
0
|
|
|
3687 / 964 / 114
Регистрация: 10.01.2010
Сообщений: 2,550
|
|
| 18.09.2011, 00:02 | |
|
odip, а это будет не 20 вложенных циклов?
Скорее хотелось бы понять в каком формате представлены данные
0
|
|
|
7176 / 3234 / 82
Регистрация: 17.06.2009
Сообщений: 14,164
|
|
| 18.09.2011, 12:59 | |
|
Самый тупой алгоритм - перебираем все точки
Находим ближайших k штук Внешний цикл будет на 10000
0
|
|
|
21 / 21 / 1
Регистрация: 28.05.2010
Сообщений: 67
|
|
| 19.09.2011, 19:50 [ТС] | |
|
Спасибо за ответы. Но в самом тупом варианте надо перебрать все пары точек, а их 50 миллионов. Это слишком много, хочется чтобы было меньше.
Данные - массив 10000х200. Из имеющихся 200 переменных я выбираю наборы по 20 и использую в дальнейшем для построения так называемых локально-линейных моделей. Вообще, мне нужно найти более-менее удачный набор из 20 переменных, что потребует перебора очень большого количества вариантов, что и приводит к желанию, обрабатывать каждый набор из 20 переменных как можно быстрее. Добавлено через 33 минуты Перечитал свое сообщение и понял, что плохо сформулировал задачу. Требуется для каждой из 10000 точек найти k ближайших в этом же множестве.
0
|
|
|
3225 / 1752 / 436
Регистрация: 03.05.2010
Сообщений: 3,867
|
|
| 19.09.2011, 20:52 | |
|
Ну, если точки распределены приблизительно равномерно, то, зная k, можно прикинуть радиус R двадцатимерной сферы, в которой гарантированно содержатся k точек. Далее рассматриваем для текущей точки только соседей, расположенных по каждой координате не дальше R. Чтобы это было удобнее делать, имеет смысл проиндексировать все координаты векторов, т.е. для каждой i-й координаты построить мэп, содержащий пары <значение i-й координаты, номер вектора>, т.е. построить предварительно вектор из 200 таких мэпов.
Если в сферу радиуса R попало меньше k точек, то удваиваем R и повторяем расчеты.
1
|
|
|
21 / 21 / 1
Регистрация: 28.05.2010
Сообщений: 67
|
||
| 19.09.2011, 22:32 [ТС] | ||
![]() Я отсортирую точки отдельно по каждой из 200 координат, а потом буду брать кандидатов на ближайших соседей из ближайших в отсортированных массивах, лежащих ближе чем R. Так я переберу содержимое 20-мерного гиперкуба. Если еще проверять, что точки лежат именно в сфере, то гарантированно найду именно ближайших. Спасибо! Пошел воплощать.
1
|
||
| 19.09.2011, 22:32 | |
|
Помогаю со студенческими работами здесь
7
Быстрый поиск слова
Быстрый поиск папок на сервере Быстрый поиск элементов массива Быстрый поиск строки в списке строк с предварительным хешированием Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2.
Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом.
В. . .
|
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2.
Задача: отобразить спецтехнику, которая на данный момент находится в ремонте.
Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
|
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
|
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
|
|
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут
Суть:
- Группа наркоманов из 10 человек.
- Только один инфицирован ВИЧ.
- Колются одной иглой.
- Колются раз в день.
- Колются последовательно через. . .
|
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
|
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
|
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . .
а удачный момент так и не приходит.
|