Форум программистов, компьютерный форум, киберфорум
Алгоритмы
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.95/22: Рейтинг темы: голосов - 22, средняя оценка - 4.95
21 / 21 / 1
Регистрация: 28.05.2010
Сообщений: 67

Быстрый поиск k ближайших соседей

16.09.2011, 23:50. Показов 4824. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Имеется 10000 точек в 20-мерном пространстве. Распределены более менее равномерно. Нужно по возможности быстро искать k ближайших соседей. Можно приближенно. Какой алгоритм посоветуете?

Заранее спасибо.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
16.09.2011, 23:50
Ответы с готовыми решениями:

метод k ближайших соседей
дайте ссылку на литературу где описан это метод

Поиск ближайших точек
На плоскости случайно расставляются точки. Далее задаётся ещё одна точка, для которой нужно найти n её ближайших соседей, либо те точки,...

Поиск соседей в изменяющихся точках
Доброго дня. Существует следующая задача: Есть много точек от нескольких десятков тысяч. Часть из них ( около 1\3) постоянно меняет...

6
Эксперт С++
 Аватар для odip
7176 / 3234 / 82
Регистрация: 17.06.2009
Сообщений: 14,164
17.09.2011, 17:53
Цикл на 10000 итераций чем не устраивает ?

Полностью как выглядит текст задачи ?
0
Автор FAQ
 Аватар для insideone
3687 / 964 / 114
Регистрация: 10.01.2010
Сообщений: 2,550
18.09.2011, 00:02
odip, а это будет не 20 вложенных циклов?

Скорее хотелось бы понять в каком формате представлены данные
0
Эксперт С++
 Аватар для odip
7176 / 3234 / 82
Регистрация: 17.06.2009
Сообщений: 14,164
18.09.2011, 12:59
Самый тупой алгоритм - перебираем все точки
Находим ближайших k штук
Внешний цикл будет на 10000
0
21 / 21 / 1
Регистрация: 28.05.2010
Сообщений: 67
19.09.2011, 19:50  [ТС]
Спасибо за ответы. Но в самом тупом варианте надо перебрать все пары точек, а их 50 миллионов. Это слишком много, хочется чтобы было меньше.

Данные - массив 10000х200. Из имеющихся 200 переменных я выбираю наборы по 20 и использую в дальнейшем для построения так называемых локально-линейных моделей. Вообще, мне нужно найти более-менее удачный набор из 20 переменных, что потребует перебора очень большого количества вариантов, что и приводит к желанию, обрабатывать каждый набор из 20 переменных как можно быстрее.

Добавлено через 33 минуты
Перечитал свое сообщение и понял, что плохо сформулировал задачу. Требуется для каждой из 10000 точек найти k ближайших в этом же множестве.
0
Эксперт С++
 Аватар для Mr.X
3225 / 1752 / 436
Регистрация: 03.05.2010
Сообщений: 3,867
19.09.2011, 20:52
Ну, если точки распределены приблизительно равномерно, то, зная k, можно прикинуть радиус R двадцатимерной сферы, в которой гарантированно содержатся k точек. Далее рассматриваем для текущей точки только соседей, расположенных по каждой координате не дальше R. Чтобы это было удобнее делать, имеет смысл проиндексировать все координаты векторов, т.е. для каждой i-й координаты построить мэп, содержащий пары <значение i-й координаты, номер вектора>, т.е. построить предварительно вектор из 200 таких мэпов.
Если в сферу радиуса R попало меньше k точек, то удваиваем R и повторяем расчеты.
1
21 / 21 / 1
Регистрация: 28.05.2010
Сообщений: 67
19.09.2011, 22:32  [ТС]
Ну, если точки распределены приблизительно равномерно, то, зная k, можно прикинуть радиус R двадцатимерной сферы, в которой гарантированно содержатся k точек. Далее рассматриваем для текущей точки только соседей, расположенных по каждой координате не дальше R. Чтобы это было удобнее делать, имеет смысл проиндексировать все координаты векторов, т.е. для каждой i-й координаты построить мэп, содержащий пары <значение i-й координаты, номер вектора>, т.е. построить предварительно вектор из 200 таких мэпов.
Если в сферу радиуса R попало меньше k точек, то удваиваем R и повторяем расчеты.
А ведь очень дельная мысль!

Я отсортирую точки отдельно по каждой из 200 координат, а потом буду брать кандидатов на ближайших соседей из ближайших в отсортированных массивах, лежащих ближе чем R. Так я переберу содержимое 20-мерного гиперкуба. Если еще проверять, что точки лежат именно в сфере, то гарантированно найду именно ближайших.

Спасибо! Пошел воплощать.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
19.09.2011, 22:32
Помогаю со студенческими работами здесь

Быстрый поиск слова
Поделитесь кто-нибудь знаниями по быстрому поиску в большом объеме текста, находящемся в памяти. Могу хранить бинарное дерево слов,...

Быстрый поиск пар
Здравствуйте. Задача такая: есть N прямоугольных &quot;коробок&quot; и N прямоугольных &quot;вещей&quot; (все они заданы парами ширина-высота,...

Быстрый поиск папок на сервере
Здравствуйте! Задача: Есть сервер. На сервере хранятся определенные папки с файлами. Имя такой папки содержит только цифри. Длина имени...

Быстрый поиск элементов массива
Есть два частично заполненных трёхмерных массива. Массивы не ограничены по размерности (т.е. индексы могут иметь любые целочисленные...

Быстрый поиск строки в списке строк с предварительным хешированием
Здравствуйте. Необходимо реализовать быстрый поиск строки в списке строк с предварительным хешированием в целях исследования (изучения). ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2. Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом. В. . .
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru