|
4 / 4 / 3
Регистрация: 28.11.2017
Сообщений: 107
|
|||||||||||
Нечеткий поиск по столбцу13.01.2020, 10:40. Показов 3022. Ответов 11
Добрый день.
Есть столбец в DataTable ["LINE"] с адресами типа ("Ростовская область, г. Ростов-на-Дону, ул. Красноармейская, д 93/4"). Таких строк в столбце больше миллиона... На форме есть comboBox, в котором пользователь будет вбивать, например, "ростов красноарм". comboBox будет раскрываться и показывать возможные варианты адреса. И вот я застрял на нечетком поиске подстроки в строке... Я пробовал алгоритм Левенштейна, но для такого кол-ва строк он очень долгий... Кликните здесь для просмотра всего текста
Очень быстро и круто работает поиск через Contains, но там нет нечеткого поиска.. Кликните здесь для просмотра всего текста
Может кто-то сталкивался с такой задачей. Как ее можно решить? На счет dadata и т.д. - не вариант. Нужно, чтобы поиск работал автономно, без интернета. Все делается по скачанной базе ФИАС.
0
|
|||||||||||
| 13.01.2020, 10:40 | |
|
Ответы с готовыми решениями:
11
Нечеткий поиск Как реализовать нечеткий поиск, используя алгоритм Левенштейна? |
|
163 / 138 / 35
Регистрация: 25.11.2015
Сообщений: 910
|
|
| 13.01.2020, 12:05 | |
|
В contains проверяй не все выражение целиком, а по словам.
т.е. "ростов красноарм" это два слова для поиска.А тут уже как тебе интересно будет. Можешь второе слово искать в результатах первого, можешь результаты в AddRange скидывать...
0
|
|
|
4 / 4 / 3
Регистрация: 28.11.2017
Сообщений: 107
|
||
| 13.01.2020, 12:18 [ТС] | ||
|
Я создаю лист и загоняю туда все индексы подходящих строк от первого слова. Далее создаю лист и загоняю туда индексы подходящих строк от второго слова. И т.д. Далее я нахожу повторяющиеся индексы и вывожу строки по этим индексам... Это займет очень много времени... Как можно это реализовать? Подскажи идею)
0
|
||
|
163 / 138 / 35
Регистрация: 25.11.2015
Сообщений: 910
|
||||||
| 13.01.2020, 13:37 | ||||||
|
Зачем много времени. Один запрос, если работаешь из EF. В linq собираешь запрос из where и потом одной транзакцией вытягиваешь.
Чем больше слов, тем больше промежуточных запросов и тем дольше он будет исполняться, поэтому я бы еще ввел лимит выдачи, скажем там 50 записей. И зачем для разделения строки использовать regex?
1
|
||||||
|
4 / 4 / 3
Регистрация: 28.11.2017
Сообщений: 107
|
|||||||
| 13.01.2020, 13:58 [ТС] | |||||||
|
В моем случае есть DataTable join_table, у которого есть столбец LINE. И пользователь вводит текст в comboBox1.Text. Помоги с написанием linq запроса) Я пока реализовал вот так: Кликните здесь для просмотра всего текста
0
|
|||||||
|
880 / 559 / 291
Регистрация: 21.11.2012
Сообщений: 1,554
|
||||||
| 13.01.2020, 17:06 | ||||||
|
если поиск происходит по целым словам:
1
|
||||||
|
4 / 4 / 3
Регистрация: 28.11.2017
Сообщений: 107
|
|||||||
| 13.01.2020, 17:24 [ТС] | |||||||
|
Кликните здесь для просмотра всего текста
Надеюсь ваш пример будет работать стабильнее) А ещё мне интересно, что у вас написано в тексте?) Я пытался перевести через переводчик, но что-то вообще непонятное получилось... Это латынь?)
0
|
|||||||
|
14145 / 9374 / 1350
Регистрация: 21.01.2016
Сообщений: 35,299
|
|||||||||||||
| 14.01.2020, 06:41 | |||||||||||||
Сообщение было отмечено ndrnesterov как решение
Решениеполнотекстовый индекс. Но это отдельная структура данных, которую нужно построить по вашим данным и которая занимает место.Если вы поиск производите именно в СУБД, то там такой индекс уже поддерживается (кроме Firebird, там нужно отдельную тулзу прикручивать). Его нужно просто включить для нужных колонок. Ну и обращаться к нему нужно определённым образом в запросе. Если с вами что-то не то (полнолуние или ударились сильно) и вы весь миллион строк храните в оперативке, то вы можете использовать всё тот же Contains. С той лишь разницей, что желательно ввод пользователя разбивать на отдельные слова ("ростов" и "красноарм") и искать их отдельно объединяя условие через логическое И:
1
|
|||||||||||||
|
163 / 138 / 35
Регистрация: 25.11.2015
Сообщений: 910
|
|||
| 14.01.2020, 07:42 | |||
|
0
|
|||
|
14145 / 9374 / 1350
Регистрация: 21.01.2016
Сообщений: 35,299
|
||
| 14.01.2020, 07:52 | ||
SELECT ... FROM ... WHERE ... MATCH ...) из EF не сделать, а значит действительно или SQL-запрос или вызов процедуры.
0
|
||
|
4 / 4 / 3
Регистрация: 28.11.2017
Сообщений: 107
|
||
| 15.01.2020, 10:46 [ТС] | ||
|
0
|
||
| 15.01.2020, 10:46 | |
|
Помогаю со студенческими работами здесь
12
Поиск по столбцу в datagridview Поиск по одному столбцу в DataGridView DataGridView. Поиск по определенному столбцу Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2).
Унарный минус обозначается как !
*/
#include <iostream>
#include <stack>
#include <cctype>. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|