|
28 / 28 / 11
Регистрация: 08.08.2011
Сообщений: 1,173
|
|
Ускорить бинарный поиск по большому словарю04.12.2013, 21:06. Показов 2507. Ответов 9
Метки нет (Все метки)
Добрый день!
Словарь из 500 тысяч слов на русском языке. Словарь отсортирован, использую BinarySearch(), но хотелось бы еще повысить скорость. Подскажите, какие есть еще варианты? Например, будет ли полезно разбить словарь на два и искать в разных потоках? Добавлено через 2 минуты Важный момент - при каждом выходе из программы словарь обновляется, туда добавляются новые слова. То есть как-то индексировать затратно, потому что программа будет долго выгружаться или загружаться.
0
|
|
| 04.12.2013, 21:06 | |
|
Ответы с готовыми решениями:
9
Поиск по большому текстовому файлу Поиск осмысленной фразы по словарю Не работает поиск по словарю |
|
Master of Orion
|
|
| 04.12.2013, 22:12 | |
|
Suppir, используй сразу сортированный словарь, по-моему класс SortedDictionary существует. Он как раз на дереве по-моему и реализован, поиск среди 500к элементов потребует прохода всего 19 элементов в худшем случае.
1
|
|
|
28 / 28 / 11
Регистрация: 08.08.2011
Сообщений: 1,173
|
|
| 05.12.2013, 14:47 [ТС] | |
|
ok, спасибо, попробую.
Добавлено через 1 час 25 минут Значит, я проверил. Если использовать простой List<string> отсортированный и бинарный поиск по нему, то скорость поиска получается в 2 раза выше, чем поиск по SortedDictionary.
0
|
|
|
28 / 28 / 11
Регистрация: 08.08.2011
Сообщений: 1,173
|
|
| 05.12.2013, 15:10 [ТС] | |
|
Дело в том, что словарь огромный - 500 тыс. слов, а количество вставок маленькое - от 1 до 100 за сеанс. Поэтому вставки у меня хранятся в отдельном List<string>. И сначала поиск идет по вставкам, а потом - по основному словарю. При выходе из программы вставки вливаются в общий словарь.
0
|
|
|
1274 / 975 / 113
Регистрация: 12.01.2010
Сообщений: 1,971
|
|
| 05.12.2013, 15:14 | |
|
оч сомневаюсь что двоичный поиск у SortedDictionary внезапно стал медленней двоичного поиска у списка
кроме SortedDictionary есть еще Hashtable и Sortedlist можно попробовать спец алгоритмы именно для слов/строк http://en.wikipedia.org/wiki/Ternary_search_tree
0
|
|
|
28 / 28 / 11
Регистрация: 08.08.2011
Сообщений: 1,173
|
|||||||
| 05.12.2013, 15:26 [ТС] | |||||||
По этому коду бинарный поиск по List отрабатывает в 2,5 раза быстрее, чем поиск ключа по SortedDictionary. Правда, для SortedDictionary вставлена еще она маленькая проверка значения. Но не думаю, что она должна сильно тормозить.
0
|
|||||||
|
28 / 28 / 11
Регистрация: 08.08.2011
Сообщений: 1,173
|
|
| 05.12.2013, 16:10 [ТС] | |
|
Ну да, я так примерно и понял, спасибо )
0
|
|
|
835 / 643 / 101
Регистрация: 20.08.2013
Сообщений: 2,524
|
||
| 06.12.2013, 18:06 | ||
|
Ещё есть SortedSet. А вообще, попробуй список заменить на массив.
Добавлено через 44 минуты
0
|
||
| 06.12.2013, 18:06 | |
|
Помогаю со студенческими работами здесь
10
Поиск по словарю
Поиск в столбце по словарю Поиск пароля по словарю Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога
Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
|
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
|
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога
В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
|
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|
|
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога
Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
|
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
|
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования.
Часть библиотеки BedvitCOM
Использованы. . .
|
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога
SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
|