Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.91/11: Рейтинг темы: голосов - 11, средняя оценка - 4.91
0 / 0 / 0
Регистрация: 28.10.2012
Сообщений: 20
1

Произвести хэширование по словам

05.05.2013, 14:54. Просмотров 2057. Ответов 10
Метки нет (Все метки)

Помогите, пожалуйста, разобраться, что должна делать хэш-функция. Мне нужно произвести хэширование по словам, т.е. я должен каждому слову каким-то образом присвоить какое-либо число? Если да, то как это можно сделать?
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
05.05.2013, 14:54
Ответы с готовыми решениями:

Хэширование
Добрый день, коллеги! Вопрос в следующем, есть ли готовая реализация на 1С алгоритма хэширования...

Хэширование
«Дана таблица текстовой базы данных с полями фиксированной ширины. Произвести хэширование по двум...

Хэширование
Здравствуйте, вот прям вообще не понимаю, что нужно делать и что есть что и где :D....

Трай-хэширование
Расскажите пожалуйста что такое trie -хэширование . Или где можно взять информацию о нем

10
4293 / 1415 / 463
Регистрация: 16.12.2010
Сообщений: 2,938
Записей в блоге: 3
05.05.2013, 15:26 2
Можете сложить коды символов слова и взять остаток от деления на 100, например. Чем не вариант?
1
Эксперт С++
1659 / 1031 / 174
Регистрация: 27.09.2009
Сообщений: 1,945
05.05.2013, 16:21 3
Цитата Сообщение от BumerangSP Посмотреть сообщение
Чем не вариант?
Подойдёт не всегда, так как совершенно безразличен к порядку букв и не отличит "апостол" от "полосат".
0
4293 / 1415 / 463
Регистрация: 16.12.2010
Сообщений: 2,938
Записей в блоге: 3
05.05.2013, 16:26 4
Nick Alte, действительно, но ведь существуют всякие методы разрешения коллизий.
0
276 / 275 / 83
Регистрация: 03.02.2013
Сообщений: 792
05.05.2013, 16:32 5
в универе мы делали нечто подобное
решение было таким - выбиралось число N (простое, например 97)
и далее бралась сумма
h(str) = str[0]+str[1]*N^1+str[2]*N^2+...str[L]*N^L
h - хеш, str - строка, L - str.size-1
таким методом мы определяли количество различных слов в большом тексте

ну это если самому, а так может посмотреть в сторону OpenSSL или не побоюсь этого слова RCO?
0
go
Эксперт С++
3639 / 1371 / 243
Регистрация: 16.04.2009
Сообщений: 4,527
05.05.2013, 16:41 6
cornis, преобразование системы счисления. Все латинский(строчные и прописные) + 10 цифр. Вроде 62 получается основание.

Добавлено через 2 минуты
Цитата Сообщение от Nick Alte Посмотреть сообщение
Подойдёт не всегда, так как совершенно безразличен к порядку букв и не отличит "апостол" от "полосат".
так а почему не подходит?
0
Эксперт С++
1659 / 1031 / 174
Регистрация: 27.09.2009
Сообщений: 1,945
05.05.2013, 16:47 7
Цитата Сообщение от go Посмотреть сообщение
так а почему не подходит?
Потому что бывает необходимо, чтобы у разных слов были разные хеши, даже если эти слова - анаграммы. Нехорошо, когда система поиска (словарь, например), не может отличить слова "фашистка" и "фисташка".

Добавлено через 1 минуту
Цитата Сообщение от BumerangSP Посмотреть сообщение
но ведь существуют всякие методы разрешения коллизий.
Безусловно, но не помешает сразу воспользоваться более "разборчивым" алгоритмом, хотя бы тем же CRC32.
0
go
Эксперт С++
3639 / 1371 / 243
Регистрация: 16.04.2009
Сообщений: 4,527
05.05.2013, 16:49 8
Цитата Сообщение от Nick Alte Посмотреть сообщение
система поиска (словарь, например),
Интересно вот только, как слова хранятся в этом словаре?
0
Эксперт С++
1659 / 1031 / 174
Регистрация: 27.09.2009
Сообщений: 1,945
05.05.2013, 18:37 9
Цитата Сообщение от go Посмотреть сообщение
Интересно вот только, как слова хранятся в этом словаре?
Возможно, вообще не хранятся, а хранится только соответствующая слову информация, в робкой надежде, что хеш-функция окажется достаточно надёжной.
0
go
Эксперт С++
3639 / 1371 / 243
Регистрация: 16.04.2009
Сообщений: 4,527
05.05.2013, 19:05 10
Цитата Сообщение от Nick Alte Посмотреть сообщение
Возможно, вообще не хранятся, а хранится только соответствующая слову информация,
Из расчета, что объем памяти равен бесконечность?
0
Эксперт С++
1659 / 1031 / 174
Регистрация: 27.09.2009
Сообщений: 1,945
07.05.2013, 19:33 11
Цитата Сообщение от go Посмотреть сообщение
Из расчета, что объем памяти равен бесконечность?
Не совсем понял искромётный юмор этого замечания. Когда я реализовывал такую схему, перерасхода памяти, а тем более потребности в бесконечном её объёме не наблюдалось.
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
07.05.2013, 19:33

Заказываю контрольные, курсовые, дипломные и любые другие студенческие работы здесь.

Хэширование строк
Прошу помощи в объяснении задания. "Составить программу для поиска по хэшам данных. Дан текст в...

Хэширование пароля
Добрый вечер. Есть рабочая программа. Необходимо, чтобы пароль добавлялся в базу данных...

Универсальное хэширование
Помогите разобраться с алгоритмом хэширования. Задание построить таблицу идентификаторов Вариант...

MD5 хэширование
Необходимо написать консольное приложение на C++ которое будет хэшировать строку по алгоритму MD5....


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2020, vBulletin Solutions, Inc.