|
180 / 85 / 10
Регистрация: 13.02.2010
Сообщений: 318
|
||||||
.NET 4.x Процентная похожесть двух слов01.02.2012, 14:42. Показов 11031. Ответов 8
Метки нет (Все метки)
Собственно сабж.
Не могу придумать алгоритм для сравнения двух слов разной длины и получить процент их схожести. Вручную на листике можно запросто,к примеру: слово - олово - 80% схожести слово - корова - 55% схожести А вот как это сделать программным путём? Проверяю схожесть по вхождению символов одного слова в другом. Вот пока до чего дошёл,но это не совсем правильно,можно сказать вообще
0
|
||||||
| 01.02.2012, 14:42 | |
|
Ответы с готовыми решениями:
8
Похожесть двух карт Сравнить похожесть двух строк игнорируя служебные символы
|
|
180 / 85 / 10
Регистрация: 13.02.2010
Сообщений: 318
|
||
| 01.02.2012, 14:50 [ТС] | ||
|
Ну я посчитал количество букв, которое есть в обоих словах.Нашёл их процентное составляющее для каждого слова в отдельности,а потом нашёл средний процент из двух, ранее найденных, значений. Я знаю,что это не правильно,но по-другому вообще не знаю как. Алгоритм Шинглов не подходит - он для строк.
0
|
||
|
|
|
| 01.02.2012, 15:51 | |
|
в голову приходит только что-то типа баллов:
за каждую общую букву - 1 балл за каждую общую букву после другой общей - 3 балла за каждую общую букву после другой общей, при этом они соседние - 5 баллов. вот и придется подсчитать каждый для конкретной пара, а также найти максимум схожести. потом поделить. хотя кривовато будет. надо определиться с критериями похожести
1
|
|
|
136 / 104 / 9
Регистрация: 30.01.2011
Сообщений: 699
|
|
| 01.02.2012, 15:56 | |
|
Вопрос собственно ЗАЧЕМ?
Я понимаю, нужно, очень часто при взаимодействии с пользователем через текст, обрабатывать возможность опечаток-ошибок. Но тут?
0
|
|
|
180 / 85 / 10
Регистрация: 13.02.2010
Сообщений: 318
|
||
| 01.02.2012, 16:05 [ТС] | ||
|
Хочу сделать систему выбора правильного варианта с последующим анализом частоты выбора одного из двух вариантов. А для этого мне нужно знать насколько эти два слова похожи,чтобы предоставлять пользователю возможность выбора или нет.Ну как-то.Объясняю плохо,если что извините.
0
|
||
|
|
|
| 01.02.2012, 16:12 | |
|
вообще насколько видно задача довольно старая и фундамент заложен давно, ведь по сути алгоритм используется в spell-cheker-ах
советую посмотреть статью http://habrahabr.ru/blogs/algorithm/114997/, там есть реализация на java. На c# переписать, я думаю, не составит труда и если не пугает английский http://stackoverflow.com/q/2294915/272742
1
|
|
|
180 / 85 / 10
Регистрация: 13.02.2010
Сообщений: 318
|
|||
| 01.02.2012, 16:14 [ТС] | |||
|
Заключается в чём: Есть "корова" и "слово", нужно брать с первого слова первую пару букв т.е. "ко" и смотреть,есть ли вхождения этой пары или нет в "слово",если нет,то брать следующую пару,т.е. "ор" и т.д. Когда находим вхождение (это будет "ов"), запоминаем позицию, берём следующую пару букв с первого слова "ва" и с УЖЕ известной позиции смотрим, есть ли там также эта пара,если нет,то вхождение равно 2 (два символа),если дальше есть допустим в примере "слово-олово",то вхождение равно 4. Считаем проценты вхождений: корова - 2 - 33% слово - 2 - 40% Общий процент схожести будет 36.5% В случае "слово-олово" будет 80%. Как идея? Добавлено через 1 минуту
0
|
|||
| 01.02.2012, 16:14 | |
|
Помогаю со студенческими работами здесь
9
Сравнить эти списки на «похожесть»
Посчитать общее количество слов и определить, сколько слов в этом тексте состоит из двух символов Процентная вероятность Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2).
Унарный минус обозначается как !
*/
#include <iostream>
#include <stack>
#include <cctype>. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|