Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 05.12.2015
Сообщений: 1

Алгоритм Витерби

05.12.2015, 16:25. Показов 3537. Ответов 0
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Дорогие форумчане!

Помогите разобраться с кодом, где алгоритм Витерби используется для поиска лучшей пары слово/тег. Пытаюсь понять и сам алгоритм, и код, но что-то совсем запуталась. Прошу помощи

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
# This function takes data to tag (brown_dev_words), a set of all possible tags (taglist), a set of all known words (known_words),
# trigram probabilities (q_values) and emission probabilities (e_values) and outputs a list where every element is a tagged sentence 
# (in the WORD/TAG format, separated by spaces and with a newline in the end, just like our input tagged data)
# brown_dev_words is a python list where every element is a python list of the words of a particular sentence.
# taglist is a set of all possible tags
# known_words is a set of all known words
# q_values is from the return of calc_trigrams()
# e_values is from the return of calc_emissions()
# The return value is a list of tagged sentences in the format "WORD/TAG", separated by spaces. Each sentence is a string with a 
# terminal newline, not a list of tokens. Remember also that the output should not contain the "_RARE_" symbol, but rather the
# original words of the sentence!
def viterbi(brown_dev_words, taglist, known_words, q_values, e_values):
    
    tagged = []
    
    pi = defaultdict(float)
    bp = {}
    bp[(-1,'*','*')] = '*'
    pi[(-1,'*','*')] = 0.0
    
    for line in brown_dev_words:    
        tokens = [w if w in known_words else '_RARE_' for w in line]
        tokens = tokens
        
                # k = 1 case
        for w in taglist:
            pi[(0, '*', w)] = pi[(-1,'*','*')] + q_values.get(('*', '*', w), -1000) + e_values.get((tokens[0], w), -1000)
            bp[(0, '*', w)] = '*'
 
        # k = 2 case
        for (w, u) in itertools.product(taglist, taglist):
            key = ('*', w, u)
            pi[(1, w, u)] = pi.get((0, '*', w), -1000) + q_values.get(key, -1000) + e_values.get((tokens[1], u), -1000)
            bp[(1, w, u)] = '*' 
 
        # k >= 2 case
        for k in range (2, len(tokens)):
            for (u, v) in itertools.product(taglist, taglist):
                max_prob = -float('Inf')
                max_tag = ""
                for w in taglist:
                    score = pi.get((k-1, w, u), -1000) + q_values.get((w,u,v), -1000) + e_values.get((tokens[k], v), -1000)
                    if(score > max_prob):
                        max_prob = score
                        max_tag = w
                bp[(k,u,v)] = max_tag
                pi[(k,u,v)] = max_prob
                
        max_prob = -float('Inf')
 
        #finding the max probability of last two tags
        for (u,v) in itertools.product(taglist, taglist):
            score = pi.get((len(line)-1, u, v),-1000) + q_values.get((u,v,'STOP'),-1000) 
            if score >  max_prob:
                max_prob = score
                u_max = u
                v_max = v
 
        #append tags in reverse order
        tags = []
        tags.append(v_max)
        tags.append(u_max)
        count = 0
        
        for k in range(len(line) - 3, -1, -1):
            tags.append(bp[(k + 2, tags[count+1], tags[count])])
            count +=1
        tagged_sentence = ""
 
        #reverse tags
        tags.reverse()
 
                #stringify tags paired with word without start and stop symbols
        for k in range(0, len(line)):
            tagged_sentence = tagged_sentence + line[k] + "/" + str(tags[k]) + " "
        
        tagged_sentence += "\n"
        tagged.append(tagged_sentence)
        
    return tagged
Заранее спасибо большое за помощь!
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
05.12.2015, 16:25
Ответы с готовыми решениями:

Декодер Витерби
Необходимо доработать декодер Витерби, так как он работает не совсем корректно. Настоящий декодер Витерби делает выбор в пользу кодового...

Алгоритм Витерби
Нужно реализовать алгоритм свёрточного кодирования и алгоритм декодирования на основе ММП. Описание свёрточного алгоритма: Для начала...

Сверточное кодирование. Алгоритм Витерби
Никак не могу исправить ошибки в своей программе дипломного проекта. А сдавать уже очень скоро на следующей неделе а ошибок много. Помогите...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
05.12.2015, 16:25
Помогаю со студенческими работами здесь

Декодер Витерби
Появилась задача написать декодер сверточных кодов на С#. Выбрал алгоритм декодирования Витерби. Прошу поделится ссылками, если таковые...

Декодер Витерби
Доброе время суток! Интересует реализация алгоритма декодирования Витерби на Java. Нужно для курсовой работы. Благодарю =)

Декодер Витерби
Здравствуйте. Написал декодер для сверточного кода памяти 2 и скорости 1/2 (5,7) на языке си. Руководитель поставил под сомнение...

Декодер Витерби
Привет Всем, может кто объяснить принцип построение Графа декодера витерби. как он строится.

Моделирование декодера Витерби
Это декодер Витерби, основанный на soft decision, для длины ограничения (constraint length ) 7. Код кодируется со скоростью 1/2 с помощью...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru