Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.63/121: Рейтинг темы: голосов - 121, средняя оценка - 4.63
0 / 0 / 0
Регистрация: 18.10.2018
Сообщений: 3

Частотность N-грамм

18.10.2018, 19:52. Показов 22932. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
N-грамма — это N соседних слов в одном предложении. 2-граммы называют биграммами. 3-граммы — триграммами.

Например, из текста: "She stood up. Then she left." можно выделить следующие биграммы "she stood", "stood up", "then she" и "she left", но не "up then". И две триграммы "she stood up" и "then she left", но не "stood up then".

По списку предложений, составленному в прошлой задаче, составьте словарь самых частотных продолжений биграмм и триграмм. Это словарь, ключами которого являются все возможные начала биграмм и триграмм, а значениями — их самые частотные продолжения.

Более формально так:

Для каждой пары (key, value) из словаря должно выполняться одно из следующих условий:

В тексте есть хотя бы одна биграмма (key, value), и для любой другой присутствующей в тексте биграммы (key, otherValue), начинающейся с того же слова, value должен быть лексикографически меньше otherValue.

Либо в тексте есть хотя бы одна триграмма (w1, w2, value), такая что w1 + " " + w2 == key и для любой другой присутствующей в тексте триграммы (w1, w2, otherValue), начинающейся с той же пары слов, value должен быть лексикографически меньше otherValue.

Вот мой код, но когда проходит тест выводит ошибка, что нужно исправить?
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
using System;
using System.Collections.Generic;
using System.Linq;
 
namespace TextAnalysis
{
    static class FrequencyAnalysisTask
    {
        public static Dictionary<string, string> GetMostFrequentNextWords(List<List<string>> text)
        {
            Dictionary<string, Dictionary<string, int>> couple = new Dictionary<string, Dictionary<string, int>>();
            foreach (List<string> sentences in text)
            {
                for (int i = 0; i < sentences.Count - 1; i++)
                {
                    if (couple.ContainsKey(sentences[i]))
                    {
                        if (couple[sentences[i]].ContainsKey(sentences[i + 1]))
                            if (couple[sentences[i + 1]].ContainsKey(sentences[i + 2]))
                            {
                                couple[sentences[i]][sentences[i + 1]]++;
                                couple[sentences[i+1]][sentences[i + 2]]++;
                            }
                            else 
                                couple[sentences[i]][sentences[i + 1]]++;
                    }
                    else
                    {
                        couple[sentences[i]] = new Dictionary<string, int> { { sentences[i + 1], 1 } };
                    }
                }
            }
 
            Dictionary<string, string> result = new Dictionary<string, string>(couple.Count);
 
            foreach (var item in couple)
            {
                result.Add(item.Key, item.Value.OrderByDescending(x => x.Value).ThenBy(s => s.Key, StringComparer.Ordinal).First().Key);
            }
 
            return result;
        }
    }
}
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
18.10.2018, 19:52
Ответы с готовыми решениями:

Частотность букв
Добрый день. Необходимо реализовать получение частотности букв из входящей строки. Т.е. % соотношение употребление буквы в конкретном...

частотность запросов
Надо формализовать понятия : выскочастотный запрос, среднечастотны и низкочастотный. По каким критериям делить ?

Частотность запросов
Скажите, какие запросы счтиаются НЧ какие СЧ какие ВЧ ?

3
0 / 0 / 0
Регистрация: 16.02.2019
Сообщений: 7
26.03.2019, 12:55
Если до сих пор актуально, то нашел ошибку в вашем решении
0
0 / 0 / 0
Регистрация: 01.12.2016
Сообщений: 12
05.04.2020, 14:22
Актуально

Добавлено через 1 минуту
Цитата Сообщение от creepyman Посмотреть сообщение
Если до сих пор актуально, то нашел ошибку в вашем решении
Актуально
0
0 / 0 / 0
Регистрация: 05.06.2020
Сообщений: 1
28.06.2020, 14:13
Так а в чем ошибка?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
28.06.2020, 14:13
Помогаю со студенческими работами здесь

Частотность слов в word
Здравствуйте, уважаемые программисты! Нуждаюсь в Вашей доброй помощи. Моей девушке (лингвисту-переводчику) на последнем курсе ввели новую...

Определить частотность символов текста
Само задание: Дан файл F, контентом которого является текст. Определить частотность всех символов текста. #include &lt;iostream&gt; ...

Определить частотность слов входного текста
Нужно вывести все различные слова из входного потока, отсортированные в порядке убывания частоты употребления. Слова с количеством...

Как определять частотность поисковых запросов ?
Подскажите плиз, как определять частотность поисковых запросов в яндексе, и их стоимость ? Есть ли какая нибудь схема для определения...

Разбить строку на слова, найти их частотность, отсортировать по алфавиту
&quot;Дана последовательность, содержащая до 5 слов, в каждом из которых до 5 строчных латинских букв; между соседними словами — запятая, за...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Как я обхитрил таблицу Word
Alexander-7 21.03.2026
Когда мигает курсор у внешнего края таблицы, и нам надо перейти на новую строку, а при нажатии Enter создается новый ряд таблицы с ячейками, то мы вместо нервных нажатий Энтеров мы пишем любые буквы. . .
Krabik - рыболовный бот для WoW 3.3.5a
AmbA 21.03.2026
без регистрации и смс. Это не торговля, приложение не содержит рекламы. Выполняет свою непосредственную задачу - автоматизацию рыбалки в WoW - и ничего более. Однако если админы будут против -. . .
Программный отбор значений справочника
Maks 21.03.2026
Установка программного отбора значений справочника "Сотрудники" из модуля формы документа. В качестве фильтра для отбора служит предопределенное значение перечислений. Процедура. . .
Переходник USB-CAN-GPIO
Eddy_Em 20.03.2026
Достаточно давно на работе возникла необходимость в переходнике CAN-USB с гальваноразвязкой, оный и был разработан. Однако, все меня терзала совесть, что аж 48-ногий МК используется так тупо: просто. . .
Оттенки серого
Argus19 18.03.2026
Оттенки серого Нашёл в интернете 3 прекрасных модуля: Модуль класса открытия диалога открытия/ сохранения файла на Win32 API; Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru