С Новым годом! Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.96/25: Рейтинг темы: голосов - 25, средняя оценка - 4.96
0 / 0 / 0
Регистрация: 08.02.2014
Сообщений: 57

Стеммер Портера: реализация группы окончаний

27.02.2015, 00:46. Показов 5476. Ответов 7
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Не смог придумать более адекватного заголовка, извините.
Схема perfective ground для русского языка, насколько я понял, выглядит так:

Группа 1: в, вши, вшись.
Группа 2: ив, ивши, ившись, ыв, ывши, ывшись.
Окончаниям из группы 1 должна предшествовать буква а или я.

Желанию запихать все в массив строк мешает как раз-таки требование предшествования.

На яве реализация выглядит так:
Java
1
    private static final Pattern PERFECTIVEGROUND = Pattern.compile("((ив|ивши|ившись|ыв|ывши|ывшись)|((?<=[ая])(в|вши|вшись)))$");
Здесь присутствует волшебная конструкция - [ая]

Просьба такая: покидайте идей как можно эту штуку в шарпе реализовать, возможно, есть некий контейнер о котором я не знаю, который позволяет учесть подобного рода вещи? Или я провтыкал момент и в с# есть такая же конструкция?

Опять же извинения, за, возможно, некорректно составленный вопрос.
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
27.02.2015, 00:46
Ответы с готовыми решениями:

Выделение основы слова. Стеммер Портера. Поиск однокоренных слов из файла
Добрый день нужна помощь если алгорит Стеммера Портера на поиск основы слова. Теперь необходимо сделать чтобы поиск шел по файлу: ...

Стеммер Портера
Пытаюсь выделить "корень" слова. Скорее даже просто удалить все суффиксы и окончания. Без баз слов. Естественно нашёл алгоритм стеммера...

Реализация объектов учебного процесса студенческой группы ВУЗА
Конструктор объектов учебного процесса кафедры вуза = студент, группа, преподаватель, журнал посещений, журнал успеваемости, учебный план...

7
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
27.02.2015, 01:40
Staple Stable,
http://tartarus.org/martin/Por... csharp.txt

мм?

стандартной нет, это точно.
0
0 / 0 / 0
Регистрация: 08.02.2014
Сообщений: 57
27.02.2015, 15:11  [ТС]
Не, я ищу какой-нибудь контейнер, куда можно запихать все эти суффиксы, учитывая обязательность предшествования какой-либо буквы.
Чтобы был возможен такой код:
Java
1
String temp = PERFECTIVEGROUND.matcher(rv).replaceFirst("");
То есть просто удаляя последовательности букв одной командой.
0
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
27.02.2015, 17:24
Staple Stable, ну удачи найти, я вам скинул порт этого алгоритма на шарп, ни готовой библиотеки, где он есть, ни тем более библиотеки, где все в одну строчку, на шарпе не существует в природе. Очень рад за джаву, что там это есть.
0
Эксперт .NETАвтор FAQ
 Аватар для Storm23
10425 / 5155 / 1825
Регистрация: 11.01.2015
Сообщений: 6,226
Записей в блоге: 34
27.02.2015, 17:46
Что-то мне кажется, ТС нужен просто регекс.
0
0 / 0 / 0
Регистрация: 08.02.2014
Сообщений: 57
27.02.2015, 18:14  [ТС]
Я не говорю, что мне нужен готовый механизм жеж.

Регекс - хорошо, попробую подумать.
0
Эксперт .NETАвтор FAQ
 Аватар для Storm23
10425 / 5155 / 1825
Регистрация: 11.01.2015
Сообщений: 6,226
Записей в блоге: 34
27.02.2015, 18:17
Лучший ответ Сообщение было отмечено Psilon как решение

Решение

Вот это
C#
1
"((ив|ивши|ившись|ыв|ывши|ывшись)|((?<=[ая])(в|вши|вшись)))$"
Это ж явно регекс. Только вместо &lt; нужно <.
В шарпе регекс реализован в классе Regex.
0
0 / 0 / 0
Регистрация: 08.02.2014
Сообщений: 57
02.03.2015, 06:17  [ТС]
Благодарствую.
Я не сразу понял, вообще о чем шла речь, но- таки допер, спасибо.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
02.03.2015, 06:17
Помогаю со студенческими работами здесь

Студент определяет свой номер N в списке группы. Старосте группы сообщается идентификатор M группы
:cry::cry::cry: Решить задание нужно до 25.11.2018. SOS!!!!!

Обработка окончаний
Здравствуйте. Подскажите, как можно обработать окончание в слове? Предположим, получаю строковую переменную $selectedString, равную...

Поисковик окончаний
Здравствуйте! Есть БД окончаний. Нужно написать программу для поиска окончания слова написанного в Edit. Помогите пожалуйста.

Изменение окончаний
Для программы требуется что бы, например: Пользователь вводит в textbox цифру 1. А рядом стоящий label при этом изменяется на...

Замена окончаний слов
Доброго времени суток уважаемые форумчане! Пишу программу, которая генерирует pdf документы по определенному шаблону. И вот столкнулся с...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru