|
1 / 1 / 0
Регистрация: 06.03.2013
Сообщений: 21
|
||||||
Построение семантической сети - программа для поиска ассоциаций заданному слову в тексте23.09.2013, 21:17. Показов 5775. Ответов 5
Метки нет (Все метки)
В институте задали задачку:
Алгоритм работы семантической сети в режиме обучения 1. Ввести некий текст, содержащий не менее 500 слов. 2. Из текста извлечь все слова и поместить в сеть. 3. Ассоциативным весам сети присвоить значения = 0 4. Запустить текст на обработку весов. 5. Вес между стоящими в тексте рядом словами увеличить на N 6. Вес между стоящими в тексте через одно словами увеличить на N/2 В рабочем режиме программа обработки по введенному слову выдает список ассоциаций, причем первыми в списке выводятся слова с наибольшими весами ассоциаций. На первый взгляд задача простая. Алгоритм работы понятен. Заносим текст в массив, каждый указатель которого указывает на 1 слово в памяти. Ищем совпадения в массиве с заданным словом, и если находим то определяем "вес" рядом стоящих слов. Выводим полный список этих слов и их вес. Когда дело дошло то программирования, я начал спотыкаться об каждую мелочь и с горем накалякал код. Скажу сразу, код - говно. Я долго мучал его, начиная с одной идеи реализации и заканчивая другой. В итоге программа работает, но не со всеми видами текста. С большими кусками текста выбивает ошибку доступа к памяти. Помогите найти ошибку или лучший метод реализации задачи! Вот сам код:
0
|
||||||
| 23.09.2013, 21:17 | |
|
Ответы с готовыми решениями:
5
Построение семантической сети Построение семантической сети из текста Библиотека для семантической сети |
|
1 / 1 / 0
Регистрация: 06.03.2013
Сообщений: 21
|
|
| 23.09.2013, 22:56 [ТС] | |
|
По сути это и есть задача. Преподаватель точно описал что хочет видеть.)
0
|
|
|
435 / 402 / 57
Регистрация: 06.02.2012
Сообщений: 1,384
|
|
| 23.09.2013, 23:48 | |
|
Одно слово может встретиться в тексте несколько раз, т.е. может иметь любое число ассоциативных соседей (более 2). Поэтому я думаю нужно делать матрицу. По х и по у идут сортированные уникальные слова, а в ячейках пишется коэффициент связи между ними.
0
|
|
|
|
|||||||||||
| 25.09.2013, 21:53 | |||||||||||
Сообщение было отмечено SatanaXIII как решение
Решение
Разбирать твой код, честно говоря, желание быстро кончилось.
![]() Поэтому вот реализация, как я ее вижу. Что имеем: анализатор может поглощать тексты и считать "ассоциации" слов, может все это дело запоминать и выдавать статистику по каждому из слов, парсинг текста можно немножко настраивать сепараторами, массив слов, вытащенных из текста, можно править перед анализом и т.д. На больших текстах не спотыкается. ![]() Что можно добавить, так это мозгов. Например, не считать за ассоциации слова, находящиеся в соседнем предложении, или исключить из анализа предлоги и междометия. Экзешник в релизе - Project1_exe.rar Проект - Project1.rar
3
|
|||||||||||
|
1 / 1 / 0
Регистрация: 06.03.2013
Сообщений: 21
|
|
| 26.09.2013, 01:47 [ТС] | |
|
Спасибо большое. Куча новых примочек для меня открыли)) Буду учить!!!
0
|
|
| 26.09.2013, 01:47 | |
|
Помогаю со студенческими работами здесь
6
Программа для поиска в тексте номеров телефона
Что нужно делать для оптимизации поиска по слову? Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Оттенки серого
Argus19 18.03.2026
Оттенки серого
Нашёл в интернете 3 прекрасных модуля:
Модуль класса открытия диалога открытия/ сохранения файла на Win32 API;
Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
|
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога
Финальные проекты на Си и на C++:
finish-rectangles-sdl3-c. zip
finish-rectangles-sdl3-cpp. zip
|
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие.
Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|