Форум программистов, компьютерный форум, киберфорум
Искусственный интеллект
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.50/6: Рейтинг темы: голосов - 6, средняя оценка - 4.50
0 / 0 / 0
Регистрация: 25.01.2017
Сообщений: 6
1

Нахождение фраз одного семантического смысла

19.12.2018, 14:21. Показов 1079. Ответов 3

Привет!
У меня есть документ в формате .doc в котором различное содержимое - тексты, таблицы и тд. Для работы с word файлами я использую библиотеку python-docx.
Мне нужно написать программу которая находит в этом документе фразу с определенным семантическим смыслом.
Например:
find('Дополнительные сведения')
Найденные совпадения: 'Дополнительная информация', 'Вспомогательные данные', 'Добавочные знания'.

Что мне нужно сделать для этого? Использовать методы машинного обучения? WordEmbeddings, Word2Vec?
Спасибо.
0

Помощь в написании контрольных, курсовых и дипломных работ здесь.

Лучшие ответы (1)
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
19.12.2018, 14:21
Ответы с готовыми решениями:

Нахождение фраз одного семантического смысла
Привет! У меня есть документ в формате .doc в котором различное содержимое - тексты, таблицы и тд....

Что может быть из-за использования одного семантического ядра на 3-х сайтах?
Что может быть из-за использования одного семантического ядра на 3-х сайтах?Как ПС к этому...

Оптимизировать алгоритм поиска двух одинаковых фраз, в массиве фраз
Всем привет! Может кто подскажет, как оптимизировать алгоритм поиска 2-х одинаковых фраз, в...

Нахождение количества столбцов матрицы, не содержащих ни одного нулевого элемента, и максимального числа, встречающихся более одного раза.
Ребята очень нужна помощь, срочно надо сдать индивидуалку две задачки не получилось сделать...

3
117 / 37 / 9
Регистрация: 29.10.2016
Сообщений: 228
19.12.2018, 16:26 2
Семантика бывает очень сложной. Например можно собрать в файл теоремы типа Ферма, гипотезу Пуанкаре, фразы типа "на марсе есть жизнь", "биткойн упадет 11 февраля" и потом попросить найти "Истина". Системе придется решить все эти вопросы чтобы найти с указанным смыслом.

Простую можно искать через тезаурус.
0
450 / 351 / 46
Регистрация: 20.09.2014
Сообщений: 2,174
19.12.2018, 18:26 3
Лучший ответ Сообщение было отмечено Nivels как решение

Решение

Для машинного обучения нужны большие размеченные обучающие датасеты. При этом эти датасеты не должны содержать четкую информацию типа "дополнительная информация = добавочные сведения", в них наоборот информация с взаимосвязями статистического характера и с большим количеством повторений. То есть не подходит.

Выделение семантики из текста вам не требуется, это вы зря будете решать сложнейшую задачу, а вам оно и не требуется. А вот, например, использование словаря синонимов даст простое решение, работающее в 60-90%.
2
0 / 0 / 0
Регистрация: 25.01.2017
Сообщений: 6
20.12.2018, 06:23  [ТС] 4
Всем большое спасибо за ответы! Действительно в данном случае система машинного обучения будет overkill. Лучше либо "захардкодить" все возможные варианты искомой фразы, либо использовать словарь синонимов.
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
20.12.2018, 06:23

Заказываю контрольные, курсовые, дипломные работы и диссертации здесь.

Объяснить нахождение одного простейшего интеграла
Добрый вечер, форумчане. Уже довольно-таки долго бьюсь с этим интегралом: сначала не могла понять,...

Нахождение кратных чисел из одного большого числа
Дамы и господа ... Информатика , 9-ый класс ... Задали создать программу в паскале ... она...

Составление семантического ядра
День добрый уважаемые форумчане. Мне нужно составить семантическое ядро для большого проекта, с...

Создание семантического ядра
Здравствуйте. Есть лендинг, которому надо создать семантическое ядро, SEO я вообще никогда не...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2021, vBulletin Solutions, Inc.