9 / 0 / 0
Регистрация: 26.11.2015
Сообщений: 3
1

Библиотека для семантического анализа текстов

26.11.2015, 22:38. Показов 7855. Ответов 5
Метки php (Все метки)

Author24 — интернет-сервис помощи студентам
Всем добра!

В данный момент работаю над проектом, где требуется делать сематический и статестический анализ текстов. Задачи на подобее таких:
  • Удалить из текста стоп слова (разные языки)
  • Посчитать плотность слов или фраз
  • Выявить предложения с причастным оборотом (Passive Voice) и посчить их процентоное соотношение
  • и т.д.
Делать все это руками долго и тяжко, а гугл помоч не смог (или это я не смог). Хочу спросить у сообщества, может быть кто-то может посоветовать дельную библиотеку для подобных вещей?
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
26.11.2015, 22:38
Ответы с готовыми решениями:

Программа для семантического анализа и аннотации музыки
Добрый вечер, друзья! В программировании - я полный ноль (знанию только названия языков...

Подойдет ли Delphi для написания программы синтаксического и семантического анализа форума?
Задали написать программу которая осуществляет синтаксический и семантический анализ форума, т.е....

Прога для статистического анализа больших текстов
Нужна прога которая будет считать кол-во пробелов,запятых,заглавных букв,точек и всего кол-во слов...

Программа для анализа русских/английских текстов
Уфф, в общем я студент-самоучка, пытаюсь охватить побольше теории, но с практикой дело у меня идёт...

5
285 / 234 / 113
Регистрация: 08.06.2013
Сообщений: 725
04.12.2015, 17:02 2
Удаление запрещенных слов из строки:
PHP
1
2
3
4
5
$str = 'текст стоп текст текст слово';
$stop = array('стоп','слово');
 
$result = str_replace($stop,'',$str);
echo $result;
0
9 / 0 / 0
Регистрация: 26.11.2015
Сообщений: 3
04.12.2015, 17:43  [ТС] 3
Эм, сасибо кшно. Но языков 9-ть. Вы выписали 4-ре стоп слова, это даже не 5-я часть. До этого я и сам догодался).
0
285 / 234 / 113
Регистрация: 08.06.2013
Сообщений: 725
04.12.2015, 18:38 4
Padd1ngtOn, Ну если будут 9 языков, значит составьте 9 массивов со стоп-словами на разных языках и обрабатывайте ими соответствующие тексты. В чем проблема? Пусть скрипт работает в Utf-8, если тексты берутся из файлов и у них разные кодировки, то делайте перекодировку в utf-8, когда будете читать файл в строку.
0
9 / 0 / 0
Регистрация: 26.11.2015
Сообщений: 3
04.12.2015, 18:54  [ТС] 5
Проблема в том, что я в примере привел всего 4-ре задачи. Буквально для примера. У меня таких подзадачь ДЕСЯТКИ: лемантизация, стемминг, обратное индексирование, семантический разбор текстов.... список очень долгий. Мне нужно для СОКРАЩЕНИЯ ВРЕМЕНИ найти ГОТОВОЕ КОМПЛЕКСНОЕ РЕШЕНИЕ, или собирать его по частям из УЖЕ ГОТОВЫХ либ.

От предложенного вами кусочка решения ни холодно ни жарко.

Мне нужен был примерно такой ответ:
1. https://github.com/yooper/php-text-analysis
2. https://github.com/DaveChild/Text-Statistics

Это то что я нашело, и эти две либы ссократили мне рабьты недели на 3, если бы я это руками сам делал поседел бы. ТРИ НЕДЕЛИ РАБОТЫ, КАРЛ!!! Но их мало, нет и половины от искомого.

Так понятнее?)
0
285 / 234 / 113
Регистрация: 08.06.2013
Сообщений: 725
04.12.2015, 19:23 6
Padd1ngtOn, Ну так ищите тогда и в других языках программирования, а не только php, например в си или яве, там думаю больше будет решений
0
04.12.2015, 19:23
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
04.12.2015, 19:23
Помогаю со студенческими работами здесь

Прога для статистического анализа больших текстов
выдает ошибку при открытии файла _Str было 0x1110112. #include <iostream> #include <stdio.h>...

Библиотека для анализа файла перетаскиванием
Здравствуйте, прошу помощи в поиске таковой библиотеки. Чтобы можно было в окно программы...

Обработка текстов: Элементы Лексического анализа
Помогите пожалуйста с лабораторной.. 1.Надо разработать программу,которая выполняет частичный...

Возникли трудности с исправлением ошибок в программе анализа текстов
Здравствуйте, прошу помощи у гуру Delphi! Для курсовой взяла программу "Анализ текстов" которая...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru