Форум программистов, компьютерный форум, киберфорум
STATISTICA
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 08.06.2016
Сообщений: 1

Text mining (добыча данных)

08.06.2016, 13:16. Показов 1357. Ответов 0
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток!

Столкнулась с такой проблемой:
Есть некоторое количество документов. В основном там русский текст, но кое-где попадаются английские слова в текстах.
Так вот нужно проанализировать эти документы и найти только те, которые относятся к продаже определенной услуги.
Воспользовалась Текстовым анализом text mining 10 версии Статистики.
Проблема в том, что при анализе после индексации получается список только из английских слов...Т.е. text mining ищет в текстах только английские слова,а на русские внимание не обращает. Хотя в настройках самого анализа стоит русский стоп лист и Stemming language указан русский.
Подскажите. пожалуйста, что нужно сделать, что text mining брал в анализ русские слова?

Заранее спасибо!
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
08.06.2016, 13:16
Ответы с готовыми решениями:

Python Text-mining
Доброго времени суток! Передо мной стоит задача определить образ России по социальным сетям. Для этого я принялся парсить твитер. С...

Mining FaceBook Data и сохранить в локальной базе данных mysql
Всем здравствуйте. Возникла проблема, с которой не могу справиться. Не могли бы объяснить мне, что такое Facebook API и с чем его едят. Я в...

результат выборки из БД: rs.next(); String text=rs.getString('text'); <input type=text name=name value=<%=text%>>
Возникла проблема в текстовое поле надо вывести результат выборки из БД rs.next(); String text=rs.getString('text'); &lt;input...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
08.06.2016, 13:16
Помогаю со студенческими работами здесь

База данных с++ "Добыча угля" (Отчет по практике)
Доброго времени суток! Люди помогите создать базу данных по добыче угля,производственная практика уже заканчивается а программы нет(незнаю...

Добыча из URL
У меня url такого вида http://saitotot.com/page.php/id1. Как мне добыть цифру 1 или которая там . Вот такое не выходит if...

Добыча золота в варкрафт
Заданное количество юнитов добывают золото равными порциями из одной шахты, задерживаясь в пути на случайное время, до ее истощения. ...

Люди! Помогите разобраться с записью большого объема данных в поле с типом данных text
Дело в том, что мне нужно записать в поле с типом text XML-документ. Но проблема состоит в том, что этот XML может быть оч. большого...

Динамическое создание текстблока и добыча его содержимого
Всем привет. Я программно создаю TextBlock, мне надо узнать его &quot;id&quot; при клике, тк в будущем надо будет работать с этим. Я добавил...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Автозаполнение реквизита при выборе элемента справочника
Maks 27.03.2026
Программный код из решения ниже на примере нетипового документа "ЗаявкаНаРемонтСпецтехники" разработанного в конфигурации КА2. При выборе "Спецтехники" (Тип Справочник. Спецтехника), заполняется. . .
Сумматор с применением элементов трёх состояний.
Hrethgir 26.03.2026
Тут. https:/ / fips. ru/ EGD/ ab3c85c8-836d-4866-871b-c2f0c5d77fbc Первый документ красиво выглядит, но без схемы. Это конечно не даёт никаких плюсов автору, но тем не менее. . . всё может быть. . .
Автозаполнение реквизитов при создании документа
Maks 26.03.2026
Программный код из решения ниже размещается в модуле объекта документа, в процедуре "ПриСозданииНаСервере". Алгоритм проверки заполнения реализован для исключения перезаписи значения реквизита,. . .
Команды формы и диалоговое окно
Maks 26.03.2026
1. Команда формы "ЗаполнитьЗапчасти". Программный код из решения ниже на примере нетипового документа "ЗаявкаНаРемонтСпецтехники" разработанного в конфигурации КА2. В качестве источника данных. . .
Кому нужен AOT?
DevAlt 26.03.2026
Решил сделать простой ланчер Написал заготовку: dotnet new console --aot -o UrlHandler var items = args. Split(":"); var tag = items; var id = items; var executable = args;. . .
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования типового справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной. . .
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru