Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.55/11: Рейтинг темы: голосов - 11, средняя оценка - 4.55
1 / 1 / 1
Регистрация: 27.01.2015
Сообщений: 77

BigARTM - невозможно вывести список ключевых слов по темам (Topic)

22.05.2019, 07:36. Показов 2201. Ответов 4

Студворк — интернет-сервис помощи студентам
Всем доброго времени суток, я столкнулся с такой проблемой - мне нужно провести тематическое моделирование новостей средствами BigARTM, однако входные данные не попадают на их вывод в формате "topic # - ключевое слово с его весом", например "topic_0 студент 0.8". На этапе вывода мне выпадает следующее сообщение
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-6-5f8d3a85f616> in <module>()
----> 1 for topic_name in model.topic_names:
2 print (topic_name)
3 for (token, weight) in zip(top_tokens.last_tokens[topic_name],
4 top_tokens.last_weights[topic_name]):
5 print (token, '-', round(weight,3))

D:\Anaconda\lib\site-packages\pandas\core\generic.py in __getattr__(self, name)
4370 if self._info_axis._can_hold_identifiers_an d_holds_name(name):
4371 return self[name]
-> 4372 return object.__getattribute__(self, name)
4373
4374 def __setattr__(self, name, value):

AttributeError: 'DataFrame' object has no attribute 'topic_names'

Делаю в Anaconda с версией Python 3.7, сама библиотека установилась и работает
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import artm
batch_vectorizer = artm.BatchVectorizer(data_path="all news.txt", data_format="vowpal_wabbit", target_folder="habrhabr", 
                                       batch_size=100)
batch_vectorizer = artm.BatchVectorizer(data_path='habrhabr',data_format='batches')
T = 6   # количество тем
model_artm = artm.ARTM(num_topics=T, topic_names=["sbj"+str(i) for i in range(T)], class_ids={"text":1})
# число после названия модальностей - это их веса
batch_vectorizer = artm.BatchVectorizer(data_path='habrhabr',data_format='batches')
dictionary = artm.Dictionary(data_path='habrhabr')# загрузка данных в словарь
model = artm.ARTM(num_topics=6,
                  topic_names=["topic_"+str(i) for i in range(T)],
                  num_document_passes=10,#10 проходов по документу
                  dictionary=dictionary,
                  scores=[artm.TopTokensScore(name='top_tokens_score')])
model.fit_offline(batch_vectorizer=batch_vectorizer, num_collection_passes=10)#10 проходов по коллекции
top_tokens = model.score_tracker['top_tokens_score']
model=model.transform(batch_vectorizer=batch_vectorizer, theta_matrix_type= 'dense_theta', predict_class_id=None )
print(model)
for topic_name in model.topic_names:
    print (topic_name)
    for (token, weight) in zip(top_tokens.last_tokens[topic_name],
                               top_tokens.last_weights[topic_name]):    
         print (token, '-', round(weight,3))
Вложения
Тип файла: rar all news.rar (448.0 Кб, 0 просмотров)
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
22.05.2019, 07:36
Ответы с готовыми решениями:

Keywords-Club (Склад Ключевых Слов, Подбор Ключевых Слов, Бесплатные Базы Кеев)
По просьбе одноклубников и по причине запрета регистрации, на этом замечательном форуме, размещаю предложение на вступление в...

Как вывести полный размер тета-матрицы BigARTM
Всем доброго времени суток, я столкнулся со следующей проблемой - мне необходимо вывести тета-матрицу со значениями, определяющими,...

Выявление злоупотреблений Веб-сёрфингом New Topic Reply to Topic
Хочу написать прогу, которая 'втихую' стартует вместе с Виндами, не видна по трём педалям, отслеживает посещаемые с компа УРЛы, и - самое...

4
277 / 226 / 93
Регистрация: 27.06.2016
Сообщений: 639
22.05.2019, 09:24
Python
1
print(model)
что показывает?
0
1 / 1 / 1
Регистрация: 27.01.2015
Сообщений: 77
22.05.2019, 09:31  [ТС]
alex white, он вводит на экран модель, это я делал в качестве проверки - вдруг модель не создалась, но она создаётся исправно
0
277 / 226 / 93
Регистрация: 27.06.2016
Сообщений: 639
22.05.2019, 09:32
Retroman, написано, что это DataFrame, там есть атрибут topic_names?
0
1 / 1 / 1
Регистрация: 27.01.2015
Сообщений: 77
22.05.2019, 09:43  [ТС]
alex white, в модели указано topic_names. Я без понятия, как DataFrame проверить, что там есть.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
22.05.2019, 09:43
Помогаю со студенческими работами здесь

Вывести список слов в порядке убывания количества вхождений слов
Доброго времени суток. Задание такое: вывести на стандартный выходной поток список всех различных слов в файле в порядке убывания...

Ввести массив слов, вывести в документ WORD список слов и статистику букв
Разработать программу, которая запрашивает у пользователя количество слов, которое он хотел бы обработать, после чего создаёт массив...

Плотность ключевых слов или тошнота слов
Доброго времени суток, проанализировал свой сайт данным сервисом &quot;http://seositecheckup.com/&quot; Тошнота одного ключевого слова равна...

Не работает редирект с /topic/# на /topic/#-/
Доброго дня! Как можно перенаправить /topic/# на /topic/#-/ ? Дело в том, что # - любое число, и после него нужно добавить тире и...

Прочитать последовательность слов в список. Если количество слов четно, то тогда создать список из 2-го, 4-го и т.д. слов
Вот условие задачи(В файл занести последовательность слов. Прочитать последовательность слов в список. Если количество слов четно, то тогда...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru