Форум программистов, компьютерный форум, киберфорум
Алгоритмы
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.83/6: Рейтинг темы: голосов - 6, средняя оценка - 4.83
 Аватар для Kill100
434 / 299 / 82
Регистрация: 11.12.2010
Сообщений: 1,209

Кластеризация данных

07.01.2016, 14:36. Показов 1129. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Собственно не как не могу понять какой алгоритм подойдёт для такой задачи. Очень желательно не сложный в реализации алгоритм, с приемлемый результатом.
Есть объекты
Code
1
2
3
4
5
Пользователь:
[
"Поисковый запрос":[Список статей сайта на которые перешёл пользователь ({url, заголовок})]
"Поисковый запрос":[Список статей сайта на которые перешёл пользователь]
]
Появилась необходимость разбить пользователей на какие то группы, и предлагать пользователю результаты которые искали пользователи из аналогичной группы
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
07.01.2016, 14:36
Ответы с готовыми решениями:

Кластеризация
Ребят,кто-нибудь может объяснить как найти расстояния смешанных данных? Я изучила метод к-средних для числовых данных,где расстояние...

Спектральная кластеризация
Кто знает где описан алгоритм спектральной кластеризации с примером. Желательно если вы знаете книгу, так как надеюсь там найти другие...

Автоматическая кластеризация текстов
Сижу тут, думаю об алгоритме автоматической кластеризации текстов... но без тематических словарей и без предустановленных возможных...

6
294 / 265 / 48
Регистрация: 09.04.2013
Сообщений: 1,038
08.01.2016, 03:10
Например, для каждой статьи сделать список других статей, на которые переходили, и для каждой пары таких статей добавить счетчик сколько раз такое сочетание встречалось, а пользователю выдавать список из самых частых совпадений таких пар при условии что хотя бы одна статья из списка есть у пользователя в этот раз.
0
 Аватар для Kill100
434 / 299 / 82
Регистрация: 11.12.2010
Сообщений: 1,209
08.01.2016, 14:49  [ТС]
проблема в том что статьи не имеют ссылок в теле. Так как это электронная библиотека.
А делать для каждой список в ручную это более 1кк статей.
0
294 / 265 / 48
Регистрация: 09.04.2013
Сообщений: 1,038
08.01.2016, 19:31
возможно я неправильно понял вводные данные
я понял так:
- для каждого пользователя у нас список "сессий"
- каждая "сессия" представляет собой список статей, посещенных после введения поискового запроса, ну или список статей, которые он выбрал в списке выдаче по какому-то поисковому запросу.

Уточните если ошибаюсь
0
 Аватар для Kill100
434 / 299 / 82
Регистрация: 11.12.2010
Сообщений: 1,209
08.01.2016, 20:00  [ТС]
Да именно так. Есть пользователи, каждый имеет список запросов, в запросе содержится сам запрос и список статей/аннотаций на которые перешёл пользователь по этому запросу.
0
294 / 265 / 48
Регистрация: 09.04.2013
Сообщений: 1,038
10.01.2016, 03:58
Например в БД добавить таблицу
(статья1, статья2, количество)
Увеличивать "количество" на единицу для всех пар статей, которые пользователь открывал в рамках одного запроса.
Потом когда кто-то смотрит какую-то статью соответственно найти, например, топ 5 связанных статей.
1
2628 / 1640 / 266
Регистрация: 19.02.2010
Сообщений: 4,353
10.01.2016, 21:41
Коллаборативная фильтрация, не?
Щас во многих универсальных CMSках есть такой модуль (в Друпале, например). При построении интернет-магазина выводит "с этим товаром также покупали ...".
В качестве учебник - переводная книга Тоби Сегарана, там как раз про разные задачи для инет-приложений.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
10.01.2016, 21:41
Помогаю со студенческими работами здесь

Кластеризация бинарных векторов
Здравствуйте! Я тут недавно и пока что не знаю, как лучше задавать вопросы,но очень нужно разобраться как сделать задачку. У меня есть...

Кластеризация с использованием карт Кохонена
Реализовывал ли кто-нибудь подобную программу? Буду благодарен за код. Или за совет.

Кластеризация двумерных данных
1. кластеризации данных df=50; число эпох,через которое обновляются данные на графике в процессе самообучения me=1000; число эпох...

Кластеризация и Хранилище данных iSCSI
Доброго времени суток. Встал жёсткий вопрос. Необходимо построить кластеризацию + хранилище данных, т.к. в эти дебри я ещё не лез, ...

Кластеризация данных с использованием алгоритма O-cluster
Дело вот в чем. Перед тем как начать делать свою лабораторную работу мне надо сдать "Полное Описание" этой лабораторной работы. Я...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит переходные токи и напряжения на элементах схемы. . . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru