0 / 0 / 0
Регистрация: 10.01.2018
Сообщений: 4
1

Реализация алгоритма Apriori на Python 3

30.06.2018, 13:52. Показов 5460. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
HELP!!! Уже который раз я прошу помощи у гуру-программистов, так как самой уже хочется
На этот раз это совершенно "чужой" для меня язык программирования - Python (версия 3.6)
Ладно, перейдем к сути: нужно написать программу, которая будет реализовывать алгоритм Apriori.

Честно пыталась понять уже реализованные программы, которые есть на просторах Интернета, но они все написаны на Python 2, вследствие чего возникла проблема с несовместимость версий.

Конечно было бы здорово, если бы еще была визуализация конечного результата, но мне хватит и самого алгоритма
p.s. кстати, думаю многим было бы интересно посмотреть эту реализацию, например таким же чайникам, как я
0
Лучшие ответы (1)
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
30.06.2018, 13:52
Ответы с готовыми решениями:

Реализация алгоритма DFS (поиск в глубину)на python для нахождения всех компонент связности
Здравствуйте, для решения задачи необходимо найти все компоненты связности графа(граф представлен в...

Алгоритм Apriori
По заданию нужно было найти и разобраться с реализацией алгоритма Apriori, построить ассоциативные...

Реализация А* алгоритма
Здравствуйте! Возникли проблемы с пониманием данной практической работы. Буду рад любой помощи....

Реализация А* алгоритма
Здравствуйте! Возникли проблемы с пониманием данной практической работы. Как реализовать этот...

Реализация алгоритма
Уважаемые форумчане, помогите, пожалуйста, с реализацией алгоритма на VBA Действия производятся...

2
1291 / 908 / 479
Регистрация: 05.12.2013
Сообщений: 3,073
30.06.2018, 14:36 2
Лучший ответ Сообщение было отмечено Big_Sister как решение

Решение

Вот отсюда https://github.com/asaini/Apriori, код подправлен под python 3

Кликните здесь для просмотра всего текста
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
import sys
 
from itertools import chain, combinations
from collections import defaultdict
from optparse import OptionParser
 
 
def subsets(arr):
    """ Returns non empty subsets of arr"""
    return chain(*[combinations(arr, i + 1) for i, a in enumerate(arr)])
 
 
def returnItemsWithMinSupport(itemSet, transactionList, minSupport, freqSet):
        """calculates the support for items in the itemSet and returns a subset
       of the itemSet each of whose elements satisfies the minimum support"""
        _itemSet = set()
        localSet = defaultdict(int)
 
        for item in itemSet:
                for transaction in transactionList:
                        if item.issubset(transaction):
                                freqSet[item] += 1
                                localSet[item] += 1
 
        for item, count in localSet.items():
                support = float(count)/len(transactionList)
 
                if support >= minSupport:
                        _itemSet.add(item)
 
        return _itemSet
 
 
def joinSet(itemSet, length):
        """Join a set with itself and returns the n-element itemsets"""
        return set([i.union(j) for i in itemSet for j in itemSet if len(i.union(j)) == length])
 
 
def getItemSetTransactionList(data_iterator):
    transactionList = list()
    itemSet = set()
    for record in data_iterator:
        transaction = frozenset(record)
        transactionList.append(transaction)
        for item in transaction:
            itemSet.add(frozenset([item]))              # Generate 1-itemSets
    return itemSet, transactionList
 
 
def runApriori(data_iter, minSupport, minConfidence):
    """
    run the apriori algorithm. data_iter is a record iterator
    Return both:
     - items (tuple, support)
     - rules ((pretuple, posttuple), confidence)
    """
    itemSet, transactionList = getItemSetTransactionList(data_iter)
 
    freqSet = defaultdict(int)
    largeSet = dict()
    # Global dictionary which stores (key=n-itemSets,value=support)
    # which satisfy minSupport
 
    assocRules = dict()
    # Dictionary which stores Association Rules
 
    oneCSet = returnItemsWithMinSupport(itemSet,
                                        transactionList,
                                        minSupport,
                                        freqSet)
 
    currentLSet = oneCSet
    k = 2
    while(currentLSet != set([])):
        largeSet[k-1] = currentLSet
        currentLSet = joinSet(currentLSet, k)
        currentCSet = returnItemsWithMinSupport(currentLSet,
                                                transactionList,
                                                minSupport,
                                                freqSet)
        currentLSet = currentCSet
        k = k + 1
 
    def getSupport(item):
            """local function which Returns the support of an item"""
            return float(freqSet[item])/len(transactionList)
 
    toRetItems = []
    for key, value in largeSet.items():
        toRetItems.extend([(tuple(item), getSupport(item))
                           for item in value])
 
    toRetRules = []
    largeSet.pop(list(largeSet.keys())[0])
    for key, value in largeSet.items():
        for item in value:
            _subsets = map(frozenset, [x for x in subsets(item)])
            for element in _subsets:
                remain = item.difference(element)
                if len(remain) > 0:
                    confidence = getSupport(item)/getSupport(element)
                    if confidence >= minConfidence:
                        toRetRules.append(((tuple(element), tuple(remain)),
                                           confidence))
    return toRetItems, toRetRules
 
 
def printResults(items, rules):
    """prints the generated itemsets sorted by support and the confidence rules sorted by confidence"""
    for item, support in sorted(items, key=lambda item: item[1]):
        print ("item: %s , %.3f" % (str(item), support))
    print ("\n------------------------ RULES:")
    for rule, confidence in sorted(rules, key=lambda rule: rule[1]):
        pre, post = rule
        print ("Rule: %s ==> %s , %.3f" % (str(pre), str(post), confidence))
 
 
def dataFromFile(fname):
        """Function which reads from the file and yields a generator"""
        file_iter = open(fname, 'rU')
        for line in file_iter:
                line = line.strip().rstrip(',')                         # Remove trailing comma
                record = frozenset(line.split(','))
                yield record
 
 
if __name__ == "__main__":
 
    optparser = OptionParser()
    optparser.add_option('-f', '--inputFile',
                         dest='input',
                         help='filename containing csv',
                         default=None)
    optparser.add_option('-s', '--minSupport',
                         dest='minS',
                         help='minimum support value',
                         default=0.15,
                         type='float')
    optparser.add_option('-c', '--minConfidence',
                         dest='minC',
                         help='minimum confidence value',
                         default=0.6,
                         type='float')
 
    (options, args) = optparser.parse_args()
 
    inFile = None
    if options.input is None:
            inFile = sys.stdin
    elif options.input is not None:
            inFile = dataFromFile(options.input)
    else:
            print ('No dataset filename specified, system with exit\n')
            sys.exit('System will exit')
 
    minSupport = options.minS
    minConfidence = options.minC
 
    items, rules = runApriori(inFile, minSupport, minConfidence)
 
    printResults(items, rules)


хотя не понятно, как мелкие ошибки помешали вам понять алгоритм
1
0 / 0 / 0
Регистрация: 10.01.2018
Сообщений: 4
01.07.2018, 10:24  [ТС] 3
каким образом можно его распараллелить?
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
01.07.2018, 10:24
Помогаю со студенческими работами здесь

Реализация алгоритма
помогите пожалуйсто написать программу: 1. Реализовать алгоритм Insertion-Sort (сортировка...

Реализация А* алгоритма
Здравствуйте! Получил практическое задание и я в ступоре. Может у вас буду идеии как реализовать...

Реализация алгоритма
Здравствуйте подскажете как реализовать механизм. K=0; K=K+K() Функция K имеет вид...

Реализация алгоритма A *
может кто то с этим сталкивался и может объяснить или поделится с готовым вариантом .Я реалйно тут...

Реализация А* алгоритма
Здравствуйте! Возникли проблемы с пониманием данной практической работы. Как реализовать этот...

Реализация алгоритма
Реализация алгоритма построения Эйлерова цикла для теста: -x^3+12sin(3x )-5x= 0


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2023, CyberForum.ru