Форум программистов, компьютерный форум CyberForum.ru

Python: научные вычисления

Войти
Регистрация
Восстановить пароль
 
max314
0 / 0 / 0
Регистрация: 15.12.2014
Сообщений: 10
#1

Оптимизировать код - Python

14.11.2016, 16:09. Просмотров 261. Ответов 1
Метки нет (Все метки)

Здравствуйте!

Помогите оптимизировать код
data_samples состоит из 255 узлов, каждый узел это текст статьи

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
data_list=[]
t0 = time()
err_list=[]
for data_str in data_samples:     
    result = []
    err=[]   
    tokenize=TweetTokenizer()
    plurals=tokenize.tokenize(data_str.decode("utf-8") )
    items = list(range(0, 100))
    l = len(plurals)
    leng = 0
    wnl = WordNetLemmatizer() 
    for word in plurals:
        if wnl.lemmatize(word, 'n') in words.words():
            result.append(word)
        else:
            err.append(word)
        
    data_list.append(' '.join(result))
    err_list.append(' '.join(err))
    k=0
    
    
print("done in %0.3fs." % (time() - t0))
print("OK...")
Вложенный цикл работает очень медленно

Python
1
2
3
4
5
for word in plurals:
        if wnl.lemmatize(word, 'n') in words.words():
            result.append(word)
        else:
            err.append(word)

Заранее спасибо!
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
14.11.2016, 16:09     Оптимизировать код
Посмотрите здесь:

Visual Basic Оптимизировать код
Оптимизировать код Turbo Pascal
C (СИ) Оптимизировать код
Оптимизировать код Delphi
C++ Оптимизировать код
Оптимизировать код Python
Оптимизировать код C#
Delphi Оптимизировать код
Bash Оптимизировать код
C# Оптимизировать код
Оптимизировать код C#
Оптимизировать код C++

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
vrm2
147 / 125 / 27
Регистрация: 03.12.2015
Сообщений: 208
Завершенные тесты: 1
14.11.2016, 21:29     Оптимизировать код #2
Цитата Сообщение от max314 Посмотреть сообщение
Вложенный цикл работает очень медленно
Трудно сказать насколько быстро работают и что возвращают wnl.lemmatize, words.words(), tokenize.tokenize. Скорее всего списки. Попробуйте превратить их в множества, операции in будут выполняться намного быстрее.

Python
1
2
3
4
5
6
words_set = set(words.words()) # вроде не изменяется можно вынести из цикла, заодно превратить в set
for word in set(plurals): # поиск по set()
        if wnl.lemmatize(word, 'n') in words_set: # используется words_set, вынесенный из цикла
            result.append(word)
        else:
            err.append(word)
Yandex
Объявления
14.11.2016, 21:29     Оптимизировать код
Ответ Создать тему
Опции темы

Текущее время: 15:05. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru