Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.83/6: Рейтинг темы: голосов - 6, средняя оценка - 4.83
1 / 1 / 1
Регистрация: 15.05.2012
Сообщений: 87

Не позволяет сделать больше 256 итераций

25.02.2017, 12:03. Показов 1305. Ответов 9
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Имеется несоклько тысяч файлов, где надо привести все слова в нормальную форму, использую для этого бибилиотеку pymorphy.
Но почему-то выполняя код после 256 итераций(обработанных фалов) выходит такая ошибка:
Traceback (most recent call last):
File "morph.py", line 52, in <module>
File "morph.py", line 22, in GetNormal
File "/usr/local/lib/python2.7/dist-packages/pymorphy/_morph.py", line 684, in get_morph
File "/usr/local/lib/python2.7/dist-packages/pymorphy/_morph.py", line 176, in __init__
File "/usr/local/lib/python2.7/dist-packages/pymorphy/backends/shelve_source/__init__.py", line 27, in load
File "/usr/local/lib/python2.7/dist-packages/pymorphy/backends/shelve_source/__init__.py", line 87, in _get_shelf
File "/usr/local/lib/python2.7/dist-packages/pymorphy/backends/shelve_source/sqlite_shelve.py", line 68, in __init__
File "/usr/local/lib/python2.7/dist-packages/pymorphy/backends/shelve_source/sqlite_shelve.py", line 15, in __init__
sqlite3.OperationalError: unable to open database file
Exception AttributeError: "'SqliteDict' object has no attribute 'conn'" in <bound method SqliteDict.__del__ of <pymorphy.backends.shelve_source.sqlite_ shelve.SqliteDict object at 0x7f9b08a541d0>> ignored

Вот метод GetNormal на котором всё и выходит:
Python
1
2
3
4
5
6
7
8
9
10
def GetNormal(path):
   morph = get_morph('/home/anton/Dictionary/en.sqlite-json')
   f = open(path,'r')
   text = " ".join(f.read().split())
   f.close()
   words = text.split()
   f = open(path,'w')
   for word in words:
      f.write("".join(morph.normalize(word))+" ")
   f.close()
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
25.02.2017, 12:03
Ответы с готовыми решениями:

Есть сгенерированный дайджест текстового файла методом SHA-2(256 битов). Как сделать из 256 битов 512?
Основной код unit Main; interface uses Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms, ...

Какое минимальное количество итераций понадобится чтобы определить случайное число от 0 - до 256?
задание такое: какое минимальное количество итераций понадобится чтобы определить случайное число от 0 - до 256?

Строка больше 256 символов
Нужно вывести на экран строку, прочитанную из файла, но в файле больше чем 256 символов, при использовании String половина текста не...

9
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
25.02.2017, 13:34
trutoxa,
А это не связано с тем, что как указано на сайте разработчика - словари sqlite содержат ошибку?
в sqlite-словарях серьезная ошибка. В разделе для скачивания они пока оставлены в целях совместимости.
0
115 / 92 / 66
Регистрация: 27.04.2014
Сообщений: 307
25.02.2017, 15:10
Цитата Сообщение от Garry Galler Посмотреть сообщение
А это не связано с тем, что как указано на сайте разработчика - словари sqlite содержат ошибку?
Ну, я думал если ошибка в словаре, то ошибка в выполнении программы должна выскакивать в момент приведения слова в нормальную форму, или какого-то определённого слова... А тут я пробовал с совершенно различными данными и всегда все останавливалось именно на 256-ой итерации
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
25.02.2017, 16:14
Цитата Сообщение от Difaust Посмотреть сообщение
пробовал с совершенно различными данными
Какими именно данными? Я пока не очень активно использовал pymorphy, и только на русском языке (то есть без доп. словарей), но никаких проблем при нормализации слов из текстов (с количеством слов более 100 тыс.) не возникало.
А у ТС в trace ошибки явно указывается на sql backend: sqlite3.OperationalError: unable to open database file.

Добавлено через 13 минут
UPD. Кстати, тут еще непонятно кто какую версию юзает. Я - второй pymorphy. А ТС, похоже, первую версию, уже не поддерживаемую.
0
1 / 1 / 1
Регистрация: 15.05.2012
Сообщений: 87
25.02.2017, 20:56  [ТС]
Цитата Сообщение от Garry Galler Посмотреть сообщение
(с количеством слов более 100 тыс.
У меня есть масса текстовых файлов, в которых может быть и больше 100 тыс слов в каждом, тут странность в том, что именно на количество этих файлов ругается.... Если есть возможность, проверь у себя, допустим, на 260 текстовых файлах
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
25.02.2017, 21:14
trutoxa,
Я использую pymorphy2 - там, я уверен, такой проблемы просто нет, поскольку был изменен формат словарей.
Если бы проблема была - на сайте разработчика было бы куча запросов на исправление, так как pymorphy2 применяется многими лингвистами.
0
1 / 1 / 1
Регистрация: 15.05.2012
Сообщений: 87
26.02.2017, 11:08  [ТС]
Цитата Сообщение от Garry Galler Посмотреть сообщение
Я использую pymorphy2
Мне нужен английский язык(
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
26.02.2017, 14:37
Цитата Сообщение от trutoxa Посмотреть сообщение
английский язык
... nltk

Python
1
2
3
4
5
6
import nltk
quote = """three cups, two guns, thousands of bubbles"""
 
wnl = nltk.WordNetLemmatizer()
words = nltk.word_tokenize(quote)
print([wnl.lemmatize(t) for t in words])
0
Фрилансер
 Аватар для Black Fregat
3709 / 2083 / 567
Регистрация: 31.05.2009
Сообщений: 6,683
12.04.2017, 10:25
Может быть, проблема в том, что объект morph создаётся каждый раз заново?
Что, если создать один объект morph глобально?
1
1 / 1 / 1
Регистрация: 15.05.2012
Сообщений: 87
20.04.2017, 19:23  [ТС]
Цитата Сообщение от Black Fregat Посмотреть сообщение
Может быть, проблема в том, что объект morph создаётся каждый раз заново?
Переделал, но проблема осталась

Добавлено через 3 часа 34 минуты
Цитата Сообщение от Black Fregat Посмотреть сообщение
Может быть, проблема в том, что объект morph создаётся каждый раз заново?
Блин, виноват. Проблема именно в этом и была
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
20.04.2017, 19:23
Помогаю со студенческими работами здесь

Строка, имеющая длину больше 256 символов
Обьясните как вставлять поле memo в паскале а то текста больше заданного количества символом в паскале

Размер поля в MS WORD больше, чем 256 символов
Доброго время суток! обычное поле в ворде, в свойствах длина на максимуме, тип &quot;обычный текст&quot;... вставляю руками текст в...

Консоль не позволяет ввести больше 254 символов
День добрый. Столкнулся с очень странной проблемой: в консоль нельзя ни вставить, ни ввести то количество символов, которое она вмещает...

i2c eeprom не могу записать больше 256 байт подряд
#define I2C_PORT GPIOB #define I2C_SCL GPIO_PIN_6 /* PB6 ------&gt; I2C1_SCL */ #define I2C_SDA ...

Gorenje W6843 L/S не позволяет выставить обороты отжима больше 600
Здравствуйте, стиральная машинка Gorenje W6843 L/S, 6 кг загрузка, 1400 об. отжим. С недавнего времени на любой программе могу выставить...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Новые блоги и статьи
Вывод данных через динамический список в справочнике
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Функция заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
10 пpимет, которые всегда сбываются
Maks 31.03.2026
1. Чтобы, наконец, пришла маршрутка, надо закурить. Если сигарета последняя, маршрутка придет еще до второй затяжки даже вопреки расписанию. 2. Нaдоели зима и снег? Не надо переезжать. Достаточно. . .
Перемещение выделенных строк ТЧ из одного документа в другой
Maks 31.03.2026
Реализация из решения ниже выполнена на примере нетипового документа "ВыдачаОборудованияНаСпецтехнику" с единственной табличной частью "ОборудованиеИКомплектующие" разработанного в конфигурации КА2. . . .
Functional First Web Framework Suave
DevAlt 30.03.2026
Sauve. IO Апнулись до NET10. Из зависимостей один пакет, работает одинаково хорошо как в режиме проекта так и в интерактивном режиме. из сложностей - чисто функциональный подход. Решил. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru