|
0 / 0 / 0
Регистрация: 04.10.2014
Сообщений: 28
|
||||||
UnicodeDecodeError: 'utf8' codec can't decode byte 0x80 - invalid start byte18.05.2015, 14:36. Показов 21051. Ответов 13
Метки нет (Все метки)
Добрый день
При вызове скрипта вылетает такая ошибка: "UnicodeDecodeError: 'utf8' codec can't decode byte 0x80 in position 3131: invalid start byte". Вылетает, как я поимаю, в этом месте. При том, что раньше он не вылетал. Файлы, которые пытаюсь открыть вроде бы точно в UTF-8 (в Sublime text 2 при выборе Reopen with UTF-8 нормально открываются). В скрипте еще используется pymorphy2, в которую скармливается нарезанный на слова файл. В чем может быть ошибка?
0
|
||||||
| 18.05.2015, 14:36 | |
|
Ответы с готовыми решениями:
13
UnicodeDecodeError: 'charmap' codec can't decode byte 0x98 in position 308: character maps to <undefined> Ошибка Pyglet UnicodeDecodeError: 'ascii' codec can't decode UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte |
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|
| 18.05.2015, 15:00 | |
|
YERMLV, Для начала полный текст ошибки в студию, во вторых как ты предлагаешь отлаживать это дело, когда тут происходят вызовы функций, которые мы не видим?
0
|
|
|
1 / 1 / 2
Регистрация: 11.02.2014
Сообщений: 97
|
|||||||||||
| 18.05.2015, 15:01 | |||||||||||
|
Добрый день. Присоеденяюсь к вышепоставленному вопросу. При попытке записать в txt файл байт код, выдаёт ту же ошибку:
0
|
|||||||||||
|
0 / 0 / 0
Регистрация: 04.10.2014
Сообщений: 28
|
|||||||||||
| 18.05.2015, 15:07 [ТС] | |||||||||||
|
Код ошибки
Кстати, уточню, что ОС – OS X
0
|
|||||||||||
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
||
| 18.05.2015, 15:12 | ||
|
Второе, с чего ты взял, что что-то в 6 строке нужно декодировать?
0
|
||
|
0 / 0 / 0
Регистрация: 04.10.2014
Сообщений: 28
|
|
| 18.05.2015, 15:21 [ТС] | |
|
На всякий случай поясню: этот кусок кода потрошит текстовый файл на куски по 1000 слов. Собирает разную статистику по каждому куску, записывает в новый объект textAtom, который добавляется в массив таких объектов
0
|
|
|
1 / 1 / 2
Регистрация: 11.02.2014
Сообщений: 97
|
||||||
| 18.05.2015, 15:23 | ||||||
|
alex925, По поводу первого: Вы же потом первый скажете что мол "поиск не используют", "одинаковые темы пачками плодят" итд. По поводу второго: метод write() хочет принимать только стринг, если сделать str.content то выдает ошибку:
0
|
||||||
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|||||||
| 18.05.2015, 15:56 | |||||||
|
Козак Алексей, Одинаковые темы, это когда несколько человек из одного учебного заведения начинают заваливать форум дебильными задачами. То есть один пришёл и создал 3 темы с одной задачей, потом другой сделал тоже самое и т д В данном случае нужно создавать новую тему, а не гадить в чужой.
Вот пример как происходит просто создание файла с точно таким же содержанием (как я понял ты это пытался сделать).
Добавлено через 1 минуту YERMLV, Сделай вывод в консоль тех файлов, что пытается читать программа и скинь сюда файл, на котором происходит ошибка.
1
|
|||||||
|
0 / 0 / 0
Регистрация: 04.10.2014
Сообщений: 28
|
|
| 18.05.2015, 16:47 [ТС] | |
|
Не работает на всех файлах
https://drive.google.com/file/... sp=sharing вот один из них
0
|
|
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|
| 18.05.2015, 17:05 | |
|
YERMLV, файл без проблем открывается. Если у тебя возникает ошибка, значит файл, который ты пытаешься открыть все таки не в utf8.
0
|
|
|
0 / 0 / 0
Регистрация: 04.10.2014
Сообщений: 28
|
|
| 18.05.2015, 17:18 [ТС] | |
|
Все решилось. Оказывается, в папке лежала пара скрытых файлов (некий .DS_Store), который мой скрипт тоже пытался прочитать. Спасибо всем за помощь)
0
|
|
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|
| 18.05.2015, 17:22 | |
|
0
|
|
|
0 / 0 / 0
Регистрация: 04.10.2014
Сообщений: 28
|
|
| 18.05.2015, 17:58 [ТС] | |
|
я просто методологически неправильно поступал: я оставлял по одному файлу в папке, а там в то же время оставались те скрытые файлы
0
|
|
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|
| 18.05.2015, 18:05 | |
|
По этому нужно или использовать вывод промежуточных результатов с помощью print или использовать отладчик.
0
|
|
| 18.05.2015, 18:05 | |
|
Помогаю со студенческими работами здесь
14
Проблема с фикстурами - UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 4: invalid continuation byte
Unicodedecodeerror 'utf-8' codec can't decode byte 0xd1 in position 0 invalid continuation byte Ошибка UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 0: invalid continuation byte Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|
|
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
kYBz3eJf3jQ
|
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
|
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
|
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора
Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2.
Задача: уведомлять пользователя, если. . .
|