Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/6: Рейтинг темы: голосов - 6, средняя оценка - 4.67
0 / 1 / 0
Регистрация: 07.12.2021
Сообщений: 27

Ошибки кодировок в Питоне при чтении файлов

07.12.2021, 11:57. Показов 1308. Ответов 12
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день
опять про "charmap codec can't decode byte 0x98"
Я начинающий программист и уже второй день бьюсь с проблемой кодировок.
Есть ардуиновский исходник, где в текстах сотни файлов встречаются символы почти на всех языках мира.
Задача простая: переписать файлы в один, вставляя комментарии.
И никак. При чтении-записи файлов как 'r' обязательно попадаю на ошибку кодировки.
При чтении-записи как 'rb' не могу вставить комментарии.
Уже склоняюсь к варианту переписать файлы удалив весь нечитаемый мусор. Это устраивает, но разовое и нудное решение.
Что предложите?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
07.12.2021, 11:57
Ответы с готовыми решениями:

Ошибки при чтении из Edit
Я еще не очень то разобрался с линейным программированием. Но полгода назад черт дернул меня разбираться в ООп и с помощью одного товарища...

Ошибки при чтении из транспортного соединения
Доброго времени суток. Необходимо сохранить код страницу, делаю следующим образом: HttpWebRequest proxy_request =...

Ошибки при записи и чтении из файла
double calc(int n, double sum, int a, int b, double p, double f) { if(n == 0) return sum; else{ sum += p...

12
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
07.12.2021, 15:04
Цитата Сообщение от George164 Посмотреть сообщение
уже второй день бьюсь с проблемой кодировок.
Если у тебя проблема с кодировкой, то просто укажи кодировку в open. Так все делают.

Добавлено через 53 секунды
Цитата Сообщение от George164 Посмотреть сообщение
де в текстах сотни файлов встречаются символы почти на всех языках мира.
Это совершенно не важно.

Добавлено через 1 минуту
Цитата Сообщение от George164 Посмотреть сообщение
Есть ардуиновский исходник,
Это бинарный файл или текстовый?
Если бинарный, то его бессмысленно читать в текстовом режиме и также бессмысленно искать в нем кодировку.
0
0 / 1 / 0
Регистрация: 07.12.2021
Сообщений: 27
07.12.2021, 15:06  [ТС]
Ну ну. Есть пример? Готов протестировать.
Бинарный вариант, наконец, заработал.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
07.12.2021, 15:12
Цитата Сообщение от George164 Посмотреть сообщение
Есть пример? Готов протестировать
Какой пример? Что протестировать?
Пример кода и сорца должен был быть от тебя. Но мы его не увидели.
0
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,328
07.12.2021, 15:44
что-то похожее
Python
1
2
f1 = open(f1, 'r', encoding='utf-8')
s1 = f1.read()
есть?
0
0 / 1 / 0
Регистрация: 07.12.2021
Сообщений: 27
07.12.2021, 18:01  [ТС]
#!/usr/bin/python
# -*- coding: utf-8 -*-

import glob, os
os.chdir("E:\Marlin2")
fw = open('e:\\Marlin21.txt', 'w',encoding='utf-8')
for file in glob.glob("*.h"):
....print(file)
....fr = open(file, 'r', encoding='utf-8')
....s1 = fr.read()
....for line in s1:
........fw.write(line)
....fr.close ()
fw.close ()

Всем спасибо. Сработало, если ставить кодировку и при чтении и при записи.
Пробовал, конечно, так делать вчера, но видно не попробовал вариант ставить и там и там.
Убил время на вариант с бинарным копированием, а там свои заморочки только утром поборол.
Там 705 файлов, но если на 3х сработало, сработает и на 700х.
0
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,328
07.12.2021, 19:08
Цитата Сообщение от George164 Посмотреть сообщение
'e:\\Marlin21.txt'
r вначале ставите и не два слеша а один нужен, значит "как строка"
0
0 / 1 / 0
Регистрация: 07.12.2021
Сообщений: 27
07.12.2021, 22:18  [ТС]
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
r вначале ставите и не два слеша а один нужен, значит "как строка"
Вы понимаете в чем проблема этого и подобных советов?
Во первых чисто по русски понять трудно что написано.
Во вторых совет понимаешь только если знаешь ответ. Иначе какая r? Какой слеш? Какая строка? В питоне столько подводных камней, что надо немного подробней разжевывать.
А сухой осадок да, напоминание по делу. Сейчас повезло, а будет другая буква в имени файла и будет сюрприз.
0
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,328
08.12.2021, 08:27
Цитата Сообщение от George164 Посмотреть сообщение
Иначе какая r
где красные, где белые, куда бежать..........
было
Цитата Сообщение от George164 Посмотреть сообщение
fw = open('e:\\Marlin21.txt', 'w',encoding='utf-8')
нужно
Python
1
fw = open(r'e:\Marlin21.txt', 'w', encoding='utf-8')
0
enx
 Аватар для enx
1190 / 766 / 277
Регистрация: 05.09.2021
Сообщений: 1,772
08.12.2021, 08:46
Цитата Сообщение от George164 Посмотреть сообщение
Вы понимаете в чем проблема этого и подобных советов?
Вы понимаете, в чем проблема подобных вопросов?

Очень подробный ответ

Коротко:

1. В Linux для написания абсолютного пути:

f = open('/Users/test/mytestfiles/testproject/mytest/test.txt')

2. В Windows вам потребуется указать диск и использовать обратные слэши "", чтобы не испытывать с ними проблем можно поставить перед кавычками символ "r", что сделает строку "сырой", либо использовать двойной "" (для экранирования):

f = open(r'C:\test\testtest\test.txt')
f = open('C:\\test\\testtest\\test.txt')

Само собой все писать через контекст. Но тут ты спросишь, а это что такое?
Гуглить python with
0
0 / 1 / 0
Регистрация: 07.12.2021
Сообщений: 27
08.12.2021, 17:01  [ТС]
Спасибо. Вроде все, что надо обсудили, а то я сейчас начну искать ошибки там, где их нет.
0
0 / 1 / 0
Регистрация: 07.12.2021
Сообщений: 27
09.12.2021, 11:59  [ТС]
Спрошу здесь, чтобы не плодить.
Задержки в программе с tkinter'om.
Нужно, например, менять цвет букв в тексте. Номера букв и времен в списке.
Ничего не приходит в голову кроме таймера из создания фиктивного объекта, через after менять в нем что-нибудь и в бесконечном цикле отслеживать это изменение.
А как еще?
0
0 / 1 / 0
Регистрация: 07.12.2021
Сообщений: 27
11.12.2021, 10:16  [ТС]
С трудом, но разобрался и со sleep() и с after.
Проблемы была, что не знал или забыл про .update()
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
11.12.2021, 10:16
Помогаю со студенческими работами здесь

Ошибки при записи/чтении данных из базы
Всем доброго времени суток. Написал приложение которое работает с SQLite. При запуске если базы нет, то она создается и вносится одна...

Ошибки в потоковой записи в структуру и при чтении
#include "iostream" #include "stdafx.h" #include <stdio.h> #include <conio.h> #include <string.h> struct oz{ int ...

зацикливание при чтении файлов
Здравствуйте, подскажите, как можно изменить код, чтобы цикл заканчивался, когда проверен на принадлежность последний элемент второго...

Ошибки при чтении секторов жесткого. Что делать?
При переустановке винды форматировал жосткий прошли все 100 процентов потом пишет что ошибка жочткий не форматнулся. пробую еще раз вообще...

HP Pavilion DV6-3125er: ошибки при чтении архивов
ОС: Windows 7: Home basic x64 SP1 Как проявляется проблема: При запуске различных установщиков в процессе распаковки архива в...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
13
Ответ Создать тему
Новые блоги и статьи
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной записи. . .
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
Контроль уникальности заводского номера - вариант №2
Maks 24.03.2026
В отличие от предыдущего варианта добавлено прерывание циклов, также добавлены новые переменные для сохранения контекста ошибки перед прерыванием цикла: Процедура ПередЗаписью(Отказ, РежимЗаписи,. . .
SDL3 для Desktop (MinGW): Вывод текста со шрифтом TTF с помощью библиотеки SDL3_ttf на Си и C++
8Observer8 24.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-text-sdl3-c. zip finish-text-sdl3-cpp. zip
Жизнь в неопределённости
kumehtar 23.03.2026
Жизнь — это постоянное существование в неопределённости. Например, даже если у тебя есть список дел, невозможно дойти до точки, где всё окончательно завершено и больше ничего не осталось. В принципе,. . .
Модель здравоСохранения: работники работают быстрее после её введения.
anaschu 23.03.2026
geJalZw1fLo Корпорация до введения программа здравоохранения имела много невыполненных работниками заданий, после введения программы количество заданий выросло. Но на выплатах по больничным это. . .
Контроль уникальности заводского номера - вариант №1
Maks 23.03.2026
Алгоритм контроля уникальности заводского (или серийного) номера на примере документа выдачи шин для спецтехники с табличной частью в конфигурации КА2. Данные берутся из регистра сведений, по. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru