|
0 / 0 / 0
Регистрация: 27.08.2022
Сообщений: 11
|
||||||
Для символа с последовательностью байт 0x98 из кодировки "WIN1251" нет эквивалента в "UTF8"14.09.2022, 10:17. Показов 37375. Ответов 6
Метки нет (Все метки)
Ребята привет,
Нужна очень помощь. В postgrese я создалаа таблицу . Пытаюсь данные из csv файла импортировать в postgresql через командную строку. Первый раз это делаю, сложно очень. Так вот в процессе выдает ошибку : для символа с последовательностью байт 0x98 из кодировки "WIN1251" нет эквивалента в "UTF8" Как данные выглядят в csv файле я приложу скрин А вот такую таблицу я создала в postgres:
0
|
||||||
| 14.09.2022, 10:17 | |
|
Ответы с готовыми решениями:
6
Кодировки win1251-UTF8 Перевод кодировки в Win1251/UTF8
|
|
1263 / 977 / 384
Регистрация: 02.09.2012
Сообщений: 3,020
|
|
| 14.09.2022, 11:24 | |
|
Ищите в исходном файле неверные символы, удаляйте их, потом повторяйте.
Вот таблица win125 https://ru.wikipedia.org/wiki/Windows-1251 как видите символа 0x98 действительно нет в unicode. Так что база все верно Вам говорит ошибку.
0
|
|
|
0 / 0 / 0
Регистрация: 27.08.2022
Сообщений: 11
|
|
| 14.09.2022, 12:12 [ТС] | |
|
Кодировкой является в таблице верхний символ в ячейке? Я в этом не разбираюсь еще.
У меня в данных есть символ 0x98? Прям по этому 0x98 и искать?
0
|
|
|
1263 / 977 / 384
Регистрация: 02.09.2012
Сообщений: 3,020
|
|
| 14.09.2022, 23:34 | |
|
Нет, кодировка - это кодировка. Это некая стандартизованная таблица, которая определяет в каждый момент времени выполнения какой-либо программы на каком-либо языке как интерпретировать тот или иной символ, заданный последовательностью байт (1 и более) или наоборот, последовательность байт - символом.
В вашем случае в момент импорта CSV где-то определяется, что записанные в файле байты будут интерпретироваться по таблице WIN1251, потом разбираться на строки и колонки (CSV-формат), потом передаваться на сторону БД для записи в таблицу. В момент записи в таблицу происходит перекодирование в UTF8, т. к. у вас база наверно по умолчанию создана для хранения символов в полях таблицы в UTF8. Соответственно в процессе разбора вашего CSV-файла как последовательности байт, где-то обнаруживается байт со значением 0x98, который попадает на сторону БД и не может быт преобразован в UTF8. Ищите в исходном файле байт 0x98 - это может быть "невидимый" или не читаемый обычными редакторами символ. Его надо или исправить на какой-то читаемый символ (может это синтаксическая ошибка какая-нибудь) или просто удалить из CSV-файла.
0
|
|
|
Нарушающий
417 / 305 / 46
Регистрация: 13.04.2022
Сообщений: 1,759
|
|
| 14.09.2022, 23:59 | |
|
TIL: 98h пропал из кодировки 1251.
Кто-то знает причину? У других кодировок тоже так?
0
|
|
|
0 / 0 / 0
Регистрация: 27.08.2022
Сообщений: 11
|
|
| 15.09.2022, 09:14 [ТС] | |
|
Спасибо большое, но у меня во всем файле каракули. В пандас когда импортирую все читает нормально. А вот постргрес нет. Как мне в этих непривычных символах найти неправильный если их много? (
0
|
|
|
1263 / 977 / 384
Регистрация: 02.09.2012
Сообщений: 3,020
|
|
| 15.09.2022, 19:59 | |
|
Каким способом вы импортируете этот файл?? кто его и как читает, прежде чем запихивать в базу?? Каким запросом это происходит?? Как устанавливается сессия, чтобы передать запрос??
Короче тут целый айсберг на клиентской стороне и в каком месте кто в какой кодировке что читает и пихает, надо разбираться по шагам.
0
|
|
| 15.09.2022, 19:59 | |
|
Помогаю со студенческими работами здесь
7
Из win1251 в utf8 Перекодировка из win1251 в utf8
Преобразовать текст из кодировки Win1251 в DOS-866 Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|