1536 / 434 / 43
Регистрация: 10.04.2009
Сообщений: 7,517
|
||||||
1 | ||||||
Изменение кодировки текстового файла05.05.2017, 13:47. Показов 13985. Ответов 13
Метки нет Все метки)
(
здравствуйте, в своих записях имею пару кодов
для перекодировки файлов, а как сделать из ANSI > UTF 8? спасибо
сколько не перепробовал решений с инета всё как-то работает не правильно, ANSI это точно = windows-1251? потому, что файл перекодированный кодом ВБА кодировку меняет как надо, а текст не меняется, если перекодировать в ручную, тогда и текст в файле меняется правильно
0
|
|
05.05.2017, 13:47 | |
Ответы с готовыми решениями:
13
Изменение формата ячеек при открытии текстового файла Определение кодировки текстового файла
|
141 / 119 / 29
Регистрация: 12.02.2017
Сообщений: 308
|
||||||
07.05.2017, 20:20 | 2 | |||||
Наверняка есть готовые решения по конвертации кодировок, но я, из интереса, попробовал сделать на VB. В макросе есть ограничения (это всего лишь рабочий набросок для проекта): 1)он конвертирует ascii коды и буквы кириллицы, остальные символы из расширенной таблицы не конвертирует, 2) при конвертации файла не проверяются региональные настройки кодовой страницы, а просто тупо идет преобразование из windows-1251 в utf-8.
При вызове процедуры указываете полный путь текстового файла в кодировке 1251 (или ansi) и результат будет в той же папке.
Да, и еще, в ворде имеются встроенные инструменты по изменению кодировки, поищите, вполне возможно что и найдете. Я сейчас сделать это не могу. Добавлено через 19 секунд Да, и еще, в ворде имеются встроенные инструменты по изменению кодировки, поищите, вполне возможно что и найдете. Я сейчас сделать это не могу.
1
|
1536 / 434 / 43
Регистрация: 10.04.2009
Сообщений: 7,517
|
||||||
08.05.2017, 13:02 [ТС] | 3 | |||||
такое впечатление, как будто я про ВБА ничего не знаю...
но эти строки
а как это на ВБА будет? спасибо Добавлено через 28 минут смотрю на эти строки - ничего в них такого чтобы не нравилось ВБА не вижу....
0
|
412 / 261 / 81
Регистрация: 27.10.2012
Сообщений: 856
|
|
08.05.2017, 13:08 | 4 |
Это утверждение? Судя по кол-ву тем с вопросами, ответ очевиден.
Может покажете свой ansi файл? И как происходит проверка кодировки, после обработки?
0
|
1536 / 434 / 43
Регистрация: 10.04.2009
Сообщений: 7,517
|
|
08.05.2017, 13:37 [ТС] | 5 |
это мысли вслух
Добавлено через 24 минуты в этой строке sTargetFile = Left(sSourceFile, i - 1) & "_ToUtf8" & Right(sSourceFile, Len(sSourceFile) - i + 1) понял + был пропущен
0
|
141 / 119 / 29
Регистрация: 12.02.2017
Сообщений: 308
|
||||||
08.05.2017, 19:21 | 6 | |||||
Вот встроенными инструментами ворд'а
Насчет знаков "+", непонятно по какому принципу они удаляются на этом сайте, иногда исчезают, иногда - нет.
1
|
1536 / 434 / 43
Регистрация: 10.04.2009
Сообщений: 7,517
|
|
09.05.2017, 12:11 [ТС] | 7 |
таких кодов я перепробовал множество, Ваш нужную мне строку в файле:
birthplace [+] (1.000) Р"РћР . РњРР Р"РћР РћР" ПОЛТАР'РЎРљРћР(tm) РћР'Р›. преобразует в: birthplace [+] (1.000) ГОР*. РњРР*ГОР*РћР” ПОЛТАВСКОЙ ОБЛ. хотя если в Блокнот++ смотреть, то да из ANSI > UTF 8 кодировка сменилась, такие дела... закрадываются мысли, может у меня не в ANSI? но если я ручками сменю кодировку на UTF 8, то всё гут! Добавлено через 18 минут только в одном месте онлайн переводчик сделал CP1251-UTF-8 и так криво-�"О� . М�� �"О� О�" ПОЛТА�'СКО�(tm) О�'Л. а должно быть ГОР. МИРГОРОД ПОЛТАВСКОЙ ОБЛ. значит нужно тупо открыть текстовый файл и сменить кодировку как бы это сделал вручную!!! наверное бат файлом
0
|
294 / 147 / 67
Регистрация: 22.02.2017
Сообщений: 590
|
||||||
09.05.2017, 14:31 | 8 | |||||
вот этим кодировщиком пользуюсь весьма давно, замечательно работает, может и вам пригодится.
2
|
1536 / 434 / 43
Регистрация: 10.04.2009
Сообщений: 7,517
|
|
09.05.2017, 15:13 [ТС] | 9 |
увы, ђ"ђ?ђя. ђ?ђ?ђяђ"ђ?ђяђ?ђ" ђ?ђ?ђ>ђчђ?ђ'ђцђ?ђ?ђT ђ?ђ'ђ>.
Добавлено через 32 минуты методом тыка смотрю какие буквы что означают: М-Рњ У-РЈ Ж-Р– Г-Р“ З-Р— Ь-Р¬ А-Рђ Н-Рќ Д-Р” ни на какие мысли не наводит?
0
|
1536 / 434 / 43
Регистрация: 10.04.2009
Сообщений: 7,517
|
|
09.05.2017, 15:16 [ТС] | 10 |
наверное файл который нужно перекодировать приложу
0
|
Модератор
|
|
09.05.2017, 17:53 | 11 |
верхняя половина файла в ASCII, а нижняя в UTF8. Потому и не берут её нормальные перекодировщики, т.к. формат в одном файле разный.
это в ASCII:
1
|
141 / 119 / 29
Регистрация: 12.02.2017
Сообщений: 308
|
||||||
09.05.2017, 20:21 | 12 | |||||
Pro_grammer опередил меня с ответом, могу только добавить, bom-маркер Вашего txt-файла задан в кодировке windows, поэтому, даже если путь укажете в латинице то текстовые редакторы будут открывать его именно в этом формате, пока им не будет "насильно" указана кодировка utf-8.
Вот здесь немного подправленный макрос, специально для Вас, он конвертирует файл в utf-8, при этом предполагается, что начальная кодировка windows-1251 (даже если это не так, поэтому будьте внимательны)
Кстати, Ваш файл он конвертирует в utf-8 правильно, просто те символы, которые были "крякозябрами" в кодировке windows-1251 ими и остались. Есть вопрос, каким чудом Вы умудрились в текстовой ansi-файл "воткнуть" строки в utf-8??? Добавлено через 9 минут По моим предположениям, такое сделать в текстовом редакторе, в режиме пользователя, практически невозможно. Разве что манипуляциями байтами текстового файла.
0
|
1536 / 434 / 43
Регистрация: 10.04.2009
Сообщений: 7,517
|
||||||
10.05.2017, 04:35 [ТС] | 13 | |||||
если интересно, то, я запускаю батник для запуска одной проги
Добавлено через 5 минут Homarty, Ваш код не взлетел, поэтому воспользуюсь советом Pro_grammer
0
|
0 / 0 / 0
Регистрация: 11.08.2015
Сообщений: 17
|
||||||||||||||||
07.03.2019, 15:15 | 14 | |||||||||||||||
Добавлено через 2 часа 9 минут На просторах инета нашел функцию. Отлично работает
0
|
07.03.2019, 15:15 | |
Помогаю со студенческими работами здесь
14
Перекодировка текстового файла из одной кодировки в другую преобразование текстового файла из русской кодировки Dos Смена кодировки текстового файла при его создании
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |