Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.86/65: Рейтинг темы: голосов - 65, средняя оценка - 4.86
0 / 0 / 1
Регистрация: 19.11.2014
Сообщений: 41

Изменение кодировки файла с ASCII на UTF-8

26.02.2016, 12:49. Показов 12591. Ответов 9
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Не работает этот код
PHP
1
2
3
4
5
6
7
function change_files_coding_to_UTF8($file_name)
{
    $str         = file_get_contents($file_name);
    $coding    = mb_detect_encoding($str);
    $new_str  = iconv($coding, 'UTF-8' , $str);
    file_put_contents($file_name, $new_str);
}
Я понял, что эта строка не работает:

PHP
1
$new_str = iconv($coding, 'UTF-8' , $str);
$new_str обрывается на первом кириллическом символе.

Думаю, что не работает так как ASCII - 1-байтная кодировка, а UTF-8 - 2-ух. По всей видимости функция iconv прекращает свою работу, когда натыкается на первый кириллический символ в ASCII, и пытается его перекодировать в UTF-8. Так как строка в направлении UTF-8 -> UTF-8 работает так, как я хочу.

Не могу понять что именно тут не так и как это исправить. Мануал и гугл как-то не помогли.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
26.02.2016, 12:49
Ответы с готовыми решениями:

Разные кодировки файлов (ASCII, UTF-8, UTF-16)
Привет всем! Нужно написать программу поиска файлов, содержащих заданную строку. Т.е. пользователь выбирает начальный каталог, задаёт...

Изменение кодировки Unicode в UTF-8
Нужно переделать Unicode to UTF-8 Пользуюсь функцией string test =...

Конвертация из ASCII в UTF-32 или UTF-8 в UTF-32
Собсно сабж.

9
 Аватар для Пифагор
2172 / 1655 / 840
Регистрация: 10.01.2015
Сообщений: 5,207
26.02.2016, 13:39
PHP
1
$new_str  = mb_convert_encoding($str, 'UTF-8', $coding);
0
0 / 0 / 1
Регистрация: 19.11.2014
Сообщений: 41
26.02.2016, 13:48  [ТС]
спасибо, пробовал, так вырезает кириллицу и в получаемом файле только латиница.

Если это сделать без переменной $coding, то преобразование произойдёт:

PHP
1
file_put_contents("test.php", mb_convert_encoding(file_get_contents($file_name), 'UTF-8'));
НО, символы полученного файла будут нечитаемы. Полученный файл будет открываться в РНР-Шторме и браузере не так, как другие файлы, mb_detect_encoding() которых == UTF-8.

Не знаю что не так...
0
 Аватар для Пифагор
2172 / 1655 / 840
Регистрация: 10.01.2015
Сообщений: 5,207
26.02.2016, 13:59
А если не записывать в файл, а просто вывести контент файла в браузер после перекодирования, то же самое происходит?
0
0 / 0 / 1
Регистрация: 19.11.2014
Сообщений: 41
26.02.2016, 14:31  [ТС]
Да. Например я вставляю код в index.php:
PHP
1
2
3
4
    $str = file_get_contents("index.php");
    $coding = mb_detect_encoding($str);
    echo "$coding<br>"; // UTF-8,
    echo mb_convert_encoding(file_get_contents("menu.php"), 'UTF-8'); // файл НЕ в UTF-8
Вместо меню выводит кракозябры. То есть и index.php и menu.php уже в UTF-8, но символы кириллицы не совпадают.
0
 Аватар для Пифагор
2172 / 1655 / 840
Регистрация: 10.01.2015
Сообщений: 5,207
26.02.2016, 14:39
преобразуйте файл в UTF-8 без BOM
0
0 / 0 / 1
Регистрация: 19.11.2014
Сообщений: 41
26.02.2016, 14:53  [ТС]
Не знаю как это сделать. Мануал в статье про mb_convert_encoding молчит об UTF-8 без BOM.
0
 Аватар для Пифагор
2172 / 1655 / 840
Регистрация: 10.01.2015
Сообщений: 5,207
26.02.2016, 14:56
Нене)) В текстовом редакторе... Например, Notepad++

Добавлено через 2 минуты
Кодировки > Преобразовать в UTF-8 без BOM.
Именно преобразовать, а не кодировать.
0
0 / 0 / 1
Регистрация: 19.11.2014
Сообщений: 41
26.02.2016, 15:40  [ТС]
Так созданный файл test.php и так получается в UTF-8 без BOM. И index.php в UTF-8 без BOM. А кириллица в них разная.
0
 Аватар для Пифагор
2172 / 1655 / 840
Регистрация: 10.01.2015
Сообщений: 5,207
26.02.2016, 15:43
Цитата Сообщение от Mega Therion Посмотреть сообщение
А кириллица в них разная.
это как?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
26.02.2016, 15:43
Помогаю со студенческими работами здесь

Изменение кодировки текстового файла
здравствуйте, в своих записях имею пару кодов для перекодировки файлов, а как сделать из ANSI &gt; UTF 8? спасибо ' ...

Изменение кодировки .txt файла
Добрый вечер. Недавно начал переходить с Delphi на C#, и столкнулся с проблемой изменения кодировки файла. Нужно из Windows-1251...

Изменение кодировки DBF файла
Здравствуйте. Перевожу данные из DBF файла в EXCEL С самой передачей данных всё отлично, но в DBF файле непонятная кодировка. ...

Изменение кодировки создаваемого XML файла
Доброго времени суток. Столкнулся с проблемой. Не могу при создании XML файла сменить кодировку. Суть задачи следующая. Есть список в...

Изменение кодировки файла dbf из utf8 в 1251
Доброго дня Прошу Вашей помощи в решении следующей задачи. Существует фалик dbf, кодировка которого utf8, нужно изменить эту кодировку на...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru