Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/6: Рейтинг темы: голосов - 6, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 11.03.2016
Сообщений: 2
1

Неправильная кодировка

11.03.2016, 15:29. Показов 1120. Ответов 3
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Уже целый день пытаюсь спарсить данные с сайта, но возникает проблема с кодировкой.
Русские буквы отображаются в виде: Паблик
Кодировка файла utf-8;
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
<?php
$url="http://dsins.myarena.ru/stats/hlstats.php?mode=chat&game=csgo";
$html = file_get_contents($url); // Читаем содержимое HTML страницы
$charset = 'UTF-8'; // кодировка получаемой страницы
 
$pos=mb_strpos($html,'<table class="data-table">', 0, $charset); // позиция
$html=mb_substr($html,$pos,mb_strlen($html, $charset), $charset); // обрезаем до указанной позиции, удаляя все лишнее
 
$dom = new domDocument; // создаем объект дерева DOM
$dom->loadHTML($html); // загружаем в него спарсенную страницу
 
$dom->preserveWhiteSpace = false;
//echo $html;
$tables = $dom->getElementsByTagName('table'); // получаем из дерева DOM первую таблицу, ею является как раз таблица содержащая курсы валют
$rows = $tables->item(0)->getElementsByTagName('tr'); // получаем из таблицы все строки
 
$i=0;
$curs = array(); // массив который будет хранить данные
foreach ($rows as $row) //перебор полученных строк
    {
    if($i==0) {$i++; continue;} // первую строку пропускаем, т.к. она содержит заголовки столбцов а не данные
        $cols = $row->getElementsByTagName('td'); // разбираем все строки по столбцам
 
 
    // записываем в полученные данные в массив, для удобного представления и работы дальше
        $curs[$i][0]=$cols->item(0)->nodeValue; // дата
        $curs[$i][1]=$cols->item(1)->nodeValue; // ник
        $curs[$i][2]=$cols->item(2)->nodeValue; // сообщение
        $curs[$i][3]=$cols->item(3)->nodeValue; // сервер
        $curs[$i][4]=$cols->item(4)->nodeValue; // карта
    $i++;
    }
//print_r($curs);// выводим полученный массив
echo $curs[1][3];
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
11.03.2016, 15:29
Ответы с готовыми решениями:

Неправильная кодировка
страницы отображаются нормально я вижу нормально все но к примеру при проверке на pr-cr.r* в...

Неправильная кодировка mail()
mail(&quot;mail@mail.ru&quot;, &quot;тема&quot;, &quot;текст сообщения&quot;); Тема приходит нормально, а текст сообщения на...

Неправильная кодировка через анонимайзер
Не правильно отображается текст при заходе на сайт через анонимайзер на странице php...

Неправильная кодировка - PHP и MYSQL
Как избавиться от этого? Помогите плиз. Заранее спасибо.

3
Эксперт PHP
3106 / 2591 / 1219
Регистрация: 14.05.2014
Сообщений: 7,236
Записей в блоге: 1
11.03.2016, 15:38 2
Цитата Сообщение от ZyrLex Посмотреть сообщение
Кодировка файла utf-8
Файла, который читаете, или файла вашего кода?
0
0 / 0 / 0
Регистрация: 11.03.2016
Сообщений: 2
11.03.2016, 15:47  [ТС] 3
Kerry_Jr, файла кода
0
Эксперт PHP
3106 / 2591 / 1219
Регистрация: 14.05.2014
Сообщений: 7,236
Записей в блоге: 1
11.03.2016, 17:01 4
Я долго искал и нашел решение
Цитата Сообщение от ZyrLex Посмотреть сообщение
PHP
1
$dom->loadHTML($html); // загружаем в него спарсенную страницу
PHP
1
$dom->loadHTML('<?xml encoding="UTF-8">'.$html); // загружаем в него спарсенную страницу
Добавлено через 13 минут
либо оставляете все как есть, но после строки
PHP
1
$charset = 'UTF-8'; // кодировка получаемой страницы
пишете
PHP
1
$html = mb_convert_encoding($html, 'HTML-ENTITIES', $charset);
0
11.03.2016, 17:01
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
11.03.2016, 17:01
Помогаю со студенческими работами здесь

Неправильная кодировка при парсинге
Привет всем. Извеняюсь, что создал ещё одну тему. Просто нужно решить одну проблему. Использую...

Неправильная кодировка в теле письма
Здравствуйте, у меня такая проблема, юзеры получают письма вот в таком виде ...

Неправильная кодировка обратной связи
Код: &lt;?php /* Spark – Simple and Effective Rev. 6 */ // Replace the email address...

Неправильная кодировка при выводе из бд
Выводит знаки вопроса. В чём может быть причина? В phpmyadmin смотрю - русские буквы...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru