Форум программистов, компьютерный форум, киберфорум
PHP: сети
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.63/8: Рейтинг темы: голосов - 8, средняя оценка - 4.63
1 / 1 / 1
Регистрация: 29.01.2013
Сообщений: 87

Получить код страницы

15.11.2015, 14:04. Показов 1570. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем привет! Нужно получить код страницы http://ru.leonbets.net/stavki24. Пробовал и через curl и file_get_contents, но ничего не выходит. Подскажите, что не так?
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
15.11.2015, 14:04
Ответы с готовыми решениями:

Не могу получить код HTML страницы
В общем file_get_contents работает, но не всегда, так же как и curl. При использовании curl и file_get_contents например на сайте...

Как получить код страницы, после того, как все скрипты данной страницы отработают, и выдадут все результаты?
Добрый день! Хотелось бы узнать, как получить код страницы, после того как все скрипты, данной страницы, отработают и выдадут все...

Получить html код любой страницы
Здавствуйте,задача простая: Как с помощью php можно получить содержание любой страницы в интернете? т.е есть например страница...

2
433 / 352 / 259
Регистрация: 29.11.2011
Сообщений: 628
16.11.2015, 02:20
Лучший ответ Сообщение было отмечено insideone как решение

Решение

JGalt, проблема в том, что при первом запросе, сайт отдает JS скрипт, который устанавливает одну куку в браузер:
Кликните здесь для просмотра всего текста
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta http-equiv="Content-Script-Type" content="text/java">
<script type="text/javascript">
function getCookie(c_name) { // Local function for getting a cookie value
    if (document.cookie.length > 0) {
        c_start = document.cookie.indexOf(c_name + "=");
        if (c_start!=-1) {
        c_start=c_start + c_name.length + 1;
        c_end=document.cookie.indexOf(";", c_start);
 
        if (c_end==-1) 
            c_end = document.cookie.length;
 
        return unescape(document.cookie.substring(c_start,c_end));
        }
    }
    return "";
}
function setCookie(c_name, value, expiredays) { // Local function for setting a value of a cookie
    var exdate = new Date();
    exdate.setDate(exdate.getDate()+expiredays);
    document.cookie = c_name + "=" + escape(value) + ((expiredays==null) ? "" : ";expires=" + exdate.toGMTString()) + ";path=/";
}
function getHostUri() {
    var loc = document.location;
    return loc.toString();
}
setCookie('YPF8827340282Jdskjhfiw_928937459182JAX666', '178.155.99.235', 10);
try {  
    location.reload(true);  
} catch (err1) {  
    try {  
        location.reload();  
    } catch (err2) {  
        location.href = getHostUri();  
    }  
}
</script>
</head>
<body>
<no>This site requires JavaScript and Cookies to be enabled. Please change your browser settings or upgrade your browser.</no>
</body>
</html>

Без которой дальнейшее получение контента, соответственно не доступно.

Можно через регулярное выражение вытащить эти данные, чтобы потом их отправлять в виде cookie, при последующем запросе.
PHP
1
2
preg_match('/setCookie\(\'(\w+)\',\040\'(.+)\'/', $result['content'], $matches);
$cookie = array($matches[1] => $matches[2]);
Далее делать второй запрос (на этот же адрес), например используя вот такую функцию cURL (которая рекурсивно перейдет по всем 302 перенаправлениям сервера, при этом сохраняя и используя все дополнительные cookie, отдаваемые сервером):
Кликните здесь для просмотра всего текста
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
function getURL($url, $cookie = false, $timeout = 30, $maxRedirs = 3)
{
    $ch = curl_init();
    $header[] = "Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8";
    $header[] = "Connection: keep-alive";
    $header[] = "Keep-Alive: 300";
    $header[] = "Accept-Language: ru-RU,ru;q=0.8,en-US;q=0.5,en;q=0.3";
    $header[] = "Pragma: "; 
    curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.3; WOW64; rv:35.0) Gecko/20100101 Firefox/35.0");
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_HTTPHEADER, $header); 
    if ($cookie) {
        if (is_array($cookie)) {
            foreach($cookie as $key => $value ) {
              $arCookieString[] = "{$key}={$value}";
            };
            $cookieString = implode('; ', $arCookieString);
        }
        curl_setopt($ch, CURLOPT_COOKIE, $cookieString);
    }
    curl_setopt($ch, CURLOPT_HEADER, true);
    curl_setopt($ch, CURLOPT_ENCODING, 'gzip, deflate');
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_AUTOREFERER, true);
    curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
    curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
    curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
    $content = curl_exec($ch);
    $response = curl_getinfo($ch);
    curl_close ($ch); 
    if ($content) {
        preg_match_all('/^Set-Cookie:\s*([^;]*)/mi', $content, $match);
        $setCookie = array();
        if ($match[1]) {
            foreach($match[1] as $setCookieString) {
                parse_str($setCookieString, $setCookieUnit);
                $setCookie = array_merge($setCookie, $setCookieUnit);
            }
            $cookie = is_array($cookie) ? array_merge($cookie, $setCookie) : $setCookie;
        }
    }
    if (($response['http_code'] == 301 || $response['http_code'] == 302) && $maxRedirs && $response['url'])
        return getURL($response['url'], $cookie, $timeout, --$maxRedirs);
    if ($content) {
        return array(
            'set_cookie' => $cookie,
            'response' => $response,
            'content' => $content
        );
    } else 
        return false;
}
PHP
1
2
3
$result = getURL($url, $cookie);
echo $result['content']; // вывод кода страницы
$cookie = $result['set_cookie']; // сохранение cookie для последующих запросов
Но если вам нужно получить не просто код страницы, а данные из таблицы "Ставки на ближайшие 24 часа", то дополнительно из полученного контента нужно извлечь JSON (на основе которого, через JS строится эта таблица на сайте).
PHP
1
2
3
4
/* Получение данных "Ставки на ближайшие 24 часа" в виде объекта */
preg_match_all('/displayPreMatchOnLoad\((\'|")(.+)(\'|")\);/', $result['content'], $matches);
$data = json_decode(str_replace('\"', '"', $matches[2][1]));
echo nl2br(print_r($data, true)); // вывод всего объекта
Ну и пример вывода свойства, например из первой ставки:
PHP
1
echo $data->matches[0]->_next24team_;
Полный пример работы:

Кликните здесь для просмотра всего текста
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
<?php
$url = 'http://ru.leonbets.net/stavki24';
 
/* Получение первой cookie из JS кода */
$result = getURL($url);
preg_match('/setCookie\(\'(\w+)\',\040\'(.+)\'/', $result['content'], $matches);
$cookie = array($matches[1] => $matches[2]);
 
/* Получение кода страницы */
$result = getURL($url, $cookie);
//echo $result['content']; // вывод кода страницы
$cookie = $result['set_cookie']; // сохранение cookie для последующих запросов
 
/* Получение данных "Ставки на ближайшие 24 часа" в виде объекта */
preg_match_all('/displayPreMatchOnLoad\((\'|")(.+)(\'|")\);/', $result['content'], $matches);
$data = json_decode(str_replace('\"', '"', $matches[2][1]));
echo nl2br(print_r($data, true)); // вывод всего объекта
//echo $data->matches[0]->_next24team_; // вывод свойства из первой ставки
 
function getURL($url, $cookie = false, $timeout = 30, $maxRedirs = 3)
{
    $ch = curl_init();
    $header[] = "Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8";
    $header[] = "Connection: keep-alive";
    $header[] = "Keep-Alive: 300";
    $header[] = "Accept-Language: ru-RU,ru;q=0.8,en-US;q=0.5,en;q=0.3";
    $header[] = "Pragma: "; 
    curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.3; WOW64; rv:35.0) Gecko/20100101 Firefox/35.0");
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_HTTPHEADER, $header); 
    if ($cookie) {
        if (is_array($cookie)) {
            foreach($cookie as $key => $value ) {
              $arCookieString[] = "{$key}={$value}";
            };
            $cookieString = implode('; ', $arCookieString);
        }
        curl_setopt($ch, CURLOPT_COOKIE, $cookieString);
    }
    curl_setopt($ch, CURLOPT_HEADER, true);
    curl_setopt($ch, CURLOPT_ENCODING, 'gzip, deflate');
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_AUTOREFERER, true);
    curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
    curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
    curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
    $content = curl_exec($ch);
    $response = curl_getinfo($ch);
    curl_close ($ch); 
    if ($content) {
        preg_match_all('/^Set-Cookie:\s*([^;]*)/mi', $content, $match);
        $setCookie = array();
        if ($match[1]) {
            foreach($match[1] as $setCookieString) {
                parse_str($setCookieString, $setCookieUnit);
                $setCookie = array_merge($setCookie, $setCookieUnit);
            }
            $cookie = is_array($cookie) ? array_merge($cookie, $setCookie) : $setCookie;
        }
    }
    if (($response['http_code'] == 301 || $response['http_code'] == 302) && $maxRedirs && $response['url'])
        return getURL($response['url'], $cookie, $timeout, --$maxRedirs);
    if ($content) {
        return array(
            'set_cookie' => $cookie,
            'response' => $response,
            'content' => $content
        );
    } else 
        return false;
}
?>
1
1 / 1 / 1
Регистрация: 29.01.2013
Сообщений: 87
16.11.2015, 14:56  [ТС]
Огромное спасибо, за подробность!=) Думаю теперь разберусь. Еще раз спасибо!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
16.11.2015, 14:56
Помогаю со студенческими работами здесь

Получить данные со страницы
С помощью функции для переменной $spisok присваивается таблица значений (она выводится/echo на страницу). Это данные &quot;фамилия, имя,...

Как получить ссылку страницы?
Всем привет. Есть страница index.php, и в нем есть форма. Как можно сделать так чтобы в форме в скрытом поле передавалось адрес...

Необходимо получить содержимое страницы
Добрый день! Мне необходимо получить html-код страницы: http://kidsco.md/ Выполняю cURL запрос: $vars = array(); $vars =...

Получить содержимое из html страницы
Всем привет! Помогите пожалуйста разобраться, с такой задачкой столкнулась впервые, можно сказать ничего в этом не понимаю. Нужно из html...

получить содержания страницы через урл
есть идеи как еще можно , без curl , без file_get_contents , без fopen ? Добавлено через 8 минут может стоит смотреть в сторону...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит: токи, напряжения и их 1 и 2 производные при t = 0;. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru