С Новым годом! Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.79/19: Рейтинг темы: голосов - 19, средняя оценка - 4.79
0 / 0 / 2
Регистрация: 07.09.2013
Сообщений: 41

Не сохраняется в файл HTML код страницы, полученный с помощью file_get_contents()

20.03.2014, 00:38. Показов 4168. Ответов 12
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Не могу понять почему не сохраняет страницу http://www.kinopoisk.ru/film/444
А вот эту сохраняет http://www.kinopoisk.ru/film/444/cast/
PHP
1
2
3
4
5
$page_name = 'http://www.kinopoisk.ru/film/444/cast/';
$page = file_get_contents($page_name);
$fp = fopen ('stranica.php', 'w+');
fwrite ($fp, $page);
fclose($fp);
Добавлено через 4 часа 27 минут
помогите или некто незнает?

Добавлено через 16 минут
или можно рассмотреть любой другой способ
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
20.03.2014, 00:38
Ответы с готовыми решениями:

Записать в файл HTML код страницы, которая генерируется с помощью JavaScript
Всем привет есть ли возможность записать в файл HTML код страницы, которая генерируется с помощью JavaScript? Делал так: Dim...

Считывание исходного кода страницы html - сохраняется ли содержимое в файл?
Здравствуйте. Есть код считывания исходного кода страницы html. Подскажите, в переменную html считывание данные поступают...

С помощью ajax полученить html код всей страницы
Задача: через ajax получение html кода всей страницы. Требуется заменять весь код в 'фрейме' на полученный. прим.: 'src' значение фрейма...

12
Заблокирован
20.03.2014, 10:45
PHP
1
2
3
4
5
6
7
8
9
10
11
12
<?php
  if( $curl = curl_init() ) {
    curl_setopt($curl, CURLOPT_URL, 'http://www.kinopoisk.ru/film/444/cast/');
    curl_setopt($curl, CURLOPT_RETURNTRANSFER,true);
     curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0');
    $out = curl_exec($curl);
    $fp = fopen ('stranica.php', 'w+');
    fwrite ($fp, $out);
    fclose($fp);
    curl_close($curl);
  }
?>
Добавлено через 3 минуты
На сайте может быть установлена защита, которая проверяет юзерагента. Поэтому с помощью curl можно решать такие проблемы)
0
Не мoдepaтор
 Аватар для MVS76
340 / 315 / 94
Регистрация: 07.07.2012
Сообщений: 1,040
Записей в блоге: 7
20.03.2014, 13:39
На сайте действительно защита, курл работал, теперь перестал.
0
Заблокирован
20.03.2014, 13:52
Цитата Сообщение от MVS76 Посмотреть сообщение
На сайте действительно защита, курл работал, теперь перестал.
В смысле? Есть еще защита от парсинга на некоторых сайтах. Если Вы превысили лимит открываемых страниц с одного айпи за определенное время - Ваш айпи будет забанет. Опять же на время, которое установлено на данном движке этого сайта. Вряд ли они будут париться с файлом .htaccess
Рекомендую менять айпи время от времени, если он у Вас динамический. В противном же случае используйте доступные прокси-сервера.
0
Не мoдepaтор
 Аватар для MVS76
340 / 315 / 94
Регистрация: 07.07.2012
Сообщений: 1,040
Записей в блоге: 7
20.03.2014, 14:18
Когда ТС подымал тему в прошлый раз, Вы это видите перейдя по ссылке, то на тот момент курл решил проблемы, а вот сейчас читая темы, Я попал опять на эту-же тему, и меня удивило что ТС в прошлый раз дали нормальный рабочий вариант, но он опять в теме пишет этот кривой никчемный код
Код PHP
$page_name = 'http://www.kinopoisk.ru/film/444/cast/';
$page = file_get_contents($page_name);
$fp = fopen ('stranica.php', 'w+');
fwrite ($fp, $page);
fclose($fp);
Далее думаю проверю в чем проблемы, и действительно, страница не выводится - белый экран и все, хотя в тот момент все работало.
Ну со своего IP естественно проверял, и всего пару раз, так что проблема не в IP.
0
Заблокирован
20.03.2014, 14:31
Цитата Сообщение от MVS76 Посмотреть сообщение
Ну со своего IP естественно проверял, и всего пару раз, так что проблема не в IP.
Смешно читать. Вот подумайте сами. Я уже сказала, что необходимо в курле учитывать юзерагента
PHP
1
 curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0');
Если это не проходит, то необходимо проверить не забанен ли айпи. Просто зайдите на этот сайт и откройте любую страницу. Если она открывается - тогда можно проверять в самом коде, что выходит. Чудес не бывает и Ваша проблема в незнании, а незнания легко превращаются в знания... стоит только захотеть. Покажите, какой код у Вас не работает. Я постараюсь помочь.
0
Не мoдepaтор
 Аватар для MVS76
340 / 315 / 94
Регистрация: 07.07.2012
Сообщений: 1,040
Записей в блоге: 7
20.03.2014, 14:38
Цитата Сообщение от Танкья Посмотреть сообщение
Покажите, какой код у Вас не работает. Я постараюсь помочь
Ну если Вы читали топик, то здесь есть ссылка
Не сохраняется в файл HTML код страницы, полученный с помощью file_get_contents()
Ну вот собственно, ещё раз ссылка Сохранить страницу в переменную

PS. Ценю умных людей!!!
0
Заблокирован
20.03.2014, 14:50
Цитата Сообщение от MVS76 Посмотреть сообщение
Не сохраняется в файл HTML код страницы, полученный с помощью file_get_contents()
Вроде я уже объясняла, что на этом сайте с помощью file_get_contents() получить страницу невозможно. У них защита. Код, который я давала выше, работает. Что не так?
Во второй теме я не отвечала и поэтому не стоит давать мне на нее ссылки. Если Вы дублируете темы - это пусть модераторы разбираются.
Вы можете доступным языком объяснить, что не работает? Покажите код.
0
Не мoдepaтор
 Аватар для MVS76
340 / 315 / 94
Регистрация: 07.07.2012
Сообщений: 1,040
Записей в блоге: 7
20.03.2014, 15:06
Цитата Сообщение от Танкья Посмотреть сообщение
Вы можете доступным языком объяснить, что не работает?
Цитата Сообщение от koksacs Посмотреть сообщение
Не могу понять почему не сохраняет страницу http://www.kinopoisk.ru/film/444
А вот эту сохраняет http://www.kinopoisk.ru/film/444/cast/
Почитайте внимательно проблему темы!!!
Вы что сохраняете?, вот это "http://www.kinopoisk.ru/film/444/cast/"
а нужно "http://www.kinopoisk.ru/film/444/"
Ваш код сохраняет эту страницу?
0
Заблокирован
20.03.2014, 15:30
MVS76, не бывает нерешаемых проблем.
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<?php                                                                              
 
$opts = array(
    'socket' => array(
        'bindto' => '213.180.193.105:7000',
    ),
);
 
$context = stream_context_create($opts);
 
$get = file_get_contents('http://www.kinopoisk.ru/film/444/', false, $context);
 $fp = fopen ('stranica.php', 'w+');
    fwrite ($fp, $get);
    fclose($fp);
 
?>
0
Не мoдepaтор
 Аватар для MVS76
340 / 315 / 94
Регистрация: 07.07.2012
Сообщений: 1,040
Записей в блоге: 7
20.03.2014, 16:42
Цитата Сообщение от Танкья Посмотреть сообщение
MVS76, не бывает нерешаемых проблем
Вы сохранили именно страницу: http://www.kinopoisk.ru/film/444/ ?
Вы заходили на эту странуцу, видели ее содержание?
0
Заблокирован
20.03.2014, 17:04
Да... очень интересная задачка. Действительно в моем коде отображалась главная страница этого сайта. Будем думать)
0
Не мoдepaтор
 Аватар для MVS76
340 / 315 / 94
Регистрация: 07.07.2012
Сообщений: 1,040
Записей в блоге: 7
20.03.2014, 17:33
Страница http://www.kinopoisk.ru/film/444/ отдает редирект 302, но что самое интересное, куда редиректит - неизвестно, нет заголовков.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
20.03.2014, 17:33
Помогаю со студенческими работами здесь

Как передать с помощью VBA в Word html-код страницы?
Подскажите, пожалуйста, как передать с помощью VBA в Word html-код страницы. Конкретно http://www.fonbet.com/scripts/fon.dll?V=0. Проблема...

Аналог file_get_contents() или как получить код страницы
&lt;div class=&quot;post&quot;&gt; Воспользуйся короткой ссылкой:&lt;BR /&gt; &lt;?php $tinyurl =...

Html файл не сохраняется. Notepad++
Надеюсь с темой не ошибся. Понимаю, глупая проблема, но раздражает ужасно. Использую Notepad++ для написания html-страниц. Столкнулся с...

Как найти слово в тексте полученный через file_get_contents?
Всем привет! Есть сайт с большим кол-вом слов(не только слова, есть и ссылки и заголовки). Эти слова я получаю на свой сайт через...

Программа, конвертирующая xls в html и загружающая полученный файл на сервер
Доброго времени суток! Нужна программа, конвертирующая xls в html и загружающая полученный файл на сервер по ftp. Может есть наброски или...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
13
Ответ Создать тему
Новые блоги и статьи
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути Сочетание глобально распределённой вычислительной мощности и инновационных. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru