Форум программистов, компьютерный форум, киберфорум
PHP
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/14: Рейтинг темы: голосов - 14, средняя оценка - 5.00
12 / 12 / 12
Регистрация: 01.07.2014
Сообщений: 106

Curl и парсинг, танцы с бубном

21.07.2014, 09:22. Показов 3053. Ответов 7
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго вечера, форумчане.
Для себя и, возможно, друзей-знакомых, решил написать простенький проектик.
Суть в том, чтобы с часто посещаемых сайтов парсить видео, затем получать на него прямые ссылки и ваставлять на просмотр посредством <video>.
Весь функционал был успешно реализован на localhost aka 127.0.0.1 . Но, при загрузке всего этого "кода" на хостинг обнаружилась проблема - ни в какую не хотел выполнятся парсинг прямой ссылки на видео с vk.com. В поисках решения проблемы я перетанцевал с бубном и решил остановиться на curl, во многом благодаря этой статье с хабра. Рабочего решения на cURL я не нашел, может кто видел, где оно обитает? Возвращаться на <iframe>, успешно работающий и на хостинге, не хочу по многим причинам.
Кто сталкивался с подобной проблемой и смог как то ее устранить, прошу вас о помощи. Может какую ссылку, где можно подчерпнуть знаний о curl касательно данной области, или пример готового срипта. Буду благодарен за любую наводку.
P.S. Или парсинг с вк на данный момент вообще не возможен?

Добавлено через 9 часов 15 минут
Вообщем, как я понял, на данный момент способ авторизации остается только один - API VK. Однако, если поместить на сайт уже готовый файл Coockie с VK будет ли толк? Curl ведь может работать на прямую с Coockie. Так же интересует почему на локальном сервере страницы парсятся вообще без единой проблемы, а на хостинге - нет. Знает кто, в чем причина? И как можно обойти?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
21.07.2014, 09:22
Ответы с готовыми решениями:

Танцы с бубном
Сегодя часа два назад меня просто убили следующей новостью: У нас утреннем развозе проставились не закупочные цены вместо продажных....

Почтовая БД - танцы с бубном
Странное дело начало происходить с моей почтовой БД. В один день пропали все входящие из папки &quot;Инбокс&quot;. Фиксап, сжатие не...

Надоели танцы с бубном
Всем доброго времени суток. Суть проблемы: имеется локальная сеть из 16 компов,1 выступает в роли сервера и через него остальные выходят в...

7
1943 / 1768 / 825
Регистрация: 23.01.2014
Сообщений: 6,230
21.07.2014, 19:44
Цитата Сообщение от justprolol Посмотреть сообщение
Так же интересует почему на локальном сервере страницы парсятся вообще без единой проблемы, а на хостинге - нет. Знает кто, в чем причина
Если хостинг бесплатный, то, вполне вероятно, что curl и другие возможности php, способные зайти на другие сайты, запрещены хостером.
Цитата Сообщение от justprolol Посмотреть сообщение
Вообщем, как я понял, на данный момент способ авторизации остается только один - API VK.
Можно и без API. Браузер же делает это без API.
Цитата Сообщение от justprolol Посмотреть сообщение
Однако, если поместить на сайт уже готовый файл Coockie с VK будет ли толк?
будет.
Цитата Сообщение от justprolol Посмотреть сообщение
Может какую ссылку, где можно подчерпнуть знаний о curl касательно данной области,
Все что надо тут http://ru2.php.net/manual/ru/book.curl.php
все функции, каждая с примерами.
1
12 / 12 / 12
Регистрация: 01.07.2014
Сообщений: 106
21.07.2014, 20:12  [ТС]
Цитата Сообщение от pav1uxa Посмотреть сообщение
Если хостинг бесплатный, то, вполне вероятно, что curl и другие возможности php, способные зайти на другие сайты, запрещены хостером.
Проблема в том, что не работает даже у меня на локалке. Пока единственный варинат - файл куки каждую неделю обновлять. Я уже написал даже отправку номера телефона. Весь код валидный, но в ответе - вечный редирект. Т.е. если начинать парсить - получается зацикливание. Или если просто вывести страницу - эффект тот же. Ни в файл записать, да вообще ничего не сделать. Видимо, Это и есть защита от парсинга.
0
1943 / 1768 / 825
Регистрация: 23.01.2014
Сообщений: 6,230
21.07.2014, 20:57
Цитата Сообщение от justprolol Посмотреть сообщение
Так же интересует почему на локальном сервере страницы парсятся вообще без единой проблемы, а на хостинге - нет.
Цитата Сообщение от justprolol Посмотреть сообщение
Проблема в том, что не работает даже у меня на локалке.
Какая-то нестыковочка, что-то я не так понял видимо...

Цитата Сообщение от justprolol Посмотреть сообщение
Я уже написал даже отправку номера телефона. Весь код валидный, но в ответе - вечный редирект.
Я писал собственную фичу для контакта (без использования API), и никаких там вечных редиректов нет (да и быть не может теортетически). А если использовать API то все еще проще будет... Неправильно пишите значит.
0
12 / 12 / 12
Регистрация: 01.07.2014
Сообщений: 106
21.07.2014, 21:09  [ТС]
Цитата Сообщение от pav1uxa Посмотреть сообщение
использовать API то все еще проще будет
через api не получить прямую ссылку на видео.
Цитата Сообщение от pav1uxa Посмотреть сообщение
и никаких там вечных редиректов нет
Если даже просто сохранить страницу, она сама себя редиректит в цикле. Если все <link> проблема отпадает.
0
1943 / 1768 / 825
Регистрация: 23.01.2014
Сообщений: 6,230
21.07.2014, 22:37
Цитата Сообщение от justprolol Посмотреть сообщение
Если даже просто сохранить страницу, она сама себя редиректит в цикле.
Голословное заявление, так как Вы не предоставляете ответа сервера, который по Вашему мнению "редиректит в цикле". Я могу просто ответить "нет, это не так".

Что бы понять в чем дело, надо смотреть что возвращает сервер (а именно http-заголовки и сам код), а не с бубном плясать. И я, кстати, писал напрямую через fsockopen(), fwrite(), fgets(), без использования cURL.
1
12 / 12 / 12
Регистрация: 01.07.2014
Сообщений: 106
21.07.2014, 23:15  [ТС]
Цитата Сообщение от pav1uxa Посмотреть сообщение
Что бы понять в чем дело, надо смотреть что возвращает сервер (а именно http-заголовки и сам код), а не с бубном плясать. И я, кстати, писал напрямую через fsockopen(), fwrite(), fgets(), без использования cURL.
Попробую так. А полученная мною страница на cURL`е - действительно "саморедиректится". Даже после сохранения ее в HTML и запуска в браузере - все равно вечный редирект. После удаления какой то из линков - все нормально становилось.
P.S. Я всегда первое что делаю - смотрю где, что и как возращается функциями.

Добавлено через 3 минуты
Пожалуй, сделаю указанным вами методом, ведь в принципе авторизация в VK не нужна для публичного видео...
0
Заблокирован
23.07.2014, 21:02
остановись на qt creator. там qwebbrowser это хорошо делает.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
23.07.2014, 21:02
Помогаю со студенческими работами здесь

Танцы с бубном или точнее с if
В общем я опять с if заморачиваюсь. Все вроде работает, кроме нажатия клавиши &quot;d&quot;, не возвращается к началу программы. Если вставить...

Танцы с бубном вокруг озу
Есть мат. плата - P8H61-V Есть две планки Crucial BLS4G3D13390S1S00 Ballistix по 8Gb Вставляю планку №1 в слот №1 - биос видит 8 гиг ...

EFI на ноутбуке и танцы с бубном
Добрый день, появилась необходимость переустановить ОС на ноутбуке, который использует EFI. В силу того, что единственный флеш-накопитель...

Выбор процессора на ноутбук и танцы с бубном
Здравствуйте. Имеется такая ситуация... Хочу немного освежить свой ноут и подобрать к нему процессор по мощнее. Но не могу разобраться с...

Танцы с бубном вокруг I2C и TDA7313
Даже не знаю как описать свою проблему, но попробую, ибо у самого вариантов уже нет. Есть контроллер, мега8 и программная реализация...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru