|
3 / 3 / 1
Регистрация: 13.11.2008
Сообщений: 219
|
|
Как получать данные с сайта rp5.ru ?14.11.2012, 17:42. Показов 13375. Ответов 41
Метки нет (Все метки)
Написал программу генерирующую розу ветров на основе данных из .csv файла. Вот только это файл нужно скачивать с сайта http://rp5.ru/%D0%90%D1%80%D1%... 1%83%D0%B3
в ручном режиме. Сначала нужно выбрать период времени, затем нажать на кнопку "Выбрать в файл CSV.GZ". Как это автоматизировать? Сначала сделать POST, запрос, а затем что? Ссылка на .gz все время имеет разные названия :-(
0
|
|
| 14.11.2012, 17:42 | |
|
Ответы с готовыми решениями:
41
Как получать текстовые данные с сайта? Как получать динамические данные с сайта Как получать текстовые данные с сайта? |
|
5755 / 4134 / 1508
Регистрация: 06.01.2011
Сообщений: 11,276
|
|
| 16.11.2012, 18:41 | |
|
C помощью какого-нибудь сканера http заголовков смотрите, куда идёт запрос при нажатии на кнопку "Выбрать в файл CSV.GZ", затем смотрите какие данные туда посылаются. Потом с помощью сURL либо с помощью file_get_contents делаете запрос на адрес, который вы получите. В запросе посылаете те же данные, что посылаются с сайта. Потом получаете ссылку и скачиваете файл с помощью всё того же curl'a.
0
|
|
|
3 / 3 / 1
Регистрация: 13.11.2008
Сообщений: 219
|
||||||||||||||||
| 19.11.2012, 03:38 [ТС] | ||||||||||||||||
|
На странице http://rp5.ru/%D0%90%D1%80%D1%... 1%83%D0%B3
тег form имеет следующий вид
0
|
||||||||||||||||
|
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
|
|||||||||||
| 19.11.2012, 04:47 | |||||||||||
|
буква лишняя<form a
Добавлено через 2 минуты тег action показывает в каком файле находится обработчик формы, тюе в какой файл передаются данные Если он пустой это значит что обработка данных производится в том же файле Добавлено через 25 минут мне кажется для того что бы скачивать эти файлы вам не нужны никакие заголовки, вы сможете формировать запрос сами, посмотрите на запрос который формируется, он выглядит примерно так
далее идут начальная и конечная даты 19.11.2012.19.11.2012. далее три цифры меняются в зависимости от того что вы хотите выбрать 1.0.0 если вам нужен отчет за промежуток дат 2.11.0 усли вам нужен отчет за месяц где первая цифра 2 тип отчета, вторая цифра это месяц, третий 0 3.11.19 если вам нужно выбрать конкретную дату, где первая цифра 3 тип отчета, вторая месяц, третья число далее ru.ansi. идут язык и кодировка файла и окончание 00000000.csv.gz которое тоже никогда не меняется Т.е вы можете свободно сами формировать запрос исходя из требований которые вам нужны и обращаться по адресу который у вас получился и в ответ вам будет отдаваться файл на скачку Добавлено через 9 минут кстати 27605 в начале это метеостанция (WMO ID):27605
1
|
|||||||||||
|
3 / 3 / 1
Регистрация: 13.11.2008
Сообщений: 219
|
||||||
| 19.11.2012, 04:52 [ТС] | ||||||
|
Я поставил прокси/сканер заголовков Proxomitron-RE и выяснил, что данные отсылаются по этому URL http://rp5.ru/inc/f_archive.php
Добавил этот URL в action. Выдрал все теги select, input, radio и вставил их в форму. Но все-равно, имя архива не генерируется и имя архива не возвращается ((((
Как Вы выяснили, что можно получать архив с помощью GET-запроса http://rp5.ru/objects/files.fr... 000.csv.gz ?
0
|
||||||
|
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
|
|
| 19.11.2012, 04:56 | |
|
попробуйте вручную составить запрос по алгоритму который я описал
а после уже можно сделать форму без проблем которая будет формировать запрос и скачивать файл Добавлено через 1 минуту ну вы когда наводите на ссылку скачать в левом нижнем углу браузера появляется ссылка на скачивание , вот попробуйте поизменять данные и посмотреть что меняется и сразу сами все поймете по какому принципу он фформируется Добавлено через 1 минуту и ссылка там кстати формируется на javascript, если поискать то можно и скрипт найти который ее формирует
1
|
|
|
3 / 3 / 1
Регистрация: 13.11.2008
Сообщений: 219
|
|
| 19.11.2012, 05:00 [ТС] | |
|
А распаковывать архив с помощью командной строки exec или есть какая-нибудь библиотека для PHP?
0
|
|
|
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
|
|
| 19.11.2012, 05:12 | |
|
вот есть расширение, я в нем особо не практиковался но там помоему все просто
Добавлено через 3 минуты вот функция для извлечения там и примеры есть на странице Добавлено через 4 минуты извлекаете из архива апотом считываете этой функцией в массив и делаете что вам нужно с данными
1
|
|
|
3 / 3 / 1
Регистрация: 13.11.2008
Сообщений: 219
|
||||||
| 20.11.2012, 02:08 [ТС] | ||||||
|
Оказалось, что класс ZipArchive c .gz не работает.
Подскажите пожалуйста почему может не работать вот этот скрипт? Права на папку tmp стоят, файл .gz лежит там же, где и скрипт. http://stretchfilm.byethost13.com/
0
|
||||||
|
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
|
|
| 20.11.2012, 02:44 | |
|
http://www.php.net/manual/ru/book.zlib.php
хм у них сегодня ip адрес другой стал 219 в конце
0
|
|
|
3 / 3 / 1
Регистрация: 13.11.2008
Сообщений: 219
|
|
| 20.11.2012, 03:07 [ТС] | |
|
Для разархивирования файла использовать эту функцию? http://www.php.net/manual/ru/f... decode.php
0
|
|
|
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
|
|
| 20.11.2012, 03:18 | |
|
не знаю попробуйте хотя это для декодирования данных, посмотрите эту
1
|
|
|
3 / 3 / 1
Регистрация: 13.11.2008
Сообщений: 219
|
||||||
| 20.11.2012, 03:29 [ТС] | ||||||
|
Вот так заработало!
1
|
||||||
|
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
|
|
| 20.11.2012, 03:39 | |
|
ну отлично
0
|
|
|
3 / 3 / 1
Регистрация: 13.11.2008
Сообщений: 219
|
||||||
| 01.12.2012, 09:24 [ТС] | ||||||
0
|
||||||
|
Почетный модератор
16844 / 6724 / 880
Регистрация: 12.06.2012
Сообщений: 19,967
|
|
| 01.12.2012, 09:48 | |
|
для работы такого кода нужно отправить заголовки что это архив
0
|
|
|
3 / 3 / 1
Регистрация: 13.11.2008
Сообщений: 219
|
|
| 01.12.2012, 09:52 [ТС] | |
|
Я не имею ввиду, что надо скачивать этот файл. Мне бы его хотя бы в браузер вывести, чтобы удостовериться, что данные удалось получить.
Если получиться считать этот файл в переменную, то я потом ее в файл tmp.tmp выведу. Но у меня почему-то не удается считать содержимое этого бинарника. Может таймаут от сервера слишком большой? gzopen тоже этот URL не открывает
0
|
|
|
5755 / 4134 / 1508
Регистрация: 06.01.2011
Сообщений: 11,276
|
|
| 01.12.2012, 14:25 | |
|
vlad275, вы на локале тестируете? Скорость интернета хорошая? У меня скрипт быстро получил этот архив и вывел его в виде шикарных кракозябров
.
1
|
|
|
3 / 3 / 1
Регистрация: 13.11.2008
Сообщений: 219
|
||||||||
| 02.12.2012, 05:13 [ТС] | ||||||||
|
На бесплатном хостинге buythost. Попробую Ayola.net.
Добавлено через 12 часов 25 минут Похоже, что бесплатные хостеры блокируют работу функций с внешними URL. Подскажите пожалуйста, может какой-нибудь директивой в .htaccess можно разблокировать?
Добавлено через 7 минут
Директива "php_value allow_url_fopen On" в файле .htaccess привела к ошибке "Запрашиваемый вами сайт имеет ошибку в файле .htaccess." Я только, что написал хосту просьбу включить эту опцию.
0
|
||||||||
|
5755 / 4134 / 1508
Регистрация: 06.01.2011
Сообщений: 11,276
|
|||||||
| 02.12.2012, 08:16 | |||||||
Если значение - php_value. В данном случае у нас flag Добавлено через 43 секунды Можно CURL использовать, если не заработает.
1
|
|||||||
| 02.12.2012, 08:16 | |
|
Помогаю со студенческими работами здесь
20
Как получать текстовые данные с сайта? Получать данные с сайта в реальн. времени Скачивание архива погоды с сайта RP5.ru Как получать информацию с сайта? Как постоянно получать данные из БД Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net
REST сервисы временно не работают, только через Web.
Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
|
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
|
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
|
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма).
На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
|
|
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ *
Дана цепь(не выше 3-го порядка) постоянного тока с элементами R, L, C, k(ключ), U, E, J. Программа находит переходные токи
и напряжения на элементах схемы классическим методом(1 и 2 з-ны. . .
|
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым.
Но восстановить их можно так.
Для этого понадобится консольная утилита. . .
|
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|