|
NeSS23
|
|
Скрипт, который собирает данные с сайта10.11.2013, 23:02. Показов 4174. Ответов 1
Метки нет (Все метки)
Добрый день. Нужна помощь! У меня есть задание: необходимо написать скрипт, который будет заходить на какую-либо страницу сайта, собирать там информацию, и сохранять её. Из сценарных языков мне знаком только bash, причем всё использование ограничилось сложением чисел a и b и выводом их в консоли.
Поэтому есть вопрос: как вообще можно выудить информацию с сайта, какими средствами? Можно ли сделать это, не прибегая к помощи html, php, perl и т.д. )? То есть обязательно ли доставать инфу с другого сайта через свой сайт, или можно как-то по другому решить задачу? |
|
| 10.11.2013, 23:02 | |
|
Ответы с готовыми решениями:
1
|
|
363 / 334 / 38
Регистрация: 29.03.2011
Сообщений: 838
|
|
| 11.11.2013, 15:29 | |
|
NeSS23, есть просто куча вариантов вытащить что-то с инета, используя только bash и пару утилит. Свой сайт не нужен - что можно открыть в браузере, в принципе возможно и без него.
Задача делится на 2 части: скачать страницу и распарсить. 1. curl, wget, lynx - в общем любой консольный браузер или качалка, умеющие работать в неинтерактивном режиме. 2. sed, awk, grep, xpath, или даже встроенные регулярки.
1
|
|
| 11.11.2013, 15:29 | |
|
Помогаю со студенческими работами здесь
2
Нужен скрипт который будет сохранять данные Скрипт, который через $_POST отправляет в базу данные Какую информацию собирает этот скрипт? Пишу скрипт который считывает данные с другого URL адреса
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|
|
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
kYBz3eJf3jQ
|
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
|
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
|
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора
Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2.
Задача: уведомлять пользователя, если. . .
|