|
zufax
|
||||||
Содержимое каждой страницы распарсить с помощью BeautifulSoup и сохранить всё в файл31.05.2014, 13:15. Показов 2281. Ответов 1
Метки нет (Все метки)
Добрый день!
Пытаюсь парсить сайт, на котором информация выводится по 30 записей на страницу, всего ~1000. Для получения ссылок есть цикл:
http://blablabla.ru/ss?id=30&blabla http://blablabla.ru/ss?id=60&blabla http://blablabla.ru/ss?id=90&blabla Мне нужно содержимое каждой страницы распарсить с помощью BeautifulSoup и сохранить всё в файл. Вопрос, как мне поочереди эти ссылки передать в urlopen? |
||||||
| 31.05.2014, 13:15 | |
|
Ответы с готовыми решениями:
1
как скрыть всё содержимое страницы с помощью css
Получить содержимое страницы по URL и распарсить ее |
|
561 / 484 / 168
Регистрация: 14.02.2012
Сообщений: 1,561
|
|
| 31.05.2014, 13:37 | |
|
В этом же цикле парсить, не вижу проблемы.
0
|
|
| 31.05.2014, 13:37 | |
|
Помогаю со студенческими работами здесь
2
Содержимое текстового файла F перенести в файл G, перенося при этом в конец каждой строки все входящие в нее цифры Переписать содержимое файла А в файл В, перенося при этом в конец каждой строки все входящие в нее знаки препинания Распарсить текстовый файл с помощью Split Помогите распарсить xml файл с помощью excel-vba... Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
kYBz3eJf3jQ
|
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
|
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
|