Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.82/11: Рейтинг темы: голосов - 11, средняя оценка - 4.82
zufax

Содержимое каждой страницы распарсить с помощью BeautifulSoup и сохранить всё в файл

31.05.2014, 13:15. Показов 2281. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день!
Пытаюсь парсить сайт, на котором информация выводится по 30 записей на страницу, всего ~1000.
Для получения ссылок есть цикл:
Python
1
2
3
4
5
6
7
#!/usr/bin/env python3.3
 
src = 'http://bla.ru/ss?id={}&blabla'
 
for i in range(30, 91, 30):
    url = src.format(i)
    print(url)
Результат:
http://blablabla.ru/ss?id=30&blabla
http://blablabla.ru/ss?id=60&blabla
http://blablabla.ru/ss?id=90&blabla

Мне нужно содержимое каждой страницы распарсить с помощью BeautifulSoup и сохранить всё в файл. Вопрос, как мне поочереди эти ссылки передать в urlopen?
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
31.05.2014, 13:15
Ответы с готовыми решениями:

как скрыть всё содержимое страницы с помощью css
для того чтобы добавить функцию распечатки мне нужно скрыть абсолютно всё содержимое сайта, а так же добавить для отображения рисунок,...

PHP распарсить содержимое страницы
Есть ссылка: ...

Получить содержимое страницы по URL и распарсить ее
Здравствуйте. Передо мной возникла задача получения содержимого HTML-страницы для дальнейшего парсинга. Я нахожусь на исходной странице,...

1
561 / 484 / 168
Регистрация: 14.02.2012
Сообщений: 1,561
31.05.2014, 13:37
В этом же цикле парсить, не вижу проблемы.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
31.05.2014, 13:37
Помогаю со студенческими работами здесь

Распарсить файл с помощью PugiXML
Есть вот такой вот xml файл <?xml version="1.0" encoding="UTF-8"?> <note> <body>Hello world of XML!</body> </note> Делаю по...

Содержимое текстового файла F перенести в файл G, перенося при этом в конец каждой строки все входящие в нее цифры
Здравствуйте, помогите решить данную задачу. Используя очередь, решить следующую задачу. Содержимое текстового файла F, разделенное на...

Переписать содержимое файла А в файл В, перенося при этом в конец каждой строки все входящие в нее знаки препинания
Дан текстовый файл А. Переписать его содержимое в файл В, перенося при этом в конец каждой строки все входящие в нее знаки препинания. ...

Распарсить текстовый файл с помощью Split
К примеру у меня есть ID, имена, номера которые я уже открыл в программе, и мне нужно при определенной команде читались только буквы до...

Помогите распарсить xml файл с помощью excel-vba...
я могу вытаскивать определенную ветвь из файла, а как вытащить все... заранее спасибо


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru