Форум программистов, компьютерный форум, киберфорум
Python: Решение задач
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/5: Рейтинг темы: голосов - 5, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 31.03.2023
Сообщений: 6

Парсинг на Python

31.03.2023, 19:19. Показов 1147. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Спарсить первые два абзаца со странички http://www.pythonscraping.com/... er1-ru.txt с правильной кодировкой и сохранить их в txt файл. Помогитеб пожалуйста.
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
31.03.2023, 19:19
Ответы с готовыми решениями:

Парсинг python
Хотел запарсить одну сайт,написал код.Правильно? import requests from bs4 import Beautifulsoup as BS page = 1 while True: ...

Парсинг Python
Задача запарсирсить странички обявление страницу в https://krisha.kz/prodazha/kvartiry/ Надо запарсить цену и ссылку. не смог запарсить их ...

Парсинг файла в python
У меня есть метод в классе def splited_message(cls, filename): with open(filename, 'r', encoding="utf-8") as file: ...

4
74 / 53 / 24
Регистрация: 10.06.2015
Сообщений: 162
31.03.2023, 19:29
Python
1
2
3
4
5
6
7
8
9
10
11
12
import requests
import codecs
 
url = "https://www.pythonscraping.com/pages/warandpeace/chapter1-ru.txt"
 
# Загрузить содержимое страницы
response = requests.get(url)
content = response.content.decode('utf-8')
 
# Сохранить содержимое в файл
with codecs.open("chapter1-ru.txt", "w", "utf-8") as file:
    file.write(content)

Тут общий парс страницы. Для того, чтобы спарсить 2 абзаца, необходимо знать с чего он начинается. Если же использовать split для поиска абзаца, то он берет первые 2 строки:
ЧАСТЬ ПЕРВАЯ

I
1
0 / 0 / 0
Регистрация: 31.03.2023
Сообщений: 6
31.03.2023, 21:03  [ТС]
Jess163, спасибо, но мне нужен именно часть кода, где мы используем split и как достаём из получившегося списка нужные мне абзацы
0
88 / 32 / 14
Регистрация: 25.03.2023
Сообщений: 69
31.03.2023, 21:03
Лучший ответ Сообщение было отмечено Иван2706 как решение

Решение

Иван2706, А где там вообще абзацы то?!))

Python
1
paragraphs = content.split('\n\n')[:2]
.split('\n\n') - мы разбиваем текст на подстроки, используя двойной перенос строки как разделитель а [:2] - используем 2 блока
0
74 / 53 / 24
Регистрация: 10.06.2015
Сообщений: 162
31.03.2023, 21:44
Цитата Сообщение от Иван2706 Посмотреть сообщение
абзацы
В том тексте нет абзацев
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
31.03.2023, 21:44
Помогаю со студенческими работами здесь

Python парсинг
Привет. Скажите, пожалуйста.. Когда начинаю прогонять по циклу, всегда выводит одну и ту же информацию. В чем проблема?

Парсинг с Python
Подскажите пожалуйста - что делать если классы\id одинаковые во многих блоках, но данные содержащиеся в них разные. Надо из каждого...

Парсинг на Python
Дополнить парсер возможность вывода ссылок со всех url, которые попадаются на странице https://docs.python.org/3/library/index.html ...

Парсинг python
Всем привет, уважаемые спецы, мне для парсинга данных нужно получить количество страниц вот на этом сайте, цифры указаны внизу пагинация....

Парсинг на Python
Помогите реализовать парсер, который скачивает названия категорий и ссылки на изображения по адресу https://myspar.ru/catalog/


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru