|
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
|
|
ООП для парсинга сайтов24.08.2020, 18:44. Показов 5691. Ответов 16
Метки нет (Все метки)
Код части обучающих уроков написан с ООП. Как Вы думаете, достаточно того, что знаю (судя по общению на форуме на эту тему) или если нет, то по каких ключевым словам поискать, что надо подучить? Или надо всё ООП выучить, чтобы изучать парсинг по урокам? БьютифулСуп не смотрю. Хочу изучить на основе других модулей сначала.
0
|
|
| 24.08.2020, 18:44 | |
|
Ответы с готовыми решениями:
16
Функции для парсинга многостраничных сайтов Подскажите набор инструментов для парсинга сайтов
|
|
3258 / 2060 / 351
Регистрация: 24.11.2012
Сообщений: 4,909
|
|
| 24.08.2020, 18:45 | |
|
Судя по этому вопросу — https://www.cyberforum.ru/post14798866.html — ты не умеешь читать код. Без разницы, в какой парадигме он написан.
0
|
|
|
Просто Лис
|
|
| 24.08.2020, 18:50 | |
|
Зачем тебе ООП? Хочешь парсить сайты - парсь. Только в руки возьми requests+soup+lxml или что-нибудь подобное. Пользоваться готовыми классами (из этих библиотек) много ума не надо.
1
|
|
|
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
|
|
| 24.08.2020, 19:02 [ТС] | |
|
soup - имеется в виду БьютифулСуп?
Если не ошибаюсь, в уроке по lxml автор показывал код с ООП, в то же время сказал, что для тех, кто не знает, покажет потом без него. Другие уроки по парсингу в определенный момент переставал понимать. Думаю, может быть из-за того, что там ООП.
0
|
|
|
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
|
|
| 24.08.2020, 19:24 [ТС] | |
|
0
|
|
| 24.08.2020, 21:12 | ||||||
|
supmener, Я с парсингом знаком совсем немного, начал было и забросил. Поэтому знаком только с одной технологией парсинга, это с помощью фреймворка Scrapy . Там знание ООП обязательно. Вот здесь дается пример парсинга с помощью Scrapy
https://pycoder.ru/make-simple-spider-scrapy/ Там нужно создавать структуру каталогов для парсинга. А вот пример кода для парсинга, размещаемого в одном из каталогов
Хотя не только это, а то, что парсинг пишется свой на каждый сайт, для того, что бы отслеживать изменения информации на этом сайте. Как оказалось, для меня это не настолько интересно, что бы изучать нудный язык XPath. Может конечно другие технологии парсинга менее трудоемки, я не знаю.
1
|
||||||
|
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
|
||
| 24.08.2020, 21:22 [ТС] | ||
|
Благодарю. В XPath почти что уже выучил многое из него, надо повторить для закрепления материала.
0
|
||
|
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
|
|
| 25.08.2020, 09:12 [ТС] | |
|
Теперь понял, что cat - это команда для вывода содержимого requirements.txt в консоль.
0
|
|
|
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
|
|
| 25.08.2020, 16:40 [ТС] | |
|
Начал изучать ООП полностью.
В сложных случаях Scrapy используется совместно с Selenium или похожей программой. А ещё какие из них?
0
|
|
| 25.08.2020, 18:33 | ||
|
1
|
||
|
Просто Лис
|
|
| 25.08.2020, 18:47 | |
|
Вообще вопрос звучит как "Я хочу изучить арифметические операции, которые мне могут пригодиться для парсинга сайтов". Да никаким боком (почти) парсинг не связан с ООП.
Хочешь парсить сайты - для общего развития почитай про dns/ip/маршрутизацию/nat/модель osi/http/https. Поставь wireshark - погоняй http-трафик.
1
|
|
|
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
|
|
| 25.08.2020, 19:22 [ТС] | |
|
Для чтения гуглить, что попадется или какую - то определенную документацию?
0
|
|
| 26.08.2020, 13:06 | ||
|
0
|
||
| 26.08.2020, 13:06 | |
|
Помогаю со студенческими работами здесь
17
QT - класс для парсинга сайтов Компоненты для парсинга сайтов Методики для парсинга сайтов Какой язык выбрать для парсинга сайтов? Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма).
На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
|
Первый деплой
lagorue 16.01.2026
Не спеша развернул своё 1ое приложение в kubernetes.
А дальше мне интересно создать 1фронтэнд приложения и 2 бэкэнд приложения
развернуть 2 деплоя в кубере получится 2 сервиса и что-бы они. . .
|
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ *
Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам
Кирхгофа, решает её и находит:
токи, напряжения и их 1 и 2 производные при t = 0;. . .
|
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым.
Но восстановить их можно так.
Для этого понадобится консольная утилита. . .
|
|
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
|
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11
Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
|