Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.60/5: Рейтинг темы: голосов - 5, средняя оценка - 4.60
0 / 0 / 0
Регистрация: 20.04.2020
Сообщений: 2

Scrapy, прописать селектор правильно

31.07.2020, 13:09. Показов 1004. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Создаю spider на Scrapy, не получается спарсить данные, у всех одинаковый класс, не знаю как правильно прописать селектор,
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
import scrapy
 
 
# scrapy crawl author
# scrapy crawl author -o qauthor.jl сохранение
 
class AuthorSpider(scrapy.Spider):
    name = 'author'
 
    start_urls = ['https://www.marathonbet.ru/su/popular/Football/Russia+-+10898']
 
    def parse(self, response):
        author_page_links = response.css('a.member-link')
        yield from response.follow_all(author_page_links, self.parse_author)
 
    def parse_author(self, response):
        def extract_with_css(query):
            return response.css(query).get(default='').strip()
 
        yield {
            'ceff': extract_with_css('td.price height-column-with-price    coupone-width-1 > span.selection-link.active-selection::text'),
            'date': extract_with_css('td.date::text'),
 
        }
скан, что именно надо извлечь
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
31.07.2020, 13:09
Ответы с готовыми решениями:

Как правильно прописать сетевой путь?
Всем доброго дня. Недавно приступил к освоению ЯП. Мал по малу осваиваю, но что-то споткнулся на примитивной задаче. Необходимо...

Как правильно прописать путь
win10 Python 3 Установил пакет PhantomJS в каталог G:\TMP\phantomjs-2.1.1-windows\ Не знаю надо ли как-то этот пакет прописывать pip...

Как правильно прописать импорт пакета?
Есть некий пакет - папка с похожими классами и файлом '__init__.py' Сейчас все эти классы импортируются строчкой: from classes import *...

2
1732 / 970 / 199
Регистрация: 22.02.2018
Сообщений: 2,693
Записей в блоге: 6
31.07.2020, 16:11
mironodim, Я когда то начинал изучать парсинг с помощью Scrapy . Начал изучать язык XPath но потом потерял интерес к этой области (сейчас полно специалистов по парсингу) и забросил.
Вот ссылки, которые может быть Вам пригодятся. В первой ссылке рассказывается о структуре при работе со Scrapy . Вторая на документацию по языку XPath
https://pycoder.ru/make-simple-spider-scrapy/
https://docs.microsoft.com/ru-... 1(v=vs.90)
0
0 / 0 / 0
Регистрация: 20.04.2020
Сообщений: 2
31.07.2020, 16:15  [ТС]
Спасибо большое!!!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
31.07.2020, 16:15
Помогаю со студенческими работами здесь

Написать правильно селектор
Есть код, и селекторы типа Как написать такую выборку, что бы уменьшить количество селекторов в коде? <!DOCTYPE html> ...

Правильно определить селектор
Доброго дня, господа, задаюсь таким вопросом - есть модальное окно (собсна обертка и контент) в контенте есть кнопка закрытия этого самого...

Как назначить правильно селектор?
Как правильно назначить селектор активным ссылкам из меню <nav> <menu> <li...

Немогу написать правильно селектор
нужно по выбору из 1 select'a на 2 это поле блокировалось. 3 вариант работает, но он блокирует только тот элемент который я ранние написал...

Как правильно составить селектор?
Здравствуйте! Как составить селектор так,чтобы при наведении на li менялся цвет ссылки a? <div class="main"> ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
YAFU@home — распределённые вычисления для математики. На CPU
Programma_Boinc 20.01.2026
YAFU@home — распределённые вычисления для математики. На CPU YAFU@home — это BOINC-проект, который занимается факторизацией больших чисел и исследованием aliquot-последовательностей. Звучит. . .
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит: токи, напряжения и их 1 и 2 производные при t = 0;. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru