Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.86/7: Рейтинг темы: голосов - 7, средняя оценка - 4.86
0 / 0 / 0
Регистрация: 22.02.2017
Сообщений: 10

Взаимодействие двух пауков в фреймфорке scrapy

11.04.2017, 21:54. Показов 1585. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте, как сделать в scrapy так, чтобы один паук вернул данные, которые пропарсил, а второй паук принял эти возвращенные первым пауком данные и, используя их, начал свою работу?

На официальном сайте такой пример:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import scrapy
from scrapy.crawler import CrawlerProcess
 
class MySpider1(scrapy.Spider):
    # Your first spider definition
    ...
 
class MySpider2(scrapy.Spider):
    # Your second spider definition
    ...
 
process = CrawlerProcess()
 
process.crawl(MySpider1)
process.crawl(MySpider2)
process.start() # the script will block here until all crawling jobs are finished
Но он мне не подходит, потому что в crawl передается класс(в данном случае MySpider1), а не объект и я не могу получить возвращаемые данные, чтобы передать их второму пауку...
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
11.04.2017, 21:54
Ответы с готовыми решениями:

Scrapy, определенное количество пауков за раз
Есть управляющий скрипт, который запускает нескольких пауков s = get_project_settings() process = CrawlerProcess(s) for spider in...

контроль "пауков"
Много труда и времени нужно посвятить на оптимизации сайта для поисковиковых систем. Большинство вебмастеров “подсраиваются” под алгоритмы...

Взаимодействие Двух классов.
Собственно такая проблема: 1 класс использует другой в некоторых ситуациях, из-за этого появляется ошибка base class undefined. Как-то...

3
2 / 2 / 7
Регистрация: 08.05.2013
Сообщений: 139
12.04.2017, 16:32
Костыльно, но всё же:

Python
1
2
3
4
import subprocess
 
subprocess.call("spider crawl MySpider2", shell=True)
subprocess.call("spider crawl MySpider2", shell=True)
0
0 / 0 / 0
Регистрация: 22.02.2017
Сообщений: 10
12.04.2017, 23:15  [ТС]
Headmaster, а как без костылей?
0
2 / 2 / 7
Регистрация: 08.05.2013
Сообщений: 139
13.04.2017, 09:54
Цитата Сообщение от Matcher Посмотреть сообщение
а как без костылей?
Опиши, хоть примерно, что формирует 1-ый паук для 2-ого. Ссылки?

Добавлено через 10 часов 30 минут
Если в общих чертах, то вот тебе небольшой теоретический вброс/совет: для каждого паука можно создать отдельный файл
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
13.04.2017, 09:54
Помогаю со студенческими работами здесь

Взаимодействие двух объектов
Мне нужно, чтобы объект с boxCollider и rigidbody толкал объект только с boxCollider. Возможно ли это сделать, если да, то как?

Взаимодействие двух форм
Приветствую всех! Я создал две формы. На той, что вызывается первой есть кнопка, которая вызывает вторую. Но это действие даёт...

Взаимодействие двух серверов
Имеются у меня два сервера Domino R5 (сеть одна - локальная, домены разные). Хочу наладить между ними взаимодействие, чтобы там репликация,...

Взаимодействие двух классов
Здравствуйте. У меня есть два класса: Database и User. Класс Database хранит вектор User'ов, при этом класс User должен иметь доступ к...

взаимодействие двух класов
global.h #ifndef global_h #define global_h const char name_file_data="C:\\Projects\\Elemental war\\data\\data.txt"; const char...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru