我可以用简单的命令在scrapy中运行蜘蛛
scrapy crawl custom_spider -a input_val = 5 -a input_val2 = 6
其中input_val和input_val2是我传递给蜘蛛的值
以上方法工作正常..
然而,在用scrapyd安排蜘蛛时
赛跑
curl http://localhost:6800/schedule.json -d project=crawler -d input_val=5 -d input_val2=6 -d spider=custom_spider
引发错误
spider = cls(*args, **kwargs)
exceptions.TypeError: __init__() got an unexpected keyword argument '_job'
我如何让这个工作?
编辑
这个:在我的初始化程序中:
def __init__(self,input_val=None, input_val2=None, *args, **kwargs):
self.input_val = input_val
self.input_val2 = input_val2
super(CustomSpider, self).__init__(*args, **kwargs)
解决方法:
一定要支持蜘蛛中的任意关键字参数,并使用super()like shown in the docs for spider arguments调用__init__:
class MySpider(scrapy.Spider):
name = 'myspider'
def __init__(self, category=None, *args, **kwargs):
super(MySpider, self).__init__(*args, **kwargs) # <- important
self.category = category
Scrapyd提供作业ID作为传递给蜘蛛的_job参数(见code here).
标签:python,scrapy,scrapyd 来源: https://codeday.me/bug/20190528/1169334.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。