[問題] 關於scrapy中，程式碼運作的問題 jamesxxx1997 PTT批踢踢實業坊

[問題] 關於scrapy中，程式碼運作的問題

作者: jamesxxx1997 (黃~) 2018-01-19 20:35:58

大家好，在scrapy中，我對於spider folder中的project(自訂名字).py的運作不了解
以下是project.py中的代碼
import scrapy
class QuotesSpider(scrapy.Spider):
name = "quotes"
start_urls = [
'http://quotes.toscrape.com/page/1/',
]
def parse(self, response):
for quote in response.css('div.quote'):
yield {
'text': quote.css('span.text::text').extract_first(),
'author': quote.css('span small::text').extract_first(),
'tags': quote.css('div.tags a.tag::text').extract(),
}
next_page = response.css('li.next a::attr(href)').extract_first()
if next_page is not None:
yield response.follow(next_page, callback=self.parse)
想請問一下，當我執行此段代碼時，程式碼的執行流程是?
個人疑惑點 :
1. 官方網站上是說，scrapy 會把response物件丟回給parse，再執行parse
，但是parse是一個generator，scrapy是如何執行此generator呢?

繼續閱讀

[問題] 請問generator的send方法Tomcat [情報] 線上8小時爬蟲課程/64折倒數3天va12024 Re: [問題] 判斷布林值的問題MOONY135 [問題] Windows重導向stdout至檔案發生編碼錯誤danny0838 [問題] 把django deploy 到 apacheredbxh [問題] 新手請益，做seo相關資料蒐集yuimei [問題] 判斷布林值的問題zuso [討論] DataCamp徵求共用會員maybe0930 [問題] Tk Filedialog 存檔如何存成有副檔名?caesar0929 [問題] matplotlib 畫餅圖時值0能否去除?qwerfvcxz32