文章詳情頁
python - 為什么感覺 pyspider 爬取的速度好慢
瀏覽:212日期:2022-08-08 09:43:03
問題描述
為什么感覺 pyspider 爬取的速度好慢(比自己直接用 requests 和 bs慢多了),是不是因為有些網(wǎng)頁會 retry,不過成功率倒是比自己爬取的高多了。是不是我的使用方法不對?求解釋
問題解答
回答1:這里可以設(shè)置 web ui 控制臺上的 rate/burst 參數(shù)來調(diào)節(jié)速度,rate 是 每秒抓取的數(shù)量,burst 是并發(fā)的數(shù)量,默認(rèn)是 1/3 所以比較慢,還是對這個工具了解不夠呀
回答2:我沒有用過框架來寫爬蟲,但是我在自己寫爬蟲的時候,并發(fā)寫起來,模型越復(fù)雜(如線程控制,線程狀態(tài)監(jiān)控),效率是越低的。
相關(guān)文章:
1. 關(guān)docker hub上有些鏡像的tag被標(biāo)記““This image has vulnerabilities””2. boot2docker無法啟動3. docker-compose中volumes的問題4. nignx - docker內(nèi)nginx 80端口被占用5. java - SSH框架中寫分頁時service層中不能注入分頁類6. docker安裝后出現(xiàn)Cannot connect to the Docker daemon.7. dockerfile - 為什么docker容器啟動不了?8. docker容器呢SSH為什么連不通呢?9. 關(guān)于docker下的nginx壓力測試10. docker images顯示的鏡像過多,狗眼被亮瞎了,怎么辦?
排行榜

熱門標(biāo)簽
網(wǎng)公網(wǎng)安備