文章詳情頁
python - pyspider 定時爬取問題
瀏覽:223日期:2022-07-14 10:37:31
問題描述



在寫爬蟲的時候,發現 在代碼中設置了 every 之后,21號爬取了一次之后,今天看 result 沒有更新,那個 lastcrawltime 依舊是 21號的。請問是不是我的參數設置的不正確?




問題解答
回答1:你貼的這個 task 的圖,是什么任務的?
貼的是 detail_page 的任務的
題主給 index_page 設置了小于 cronjob 間隔的時間。然而沒有給 detail_page 設置。這樣 detail_page 是不會被重新調度的
project 隊列狀態,最近活動任務是怎樣的?
回答2:有可能是 every 和 age 不匹配。如果 age 沒問題的話,說實話這屬于疑難雜癥了,我也經常遇到,我都是去 taskdb 把相應的表清空,然后重啟 pyspider 重新運行項目
相關文章:
1. html5和Flash對抗是什么情況?2. html5 - datatables 加載不出來數據。3. docker 下面創建的IMAGE 他們的 ID 一樣?這個是怎么回事????4. 利用IPMI遠程安裝centos報錯!5. node.js - mongodb查找子對象的名稱為某個值的對象的方法6. 運行python程序時出現“應用程序發生異常”的內存錯誤?7. 測試自動化html元素選擇器元素ID或DataAttribute [關閉]8. javascript - QQ第三方登錄的問題9. javascript - 在 model里定義的 引用表模型時,model為undefined。10. spring-mvc - spring-session-redis HttpSessionListener失效
排行榜

網公網安備