文章詳情頁

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。

瀏覽：137日期：2022-08-04 16:42:25

問題描述

因為在爬取的網站需要賬號登陸，不方便公開。因此我只能這樣大致性的咨詢，實在抱歉。

我需要爬一個目標網站的數據，發現在點擊下一頁時候，網址并沒有改變.通過源碼確定是使用了js外加ajax的樣子.通過chrome的控制臺，捕獲到點擊下一頁時候，向指定地址發送了一條帶多個參數的get指令。

原先采用selenium+phantomjs的方式暴力無腦方式爬取，一個頁面大概5S左右就能獲取，實際用瀏覽器打開也是這個速度。為了爬取大量的數據，準備改用多線程+直接requests.get目標地址的方式來采集，但是發現采集速度非常的慢，從5S降到的20s左右。

請教下，出現這樣現象的原因可能是什么？我該如何解決？請指教

問題解答

回答1：

抱歉浪費了各位的時間- -是我開始測試的時候，周圍有人再下迅雷，網絡炸了。抱歉抱歉

Python 編程

上一條：python - 使用pandas的resample報錯下一條：python - 相當于分組數據的合并，兩個列表生成dataframe，但長度不同

相關文章：

1. phpstudy8.1沒集成mysql-front2. 關docker hub上有些鏡像的tag被標記““This image has vulnerabilities””3. node.js - mongodb查找子對象的名稱為某個值的對象的方法4. docker鏡像push報錯5. Docker for Mac 創建的dnsmasq容器連不上/不工作的問題6. javascript - 在 model里定義的引用表模型時，model為undefined。7. 運行python程序時出現“應用程序發生異常”的內存錯誤？8. javascript - QQ第三方登錄的問題9. 利用IPMI遠程安裝centos報錯！10. html5 - datatables 加載不出來數據。

排行榜

					
					Docker for Mac 創建的dnsmasq容器連不上/不工作的問題
關docker hub上有些鏡像的tag被標記““This image has vulnerabilities””
docker鏡像push報錯
node.js - mongodb查找子對象的名稱為某個值的對象的方法
phpstudy8.1沒集成mysql-front
html5 - datatables 加載不出來數據。
運行python程序時出現“應用程序發生異常”的內存錯誤？
javascript - QQ第三方登錄的問題
前端 - @media query 使用出現的問題？
javascript - 在 model里定義的 引用表模型時，model為undefined。
利用IPMI遠程安裝centos報錯！
				

熱門標簽

午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。