文章詳情頁

網(wǎng)頁爬蟲 - Python爬蟲返回狀態(tài)碼與實際情況不符？

瀏覽：303日期：2022-09-03 18:57:11

問題描述

import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open(’http://www.sxxrcs.com/was5/web/’)html = response.codeprint html

比如這個爬蟲，輸出狀態(tài)碼是200。

可是直接訪問http://www.sxxrcs.com/was5/web/是404，抓包響應(yīng)的也是404，請問這是為什么？

網(wǎng)頁爬蟲 - Python爬蟲返回狀態(tài)碼與實際情況不符？

問題解答

回答1：

用requests吧

import requestsr = requests.get(’http://www.sxxrcs.com/was5/web/’)print r.status_codeprint r.text回答2：

200正常啊，requests方便快捷。

Python 編程

上一條：python - 模擬滑動驗證碼，有源碼，求解下一條：python爬蟲時，抓取網(wǎng)頁遇到的問題？

相關(guān)文章：

1. node.js - nodejs+express+vue2. javascript - 我的站點貌似被別人克隆了， google 搜索特定文章，除了域名不一樣，其他的都一樣，如何解決？3. java - web端百度網(wǎng)盤的一個操作為什么要分兩次請求服務(wù)器, 有什么好處嗎4. 數(shù)據(jù)庫 - Mysql的存儲過程真的是個坑！求助下面的存儲過程哪里錯啦，實在是找不到哪里的問題了。5. javascript - 如何獲取未來元素的父元素在頁面中所有相同元素中是第幾個?6. python - 如何把152753這個字符串轉(zhuǎn)變成時間格式15:27:537. 使用mysql命令行連接遠程數(shù)據(jù)庫host跳轉(zhuǎn)8. javascript - onclick事件點擊不起作用9. javascript - webpack-dev-server和webpack沖突嗎10. python 字符串匹配問題

排行榜

					
					node.js - nodejs+express+vue
淺談Vue static 靜態(tài)資源路徑 和 style問題
java - web端百度網(wǎng)盤的一個操作為什么要分兩次請求服務(wù)器, 有什么好處嗎
javascript - 我的站點貌似被別人克隆了， google 搜索特定文章，除了域名不一樣，其他的都一樣，如何解決？
webgl - android上類似汽車之家的3d全景照片怎么實現(xiàn)
python  字符串匹配問題
javascript - onclick事件點擊不起作用
數(shù)據(jù)庫 - Mysql的存儲過程真的是個坑！求助下面的存儲過程哪里錯啦，實在是找不到哪里的問題了。
javascript - 如何獲取未來元素的父元素在頁面中所有相同元素中是第幾個?
python - 如何把152753這個字符串轉(zhuǎn)變成時間格式15:27:53
javascript - webpack-dev-server和webpack沖突嗎
				

熱門標簽

午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

網(wǎng)頁爬蟲 - Python爬蟲返回狀態(tài)碼與實際情況不符？