文章詳情頁

網頁爬蟲 - python 爬取網站并解析非json內容

瀏覽：215日期：2022-06-27 10:19:15

問題描述

小弟剛學會獲得json的內容，但今天爬的網站返回的并不是json內容并且會有一個隨機數的生成在每次請求鏈接的后面

不知道會不會影響我要爬的內容

需要獲得內容是下圖中間的內容

網頁爬蟲 - python 爬取網站并解析非json內容網站鏈接 http://www.szse.cn/main/discl...

我自己嘗試的代碼：

import requestsdir = ’/Users/S1Lence/Desktop/new_html/szse/許可類重組問詢函’headers = {’Host’: ’www.szse.cn’, ’Referer’: ’http://www.szse.cn/main/disclosure/jgxxgk/wxhj/’, ’User-Agent’: ’Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.109 Safari/537.36’ }payload= {’ACTIONID’: ’7’, ’AJAX’: ’AJAX-TRUE’, ’CATALOGID’: ’main_wxhj’, ’TABKEY’: ’tab1’, ’selecthjlb’: ’許可類重組問詢函’, ’tab1PAGENO’: ’1’, ’tab1PAGECOUNT’: ’7’, ’tab1RECORDCOUNT’: ’63’, ’REPORT_ACTION’: ’navigate’}res = requests.post(’http://www.szse.cn/szseWeb/FrontControllere’, data=payload)print(res.text)

輸出的內容并不是我想要的求解應該怎么爬

問題解答

回答1：

把他的header信息拷過來用。。

回答2：

你post的url地址寫錯了，應該是

http://www.szse.cn/szseWeb/FrontController.szse

Python 編程

上一條：numpy - python [:,2][:,None]是什么意思下一條：（python)關于如何做到按win+R再輸入文件文件名就可以運行？

相關文章：

1. html5 - datatables 加載不出來數據。2. node.js - mongodb查找子對象的名稱為某個值的對象的方法3. 測試自動化html元素選擇器元素ID或DataAttribute [關閉]4. html5和Flash對抗是什么情況？5. 利用IPMI遠程安裝centos報錯！6. javascript - QQ第三方登錄的問題7. 在mac下出現了兩個docker環境8. 運行python程序時出現“應用程序發生異常”的內存錯誤？9. spring-mvc - spring-session-redis HttpSessionListener失效10. 正在使用electron和node.js做桌面應用，需要實時監聽是否有網絡連接，node或者electron是否可以做到

排行榜

					
					html5 - datatables 加載不出來數據。
運行python程序時出現“應用程序發生異常”的內存錯誤？
javascript - QQ第三方登錄的問題
node.js - mongodb查找子對象的名稱為某個值的對象的方法
測試自動化html元素選擇器元素ID或DataAttribute [關閉]
利用IPMI遠程安裝centos報錯！
在mac下出現了兩個docker環境
html5和Flash對抗是什么情況？
java - Spring boot 讀取 放在 jar 包外的，log4j 配置文件，系統有創建日志文件，不寫入日志信息。
spring-mvc - spring-session-redis HttpSessionListener失效
正在使用electron和node.js做桌面應用，需要實時監聽是否有網絡連接，node或者electron是否可以做到
				

熱門標簽

午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

網頁爬蟲 - python 爬取網站 并解析非json內容

網頁爬蟲 - python 爬取網站并解析非json內容