午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

您的位置:首頁技術文章
文章詳情頁

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

瀏覽:295日期:2022-07-24 08:56:37

問題描述

想用urllib抓取上交所股票列表的xls下載鏈接,如下圖紅色小框:

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

發現抓下來的xls只有報錯信息:

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

請問要怎樣才能把有內容的xls抓下來?

代碼如下

from urllib import requestfrom datetime import datetime# -*- coding:utf-8 -*-url = ’http://query.sse.com.cn/security/stock/downloadStockListFile.do?’ ’csrcCode=&stockCode=&areaName=&stockType=1’myheaders = [(’User - Agent’, ’Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13’ ’ (KHTML, like Gecko) Version/3.1 Safari/525.13’),]opener = request.build_opener()opener.addheaders = myheadersrequest.install_opener(opener)local = '/Users/Mty/Downloads/data/' + str(datetime.now().date()) + ' .xls'request.urlretrieve(url, local)

問題解答

回答1:

可以在標紅線的url上看到返回的公司信息,剩下的就是模擬瀏覽器請求這個url了,request header中的refer一定不能省略,不然會報403

記住要模擬 refer 這一項的值。

http://blog.csdn.net/ssshen14...這個是已有的解決方案

回答2:

查看cookie,referer

標簽: Python 編程
主站蜘蛛池模板: 超碰精品 | 国产精品www. | 裸体男女树林做爰 | 中文字幕观看在线 | 日韩精品久久 | 久久精品一 | 精品一区二区三区四区五区六区 | 日本毛片视频 | 久久福利影视 | 超碰久操| 九九av | 麻豆网址 | 免费在线日本 | 欧美一级在线观看 | 国产高清黄色 | 久久五月视频 | 国产一区二区三区四区五区六区 | 日韩一区二区在线观看视频 | 91玖玖| 成人免费看片39 | 欧美精品日韩少妇 | 午夜免费视频 | xxxx操| 在线免费观看毛片 | 黄色日批网站 | 午夜国产福利视频 | 91精品久久久久久粉嫩 | 91黄色免费版| 欧美自拍视频在线观看 | 久久午夜精品 | 怡春院久久 | 亚洲成人少妇 | 国产一级二级三级在线观看 | 中文字幕在线观看不卡 | 成人在线精品视频 | 午夜免费福利在线观看 | 成人午夜小视频 | 3d动漫啪啪精品一区二区中文字幕 | 欧美精品免费一区二区三区 | 在线免费观看黄色小视频 | 在线观看免费黄色小视频 |