午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

您的位置:首頁技術文章
文章詳情頁

網頁爬蟲 - python爬蟲翻頁問題,請問各位大神我這段代碼怎樣翻頁,還有價格要登陸后才能看到,應該怎么解決

瀏覽:386日期:2022-08-06 14:43:40

問題描述

import urllib.requestimport reweb=urllib.request.urlopen(’https://www.gpyh.com/pricebuy/index?pageNum=1&hasStock=&goodsStandardId=1931&materialDictCode=&materialGroupCode=037001&diameter=&length=&brandId=&merchantId=’)neirong=web.read()def getPage(self,pageIndex): url = self.siteURL + '?pageNum=' + str(pageIndex) request = urllib2.Request(url) response = urllib2.urlopen(request) return response.read().decode(’gbk’)jiangrenhua=neirong.decode(’UTF-8’)RegularExpression=’<td>(.*)</td>’Valuable=re.findall(RegularExpression,jiangrenhua)information=[]for i in range(173): print(Valuable[i]

問題解答

回答1:

?pageNum=' + str(pageIndex)

這一個不就是你的頁碼控制嗎?登錄后才看到那就用cookie或者用戶名密碼模擬登錄后獲取

回答2:

httplib2基本應該是所有http請求的終結者了吧。

import httplib2import urllibhttp = httplib2.Http()url=’要獲取的地址’header={’Accept’:’text/html’, ’Accept-Encoding’:’gzip, deflate, sdch’, ’Accept-Language’:’zh-CN,zh;q=0.8’, ’Cache-Control’:’max-age=0’, ’Connection’:’keep-alive’, ’Cookie’:’cookie內容’, ’Upgrade-Insecure-Requests’:’1’, ’User-Agent’:’Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36’} #要有登陸狀態才能翻頁就要模擬登陸后把cookie放進去body_value={’username’:’test’,’password’:’123456’} #表單的所有內容body_value=urllib.urlencode(body_value) #utf8編碼response, content = http.request(url, ’GET’, headers=header,body=body_value) #GET或者POST方法response.encoding = ’utf-8’#content就是返回內容

標簽: Python 編程
主站蜘蛛池模板: 免费黄色片子 | 国产欧美自拍 | 欧美成人精品激情在线观看 | 久久亚洲国产 | av中文在线| 国产激情二区 | 久久久999精品视频 日韩在线天堂 | 在线观看精品视频 | 天天综合视频 | 一级大黄色片 | 性感毛片 | 亚洲砖区区免费 | 狠狠欧美| beeg欧美| 婷婷色在线观看 | 日本在线观看网址 | 欧美性生交 | 欧美日韩综合网 | 免费精品在线 | 天堂网av手机版 | 男人的天堂欧美 | 亚洲阿v天堂 | 日本一级二级视频 | 鲁大师在线高清在线播放免费观看 | 日韩中文在线视频 | 福利网在线观看 | 四虎成人精品永久免费av九九 | av国产精品| 国产一级精品视频 | 日韩另类视频 | 久久福利精品 | 亚洲第一视频在线播放 | 超碰2021| 性色av一区二区三区在线观看 | 性做爰裸体按摩视频 | 国产麻豆久久 | 午夜av免费在线观看 | 午夜高清| 麻豆国产一区二区三区四区 | 伊人成综合 | 国产极品久久久 |