午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

您的位置:首頁技術文章
文章詳情頁

網頁爬蟲 - python爬蟲翻頁問題,請問各位大神我這段代碼怎樣翻頁,還有價格要登陸后才能看到,應該怎么解決

瀏覽:368日期:2022-08-06 14:43:40

問題描述

import urllib.requestimport reweb=urllib.request.urlopen(’https://www.gpyh.com/pricebuy/index?pageNum=1&hasStock=&goodsStandardId=1931&materialDictCode=&materialGroupCode=037001&diameter=&length=&brandId=&merchantId=’)neirong=web.read()def getPage(self,pageIndex): url = self.siteURL + '?pageNum=' + str(pageIndex) request = urllib2.Request(url) response = urllib2.urlopen(request) return response.read().decode(’gbk’)jiangrenhua=neirong.decode(’UTF-8’)RegularExpression=’<td>(.*)</td>’Valuable=re.findall(RegularExpression,jiangrenhua)information=[]for i in range(173): print(Valuable[i]

問題解答

回答1:

?pageNum=' + str(pageIndex)

這一個不就是你的頁碼控制嗎?登錄后才看到那就用cookie或者用戶名密碼模擬登錄后獲取

回答2:

httplib2基本應該是所有http請求的終結者了吧。

import httplib2import urllibhttp = httplib2.Http()url=’要獲取的地址’header={’Accept’:’text/html’, ’Accept-Encoding’:’gzip, deflate, sdch’, ’Accept-Language’:’zh-CN,zh;q=0.8’, ’Cache-Control’:’max-age=0’, ’Connection’:’keep-alive’, ’Cookie’:’cookie內容’, ’Upgrade-Insecure-Requests’:’1’, ’User-Agent’:’Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36’} #要有登陸狀態才能翻頁就要模擬登陸后把cookie放進去body_value={’username’:’test’,’password’:’123456’} #表單的所有內容body_value=urllib.urlencode(body_value) #utf8編碼response, content = http.request(url, ’GET’, headers=header,body=body_value) #GET或者POST方法response.encoding = ’utf-8’#content就是返回內容

標簽: Python 編程
主站蜘蛛池模板: 国产一区二区在线观看视频 | 欧美成人综合网站 | 久久久精品 | 粉嫩av懂色av蜜臀av分享 | 国产一级精品毛片 | 久久av一区二区 | bb任你操| 久久国产精品一区二区三区 | 日韩视频精品 | 99久久久久成人国产免费 | 伊人热久久 | 亚色综合 | 天堂网视频在线 | 久久久国产精品一区二区三区 | 中文字幕日本一区 | 天天曰| 亚洲自拍小视频 | 欧美三级日本三级 | 欧美成人精品激情在线观看 | 国产精品xxxxxx | 亚洲午夜18毛片在线看 | 成人亚洲天堂 | 色女av | 一级黄色片免费 | 中文字幕一区二区三区av | 中文字幕乱码在线 | 国产精品久久久国产盗摄 | 国产一级淫片a视频免费观看 | 自拍偷拍1 | 亚洲欧美大片 | 国产高清不卡 | 国产黄色一级片 | 久久久久久久艹 | 狠狠的色 | 欧美日韩看片 | 午夜精彩视频 | 国产免费看黄 | 中文字幕在线免费观看视频 | 一区二区三区高清不卡 | 欧美精品免费在线观看 | 日韩精品久久久久久久的张开腿让 |