午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

您的位置:首頁技術(shù)文章
文章詳情頁

html - Python爬蟲,翻頁數(shù)據(jù)怎么爬,URL不變

瀏覽:181日期:2022-08-09 14:14:12

問題描述

網(wǎng)址:http://quote.eastmoney.com/ce...我想爬所有頁的名稱數(shù)據(jù),(這里只有兩頁),判斷有沒有下一頁的條件該怎么寫呢?代碼:

from selenium import webdriverdriver=webdriver.PhantomJS()url=’http://quote.eastmoney.com/center/list.html#28003684_0_2’driver.get(url)usoup = BeautifulSoup(driver.page_source, ’xml’)n=[]while True: t=usoup.find(’table’,{’id’:’fixed’}) utable=t.find_all(’a’,{’target’:’_blank’}) for i in range(len(utable)): if i % 6 ==1: n.append(utable[i].text) if #停止條件怎么寫: break driver.find_element_by_xpath(r’//*@id='pagenav']/a[2]’).click() usoup = BeautifulSoup(driver.page_source, ’xml’)

后面這里就不會寫了。。。

問題解答

回答1:

可以判斷每一頁的條目,每一頁共20條,如果當(dāng)前頁不足20條的時候,說明此頁是最后一頁了,爬完當(dāng)前頁就該停止了

回答2:

話說 這個表格不是都有個jsonp的返回接口嗎?為什么還要爬?

回答3:

走的就是jsonp接口,直接拿就好了。

非要抓取的話,只能用selenium + phantomjs 之類的模擬頁面去獲取了。

回答4:

http://nufm.dfcfw.com/EM_Fina...{rank:[(x)],pages:(pc)}&token=7bc05d0d4c3c22ef9fca8c2a912d779c&jsName=quote_123&_g=0.5385195357178545

標(biāo)簽: Python 編程
主站蜘蛛池模板: 黄页在线观看 | 狠狠狠久久久 | 成人看片 | 国产精品视频久久久久 | 亚洲午夜影视 | 91爱爱视频 | 久久久久久国产 | 久久综合爱| 天天干天天干天天干天天 | 神马影院午夜伦 | 天天cao| 欧美三级欧美成人高清 | 涩涩网站免费 | 免费看黄色大片 | 超碰影音 | 国产传媒在线 | 亚洲高清在线视频 | 欧美综合亚洲 | 国产免费一级视频 | 国产高清视频在线观看 | 亚洲成熟少妇视频在线观看 | aaa在线免费观看 | 美女18毛片 | www视频在线观看 | 日日夜夜拍| 国产天堂网 | 美女一区二区视频 | 日日日夜夜操 | 嫩草一区二区三区 | 俺去啦最新网址 | 午夜视频一区二区三区 | 午夜噜噜噜 | 日本免费黄色小视频 | 日韩欧美在线看 | 日本久久中文 | 中文字幕一区三区 | 一区二区三区在线免费观看视频 | 国产视频一区在线播放 | 免费午夜影片 | 亚洲最大的黄色网址 | 污视频网站入口 |