午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

您的位置:首頁技術(shù)文章
文章詳情頁

python - beautifulSoup4 .select(’.bnrName’) 取不到到 text 文字

瀏覽:197日期:2022-07-25 15:24:15

問題描述

背景: Python3 下使用 bs4 的 select 去獲取 ZOZO首頁上方的 coupon 信息中店鋪名字。 (國(guó)內(nèi)ip貌似看不到優(yōu)惠券信息,需要翻一下才能看到,最好是島國(guó)ip)

問題: 發(fā)現(xiàn)自己找不到他的店鋪名字在寫在什么地方,不知道怎么取,前端 js 不懂,請(qǐng)教諸位解答。謝謝。

自己的代碼如下:

import requests, bs4shopName = ’BEAUTY&YOUTH’url = ’http://zozo.jp/’def getZozoCoupon(): res = requests.get(url, headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.110 Safari/537.36'}) res.raise_for_status() soup = bs4.BeautifulSoup(res.text, ’html.parser’) elems = soup.select(’.bnrName’) return elems[0].text.strip()

如下截圖中是想要獲取的文字,python - beautifulSoup4 .select(’.bnrName’) 取不到到 text 文字

發(fā)現(xiàn)查看源碼中卻沒有文字。

<p class='couponInfo'> <p class='bnrName'>說好的文字呢。。。</p> <p class='bnrText'></p></p>

請(qǐng)教他的文字是在哪實(shí)現(xiàn)的啊,要怎么用bs4 select才出來,謝謝。

問題解答

回答1:

有可能用ajax從服務(wù)器獲取之后操作dom動(dòng)態(tài)添加的吧,在瀏覽器里執(zhí)行了js就文字也被添加進(jìn)來。而你用爬蟲爬的時(shí)候沒有執(zhí)行有關(guān)js所以也沒有添加文字。

要是真的這樣的話,你可以在瀏覽器的f12那里查看network,把獲取文字的那個(gè)http請(qǐng)求的url找出來,直接請(qǐng)求這個(gè)url獲取你需要的信息。

回答2:

我在瀏覽器中打開http://zozo.jp/查看源代碼并沒有找到你所要找的bnrNamepython - beautifulSoup4 .select(’.bnrName’) 取不到到 text 文字

回答3:

你在瀏覽器上右鍵“查看網(wǎng)頁源碼”看看能不能找得你那段文字,如果找不到,那網(wǎng)頁應(yīng)該是用js或者ajax動(dòng)態(tài)加載的,想要爬取這種動(dòng)態(tài)頁面,兩種方法,要么是自己手動(dòng)模擬請(qǐng)求,要么就用selenium去抓吧

回答4:

確實(shí)是js生成的,已經(jīng)采用headless瀏覽器模擬抓取了,謝謝大家!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 三级视频在线播放 | 欧美又粗又长 | 免费在线观看一区二区三区 | 国产女人毛片 | 97综合网| 鲁大师影院入口在线观看 | 黄色三级三级三级三级 | 超碰成人97 | 最近中文字幕第一页 | 最新av在线免费观看 | 亚洲精品中字 | 日韩动漫av | 国产三级在线看 | 欧美精品色 | 欧美三级一区 | 国产精品亚洲天堂 | 五月综合激情网 | 蜜臀久久99精品久久久无需会员 | 538精品视频 | 国产精品久久一区二区三区 | 免费一级淫片 | 国产在线视频网址 | 亚洲a网 | 激情av在线播放 | 精品在线免费视频 | 99视频这里有精品 | 欧美日在线 | 亚洲九九热| 国产综合图片 | 欧美黄色片视频 | 亚洲毛茸茸 | 成人在线免费观看视频 | 亚洲一区在线看 | 色综合区 | 日本国产在线观看 | 99精品视频在线免费观看 | 欧美国产日韩综合 | 国产在线播放av | 亚洲一区二区三区久久久 | 成人公开免费视频 | 国产69精品久久久久久久久久 |