午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

您的位置:首頁技術文章
文章詳情頁

網頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素,請問各位大神哪里出了問題?

瀏覽:227日期:2022-09-17 10:49:15

問題描述

用scrapy爬了圖書館書籍的書名和評論,用Chrome的檢查拔下來的Xpath,但是運行爬蟲返回的是空元素,請問各位哪里出了問題,謝謝大家。截圖:

網頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素,請問各位大神哪里出了問題?

附上我的Scrapy源碼,請大家多指教,謝謝!

from scrapy import Spiderfrom scrapy.selector import Selectorfrom CommentCrawl.items import CommentcrawlItemclass commentcrawl(Spider): name = 'commentcrawl' allowed_domains = ['http://opac.lib.bnu.edu.cn:8080'] start_urls = ['http://opac.lib.bnu.edu.cn:8080/F/S9Q2QIQV5D9R9HBHPI2KNN8JH11TRIRSIEPKYQLTAQQ17LA6B6-16834?func=full-set-set&set_number=010408&set_entry=000001&format=999', ] def parse(self,response):item = CommentcrawlItem()item[’name’] = Selector(response).xpath(’//*[@id='details2']/table/tbody/tr[1]/td[2]/a/text()’).extract()item[’comment’] = Selector(response).xpath(’//*[@id='localreview']/text()’).extract()yield item

問題解答

回答1:

頁面需要登錄才能訪問,缺少登錄操作。

回答2:

網頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素,請問各位大神哪里出了問題?

頁面被登錄攔截了。

回答3:

你把你實際獲得的內容打印或者保存完了,看看是什么內容。估計是返回的內容跟你的 Xpath 匹配不上,該登錄的登錄啊。

標簽: Python 編程
主站蜘蛛池模板: 麻豆理论片 | 一区三区视频在线观看 | 久久精品99久久久久久 | 毛片在哪里看 | 尤物天堂 | 夜夜草 | 精品一区二区视频在线观看 | 永久免费看成人av的动态图 | 在线精品亚洲欧美日韩国产 | 久久伦理片 | 久久精品99国产精品日本 | 影音先锋国产在线 | 欧美色综合天天久久综合精品 | 色日韩 | 亚洲免费视频网站 | 亚洲一区在线视频 | 国产精品免费在线视频 | 国产精品免费一区 | 999久久久国产精品 国产69精品久久久 jizz日本视频 | 中文字幕在线观看一区 | 无毒不卡| 一区二区三区不卡在线观看 | 久久99精品久久久久久园产越南 | 天天干天天干天天干天天 | 国产精品久久久久久久久久久久久久久久 | 欲色综合 | 黄网站在线播放 | 国产欧美一区二区精品性色 | 一区三区在线观看 | 久久婷婷丁香 | 91在线视频精品 | 成人综合在线视频 | 亚洲精品播放 | 天天操一操 | av黄色在线播放 | 香蕉视频一直看一直爽 | 精品小视频 | avtt天堂在线 | 884aa四虎影成人精品一区 | 在线成人播放 | 天天草天天 |