文章詳情頁
ruby - nokogiri 怎么獲取一個 html 元素自身的 text 文本但不包含起子元素的 text 文本?
瀏覽:179日期:2023-10-15 14:19:56
問題描述
<body> <p id=’p1’>111</p> <p id=’p2’>222<p id=’p3’>333 <p id=’p4’>444</p></p><p id=’p33’>bbb</p> </p></body>
比如:p2元素自身的text為222.但使用nokogiri獲取p2的text文本時,會包含p2的各級子元素的文本,比如p3和p4的text文本也包含在內。而我只想要p2自身的text文本,即只要222。
require ’nokogiri’html = Nokogiri::HTML(open ’test.html’)p2_obj = html.xpath('//*[@id=’p2’]')p2_text = p2_obj.to_s #這樣會獲取到p2各級子元素的文本
那么怎么樣才能只獲取到p2自身的text文本(即只要222,不要333 444 bbb)呢?
問題解答
回答1:p2_obj.children[0].text就是p_obj自身的text文本,也就是222,不包含333 444 bbb
標簽:
HTML
相關文章:
1. angular.js - angular內容過長展開收起效果2. docker網絡端口映射,沒有方便點的操作方法么?3. mac連接阿里云docker集群,已經卡了2天了,求問?4. 百度地圖api - Android 百度地圖 集成了定位,導航 相互的jar包有沖突?5. vim - docker中新的ubuntu12.04鏡像,運行vi提示,找不到命名.6. 為什么我ping不通我的docker容器呢???7. golang - 用IDE看docker源碼時的小問題8. html5和Flash對抗是什么情況?9. 我何時應該在Java中使用JFrame.add(component)和JFrame.getContentPane()。add(component)10. docker images顯示的鏡像過多,狗眼被亮瞎了,怎么辦?
排行榜

網公網安備