文章詳情頁

java - 如何用正則提取html內容

瀏覽：207日期：2023-12-04 08:35:21

問題描述

<p class='info-detail-head-classify-subname'><a href='http://www.leifengta.com.cn/wenda/11492.html' target='_blank'>財富</a></p> 想用java 提取財富兩個字請問用正則怎么提取用jsoup會不會簡單一點

問題解答

回答1：

可以使用jsoup和regex, 推薦使用jsoup!jsoup document:https://jsoup.org/cookbook/in...http://www.open-open.com/jsoup/

import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element;import java.util.regex.Matcher; import java.util.regex.Pattern;public class Main { public static void main(String[] args) {// 方法１: jsoup String html = '<p class='info-detail-head-classify-subname'><a href='http://www.leifengta.com.cn/wenda/11492.html' target='_blank'>財富</a></p>';Document doc = Jsoup.parse(html); Element element = doc.getElementById('info_detail_head_classify_type'); System.out.println(element.text());// 方法2: regex Pattern r = Pattern.compile('<a.*>(.*)</a>'); Matcher m = r.matcher(html); if (m.find()) {System.out.println(m.group(1)); }} }回答2：

<a[^>]*>([^<]*)</a>

取<a></a>中的內容

HTML

上一條：java - 反射數組:為什么每次獲取Modifiers都是public,abstract,以及final下一條：java - Kafka:如果消息的保存策略被設置為2天，那么在一個消息被發布的兩天時間內，它都是可以被消費的。之后它將被丟棄以釋放空間。

相關文章：

1. 關docker hub上有些鏡像的tag被標記““This image has vulnerabilities””2. docker鏡像push報錯3. Docker for Mac 創建的dnsmasq容器連不上/不工作的問題4. javascript - 在 model里定義的引用表模型時，model為undefined。5. 利用IPMI遠程安裝centos報錯！6. node.js - mongodb查找子對象的名稱為某個值的對象的方法7. 運行python程序時出現“應用程序發生異常”的內存錯誤？8. html5和Flash對抗是什么情況？9. phpstudy8.1沒集成mysql-front10. 前端 - @media query 使用出現的問題？

排行榜

					
					Docker for Mac 創建的dnsmasq容器連不上/不工作的問題
關docker hub上有些鏡像的tag被標記““This image has vulnerabilities””
docker鏡像push報錯
運行python程序時出現“應用程序發生異常”的內存錯誤？
node.js - mongodb查找子對象的名稱為某個值的對象的方法
前端 - @media query 使用出現的問題？
javascript - 在 model里定義的 引用表模型時，model為undefined。
phpstudy8.1沒集成mysql-front
利用IPMI遠程安裝centos報錯！
html5和Flash對抗是什么情況？
docker  下面創建的IMAGE 他們的 ID 一樣？這個是怎么回事？？？？
				

熱門標簽

午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

java - 如何用正則提取html內容