a標簽 url 正則怎么寫(python 或者js)
問題描述
<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>
我要取 href里的鏈接
6個鏈接 前三個符合條件 正則怎么寫(即鏈接中必須帶有參數viewkey page viewtype category)
第二個和第三個鏈接相同 怎么去重復(python下)
問題解答
回答1:# python 2.7import rea = ’’’<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:
提取前三個鏈接:
links= re.findall(r’href='http://www.leifengta.com.cn/wenda/(.*?=rf)'’,l_string,re.S)
去重:
new_links=set(links)
相關文章:
1. 關docker hub上有些鏡像的tag被標記““This image has vulnerabilities””2. boot2docker無法啟動3. docker-compose中volumes的問題4. javascript - mock.js可以存儲數據嗎5. docker安裝后出現Cannot connect to the Docker daemon.6. nignx - docker內nginx 80端口被占用7. java - SSH框架中寫分頁時service層中不能注入分頁類8. docker api 開發的端口怎么獲取?9. dockerfile - 為什么docker容器啟動不了?10. node.js - antdesign怎么集合react-redux對input控件進行初始化賦值

網公網安備