python - lxml.etree為什么會(huì)自動(dòng)加上加上</i>?
問題描述
正在學(xué)習(xí)lxml,代碼如下:
from lxml import etreetext = ’’’<i class='cell maincell'> <p class='title'><a target='_blank' > <span>洋鼴鼠</span></a> </p> <p><span class='tags t-small c-gray-aset'> <a >電子商務(wù)</a></span><span class='loca c-gray-aset t-small'> <a >天津</a></span> </p></i>’’’html = etree.HTML(text)print(etree.tostring(html,encoding=’utf-8’).decode(’utf-8’))
輸出如下:
<html><body><i class='cell maincell'> </i><p class='title'><a target='_blank' > <span>洋鼴鼠</span></a> </p> <p><span class='tags t-small c-gray-aset'> <a >電子商務(wù)</a></span><span class='loca c-gray-aset t-small'> <a >天津</a></span> </p></body></html>
主要不理解為什么<i>標(biāo)簽?zāi)抢飼?huì)出錯(cuò)呢?請問怎么解決這個(gè)問題?謝謝~
問題解答
回答1:主要是因?yàn)?/p>
p元素內(nèi)容分類 Flow content, palpable content.允許的內(nèi)容 Phrasing content.允許的父元素任何接受flow content的元素
i元素Content catergories Flow content, phrasing content, palpable content.允許量 phrasing content.
很顯然P元素的父元素應(yīng)該是flow content類型的,然而i并不滿足條件,也就是說這是不符合規(guī)范的。解決辦法就是i直接換為p。
相關(guān)文章:
1. 關(guān)docker hub上有些鏡像的tag被標(biāo)記““This image has vulnerabilities””2. docker-compose中volumes的問題3. boot2docker無法啟動(dòng)4. nignx - docker內(nèi)nginx 80端口被占用5. docker安裝后出現(xiàn)Cannot connect to the Docker daemon.6. docker容器呢SSH為什么連不通呢?7. node.js - antdesign怎么集合react-redux對input控件進(jìn)行初始化賦值8. dockerfile - 為什么docker容器啟動(dòng)不了?9. java - SSH框架中寫分頁時(shí)service層中不能注入分頁類10. 關(guān)于docker下的nginx壓力測試

網(wǎng)公網(wǎng)安備