python - Notepad2與PyCharm區別
問題描述
同樣的代碼在 Notepad 環境(測試過記事本)過不了,在 Pycharm 可以過( Python3.5 )代碼:
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data = data.decode(’UTF-8’)
這條語句,兩個環境都可以過
data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
在 Pycharm 顯示爬出的網頁,在 cmd 窗口顯示
UnicodeEncodeError: ’gbk’ codec can’t encode character ’xbb’ in position 26830:illegal multibyte sequence
必須去除無效字符。
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
這樣可以過,求解釋
問題解答
回答1:你遇到的可能和我一樣是python編碼問題,或者使用的terminal的編碼支持問題??纯聪旅娴膯栴}。
【python編碼問題?】分享自@SegmentFault,傳送門:/q/10...
相關文章:
1. Docker for Mac 創建的dnsmasq容器連不上/不工作的問題2. 關于docker下的nginx壓力測試3. docker - 如何修改運行中容器的配置4. docker鏡像push報錯5. 關docker hub上有些鏡像的tag被標記““This image has vulnerabilities””6. 我何時應該在Java中使用JFrame.add(component)和JFrame.getContentPane()。add(component)7. javascript - 請指條明路,angular的$event,在select中卻是undefined?8. html5和Flash對抗是什么情況?9. docker 下面創建的IMAGE 他們的 ID 一樣?這個是怎么回事????10. html - css氣泡,實現“倒三角(不知道算不算三角了)”可透明的。

網公網安備