午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

您的位置:首頁技術文章
文章詳情頁

python - 爬蟲獲取網站數據,出現亂碼怎么解決。

瀏覽:199日期:2022-08-04 09:36:09

問題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫的很簡單,但是print出來的是亂碼嘗試了 print str.decode(“utf-8“”)但是報錯UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問題解答

回答1:

str = response.read()這句有兩個問題:1、str是內置關鍵字必須更改為其他變量名2、查看網頁源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應解碼

小建議這種小程序寫個函數會比用類來更加方便,無論是使用還是實現

回答2:

推測用的是sublime text?參考這個

回答3:

這兒應該是encode不是decode,而且你的變量名居然是跟內置關鍵字名字一樣

回答4:

應該是encode吧

標簽: Python 編程
主站蜘蛛池模板: 免费av大片| 亚洲v视频| 午夜男人视频 | 国产欧美一区二区三区在线观看视频 | 超碰丝袜 | 欧美视频亚洲视频 | 精品999视频 | 另类综合网 | 狠狠搞狠狠搞 | 国产激情二区 | 天天操好逼| 一区二区国产在线观看 | 看全色黄大色黄大片大学生 | 精品一区二区三区视频 | 高清一区二区三区 | 99热国产 | 最新中文字幕av专区 | 中文字幕在线日韩 | x88av在线| 美女久久久久久久 | 日本色网站 | 丁香六月婷婷 | 日本欧美在线视频 | 精品免费一区二区三区 | 男女做爰猛烈动高潮大叫 | 毛片网站免费观看 | 在线观看的av网址 | 狠狠操91| 免费视频一区二区 | 黄色剧场| 91久久国产综合久久91精品网站 | 国产精品高清在线观看 | 久久精品伦理 | 国产精品一区二区久久 | 日本黄色视 | 十大污网站 | 亚洲免费网站在线观看 | 中文字幕高清在线观看 | 偷拍第一页 | 天堂社区av | 99只有精品|