如何使用Python 對(duì)缺失值進(jìn)行處理
問題描述
最近項(xiàng)目一直在研究如何處理缺失值,因?yàn)槟脕?lái)分析的數(shù)據(jù)多種多樣,缺失值也占了一小部分,讓人頭痛的有兩個(gè)問題:1.R語(yǔ)言里有一個(gè)專門處理缺失值的mice包,那么萬(wàn)能的Python里有沒有相似的呢?2.如何對(duì)含有字符串類型的缺失值進(jìn)行填充呢?聚類啊回歸都是相對(duì)于數(shù)值型來(lái)說(shuō)的,那么對(duì)于字符型有什么好的算法或者有什么好的封裝的包來(lái)處理呢?求大神解答。PS:額,樣例的話,比較不好描述,就如下:name,password,age,address張三,123456,15.3,sichuang李四,12,12.2,wuhan王五,232,12,錢六,,23,nanchang哈哈,123456,,lal啦啦,123123,,mmm
我們希望如R語(yǔ)言中的mice包一樣,能使用Python很快的填充里面的缺失值(當(dāng)然這個(gè)例子里面的信息關(guān)聯(lián)性不大,但是要處理的數(shù)據(jù)里關(guān)聯(lián)性比較多),再也如例子中,通過(guò)其他的屬性,將屬于字符串類型的address填充完整,就是第二個(gè)問題。
問題解答
回答1:#文本保存到1.txt,刪除最后一行的address值name,password,age,address張三,123456,15.3,sichuang李四,12,12.2,wuhan王五,232,12,錢六,,23,nanchang哈哈,123456,,lal啦啦,123123,,
import pandas as pddf = pd.read_table(’1.txt’, header=0, sep=’,’)#添加一列df[’new’] = ’新值’#按當(dāng)前行的其他列,填充address值df[’address’] = df.apply(lambda x: x[’new’] if pd.isnull(x[’address’]) else x[’address’], axis=1)print df回答2:
PyMICE is a Python? library for mice behavioural data analysis.你可以看看是不是你要的?https://neuroinflab.wordpress...http://neuroinflab.github.io/...
相關(guān)文章:
1. 測(cè)試自動(dòng)化html元素選擇器元素ID或DataAttribute [關(guān)閉]2. html5 - datatables 加載不出來(lái)數(shù)據(jù)。3. javascript - QQ第三方登錄的問題4. html5和Flash對(duì)抗是什么情況?5. 利用IPMI遠(yuǎn)程安裝centos報(bào)錯(cuò)!6. node.js - mongodb查找子對(duì)象的名稱為某個(gè)值的對(duì)象的方法7. 運(yùn)行python程序時(shí)出現(xiàn)“應(yīng)用程序發(fā)生異常”的內(nèi)存錯(cuò)誤?8. 在mac下出現(xiàn)了兩個(gè)docker環(huán)境9. 正在使用electron和node.js做桌面應(yīng)用,需要實(shí)時(shí)監(jiān)聽是否有網(wǎng)絡(luò)連接,node或者electron是否可以做到10. spring-mvc - spring-session-redis HttpSessionListener失效

網(wǎng)公網(wǎng)安備