文章詳情頁

python利用K-Means算法實(shí)現(xiàn)對(duì)數(shù)據(jù)的聚類案例詳解

瀏覽：21日期：2022-06-21 08:18:43

目的是為了檢測(cè)出采集數(shù)據(jù)中的異常值。所以很明確，這種情況下的簇為2：正常數(shù)據(jù)和異常數(shù)據(jù)兩大類

1、安裝相應(yīng)的庫

import matplotlib.pyplot as plt # 用于可視化from sklearn.cluster import KMeans # 用于聚類import pandas as pd # 用于讀取文件2、實(shí)現(xiàn)聚類2.1 讀取數(shù)據(jù)并可視化

# 讀取本地?cái)?shù)據(jù)文件df = pd.read_excel('../data/output3.xls', header=0)

python利用K-Means算法實(shí)現(xiàn)對(duì)數(shù)據(jù)的聚類案例詳解

本次實(shí)驗(yàn)選擇溫度和CO2作為二維數(shù)據(jù),其中溫度含有異常數(shù)據(jù)。

plt.scatter(df['光照'], df['CO2'], linewidths=1, alpha=0.8)plt.rcParams[’font.sans-serif’] = [’SimHei’] # 用來正常顯示中文標(biāo)簽vplt.xlabel('光照')plt.ylabel('CO2')plt.grid(color='#95a5a6', linestyle='--', linewidth=1, alpha=0.4)plt.show()

python利用K-Means算法實(shí)現(xiàn)對(duì)數(shù)據(jù)的聚類案例詳解

2.2 K-means聚類

設(shè)置規(guī)定要聚的類別個(gè)數(shù)為2

data = df[['光照','CO2']] # 從原始數(shù)據(jù)中選擇該兩項(xiàng)estimator = KMeans(n_clusters=2) # 構(gòu)造聚類器estimator.fit(data) # 將數(shù)據(jù)帶入聚類模型

獲取聚類中心的值和聚類標(biāo)簽

label_pred = estimator.labels_ # 獲取聚類標(biāo)簽centers_ = estimator.cluster_centers_ # 獲取聚類中心

將聚類后的 label0 和 label1 的數(shù)據(jù)進(jìn)行輸出

x0 = data[label_pred == 0]x1 = data[label_pred == 1]plt.scatter(x0['光照'], x0['CO2'],c='red', linewidths=1, alpha=0.8,marker=’o’, label=’label0’)plt.scatter(x1['光照'], x1['CO2'],c='green', linewidths=1, alpha=0.8,marker=’+’, label=’label1’)plt.grid(c='#95a5a6', linestyle='--', linewidth=1, alpha=0.4)plt.legend()plt.show()

python利用K-Means算法實(shí)現(xiàn)對(duì)數(shù)據(jù)的聚類案例詳解

附上全部代碼

import matplotlib.pyplot as pltfrom sklearn.cluster import KMeansimport pandas as pddf = pd.read_excel('../data/output3.xls', header=0)plt.scatter(df['光照'], df['CO2'], linewidths=1, alpha=0.8)plt.rcParams[’font.sans-serif’] = [’SimHei’] # 用來正常顯示中文標(biāo)簽vplt.xlabel('光照')plt.ylabel('CO2')plt.grid(color='#95a5a6', linestyle='--', linewidth=1, alpha=0.4)plt.show()data = df[['光照','CO2']]estimator = KMeans(n_clusters=2) # 構(gòu)造聚類器estimator.fit(data) # 聚類label_pred = estimator.labels_ # 獲取聚類標(biāo)簽centers_ = estimator.cluster_centers_ # 獲取聚類結(jié)果# print('聚類標(biāo)簽',label_pred)# print('聚類結(jié)果',centers_)# predict = estimator.predict([[787.75862069, 1505]]) # 測(cè)試新數(shù)據(jù)聚類結(jié)果# print(predict)x0 = data[label_pred == 0]x1 = data[label_pred == 1]plt.scatter(x0['光照'], x0['CO2'],c='red', linewidths=1, alpha=0.8,marker=’o’, label=’label0’)plt.scatter(x1['光照'], x1['CO2'],c='green', linewidths=1, alpha=0.8,marker=’+’, label=’label1’)plt.grid(c='#95a5a6', linestyle='--', linewidth=1, alpha=0.4)plt.legend()plt.show()

到此這篇關(guān)于python利用K-Means算法實(shí)現(xiàn)對(duì)數(shù)據(jù)的聚類的文章就介紹到這了,更多相關(guān)python K-Means算法數(shù)據(jù)的聚類內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)！

Python 編程

上一條：Python基礎(chǔ)之pandas數(shù)據(jù)合并下一條：Python基礎(chǔ)之time庫詳解

相關(guān)文章：

1. IntelliJ IDEA刪除類的方法步驟2. IntelliJ IDEA創(chuàng)建web項(xiàng)目的方法3. docker /var/lib/docker/aufs/mnt 目錄清理方法4. 詳解PHP laravel中的加密與解密函數(shù)5. IntelliJ IDEA導(dǎo)出項(xiàng)目的方法6. 如何用JS實(shí)現(xiàn)簡(jiǎn)單的數(shù)據(jù)監(jiān)聽7. IntelliJ IDEA配置Tomcat服務(wù)器的方法8. Intellij IDEA 關(guān)閉和開啟自動(dòng)更新的提示?9. 刪除docker里建立容器的操作方法10. IntelliJ IDEA設(shè)置默認(rèn)瀏覽器的方法

排行榜

					
					idea自定義快捷鍵的方法步驟
詳解PHP laravel中的加密與解密函數(shù)
Intellij IDEA 關(guān)閉和開啟自動(dòng)更新的提示?
IntelliJ IDEA設(shè)置默認(rèn)瀏覽器的方法
如何用JS實(shí)現(xiàn)簡(jiǎn)單的數(shù)據(jù)監(jiān)聽
IntelliJ IDEA配置Tomcat服務(wù)器的方法
IntelliJ IDEA導(dǎo)出項(xiàng)目的方法
IntelliJ IDEA創(chuàng)建web項(xiàng)目的方法
刪除docker里建立容器的操作方法
docker /var/lib/docker/aufs/mnt 目錄清理方法
IntelliJ IDEA刪除類的方法步驟