国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - python中實現k-means聚類算法詳解

python中實現k-means聚類算法詳解

2020-12-17 00:30mrbean Python

這篇文章主要介紹了python中實現k-means聚類算法詳解,具有一定參考價值,需要的朋友可以了解下。

算法優缺點:

優點:容易實現
缺點:可能收斂到局部最小值,在大規模數據集上收斂較慢
使用數據類型:數值型數據

算法思想

k-means算法實際上就是通過計算不同樣本間的距離來判斷他們的相近關系的,相近的就會放到同一個類別中去。

1.首先我們需要選擇一個k值,也就是我們希望把數據分成多少類,這里k值的選擇對結果的影響很大,Ng的課說的選擇方法有兩種一種是elbow method,簡單的說就是根據聚類的結果和k的函數關系判斷k為多少的時候效果最好。另一種則是根據具體的需求確定,比如說進行襯衫尺寸的聚類你可能就會考慮分成三類(L,M,S)等

2.然后我們需要選擇最初的聚類點(或者叫質心),這里的選擇一般是隨機選擇的,代碼中的是在數據范圍內隨機選擇,另一種是隨機選擇數據中的點。這些點的選擇會很大程度上影響到最終的結果,也就是說運氣不好的話就到局部最小值去了。這里有兩種處理方法,一種是多次取均值,另一種則是后面的改進算法(bisecting K-means)

3.終于我們開始進入正題了,接下來我們會把數據集中所有的點都計算下與這些質心的距離,把它們分到離它們質心最近的那一類中去。完成后我們則需要將每個簇算出平均值,用這個點作為新的質心。反復重復這兩步,直到收斂我們就得到了最終的結果。

函數

loadDataSet(fileName)

從文件中讀取數據集

distEclud(vecA, vecB)

計算距離,這里用的是歐氏距離,當然其他合理的距離都是可以的

randCent(dataSet, k)

隨機生成初始的質心,這里是雖具選取數據范圍內的點

kMeans(dataSet, k, distMeas=distEclud, createCent=randCent)

kmeans算法,輸入數據和k值。后面兩個事可選的距離計算方式和初始質心的選擇方式

show(dataSet, k, centroids, clusterAssment)

可視化結果

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
#coding=utf-8
from numpy import *
def loadDataSet(fileName):
 dataMat = []
 fr = open(fileName)
 for line in fr.readlines():
 curLine = line.strip().split('\t')
 fltLine = map(float, curLine)
 dataMat.append(fltLine)
 return dataMat
#計算兩個向量的距離,用的是歐幾里得距離
def distEclud(vecA, vecB):
 return sqrt(sum(power(vecA - vecB, 2)))
#隨機生成初始的質心(ng的課說的初始方式是隨機選K個點)
def randCent(dataSet, k):
 n = shape(dataSet)[1]
 centroids = mat(zeros((k,n)))
 for j in range(n):
 minJ = min(dataSet[:,j])
 rangeJ = float(max(array(dataSet)[:,j]) - minJ)
 centroids[:,j] = minJ + rangeJ * random.rand(k,1)
 return centroids
def kMeans(dataSet, k, distMeas=distEclud, createCent=randCent):
 m = shape(dataSet)[0]
 clusterAssment = mat(zeros((m,2)))#create mat to assign data points
     #to a centroid, also holds SE of each point
 centroids = createCent(dataSet, k)
 clusterChanged = True
 while clusterChanged:
 clusterChanged = False
 for i in range(m):#for each data point assign it to the closest centroid
  minDist = inf
  minIndex = -1
  for j in range(k):
  distJI = distMeas(centroids[j,:],dataSet[i,:])
  if distJI < minDist:
   minDist = distJI; minIndex = j
  if clusterAssment[i,0] != minIndex:
  clusterChanged = True
  clusterAssment[i,:] = minIndex,minDist**2
 print centroids
 for cent in range(k):#recalculate centroids
  ptsInClust = dataSet[nonzero(clusterAssment[:,0].A==cent)[0]]#get all the point in this cluster
  centroids[cent,:] = mean(ptsInClust, axis=0) #assign centroid to mean
 return centroids, clusterAssment
def show(dataSet, k, centroids, clusterAssment):
 from matplotlib import pyplot as plt
 numSamples, dim = dataSet.shape
 mark = ['or', 'ob', 'og', 'ok', '^r', '+r', 'sr', 'dr', '<r', 'pr']
 for i in xrange(numSamples):
 markIndex = int(clusterAssment[i, 0])
 plt.plot(dataSet[i, 0], dataSet[i, 1], mark[markIndex])
 mark = ['Dr', 'Db', 'Dg', 'Dk', '^b', '+b', 'sb', 'db', '<b', 'pb']
 for i in range(k):
 plt.plot(centroids[i, 0], centroids[i, 1], mark[i], markersize = 12)
 plt.show()
def main():
 dataMat = mat(loadDataSet('testSet.txt'))
 myCentroids, clustAssing= kMeans(dataMat,4)
 print myCentroids
 show(dataMat, 4, myCentroids, clustAssing)
 
if __name__ == '__main__':
 main()

這里是聚類結果,還是很不錯的啦

python中實現k-means聚類算法詳解

但是有時候也會收斂到局部最小值,就像下面這樣,就是不幸收斂到局部最優了

python中實現k-means聚類算法詳解

總結

以上就是本文關于python中實現k-means聚類算法詳解的全部內容,希望對大家有所幫助。有什么問題可以隨時留言,小編會及時回復大家的。感謝朋友們對本站的支持!

原文鏈接:http://www.cnblogs.com/MrLJC/p/4127553.html

延伸 · 閱讀

精彩推薦
Weibo Article 1 Weibo Article 2 Weibo Article 3 Weibo Article 4 Weibo Article 5 Weibo Article 6 Weibo Article 7 Weibo Article 8 Weibo Article 9 Weibo Article 10 Weibo Article 11 Weibo Article 12 Weibo Article 13 Weibo Article 14 Weibo Article 15 Weibo Article 16 Weibo Article 17 Weibo Article 18 Weibo Article 19 Weibo Article 20 Weibo Article 21 Weibo Article 22 Weibo Article 23 Weibo Article 24 Weibo Article 25 Weibo Article 26 Weibo Article 27 Weibo Article 28 Weibo Article 29 Weibo Article 30 Weibo Article 31 Weibo Article 32 Weibo Article 33 Weibo Article 34 Weibo Article 35 Weibo Article 36 Weibo Article 37 Weibo Article 38 Weibo Article 39 Weibo Article 40
主站蜘蛛池模板: 中文字幕国产 | 亚洲国产精品久久久久久 | 久久久精品网 | 午夜精品视频在线观看 | 国产欧美日韩综合精品一区二区 | 日韩综合网 | 欧美一区二区激情视频 | 午夜视频免费 | 欧美一区二区黄色 | 亚洲永久免费 | 亚洲一区二区三区高清 | 亚洲国产精品久久久久久久久久久 | 黄色在线观看网站 | 亚洲精品久久久久久久久久久久久 | 欧美精品在线一区二区三区 | 日韩成人免费视频 | 91羞羞 | 一区二区三区免费 | 香蕉大人久久国产成人av | 亚洲天堂第一页 | 一区二区福利 | 在线免费日韩 | 日本三级网址 | 91精品国产综合久久福利软件 | 国产一区二区在线播放 | 波多野结衣一二三四区 | av成人一区二区 | 国产一区二区三区免费播放 | 中日韩一线二线三线视频 | 精品视频免费观看 | 久久蜜桃精品一区二区三区综合网 | 成人av片在线观看 | 久草成人| 免费观看a毛片 | 精品国产不卡一区二区三区 | 99热这里有精品 | 亚洲黄色高清 | 国产精品免费大片 | 欧美在线观看一区 | 日本不卡免费新一二三区 | 天天精品 |