标签:axes people -- random kmeans KMeans state 聚类
1、什么是K均值聚类
-
k均值聚类是最简单也是最常用的聚类算法之一。它试图找到代表数据特定区域的簇中心(Cluster Center)
-
K-means算法过程
1.随机布置K个特征空间内的点作为初始的聚类中心
2.对于根据每个数据的特征向量,从K个聚类中心中寻找距离最近的一个,并且把该数据标记为从属这个聚类中心
3.在所有的数据都被标记过聚类中心之后,根据这些数据新分配的类簇,重新对K个聚类中心做计算
4.如果一轮下来,所有的数据点从属的聚类中心与上一次的分配的类簇没有变化,那么可以迭代停止,否者回到第2步继续循环mglearn.plots.plot_kmeans_algorithm()
mglearn.plots.plot_kmeans_boundaries()
2、KMeans应用于模拟数据
#获取数据集
X, y = make_blobs(n_samples=100,n_features=2,random_state=42)
#Kmeans模型实例化
kmeans = KMeans(n_clusters=3,random_state=0)
kmeans=kmeans.fit(X)
#打印kmeans.labels_属性
print("labels:{}".format(kmeans.labels_))
标签:axes,people,--,random,kmeans,KMeans,state,聚类 来源: https://www.cnblogs.com/caolanying/p/16225057.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。