K-mean聚类(k-mean聚类 腰围和血压血糖)

liftword1周前 (05-02)技术文章2

首先再补充一下昨天的主成分分析,给大家补充的是通过sklenrn库如何使用主成分分析的。python自带的机器学习包里面包含了很多种常见的算法,给那些不是学习计算机的同学也能够方便的使用算法进行分析。

from sklearn.decomposition import PCA #导入机器学习包里面的PCA主成分分析
pca=PCA(n_components=0.95)#设置主成分分析的参数,其中这里设置是累计贡献度95%
pca.fix(x)#导入数据使用主成分分析 
Y=pca.transform(X)#提取主成分,也就是昨天所说的Y

训练后的pca对象中还有我们昨天通过一步步计算出来的属性。components_特征向量,explained_variance_特征值等等。具体属性大家可以查看源代码。

K-mean聚类原理

今天给大家分享一下K-mean聚类的代码。K-mean聚类是属于无监督学习的一种数据挖掘算法。K-mean聚类的原理其实非常简单,就是计算距离,距离哪个聚类点近就归为哪一个聚类点。聚类点的个数由测试者自行决定,至于聚类点的个数应该选多少个我也不太清楚(哈哈哈)。其次聚类点的更新是由后面加入点决定的,简单来说就是如果这一类有5个,那么就是距离这5个距离相加起来最近的位置的点即为新的距离中心点。就比如以下图片,图片中5个点距离最近的中心点即为新的聚类点(也可以成为质心)。

距离的计算方法有很多种,比如欧几里得聚类、曼哈顿聚类、切比雪夫聚类等等,甚至你还可以自己设置如何计算,通常都是使用第一个。

K-mean聚类代码

直接使用机器学习包中的KMeans模块即可。

from sklearn.cluster import KMeans
model=KMeans(n_clusters='聚类个数',random_state=0,max_iter='迭代次数')
model.fix(x)#训练数据
c=model.labels_#保存聚类结果

每日日语语法:

これ それ あれ用法。

以上意思均相当于中文的:这个、那个、那个。

これ距离说话人较近的物体或事物。

それ距离听说话人较近的物体或事物。

あれ距离两个人较远的物体或事物。

相关文章

用Python进行机器学习(11)-主成分分析PCA

我们在机器学习中有时候需要处理很多个参数,但是这些参数有时候彼此之间是有着各种关系的,这个时候我们就会想:是否可以找到一种方式来降低参数的个数呢?这就是今天我们要介绍的主成分分析,英文是Princip...

主成分分析PCA可视化(简要说明主成分分析pca的基本原理)

前面已经介绍了主成分分析的内容,并使用Python和R语言进行了演示。主成分分析里面很重要的一个作用,高维数据降维后的可视化,之前只是简单的讲了一下,这一篇就专门针对主成分分析的可视化来进行详细的介绍...

从实践的角度理解主成分分析(从实践的角度看)

主成分分析是提高机器学习算法处理大量数据和特征的性能的最常用方法之一。然而,有时PCA可能太复杂,太技术化,甚至太乏味,无法正确理解基本原理,因此,我决定写这篇文章,以实际的方式阐明每一步,并易于初学...

机器学习——PCA 主成分分析(pca主成分分析原理)

PCACreated: Apr 26, 2020 4:40 PMPCA 简介PCA是一种降维算法属性:- 在数据集中保留了最多的信息,同时将数据转换到较低维的子空间- 主要的成分彼此正交(方差最大)-...

Python 数据分析实例——典型相关分析

简单相关系数描述两组变量的相关关系存在一个缺点:只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数,使问题显得复杂,难以从整体描述。本节讲述的典型相关...