K-mean聚类(k-mean聚类 腰围和血压血糖)

liftword2个月前 (05-02)技术文章21

首先再补充一下昨天的主成分分析,给大家补充的是通过sklenrn库如何使用主成分分析的。python自带的机器学习包里面包含了很多种常见的算法,给那些不是学习计算机的同学也能够方便的使用算法进行分析。

from sklearn.decomposition import PCA #导入机器学习包里面的PCA主成分分析
pca=PCA(n_components=0.95)#设置主成分分析的参数,其中这里设置是累计贡献度95%
pca.fix(x)#导入数据使用主成分分析 
Y=pca.transform(X)#提取主成分,也就是昨天所说的Y

训练后的pca对象中还有我们昨天通过一步步计算出来的属性。components_特征向量,explained_variance_特征值等等。具体属性大家可以查看源代码。

K-mean聚类原理

今天给大家分享一下K-mean聚类的代码。K-mean聚类是属于无监督学习的一种数据挖掘算法。K-mean聚类的原理其实非常简单,就是计算距离,距离哪个聚类点近就归为哪一个聚类点。聚类点的个数由测试者自行决定,至于聚类点的个数应该选多少个我也不太清楚(哈哈哈)。其次聚类点的更新是由后面加入点决定的,简单来说就是如果这一类有5个,那么就是距离这5个距离相加起来最近的位置的点即为新的距离中心点。就比如以下图片,图片中5个点距离最近的中心点即为新的聚类点(也可以成为质心)。

距离的计算方法有很多种,比如欧几里得聚类、曼哈顿聚类、切比雪夫聚类等等,甚至你还可以自己设置如何计算,通常都是使用第一个。

K-mean聚类代码

直接使用机器学习包中的KMeans模块即可。

from sklearn.cluster import KMeans
model=KMeans(n_clusters='聚类个数',random_state=0,max_iter='迭代次数')
model.fix(x)#训练数据
c=model.labels_#保存聚类结果

每日日语语法:

これ それ あれ用法。

以上意思均相当于中文的:这个、那个、那个。

これ距离说话人较近的物体或事物。

それ距离听说话人较近的物体或事物。

あれ距离两个人较远的物体或事物。

相关文章

主成分分析PCA可视化(简要说明主成分分析pca的基本原理)

前面已经介绍了主成分分析的内容,并使用Python和R语言进行了演示。主成分分析里面很重要的一个作用,高维数据降维后的可视化,之前只是简单的讲了一下,这一篇就专门针对主成分分析的可视化来进行详细的介绍...

Python 数据分析实例——典型相关分析

简单相关系数描述两组变量的相关关系存在一个缺点:只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数,使问题显得复杂,难以从整体描述。本节讲述的典型相关...

Python编程 - 基于OpenCV实现人脸识别(实践篇)爬虫+人脸识别

一.案例概述本案例需要一定的Python编程基础并掌握OpenCV基本使用。 时间仓促:初略编写文档效果如下:开发环境:操作系统:Windows 10开发工具:PyCharm 2019.2版本pyth...

Python计算机视觉编程 第一章 基本的图像操作和处理

以下是使用Python进行基本图像操作和处理的示例代码:使用PIL库加载图像:from PIL import Image image = Image.open("image.jpg"...

ES数据不完整?(es数据包)

问题诊断实验数据缺失常见于样本丢失或记录错误。第一步通过箱线图识别异常值分布,热力图定位缺失字段集中区域。案例:某基因测序数据缺失15%样本,热力图显示缺失集中在第3-5实验批次新手急救包1 数据清洗...