搜索
写经验 领红包
 > 地理

什么是聚类分析(什么是分类什么是聚类)

在生活中,很多人可能想了解和弄清楚什么是聚类的相关问题?那么关于什么是聚类分析的答案我来给大家详细解答下。

什么是聚类分析(什么是分类什么是聚类)

聚类就是将相似数据分成一组的操作。一个组叫做一个“簇”。

举例:下面是三个簇。

什么叫相似?就是数组之间差距小。那么这个差距就取决于我们采用什么样的标准来定义。

假设某所高中的某个年级中共有400 名学生,现在我们想要将这些学生在考试中取得的语文、数学、英语成绩数据化,并将他们按照“擅长或不擅长的科目相似”进行聚类。把每个学生都转换成“(语文成绩, 数学成绩, 英语成绩)”形式的数据后,就可以将两个数据(c1, m1, e1)和(c2, m2, e2)之间的差距定义为(c1-c2)2 + (m1-m2)2 + (e1-e2)2 ,其中差距小的数据就互为“相似的数据”。

决定聚类不同的第二个因素就是条件,即使用什么样的条件分簇,而这需要看我们的目的是什么。

温馨提示:通过以上关于什么是聚类内容介绍后,相信大家有新的了解,更希望可以对你有所帮助。