此题为判断题(对,错)。
第1题:
8、假定一个数据集: 有m个点,K个簇; 一半的点和簇在"较稠密的"区域; 一半的点和簇在"不太稠密的"区域; 两个区域之间是明显分离的 对给定的数据集,下面哪种情况可以最小化寻找K个簇时的平方误差?
A.在较稠密和不太稠密的区域质心分布应当相同
B.不太稠密的区域应当分配更多的质心
C.较稠密的区域应当分配更多的质心
D.以上都可以
第2题:
【判断题】非聚簇索引的信息,包含了非聚簇索引的键值和指针,每个键值项都有一个指针,并指向包含该键值的数据行。
A.Y.是
B.N.否
第3题:
5、对于新划分好的各个簇群,新质心向量的计算方法是通过计算各个簇群中所有样本各个维度均值得到的。
第4题:
6、关于K均值和DBSCAN的比较,以下说法不正确的是()。
A.DBSCAN使用基于密度的概念
B.K均值使用簇的基于层次的概念
C.K均值很难处理非球形的簇和不同大小的簇
D.DBSCAN可以处理不同大小和不同形状的簇。
第5题:
4、在KMeans聚类算法的当前迭代过程中,各个簇的质心为(1,2),(-1,3),(6,0)。那么 (2,4)和(2,0)这两个样本在下一次迭代中
A.分在同一簇中,该簇质心为(1,2)
B.分在同一簇中,该簇质心为(-1,3)
C.分在不同簇中,(2,4)在质心为(-1,3)的簇中,(2,0)在质心为(6,0)的簇中
D.以上说法都不正确