多测师-多培养一些优秀的测试工程师
网站地图 |   收藏本站   |   

17727591462

拓扑数据分析的主要步骤

发布日期:2022-06-24 09:01:57 作者:多测师 浏览次数:

  用一个滤波函数对每个数据点计算一个滤波值。这个滤波函数可以是数据矩阵的线性投影,比如PCA。也可以是距离矩阵的密度估计或者中心度指标,比如L-infinity(L-infinity的取值是该点到离它最远的点的距离,是一个中心度指标)。

  数据点按照其滤波值,从小到大被分到不同的滤波值区间里。参照下图中“手”被切成等宽的块。但需要注意的是,相邻的滤波值区间设置有一定的重叠区域,也就是重叠区域的点同时属于两个区间(这一点很重要)。

拓扑数据分析的主要步骤

  对每个区间里的数据分别做聚类。

  把上一步骤中各区间聚类的得到的小类放在一起,每一个小类用一个大小不同的圆表示。若两个类之间存在相同的原始数据点(这就是区间需要相互重叠的原因),则在它们之间加上一条边。

  对上述圆和边组成的图形施加一层力学布局,让其达到平衡,就得到最终的“数据图形”。

如需了解更多测试技术信息请关注:https://www.duoceshi.cn/jswz/深圳多测师软件与技术服务有限公司


查看更多 >>

推荐阅读