多测师-多培养一些优秀的测试工程师
网站地图 |   收藏本站   |   

17727591462

拓扑数据分析的三个要点

发布日期:2022-06-24 09:00:40 作者:多测师 浏览次数:

  1)TDA的输入可以是一个距离矩阵,表示任意两数据点之间的距离。

  它研究的是与坐标无关的形状,完全不受坐标的限制。这也意味着拓扑形状的构建依赖于距离函数的定义,或者说相似度概念的定义。坐标无关的特性,使得TDA可以整合来自不同平台的数据,尽管这些数据的结构不太一样,你只需要给出合理的距离函数。这是TDA的一个优点,通用性。

  举个例子,TDA在癌症分析领域的成功,这种通用性是一个重要原因。因为不同癌症数据集的指标、结构都不尽相同,而TDA可以轻松整合。

拓扑数据分析的三个要点

  2)TDA研究的数据形状,可以容忍数据小范围的变形与失真。

  想象在一块橡皮上写了一个字母”A”,你用力挤压拉扯这块橡皮,字母”A”虽然有点扭曲变形,但是“一个三角形带两个脚”这样的基本特征仍然存在。从上面“手”的例子也可以看出,TDA对小误差的容忍度很大。

  3)如果我们要粗略的描绘一个湖泊轮廓,最简洁的就是使用一个多边形。

  拓扑处理的是抽象的形状,最典型的例子就是用六边形来表示圆,这只需要用到6个点和6条边。

  TDA使用这种形式压缩数据,用有限的点和边来表示大量的数据,并且保留了数据重要的特征。

如需了解更多测试技术信息请关注:https://www.duoceshi.cn/jswz/深圳多测师软件与技术服务有限公司


查看更多 >>

推荐阅读