Radviz是一种多维数据可视化技术,它通过将数据的多维特征映射到二维平面上,辅助人们理解数据的维度特征。
然而,Radviz的可视化效果受限于维度的数量和特征的排序顺序,这将导致数据认知信息受损。该项目尝试对论文[1]技术路线复现。
首先,利用概率统计的方法捕获鸢尾花数据集不同特征维度的频率-数值关系,然后作为均值漂移算法的输入以得到升维处理;使用Dunn值何准确率来作为升维结果评价指标。
最后,利用皮尔逊系数实获得多个维度的排序序列,基于D3.JS实现可视化结果。

图1:技术路线图
- 编程语言与编辑器:
Pycharm+python Vscode+js - 环境依赖:
Python : Pandas、Numpy、Sklearn、Scipy
JS : D3.JS(d3.csv、d3.arc、d3.arc、d3.forceSimulation)

图2:鸢尾花数据原始维度可视化

图3:鸢尾花数据升维可视化
[1]基于维度扩展的Radviz可视化聚类分析方法.