数据可视化笔记 -- 整合

这篇具有很好参考价值的文章主要介绍了数据可视化笔记 -- 整合。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1 intro

何为可视化?

可视形式进行解释的动作、过程

Function上

功能
线
区域
间隔(柱状图
路径
纲要(schema

从分割来看

  1. 多边形
  2. 外形轮廓/contour

形式上 Form

  1. 大小
  2. 形状
  3. 旋转 rotation

颜色

  • 亮度
  • 颜色 Hue
  • 饱和度 saturation

材质

  1. 颗粒度 granularity
  2. 样式 pattern
  3. 方向 orientation
光学
模糊
透明度

从cue上

  1. cartesian
  2. polar
  3. geographic

重要性

  • 科学性
    • 可视化手段,提升数据分析效率
  • 重要性
  • 急迫性
input 图像 input 知识
output图像 图像处理 计算机视觉
output知识 图形学/数据可视化 others

作用

  • 记录
  • 验证假设
  • 分析推理
  • 交流

感知与颜色模型

感知与认知

  • visual attention
  • visual recognition

颜色模型

  • color model
  • harmonious model
  • color channel

可视化模型

  1. 图数据可视化
  • graph layout
  • community detection (不同的类的联系)
  • edge bundling 边缘捆扎
  1. 层次
  2. 文本
  3. 地理数据
  4. 时空数据
  5. 科学
    1. 医学数据
    2. 高维数据
  6. 大数据可视化
  7. 跨媒体可视化
  8. AI可视化

分析

  1. 交互系统
  2. 方法评估
  3. 可视化交互分类
  4. 用户评估

2. tool

数据处理

爬取: BeautifulSoup

数据分析: Panda
Excel, Shell, Cygwin

前端框架

2D: AngularJS(MVC) React(JSX) VUE

3D: three.js Unity3D

Qt

设计类

2D

Photoshop
Pixelmator
AI
CorelDraw
Vector Magic

3D:

3DMax
Maya
Blender

可视化

2d

qlik
tableau
db
echarts
leaflet
arcgis

vtk

3 可视分析

以下概念入手

  1. 任务 task
    1. 问题
    2. 目标
    3. 假设
  2. 数据 data
    1. 属性
    2. 格式
  3. 领域 domain
    1. 元数据
    2. 语义
    3. 概念
    4. 惯例

整合以上内容 – 数据处理算法 可视编码 – 图形标记 视觉通道

前期

  • 需求分析:明确
  • 任务设计:少变换

数据

data 获取

  • 属性
    • 数学:维度
    • AI: 特征
    • 统计: 变量
  • 格式
    • 类型
      • 1D 集合,序列
      • temporal
      • 2D 地图
      • 3D 形状
      • nD
      • 树 hierarchy
      • 网 graph
    • 存储格式
      • bool
      • int…
    • 抽象格式
      • 图片
      • 操作
    • 可排序性
    • 数值

data 变换

目的: 简化数据 解决特定问题 提供可视化设计选择

  • 线性变换
    • 对数变换
    • 其他函数
  • 归一化
    • 【分布】映射数据
    • color/size/coordinate
    • 区间
  • 拟合/光滑
    • 数据趋势
    • m i n ∑ i = 1 n ( y m − y i ) 2 min\sum^n_{i=1}(y_m-y_i)^2 mini=1n(ymyi)2

统计采样

definition:
为近似原分布的特征,统计分布中选出样本

  • 因素 本身精度
  • data测量精度
  • 细节
  • 成本

如随机采样,泊松采样

可视设计

统计计算

  1. 中位数
    1. 避免极端值
    2. 计算耗时
  2. 均值
    1. 计算快
    2. 不适用于可排序属性(如胖瘦
  3. 方差
    1. 离散程度
  4. 相似度计算
    1. 曼哈顿距离
    2. 欧式距离
  5. 降维
    1. 主成分分析
    2. 多尺度标记
  6. 聚类

如K-means

随机产生K个中心位置
将每个数据点归为距离最近的中心位置所属的类
• 根据新的类别划分重新计算中心位置
• 回到第二步,直到满足一定约束

视觉编码

表现力
• 准确编码数据包含的所有信息
• 尽量忠于原始数据

有效性
• 符合属性的重要性

可视设计

RGB颜色 或HSL(Hue Saturation Lightness)颜色 Lab颜色

折线图

  • 宽高比
  • (多尺度45°倾斜,优化横纵比)
  • 尺度(区别看68页
    • 尺度截断
    • 尺度的中断(比如时间跨度
    • log中断

柱状图
样式可以使用堆叠,对称等

  • 排序
  • 尺度
  • 偏离设计
    • 注意不必要的三维设计
    • 以及基准点的设定

饼状图

散点图

  • 参考线

盒须图

4 attention color

感知

感知

客观事物,通过人的感受器官,在人脑形成的反应

感受器官:眼耳鼻触觉神经末梢
视觉感知:通过视觉,人脑形成的反应

影响因素

  • 轮廓
  • 对比
  • 非注意盲视
    • 突出变化,减轻视觉负担
    • 高对比度(同物体间,但不要过度
  • 边界

考虑使用 显著性图/视觉重要性/热力图

  • 显著性检测
  • 应用
    • 构图
    • 内容缩放
    • 眼动仪

认知

关于怎样理解和解释东西 —— 外部认知: 利用大脑以外的资源增强大脑认知

格式塔理论

  • 结构比元素重要,视觉形象首先作为统一的
  • 共势原则
  • 相似原则
  • 对称
  • 经验原则
  • 相对性
  • 图形,背景关系 (模糊 大小 对比度

视觉通道

表现力

  • 要求视觉通道准确编码数据包含的所有信息

有效性

  • 通道表现力符合属性的重要性

因素如下考虑

  1. 精确性
  2. 可辨性
  3. 可分离性
  4. 视觉突出

色彩/光谱

系统比如

  • RGB(加色系统)
  • 红黄蓝
  • 青,品红,黄,黑 CMYK(减色系统

RGB颜色系统

  1. 被显示器表达的颜色
  2. 感知不均匀

HSL

  • 色相,人类认为的颜色
  • 饱和度 纯度(与灰色的距离
  • 亮度 黑色到亮色

Lab

  • 感知上均匀
  • L近似亮度
  • a 红/绿
  • b 黄/蓝

5 图

基本概念

  1. 无向图
  2. 有向图
  3. 完全图
  4. 子图
  5. 权重
  6. 关联矩阵
  7. 最短路径

相较于树型数据中明显的层次结构,图(网络)数据并不具有自底向上或自顶向下的层次结构,表达的关系更加自由和复杂

应用

  • 疾病传播
  • 路由器网络
  • 搜索引擎
  • 协作关系
  • 社交网络
  • 推荐

解决问题

  • 网络结构图形化演示
  • 节点排布
  • 视觉复杂度
  • 交互

显示

  • 节点连接
    • 分层
    • 力导向
    • 多维尺度
  • 相邻矩阵
  • 属性显示

其中力引导算法
物理引擎: 边 – 弹簧, 节点–互斥

弹簧模型
E S = ∑ i = 1 n ∑ j = 1 n 1 2 k ( d ( i , j ) − s ( i , j ) ) E_S = \sum^n_{i=1}\sum^n_{j=1}\frac{1}{2}k(d(i,j) - s(i,j)) ES=i=1nj=1n21k(d(i,j)s(i,j))
能量
E = E S + ∑ i = 1 n ∑ j = 1 n r w i w j d ( i , j ) E = E_S + \sum^n_{i=1}\sum^n_{j=1}\frac{rw_iw_j}{d(i,j)} E=ES+i=1nj=1nd(i,j)rwiwj

随机生成节点排列
循环

  1. 节点对计算排斥力
  2. 边计算引力
  3. 节点各个力累加
  4. 合力更新

优点:灵活,容易实现,现成库
局限:局部最优,初始位置影响较大,迭代复杂度O(N^2)

其他形式

  • 正交图
    • UML
  • 环形排列
  • 嵌套排列
    • 递归
    • 合适层次结构
  • 弧长链接

节点连接图:

优点:反应网络关系
表现图的结构、簇、路径
灵活

局限:
复杂度大
密集图不适用

相邻矩阵

N*N矩阵,代表N个节点,矩阵内的位置(i, j)表达了第i个节点和第j个节点之间的关系

  • 权重
  • 方向

相关算法:排序,路径搜索

优点:

  1. 合适密集图
  2. 伸缩性强
  3. 展示图的模式

缺点

  1. 结果抽象
  2. 难跟踪路径

可以混合
内部: 关系用相邻矩阵, 外部 点-线

可是 Gmap
平面代表实体,平面联通代表实体关系

还可以边绑定 —— 可能产生误导信息

鱼眼

  • 图形非线性变换
  • 点和边操控
  • 不同焦点的切换

简化

减少点 聚类
减少边 最小生成树

交互

  • 视角
    • 平移
    • 旋转
    • 缩放
    • 选择
    • 高亮
    • 移动
    • 删除
  • 结构
    • 重排序/布局
    • 上下文+焦点
    • 细节

summary

考虑

  • 排布
  • 简化
  • 交互

分析:网络、社会特性

6 层次数据可视化

重点:

  • 个体的从属关系
    • 社会、自然
      • 机构组织
      • 物种关系
    • 信息组织
      • 文件列表
      • 函数嗲用
    • 逻辑承接
      • 决策树

有效管理,稳定、可持续

  1. 公司结构图
  2. 家谱树
  3. 物种发展
  4. 思维导图
  5. 场景树/行为树
  6. 文件系统
  7. 函数调用

层次表达:图结构

G , V , E G, V, E G,V,E

分类

  1. 无向图
  2. 加权图
  3. 不连通图
  4. 点的度
  5. 回路
  6. 无回路图
  7. 含根节点层次树
  8. 节点深度

树形、网状是基本方法,重要组成部分

  • 节点的度
  • 平面性
  • 连通性

展示面临挑战

  1. 节点、边信息展示
    1. 点和边空间排布组织形式
  2. 用户对层次数据进行交互式分析探索
  3. 展示:显示空间如何利用
  4. 交互 任务相关功能工具
    1. 微观细节
    2. 宏观背景
    3. 子系统汇总,比较不同子系统

关注的重点

  • 树形结构
  • 父节点,子节点
  • 父子节点,兄弟节点的关系

方法

  1. 节点连接法
    1. 结构
      1. 节点连接树
      2. 双曲树
      3. 三维树
    2. 结构清晰表达
  2. 空间填充法
    1. 结构
      1. 树图
      2. Voronoi数图
    2. 空间利用高
  3. 混合型
    1. 弹性层次图

节点连接法

图论树形的扩展,核心为:结点和边的位置编码视觉符号编码,可能遵循以下原则

  1. 避免边交叉
  2. 点与边均匀分布
  3. 边长度统一
  4. 整体对称,保持一定比例
  5. 相似子结构可视化效果相似

(他们之间可能会矛盾,需要平衡取舍

可以细分为三种

  • 正交布局(网格型布局)
    • 缩进图 indent
    • 聚类树 dendrogram
    • 冰柱图 icicle
  • 径向分布(辐射型)
    • 镜像布局图
    • 双曲树
      • 节点在双曲空间分布
      • 节点数随深度几何级数增长
  • 三维布局

正交布局

节点: 水平 or 垂直对齐. 方向与坐标轴一致。 直观

缺点: 对于大型层次结构(广度较大)导致

电路图

正交,空间高效

  • 机器友好
  • 用户不友好
缩进图
  • 快速,简单
  • 支持纯文本(如HTML
  • 需要滚轮操作

缺点:容易失去上下文

正交树图实现

简单递归:

  1. 根据深度,纵轴均分。
    1. 每个区域对应一层树
    2. 相同深度属于同一层
  2. 根据叶数量,均分等宽区域
  3. 节点布置区域中心
  4. 节点、父节点连线

径向布局

  • 合理利用空间
    • 根 —— 圆心
    • 不同层次在半径不同同心圆上
  • 节点到圆心距离对应深度
    • 树结构节点数量随层次增加

三维树 Cone Tree

优点:3D空间扩展显示控件;3D动画降低认知成本。

缺点:大树不适用,三维交互难处理

空间嵌套填充

基于区域可视化,空间分块区域表达个体。

  • 可读性
  • 距离相关性
  • 稳定性

展现为“包含,被包含关系”。 假定每个叶节点有 “尺寸” 属性 —— 磁盘文件,机构图薪水等,父节点尺寸是所有子节点尺寸之和(例子,地图

类别数据数图

本身没有层次结构 —— 层次安排对结果影响骄傲大,吧类别对数据影响程度作为层次

如 房产数据

  • 地区:闹市教区
  • 类型 别墅商品房
  • 周围环境

树图原则

  • 层次
  • 层次间关系清晰
  • 子系统之间统一的数字化度量
  • 允许用户控制数图的粒度

一个问题: 逐级纵横切割细分的结果: 狭长四边形, 难和内部节点交互。

  • 交替纵切
  • 严格正等分

使用Voronoi树图 —— 凸多边形代替矩形

  • 圆利用率不高
  • 长宽比问题被解决

混合型(节点连接+空间嵌套

弹性层次图

文件浏览器

  • 节点、联系表示目录关系
  • 文件和目录(最后一级)用空间填充

其他

  1. 可缩放交互空间
  2. 时间换空间
  3. 尺度改变用户掌握
  4. 不同空间尺度下显示不同层次数据

7 文本可视化

技能频次,词艺术

  1. 原始文本收集
  2. 清洗
  3. 分词
  4. 标准化
  5. 特征提取
  6. 建模

预处理: 过滤无效数据,提取有效词。

特征抽取:key word, 词频, 主题

特征度量:相似性,文本聚类

显示方法

  • 词云
    • 形状/font/size/color可以定制。
  • 还有 主题流
  • 故事线
    • 文字的动态关系
    • 句子的层次关系

未来方向

  1. 渐进式
  2. 融合多种媒体(图像视频)
  3. 社交网络信息
  4. 可视问答VQA

8 地图

海洋/植被/地形/土壤/岩石,地质,地下空间/城市

可以分为

  • 点数据
  • 线数据
  • 区域
  • 三维数据
  • 地理空间

点数据

离散点:经纬度坐标,无大小尺寸

  • 六边形(蜂窝)网格
  • bricks点
  • 显著性/热力图
  • 空间数据感知编码
  • 时间数据感知编码

流线可视化;静态流场,时变流场,从某一点开始的一条柳絮的先,任一点切线与向量场该点方向一致

d x s t r e a m ( s ) d s = u ( x s t r e a m ( s ) , ϕ ) 或 x s t r e a m ( 0 ) = x 0 \frac{dx_{stream}(s)}{ds} = u(x_{stream}(s),\phi) 或 x_{stream}(0) = x_0 dsdxstream(s)=u(xstream(s),ϕ)xstream(0)=x0

s : 流线轨迹参数, ϕ :某个时间点流场 s:流线轨迹参数,\phi:某个时间点流场 s:流线轨迹参数,ϕ:某个时间点流场

种子点放置

  • 覆盖 conveage
  • 均匀 uniformity
  • 连续 continuity

基于纹理

线

两个/多个线段 or 路径

  • 长度属性
  • 连接关系

线绑定技术(航线,流动图

区域

等值线图/轮廓线图

  • 等值线抽取
  • 距离长计算(所属区域中心距离

还可以使用等值区间地图(数据属性在一个区域内平均分布,一个区域用一个颜色表示属性

  • 如果是无序数据使用区分度大的颜色
  • 课比较数据
    • 相同颜色,不同色调/亮度
    • 连续变化的颜色

但Chropleth地图会有数据分布 – 地理区域大小对称问题
—— 地理位置大,实际数据较小

  • 大数据集中于人口密集区域
  • 稀疏地区占据大多数空间
  • 大量空间表示小数据
    • 空间利用不经济
    • 理解错误

保证思维连贯:可以缩放或用别的相似形状,如Cartogram区域缩放算法

  • 输入:多边形网格和每个区域对应数值
  • 目标
    • 变形后多边形面积和数值成正比
    • 最小化形状误差,面积误差空间优化问题
  • CartoDraw
    • 扫描线算法调整多边形顶点位置:交互控制形变,最小化两个误差

判断区域面积大小,rec map, 识别问题。

多元关系

区域属性直接的多关系 —— 连线集合方法表达

气泡集

线集:集合所有点用曲线链接(尽量 避免自相交和弯曲

3D

路线规划,导航,广告,市政,交通模拟

问题

  • 传统地图思想不一
  • 视觉干扰
  • 视觉遮挡
    • 道路更多显示空间
      • 扩充道路宽度
    • 细节保留(转弯,建筑物等
      • 放大标志性建筑体积

seam carving加入空间,不破坏其他路状态

  • 鱼眼放大
  • 网格放大

其他形式

  • 内容保持缩放

工具

  • OpenStreeMap
  • mapBox
  • Leaflet
  • ArcGIS

9 时空数据

相关现象

  • 存在性变化
    • 特定特征出现/消失
  • 地理属性变化
    • 地点,形状,大小
    • 运动轨迹
    • 第三维度
  • 主题属性变化
    • 定量,定性属性变化
    • 混合视图
    • 动画比较
      • 动画陷阱:习惯,非注意盲视,中心凹实力和边缘视力,快慢变化率,多点变化

非注意盲视

  • 不在关注范围
  • 变化时间过短
  • 变化时间复杂
  • 变化不剧烈

边缘实例需要更强的信号

10 科学可视化

空间/标量/矢量/张量/多变量

人机界面,把科学工程数据交互转换为易为感知的图形图像,解释结构、特征、演化规律

  1. 解释结构特征
  2. 计算/分析/决策
  3. 数据拓扑
  4. 非结构化网络
    1. 优先元素
    2. 四面体
    3. 六面体
    4. 其他
  5. 非结构化点
    1. 材料点
    2. 平滑粒子流体力学

数据拓扑:数据存储离散位置,介乎中间位置发生了什么?kernel函数,坐标重建,对非组织数据更复杂

标量:密度/温度

向量:风向/立场(一阶张量)

张量:压力/张力/漫射 —— 基于基向量,可以用丰富组合

  • 空间维度n:多为3维
  • 张量阶数m,小于等于维数n

空间标量数据可视化

坐标图常用于一维数据可视化,注意数据转换,坐标轴转换

  • 空间信息有关的属性,值域可取不同的物理属性

二维

  • 颜色映射法
    • 建立颜色映射表
    • 数据变为索引
    • (传输函数
  • 高度映射法 isocontour
    • iso —— 相等
    • contour —— 线
  • 标记法
    • 编码测量到的数据

三维

  • 体绘制
    • 等值面
      • 几何采样
    • 直接体绘制
      • 图像空间
      • 数据空间
      • 传输函数

等值面

  1. 三维数据分割成体素(立方体
  2. 体素八个顶点值判断是否在等值面上

直接体绘制的问题

  • 阈值,极值构造中间曲面
  • 细节丢失,分割面扩大
  • 更好的图形质量需求

光线投射算法

光线投射算法:图片屏幕的像素,从视点投射像素视线,视线穿过体数据空间 —— 视线的采样值合成像素亮度

1. 体光照模型
  1. 吸收
  2. 发射
  3. 吸收+发射
  4. 多重散射

吸收(不透明度)/发射模型(颜色 rgb)。
局部光照模型,容易实现,不必考虑间接光照(散射)与阴影。example:phong光照模型

需要考虑等值面法向量 —— 梯度矢量

  • 一阶导数 l ( x , y , z ) l(x,y,z) l(x,y,z)
  • 高度场:矢量最大,上升方向垂直等值线
  • 对正交网格:中心差分
  • 边界区域:前向后向差分或逼近二阶差分
2. 体分类

决定吸收的值(不透明度α) 和发射的部分(颜色RGB)

传输函数:关键因素

  • 决定体素对最后图像的贡献大
  • 材料性质、外观

原则:感兴趣的部分高不透明,反之高透明

设计困难

3. 体采样

简单方法:最近邻域插值

常用方法:三线性插值

体重采样/等距离采样。
问题:delta_t小速度慢,大则漏特征

4. 体积分

物理过程模拟。 两种顺序

  1. 从后向前
    1. 比从前向后方法直接简单
    2. 不存储累计alpha值
  2. 从前向后
    1. 可利用早期光线终止算法
    2. 速度快

跳过空单元。以三维空间数据场为处理对象,从数据空间出发向图像平面传递数据信息,累积光亮度贡献

传输函数

体素标量到光学属性映射

  • RGB
  • alpha

对数据分类,解释内部结构。 输入数据,输出影响绘制的参数

设计方法

  • 数据为中心?
    • 标量大小,梯度,曲率,大小,纹理,形状(拓扑/轮廓
    • 可见性
    • 维度
  • 图像为中心?
  • 可视分析结合

空间向量数据

向量方向与大小。 信息包括: 趋势,模式

  • 基于标量场可视化
  • 基于几何
  • 基于纹理
  • 基于拓扑分析
  1. 空间
    2D:平面流。 2.5d,曲面流,边界流。3D 三维空间流
  2. 时间
    时间维度: 定常流(静态,或一个时间步) 非定常流(时变,瞬态

几何法

基于几何: 线条,箭头,方向标识符。矢量线/面:流线、粒子。

标记方法:

  • 实现简单,灵活,直观
  • 可视混乱,无法揭示连续性
  • 难以表达涡流的特征结构

质量提升:标记方式,降低可是混乱,自适应采样

积分曲线

  • 流线/迹线/时间线/脉线/时线
  • 流带
  • 流管气泡
  • 流面
  • 流体

对于流线来说:静态流场或时变流场的某个时刻,某一点开始,一条连续曲线。上任一点的切线方向均与向量场在 该点的方向一致

迹线pathline:时变流场: 某一点释放一个粒子在各个时刻形成的一条曲线。

脉线:时变流场某点持续释放例子:形成轨迹线

时线:脉线的扩展,一个其实轨迹/区域不同位置生成脉线

如何提升积分曲线质量?

  1. 积分曲线的计算
  2. 欧拉方法
    1. 快速
    2. 简单
    3. 精度低
  3. 龙格库塔
    1. 二阶、四阶误差控制
    2. 自适应步长选择
  4. 种子点选取,流线放置
    1. 多 —— 混乱
    2. 少——不完整
    3. 性质
      1. 覆盖
      2. 均匀
      3. 连续

纹理

思想: 指定的度量标准进行流线

  • 点噪音
  • 线积分卷积 LIC

空间张量数据

数据点的值为n维矩阵: 三维数据:3x3x3张量

描述数据在数据点邻域上如何变化
• 扫描设备:人脑中水的弥散
• 模拟:压力,张力

  • 标量指数法
  • 图标法
    • 超二次图元
    • 长方体和圆柱
  • 纤维追踪
  • 超流线
    • 主特征向量生成流线
  • 线积分卷积
  • 拓扑结构分析

多变量数据可视化

  • 纹理
  • 不同的视觉通道和融合

11 医学可视化

扫描设备:

  • x-ray
  • MRI
    • 计算机断层扫描
  • CT
    • 核磁共振成像
  • ultrasound

直接体可视化:切片重建
最大密度投影

神经外科的可视化

  • 入侵最小化
  • 锁孔
  • 定制

绘制方法

  1. 体绘制
  2. 面绘制
  3. 交互分割 —— 三维图像二值化
    1. 数学形态学操作进行区域修正
  4. 等值面

体绘制优点

  • 同时显示多组织
  • 高解析度

缺点

  • 渲染过程复杂
  • 交互性差

模型剖切

  1. 抽样
  2. 自适应细分
  3. 删除
  4. 顶点合并
  • 理论感知可视化(视觉颜色识别/颜色效能
  • 特征增强可视化

12 高纬度

数据降维:线性/非线性变换把高位投影到低维:保留重要关系(无重要信息损失,保持数据区分)

线性方法

  • 主成分分析 PCA
  • 多维尺度分析 MDS

非线性

  • 等距特征映射 ISOMAP
  • 局部线性嵌套LLE

交互 - 灵活轴线法

主成分分析

最大化方差(变量的信息量) —— 最小化投影后损失

降维后,方差对应协方差矩阵特征值 —— 方差最大,要最大特征值,对应特征向量为最佳投影向量

example:人脸数据

  1. 90%的方差可被 top 50个特征向量捕获
  2. 50个基图像重建存在的人脸
  3. 切尔诺夫脸谱图(Chernoff Faces) —— 人脸特征编码不同的值

高纬度相似 —— 降到低维位置较近

方法

• 基于点的方法——散点矩阵、径向布局

• 基于线的方法——线图、平行坐标、径向轴

• 基于区域的方法——柱状图、表格显示、像素图、维度堆叠、马赛克图

• 基于样本的方法——切尔诺夫脸谱图

散点矩阵

二位散点图表达维度之间关系(维度相关性),数目与维度平方成正比

改进:自动方法寻找散点矩阵中可能感兴趣的散点图

径向布局

  • 基于弹簧模型,圆形布局
  • N维N个锚点
  • N锚点作用的N种力量将数据散步园内

平行坐标

坐标轴相互平行,每个数据点对应一条穿过所有坐标轴的折线(唯独相关性)

  • 刷新/过滤
  • 半透明平行坐标
  • 连续式平行坐标
  • 结合散点图
  • 径向轴
    • 径向排列版本

柱状图(基于区域)

  • 基本元素
  • 高维数据:堆叠柱状图

表格图

热力图,表格镜子

像素图

介于点和区域方法混合

  • 有颜色小块表达单属性
  • 布局像素块(基于相似度

维度堆叠

离散N维变2维

  • 二维空间多个独立数据属性迭代为若干个网络
  • 同类格式,不同数据区别

星形图

辐条编码数值

  • 一个数据点 一个星形折线

Small Multiples

高维数据多个视图,按邮票大小放于一个视图种

13 交互

表示与交互

  • representation:用户关注
  • interaction 用户可操作手段

类型

  1. 高亮,焦点
  2. 搜索更多信息, 超链接
  3. 上下文,缩放,语言
  4. 同意表达,不同参数
  5. 时间上的过度

交互类型

  • 投影 映射
  • 过滤
  • 缩放
  • 失真变形
  • brushing linking

新的分类

  • 选择
    • 信息提示
    • 鼠标选择
      • 选择时候视觉混乱? —— 放大
      • 选择的标签如何可视化? 字符串有限空间的排列问题
      • 应可解读,指引性,不遮挡
    • 偏心标签
      • 用户鼠标接触到数据点之前不可见
      • 名称描述每个数据点
      • 连接数据点和标签
      • 标签排序,显示数据点布局
  • 探索
    • 显示不同数据,属性
      • 用户检查不同数据子集
      • 克服显示尺寸限制
    • 实例
      • 词典链接
      • 数字医疗改变视点
    • 直接跳转
  • 再布局
    • 显示不同排列
    • (排序重组
  • 视觉编码
    • 显示不同表示方式
      • 核心要素
      • 改变外观
    • 例子
      • 颜色
      • 大小
      • 方向
      • 字体
      • 形状
  • 抽象化具体化
    • 抽象级别(更多/更少数据细节
    • 例子
      • 展开treeMap
      • 放缩
  • 过滤
    • 符合某些条件的数据子集(缩小/扩大,聚焦)
    • 某些特定条件改变显示的数据集
    • 例子
      • 动态查询(自然,反向、撤销、探索,加快效率)(劣势:过于耦合,布尔表达式难指定,全局影响,条件提前确定,尺寸变大,动态查询不实时 —— 尤其是尺寸变大的时候)
      • 直方图刷去(brushing, 选择某个柱,数据高亮显示
      • 属性浏览
      • 案件过滤
      • querySketch
  • 链接
    • 显示相关项目
    • 高亮关系
      • 常用技术,一个视图选择数据,另一个视图高亮
    • 显示有关的被隐藏项目

交互范式

  • 概览,细节
    • 尺度问题(数据大,无法再屏幕上显示
    • 解决方案:数据表达 + 用户交互
      • 滚动
      • 放大缩小
  • 焦点 上下文
  • 对偶界面
  • 动画过渡

可视化方法技术评估

针对明确的用户目标/使用场景/具体任务,还需考虑其他领域应用

  1. 对比新老方法
  2. 确定有效性(目标,任务,场景
  3. 应用领域

定量评估:假设+验证

  1. 已有理论提出假设
  2. 设计评估实验
  3. 执行方案
  4. 分析结果
  5. 基于假设和结果进行讨论思考
  6. 研究结论改进点

考虑平衡效应

  • 顺序效应,学习效应:拉丁方设计
  • 实验者效应

定性评估

  • 观察
  • 访谈
  • 扎根理论 Grounded theory
  • 技术使用前后对比

14 大数据

15 多媒体

图像

图像数据丰富
用于可视化的图像特征:

• 色彩
• 明暗
• 轮廓
• 场景

时空采样,平均:将时空流内同类图像进行平均

视频

颜色流

线性播放的“视频流”

可视化增强:
• 非线性“视频浏览”
• 提高自动视频分析算法
• 性能
• 检测视频中的物体、特征等

视频立方: 将(平面)视频帧按时间轴堆叠排列;体可视化技术展示视频(流)中的特征

视频签名,视频指纹 - 环形排列+场景对齐

音频

  • 弧图(Arc Diagram)表达乐句间的重复匹配关系
  • 基于“花瓣”表达音乐特性

联觉通感,

跨媒体

info/data不同没接的分布,互动

  • 媒体之间交叉传播,整合
  • 学习,推理进行跨越

涉及到

  • 文本
  • 网络日志
  • 视频
  • 音频
  • 连接关系(超链接
  • 社会关系

微博可视化

  • 文本(博客
  • 社交网络
  • 新闻媒体

基于用户关系的信息分享,传播,获取平台:数据分析领域热点话题

显示内容:文本,图像,视频。
隐形内容:人际关系、舆情、突发事件、信息产生传播消亡

  • 属性实时变化
  • 时间实时传播
  • 交互式可视化

15深度学习

基于学习数据可视化 AI4VIS文章来源地址https://www.toymoban.com/news/detail-498777.html

  • 智能化可视化设计
  • 智能化可视化推荐
  • 语义识别
  • 信息隐写与可视化传播

question

  1. 单选
  2. 判断
  3. 问答)传输函数
  4. 图标,画出来
  5. 代码理解
  • 靠前面的相对重要
  • 后三章可能不咋考
  1. 感知认知,
    1. 理论,结构最好
    2. RGB(那一章
  2. 可视分析
    1. 了解流程
    2. 格式类型
      1. 抽象类型,等于,不等于,其他操作不行( + - 大小与
      2. 可排序
      3. 数值
      4. json理解
    3. 归一化
    4. Kmeans
    5. 常见图表
    6. 其他了解一下
  3. 网格图/层次可视化
    1. 定义
    2. 知识图谱
      1. 节点关系语义
    3. 力引导
    4. 相邻矩阵
    5. 边绑定
    6. gephi neo4j
      1. 思维导图,函数,文件系统,场景树
      2. 节点连接法-树状结构
      3. 镜像布局 -绕一个环
      4. 空间嵌套填充
      5. voroni维诺图 气泡
  4. 文本
    1. 词云
    2. 故事线,代表了什么
  5. 地理可视化
    1. 墨卡托投影
    2. 点的可视化(热力图,密度估计
    3. 流线图
  6. 数字孪生/元宇宙
  7. 时空
    1. 突出变化
  8. 科学可视化
    1. 拓扑
    2. 物理量:
      1. 张量,压力,漫射
    3. 体绘制
      1. 光线投射
      2. 传输函数
      3. 流线绘制
  9. 常见医学数据类型
  10. 降维
    1. UMAP
    2. t-SNE
    3. 平行坐标
  11. 大数据
    1. TB
    2. PB
    3. EB
  12. 多媒体
    1. 图像视频音频/微博
  13. 概念
    1. AI 4 VIS
    2. IS4AI

到了这里,关于数据可视化笔记 -- 整合的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据分析——seaborn可视化(笔记自用)

     参考内容  【Python】一小时带你掌握seaborn可视化_哔哩哔哩_bilibili 目录 一、变量分布  1、查看异常值  2、观察变量分布  3、figure-level functions具有FacetGrid特性  二、数值变量的关系分析  1、sns.relplot(): 2、sns.lmplot():分析两个变量的线性关系 3、sns.displot():绘制两个变量的联

    2023年04月08日
    浏览(39)
  • Python笔记10-数据可视化练习折线图

    JSON是一种轻量级的数据交互格式。可以按照JSON指定的格式去组织和封装数据 。本质上是一个带有特定格式的字符串 主要功能:可以在各个编程语言中流通,负责在不同编程语言中进行数据传递和交互. JSON示例: Echarts 是个由百度开源的数据可视化,凭借着良好的交互性,精

    2024年01月21日
    浏览(37)
  • 数据分析基础-数据可视化学习笔记06-交互架构

    对视觉表⽰进⾏操作 · 视觉分析的可视化应有助于对视觉表⽰数据的操作 · ⼀系列反馈回路 · 概述 · 放⼤/缩⼩ · 选择 · 筛选 · 查找相关信息 · 促进数据空间的探索。 · 选择和操作 · 直接处理数据的视觉表⽰。 · 探索与导航 · 理解并⾛过视觉呈现的空间。 从列表中选

    2024年02月10日
    浏览(47)
  • 数据分析基础-数据可视化学习笔记05-交互模型

    理解交互中的人类认知行为 •人类信息处理模型 •生态模型 •社交互动模型 •在认知心理学中——人类被视为一个信息处理单元 •认知过程被建模为该 IP 单元上的一系列信息过程 •了解人类认知过程,例如推理、解决问题、记忆和学习 •SK Card、TP Moran 和 A. Newell:人机交

    2024年02月11日
    浏览(39)
  • GEE/PIE遥感大数据处理与典型案例丨数据整合Reduce、云端数据可视化、数据导入导出及资产管理、机器学习算法等

    目录 ​专题一:初识GEE和PIE遥感云平台 专题二:GEE和PIE影像大数据处理基础 专题三:数据整合Reduce 专题四:云端数据可视化 专题五:数据导入导出及资产管理 专题六:机器学习算法 专题七:专题练习与回顾 更多应用 随着航空、航天、近地空间等多个遥感平台的不断发展

    2024年02月11日
    浏览(76)
  • python库,科学计算与数据可视化基础,知识笔记(numpy+matplotlib)

    这篇主要讲一下数据处理中科学计算部分的知识。 之前有一篇pandas处理数据的。 讲一下这几个库的区别。 Pandas主要用来处理类表格数据(excel,csv),提供了计算接口,可用Numpy或其它方式进行计算。 NumPy 主要用来处理数值数据(尤其是矩阵,向量为核心的),本质上是纯

    2024年02月02日
    浏览(50)
  • ElasticSearch与Kibana的整合与可视化

    ElasticSearch 和 Kibana 是两个非常受欢迎的开源工具,它们在日志分析、监控和搜索领域具有广泛的应用。ElasticSearch 是一个基于分布式搜索引擎,它可以处理大量数据并提供快速、准确的搜索结果。Kibana 是一个基于 Web 的数据可视化工具,它可以与 ElasticSearch 整合,以实现数据

    2024年04月13日
    浏览(36)
  • python气象数据可视化学习笔记8——利用matplotlib和ERA5数据绘制时间-高度气象综合廓线图

    气象预报业务中,有种常用的综合廓线图,其本质上是单个站点时间-高度的等高线或者填色图,其中时间是从右到左来看。所以准备好(time, level)的二维数据,然后依次叠加线条和填色就可以,思路很简单,但是绘图中涉及到了很多细节问题,也是琢磨了一阵子,怕以后忘了

    2024年02月05日
    浏览(48)
  • matlab数据的获取、预处理、统计、可视化、降维 | 《matlab数学建模方法与实践(第三版)》学习笔记

    一、数据的获取 1.1 从Excel中获取 使用readtable() 使用xlsread()——xlswrite() 1.2  从TXT中获取 使用load() 使用textread() 使用fopen() fread() fclose()  使用fprintf()写入信息到txt  1.3 从图片中获取 使用imread  1.4 从视频获取  使用视觉工具箱中的VideoFileReader  二、数据的预处理 2.1 缺失值处

    2024年01月19日
    浏览(67)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包