掌握Tufte的数据可视化原则意味着我们要创建清晰、诚实且富有洞察力的视觉图像,将复杂的数据转化为可执行的理解。Edward Tufte的方法核心在于通过增强数据-墨水(Data-Ink,即代表实际数据的图形部分)来最大化清晰度,最小化图表垃圾(Chart Junk,不必要的视觉杂乱),并确保每个图表都保持上下文和图形的完整性。
Tufte作品的核心原则
Edward Tufte是耶鲁大学政治学、统计学和计算机科学荣誉教授。他以其在数据可视化和信息设计方面的工作而闻名,主张在视觉展示复杂材料时追求清晰、准确和有效。
Tufte的思想旨在强调以下几点:
- 数据-墨水比:最大化代表数据的墨水比例。
- 最小化非数据墨水:减少不传达数据的元素。
- 图形完整性:确保视觉表现是真实且清晰的。
- 卓越的架构设计:力求在可视化中实现高质量的设计。
!TufteTufte可视化原则
理解图形失真与过度装饰
Edward Tufte极力倡导通过图形展示进行清晰、准确且高效的数据沟通。他强调了图形完整性的重要性,警告不要采取扭曲或歪曲数据的做法,例如误导性的坐标轴、不一致的刻度以及饼图中过多的切片。他反对过度装饰——即添加无助于理解的不必要视觉元素——因为这会分散对实际数据的注意力并导致误解。Tufte的原则指导设计师通过关注真实、整洁且上下文丰富的图形来避免这些陷阱,确保可视化能够可靠地传达预期信息并支持明智的决策。
图形失真的常见原因
!Causes图形失真的常见类型
1. 非零基线:如果y轴的起始值不是零,可能会夸大数据点之间的差异。y轴从非零值开始可能会放大数据点之间的区别。例如,如果一个柱状图的y轴从90而不是0开始,可能会让实际上很小的增长看起来很大。
!Sales非零基线
2. 不一致的刻度:在x轴和y轴上使用不同的刻度可能会扭曲变量之间被感知的关系。在x轴和y轴上使用不同的刻度会导致对变量关系的误解。例如,x轴上间隔不均匀的折线图可能会扭曲随时间变化的趋势。
!Scales不一致的刻度
3. 过度切片:在饼图中使用过多的切片会使图表难以解释,因为小的切片会变得难以区分。
!Slicing过度切片
数据-墨水最大化的力量
数据-墨水比是数据可视化专家Edward Tufte引入的一个概念。它的定义是用于呈现实际数据的墨水量(或像素量)与整个显示中所使用的墨水总量的比例。我们的目标是最大化数据-墨水比,这意味着图形上的大部分墨水都应该呈现数据信息,并且墨水应随数据的变化而变化。数据-墨水比可以用数学公式表示为:
> 数据-墨水比 = 数据-墨水 / 用于打印图形的总墨水量
Tufte将用于显示信息的墨水分为两类: 数据-墨水和非数据-墨水。
- 数据-墨水是专门用于表示图表核心(即被测量的量)的那部分墨水。
- 非数据-墨水是用于绘制图表中不必要元素的墨水,这些元素无助于阐明预期信息。
好的图形应该只包含数据-墨水。在所有可能的地方都应删除非数据-墨水。这样做的原因是为了避免将数据呈现观众的注意力吸引到无关元素上。
Tufte的原则强调了数据可视化中简单性和清晰性的重要性。他主张擦除非数据-墨水和冗余的数据-墨水以提高数据-墨水比。这种方法有助于避免干扰,节省时间和空间,使信息更清晰,更容易被受众接受。
数据-墨水比示例
应用数据-墨水比包括通过移除不必要的元素来简化图表,例如网格线、没有意义或目的的颜色、3D效果以及不能增加价