You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/zh/3-Data-Visualization/13-meaningful-visualizations
leestott 1315f4d10d
🌐 Update translations via Co-op Translator
2 weeks ago
..
solution 🌐 Update translations via Co-op Translator 4 weeks ago
starter 🌐 Update translations via Co-op Translator 4 weeks ago
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 4 weeks ago
correlation-analysis.ipynb 🌐 Update translations via Co-op Translator 2 weeks ago

README.md

制作有意义的数据可视化

 Sketchnote by (@sketchthedocs)
有意义的数据可视化 - Sketchnote by @nitya

“如果你对数据施加足够的压力,它会承认任何事情” -- Ronald Coase

数据科学家的基本技能之一是能够创建有意义的数据可视化,以帮助回答你可能提出的问题。在可视化数据之前,你需要确保数据已经像之前课程中那样被清理和准备好。之后,你可以开始决定如何最好地呈现数据。

在本课中,你将学习:

  1. 如何选择正确的图表类型
  2. 如何避免误导性图表
  3. 如何使用颜色
  4. 如何为图表设计样式以提高可读性
  5. 如何构建动画或3D图表解决方案
  6. 如何构建创意可视化

课前测验

选择正确的图表类型

在之前的课程中,你已经尝试使用 Matplotlib 和 Seaborn 构建各种有趣的数据可视化。通常,你可以使用以下表格选择适合问题的正确图表类型

你的需求是: 你应该使用:
展示随时间变化的数据趋势 折线图
比较类别 柱状图、饼图
比较总量 饼图、堆叠柱状图
展示关系 散点图、折线图、分面图、双折线图
展示分布 散点图、直方图、箱线图
展示比例 饼图、环形图、华夫图

根据数据的组成,你可能需要将其从文本转换为数值,以支持某些图表类型。

避免误导

即使数据科学家谨慎选择了适合数据的正确图表类型,数据仍然可能以某种方式被展示以证明某种观点,通常会以牺牲数据本身为代价。有许多误导性图表和信息图的例子!

Alberto Cairo 的《How Charts Lie》

🎥 点击上方图片观看关于误导性图表的会议演讲

这个图表颠倒了 X 轴,以日期为基础展示了与事实相反的内容:

bad chart 1

这个图表更加误导,因为视觉上吸引人们得出结论认为随着时间推移,各县的 COVID 病例数量有所下降。实际上,如果仔细查看日期,你会发现日期被重新排列以制造这种误导性的下降趋势。

bad chart 2

这个臭名昭著的例子使用颜色和颠倒的 Y 轴来误导:本应得出枪支死亡人数在通过支持枪支的立法后激增的结论,实际上视觉上却让人误以为情况正好相反:

bad chart 3

这个奇怪的图表展示了比例如何被操纵,效果令人捧腹:

bad chart 4

比较不可比的事物是另一种不正当的手段。有一个精彩的网站专门展示“虚假的相关性”例如缅因州的离婚率与人造黄油的消费量之间的“事实”相关性。Reddit 上也有一个小组收集了数据的丑陋用法

理解眼睛如何容易被误导性图表欺骗是很重要的。即使数据科学家的意图是好的,选择错误的图表类型(例如显示过多类别的饼图)也可能具有误导性。

颜色

你在上面“佛罗里达枪支暴力”图表中看到,颜色可以为图表提供额外的意义层次,尤其是那些没有使用 Matplotlib 和 Seaborn 等库设计的图表,这些库自带各种经过验证的颜色库和调色板。如果你手动制作图表,可以稍微研究一下颜色理论

在设计图表时,请注意可访问性是可视化的重要方面。你的部分用户可能是色盲——你的图表是否对视觉障碍用户友好?

选择图表颜色时要小心,因为颜色可能传递你未曾预料的含义。上面“身高”图表中的“粉色女士”传递了一种明显的“女性化”意义,这增加了图表本身的怪异感。

虽然颜色含义可能因地区而异,并且根据其色调会有所变化,但一般来说,颜色含义包括:

颜色 含义
红色 力量
蓝色 信任、忠诚
黄色 快乐、警告
绿色 生态、幸运、嫉妒
紫色 快乐
橙色 活力

如果你需要使用自定义颜色构建图表,请确保你的图表既可访问,又与试图传递的含义一致。

为图表设计样式以提高可读性

如果图表不可读它就没有意义花点时间考虑调整图表的宽度和高度以便与数据良好匹配。如果需要显示一个变量例如所有50个州尽量将它们垂直显示在 Y 轴上,以避免水平滚动的图表。

标注你的轴线,必要时提供图例,并提供工具提示以更好地理解数据。

如果你的数据在 X 轴上是文本且较长,可以将文本倾斜以提高可读性。Matplotlib 提供了 3D 绘图功能,如果你的数据支持它。可以使用 mpl_toolkits.mplot3d 生成复杂的数据可视化。

3d plots

动画和3D图表展示

如今一些最佳的数据可视化是动画化的。Shirley Wu 使用 D3 制作了令人惊叹的作品,例如“电影之花其中每朵花都是一部电影的可视化。另一个为《卫报》制作的例子是“Bussed Out”一个结合 Greensock 和 D3 的交互式体验,外加滚动叙事文章格式,展示纽约市如何通过将人们送出城市来处理无家可归问题。

busing

“Bussed Out: How America Moves its Homeless” 来自 卫报。可视化由 Nadieh Bremer 和 Shirley Wu 制作

虽然本课不足以深入教授这些强大的可视化库,但你可以尝试在 Vue.js 应用中使用 D3利用一个库来展示《危险关系》这本书的动画社交网络可视化。

《危险关系》是一部书信体小说,即以一系列信件形式呈现的小说。由 Choderlos de Laclos 于1782年创作讲述了18世纪末法国贵族中两位主角——瓦尔蒙子爵和梅尔特伊侯爵——之间恶毒、道德败坏的社交操纵故事。两人最终都遭遇了悲剧但在此之前造成了巨大的社会破坏。小说通过他们圈子中写给各种人的信件展开策划复仇或单纯制造麻烦。创建这些信件的可视化发现叙事中的主要关键人物。

你将完成一个网络应用程序,展示这个社交网络的动画视图。它使用一个库来创建网络可视化,基于 Vue.js 和 D3。当应用程序运行时你可以在屏幕上拖动节点以重新排列数据。

liaisons

项目:使用 D3.js 构建一个网络图表

本课文件夹包含一个 solution 文件夹,你可以在其中找到完整的项目供参考。

  1. 按照起始文件夹根目录中的 README.md 文件中的说明操作。在安装项目依赖项之前,请确保你的机器上运行了 NPM 和 Node.js。

  2. 打开 starter/src 文件夹。你会发现一个 assets 文件夹,其中包含一个 .json 文件记录了小说中的所有信件编号并带有“to”和“from”注释。

  3. 完成 components/Nodes.vue 中的代码以启用可视化。找到名为 createLinks() 的方法,并添加以下嵌套循环。

循环遍历 .json 对象以捕获信件的“to”和“from”数据并构建 links 对象,以便可视化库可以使用它:

//loop through letters
      let f = 0;
      let t = 0;
      for (var i = 0; i < letters.length; i++) {
          for (var j = 0; j < characters.length; j++) {
              
            if (characters[j] == letters[i].from) {
              f = j;
            }
            if (characters[j] == letters[i].to) {
              t = j;
            }
        }
        this.links.push({ sid: f, tid: t });
      }

从终端运行你的应用程序npm run serve享受可视化效果

🚀 挑战

浏览互联网,发现误导性可视化。作者是如何误导用户的,这是否是故意的?尝试纠正这些可视化,展示它们应该如何呈现。

课后测验

复习与自学

以下是一些关于误导性数据可视化的文章:

https://gizmodo.com/how-to-lie-with-data-visualization-1563576606

http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/

看看这些关于历史资产和文物的有趣可视化:

https://handbook.pubpub.org/

阅读这篇关于动画如何增强可视化的文章:

https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4

作业

创建你自己的自定义可视化


免责声明
本文档使用AI翻译服务Co-op Translator进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于关键信息,建议使用专业人工翻译。我们不对因使用此翻译而产生的任何误解或误读承担责任。