11 KiB

Raw Permalink Blame History Unescape Escape

創建有意義的視覺化


有意義的視覺化 - 由 @nitya 繪製的速記筆記

「如果你對數據施加足夠的壓力，它會承認任何事情」-- Ronald Coase

作為一名數據科學家，基本技能之一就是能夠創建有意義的數據視覺化，幫助回答你可能提出的問題。在進行數據視覺化之前，你需要確保數據已經像之前課程中所做的那樣進行清理和準備。之後，你就可以開始決定如何最好地呈現數據。

在本課中，你將學習：

如何選擇合適的圖表類型
如何避免誤導性的圖表
如何使用顏色
如何設計圖表以提高可讀性
如何構建動畫或3D圖表解決方案
如何創建創意視覺化

課前測驗

選擇合適的圖表類型

在之前的課程中，你已經嘗試使用 Matplotlib 和 Seaborn 創建各種有趣的數據視覺化。通常，你可以根據這張表格選擇合適的圖表類型來回答你的問題：

你的需求是：	你應該使用：
展示隨時間變化的數據趨勢	折線圖
比較類別	柱狀圖、餅圖
比較總量	餅圖、堆疊柱狀圖
展示關係	散點圖、折線圖、分面圖、雙折線圖
展示分佈	散點圖、直方圖、箱型圖
展示比例	餅圖、甜甜圈圖、華夫圖

✅ 根據數據的組成，你可能需要將其從文本轉換為數字，以支持某些圖表。

避免誤導

即使數據科學家謹慎地為合適的數據選擇了合適的圖表，仍然有許多方法可以以某種方式展示數據來證明某個觀點，往往以損害數據本身為代價。有許多誤導性圖表和信息圖的例子！

🎥 點擊上方圖片觀看關於誤導性圖表的會議演講

這張圖表反轉了 X 軸，根據日期顯示了與事實相反的內容：

這張圖表更具誤導性，因為人們的目光會被吸引到右側，得出隨時間推移各縣的 COVID 病例數下降的結論。事實上，如果仔細查看日期，你會發現它們被重新排列以呈現誤導性的下降趨勢。

這個臭名昭著的例子使用顏色和反轉的 Y 軸來誤導：與其得出槍支友好立法通過後槍支死亡率激增的結論，事實上人們的目光被欺騙以為情況正好相反：

這張奇怪的圖表展示了比例如何被操縱，效果令人捧腹：

比較不可比的事物是另一種不正當的手段。有一個精彩的網站專門展示「虛假的相關性」，顯示像緬因州的離婚率與人造黃油消耗量之間的「事實」相關性。一個 Reddit 群組也收集了糟糕的數據使用。

了解眼睛如何容易被誤導性圖表欺騙是很重要的。即使數據科學家的意圖是好的，選擇糟糕的圖表類型（例如顯示過多類別的餅圖）也可能具有誤導性。

顏色

你在上面「佛羅里達槍支暴力」的圖表中看到，顏色如何為圖表提供額外的意義，尤其是那些未使用 Matplotlib 和 Seaborn 等庫設計的圖表，這些庫附帶了各種經過驗證的顏色庫和調色板。如果你手動製作圖表，可以稍微研究一下顏色理論。

✅ 在設計圖表時，請注意可訪問性是視覺化的一個重要方面。一些用戶可能是色盲——你的圖表是否能很好地為視覺障礙用戶顯示？

選擇圖表顏色時要小心，因為顏色可能傳達你未曾預料的含義。上面「身高」圖表中的「粉紅女士」傳達了一種明顯的「女性化」意義，這增加了圖表本身的怪異感。

雖然顏色的含義可能因地區而異，並且通常根據其色調而改變。一般來說，顏色的含義包括：

顏色	含義
紅色	力量
藍色	信任、忠誠
黃色	快樂、警告
綠色	生態、幸運、嫉妒
紫色	快樂
橙色	活力

如果你需要使用自定義顏色構建圖表，請確保你的圖表既可訪問又符合你想要傳達的含義。

設計圖表以提高可讀性

如果圖表不可讀，它就沒有意義！花點時間考慮設計圖表的寬度和高度，以便與數據良好匹配。如果需要顯示一個變量（例如所有50個州），請盡可能在 Y 軸上垂直顯示，以避免水平滾動的圖表。

標記你的軸，如果需要提供圖例，並提供工具提示以更好地理解數據。

如果你的數據在 X 軸上是文本且冗長，可以將文本角度調整以提高可讀性。Matplotlib 提供了 3D 繪圖功能，如果你的數據支持它。使用 mpl_toolkits.mplot3d 可以生成精美的數據視覺化。

動畫和3D圖表顯示

如今一些最好的數據視覺化是動畫化的。Shirley Wu 使用 D3 創建了令人驚嘆的作品，例如「電影花朵」，其中每朵花都是一部電影的視覺化。另一個例子是《衛報》的「Bussed Out」，這是一個互動體驗，結合了 Greensock 和 D3 的視覺化以及滾動敘事文章格式，展示了紐約市如何通過將無家可歸者送出城市來處理其無家可歸問題。

「Bussed Out: How America Moves its Homeless」來自衛報。視覺化由 Nadieh Bremer 和 Shirley Wu 創作

雖然本課不足以深入教授這些強大的視覺化庫，但可以嘗試在 Vue.js 應用中使用 D3，展示一本書《危險關係》的動畫社交網絡視覺化。

《危險關係》是一部書信體小說，即以一系列信件形式呈現的小說。由 Choderlos de Laclos 於1782年撰寫，講述了18世紀晚期法國貴族中兩位主角 Vicomte de Valmont 和 Marquise de Merteuil 的惡毒、道德敗壞的社交操縱。他們最終都遭遇了悲慘的結局，但在此之前造成了巨大的社會損害。小說以他們寫給圈內各人的信件形式展開，信件內容包括復仇計劃或純粹製造麻煩。創建這些信件的視覺化，探索敘事中的主要角色。

你將完成一個網頁應用，顯示這個社交網絡的動畫視圖。它使用了一個庫來創建網絡視覺化，基於 Vue.js 和 D3。當應用運行時，你可以在屏幕上拖動節點來重新排列數據。

項目：使用 D3.js 構建一個展示網絡的圖表

本課文件夾包含一個 solution 文件夾，你可以在其中找到完成的項目供參考。

按照起始文件夾根目錄中的 README.md 文件中的指示操作。在安裝項目依賴項之前，確保你的機器上已運行 NPM 和 Node.js。
打開 starter/src 文件夾。你會發現一個 assets 文件夾，其中包含一個 .json 文件，記錄了小說中的所有信件，編號並附有「to」和「from」註釋。
完成 components/Nodes.vue 中的代碼以啟用視覺化。找到名為 createLinks() 的方法，並添加以下嵌套循環。

循環遍歷 .json 對象以捕獲信件的「to」和「from」數據，並構建 links 對象，以便視覺化庫可以使用它：

//loop through letters
      let f = 0;
      let t = 0;
      for (var i = 0; i < letters.length; i++) {
          for (var j = 0; j < characters.length; j++) {
              
            if (characters[j] == letters[i].from) {
              f = j;
            }
            if (characters[j] == letters[i].to) {
              t = j;
            }
        }
        this.links.push({ sid: f, tid: t });
      }