|
2 weeks ago | |
---|---|---|
.. | ||
solution | 3 weeks ago | |
starter | 3 weeks ago | |
README.md | 2 weeks ago | |
assignment.md | 3 weeks ago | |
correlation-analysis.ipynb | 2 weeks ago |
README.md
Створення змістовних візуалізацій
![]() |
---|
Змістовні візуалізації - Скетчнот від @nitya |
"Якщо достатньо довго катувати дані, вони зізнаються у чому завгодно" -- Рональд Коуз
Одним із базових навичок дата-сайєнтиста є здатність створювати змістовні візуалізації даних, які допомагають відповісти на поставлені запитання. Перед тим як візуалізувати дані, необхідно переконатися, що вони були очищені та підготовлені, як ви робили в попередніх уроках. Після цього можна почати вирішувати, як найкраще представити дані.
У цьому уроці ви розглянете:
- Як вибрати правильний тип графіка
- Як уникнути оманливих графіків
- Як працювати з кольором
- Як стилізувати графіки для зручності читання
- Як створювати анімовані або 3D графіки
- Як створювати креативні візуалізації
Тест перед лекцією
Вибір правильного типу графіка
У попередніх уроках ви експериментували зі створенням різноманітних цікавих візуалізацій даних за допомогою Matplotlib та Seaborn. Загалом, ви можете вибрати правильний тип графіка для поставленого запитання, використовуючи цю таблицю:
Вам потрібно: | Вам слід використовувати: |
---|---|
Показати тенденції даних у часі | Лінійний графік |
Порівняти категорії | Стовпчастий, круговий |
Порівняти загальні значення | Круговий, складений стовпчастий |
Показати взаємозв’язки | Точковий, лінійний, фасетний, подвійний лінійний |
Показати розподіли | Точковий, гістограма, коробковий |
Показати пропорції | Круговий, пончиковий, вафельний |
✅ Залежно від складу ваших даних, можливо, вам доведеться перетворити їх із текстових у числові, щоб графік міг їх підтримувати.
Уникнення обману
Навіть якщо дата-сайєнтист ретельно вибирає правильний графік для правильних даних, існує багато способів представити дані так, щоб довести певну точку зору, часто за рахунок спотворення самих даних. Існує багато прикладів оманливих графіків та інфографіки!
🎥 Натисніть на зображення вище, щоб переглянути конференційну доповідь про оманливі графіки
Цей графік перевертає вісь X, щоб показати протилежне до правди, базуючись на датах:
Цей графік ще більш оманливий, оскільки око спрямовується вправо, щоб зробити висновок, що з часом кількість випадків COVID зменшилася в різних округах. Насправді, якщо уважно подивитися на дати, можна побачити, що вони були переставлені, щоб створити цей оманливий спад.
Цей сумнозвісний приклад використовує колір І перевернуту вісь Y, щоб обманути: замість висновку, що кількість смертей від зброї зросла після прийняття законодавства, яке сприяє використанню зброї, око обманюється, щоб думати, що відбулося протилежне:
Цей дивний графік показує, як пропорції можуть бути маніпульовані, до смішного ефекту:
Порівняння непорівнюваного — ще один хитрий трюк. Існує чудовий веб-сайт, присвячений "хибним кореляціям", який демонструє "факти", що корелюють, наприклад, рівень розлучень у штаті Мен і споживання маргарину. Група на Reddit також збирає приклади поганого використання даних.
Важливо розуміти, як легко око може бути обмануте оманливими графіками. Навіть якщо наміри дата-сайєнтиста добрі, вибір неправильного типу графіка, наприклад кругового графіка з надто багатьма категоріями, може бути оманливим.
Колір
На прикладі графіка про "насильство зі зброєю у Флориді" ви бачили, як колір може додати додатковий рівень значення до графіків, особливо тих, які не створені за допомогою бібліотек, таких як Matplotlib та Seaborn, які мають різні перевірені бібліотеки кольорів та палітри. Якщо ви створюєте графік вручну, варто трохи вивчити теорію кольору.
✅ Пам’ятайте, що при створенні графіків доступність є важливим аспектом візуалізації. Деякі ваші користувачі можуть бути дальтоніками — чи добре ваш графік відображається для користувачів із порушеннями зору?
Будьте обережні при виборі кольорів для вашого графіка, оскільки колір може передавати значення, яке ви не мали на увазі. "Рожеві дами" на графіку "зріст" вище передають явно "жіноче" значення, що додає до дивності самого графіка.
Хоча значення кольорів можуть відрізнятися в різних частинах світу і змінюватися залежно від їх відтінку, загалом значення кольорів включають:
Колір | Значення |
---|---|
червоний | сила |
синій | довіра, лояльність |
жовтий | щастя, обережність |
зелений | екологія, удача, заздрість |
фіолетовий | щастя |
оранжевий | яскравість |
Якщо вам доручено створити графік із власними кольорами, переконайтеся, що ваші графіки доступні, а вибраний вами колір відповідає значенню, яке ви намагаєтеся передати.
Стилізація графіків для зручності читання
Графіки не мають сенсу, якщо їх важко читати! Зробіть паузу, щоб подумати про стилізацію ширини та висоти вашого графіка, щоб він добре масштабувався з вашими даними. Якщо потрібно відобразити одну змінну (наприклад, усі 50 штатів), покажіть їх вертикально на осі Y, якщо це можливо, щоб уникнути горизонтального прокручування графіка.
Підписуйте осі, надавайте легенду, якщо це необхідно, і пропонуйте підказки для кращого розуміння даних.
Якщо ваші дані текстові та багатослівні на осі X, ви можете нахилити текст для кращої читабельності. Matplotlib пропонує 3D графіку, якщо ваші дані це підтримують. Складні візуалізації даних можна створювати за допомогою mpl_toolkits.mplot3d
.
Анімація та 3D відображення графіків
Деякі з найкращих візуалізацій даних сьогодні є анімованими. Ширлі Ву створила дивовижні візуалізації за допомогою D3, такі як 'квітки фільмів', де кожна квітка є візуалізацією фільму. Інший приклад для Guardian — 'bussed out', інтерактивний досвід, що поєднує візуалізації з Greensock і D3, а також формат статті з прокруткою, щоб показати, як Нью-Йорк вирішує проблему бездомності, відправляючи людей автобусами з міста.
"Bussed Out: Як Америка переміщує своїх бездомних" від Guardian. Візуалізації від Надії Бремер та Ширлі Ву
Хоча цей урок недостатній для детального вивчення цих потужних бібліотек візуалізації, спробуйте свої сили в D3 у додатку Vue.js, використовуючи бібліотеку для відображення візуалізації книги "Небезпечні зв’язки" як анімованої соціальної мережі.
"Les Liaisons Dangereuses" — це епістолярний роман, або роман, представлений у вигляді серії листів. Написаний у 1782 році Шодерло де Лакло, він розповідає історію жорстоких, морально банкрутних соціальних маневрів двох головних героїв французької аристократії кінця XVIII століття, Віконта де Вальмона та Маркізи де Мертей. Обидва зустрічають свою загибель у кінці, але не без завдання значної соціальної шкоди. Роман розгортається як серія листів, написаних різним людям у їхніх колах, з метою помсти або просто для створення проблем. Створіть візуалізацію цих листів, щоб виявити основних "королів" оповіді візуально.
Ви завершите веб-додаток, який відображатиме анімований вигляд цієї соціальної мережі. Він використовує бібліотеку, створену для створення візуалізації мережі за допомогою Vue.js та D3. Коли додаток працює, ви можете переміщати вузли на екрані, щоб змінювати дані.
Проєкт: Створіть графік для відображення мережі за допомогою D3.js
У папці цього уроку є папка
solution
, де ви можете знайти завершений проєкт для вашого ознайомлення.
-
Виконайте інструкції у файлі README.md у кореневій папці стартового проєкту. Переконайтеся, що у вас встановлені NPM та Node.js перед встановленням залежностей проєкту.
-
Відкрийте папку
starter/src
. Ви знайдете папкуassets
, де є .json файл із усіма листами з роману, пронумерованими, з позначенням "кому" та "від кого". -
Завершіть код у
components/Nodes.vue
, щоб увімкнути візуалізацію. Знайдіть методcreateLinks()
і додайте наступний вкладений цикл.
Пройдіться по об’єкту .json, щоб захопити дані "кому" та "від кого" для листів і створити об’єкт links
, щоб бібліотека візуалізації могла його використовувати:
//loop through letters
let f = 0;
let t = 0;
for (var i = 0; i < letters.length; i++) {
for (var j = 0; j < characters.length; j++) {
if (characters[j] == letters[i].from) {
f = j;
}
if (characters[j] == letters[i].to) {
t = j;
}
}
this.links.push({ sid: f, tid: t });
}
Запустіть ваш додаток з терміналу (npm run serve) і насолоджуйтеся візуалізацією!
🚀 Виклик
Здійсніть тур по інтернету, щоб знайти оманливі візуалізації. Як автор обманює користувача, і чи це навмисно? Спробуйте виправити візуалізації, щоб показати, як вони повинні виглядати.
Тест після лекції
Огляд і самостійне навчання
Ось кілька статей для читання про оманливі візуалізації даних:
https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
Ознайомтеся з цікавими візуалізаціями історичних активів та артефактів:
Перегляньте цю статтю про те, як анімація може покращити ваші візуалізації:
https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
Завдання
Відмова від відповідальності:
Цей документ було перекладено за допомогою сервісу автоматичного перекладу Co-op Translator. Хоча ми прагнемо до точності, будь ласка, майте на увазі, що автоматизовані переклади можуть містити помилки або неточності. Оригінальний документ на його рідній мові слід вважати авторитетним джерелом. Для критичної інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникають у результаті використання цього перекладу.