You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/cs/6-Data-Science-In-Wild/20-Real-World-Examples
leestott 0f1def896e
🌐 Update translations via Co-op Translator
2 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 4 weeks ago

README.md

Data Science v reálném světě

 Sketchnote od (@sketchthedocs)
Data Science v reálném světě - Sketchnote od @nitya

Jsme téměř na konci této vzdělávací cesty!

Začali jsme definicemi datové vědy a etiky, prozkoumali různé nástroje a techniky pro analýzu a vizualizaci dat, přezkoumali životní cyklus datové vědy a podívali se na škálování a automatizaci pracovních postupů datové vědy pomocí cloudových služeb. Možná si teď říkáte: "Jak přesně mohu všechny tyto znalosti aplikovat v reálném světě?"

V této lekci prozkoumáme reálné aplikace datové vědy napříč průmyslem a ponoříme se do konkrétních příkladů v oblasti výzkumu, digitálních humanitních věd a udržitelnosti. Podíváme se na příležitosti studentských projektů a zakončíme užitečnými zdroji, které vám pomohou pokračovat ve vaší vzdělávací cestě!

Kvíz před přednáškou

Kvíz před přednáškou

Data Science + Průmysl

Díky demokratizaci AI je pro vývojáře nyní snazší navrhovat a integrovat rozhodování řízené AI a poznatky založené na datech do uživatelských zkušeností a vývojových pracovních postupů. Zde je několik příkladů, jak je datová věda "aplikována" na reálné aplikace napříč průmyslem:

  • Google Flu Trends využíval datovou vědu k propojení vyhledávacích termínů s trendy chřipky. Přestože přístup měl své nedostatky, zvýšil povědomí o možnostech (a výzvách) predikcí zdravotní péče založených na datech.

  • Predikce tras UPS - vysvětluje, jak UPS využívá datovou vědu a strojové učení k predikci optimálních tras pro doručování, přičemž bere v úvahu povětrnostní podmínky, dopravní situaci, termíny doručení a další faktory.

  • Vizualizace tras taxíků v NYC - data získaná pomocí zákonů o svobodném přístupu k informacím pomohla vizualizovat jeden den v životě taxíků v NYC, což nám umožňuje pochopit, jak se pohybují po rušném městě, kolik vydělávají a jak dlouho trvají jejich cesty během každého 24hodinového období.

  • Uber Data Science Workbench - využívá data (o místech vyzvednutí a vysazení, délce cesty, preferovaných trasách atd.) získaná z milionů denních jízd Uberu k vytvoření analytického nástroje, který pomáhá s cenotvorbou, bezpečností, detekcí podvodů a navigačními rozhodnutími.

  • Analytika ve sportu - zaměřuje se na prediktivní analytiku (analýza týmů a hráčů - například Moneyball - a řízení fanoušků) a vizualizaci dat (dashboardy týmů a fanoušků, hry atd.) s aplikacemi jako skauting talentů, sportovní sázení a řízení inventáře/areálu.

  • Datová věda v bankovnictví - zdůrazňuje hodnotu datové vědy ve finančním průmyslu s aplikacemi od modelování rizik a detekce podvodů po segmentaci zákazníků, predikce v reálném čase a doporučovací systémy. Prediktivní analytika také pohání klíčová opatření jako kreditní skóre.

  • Datová věda ve zdravotnictví - zdůrazňuje aplikace jako lékařské zobrazování (např. MRI, rentgen, CT-sken), genomiku (sekvenování DNA), vývoj léků (hodnocení rizik, predikce úspěchu), prediktivní analytiku (péče o pacienty a logistika zásob), sledování a prevence nemocí atd.

Aplikace datové vědy v reálném světě Zdroj obrázku: Data Flair: 6 Amazing Data Science Applications

Obrázek ukazuje další oblasti a příklady aplikace technik datové vědy. Chcete prozkoumat další aplikace? Podívejte se na sekci Review & Self Study níže.

Data Science + Výzkum

 Sketchnote od (@sketchthedocs)
Data Science & Výzkum - Sketchnote od @nitya

Zatímco aplikace v reálném světě se často zaměřují na průmyslové případy použití ve velkém měřítku, výzkumné aplikace a projekty mohou být užitečné ze dvou perspektiv:

  • příležitosti k inovacím - zkoumání rychlého prototypování pokročilých konceptů a testování uživatelských zkušeností pro aplikace nové generace.
  • výzvy při nasazení - zkoumání potenciálních škod nebo nechtěných důsledků technologií datové vědy v reálných kontextech.

Pro studenty mohou tyto výzkumné projekty poskytnout jak příležitosti k učení, tak ke spolupráci, což může zlepšit jejich porozumění tématu a rozšířit jejich povědomí a zapojení s relevantními lidmi nebo týmy pracujícími v oblastech zájmu. Jak tedy výzkumné projekty vypadají a jak mohou mít dopad?

Podívejme se na jeden příklad - MIT Gender Shades Study od Joy Buolamwini (MIT Media Labs) s významným výzkumným článkem spoluautorky Timnit Gebru (tehdy v Microsoft Research), který se zaměřil na:

  • Co: Cílem výzkumného projektu bylo vyhodnotit přítomnost zaujatosti v algoritmech a datových sadách pro automatizovanou analýzu obličeje na základě pohlaví a typu pokožky.
  • Proč: Analýza obličeje se používá v oblastech jako vymáhání práva, bezpečnost na letištích, systémy náboru a další - kontexty, kde nepřesné klasifikace (např. kvůli zaujatosti) mohou způsobit potenciální ekonomické a sociální škody postiženým jednotlivcům nebo skupinám. Porozumění (a eliminace nebo zmírnění) zaujatosti je klíčem k férovosti při používání.
  • Jak: Výzkumníci zjistili, že stávající benchmarky používaly převážně subjekty se světlejší pokožkou, a vytvořili novou datovou sadu (1000+ obrázků), která byla vyváženější podle pohlaví a typu pokožky. Datová sada byla použita k vyhodnocení přesnosti tří produktů pro klasifikaci pohlaví (od Microsoftu, IBM a Face++).

Výsledky ukázaly, že přestože celková přesnost klasifikace byla dobrá, existoval znatelný rozdíl v míře chyb mezi různými podskupinami - s nesprávným určením pohlaví častějším u žen nebo osob s tmavší pokožkou, což naznačuje zaujatost.

Klíčové výsledky: Zvýšení povědomí o tom, že datová věda potřebuje více reprezentativních datových sad (vyvážené podskupiny) a více inkluzivních týmů (různorodé zázemí), aby bylo možné rozpoznat a eliminovat nebo zmírnit takové zaujatosti dříve v AI řešeních. Výzkumné úsilí jako toto je také klíčové pro mnoho organizací při definování principů a postupů pro odpovědnou AI, aby se zlepšila férovost napříč jejich AI produkty a procesy.

Chcete se dozvědět o relevantních výzkumných snahách v Microsoftu?

Data Science + Humanitní vědy

 Sketchnote od (@sketchthedocs)
Data Science & Digitální humanitní vědy - Sketchnote od @nitya

Digitální humanitní vědy byly definovány jako "soubor praktik a přístupů kombinujících výpočetní metody s humanistickým zkoumáním". Projekty Stanfordu jako "rebooting history" a "poetic thinking" ilustrují propojení mezi digitálními humanitními vědami a datovou vědou - zdůrazňují techniky jako analýza sítí, vizualizace informací, prostorová a textová analýza, které nám mohou pomoci znovu prozkoumat historické a literární datové sady a získat nové poznatky a perspektivy.

Chcete prozkoumat a rozšířit projekt v této oblasti?

Podívejte se na "Emily Dickinson and the Meter of Mood" - skvělý příklad od Jen Looper, který se ptá, jak můžeme využít datovou vědu k opětovnému prozkoumání známé poezie a přehodnocení jejího významu a přínosů jejího autora v nových kontextech. Například, můžeme předpovědět roční období, ve kterém byla báseň napsána, analýzou jejího tónu nebo sentimentu - a co nám to říká o stavu mysli autora během daného období?

K zodpovězení této otázky následujeme kroky životního cyklu datové vědy:

  • Získávání dat - sběr relevantní datové sady pro analýzu. Možnosti zahrnují použití API (např. Poetry DB API) nebo scraping webových stránek (např. Project Gutenberg) pomocí nástrojů jako Scrapy.
  • Čištění dat - vysvětluje, jak může být text formátován, očištěn a zjednodušen pomocí základních nástrojů jako Visual Studio Code a Microsoft Excel.
  • Analýza dat - vysvětluje, jak můžeme nyní importovat datovou sadu do "Notebooks" pro analýzu pomocí Python balíčků (jako pandas, numpy a matplotlib) k organizaci a vizualizaci dat.
  • Analýza sentimentu - vysvětluje, jak můžeme integrovat cloudové služby jako Text Analytics, pomocí nástrojů s nízkým kódem jako Power Automate pro automatizované pracovní postupy zpracování dat.

Pomocí tohoto pracovního postupu můžeme prozkoumat sezónní vlivy na sentiment básní a pomoci nám vytvořit vlastní perspektivy na autora. Vyzkoušejte to sami - poté rozšiřte notebook, abyste položili další otázky nebo vizualizovali data novými způsoby!

Můžete použít některé nástroje z Digital Humanities toolkit k prozkoumání těchto možností.

Data Science + Udržitelnost

 Sketchnote od (@sketchthedocs)
Data Science & Udržitelnost - Sketchnote od @nitya

Agenda 2030 pro udržitelný rozvoj - přijatá všemi členy OSN v roce 2015 - identifikuje 17 cílů, včetně těch, které se zaměřují na ochranu planety před degradací a dopady změny klimatu. Iniciativa Microsoft Sustainability podporuje tyto cíle zkoumáním způsobů, jak technologická řešení mohou podporovat a budovat udržitelnější budoucnost se zaměřením na 4 cíle - být uhlíkově negativní, vodně pozitivní, bez odpadu a biodiverzní do roku 2030.

Řešení těchto výzev ve škálovatelném a včasném měřítku vyžaduje cloudové myšlení - a velké množství dat. Iniciativa Planetary Computer poskytuje 4 komponenty, které pomáhají datovým vědcům a vývojářům v tomto úsilí:

  • Katalog dat - s petabajty dat o systémech Země (zdarma a hostováno na Azure).

  • Planetary API - pomáhá uživatelům hledat relevantní data napříč prostorem a časem.

  • Hub - spravované prostředí pro vědce k zpracování masivních geodatových sad.

  • Aplikace - ukazují případy použití a nástroje pro udržitelné poznatky. Projekt Planetary Computer je aktuálně v náhledu (k září 2021) - zde je návod, jak začít přispívat k řešením udržitelnosti pomocí datové vědy.

  • Požádejte o přístup a začněte s průzkumem a propojením s kolegy.

  • Prozkoumejte dokumentaci, abyste porozuměli podporovaným datovým sadám a API.

  • Prozkoumejte aplikace jako Monitoring ekosystémů pro inspiraci na nápady aplikací.

Přemýšlejte o tom, jak můžete využít vizualizaci dat k odhalení nebo zesílení relevantních poznatků v oblastech, jako je změna klimatu a odlesňování. Nebo přemýšlejte o tom, jak lze poznatky využít k vytvoření nových uživatelských zkušeností, které motivují ke změně chování pro udržitelnější život.

Datová věda + studenti

Hovořili jsme o aplikacích v reálném světě v průmyslu a výzkumu a prozkoumali příklady aplikací datové vědy v digitálních humanitních vědách a udržitelnosti. Jak si tedy můžete rozvíjet své dovednosti a sdílet své znalosti jako začátečníci v datové vědě?

Zde jsou některé příklady studentských projektů v oblasti datové vědy, které vás mohou inspirovat.

🚀 Výzva

Vyhledejte články, které doporučují projekty datové vědy vhodné pro začátečníky - například těchto 50 témat nebo těchto 21 nápadů na projekty nebo těchto 16 projektů se zdrojovým kódem, které můžete rozebrat a upravit. Nezapomeňte také blogovat o svých učebních cestách a sdílet své poznatky s námi všemi.

Kvíz po přednášce

Kvíz po přednášce

Přehled & samostudium

Chcete prozkoumat více případů použití? Zde je několik relevantních článků:

Zadání

Prozkoumejte datovou sadu Planetary Computer


Prohlášení:
Tento dokument byl přeložen pomocí služby pro automatický překlad Co-op Translator. I když se snažíme o co největší přesnost, mějte prosím na paměti, že automatické překlady mohou obsahovat chyby nebo nepřesnosti. Za autoritativní zdroj by měl být považován původní dokument v jeho původním jazyce. Pro důležité informace doporučujeme profesionální lidský překlad. Neodpovídáme za žádná nedorozumění nebo nesprávné výklady vyplývající z použití tohoto překladu.