|
2 weeks ago | |
---|---|---|
.. | ||
README.md | 2 weeks ago | |
assignment.md | 3 weeks ago |
README.md
Data Science u stvarnom svijetu
![]() |
---|
Data Science u stvarnom svijetu - Sketchnote by @nitya |
Skoro smo na kraju ovog edukativnog putovanja!
Počeli smo s definicijama data sciencea i etike, istražili razne alate i tehnike za analizu i vizualizaciju podataka, pregledali životni ciklus data sciencea te razmotrili skaliranje i automatizaciju radnih procesa uz usluge računalstva u oblaku. Dakle, vjerojatno se pitate: "Kako točno primijeniti sve ove lekcije u stvarnim kontekstima?"
U ovoj lekciji istražit ćemo primjene data sciencea u industriji i detaljno razmotriti specifične primjere u istraživanju, digitalnim humanističkim znanostima i održivosti. Pogledat ćemo prilike za studentske projekte i zaključiti s korisnim resursima koji će vam pomoći da nastavite svoje edukativno putovanje!
Kviz prije predavanja
Kviz prije predavanja
Data Science + Industrija
Zahvaljujući demokratizaciji AI-a, programerima je sada lakše dizajnirati i integrirati odluke vođene umjetnom inteligencijom i uvide temeljene na podacima u korisničke iskustve i razvojne procese. Evo nekoliko primjera kako se data science "primjenjuje" u stvarnim industrijskim aplikacijama:
-
Google Flu Trends koristio je data science za povezivanje pojmova pretraživanja s trendovima gripe. Iako je pristup imao nedostatke, podigao je svijest o mogućnostima (i izazovima) predviđanja u zdravstvu temeljenog na podacima.
-
UPS Routing Predictions - objašnjava kako UPS koristi data science i strojno učenje za predviđanje optimalnih ruta dostave, uzimajući u obzir vremenske uvjete, prometne obrasce, rokove dostave i druge faktore.
-
NYC Taxicab Route Visualization - podaci prikupljeni korištenjem Zakona o slobodi informacija pomogli su vizualizirati jedan dan u životu taksija u New Yorku, omogućujući nam da razumijemo kako se kreću po gradu, koliko zarađuju i koliko traju vožnje tijekom 24-satnog razdoblja.
-
Uber Data Science Workbench - koristi podatke (o lokacijama preuzimanja i odredišta, trajanju vožnje, preferiranim rutama itd.) prikupljene iz milijuna Uber vožnji dnevno za izradu alata za analizu podataka koji pomaže u određivanju cijena, sigurnosti, otkrivanju prijevara i donošenju navigacijskih odluka.
-
Sports Analytics - fokusira se na prediktivnu analitiku (analiza timova i igrača - poput Moneyball - i upravljanje navijačima) i vizualizaciju podataka (nadzorne ploče za timove i navijače, igre itd.) s primjenama poput skautinga talenata, sportskog klađenja i upravljanja inventarom/objektima.
-
Data Science u bankarstvu - ističe vrijednost data sciencea u financijskoj industriji s primjenama koje uključuju modeliranje rizika, otkrivanje prijevara, segmentaciju klijenata, predviđanje u stvarnom vremenu i sustave preporuka. Prediktivna analitika također pokreće ključne mjere poput kreditnih bodova.
-
Data Science u zdravstvu - ističe primjene poput medicinskog snimanja (npr. MRI, X-Ray, CT-Scan), genomike (sekvenciranje DNA), razvoja lijekova (procjena rizika, predviđanje uspjeha), prediktivne analitike (skrb za pacijente i logistika opskrbe), praćenja i prevencije bolesti itd.
Izvor slike: Data Flair: 6 Amazing Data Science Applications
Slika prikazuje druge domene i primjere primjene tehnika data sciencea. Želite istražiti druge primjene? Pogledajte odjeljak Pregled i samostalno učenje u nastavku.
Data Science + Istraživanje
![]() |
---|
Data Science & Istraživanje - Sketchnote by @nitya |
Iako se primjene u stvarnom svijetu često fokusiraju na industrijske slučajeve korištenja u velikim razmjerima, istraživačke primjene i projekti mogu biti korisni iz dvije perspektive:
- prilike za inovaciju - istraživanje brzog prototipiranja naprednih koncepata i testiranje korisničkih iskustava za aplikacije sljedeće generacije.
- izazovi implementacije - istraživanje potencijalnih šteta ili nenamjernih posljedica tehnologija data sciencea u stvarnim kontekstima.
Za studente, ovi istraživački projekti mogu pružiti prilike za učenje i suradnju koje poboljšavaju vaše razumijevanje teme te proširuju vašu svijest i angažman s relevantnim ljudima ili timovima koji rade u područjima interesa. Kako izgledaju istraživački projekti i kako mogu imati utjecaj?
Pogledajmo jedan primjer - MIT Gender Shades Study od Joy Buolamwini (MIT Media Labs) s potpisanim istraživačkim radom koji je koautorirala Timnit Gebru (tada u Microsoft Researchu) i koji se fokusirao na:
- Što: Cilj istraživačkog projekta bio je procijeniti pristranost prisutnu u algoritmima i skupovima podataka za automatsku analizu lica na temelju spola i tipa kože.
- Zašto: Analiza lica koristi se u područjima poput provođenja zakona, sigurnosti u zračnim lukama, sustava zapošljavanja i više - konteksti u kojima netočne klasifikacije (npr. zbog pristranosti) mogu uzrokovati potencijalne ekonomske i društvene štete za pogođene pojedince ili skupine. Razumijevanje (i uklanjanje ili ublažavanje) pristranosti ključno je za pravednost u korištenju.
- Kako: Istraživači su prepoznali da se postojeći referentni uzorci uglavnom koriste za subjekte svjetlije kože te su kreirali novi skup podataka (1000+ slika) koji je uravnoteženiji prema spolu i tipu kože. Skup podataka korišten je za procjenu točnosti tri proizvoda za klasifikaciju spola (od Microsofta, IBM-a i Face++).
Rezultati su pokazali da, iako je ukupna točnost klasifikacije bila dobra, postojala je primjetna razlika u stopama pogrešaka između različitih podskupina - s pogrešnom klasifikacijom spola koja je bila veća za žene ili osobe tamnije kože, što ukazuje na pristranost.
Ključni rezultati: Podignuta je svijest da data science treba više reprezentativnih skupova podataka (uravnotežene podskupine) i više inkluzivnih timova (raznolike pozadine) kako bi se pristranosti prepoznale i uklonile ili ublažile ranije u AI rješenjima. Istraživački napori poput ovog također su ključni za mnoge organizacije u definiranju principa i praksi za odgovorni AI kako bi se poboljšala pravednost u njihovim AI proizvodima i procesima.
Želite saznati više o relevantnim istraživačkim naporima u Microsoftu?
- Pogledajte Microsoft Research Projects o umjetnoj inteligenciji.
- Istražite studentske projekte iz Microsoft Research Data Science Summer School.
- Pogledajte projekt Fairlearn i inicijative Responsible AI.
Data Science + Humanističke znanosti
![]() |
---|
Data Science & Digitalne humanističke znanosti - Sketchnote by @nitya |
Digitalne humanističke znanosti definirane su kao "zbirka praksi i pristupa koji kombiniraju računalne metode s humanističkim istraživanjem". Stanford projekti poput "rebooting history" i "poetic thinking" ilustriraju poveznicu između Digitalnih humanističkih znanosti i Data Sciencea - naglašavajući tehnike poput analize mreža, vizualizacije informacija, prostorne i tekstualne analize koje nam mogu pomoći da ponovno razmotrimo povijesne i književne skupove podataka kako bismo dobili nove uvide i perspektive.
Želite istražiti i proširiti projekt u ovom području?
Pogledajte "Emily Dickinson and the Meter of Mood" - izvrstan primjer od Jen Looper koji postavlja pitanje kako možemo koristiti data science za ponovno razmatranje poznate poezije i ponovno vrednovanje njezina značenja i doprinosa autora u novim kontekstima. Na primjer, možemo li predvidjeti godišnje doba u kojem je pjesma napisana analizom njezina tona ili sentimenta - i što nam to govori o autorovu stanju uma tijekom relevantnog razdoblja?
Da bismo odgovorili na to pitanje, slijedimo korake životnog ciklusa data sciencea:
Prikupljanje podataka
- za prikupljanje relevantnog skupa podataka za analizu. Opcije uključuju korištenje API-ja (npr. Poetry DB API) ili struganje web stranica (npr. Project Gutenberg) pomoću alata poput Scrapy.Čišćenje podataka
- objašnjava kako se tekst može formatirati, sanitizirati i pojednostaviti pomoću osnovnih alata poput Visual Studio Codea i Microsoft Excela.Analiza podataka
- objašnjava kako sada možemo uvesti skup podataka u "Notebooks" za analizu pomoću Python paketa (poput pandas, numpy i matplotlib) za organizaciju i vizualizaciju podataka.Analiza sentimenta
- objašnjava kako možemo integrirati usluge u oblaku poput Text Analyticsa, koristeći alate s malo koda poput Power Automate za automatizirane radne procese obrade podataka.
Koristeći ovaj radni proces, možemo istražiti sezonske utjecaje na sentiment pjesama i pomoći nam oblikovati vlastite perspektive o autoru. Isprobajte sami - zatim proširite notebook kako biste postavili druga pitanja ili vizualizirali podatke na nove načine!
Možete koristiti neke od alata iz Digital Humanities toolkit za istraživanje ovih područja.
Data Science + Održivost
![]() |
---|
Data Science & Održivost - Sketchnote by @nitya |
Agenda za održivi razvoj 2030 - koju su usvojile sve članice Ujedinjenih naroda 2015. godine - identificira 17 ciljeva, uključujući one koji se fokusiraju na zaštitu planeta od degradacije i utjecaja klimatskih promjena. Inicijativa Microsoft Sustainability podržava ove ciljeve istražujući načine na koje tehnološka rješenja mogu podržati i izgraditi održiviju budućnost s fokusom na 4 cilja - biti ugljično negativan, vodno pozitivan, bez otpada i biodiverzivan do 2030.
Rješavanje ovih izazova na skalabilan i pravovremen način zahtijeva razmišljanje u oblaku - i velike količine podataka. Inicijativa Planetary Computer pruža 4 komponente koje pomažu data znanstvenicima i programerima u ovom naporu:
-
Katalog podataka - s petabajtima podataka o Zemljinim sustavima (besplatno i hostirano na Azureu).
-
Planetary API - za pomoć korisnicima u pretraživanju relevantnih podataka kroz prostor i vrijeme.
-
Hub - upravljano okruženje za znanstvenike za obradu masivnih geoprostornih skupova podataka.
-
Aplikacije - prikazuju slučajeve korištenja i alate za uvide u održivost. Projekt Planetary Computer trenutno je u fazi pregleda (od rujna 2021.) - evo kako možete započeti doprinositi rješenjima za održivost koristeći podatkovnu znanost.
-
Zatražite pristup kako biste započeli istraživanje i povezali se s kolegama.
-
Istražite dokumentaciju kako biste razumjeli podržane skupove podataka i API-je.
-
Istražite aplikacije poput Praćenje ekosustava za inspiraciju za ideje o primjeni.
Razmislite o tome kako možete koristiti vizualizaciju podataka za otkrivanje ili naglašavanje relevantnih uvida u područjima poput klimatskih promjena i krčenja šuma. Ili razmislite o tome kako se uvidi mogu koristiti za stvaranje novih korisničkih iskustava koja motiviraju promjene ponašanja za održiviji način života.
Podatkovna znanost + studenti
Razgovarali smo o primjenama u stvarnom svijetu u industriji i istraživanju te istražili primjere primjene podatkovne znanosti u digitalnim humanističkim znanostima i održivosti. Pa kako možete izgraditi svoje vještine i podijeliti svoje znanje kao početnici u podatkovnoj znanosti?
Evo nekoliko primjera studentskih projekata iz podatkovne znanosti koji vas mogu inspirirati.
- MSR Ljetna škola podatkovne znanosti s GitHub projektima koji istražuju teme poput:
- Digitalizacija materijalne kulture: Istraživanje socio-ekonomskih distribucija u Sirkapu - od Ornella Altunyan i tima iz Claremonta, koristeći ArcGIS StoryMaps.
🚀 Izazov
Potražite članke koji preporučuju projekte iz podatkovne znanosti prilagođene početnicima - poput ovih 50 područja ili ovih 21 ideja za projekte ili ovih 16 projekata s izvornim kodom koje možete rastaviti i ponovno sastaviti. I ne zaboravite pisati blog o svojim iskustvima učenja i podijeliti svoje uvide s nama.
Kviz nakon predavanja
Kviz nakon predavanja
Pregled i samostalno učenje
Želite istražiti više primjera primjene? Evo nekoliko relevantnih članaka:
- 17 primjena i primjera podatkovne znanosti - srpanj 2021.
- 11 zadivljujućih primjena podatkovne znanosti u stvarnom svijetu - svibanj 2021.
- Podatkovna znanost u stvarnom svijetu - zbirka članaka
- 12 primjena podatkovne znanosti u stvarnom svijetu s primjerima - svibanj 2024.
- Podatkovna znanost u: obrazovanju, poljoprivredi, financijama, filmovima, zdravstvu i više.
Zadatak
Istražite skup podataka Planetary Computer
Odricanje od odgovornosti:
Ovaj dokument je preveden korištenjem AI usluge za prevođenje Co-op Translator. Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati mjerodavnim izvorom. Za ključne informacije preporučuje se profesionalni prijevod od strane stručnjaka. Ne preuzimamo odgovornost za bilo kakve nesporazume ili pogrešne interpretacije proizašle iz korištenja ovog prijevoda.