19 KiB
Data Science tosielämässä
![]() |
---|
Data Science tosielämässä - Sketchnote by @nitya |
Olemme melkein tämän oppimismatkan lopussa!
Aloitimme määrittelemällä data-analytiikan ja etiikan, tutkimme erilaisia työkaluja ja tekniikoita data-analyysiin ja visualisointiin, kävimme läpi data-analytiikan elinkaaren ja tarkastelimme, miten pilvipalvelut voivat auttaa skaalaamaan ja automatisoimaan data-analytiikan työnkulkuja. Nyt saatat miettiä: "Miten voin soveltaa näitä oppeja tosielämän tilanteisiin?"
Tässä oppitunnissa tutkimme data-analytiikan käytännön sovelluksia eri toimialoilla ja sukellamme tarkemmin tutkimuksen, digitaalisten humanististen tieteiden ja kestävän kehityksen esimerkkeihin. Tarkastelemme opiskelijaprojektimahdollisuuksia ja päätämme hyödyllisiin resursseihin, jotka auttavat sinua jatkamaan oppimismatkaasi!
Ennakkokysely
Data-analytiikka + Teollisuus
Tekoälyn demokratisoinnin ansiosta kehittäjien on nyt helpompi suunnitella ja integroida tekoälypohjaista päätöksentekoa ja dataan perustuvia oivalluksia käyttäjäkokemuksiin ja kehitysprosesseihin. Tässä muutamia esimerkkejä siitä, miten data-analytiikkaa sovelletaan tosielämän tilanteisiin eri toimialoilla:
-
Google Flu Trends käytti data-analytiikkaa yhdistääkseen hakutermit influenssatrendeihin. Vaikka lähestymistavassa oli puutteita, se lisäsi tietoisuutta dataan perustuvien terveydenhuollon ennusteiden mahdollisuuksista (ja haasteista).
-
UPS:n reittien ennustaminen - selittää, miten UPS käyttää data-analytiikkaa ja koneoppimista ennustaakseen optimaaliset toimitusreitit ottaen huomioon sääolosuhteet, liikennemallit, toimitusaikataulut ja paljon muuta.
-
NYC:n taksireittien visualisointi - data, joka kerättiin tietopyyntölakien avulla, auttoi visualisoimaan yhden päivän NYC:n taksien elämästä, mikä auttaa ymmärtämään, miten ne navigoivat kiireisessä kaupungissa, kuinka paljon rahaa ne ansaitsevat ja kuinka kauan matkat kestävät 24 tunnin aikana.
-
Uber Data Science Workbench - käyttää dataa (nouto- ja jättöpaikat, matkan kesto, suosikkireitit jne.), joka kerätään miljoonista Uber-matkoista päivittäin, rakentaakseen data-analytiikkatyökalun hinnoittelun, turvallisuuden, petosten havaitsemisen ja navigointipäätösten tueksi.
-
Urheiluanalytiikka - keskittyy ennakoivaan analytiikkaan (joukkue- ja pelaaja-analyysi - ajattele Moneyball - ja fanien hallinta) sekä datavisualisointiin (joukkue- ja fanidashboardit, pelit jne.) sovelluksilla, kuten kykyjenetsintä, urheiluvedonlyönti ja varaston/areenan hallinta.
-
Data-analytiikka pankkialalla - korostaa data-analytiikan arvoa rahoitusalalla sovelluksilla, jotka vaihtelevat riskimallinnuksesta ja petosten havaitsemisesta asiakassegmentointiin, reaaliaikaisiin ennusteisiin ja suosittelujärjestelmiin. Ennakoiva analytiikka ohjaa myös kriittisiä mittareita, kuten luottoluokituksia.
-
Data-analytiikka terveydenhuollossa - korostaa sovelluksia, kuten lääketieteellinen kuvantaminen (esim. MRI, röntgen, CT-skannaus), genomiikka (DNA-sekvensointi), lääkekehitys (riskinarviointi, onnistumisen ennustaminen), ennakoiva analytiikka (potilashoito ja toimituslogistiikka), tautien seuranta ja ehkäisy jne.
Kuvalähde: Data Flair: 6 Amazing Data Science Applications
Kuvassa näkyy muita aloja ja esimerkkejä data-analytiikan tekniikoiden soveltamisesta. Haluatko tutkia muita sovelluksia? Katso Review & Self Study -osio alta.
Data-analytiikka + Tutkimus
![]() |
---|
Data-analytiikka & Tutkimus - Sketchnote by @nitya |
Vaikka tosielämän sovellukset keskittyvät usein teollisuuden käyttötapauksiin laajassa mittakaavassa, tutkimus-sovellukset ja -projektit voivat olla hyödyllisiä kahdesta näkökulmasta:
- Innovointimahdollisuudet - tutkia edistyneiden konseptien nopeaa prototyyppausta ja käyttäjäkokemusten testausta seuraavan sukupolven sovelluksille.
- Käyttöönottohaasteet - tutkia mahdollisia haittoja tai tahattomia seurauksia data-analytiikan teknologioiden käytöstä tosielämän konteksteissa.
Opiskelijoille nämä tutkimusprojektit voivat tarjota sekä oppimis- että yhteistyömahdollisuuksia, jotka parantavat ymmärrystä aiheesta ja laajentavat tietoisuutta ja vuorovaikutusta asiaankuuluvien ihmisten tai tiimien kanssa kiinnostuksen kohteena olevilla alueilla. Miltä tutkimusprojektit näyttävät ja miten ne voivat vaikuttaa?
Tarkastellaan yhtä esimerkkiä - MIT Gender Shades Study, jonka toteutti Joy Buolamwini (MIT Media Labs) yhdessä tutkimuspaperin kanssa, jonka hän kirjoitti yhdessä Timnit Gebrun (silloin Microsoft Research) kanssa. Tutkimus keskittyi:
- Mitä: Tutkimusprojektin tavoitteena oli arvioida sukupuoleen ja ihonväriin perustuvaa puolueellisuutta automaattisissa kasvoanalyysialgoritmeissa ja -datalähteissä.
- Miksi: Kasvoanalyysiä käytetään esimerkiksi lainvalvonnassa, lentokenttien turvallisuudessa ja rekrytointijärjestelmissä - konteksteissa, joissa epätarkat luokitukset (esim. puolueellisuuden vuoksi) voivat aiheuttaa taloudellisia ja sosiaalisia haittoja yksilöille tai ryhmille. Puolueellisuuden ymmärtäminen (ja sen poistaminen tai lieventäminen) on avainasemassa oikeudenmukaisuudessa.
- Miten: Tutkijat huomasivat, että olemassa olevat vertailuarvot käyttivät pääasiassa vaaleaihoisia henkilöitä, ja he loivat uuden datalähteen (yli 1000 kuvaa), joka oli tasapainoisempi sukupuolen ja ihonvärin suhteen. Tätä datalähdettä käytettiin arvioimaan kolmen sukupuoliluokittelutuotteen (Microsoft, IBM ja Face++) tarkkuutta.
Tulokset osoittivat, että vaikka yleinen luokittelutarkkuus oli hyvä, virheprosentit vaihtelivat huomattavasti eri alaryhmien välillä - väärinsukupuolittaminen oli yleisempää naisilla ja tummemman ihonvärin omaavilla henkilöillä, mikä viittaa puolueellisuuteen.
Keskeiset tulokset: Tutkimus lisäsi tietoisuutta siitä, että data-analytiikka tarvitsee edustavampia datalähteitä (tasapainoiset alaryhmät) ja monimuotoisempia tiimejä (erilaiset taustat) tunnistamaan ja poistamaan tai lieventämään tällaisia puolueellisuuksia AI-ratkaisuissa. Tällaiset tutkimusponnistelut ovat myös auttaneet monia organisaatioita määrittelemään periaatteita ja käytäntöjä vastuulliselle tekoälylle oikeudenmukaisuuden parantamiseksi AI-tuotteissaan ja -prosesseissaan.
Haluatko oppia lisää Microsoftin tutkimusponnisteluista?
- Tutustu Microsoft Research Projects tekoälyn alalla.
- Tutki opiskelijaprojekteja Microsoft Research Data Science Summer School.
- Katso Fairlearn -projekti ja Responsible AI -aloitteet.
Data-analytiikka + Humanistiset tieteet
![]() |
---|
Data-analytiikka & Digitaaliset humanistiset tieteet - Sketchnote by @nitya |
Digitaaliset humanistiset tieteet on määritelty "kokoelmaksi käytäntöjä ja lähestymistapoja, jotka yhdistävät laskennalliset menetelmät humanistiseen tutkimukseen". Stanfordin projektit, kuten "rebooting history" ja "poetic thinking", havainnollistavat yhteyttä digitaalisten humanististen tieteiden ja data-analytiikan välillä - korostaen tekniikoita, kuten verkkoanalyysi, tiedon visualisointi, spatiaalinen ja tekstianalyysi, jotka voivat auttaa meitä tarkastelemaan historiallisia ja kirjallisia datasettejä uusista näkökulmista.
Haluatko tutkia ja laajentaa projektia tällä alalla?
Tutustu "Emily Dickinson and the Meter of Mood" -projektiin, joka on loistava esimerkki Jen Looperilta. Se kysyy, miten voimme käyttää data-analytiikkaa tarkastellaksemme uudelleen tuttua runoutta ja arvioidaksemme sen merkitystä ja tekijänsä panosta uusissa konteksteissa. Esimerkiksi, voimmeko ennustaa vuodenajan, jolloin runo on kirjoitettu, analysoimalla sen sävyä tai tunnetta - ja mitä tämä kertoo meille tekijän mielentilasta kyseisenä ajanjaksona?
Vastataksemme tähän kysymykseen seuraamme data-analytiikan elinkaaren vaiheita:
Datan hankinta
- kerätäksemme analyysiin sopivan datasetin. Vaihtoehtoihin kuuluu API:n käyttö (esim. Poetry DB API) tai verkkosivujen kaavinta (esim. Project Gutenberg) työkaluilla, kuten Scrapy.Datan puhdistus
- selittää, miten teksti voidaan muotoilla, puhdistaa ja yksinkertaistaa perustyökaluilla, kuten Visual Studio Code ja Microsoft Excel.Datan analyysi
- selittää, miten voimme tuoda datasetin "Notebooks"-ympäristöön analysointia varten Python-pakettien (kuten pandas, numpy ja matplotlib) avulla datan järjestämiseksi ja visualisoimiseksi.Tunneanalyysi
- selittää, miten voimme integroida pilvipalveluita, kuten Text Analytics, käyttämällä vähäkoodisia työkaluja, kuten Power Automate automatisoitujen datankäsittelytyönkulkujen luomiseen.
Tämän työnkulun avulla voimme tutkia vuodenaikojen vaikutuksia runojen tunnesisältöön ja auttaa meitä muodostamaan omia näkemyksiämme tekijästä. Kokeile itse - ja laajenna notebookia kysyäksesi muita kysymyksiä tai visualisoidaksesi dataa uusilla tavoilla!
Voit käyttää joitakin työkaluja Digital Humanities toolkit -kokoelmasta tutkiaksesi näitä kysymyksiä.
Data-analytiikka + Kestävä kehitys
![]() |
---|
Data-analytiikka & Kestävä kehitys - Sketchnote by @nitya |
2030 Agenda For Sustainable Development - jonka kaikki YK:n jäsenet hyväksyivät vuonna 2015 - määrittelee 17 tavoitetta, joista osa keskittyy planeetan suojelemiseen rappeutumiselta ja ilmastonmuutoksen vaikutuksilta. Microsoft Sustainability -aloite tukee näitä tavoitteita tutkimalla, miten teknologiaratkaisut voivat tukea ja rakentaa kestävämpiä tulevaisuuksia keskittyen neljään tavoitteeseen: hiilinegatiivisuus, vesipositiivisuus, nollajäte ja biologinen monimuotoisuus vuoteen 2030 mennessä.
Näiden haasteiden ratkaiseminen skaalautuvasti ja ajallaan vaatii pilvipohjaista ajattelua - ja suuria määriä dataa. Planetary Computer -aloite tarjoaa neljä komponenttia, jotka auttavat data-analyytikkoja ja kehittäjiä tässä työssä:
- Data Catalog - sisältää petatavuja maapallon järjestelmien dataa (ilmainen ja Azure-isännöity).
- Planetary API - auttaa käyttäjiä etsimään relevanttia dataa ajan ja paikan mukaan.
- Hub - hallinnoitu ympäristö tutkijoille massiivisten paikkatietoaineistojen käsittelyyn.
- Applications - esittelee käyttötapauksia ja työkaluja kestävän kehityksen oivallusten tueksi. Planetary Computer -projekti on tällä hetkellä esikatseluvaiheessa (syyskuu 2021) - näin voit aloittaa kestävän kehityksen ratkaisujen edistämisen datatieteen avulla.
- Pyydä käyttöoikeutta aloittaaksesi tutkimisen ja verkostoitumisen muiden kanssa.
- Tutustu dokumentaatioon ymmärtääksesi tuetut tietoaineistot ja API:t.
- Tutustu sovelluksiin, kuten Ecosystem Monitoring, saadaksesi inspiraatiota sovellusideoihin.
Pohdi, kuinka voit käyttää datavisualisointia paljastaaksesi tai korostaaksesi merkityksellisiä havaintoja esimerkiksi ilmastonmuutoksen ja metsäkadon alueilla. Tai mieti, kuinka havainnot voivat auttaa luomaan uusia käyttäjäkokemuksia, jotka motivoivat käyttäytymismuutoksia kohti kestävämpää elämäntapaa.
Datatiede + Opiskelijat
Olemme keskustelleet tosielämän sovelluksista teollisuudessa ja tutkimuksessa sekä tutkineet datatieteen sovellusesimerkkejä digitaalisen humanismin ja kestävän kehityksen alueilla. Kuinka siis voit kehittää taitojasi ja jakaa asiantuntemustasi datatieteen aloittelijana?
Tässä on joitakin esimerkkejä datatieteen opiskelijaprojekteista inspiraatioksi.
- MSR Data Science Summer School ja GitHub projektit, jotka tutkivat aiheita kuten:
- Materiaalisen kulttuurin digitalisointi: Sirkapin sosioekonomisten jakautumien tutkiminen - Ornella Altunyan ja tiimi Claremontissa, käyttäen ArcGIS StoryMaps.
🚀 Haaste
Etsi artikkeleita, jotka suosittelevat aloittelijaystävällisiä datatieteen projekteja - kuten nämä 50 aihealuetta tai nämä 21 projektia tai nämä 16 projektia lähdekoodilla, joita voit purkaa ja muokata. Älä unohda blogata oppimismatkastasi ja jakaa havaintojasi kanssamme.
Luentojälkeinen kysely
Katsaus & Itseopiskelu
Haluatko tutkia lisää käyttötapauksia? Tässä muutamia aiheeseen liittyviä artikkeleita:
- 17 datatieteen sovellusta ja esimerkkiä - heinäkuu 2021
- 11 hämmästyttävää datatieteen sovellusta tosielämässä - toukokuu 2021
- Datatiede tosielämässä - artikkelikokoelma
- Datatiede: Koulutus, Maatalous, Rahoitus, Elokuvat ja paljon muuta.
Tehtävä
Tutki Planetary Computer -tietoaineistoa
Vastuuvapauslauseke:
Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua Co-op Translator. Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäinen asiakirja sen alkuperäisellä kielellä tulisi pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskäännöstä. Emme ole vastuussa väärinkäsityksistä tai virhetulkinnoista, jotka johtuvat tämän käännöksen käytöstä.