You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/fi/6-Data-Science-In-Wild/20-Real-World-Examples
leestott 264ebcc9fd
🌐 Update translations via Co-op Translator
5 months ago
..
README.md 🌐 Update translations via Co-op Translator 5 months ago
assignment.md 🌐 Update translations via Co-op Translator 5 months ago

README.md

Data Science todellisessa maailmassa

 Sketchnote by (@sketchthedocs)
Data Science todellisessa maailmassa - Sketchnote by @nitya

Olemme melkein tämän oppimismatkan lopussa!

Aloitimme määrittelemällä data-analytiikan ja etiikan, tutkimme erilaisia työkaluja ja tekniikoita data-analyysiin ja visualisointiin, kävimme läpi data-analytiikan elinkaaren ja tarkastelimme, miten pilvipalvelut voivat auttaa skaalaamaan ja automatisoimaan data-analytiikan työnkulkuja. Saatat nyt miettiä: "Miten voin soveltaa näitä oppeja todellisiin tilanteisiin?"

Tässä oppitunnissa tutkimme data-analytiikan sovelluksia eri toimialoilla ja sukellamme tarkemmin esimerkkeihin tutkimuksen, digitaalisten humanististen tieteiden ja kestävän kehityksen konteksteissa. Tarkastelemme opiskelijaprojektimahdollisuuksia ja päätämme hyödyllisiin resursseihin, jotka auttavat sinua jatkamaan oppimismatkaasi!

Ennakkokysely

Ennakkokysely

Data-analytiikka + Teollisuus

Tekoälyn demokratisoinnin ansiosta kehittäjien on nyt helpompaa suunnitella ja integroida tekoälypohjaista päätöksentekoa ja dataan perustuvia oivalluksia käyttäjäkokemuksiin ja kehitysprosesseihin. Tässä muutamia esimerkkejä siitä, miten data-analytiikkaa sovelletaan todellisiin käyttötapauksiin eri toimialoilla:

  • Google Flu Trends käytti data-analytiikkaa yhdistääkseen hakutermit influenssatrendeihin. Vaikka lähestymistavassa oli puutteita, se lisäsi tietoisuutta dataan perustuvien terveydenhuollon ennusteiden mahdollisuuksista (ja haasteista).

  • UPS:n reittien ennustaminen - selittää, miten UPS käyttää data-analytiikkaa ja koneoppimista ennustaakseen optimaaliset toimitusreitit ottaen huomioon sääolosuhteet, liikennemallit, toimitusaikataulut ja paljon muuta.

  • NYC:n taksireittien visualisointi - data, joka kerättiin tietopyyntölakien avulla, auttoi visualisoimaan yhden päivän NYC:n taksien elämästä, mikä auttaa ymmärtämään, miten ne navigoivat kiireisessä kaupungissa, kuinka paljon rahaa ne ansaitsevat ja kuinka kauan matkat kestävät 24 tunnin aikana.

  • Uber Data Science Workbench - käyttää dataa (nouto- ja jättöpaikat, matkan kesto, suosikkireitit jne.), joka kerätään miljoonista Uber-matkoista päivittäin, rakentaakseen data-analytiikkatyökalun, joka auttaa hinnoittelussa, turvallisuudessa, petosten havaitsemisessa ja navigointipäätöksissä.

  • Urheiluanalytiikka - keskittyy ennakoivaan analytiikkaan (joukkue- ja pelaaja-analyysi - ajattele Moneyball - ja fanien hallinta) sekä datavisualisointiin (joukkue- ja fanidashboardit, pelit jne.) sovelluksilla, kuten kykyjenetsintä, urheiluvedonlyönti ja varaston/tilojen hallinta.

  • Data-analytiikka pankkialalla - korostaa data-analytiikan arvoa rahoitusalalla sovelluksilla, jotka vaihtelevat riskimallinnuksesta ja petosten havaitsemisesta asiakassegmentointiin, reaaliaikaisiin ennusteisiin ja suosittelujärjestelmiin. Ennakoiva analytiikka ohjaa myös kriittisiä mittareita, kuten luottoluokituksia.

  • Data-analytiikka terveydenhuollossa - korostaa sovelluksia, kuten lääketieteellinen kuvantaminen (esim. MRI, röntgen, CT-skannaus), genomiikka (DNA-sekvensointi), lääkekehitys (riskinarviointi, onnistumisen ennustaminen), ennakoiva analytiikka (potilashoito ja toimituslogistiikka), tautien seuranta ja ehkäisy jne.

Data-analytiikan sovellukset todellisessa maailmassa Kuvalähde: Data Flair: 6 Amazing Data Science Applications

Kuvassa esitetään muita aloja ja esimerkkejä data-analytiikan tekniikoiden soveltamisesta. Haluatko tutkia muita sovelluksia? Katso Review & Self Study -osio alta.

Data-analytiikka + Tutkimus

 Sketchnote by (@sketchthedocs)
Data-analytiikka & Tutkimus - Sketchnote by @nitya

Vaikka todelliset sovellukset keskittyvät usein teollisuuden käyttötapauksiin laajassa mittakaavassa, tutkimus-sovellukset ja -projektit voivat olla hyödyllisiä kahdesta näkökulmasta:

  • innovaatiomahdollisuudet - tutkia edistyneiden konseptien nopeaa prototyyppausta ja käyttäjäkokemusten testausta seuraavan sukupolven sovelluksille.
  • käyttöönoton haasteet - tutkia mahdollisia haittoja tai tahattomia seurauksia data-analytiikan teknologioiden käytöstä todellisissa konteksteissa.

Opiskelijoille nämä tutkimusprojektit voivat tarjota sekä oppimis- että yhteistyömahdollisuuksia, jotka parantavat ymmärrystä aiheesta ja laajentavat tietoisuutta ja vuorovaikutusta asiaankuuluvien ihmisten tai tiimien kanssa kiinnostuksen kohteena olevilla alueilla. Miltä tutkimusprojektit näyttävät ja miten ne voivat vaikuttaa?

Tarkastellaan yhtä esimerkkiä - MIT Gender Shades Study Joy Buolamwinilta (MIT Media Labs) ja tutkimuspaperi, jonka hän kirjoitti yhdessä Timnit Gebrun (silloin Microsoft Research) kanssa:

  • Mitä: Tutkimusprojektin tavoitteena oli arvioida sukupuoleen ja ihonväriin perustuvaa puolueellisuutta automaattisissa kasvoanalyysialgoritmeissa ja -datanäytteissä.
  • Miksi: Kasvoanalyysiä käytetään esimerkiksi lainvalvonnassa, lentokenttien turvallisuudessa ja rekrytointijärjestelmissä - konteksteissa, joissa virheelliset luokitukset (esim. puolueellisuuden vuoksi) voivat aiheuttaa taloudellisia ja sosiaalisia haittoja yksilöille tai ryhmille. Puolueellisuuden ymmärtäminen (ja sen poistaminen tai lieventäminen) on avain oikeudenmukaisuuteen käytössä.
  • Miten: Tutkijat huomasivat, että olemassa olevat vertailuarvot käyttivät pääasiassa vaaleaihoisia henkilöitä, ja he loivat uuden datasarjan (yli 1000 kuvaa), joka oli tasapainoisempi sukupuolen ja ihonvärin suhteen. Datasarjaa käytettiin arvioimaan kolmen sukupuolen luokittelutuotteen (Microsoft, IBM ja Face++) tarkkuutta.

Tulokset osoittivat, että vaikka yleinen luokittelutarkkuus oli hyvä, virheprosentit vaihtelivat huomattavasti eri alaryhmien välillä - väärinsukupuolittaminen oli yleisempää naisilla tai tummemman ihonvärin omaavilla henkilöillä, mikä viittaa puolueellisuuteen.

Keskeiset tulokset: Lisäsi tietoisuutta siitä, että data-analytiikka tarvitsee edustavampia datasarjoja (tasapainoiset alaryhmät) ja inklusiivisempia tiimejä (monimuotoiset taustat) tunnistamaan ja poistamaan tai lieventämään tällaisia puolueellisuuksia AI-ratkaisuissa. Tällaiset tutkimusponnistelut ovat myös keskeisiä monille organisaatioille, kun ne määrittelevät periaatteita ja käytäntöjä vastuulliselle tekoälylle oikeudenmukaisuuden parantamiseksi AI-tuotteissaan ja -prosesseissaan.

Haluatko oppia lisää Microsoftin tutkimusponnisteluista?

Data-analytiikka + Humanistiset tieteet

 Sketchnote by (@sketchthedocs)
Data-analytiikka & Digitaaliset humanistiset tieteet - Sketchnote by @nitya

Digitaaliset humanistiset tieteet on määritelty "kokoelmaksi käytäntöjä ja lähestymistapoja, jotka yhdistävät laskennalliset menetelmät humanistiseen tutkimukseen". Stanfordin projektit, kuten "rebooting history" ja "poetic thinking", havainnollistavat yhteyttä digitaalisten humanististen tieteiden ja data-analytiikan välillä - korostaen tekniikoita, kuten verkkoanalyysi, informaatiovisualisointi, spatiaalinen ja tekstianalyysi, jotka voivat auttaa meitä tarkastelemaan historiallisia ja kirjallisia datasarjoja uusista näkökulmista.

Haluatko tutkia ja laajentaa projektia tällä alalla?

Tutustu "Emily Dickinson and the Meter of Mood" -projektiin, joka on loistava esimerkki Jen Looperilta. Se kysyy, miten voimme käyttää data-analytiikkaa tarkastellaksemme uudelleen tuttua runoutta ja arvioidaksemme sen merkitystä ja tekijän panosta uusissa konteksteissa. Esimerkiksi, voimmeko ennustaa vuodenajan, jolloin runo on kirjoitettu, analysoimalla sen sävyä tai tunnetta - ja mitä tämä kertoo meille tekijän mielentilasta kyseisenä ajanjaksona?

Vastataksemme tähän kysymykseen seuraamme data-analytiikan elinkaaren vaiheita:

  • Datan hankinta - kerätäksemme analyysiin sopivan datasarjan. Vaihtoehtoihin kuuluu API:n käyttö (esim. Poetry DB API) tai verkkosivujen kaavinta (esim. Project Gutenberg) työkaluilla, kuten Scrapy.
  • Datan puhdistus - selittää, miten teksti voidaan muotoilla, puhdistaa ja yksinkertaistaa perustyökaluilla, kuten Visual Studio Code ja Microsoft Excel.
  • Datan analyysi - selittää, miten voimme nyt tuoda datasarjan "Notebooks"-ympäristöön analysointia varten Python-pakettien (kuten pandas, numpy ja matplotlib) avulla datan järjestämiseksi ja visualisoimiseksi.
  • Tunneanalyysi - selittää, miten voimme integroida pilvipalveluita, kuten Text Analytics, käyttämällä vähäkoodisia työkaluja, kuten Power Automate automatisoituihin datankäsittelytyönkulkuihin.

Tämän työnkulun avulla voimme tutkia vuodenaikojen vaikutuksia runojen tunnesisältöön ja auttaa meitä muodostamaan omia näkemyksiämme tekijästä. Kokeile itse - ja laajenna notebookia kysyäksesi muita kysymyksiä tai visualisoidaksesi dataa uusilla tavoilla!

Voit käyttää joitakin työkaluja Digital Humanities toolkit -kokoelmasta tutkiaksesi näitä kysymyksiä.

Data-analytiikka + Kestävä kehitys

 Sketchnote by (@sketchthedocs)
Data-analytiikka & Kestävä kehitys - Sketchnote by @nitya

2030 Agenda For Sustainable Development - jonka kaikki YK:n jäsenet hyväksyivät vuonna 2015 - määrittelee 17 tavoitetta, joista osa keskittyy planeetan suojelemiseen rappeutumiselta ja ilmastonmuutoksen vaikutuksilta. Microsoft Sustainability -aloite tukee näitä tavoitteita tutkimalla, miten teknologiaratkaisut voivat tukea ja rakentaa kestävämpiä tulevaisuuksia keskittyen neljään tavoitteeseen - olla hiilinegatiivinen, vesipositiivinen, jätteetön ja biologisesti monimuotoinen vuoteen 2030 mennessä.

Näiden haasteiden ratkaiseminen skaalautuvasti ja ajallaan vaatii pilvipohjaista ajattelua - ja suuria määriä dataa. Planetary Computer -aloite tarjoaa neljä komponenttia, jotka auttavat data-analyytikkoja ja kehittäjiä tässä työssä:

  • Data Catalog - sisältää petatavuja maapallon järjestelmien dataa (ilmainen ja Azure-isännöity).

  • Planetary API - auttaa käyttäjiä etsimään relevanttia dataa ajassa ja paikassa.

  • Hub - hallittu ympäristö tutkijoille massiivisten paikkatietoaineistojen käsittelyyn.

  • Applications - esittelee käyttötapauksia ja työkaluja kestävän kehityksen oivallusten saamiseksi. Planetary Computer -projekti on tällä hetkellä esikatseluvaiheessa (syyskuu 2021) - näin pääset alkuun ja voit osallistua kestävän kehityksen ratkaisuihin datatieteen avulla.

  • Pyydä käyttöoikeutta aloittaaksesi tutkimisen ja verkostoitumisen muiden kanssa.

  • Tutustu dokumentaatioon ymmärtääksesi tuetut tietoaineistot ja API:t.

  • Tutustu sovelluksiin, kuten Ecosystem Monitoring, saadaksesi inspiraatiota sovellusideoihin.

Pohdi, kuinka voit käyttää datavisualisointia tuomaan esiin tai korostamaan merkityksellisiä havaintoja esimerkiksi ilmastonmuutoksen ja metsäkadon kaltaisista aiheista. Tai mieti, kuinka havaintoja voidaan hyödyntää uusien käyttäjäkokemusten luomisessa, jotka motivoivat käyttäytymismuutoksia kohti kestävämpää elämäntapaa.

Datatiede + Opiskelijat

Olemme keskustelleet tosielämän sovelluksista teollisuudessa ja tutkimuksessa sekä tutkineet datatieteen sovellusesimerkkejä digitaalisten humanististen tieteiden ja kestävän kehityksen parissa. Kuinka siis voit kehittää taitojasi ja jakaa asiantuntemustasi datatieteen aloittelijana?

Tässä muutamia esimerkkejä datatieteen opiskelijaprojekteista inspiraatioksi.

🚀 Haaste

Etsi artikkeleita, jotka suosittelevat datatieteen projekteja aloittelijoille - kuten nämä 50 aihealuetta tai nämä 21 projektia tai nämä 16 projektia lähdekoodilla, joita voit purkaa ja muokata. Älä unohda blogata oppimismatkastasi ja jakaa havaintojasi kanssamme.

Luentojälkeinen kysely

Luentojälkeinen kysely

Kertaus & Itseopiskelu

Haluatko tutkia lisää käyttötapauksia? Tässä muutamia aiheeseen liittyviä artikkeleita:

Tehtävä

Tutki Planetary Computer -tietoaineistoa


Vastuuvapauslauseke:
Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua Co-op Translator. Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäistä asiakirjaa sen alkuperäisellä kielellä tulee pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskääntämistä. Emme ole vastuussa tämän käännöksen käytöstä johtuvista väärinkäsityksistä tai virhetulkinnoista.