You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/da/6-Data-Science-In-Wild/20-Real-World-Examples/README.md

18 KiB

Data Science i den Virkelige Verden

 Sketchnote af (@sketchthedocs)
Data Science i den Virkelige Verden - Sketchnote af @nitya

Vi er næsten ved vejs ende i denne læringsrejse!

Vi startede med definitioner af data science og etik, udforskede forskellige værktøjer og teknikker til dataanalyse og visualisering, gennemgik data science-livscyklussen og kiggede på skalering og automatisering af data science-arbejdsgange med cloud computing-tjenester. Så du tænker sikkert: "Hvordan kan jeg præcist anvende alt dette i virkelige kontekster?"

I denne lektion vil vi undersøge virkelige anvendelser af data science på tværs af industrier og dykke ned i specifikke eksempler inden for forskning, digitale humaniora og bæredygtighed. Vi vil se på muligheder for studenterprojekter og afslutte med nyttige ressourcer, der kan hjælpe dig med at fortsætte din læringsrejse!

Quiz før forelæsning

Quiz før forelæsning

Data Science + Industri

Takket være demokratiseringen af AI finder udviklere det nu lettere at designe og integrere AI-drevne beslutningsprocesser og data-drevne indsigter i brugeroplevelser og udviklingsarbejdsgange. Her er nogle eksempler på, hvordan data science "anvendes" i virkelige applikationer på tværs af industrier:

  • Google Flu Trends brugte data science til at korrelere søgetermer med influenzatrends. Selvom tilgangen havde fejl, skabte den opmærksomhed omkring mulighederne (og udfordringerne) ved data-drevne sundhedsprognoser.

  • UPS Routing Predictions - forklarer, hvordan UPS bruger data science og maskinlæring til at forudsige optimale leveringsruter, med hensyntagen til vejrforhold, trafikmønstre, leveringsfrister og mere.

  • NYC Taxicab Route Visualization - data indsamlet ved hjælp af Freedom Of Information Laws hjalp med at visualisere en dag i livet for NYC-taxier, hvilket gav indsigt i, hvordan de navigerer i den travle by, hvor meget de tjener, og varigheden af ture over en 24-timers periode.

  • Uber Data Science Workbench - bruger data (om afhentnings- og afleveringssteder, turens varighed, foretrukne ruter osv.) indsamlet fra millioner af Uber-ture dagligt til at bygge et dataanalysværktøj, der hjælper med prissætning, sikkerhed, svindelopdagelse og navigationsbeslutninger.

  • Sports Analytics - fokuserer på forudsigende analyse (hold- og spilleranalyse - tænk Moneyball - og fanhåndtering) og datavisualisering (hold- og fandashboards, spil osv.) med applikationer som talentspejderarbejde, sportsvæddemål og lager-/venuehåndtering.

  • Data Science i Banksektoren - fremhæver værdien af data science i finanssektoren med applikationer, der spænder fra risikomodellering og svindelopdagelse til kundesegmentering, realtidsprognoser og anbefalingssystemer. Forudsigende analyse driver også kritiske målinger som kreditvurderinger.

  • Data Science i Sundhedssektoren - fremhæver applikationer som medicinsk billedbehandling (f.eks. MRI, røntgen, CT-scanning), genomik (DNA-sekventering), lægemiddeludvikling (risikovurdering, succesprognose), forudsigende analyse (patientpleje og forsyningslogistik), sygdomssporing og -forebyggelse osv.

Data Science Applications in The Real World Billedkredit: Data Flair: 6 Amazing Data Science Applications

Figuren viser andre domæner og eksempler på anvendelse af data science-teknikker. Vil du udforske andre applikationer? Tjek Review & Self Study-sektionen nedenfor.

Data Science + Forskning

 Sketchnote af (@sketchthedocs)
Data Science & Forskning - Sketchnote af @nitya

Mens virkelige applikationer ofte fokuserer på industrielle anvendelser i stor skala, kan forskningsprojekter være nyttige fra to perspektiver:

  • innovationsmuligheder - udforsk hurtig prototyping af avancerede koncepter og test af brugeroplevelser for næste generations applikationer.
  • implementeringsudfordringer - undersøg potentielle skader eller utilsigtede konsekvenser af data science-teknologier i virkelige kontekster.

For studerende kan disse forskningsprojekter give både lærings- og samarbejdsmuligheder, der kan forbedre din forståelse af emnet og udvide din bevidsthed og engagement med relevante personer eller teams, der arbejder inden for interesseområder. Så hvordan ser forskningsprojekter ud, og hvordan kan de gøre en forskel?

Lad os se på et eksempel - MIT Gender Shades Study af Joy Buolamwini (MIT Media Labs) med en signatur forskningsartikel medforfattet af Timnit Gebru (dengang hos Microsoft Research), der fokuserede på:

  • Hvad: Målet med forskningsprojektet var at evaluere bias i automatiserede ansigtsanalysealgoritmer og datasæt baseret på køn og hudtype.
  • Hvorfor: Ansigtsanalyse bruges i områder som retshåndhævelse, lufthavnssikkerhed, ansættelsessystemer og mere - kontekster, hvor unøjagtige klassifikationer (f.eks. på grund af bias) kan forårsage potentielle økonomiske og sociale skader for berørte individer eller grupper. Forståelse (og eliminering eller afbødning) af bias er nøglen til retfærdighed i brugen.
  • Hvordan: Forskerne erkendte, at eksisterende benchmarks primært brugte lysere hudtoner og kuraterede et nyt datasæt (1000+ billeder), der var mere balanceret efter køn og hudtype. Datasættet blev brugt til at evaluere nøjagtigheden af tre kønsklassifikationsprodukter (fra Microsoft, IBM & Face++).

Resultaterne viste, at selvom den samlede klassifikationsnøjagtighed var god, var der en mærkbar forskel i fejlprocenter mellem forskellige undergrupper - med fejlklassifikation højere for kvinder eller personer med mørkere hudtoner, hvilket indikerer bias.

Vigtige Resultater: Skabte opmærksomhed omkring, at data science har brug for mere repræsentative datasæt (balancerede undergrupper) og mere inkluderende teams (diverse baggrunde) for at genkende og eliminere eller afbøde sådanne bias tidligere i AI-løsninger. Forskningsindsatser som denne er også afgørende for, at mange organisationer kan definere principper og praksis for ansvarlig AI for at forbedre retfærdighed i deres AI-produkter og -processer.

Vil du lære om relevante forskningsindsatser hos Microsoft?

Data Science + Humaniora

 Sketchnote af (@sketchthedocs)
Data Science & Digitale Humaniora - Sketchnote af @nitya

Digitale Humaniora er blevet defineret som "en samling af praksisser og tilgange, der kombinerer computermetoder med humanistisk forskning". Stanford-projekter som "rebooting history" og "poetic thinking" illustrerer forbindelsen mellem Digitale Humaniora og Data Science - med vægt på teknikker som netværksanalyse, informationsvisualisering, rumlig og tekstanalyse, der kan hjælpe os med at genbesøge historiske og litterære datasæt for at udlede nye indsigter og perspektiver.

Vil du udforske og udvide et projekt inden for dette område?

Tjek "Emily Dickinson and the Meter of Mood" - et godt eksempel fra Jen Looper, der spørger, hvordan vi kan bruge data science til at genbesøge velkendt poesi og genvurdere dens betydning og bidrag fra dens forfatter i nye kontekster. For eksempel, kan vi forudsige sæsonen, hvor et digt blev skrevet, ved at analysere dets tone eller sentiment - og hvad fortæller dette os om forfatterens sindstilstand i den relevante periode?

For at besvare det spørgsmål følger vi trinnene i vores data science-livscyklus:

  • Dataindsamling - for at indsamle et relevant datasæt til analyse. Muligheder inkluderer brug af en API (f.eks. Poetry DB API) eller scraping af websider (f.eks. Project Gutenberg) ved hjælp af værktøjer som Scrapy.
  • Databehandling - forklarer, hvordan tekst kan formateres, renses og forenkles ved hjælp af grundlæggende værktøjer som Visual Studio Code og Microsoft Excel.
  • Dataanalyse - forklarer, hvordan vi kan importere datasættet til "Notebooks" til analyse ved hjælp af Python-pakker (som pandas, numpy og matplotlib) til at organisere og visualisere dataene.
  • Sentimentanalyse - forklarer, hvordan vi kan integrere cloud-tjenester som Text Analytics ved hjælp af low-code værktøjer som Power Automate til automatiserede databehandlingsarbejdsgange.

Ved at bruge denne arbejdsgang kan vi udforske sæsonmæssige påvirkninger på digtenes sentiment og hjælpe os med at forme vores egne perspektiver på forfatteren. Prøv det selv - og udvid derefter notebooken til at stille andre spørgsmål eller visualisere dataene på nye måder!

Du kan bruge nogle af værktøjerne i Digital Humanities toolkit til at forfølge disse undersøgelsesveje.

Data Science + Bæredygtighed

 Sketchnote af (@sketchthedocs)
Data Science & Bæredygtighed - Sketchnote af @nitya

2030 Agenda For Sustainable Development - vedtaget af alle FN-medlemmer i 2015 - identificerer 17 mål, herunder dem, der fokuserer på beskyttelse af planeten mod nedbrydning og virkningerne af klimaforandringer. Microsoft Sustainability-initiativet støtter disse mål ved at undersøge måder, hvorpå teknologiløsninger kan understøtte og bygge mere bæredygtige fremtider med et fokus på 4 mål - at være kulstofnegative, vandpositive, nul affald og biodiversitet ved 2030.

At tackle disse udfordringer på en skalerbar og rettidig måde kræver cloud-skala tænkning - og store mængder data. Planetary Computer-initiativet tilbyder 4 komponenter til at hjælpe dataforskere og udviklere i denne indsats:

  • Data Catalog - med petabytes af Earth Systems-data (gratis og Azure-hostet).

  • Planetary API - for at hjælpe brugere med at søge efter relevante data på tværs af rum og tid.

  • Hub - administreret miljø for forskere til at behandle massive geospatiale datasæt.

  • Applications - viser anvendelsessager og værktøjer til bæredygtighedsindsigter. Planetary Computer-projektet er i øjeblikket i preview (fra september 2021) - her er, hvordan du kan komme i gang med at bidrage til bæredygtighedsløsninger ved hjælp af data science.

  • Anmod om adgang for at starte din udforskning og forbinde med andre.

  • Udforsk dokumentation for at forstå understøttede datasæt og API'er.

  • Udforsk applikationer som Ecosystem Monitoring for inspiration til applikationsidéer.

Tænk over, hvordan du kan bruge datavisualisering til at fremhæve eller forstærke relevante indsigter inden for områder som klimaforandringer og skovrydning. Eller overvej, hvordan indsigter kan bruges til at skabe nye brugeroplevelser, der motiverer adfærdsændringer for en mere bæredygtig livsstil.

Data Science + Studerende

Vi har talt om virkelige anvendelser i industrien og forskningen og udforsket eksempler på data science-applikationer inden for digitale humaniora og bæredygtighed. Så hvordan kan du opbygge dine færdigheder og dele din ekspertise som nybegynder inden for data science?

Her er nogle eksempler på data science-studerende projekter til inspiration.

🚀 Udfordring

Søg efter artikler, der anbefaler data science-projekter, som er begyndervenlige - som disse 50 emneområder eller disse 21 projektidéer eller disse 16 projekter med kildekode, som du kan dekonstruere og remix. Og glem ikke at blogge om dine læringsrejser og dele dine indsigter med os alle.

Quiz efter forelæsning

Quiz efter forelæsning

Gennemgang & Selvstudie

Vil du udforske flere anvendelsesmuligheder? Her er nogle relevante artikler:

Opgave

Udforsk et Planetary Computer-datasæt


Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, skal du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det originale dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi er ikke ansvarlige for eventuelle misforståelser eller fejltolkninger, der opstår som følge af brugen af denne oversættelse.