You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/da/6-Data-Science-In-Wild/20-Real-World-Examples
leestott 0f1def896e
🌐 Update translations via Co-op Translator
2 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 4 weeks ago

README.md

Data Science i den Virkelige Verden

 Sketchnote af (@sketchthedocs)
Data Science i den Virkelige Verden - Sketchnote af @nitya

Vi er næsten ved vejs ende i denne læringsrejse!

Vi startede med definitioner af data science og etik, udforskede forskellige værktøjer og teknikker til dataanalyse og visualisering, gennemgik data science-livscyklussen og kiggede på skalering og automatisering af data science-arbejdsgange med cloud computing-tjenester. Så du tænker sikkert: "Hvordan kan jeg præcist anvende alt dette i virkelige sammenhænge?"

I denne lektion vil vi udforske virkelige anvendelser af data science på tværs af industrier og dykke ned i specifikke eksempler inden for forskning, digitale humaniora og bæredygtighed. Vi vil også se på muligheder for studenterprojekter og afslutte med nyttige ressourcer, der kan hjælpe dig med at fortsætte din læringsrejse!

Quiz før forelæsning

Quiz før forelæsning

Data Science + Industri

Takket være demokratiseringen af AI finder udviklere det nu lettere at designe og integrere AI-drevne beslutningsprocesser og datadrevne indsigter i brugeroplevelser og udviklingsarbejdsgange. Her er nogle eksempler på, hvordan data science anvendes i virkelige applikationer på tværs af industrien:

  • Google Flu Trends brugte data science til at korrelere søgetermer med influenzatendenser. Selvom tilgangen havde fejl, skabte den opmærksomhed om mulighederne (og udfordringerne) ved datadrevne sundhedsprognoser.

  • UPS Routing Predictions - forklarer, hvordan UPS bruger data science og maskinlæring til at forudsige optimale leveringsruter, der tager højde for vejrforhold, trafikmønstre, leveringsfrister og mere.

  • NYC Taxicab Route Visualization - data indsamlet via Freedom Of Information Laws hjalp med at visualisere en dag i livet for NYC-taxier, hvilket gav indsigt i, hvordan de navigerer i byen, hvor meget de tjener, og hvor længe ture varer over en 24-timers periode.

  • Uber Data Science Workbench - bruger data (om afhentnings- og afleveringssteder, turens varighed, foretrukne ruter osv.) indsamlet fra millioner af Uber-ture dagligt til at bygge et dataanalysværktøj, der hjælper med prissætning, sikkerhed, bedrageridetektion og navigationsbeslutninger.

  • Sports Analytics - fokuserer på forudsigende analyser (hold- og spilleranalyse - tænk Moneyball - og fanhåndtering) og datavisualisering (hold- og fandashboards, spil osv.) med anvendelser som talentspejderarbejde, sportsvæddemål og lager-/venuehåndtering.

  • Data Science i Banking - fremhæver værdien af data science i finanssektoren med anvendelser, der spænder fra risikomodellering og bedrageridetektion til kundesegmentering, realtidsprognoser og anbefalingssystemer. Forudsigende analyser driver også kritiske målinger som kreditvurderinger.

  • Data Science i Sundhedssektoren - fremhæver anvendelser som medicinsk billeddannelse (f.eks. MR, røntgen, CT-scanning), genomik (DNA-sekventering), lægemiddeludvikling (risikovurdering, succesprognoser), forudsigende analyser (patientpleje og logistik), sygdomssporing og -forebyggelse osv.

Data Science Anvendelser i den Virkelige Verden Billedkredit: Data Flair: 6 Amazing Data Science Applications

Figuren viser andre domæner og eksempler på anvendelse af data science-teknikker. Vil du udforske andre anvendelser? Tjek afsnittet Review & Self Study nedenfor.

Data Science + Forskning

 Sketchnote af (@sketchthedocs)
Data Science & Forskning - Sketchnote af @nitya

Mens virkelige anvendelser ofte fokuserer på industrielle brugsscenarier i stor skala, kan forskningsprojekter være nyttige fra to perspektiver:

  • innovationsmuligheder - udforsk hurtig prototyping af avancerede koncepter og test af brugeroplevelser til næste generations applikationer.
  • implementeringsudfordringer - undersøg potentielle skader eller utilsigtede konsekvenser af data science-teknologier i virkelige sammenhænge.

For studerende kan disse forskningsprojekter give både lærings- og samarbejdsmuligheder, der kan forbedre din forståelse af emnet og udvide din bevidsthed og engagement med relevante personer eller teams, der arbejder inden for interesseområder. Hvordan ser forskningsprojekter ud, og hvordan kan de gøre en forskel?

Lad os se på et eksempel - MIT Gender Shades Study af Joy Buolamwini (MIT Media Labs) med en signaturforskningsartikel medforfattet af Timnit Gebru (dengang hos Microsoft Research), der fokuserede på:

  • Hvad: Målet med forskningsprojektet var at evaluere bias i automatiserede ansigtsanalysealgoritmer og datasæt baseret på køn og hudtype.
  • Hvorfor: Ansigtsanalyse bruges i områder som retshåndhævelse, lufthavnssikkerhed, ansættelsessystemer og mere - sammenhænge, hvor unøjagtige klassifikationer (f.eks. på grund af bias) kan forårsage økonomiske og sociale skader for berørte individer eller grupper. At forstå (og eliminere eller afbøde) bias er nøglen til retfærdighed i brugen.
  • Hvordan: Forskerne erkendte, at eksisterende benchmarks overvejende brugte personer med lysere hud, og de kuraterede et nyt datasæt (1000+ billeder), der var mere balanceret med hensyn til køn og hudtype. Datasættet blev brugt til at evaluere nøjagtigheden af tre kønsklassifikationsprodukter (fra Microsoft, IBM & Face++).

Resultaterne viste, at selvom den samlede klassifikationsnøjagtighed var god, var der en mærkbar forskel i fejlprocenter mellem forskellige undergrupper - med forkert kønsbestemmelse hyppigere for kvinder eller personer med mørkere hudtyper, hvilket indikerer bias.

Vigtige Resultater: Skabte opmærksomhed om, at data science har brug for mere repræsentative datasæt (balancerede undergrupper) og mere inkluderende teams (mangfoldige baggrunde) for at kunne identificere og eliminere eller afbøde sådanne bias tidligere i AI-løsninger. Forskningsindsatser som denne er også afgørende for, at mange organisationer kan definere principper og praksis for ansvarlig AI for at forbedre retfærdighed i deres AI-produkter og -processer.

Vil du lære om relevante forskningsindsatser hos Microsoft?

Data Science + Humaniora

 Sketchnote af (@sketchthedocs)
Data Science & Digitale Humaniora - Sketchnote af @nitya

Digitale Humaniora er blevet defineret som "en samling af praksisser og tilgange, der kombinerer beregningsmetoder med humanistisk undersøgelse". Stanford-projekter som "rebooting history" og "poetic thinking" illustrerer forbindelsen mellem Digitale Humaniora og Data Science - med vægt på teknikker som netværksanalyse, informationsvisualisering, rumlig og tekstanalyse, der kan hjælpe os med at genbesøge historiske og litterære datasæt for at udlede nye indsigter og perspektiver.

Vil du udforske og udvide et projekt inden for dette område?

Tjek "Emily Dickinson and the Meter of Mood" - et fantastisk eksempel fra Jen Looper, der spørger, hvordan vi kan bruge data science til at genbesøge velkendt poesi og genoverveje dens betydning og bidrag fra dens forfatter i nye sammenhænge. For eksempel, kan vi forudsige årstiden, hvor et digt blev skrevet, ved at analysere dets tone eller stemning - og hvad fortæller det os om forfatterens sindstilstand i den relevante periode?

For at besvare det spørgsmål følger vi trinnene i vores data science-livscyklus:

  • Dataindsamling - for at samle et relevant datasæt til analyse. Muligheder inkluderer brug af en API (f.eks. Poetry DB API) eller scraping af websider (f.eks. Project Gutenberg) ved hjælp af værktøjer som Scrapy.
  • Databehandling - forklarer, hvordan tekst kan formateres, renses og forenkles ved hjælp af grundlæggende værktøjer som Visual Studio Code og Microsoft Excel.
  • Dataanalyse - forklarer, hvordan vi nu kan importere datasættet i "Notebooks" til analyse ved hjælp af Python-pakker (som pandas, numpy og matplotlib) til at organisere og visualisere dataene.
  • Sentimentanalyse - forklarer, hvordan vi kan integrere cloud-tjenester som Text Analytics ved hjælp af lavkodeværktøjer som Power Automate til automatiserede databehandlingsarbejdsgange.

Ved at bruge denne arbejdsgang kan vi udforske årstidernes påvirkning på digtenes stemning og hjælpe os med at forme vores egne perspektiver på forfatteren. Prøv det selv - og udvid derefter notebooken til at stille andre spørgsmål eller visualisere dataene på nye måder!

Du kan bruge nogle af værktøjerne i Digital Humanities toolkit til at forfølge disse undersøgelsesveje.

Data Science + Bæredygtighed

 Sketchnote af (@sketchthedocs)
Data Science & Bæredygtighed - Sketchnote af @nitya

2030-dagsordenen for bæredygtig udvikling - vedtaget af alle FN-medlemslande i 2015 - identificerer 17 mål, herunder nogle, der fokuserer på at beskytte planeten mod nedbrydning og virkningerne af klimaforandringer. Microsoft Sustainability-initiativet støtter disse mål ved at udforske måder, hvorpå teknologiløsninger kan understøtte og skabe mere bæredygtige fremtider med et fokus på 4 mål - at være kulstofnegative, vandpositive, affaldsfrie og biodiversitetsfremmende inden 2030.

At tackle disse udfordringer på en skalerbar og rettidig måde kræver cloud-tænkning i stor skala - og store mængder data. Planetary Computer-initiativet tilbyder 4 komponenter til at hjælpe dataforskere og udviklere i denne indsats:

  • Data Catalog - med petabytes af data om jordens systemer (gratis og Azure-hostet).

  • Planetary API - for at hjælpe brugere med at søge efter relevante data på tværs af tid og rum.

  • Hub - et administreret miljø for forskere til at behandle massive geospatiale datasæt.

  • Applications - viser brugsscenarier og værktøjer til bæredygtighedsindsigter. Planetary Computer-projektet er i øjeblikket i preview (fra september 2021) - her er, hvordan du kan komme i gang med at bidrage til bæredygtighedsløsninger ved hjælp af data science.

  • Anmod om adgang for at starte din udforskning og forbinde med andre.

  • Udforsk dokumentation for at forstå understøttede datasæt og API'er.

  • Udforsk applikationer som Ecosystem Monitoring for inspiration til applikationsidéer.

Tænk over, hvordan du kan bruge datavisualisering til at fremhæve eller forstærke relevante indsigter inden for områder som klimaforandringer og skovrydning. Eller overvej, hvordan indsigter kan bruges til at skabe nye brugeroplevelser, der motiverer adfærdsændringer for en mere bæredygtig livsstil.

Data Science + Studerende

Vi har talt om virkelige anvendelser i industrien og forskningen og udforsket eksempler på data science-applikationer inden for digitale humaniora og bæredygtighed. Så hvordan kan du opbygge dine færdigheder og dele din ekspertise som nybegynder inden for data science?

Her er nogle eksempler på data science-studerende projekter til inspiration.

🚀 Udfordring

Søg efter artikler, der anbefaler data science-projekter, som er begyndervenlige - som disse 50 emneområder eller disse 21 projektidéer eller disse 16 projekter med kildekode, som du kan dekonstruere og genbruge. Og glem ikke at blogge om dine læringsrejser og dele dine indsigter med os alle.

Quiz efter forelæsning

Quiz efter forelæsning

Gennemgang & Selvstudie

Vil du udforske flere anvendelsesmuligheder? Her er nogle relevante artikler:

Opgave

Udforsk et Planetary Computer-datasæt


Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, skal du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det originale dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der måtte opstå som følge af brugen af denne oversættelse.