You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/it/6-Data-Science-In-Wild/20-Real-World-Examples
leestott 8029ff828a
🌐 Update translations via Co-op Translator
5 months ago
..
README.md 🌐 Update translations via Co-op Translator 5 months ago
assignment.md 🌐 Update translations via Co-op Translator 6 months ago

README.md

La Scienza dei Dati nel Mondo Reale

 Sketchnote di (@sketchthedocs)
La Scienza dei Dati nel Mondo Reale - Sketchnote di @nitya

Siamo quasi alla fine di questo percorso di apprendimento!

Abbiamo iniziato con le definizioni di scienza dei dati ed etica, esplorato vari strumenti e tecniche per l'analisi e la visualizzazione dei dati, esaminato il ciclo di vita della scienza dei dati e analizzato come scalare e automatizzare i flussi di lavoro della scienza dei dati con i servizi di cloud computing. Quindi, probabilmente ti starai chiedendo: "Come posso applicare tutto ciò che ho imparato ai contesti del mondo reale?"

In questa lezione, esploreremo le applicazioni reali della scienza dei dati nei vari settori e approfondiremo esempi specifici nei contesti della ricerca, delle scienze umane digitali e della sostenibilità. Esamineremo opportunità di progetti per studenti e concluderemo con risorse utili per continuare il tuo percorso di apprendimento!

Quiz Pre-Lezione

Quiz Pre-Lezione

Scienza dei Dati + Industria

Grazie alla democratizzazione dell'IA, gli sviluppatori trovano sempre più facile progettare e integrare decisioni guidate dall'IA e intuizioni basate sui dati nelle esperienze utente e nei flussi di lavoro di sviluppo. Ecco alcuni esempi di come la scienza dei dati viene "applicata" a contesti reali nell'industria:

  • Google Flu Trends ha utilizzato la scienza dei dati per correlare i termini di ricerca con le tendenze dell'influenza. Sebbene l'approccio avesse delle lacune, ha sollevato consapevolezza sulle possibilità (e sfide) delle previsioni sanitarie basate sui dati.

  • Previsioni di Routing di UPS - spiega come UPS utilizza la scienza dei dati e il machine learning per prevedere i percorsi ottimali per le consegne, tenendo conto delle condizioni meteorologiche, dei modelli di traffico, delle scadenze di consegna e altro ancora.

  • Visualizzazione dei Percorsi dei Taxi di NYC - i dati raccolti utilizzando le Leggi sulla Libertà di Informazione hanno aiutato a visualizzare una giornata nella vita dei taxi di NYC, permettendoci di capire come navigano nella città affollata, i guadagni e la durata dei viaggi in un periodo di 24 ore.

  • Uber Data Science Workbench - utilizza i dati (su luoghi di prelievo e rilascio, durata dei viaggi, percorsi preferiti, ecc.) raccolti da milioni di viaggi Uber quotidianamente per costruire uno strumento di analisi dei dati utile per prezzi, sicurezza, rilevamento delle frodi e decisioni di navigazione.

  • Analisi Sportiva - si concentra su analisi predittiva (analisi di squadra e giocatori - pensa a Moneyball - e gestione dei fan) e visualizzazione dei dati (dashboard per squadre e fan, giochi, ecc.) con applicazioni come scouting di talenti, scommesse sportive e gestione di inventari/luoghi.

  • Scienza dei Dati nel Settore Bancario - evidenzia il valore della scienza dei dati nel settore finanziario con applicazioni che vanno dalla modellazione del rischio e rilevamento delle frodi, alla segmentazione dei clienti, previsioni in tempo reale e sistemi di raccomandazione. L'analisi predittiva guida anche misure critiche come i credit scores.

  • Scienza dei Dati nella Sanità - evidenzia applicazioni come imaging medico (es. MRI, radiografie, TAC), genomica (sequenziamento del DNA), sviluppo di farmaci (valutazione del rischio, previsione del successo), analisi predittiva (cura dei pazienti e logistica delle forniture), monitoraggio e prevenzione delle malattie, ecc.

Applicazioni della Scienza dei Dati nel Mondo Reale Crediti Immagine: Data Flair: 6 Amazing Data Science Applications

La figura mostra altri domini ed esempi di applicazione delle tecniche di scienza dei dati. Vuoi esplorare altre applicazioni? Dai un'occhiata alla sezione Review & Self Study qui sotto.

Scienza dei Dati + Ricerca

 Sketchnote di (@sketchthedocs)
Scienza dei Dati & Ricerca - Sketchnote di @nitya

Mentre le applicazioni reali spesso si concentrano su casi d'uso industriali su larga scala, le applicazioni e i progetti di ricerca possono essere utili da due prospettive:

  • opportunità di innovazione - esplorare prototipi rapidi di concetti avanzati e testare esperienze utente per applicazioni di nuova generazione.
  • sfide di implementazione - indagare i potenziali danni o le conseguenze non intenzionali delle tecnologie di scienza dei dati nei contesti reali.

Per gli studenti, questi progetti di ricerca possono offrire opportunità di apprendimento e collaborazione che migliorano la comprensione dell'argomento e ampliano la consapevolezza e il coinvolgimento con persone o team rilevanti che lavorano in aree di interesse. Ma come sono i progetti di ricerca e quale impatto possono avere?

Esaminiamo un esempio: lo Studio Gender Shades del MIT di Joy Buolamwini (MIT Media Labs) con un articolo di ricerca co-autore con Timnit Gebru (all'epoca presso Microsoft Research) che si è concentrato su:

  • Cosa: L'obiettivo del progetto di ricerca era valutare i bias presenti negli algoritmi e nei dataset di analisi facciale automatizzata in base al genere e al tipo di pelle.
  • Perché: L'analisi facciale è utilizzata in contesti come forze dell'ordine, sicurezza aeroportuale, sistemi di assunzione e altro - contesti in cui classificazioni inaccurate (es. a causa di bias) possono causare potenziali danni economici e sociali agli individui o ai gruppi interessati. Comprendere (ed eliminare o mitigare) i bias è fondamentale per un uso equo.
  • Come: I ricercatori hanno riconosciuto che i benchmark esistenti utilizzavano prevalentemente soggetti con pelle chiara e hanno curato un nuovo dataset (oltre 1000 immagini) più bilanciato per genere e tipo di pelle. Il dataset è stato utilizzato per valutare l'accuratezza di tre prodotti di classificazione di genere (di Microsoft, IBM e Face++).

I risultati hanno mostrato che, sebbene l'accuratezza complessiva della classificazione fosse buona, c'era una differenza evidente nei tassi di errore tra i vari sottogruppi - con un misgendering più elevato per le donne o le persone con pelle più scura, indicativo di bias.

Risultati Chiave: Ha sollevato consapevolezza sul fatto che la scienza dei dati necessita di dataset più rappresentativi (sottogruppi bilanciati) e di team più inclusivi (background diversificati) per riconoscere ed eliminare o mitigare tali bias nelle soluzioni di IA. Sforzi di ricerca come questo sono anche fondamentali per molte organizzazioni nella definizione di principi e pratiche per un'IA responsabile per migliorare l'equità nei loro prodotti e processi di IA.

Vuoi conoscere gli sforzi di ricerca rilevanti in Microsoft?

Scienza dei Dati + Scienze Umane

 Sketchnote di (@sketchthedocs)
Scienza dei Dati & Scienze Umane Digitali - Sketchnote di @nitya

Le Scienze Umane Digitali sono state definite come "una raccolta di pratiche e approcci che combinano metodi computazionali con l'indagine umanistica". Progetti Stanford come "rebooting history" e "poetic thinking" illustrano il legame tra Scienze Umane Digitali e Scienza dei Dati - enfatizzando tecniche come l'analisi delle reti, la visualizzazione delle informazioni, l'analisi spaziale e testuale che possono aiutarci a rivisitare dataset storici e letterari per trarre nuove intuizioni e prospettive.

Vuoi esplorare ed estendere un progetto in questo ambito?

Dai un'occhiata a "Emily Dickinson and the Meter of Mood" - un ottimo esempio di Jen Looper che si chiede come possiamo utilizzare la scienza dei dati per rivisitare poesie familiari e rivalutare il loro significato e il contributo dell'autore in nuovi contesti. Ad esempio, possiamo prevedere la stagione in cui una poesia è stata scritta analizzandone il tono o il sentimento - e cosa ci dice questo sullo stato d'animo dell'autore nel periodo rilevante?

Per rispondere a questa domanda, seguiamo i passaggi del ciclo di vita della scienza dei dati:

  • Acquisizione dei Dati - per raccogliere un dataset rilevante per l'analisi. Le opzioni includono l'uso di un'API (es. Poetry DB API) o il web scraping (es. Project Gutenberg) utilizzando strumenti come Scrapy.
  • Pulizia dei Dati - spiega come i testi possono essere formattati, sanitizzati e semplificati utilizzando strumenti di base come Visual Studio Code e Microsoft Excel.
  • Analisi dei Dati - spiega come possiamo ora importare il dataset nei "Notebooks" per l'analisi utilizzando pacchetti Python (come pandas, numpy e matplotlib) per organizzare e visualizzare i dati.
  • Analisi del Sentimento - spiega come possiamo integrare servizi cloud come Text Analytics, utilizzando strumenti low-code come Power Automate per flussi di lavoro automatizzati di elaborazione dei dati.

Seguendo questo flusso di lavoro, possiamo esplorare gli impatti stagionali sul sentimento delle poesie e aiutarci a formare le nostre prospettive sull'autore. Provalo tu stesso - poi estendi il notebook per porre altre domande o visualizzare i dati in modi nuovi!

Puoi utilizzare alcuni degli strumenti nel Digital Humanities toolkit per perseguire queste linee di indagine.

Scienza dei Dati + Sostenibilità

 Sketchnote di (@sketchthedocs)
Scienza dei Dati & Sostenibilità - Sketchnote di @nitya

L'Agenda 2030 per lo Sviluppo Sostenibile - adottata da tutti i membri delle Nazioni Unite nel 2015 - identifica 17 obiettivi, tra cui quelli che si concentrano su Proteggere il Pianeta dal degrado e dall'impatto dei cambiamenti climatici. L'iniziativa Microsoft Sustainability supporta questi obiettivi esplorando modi in cui le soluzioni tecnologiche possono sostenere e costruire futuri più sostenibili con un focus su 4 obiettivi - essere carbon negative, water positive, zero waste e biodiversi entro il 2030.

Affrontare queste sfide in modo scalabile e tempestivo richiede un pensiero su scala cloud - e dati su larga scala. L'iniziativa Planetary Computer fornisce 4 componenti per aiutare i data scientist e gli sviluppatori in questo sforzo:

  • Catalogo Dati - con petabyte di dati sui sistemi terrestri (gratuiti e ospitati su Azure).

  • Planetary API - per aiutare gli utenti a cercare dati rilevanti nello spazio e nel tempo.

  • Hub - ambiente gestito per gli scienziati per elaborare enormi dataset geospaziali.

  • Applicazioni - mostra casi d'uso e strumenti per intuizioni sulla sostenibilità. Il progetto Planetary Computer è attualmente in anteprima (a partire da settembre 2021) - ecco come puoi iniziare a contribuire a soluzioni sostenibili utilizzando la data science.

  • Richiedi l'accesso per iniziare l'esplorazione e connetterti con altri utenti.

  • Esplora la documentazione per comprendere i dataset e le API supportate.

  • Esplora applicazioni come Ecosystem Monitoring per trovare ispirazione su idee applicative.

Pensa a come puoi utilizzare la visualizzazione dei dati per evidenziare o amplificare intuizioni rilevanti su temi come il cambiamento climatico e la deforestazione. Oppure considera come queste intuizioni possano essere utilizzate per creare nuove esperienze utente che motivino cambiamenti comportamentali verso uno stile di vita più sostenibile.

Data Science + Studenti

Abbiamo parlato di applicazioni reali nell'industria e nella ricerca, ed esplorato esempi di applicazioni di data science nelle discipline umanistiche digitali e nella sostenibilità. Quindi, come puoi sviluppare le tue competenze e condividere la tua esperienza come principianti nella data science?

Ecco alcuni esempi di progetti di data science per studenti che possono ispirarti.

🚀 Sfida

Cerca articoli che raccomandano progetti di data science adatti ai principianti - come queste 50 aree tematiche o queste 21 idee di progetto o questi 16 progetti con codice sorgente che puoi analizzare e rielaborare. E non dimenticare di scrivere un blog sui tuoi percorsi di apprendimento e condividere le tue intuizioni con tutti noi.

Quiz post-lezione

Quiz post-lezione

Revisione e studio autonomo

Vuoi esplorare altri casi d'uso? Ecco alcuni articoli rilevanti:

Compito

Esplora un dataset del Planetary Computer


Disclaimer:
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica Co-op Translator. Sebbene ci impegniamo per garantire l'accuratezza, si prega di notare che le traduzioni automatiche possono contenere errori o imprecisioni. Il documento originale nella sua lingua nativa dovrebbe essere considerato la fonte autorevole. Per informazioni critiche, si raccomanda una traduzione professionale effettuata da un traduttore umano. Non siamo responsabili per eventuali incomprensioni o interpretazioni errate derivanti dall'uso di questa traduzione.