You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/it/5-Data-Science-In-Cloud/17-Introduction
leestott a8ee6b6162
🌐 Update translations via Co-op Translator
3 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 3 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

Introduzione alla Data Science nel Cloud

 Sketchnote di (@sketchthedocs)
Data Science nel Cloud: Introduzione - Sketchnote di @nitya

In questa lezione, imparerai i principi fondamentali del Cloud, scoprirai perché può essere interessante utilizzare i servizi Cloud per eseguire i tuoi progetti di data science e vedremo alcuni esempi di progetti di data science eseguiti nel Cloud.

Quiz Pre-Lettura

Cos'è il Cloud?

Il Cloud, o Cloud Computing, è la fornitura di una vasta gamma di servizi informatici a consumo ospitati su un'infrastruttura tramite internet. I servizi includono soluzioni come archiviazione, database, networking, software, analisi e servizi intelligenti.

Di solito distinguiamo i Cloud Pubblici, Privati e Ibridi come segue:

  • Cloud pubblico: un cloud pubblico è di proprietà e gestito da un fornitore di servizi cloud di terze parti che offre le sue risorse informatiche su Internet al pubblico.
  • Cloud privato: si riferisce alle risorse di cloud computing utilizzate esclusivamente da un'unica azienda o organizzazione, con servizi e un'infrastruttura mantenuti su una rete privata.
  • Cloud ibrido: il cloud ibrido è un sistema che combina cloud pubblici e privati. Gli utenti optano per un datacenter locale, consentendo al contempo l'esecuzione di dati e applicazioni su uno o più cloud pubblici.

La maggior parte dei servizi di cloud computing rientra in tre categorie: Infrastructure as a Service (IaaS), Platform as a Service (PaaS) e Software as a Service (SaaS).

  • Infrastructure as a Service (IaaS): gli utenti noleggiano un'infrastruttura IT come server e macchine virtuali (VM), archiviazione, reti, sistemi operativi.
  • Platform as a Service (PaaS): gli utenti noleggiano un ambiente per sviluppare, testare, distribuire e gestire applicazioni software. Gli utenti non devono preoccuparsi di configurare o gestire l'infrastruttura sottostante di server, archiviazione, rete e database necessari per lo sviluppo.
  • Software as a Service (SaaS): gli utenti accedono a applicazioni software tramite Internet, su richiesta e tipicamente su base di abbonamento. Gli utenti non devono preoccuparsi di ospitare e gestire l'applicazione software, l'infrastruttura sottostante o la manutenzione, come aggiornamenti software e patch di sicurezza.

Alcuni dei principali fornitori di Cloud sono Amazon Web Services, Google Cloud Platform e Microsoft Azure.

Perché scegliere il Cloud per la Data Science?

Sviluppatori e professionisti IT scelgono di lavorare con il Cloud per molte ragioni, tra cui:

  • Innovazione: puoi potenziare le tue applicazioni integrando servizi innovativi creati dai fornitori di Cloud direttamente nelle tue app.
  • Flessibilità: paghi solo per i servizi di cui hai bisogno e puoi scegliere tra una vasta gamma di servizi. Tipicamente paghi a consumo e adatti i tuoi servizi in base alle tue esigenze in evoluzione.
  • Budget: non è necessario fare investimenti iniziali per acquistare hardware e software, configurare e gestire datacenter locali; puoi semplicemente pagare per ciò che utilizzi.
  • Scalabilità: le tue risorse possono scalare in base alle esigenze del tuo progetto, il che significa che le tue app possono utilizzare più o meno potenza di calcolo, archiviazione e larghezza di banda, adattandosi a fattori esterni in qualsiasi momento.
  • Produttività: puoi concentrarti sulla tua attività piuttosto che perdere tempo su compiti che possono essere gestiti da qualcun altro, come la gestione dei datacenter.
  • Affidabilità: il Cloud Computing offre diversi modi per eseguire backup continui dei tuoi dati e puoi configurare piani di recupero in caso di disastri per mantenere la tua attività e i tuoi servizi operativi, anche in tempi di crisi.
  • Sicurezza: puoi beneficiare di politiche, tecnologie e controlli che rafforzano la sicurezza del tuo progetto.

Queste sono alcune delle ragioni più comuni per cui le persone scelgono di utilizzare i servizi Cloud. Ora che abbiamo una migliore comprensione di cosa sia il Cloud e dei suoi principali vantaggi, esaminiamo più specificamente il lavoro dei Data Scientist e degli sviluppatori che lavorano con i dati, e come il Cloud può aiutarli a superare diverse sfide che potrebbero incontrare:

  • Archiviazione di grandi quantità di dati: invece di acquistare, gestire e proteggere grandi server, puoi archiviare i tuoi dati direttamente nel cloud, con soluzioni come Azure Cosmos DB, Azure SQL Database e Azure Data Lake Storage.
  • Integrazione dei dati: l'integrazione dei dati è una parte essenziale della Data Science, che ti consente di passare dalla raccolta dei dati all'azione. Con i servizi di integrazione dei dati offerti nel cloud, puoi raccogliere, trasformare e integrare dati da varie fonti in un unico data warehouse, con Data Factory.
  • Elaborazione dei dati: elaborare grandi quantità di dati richiede molta potenza di calcolo, e non tutti hanno accesso a macchine abbastanza potenti per farlo, motivo per cui molte persone scelgono di sfruttare direttamente la grande potenza di calcolo del cloud per eseguire e distribuire le loro soluzioni.
  • Utilizzo di servizi di analisi dei dati: servizi cloud come Azure Synapse Analytics, Azure Stream Analytics e Azure Databricks ti aiutano a trasformare i tuoi dati in informazioni utili.
  • Utilizzo di servizi di Machine Learning e intelligenza dei dati: invece di partire da zero, puoi utilizzare algoritmi di machine learning offerti dal fornitore di cloud, con servizi come AzureML. Puoi anche utilizzare servizi cognitivi come speech-to-text, text-to-speech, computer vision e altro.

Esempi di Data Science nel Cloud

Rendiamo tutto più concreto esaminando un paio di scenari.

Analisi del sentiment sui social media in tempo reale

Iniziamo con uno scenario comunemente studiato da chi si avvicina al machine learning: l'analisi del sentiment sui social media in tempo reale.

Supponiamo che tu gestisca un sito web di notizie e voglia sfruttare i dati live per capire quali contenuti potrebbero interessare ai tuoi lettori. Per saperne di più, puoi creare un programma che esegue un'analisi del sentiment in tempo reale dei dati provenienti da pubblicazioni su Twitter, su argomenti rilevanti per i tuoi lettori.

Gli indicatori chiave che esaminerai sono il volume di tweet su argomenti specifici (hashtag) e il sentiment, che viene stabilito utilizzando strumenti di analisi che eseguono l'analisi del sentiment sugli argomenti specificati.

I passaggi necessari per creare questo progetto sono i seguenti:

  • Creare un hub eventi per lo streaming di input, che raccoglierà dati da Twitter.
  • Configurare e avviare un'applicazione client Twitter, che chiamerà le API di streaming di Twitter.
  • Creare un lavoro di Stream Analytics.
  • Specificare l'input e la query del lavoro.
  • Creare un sink di output e specificare l'output del lavoro.
  • Avviare il lavoro.

Per visualizzare il processo completo, consulta la documentazione.

Analisi di articoli scientifici

Prendiamo un altro esempio di un progetto creato da Dmitry Soshnikov, uno degli autori di questo curriculum.

Dmitry ha creato uno strumento che analizza articoli sul COVID. Esaminando questo progetto, vedrai come puoi creare uno strumento che estrae conoscenze da articoli scientifici, ottiene informazioni e aiuta i ricercatori a navigare attraverso grandi collezioni di articoli in modo efficiente.

Vediamo i diversi passaggi utilizzati per questo:

  • Estrarre e pre-processare informazioni con Text Analytics for Health.
  • Utilizzare Azure ML per parallelizzare l'elaborazione.
  • Archiviare e interrogare informazioni con Cosmos DB.
  • Creare un dashboard interattivo per l'esplorazione e la visualizzazione dei dati utilizzando Power BI.

Per vedere il processo completo, visita il blog di Dmitry.

Come puoi vedere, possiamo sfruttare i servizi Cloud in molti modi per eseguire la Data Science.

Nota a piè di pagina

Fonti:

Quiz Post-Lettura

Quiz post-lettura

Compito

Ricerca di Mercato


Disclaimer:
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica Co-op Translator. Sebbene ci impegniamo per garantire l'accuratezza, si prega di notare che le traduzioni automatiche potrebbero contenere errori o imprecisioni. Il documento originale nella sua lingua nativa dovrebbe essere considerato la fonte autorevole. Per informazioni critiche, si raccomanda una traduzione professionale eseguita da un traduttore umano. Non siamo responsabili per eventuali incomprensioni o interpretazioni errate derivanti dall'uso di questa traduzione.