15 KiB
Crearere un'app web per utilizzare un modello ML
In questa lezione, si addestrerà un modello ML su un insieme di dati fuori dal mondo: avvistamenti di UFO nel secolo scorso, provenienti dal database di NUFORC.
Si imparerà:
- Come "scapigliare" un modello addestrato
- Come usare quel modello in un'app Flask
Si continuerà a utilizzare i notebook per pulire i dati e addestrare il modello, ma si può fare un ulteriore passo avanti esplorando il processo utilizzando un modello "in the wild", per così dire: in un'app web.
Per fare ciò, è necessario creare un'app Web utilizzando Flask.
Quiz Pre-Lezione
Costruire un'app
Esistono diversi modi per creare app Web per utilizzare modelli di machine learning. L'architettura web può influenzare il modo in cui il modello viene addestrato. Si immagini di lavorare in un'azienda in cui il gruppo di data science ha addestrato un modello che vogliono che venga utilizzato in un'app.
Considerazioni
Ci sono molte domande da porsi:
- È un'app Web o un'app mobile? Se si sta creando un'app mobile o si deve usare il modello in un contesto IoT, ci si può avvalere di TensorFlow Lite e usare il modello in un'app Android o iOS.
- Dove risiederà il modello? E' utilizzato in cloud o in locale?
- Supporto offline. L'app deve funzionare offline?
- Quale tecnologia è stata utilizzata per addestrare il modello? La tecnologia scelta può influenzare gli strumenti che è necessario utilizzare.
- Utilizzare TensorFlow Se si sta addestrando un modello utilizzando TensorFlow, ad esempio, tale ecosistema offre la possibilità di convertire un modello TensorFlow per l'utilizzo in un'app Web utilizzando TensorFlow.js.
- Utilizzare PyTorch. Se stai costruendo un modello utilizzando una libreria come PyTorch, si ha la possibilità di esportarlo in formato ONNX ( Open Neural Network Exchange) per l'utilizzo in app Web JavaScript che possono utilizzare il motore di esecuzione Onnx. Questa opzione verrà esplorata in una lezione futura per un modello addestrato da Scikit-learn
- Utilizzo di Lobe.ai o Azure Custom vision. Se si sta usando un sistema ML SaaS (Software as a Service) come Lobe.ai o Azure Custom Vision per addestrare un modello, questo tipo di software fornisce modi per esportare il modello per molte piattaforme, inclusa la creazione di un'API su misura da interrogare nel cloud dalla propria applicazione online.
Si hai anche l'opportunità di creare un'intera app Web Flask in grado di addestrare il modello stesso in un browser Web. Questo può essere fatto anche usando TensorFlow.js in un contesto JavaScript.
Per i nostri scopi, poiché si è lavorato con i notebook basati su Python, verranno esplorati i passaggi necessari per esportare un modello addestrato da un tale notebook in un formato leggibile da un'app Web creata in Python.
Strumento
Per questa attività sono necessari due strumenti: Flask e Pickle, entrambi eseguiti su Python.
✅ Cos'è Flask? Definito come un "micro-framework" dai suoi creatori, Flask fornisce le funzionalità di base dei framework web utilizzando Python e un motore di modelli per creare pagine web. Si dia un'occhiata a questo modulo di apprendimento per esercitarsi a costruire con Flask.
✅ Cos'è Pickle? Pickle 🥒 è un modulo Python che serializza e de-serializza una struttura di oggetti Python. Quando si utilizza pickle in un modello, si serializza o si appiattisce la sua struttura per l'uso sul web. Cautela: pickle non è intrinsecamente sicuro, quindi si faccia attenzione se viene chiesto di de-serializzare un file. Un file creato con pickle ha il suffisso .pkl
.
Esercizio: pulire i dati
In questa lezione verranno utilizzati i dati di 80.000 avvistamenti UFO, raccolti da NUFORC (The National UFO Reporting Center). Questi dati hanno alcune descrizioni interessanti di avvistamenti UFO, ad esempio:
- Descrizione di esempio lunga. "Un uomo emerge da un raggio di luce che di notte brilla su un campo erboso e corre verso il parcheggio della Texas Instruments".
- Descrizione di esempio breve. "le luci ci hanno inseguito".
Il foglio di calcolo ufos.csv include colonne sulla città
, lo stato
e il paese
in cui è avvenuto l'avvistamento, la forma dell'oggetto e la
sua latitudine
e longitudine
.
Nel notebook vuoto incluso in questa lezione:
-
importare
pandas
,matplotlib
e numpycome
fatto nelle lezioni precedenti e importare il foglio di calcolo ufos. Si può dare un'occhiata a un insieme di dati di esempio:import pandas as pd import numpy as np ufos = pd.read_csv('../data/ufos.csv') ufos.head()
-
Convertire i dati ufos in un piccolo dataframe con nuove intestazioni Controllare i valori univoci nel campo
Country
.ufos = pd.DataFrame({'Seconds': ufos['duration (seconds)'], 'Country': ufos['country'],'Latitude': ufos['latitude'],'Longitude': ufos['longitude']}) ufos.Country.unique()
-
Ora si può ridurre la quantità di dati da gestire eliminando qualsiasi valore nullo e importando solo avvistamenti tra 1-60 secondi:
ufos.dropna(inplace=True) ufos = ufos[(ufos['Seconds'] >= 1) & (ufos['Seconds'] <= 60)] ufos.info()
-
Importare la libreria LabelEncoder
di
Scikit-learn per convertire i valori di testo per i paesi in un numero:✅ LabelEncoder codifica i dati in ordine alfabetico
from sklearn.preprocessing import LabelEncoder ufos['Country'] = LabelEncoder().fit_transform(ufos['Country']) ufos.head()
I dati dovrebbero assomigliare a questo:
Seconds Country Latitude Longitude 2 20.0 3 53.200000 -2.916667 3 20.0 4 28.978333 -96.645833 14 30.0 4 35.823889 -80.253611 23 60.0 4 45.582778 -122.352222 24 3.0 3 51.783333 -0.783333
Esercizio: costruire il proprio modello
Ora ci si può preparare per addestrare un modello portando i dati nel gruppo di addestramento e test.
-
Selezionare le tre caratteristiche su cui lo si vuole allenare come vettore X mentre il vettore y sarà
Country
Se deve essere in grado di inserireSecondi
,Latitudine
eLongitudine
e ottenere un ID nazione da restituire.from sklearn.model_selection import train_test_split Selected_features = ['Seconds','Latitude','Longitude'] X = ufos[Selected_features] y = ufos['Country'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
-
Addestrare il modello usando la regressione logistica:
from sklearn.metrics import accuracy_score, classification_report from sklearn.linear_model import LogisticRegression model = LogisticRegression() model.fit(X_train, y_train) predictions = model.predict(X_test) print(classification_report(y_test, predictions)) print('Predicted labels: ', predictions) print('Accuracy: ', accuracy_score(y_test, predictions))
La precisione non è male (circa il 95%), non sorprende che Country
e Latitude/Longitude
siano correlati.
Il modello creato non è molto rivoluzionario in quanto si dovrebbe essere in grado di dedurre una nazione
dalla sua latitudine
e longitudine
, ma è un buon esercizio provare ad allenare dai dati grezzi che sono stati puliti ed esportati, e quindi utilizzare questo modello in una app web.
Esercizio: usare pickle con il modello
Ora è il momento di utilizzare pickle con il modello! Lo si può fare in poche righe di codice. Una volta che è stato serializzato con pickle_,_ caricare il modello e testarlo rispetto a un array di dati di esempio contenente valori per secondi, latitudine e longitudine,
import pickle
model_filename = 'ufo-model.pkl'
pickle.dump(model, open(model_filename,'wb'))
model = pickle.load(open('ufo-model.pkl','rb'))
print(model.predict([[50,44,-12]]))
Il modello restituisce "3", che è il codice paese per il Regno Unito. Jolly 👽
Esercizio: creare un'app Flask
Ora si può creare un'app Flask per chiamare il modello e restituire risultati simili, ma in un modo visivamente più gradevole.
-
Iniziare creando una cartella chiamata web-app a livello del file notebook.ipynb dove risiede il file ufo-model.pkl.
-
In quella cartella creare altre tre cartelle: static, con una cartella css al suo interno e templates. Ora si dovrebbero avere i seguenti file e directory:
web-app/ static/ css/ templates/ notebook.ipynb ufo-model.pkl
✅ Fare riferimento alla cartella della soluzione per una visualizzazione dell'app finita
-
Il primo file da creare nella cartella dell'app Web è il file requirements.txt. Come package.json in un'app JavaScript, questo file elenca le dipendenze richieste dall'app. In requirements.txt aggiungere le righe:
scikit-learn pandas numpy flask
-
Ora, eseguire questo file portandosi su web-app:
cd web-app
-
Aprire una finestra di terminale dove risiede requirements.txt e digitare
pip install
, per installare le librerie elencate in reuirements.txt:pip install -r requirements.txt
-
Ora si è pronti per creare altri tre file per completare l'app:
- Crea app.py nella directory radice
- Creare index.html nella directory templates .
- Crea sytles.css nella directory static/css .
-
Inserire nel file styles.css alcuni stili:
body { width: 100%; height: 100%; font-family: 'Helvetica'; background: black; color: #fff; text-align: center; letter-spacing: 1.4px; font-size: 30px; } input { min-width: 150px; } .grid { width: 300px; border: 1px solid #2d2d2d; display: grid; justify-content: center; margin: 20px auto; } .box { color: #fff; background: #2d2d2d; padding: 12px; display: inline-block; }
-
Quindi, creare il file index.html :
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>🛸 UFO Appearance Prediction! 👽</title> <link rel="stylesheet" href="{{ url_for('static', filename='css/styles.css') }}"> </head> <body> <div class="grid"> <div class="box"> <p>According to the number of seconds, latitude and longitude, which country is likely to have reported seeing a UFO?</p> <form action="{{ url_for('predict')}}" method="post"> <input type="number" name="seconds" placeholder="Seconds" required="required" min="0" max="60" /> <input type="text" name="latitude" placeholder="Latitude" required="required" /> <input type="text" name="longitude" placeholder="Longitude" required="required" /> <button type="submit" class="btn">Predict country where the UFO is seen</button> </form> <p>{{ prediction_text }}</p> </div> </div> </body> </html>
Dare un'occhiata al modello in questo file. Notare la sintassi con le parentesi graffe attorno alle variabili che verranno fornite dall'app, come il testo di previsione:
{{}}
. C'è anche un modulo che invia una previsione al percorso/
predict.Infine, si è pronti per creare il file python che guida il consumo del modello e la visualizzazione delle previsioni:
-
In
app.py
aggiungere:import numpy as np from flask import Flask, request, render_template import pickle app = Flask(__name__) model = pickle.load(open("../ufo-model.pkl", "rb")) @app.route("/") def home(): return render_template("index.html") @app.route("/predict", methods=["POST"]) def predict(): int_features = [int(x) for x in request.form.values()] final_features = [np.array(int_features)] prediction = model.predict(final_features) output = prediction[0] countries = ["Australia", "Canada", "Germany", "UK", "US"] return render_template( "index.html", prediction_text="Likely country: {}".format(countries[output]) ) if __name__ == "__main__": app.run(debug=True)
💡 Suggerimento: quando si aggiunge
debug=True
durante l'esecuzione dell'app Web utilizzando Flask, qualsiasi modifica apportata all'applicazione verrà applicata immediatamente senza la necessità di riavviare il server. Attenzione! Non abilitare questa modalità in un'app di produzione.
Se si esegue python app.py
o python3 app.py
, il server web si avvia, localmente, e si può compilare un breve modulo per ottenere una risposta alla domanda scottante su dove sono stati avvistati gli UFO!
Prima di farlo, dare un'occhiata alle parti di app.py
:
- Innanzitutto, le dipendenze vengono caricate e l'app si avvia.
- Quindi, il modello viene importato.
- Quindi, index.html viene visualizzato sulla rotta home.
Sulla rotta /predict
, accadono diverse cose quando il modulo viene inviato:
- Le variabili del modulo vengono raccolte e convertite in un array numpy. Vengono quindi inviati al modello e viene restituita una previsione.
- Le nazioni che si vogliono visualizzare vengono nuovamente esposte come testo leggibile dal loro codice paese previsto e tale valore viene inviato a index.html per essere visualizzato nel modello.
Usare un modello in questo modo, con Flask e un modello serializzato è relativamente semplice. La cosa più difficile è capire che forma hanno i dati che devono essere inviati al modello per ottenere una previsione. Tutto dipende da come è stato addestrato il modello. Questo ha tre punti dati da inserire per ottenere una previsione.
In un ambiente professionale, si può vedere quanto sia necessaria una buona comunicazione tra le persone che addestrano il modello e coloro che lo consumano in un'app Web o mobile. In questo caso, si ricoprono entrambi i ruoli!
🚀 Sfida
Invece di lavorare su un notebook e importare il modello nell'app Flask, si può addestrare il modello direttamente nell'app Flask! Provare a convertire il codice Python nel notebook, magari dopo che i dati sono stati puliti, per addestrare il modello dall'interno dell'app su un percorso chiamato /train
. Quali sono i pro e i contro di seguire questo metodo?
Quiz post-lezione
Revisione e Auto Apprendimento
Esistono molti modi per creare un'app Web per utilizzare i modelli ML. Elencare dei modi in cui si potrebbe utilizzare JavaScript o Python per creare un'app Web per sfruttare machine learning. Considerare l'architettura: il modello dovrebbe rimanere nell'app o risiedere nel cloud? Se quest'ultimo, come accedervi? Disegnare un modello architettonico per una soluzione web ML applicata.