History

leestott aa4b119744 🌐 Update translations via Co-op Translator		2 weeks ago
..
solution	🌐 Update translations via Co-op Translator	3 weeks ago
README.md	🌐 Update translations via Co-op Translator	2 weeks ago
assignment.md	🌐 Update translations via Co-op Translator	3 weeks ago
notebook.ipynb	🌐 Update translations via Co-op Translator	3 weeks ago

README.md

웹 앱을 만들어 ML 모델 사용하기

이 강의에서는 지난 세기 동안의 UFO 목격 데이터를 사용하여 ML 모델을 훈련시킬 것입니다. 이 데이터는 NUFORC의 데이터베이스에서 가져왔습니다.

배울 내용:

훈련된 모델을 '피클링'하는 방법
Flask 앱에서 모델을 사용하는 방법

노트북을 사용하여 데이터를 정리하고 모델을 훈련시키는 작업을 계속 진행할 것이지만, 이를 한 단계 더 발전시켜 웹 앱에서 모델을 사용하는 방법을 탐구할 것입니다.

이를 위해 Flask를 사용하여 웹 앱을 구축해야 합니다.

강의 전 퀴즈

앱 구축하기

머신 러닝 모델을 소비하는 웹 앱을 구축하는 방법은 여러 가지가 있습니다. 웹 아키텍처는 모델 훈련 방식에 영향을 미칠 수 있습니다. 데이터 과학 팀이 훈련한 모델을 앱에서 사용해야 하는 비즈니스 환경을 상상해 보세요.

고려 사항

다음과 같은 질문을 해야 합니다:

웹 앱인가 모바일 앱인가? 모바일 앱을 구축하거나 IoT 환경에서 모델을 사용해야 한다면 TensorFlow Lite를 사용하여 Android 또는 iOS 앱에서 모델을 사용할 수 있습니다.
모델은 어디에 위치할 것인가? 클라우드인가 로컬인가?
오프라인 지원. 앱이 오프라인에서도 작동해야 하는가?
모델을 훈련시킨 기술은 무엇인가? 선택한 기술은 필요한 도구에 영향을 미칠 수 있습니다.
- TensorFlow 사용. 예를 들어 TensorFlow를 사용하여 모델을 훈련시키는 경우, TensorFlow.js를 사용하여 웹 앱에서 모델을 사용할 수 있도록 변환할 수 있습니다.
- PyTorch 사용. PyTorch와 같은 라이브러리를 사용하여 모델을 구축하는 경우, ONNX (Open Neural Network Exchange) 형식으로 내보내 JavaScript 웹 앱에서 Onnx Runtime을 사용할 수 있습니다. 이 옵션은 Scikit-learn으로 훈련된 모델을 다루는 향후 강의에서 탐구할 것입니다.
- Lobe.ai 또는 Azure Custom Vision 사용. Lobe.ai 또는 Azure Custom Vision과 같은 ML SaaS(Software as a Service) 시스템을 사용하여 모델을 훈련시키는 경우, 이 소프트웨어는 클라우드에서 온라인 애플리케이션이 쿼리할 수 있는 맞춤형 API를 구축하는 등 다양한 플랫폼으로 모델을 내보내는 방법을 제공합니다.

또한 웹 브라우저에서 직접 모델을 훈련시킬 수 있는 전체 Flask 웹 앱을 구축할 수도 있습니다. 이는 JavaScript 환경에서 TensorFlow.js를 사용하여도 가능합니다.

우리의 경우, Python 기반 노트북을 사용해 왔으므로, 노트북에서 훈련된 모델을 Python으로 구축된 웹 앱에서 읽을 수 있는 형식으로 내보내는 단계를 탐구해 보겠습니다.

도구

이 작업을 위해 Flask와 Pickle이라는 두 가지 도구가 필요합니다. 둘 다 Python에서 실행됩니다.

✅ Flask란 무엇인가요? Flask는 제작자들에 의해 '마이크로 프레임워크'로 정의되며, Python을 사용하여 웹 페이지를 구축하기 위한 템플릿 엔진과 웹 프레임워크의 기본 기능을 제공합니다. Flask를 사용하여 앱을 구축하는 연습을 하려면 이 학습 모듈을 확인하세요.

✅ Pickle이란 무엇인가요? Pickle 🥒은 Python 객체 구조를 직렬화하고 역직렬화하는 Python 모듈입니다. 모델을 '피클링'하면 웹에서 사용할 수 있도록 구조를 직렬화하거나 평탄화합니다. 주의하세요: Pickle은 본질적으로 안전하지 않으므로 파일을 '언피클링'하라는 요청을 받을 경우 주의해야 합니다. 피클링된 파일은 .pkl 확장자를 가집니다.

실습 - 데이터 정리하기

이번 강의에서는 NUFORC (National UFO Reporting Center)에서 수집한 80,000건의 UFO 목격 데이터를 사용합니다. 이 데이터에는 흥미로운 UFO 목격 설명이 포함되어 있습니다. 예를 들어:

긴 설명 예시. "밤에 풀밭에 빛이 비추고 그 빛에서 한 남자가 나타나 텍사스 인스트루먼트 주차장으로 달려간다."
짧은 설명 예시. "빛이 우리를 쫓아왔다."

ufos.csv 스프레드시트에는 목격이 발생한 city, state, country, 객체의 shape, 그리고 latitude와 longitude에 대한 열이 포함되어 있습니다.

이 강의에 포함된 빈 노트북에서:

이전 강의에서 했던 것처럼 pandas, matplotlib, numpy를 가져오고 ufos 스프레드시트를 가져옵니다. 샘플 데이터 세트를 확인할 수 있습니다:
```
import pandas as pd
import numpy as np

ufos = pd.read_csv('./data/ufos.csv')
ufos.head()
```

ufos 데이터를 새 제목으로 작은 데이터프레임으로 변환합니다. Country 필드의 고유 값을 확인하세요.

ufos = pd.DataFrame({'Seconds': ufos['duration (seconds)'], 'Country': ufos['country'],'Latitude': ufos['latitude'],'Longitude': ufos['longitude']})

ufos.Country.unique()

이제 null 값을 제거하고 1-60초 사이의 목격만 가져옴으로써 처리해야 할 데이터 양을 줄일 수 있습니다:
```
ufos.dropna(inplace=True)

ufos = ufos[(ufos['Seconds'] >= 1) & (ufos['Seconds'] <= 60)]

ufos.info()
```

Scikit-learn의 LabelEncoder 라이브러리를 가져와 국가의 텍스트 값을 숫자로 변환합니다:

✅ LabelEncoder는 데이터를 알파벳 순서로 인코딩합니다.

from sklearn.preprocessing import LabelEncoder

ufos['Country'] = LabelEncoder().fit_transform(ufos['Country'])

ufos.head()

데이터는 다음과 같이 보여야 합니다:

	Seconds	Country	Latitude	Longitude
2	20.0	3		53.200000	-2.916667
3	20.0	4		28.978333	-96.645833
14	30.0	4		35.823889	-80.253611
23	60.0	4		45.582778	-122.352222
24	3.0		3		51.783333	-0.783333

실습 - 모델 구축하기

이제 데이터를 훈련 및 테스트 그룹으로 나누어 모델을 훈련시킬 준비를 할 수 있습니다.

훈련할 세 가지 특징을 X 벡터로 선택하고 y 벡터는 Country로 설정합니다. Seconds, Latitude, Longitude를 입력하여 국가 ID를 반환할 수 있도록 합니다.

from sklearn.model_selection import train_test_split

Selected_features = ['Seconds','Latitude','Longitude']

X = ufos[Selected_features]
y = ufos['Country']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

로지스틱 회귀를 사용하여 모델을 훈련시킵니다:

from sklearn.metrics import accuracy_score, classification_report
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_train, y_train)
predictions = model.predict(X_test)

print(classification_report(y_test, predictions))
print('Predicted labels: ', predictions)
print('Accuracy: ', accuracy_score(y_test, predictions))

정확도는 **(약 95%)**로 나쁘지 않습니다. 이는 Country와 Latitude/Longitude가 상관관계가 있기 때문입니다.

이 모델은 혁신적이지는 않지만, 정리된 원시 데이터를 사용하여 모델을 훈련시키고 이를 웹 앱에서 사용하는 좋은 연습이 됩니다.

실습 - 모델 '피클링'하기

이제 모델을 _피클링_할 시간입니다! 몇 줄의 코드로 이를 수행할 수 있습니다. 모델이 _피클링_되면, 피클링된 모델을 로드하고 초, 위도, 경도 값을 포함하는 샘플 데이터 배열에 대해 테스트합니다.

import pickle
model_filename = 'ufo-model.pkl'
pickle.dump(model, open(model_filename,'wb'))

model = pickle.load(open('ufo-model.pkl','rb'))
print(model.predict([[50,44,-12]]))

모델은 **'3'**을 반환하며, 이는 영국의 국가 코드입니다. 놀랍네요! 👽

실습 - Flask 앱 구축하기

이제 Flask 앱을 구축하여 모델을 호출하고 더 시각적으로 보기 좋은 방식으로 결과를 반환할 수 있습니다.

notebook.ipynb 파일 옆에 web-app이라는 폴더를 만듭니다. 이 폴더에는 ufo-model.pkl 파일이 있어야 합니다.
해당 폴더에 static 폴더와 그 안에 css 폴더, 그리고 templates 폴더를 만듭니다. 이제 다음과 같은 파일 및 디렉토리가 있어야 합니다:
```
web-app/
  static/
    css/
  templates/
notebook.ipynb
ufo-model.pkl
```
✅ 완성된 앱의 보기 형태는 솔루션 폴더를 참조하세요.
web-app 폴더에서 첫 번째 파일로 requirements.txt를 만듭니다. JavaScript 앱의 _package.json_처럼 이 파일은 앱에 필요한 종속성을 나열합니다. requirements.txt에 다음 줄을 추가합니다:
```
scikit-learn
pandas
numpy
flask
```
이제 _web-app_으로 이동하여 이 파일을 실행합니다:
```
cd web-app
```
터미널에서 pip install을 입력하여 _requirements.txt_에 나열된 라이브러리를 설치합니다:
```
pip install -r requirements.txt
```
이제 앱을 완성하기 위해 세 개의 파일을 더 만들 준비가 되었습니다:
1. 루트에 app.py를 만듭니다.
2. templates 디렉토리에 index.html을 만듭니다.
3. static/css 디렉토리에 styles.css를 만듭니다.

styles.css 파일을 몇 가지 스타일로 작성합니다:

body {
	width: 100%;
	height: 100%;
	font-family: 'Helvetica';
	background: black;
	color: #fff;
	text-align: center;
	letter-spacing: 1.4px;
	font-size: 30px;
}

input {
	min-width: 150px;
}

.grid {
	width: 300px;
	border: 1px solid #2d2d2d;
	display: grid;
	justify-content: center;
	margin: 20px auto;
}

.box {
	color: #fff;
	background: #2d2d2d;
	padding: 12px;
	display: inline-block;
}

다음으로 index.html 파일을 작성합니다:

<!DOCTYPE html>
<html>
  <head>
    <meta charset="UTF-8">
    <title>🛸 UFO Appearance Prediction! 👽</title>
    <link rel="stylesheet" href="{{ url_for('static', filename='css/styles.css') }}">
  </head>

  <body>
    <div class="grid">

      <div class="box">

        <p>According to the number of seconds, latitude and longitude, which country is likely to have reported seeing a UFO?</p>

        <form action="{{ url_for('predict')}}" method="post">
          <input type="number" name="seconds" placeholder="Seconds" required="required" min="0" max="60" />
          <input type="text" name="latitude" placeholder="Latitude" required="required" />
          <input type="text" name="longitude" placeholder="Longitude" required="required" />
          <button type="submit" class="btn">Predict country where the UFO is seen</button>
        </form>

        <p>{{ prediction_text }}</p>

      </div>

    </div>

  </body>
</html>

이 파일의 템플릿을 살펴보세요. 앱에서 제공될 변수들, 예를 들어 예측 텍스트 {{}} 주위의 '머스태시' 구문을 확인하세요. 또한 /predict 경로에 예측을 게시하는 폼이 있습니다.

마지막으로, 모델 소비와 예측 표시를 구동하는 Python 파일을 작성할 준비가 되었습니다:

app.py에 다음을 추가합니다:

import numpy as np
from flask import Flask, request, render_template
import pickle

app = Flask(__name__)

model = pickle.load(open("./ufo-model.pkl", "rb"))


@app.route("/")
def home():
    return render_template("index.html")


@app.route("/predict", methods=["POST"])
def predict():

    int_features = [int(x) for x in request.form.values()]
    final_features = [np.array(int_features)]
    prediction = model.predict(final_features)

    output = prediction[0]

    countries = ["Australia", "Canada", "Germany", "UK", "US"]

    return render_template(
        "index.html", prediction_text="Likely country: {}".format(countries[output])
    )


if __name__ == "__main__":
    app.run(debug=True)

💡 팁: Flask를 사용하여 웹 앱을 실행할 때 debug=True를 추가하면 애플리케이션에 변경 사항을 적용할 때 서버를 다시 시작하지 않아도 즉시 반영됩니다. 주의하세요! 프로덕션 앱에서는 이 모드를 활성화하지 마세요.

python app.py 또는 python3 app.py를 실행하면 로컬에서 웹 서버가 시작되고, 짧은 폼을 작성하여 UFO 목격 위치에 대한 궁금증을 해결할 수 있습니다!

그 전에 app.py의 구성 요소를 살펴보세요:

먼저 종속성이 로드되고 앱이 시작됩니다.
그런 다음 모델이 가져옵니다.
그런 다음 홈 경로에서 index.html이 렌더링됩니다.

/predict 경로에서 폼이 게시되면 여러 가지 일이 발생합니다:

폼 변수들이 수집되어 numpy 배열로 변환됩니다. 그런 다음 모델로 보내져 예측이 반환됩니다.
표시할 국가들이 예측된 국가 코드에서 읽기 가능한 텍스트로 다시 렌더링되며, 해당 값이 index.html로 다시 보내져 템플릿에서 렌더링됩니다.

Flask와 피클링된 모델을 사용하여 모델을 사용하는 것은 비교적 간단합니다. 가장 어려운 점은 모델에서 예측을 얻기 위해 보내야 할 데이터의 형태를 이해하는 것입니다. 이는 모델이 어떻게 훈련되었는지에 따라 달라집니다. 이 모델은 예측을 얻기 위해 입력해야 할 세 가지 데이터 포인트를 가지고 있습니다.

전문적인 환경에서는 모델을 훈련시키는 사람들과 이를 웹 또는 모바일 앱에서 소비하는 사람들 간의 원활한 의사소통이 얼마나 중요한지 알 수 있습니다. 우리의 경우, 그 사람은 바로 여러분입니다!

🚀 도전 과제

노트북에서 작업하고 모델을 Flask 앱으로 가져오는 대신, Flask 앱 내에서 모델을 훈련시킬 수 있습니다! 데이터를 정리한 후 노트북의 Python 코드를 앱 내에서 train이라는 경로에서 모델을 훈련시키도록 변환해 보세요. 이 방법을 추구하는 장단점은 무엇인가요?

강의 후 퀴즈

복습 및 자기 학습

ML 모델을 소비하는 웹 앱을 구축하는 방법은 여러 가지가 있습니다. JavaScript 또는 Python을 사용하여 머신 러닝을 활용하는 웹 앱을 구축할 수 있는 방법 목록을 작성해 보세요. 아키텍처를 고려하세요: 모델이 앱에 있어야 할까요, 아니면 클라우드에 있어야 할까요? 후자의 경우, 어떻게 접근할 수 있을까요? 적용된 ML 웹 솔루션에 대한 아키텍처 모델을 그려보세요.

과제

다른 모델 시도하기

면책 조항:
이 문서는 AI 번역 서비스 Co-op Translator를 사용하여 번역되었습니다. 정확성을 위해 최선을 다하고 있으나, 자동 번역에는 오류나 부정확성이 포함될 수 있습니다. 원본 문서를 해당 언어로 작성된 상태에서 권위 있는 자료로 간주해야 합니다. 중요한 정보의 경우, 전문적인 인간 번역을 권장합니다. 이 번역 사용으로 인해 발생하는 오해나 잘못된 해석에 대해 당사는 책임을 지지 않습니다.