You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
ML-For-Beginners/translations/mr/4-Classification/4-Applied/README.md

24 KiB

क्युझिन शिफारस वेब अ‍ॅप तयार करा

या धड्यात, तुम्ही मागील धड्यांमध्ये शिकलेल्या तंत्रांचा वापर करून आणि या मालिकेत वापरलेल्या स्वादिष्ट क्युझिन डेटासेटसह एक वर्गीकरण मॉडेल तयार कराल. याशिवाय, तुम्ही Onnx च्या वेब रनटाइमचा उपयोग करून जतन केलेल्या मॉडेलसाठी एक लहान वेब अ‍ॅप तयार कराल.

मशीन लर्निंगचा एक अत्यंत उपयुक्त व्यावहारिक उपयोग म्हणजे शिफारस प्रणाली तयार करणे, आणि तुम्ही आज त्या दिशेने पहिले पाऊल उचलू शकता!

या वेब अ‍ॅपचे सादरीकरण

🎥 वरील प्रतिमेवर क्लिक करा: जेन लूपर वर्गीकृत क्युझिन डेटाचा वापर करून वेब अ‍ॅप तयार करतात

पूर्व-व्याख्यान प्रश्नमंजुषा

या धड्यात तुम्ही शिकाल:

  • Onnx मॉडेल म्हणून मॉडेल कसे तयार करावे आणि जतन करावे
  • Netron चा वापर करून मॉडेल कसे तपासावे
  • तुमच्या वेब अ‍ॅपमध्ये अंदाजासाठी मॉडेलचा वापर कसा करावा

तुमचे मॉडेल तयार करा

अर्जावर आधारित मशीन लर्निंग प्रणाली तयार करणे ही तुमच्या व्यवसाय प्रणालींसाठी या तंत्रज्ञानाचा लाभ घेण्याचा एक महत्त्वाचा भाग आहे. Onnx चा वापर करून तुम्ही तुमच्या वेब अ‍ॅप्लिकेशनमध्ये मॉडेल्स वापरू शकता (आणि आवश्यक असल्यास ऑफलाइन संदर्भातही).

मागील धड्यात, तुम्ही UFO दृश्यांबद्दल एक रिग्रेशन मॉडेल तयार केले, "पिकल" केले आणि ते Flask अ‍ॅपमध्ये वापरले. ही आर्किटेक्चर जाणून घेणे खूप उपयुक्त आहे, परंतु हे पूर्ण-स्टॅक Python अ‍ॅप आहे, आणि तुमच्या गरजा JavaScript अ‍ॅप्लिकेशनचा समावेश करू शकतात.

या धड्यात, तुम्ही अंदाजासाठी एक मूलभूत JavaScript-आधारित प्रणाली तयार करू शकता. परंतु, प्रथम, तुम्हाला मॉडेल प्रशिक्षण द्यावे लागेल आणि ते Onnx सह वापरण्यासाठी रूपांतरित करावे लागेल.

व्यायाम - वर्गीकरण मॉडेल प्रशिक्षण द्या

प्रथम, आपण वापरलेल्या स्वच्छ क्युझिन डेटासेटचा वापर करून वर्गीकरण मॉडेल प्रशिक्षण द्या.

  1. उपयुक्त लायब्ररी आयात करून प्रारंभ करा:

    !pip install skl2onnx
    import pandas as pd 
    

    तुम्हाला 'skl2onnx' ची आवश्यकता आहे, जे Scikit-learn मॉडेलला Onnx स्वरूपात रूपांतरित करण्यात मदत करते.

  2. नंतर, मागील धड्यांप्रमाणेच CSV फाइल read_csv() वापरून वाचा:

    data = pd.read_csv('../data/cleaned_cuisines.csv')
    data.head()
    
  3. पहिल्या दोन अनावश्यक स्तंभ काढून टाका आणि उर्वरित डेटा 'X' म्हणून जतन करा:

    X = data.iloc[:,2:]
    X.head()
    
  4. लेबल्स 'y' म्हणून जतन करा:

    y = data[['cuisine']]
    y.head()
    
    

प्रशिक्षण प्रक्रिया सुरू करा

आम्ही 'SVC' लायब्ररीचा वापर करू, ज्याची अचूकता चांगली आहे.

  1. Scikit-learn मधून योग्य लायब्ररी आयात करा:

    from sklearn.model_selection import train_test_split
    from sklearn.svm import SVC
    from sklearn.model_selection import cross_val_score
    from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report
    
  2. प्रशिक्षण आणि चाचणी संच वेगळे करा:

    X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3)
    
  3. मागील धड्यात केल्याप्रमाणे SVC वर्गीकरण मॉडेल तयार करा:

    model = SVC(kernel='linear', C=10, probability=True,random_state=0)
    model.fit(X_train,y_train.values.ravel())
    
  4. आता, predict() कॉल करून तुमचे मॉडेल चाचणी करा:

    y_pred = model.predict(X_test)
    
  5. मॉडेलची गुणवत्ता तपासण्यासाठी वर्गीकरण अहवाल मुद्रित करा:

    print(classification_report(y_test,y_pred))
    

    जसे आपण यापूर्वी पाहिले, अचूकता चांगली आहे:

                    precision    recall  f1-score   support
    
         chinese       0.72      0.69      0.70       257
          indian       0.91      0.87      0.89       243
        japanese       0.79      0.77      0.78       239
          korean       0.83      0.79      0.81       236
            thai       0.72      0.84      0.78       224
    
        accuracy                           0.79      1199
       macro avg       0.79      0.79      0.79      1199
    weighted avg       0.79      0.79      0.79      1199
    

तुमचे मॉडेल Onnx मध्ये रूपांतरित करा

योग्य टेन्सर क्रमांकासह रूपांतरण सुनिश्चित करा. या डेटासेटमध्ये 380 घटक सूचीबद्ध आहेत, त्यामुळे तुम्हाला FloatTensorType मध्ये तो क्रमांक नमूद करणे आवश्यक आहे:

  1. 380 च्या टेन्सर क्रमांकासह रूपांतरित करा.

    from skl2onnx import convert_sklearn
    from skl2onnx.common.data_types import FloatTensorType
    
    initial_type = [('float_input', FloatTensorType([None, 380]))]
    options = {id(model): {'nocl': True, 'zipmap': False}}
    
  2. Onnx तयार करा आणि model.onnx नावाच्या फाइलमध्ये जतन करा:

    onx = convert_sklearn(model, initial_types=initial_type, options=options)
    with open("./model.onnx", "wb") as f:
        f.write(onx.SerializeToString())
    

    लक्षात घ्या, तुम्ही तुमच्या रूपांतरण स्क्रिप्टमध्ये पर्याय पास करू शकता. या प्रकरणात, आम्ही 'nocl' ला True आणि 'zipmap' ला False सेट केले. कारण हे वर्गीकरण मॉडेल आहे, त्यामुळे ZipMap काढण्याचा पर्याय आहे, जो डिक्शनरींची यादी तयार करतो (गरजेचा नाही). nocl वर्ग माहिती मॉडेलमध्ये समाविष्ट करण्यास संदर्भित करते. nocl ला 'True' सेट करून तुमच्या मॉडेलचा आकार कमी करा.

संपूर्ण नोटबुक चालवल्याने आता Onnx मॉडेल तयार होईल आणि ते या फोल्डरमध्ये जतन होईल.

तुमचे मॉडेल पहा

Onnx मॉडेल्स Visual Studio Code मध्ये फारसे दृश्यमान नाहीत, परंतु एक अतिशय चांगले मोफत सॉफ्टवेअर आहे जे अनेक संशोधक मॉडेल योग्यरित्या तयार झाले आहे की नाही हे पाहण्यासाठी वापरतात. Netron डाउनलोड करा आणि तुमची model.onnx फाइल उघडा. तुम्ही तुमचे साधे मॉडेल 380 इनपुट्स आणि वर्गीकरणासह व्हिज्युअलाइज केलेले पाहू शकता:

Netron दृश्य

Netron हे तुमचे मॉडेल पाहण्यासाठी उपयुक्त साधन आहे.

आता तुम्ही हे छान मॉडेल वेब अ‍ॅपमध्ये वापरण्यास तयार आहात. चला एक अ‍ॅप तयार करूया जे तुमच्या फ्रीजमध्ये पाहून आणि तुमच्या उरलेल्या घटकांच्या संयोजनाचा उपयोग करून कोणते क्युझिन तयार करता येईल हे ठरवण्यासाठी उपयुक्त ठरेल, जसे तुमच्या मॉडेलने ठरवले आहे.

शिफारस वेब अ‍ॅप तयार करा

तुम्ही तुमचे मॉडेल थेट वेब अ‍ॅपमध्ये वापरू शकता. ही आर्किटेक्चर तुम्हाला ते स्थानिक पातळीवर आणि आवश्यक असल्यास ऑफलाइन चालवण्याची परवानगी देते. जिथे तुमची model.onnx फाइल जतन केली आहे त्या फोल्डरमध्ये index.html फाइल तयार करून प्रारंभ करा.

  1. या फाइलमध्ये index.html, खालील मार्कअप जोडा:

    <!DOCTYPE html>
    <html>
        <header>
            <title>Cuisine Matcher</title>
        </header>
        <body>
            ...
        </body>
    </html>
    
  2. आता, body टॅगमध्ये काम करताना, काही घटक दर्शवण्यासाठी चेकबॉक्सची यादी दाखवण्यासाठी थोडासा मार्कअप जोडा:

    <h1>Check your refrigerator. What can you create?</h1>
            <div id="wrapper">
                <div class="boxCont">
                    <input type="checkbox" value="4" class="checkbox">
                    <label>apple</label>
                </div>
    
                <div class="boxCont">
                    <input type="checkbox" value="247" class="checkbox">
                    <label>pear</label>
                </div>
    
                <div class="boxCont">
                    <input type="checkbox" value="77" class="checkbox">
                    <label>cherry</label>
                </div>
    
                <div class="boxCont">
                    <input type="checkbox" value="126" class="checkbox">
                    <label>fenugreek</label>
                </div>
    
                <div class="boxCont">
                    <input type="checkbox" value="302" class="checkbox">
                    <label>sake</label>
                </div>
    
                <div class="boxCont">
                    <input type="checkbox" value="327" class="checkbox">
                    <label>soy sauce</label>
                </div>
    
                <div class="boxCont">
                    <input type="checkbox" value="112" class="checkbox">
                    <label>cumin</label>
                </div>
            </div>
            <div style="padding-top:10px">
                <button onClick="startInference()">What kind of cuisine can you make?</button>
            </div> 
    

    लक्षात घ्या की प्रत्येक चेकबॉक्सला एक मूल्य दिले आहे. हे डेटासेटनुसार घटक सापडलेल्या अनुक्रमणिकेचे प्रतिबिंबित करते. उदाहरणार्थ, सफरचंद या वर्णमालाच्या यादीत पाचव्या स्तंभात आहे, त्यामुळे त्याचे मूल्य '4' आहे कारण आपण 0 पासून मोजायला सुरुवात करतो. घटक स्प्रेडशीट सल्ला घ्या जेणेकरून एखाद्या घटकाची अनुक्रमणिका शोधता येईल.

    index.html फाइलमध्ये तुमचे काम सुरू ठेवत, अंतिम </div> बंद केल्यानंतर एक स्क्रिप्ट ब्लॉक जोडा जिथे मॉडेल कॉल केले जाते.

  3. प्रथम, Onnx Runtime आयात करा:

    <script src="https://cdn.jsdelivr.net/npm/onnxruntime-web@1.9.0/dist/ort.min.js"></script> 
    

    Onnx Runtime चा वापर तुमच्या Onnx मॉडेल्सना विस्तृत हार्डवेअर प्लॅटफॉर्मवर चालवण्यासाठी केला जातो, ज्यामध्ये ऑप्टिमायझेशन आणि वापरण्यासाठी API समाविष्ट आहे.

  4. एकदा Runtime तयार झाल्यावर, तुम्ही ते कॉल करू शकता:

    <script>
        const ingredients = Array(380).fill(0);
    
        const checks = [...document.querySelectorAll('.checkbox')];
    
        checks.forEach(check => {
            check.addEventListener('change', function() {
                // toggle the state of the ingredient
                // based on the checkbox's value (1 or 0)
                ingredients[check.value] = check.checked ? 1 : 0;
            });
        });
    
        function testCheckboxes() {
            // validate if at least one checkbox is checked
            return checks.some(check => check.checked);
        }
    
        async function startInference() {
    
            let atLeastOneChecked = testCheckboxes()
    
            if (!atLeastOneChecked) {
                alert('Please select at least one ingredient.');
                return;
            }
            try {
                // create a new session and load the model.
    
                const session = await ort.InferenceSession.create('./model.onnx');
    
                const input = new ort.Tensor(new Float32Array(ingredients), [1, 380]);
                const feeds = { float_input: input };
    
                // feed inputs and run
                const results = await session.run(feeds);
    
                // read from results
                alert('You can enjoy ' + results.label.data[0] + ' cuisine today!')
    
            } catch (e) {
                console.log(`failed to inference ONNX model`);
                console.error(e);
            }
        }
    
    </script>
    

या कोडमध्ये, अनेक गोष्टी घडत आहेत:

  1. तुम्ही 380 संभाव्य मूल्यांचा (1 किंवा 0) एक अ‍ॅरे तयार केला आहे, जो घटक चेकबॉक्स तपासला गेला आहे की नाही यावर अवलंबून मॉडेलला अंदाजासाठी पाठवला जातो.
  2. तुम्ही चेकबॉक्सेसचा अ‍ॅरे तयार केला आणि अ‍ॅप्लिकेशन सुरू झाल्यावर कॉल होणाऱ्या init फंक्शनमध्ये ते तपासले गेले आहे की नाही हे ठरवण्याचा मार्ग तयार केला. जेव्हा चेकबॉक्स तपासला जातो, तेव्हा निवडलेल्या घटकाचे प्रतिबिंबित करण्यासाठी ingredients अ‍ॅरे बदलले जाते.
  3. तुम्ही testCheckboxes फंक्शन तयार केले जे तपासते की कोणताही चेकबॉक्स तपासला गेला आहे का.
  4. जेव्हा बटण दाबले जाते तेव्हा तुम्ही startInference फंक्शन वापरता आणि जर कोणताही चेकबॉक्स तपासला गेला असेल, तर तुम्ही अंदाज सुरू करता.
  5. अंदाज दिनचर्या समाविष्ट करते:
    1. मॉडेलचे असिंक्रोनस लोड सेट करणे
    2. मॉडेलला पाठवण्यासाठी टेन्सर संरचना तयार करणे
    3. 'फीड्स' तयार करणे जे तुम्ही तुमचे मॉडेल प्रशिक्षण देताना तयार केलेल्या float_input इनपुटचे प्रतिबिंबित करते (तुम्ही Netron वापरून ते नाव सत्यापित करू शकता)
    4. हे 'फीड्स' मॉडेलला पाठवणे आणि प्रतिसादाची प्रतीक्षा करणे

तुमचे अ‍ॅप्लिकेशन चाचणी करा

Visual Studio Code मध्ये जिथे तुमची index.html फाइल आहे त्या फोल्डरमध्ये टर्मिनल सत्र उघडा. सुनिश्चित करा की तुमच्याकडे http-server जागतिक स्तरावर स्थापित आहे आणि प्रॉम्प्टवर http-server टाइप करा. एक लोकलहोस्ट उघडेल आणि तुम्ही तुमचे वेब अ‍ॅप पाहू शकता. विविध घटकांवर आधारित कोणते क्युझिन शिफारस केले जाते ते तपासा:

घटक वेब अ‍ॅप

अभिनंदन, तुम्ही काही फील्डसह 'शिफारस' वेब अ‍ॅप तयार केले आहे. या प्रणालीला तयार करण्यासाठी थोडा वेळ घ्या!

🚀आव्हान

तुमचे वेब अ‍ॅप खूपच मूलभूत आहे, त्यामुळे ingredient_indexes डेटामधील घटक आणि त्यांची अनुक्रमणिका वापरून ते तयार करत रहा. कोणते स्वाद संयोजन दिलेल्या राष्ट्रीय डिश तयार करण्यासाठी कार्य करतात?

व्याख्यानानंतरची प्रश्नमंजुषा

पुनरावलोकन आणि स्व-अभ्यास

या धड्यात अन्न घटकांसाठी शिफारस प्रणाली तयार करण्याच्या उपयुक्ततेचा फक्त स्पर्श केला गेला, परंतु ML अनुप्रयोगांच्या या क्षेत्रात अनेक उदाहरणे आहेत. या प्रणाली कशा तयार केल्या जातात याबद्दल अधिक वाचा:

असाइनमेंट

नवीन शिफारस प्रणाली तयार करा


अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील मूळ दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर केल्यामुळे उद्भवणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.