|
|
1 month ago | |
|---|---|---|
| .. | ||
| solution | 5 months ago | |
| README.md | 1 month ago | |
| assignment.md | 5 months ago | |
| notebook.ipynb | 5 months ago | |
README.md
கிளவுடில் தரவியல் அறிவியல்: "Azure ML SDK" முறையில்
![]() |
|---|
| கிளவுடில் தரவியல் அறிவியல்: Azure ML SDK - @nitya உருவாக்கிய ஸ்கெட்ச் நோட் |
உள்ளடக்க அட்டவணை:
- கிளவுடில் தரவியல் அறிவியல்: "Azure ML SDK" முறையில்
முன்-பாடம் வினாடி வினா
1. அறிமுகம்
1.1 Azure ML SDK என்றால் என்ன?
தரவியல் அறிஞர்கள் மற்றும் AI டெவலப்பர்கள் Azure Machine Learning SDK-ஐப் பயன்படுத்தி Azure Machine Learning சேவையுடன் இயங்கும் இயந்திரக் கற்றல் பணிகளை உருவாக்கி இயக்குகிறார்கள். Python சூழலில், Jupyter Notebooks, Visual Studio Code அல்லது உங்களுக்கு பிடித்த Python IDE போன்றவற்றில் இந்த சேவையுடன் தொடர்பு கொள்ளலாம்.
SDK-யின் முக்கிய பகுதிகள்:
- இயந்திரக் கற்றல் பரிசோதனைகளில் பயன்படுத்தப்படும் தரவுத்தொகுப்புகளை ஆராய்ந்து, தயாரித்து, அவற்றின் ஆயுள்நிலையை நிர்வகிக்கவும்.
- உங்கள் இயந்திரக் கற்றல் பரிசோதனைகளை கண்காணிக்க, பதிவு செய்ய மற்றும் ஒழுங்கமைக்க கிளவுட் வளங்களை நிர்வகிக்கவும்.
- மாதிரிகளை உள்ளூர் அல்லது GPU-ஐ ஆதரிக்கும் கிளவுட் வளங்களைப் பயன்படுத்தி பயிற்சி செய்யவும்.
- தானியங்கி இயந்திரக் கற்றலைப் பயன்படுத்தவும், இது கட்டமைப்பு அளவுருக்களையும் பயிற்சி தரவையும் ஏற்கிறது. இது ஆல்காரிதம்கள் மற்றும் ஹைப்பர்பாராமீட்டர் அமைப்புகளைத் தேர்ந்தெடுத்து கணிப்புகளுக்கு சிறந்த மாதிரியை கண்டறிய முயற்சிக்கிறது.
- பயிற்சி செய்யப்பட்ட மாதிரிகளை RESTful சேவைகளாக மாற்றி, எந்த பயன்பாட்டிலும் பயன்படுத்தக்கூடிய வலை சேவைகளைப் பிரசாரம் செய்யவும்.
Azure Machine Learning SDK பற்றி மேலும் அறிக
முந்தைய பாடத்தில், குறைந்த குறியீடு/குறியீடு இல்லாத முறையில் மாதிரியை பயிற்சி செய்ய, பிரசாரம் செய்ய மற்றும் பயன்படுத்துவது எப்படி என்பதைப் பார்த்தோம். இதய செயலிழப்பு தரவுத்தொகுப்பைப் பயன்படுத்தி இதய செயலிழப்பு கணிப்பு மாதிரியை உருவாக்கினோம். இந்த பாடத்தில், அதே செயல்முறையை Azure Machine Learning SDK-ஐப் பயன்படுத்தி செய்வோம்.
1.2 இதய செயலிழப்பு கணிப்பு திட்டம் மற்றும் தரவுத்தொகுப்பு அறிமுகம்
இதய செயலிழப்பு கணிப்பு திட்டம் மற்றும் தரவுத்தொகுப்பு அறிமுகத்திற்காக இங்கே பார்க்கவும்.
2. Azure ML SDK மூலம் ஒரு மாதிரியை பயிற்சி செய்யுதல்
2.1 Azure ML வேலைப்பகுதியை உருவாக்குதல்
எளிமைப்படுத்த, நாம் Jupyter Notebook-ல் வேலை செய்வோம். இதற்காக, உங்களிடம் ஏற்கனவே ஒரு வேலைப்பகுதி மற்றும் கணிப்பொறி உதாரணம் இருக்க வேண்டும். உங்களிடம் ஏற்கனவே வேலைப்பகுதி இருந்தால், நேரடியாக 2.3 நோட்புக் உருவாக்கம் பிரிவுக்கு செல்லலாம்.
இல்லையெனில், முந்தைய பாடத்தில் உள்ள 2.1 Azure ML வேலைப்பகுதியை உருவாக்குதல் பிரிவின் வழிமுறைகளைப் பின்பற்றவும்.
2.2 கணிப்பொறி உதாரணத்தை உருவாக்குதல்
நாம் முன்பு உருவாக்கிய Azure ML வேலைப்பகுதியில், கணிப்பொறி மெனுவுக்கு சென்று கிடைக்கும் கணிப்பொறி வளங்களைப் பாருங்கள்.
Jupyter Notebook-ஐ வழங்க ஒரு கணிப்பொறி உதாரணத்தை உருவாக்குவோம்.
-
- New பொத்தானை அழுத்தவும்.
- உங்கள் கணிப்பொறி உதாரணத்திற்கு ஒரு பெயரை கொடுங்கள்.
- உங்கள் விருப்பங்களைத் தேர்ந்தெடுக்கவும்: CPU அல்லது GPU, VM அளவு மற்றும் மைய எண்ணிக்கை.
- Create பொத்தானை அழுத்தவும்.
வாழ்த்துக்கள், நீங்கள் ஒரு கணிப்பொறி உதாரணத்தை வெற்றிகரமாக உருவாக்கிவிட்டீர்கள்! நோட்புக் உருவாக்கம் பிரிவில் இந்த கணிப்பொறி உதாரணத்தைப் பயன்படுத்துவோம்.
2.3 தரவுத்தொகுப்பை ஏற்றுதல்
இன்னும் தரவுத்தொகுப்பை ஏற்றவில்லை என்றால், முந்தைய பாடத்தில் உள்ள 2.3 தரவுத்தொகுப்பை ஏற்றுதல் பிரிவை பார்க்கவும்.
2.4 நோட்புக்குகளை உருவாக்குதல்
குறிப்பு: அடுத்த படிக்காக, நீங்கள் புதிய நோட்புக் ஒன்றை உருவாக்கலாம் அல்லது நாம் உருவாக்கிய நோட்புக்கை உங்கள் Azure ML ஸ்டுடியோவில் பதிவேற்றலாம். பதிவேற்ற, "Notebook" மெனுவை கிளிக் செய்து நோட்புக்கை பதிவேற்றவும்.
நோட்புக்குகள் தரவியல் அறிவியல் செயல்முறையின் முக்கியமான பகுதியாகும். அவை தரவுகளை ஆராய, கணிப்பொறி கிளஸ்டரை அழைக்க மாதிரியை பயிற்சி செய்ய, அல்லது இறுதிப்புள்ளி பிரசாரத்திற்கு அழைக்க பயன்படுத்தப்படுகின்றன.
நோட்புக் உருவாக்க, Jupyter Notebook உதாரணத்தை வழங்கும் கணிப்பொறி நொடுக்கு தேவை. மீண்டும் Azure ML வேலைப்பகுதிக்கு சென்று கணிப்பொறி உதாரணங்களை கிளிக் செய்யவும். நீங்கள் முன்பு உருவாக்கிய கணிப்பொறி உதாரணத்தை காணலாம்.
- Applications பிரிவில், Jupyter விருப்பத்தை கிளிக் செய்யவும்.
- "Yes, I understand" பெட்டியை அடையாளமிடி மற்றும் Continue பொத்தானை அழுத்தவும்.

- இது உங்கள் Jupyter Notebook உதாரணத்துடன் புதிய உலாவி தாவலைத் திறக்கும். "New" பொத்தானை அழுத்தி ஒரு நோட்புக் உருவாக்கவும்.
இப்போது, நமக்கு ஒரு நோட்புக் உள்ளது. Azure ML SDK-யுடன் மாதிரியை பயிற்சி செய்ய தொடங்கலாம்.
2.5 ஒரு மாதிரியை பயிற்சி செய்யுதல்
முதலில், சந்தேகம் இருந்தால், Azure ML SDK ஆவணங்களை பார்க்கவும். இந்த பாடத்தில் நாம் காணும் தொகுதிகளைப் புரிந்துகொள்ள தேவையான அனைத்து தகவல்களும் இதில் உள்ளன.
2.5.1 வேலைப்பகுதி, பரிசோதனை, கணிப்பொறி கிளஸ்டர் மற்றும் தரவுத்தொகுப்பை அமைத்தல்
workspace-ஐ கட்டமைப்பு கோப்பிலிருந்து கீழே உள்ள குறியீட்டை பயன்படுத்தி ஏற்ற வேண்டும்:
from azureml.core import Workspace
ws = Workspace.from_config()
இது Workspace வகையைச் சேர்ந்த ஒரு பொருளை திருப்பும், இது வேலைப்பகுதியை பிரதிநிதித்துவப்படுத்தும். பின்னர், நீங்கள் கீழே உள்ள குறியீட்டை பயன்படுத்தி ஒரு experiment உருவாக்க வேண்டும்:
from azureml.core import Experiment
experiment_name = 'aml-experiment'
experiment = Experiment(ws, experiment_name)
வேலைப்பகுதியிலிருந்து ஒரு பரிசோதனையை பெற அல்லது உருவாக்க, நீங்கள் பரிசோதனையை அதன் பெயரைப் பயன்படுத்தி கோர வேண்டும். பரிசோதனை பெயர் 3-36 எழுத்துகளுக்கு இடையில் இருக்க வேண்டும், ஒரு எழுத்து அல்லது எண்ணுடன் தொடங்க வேண்டும், மற்றும் எழுத்துக்கள், எண்கள், அடிக்கோடுகள் மற்றும் கோடுகள் மட்டுமே கொண்டிருக்க வேண்டும். வேலைப்பகுதியில் பரிசோதனை கிடைக்காவிட்டால், புதிய பரிசோதனை உருவாக்கப்படும்.
இப்போது, பயிற்சிக்காக ஒரு கணிப்பொறி கிளஸ்டரை உருவாக்க வேண்டும். இந்த படி சில நிமிடங்கள் ஆகும்:
from azureml.core.compute import AmlCompute
aml_name = "heart-f-cluster"
try:
aml_compute = AmlCompute(ws, aml_name)
print('Found existing AML compute context.')
except:
print('Creating new AML compute context.')
aml_config = AmlCompute.provisioning_configuration(vm_size = "Standard_D2_v2", min_nodes=1, max_nodes=3)
aml_compute = AmlCompute.create(ws, name = aml_name, provisioning_configuration = aml_config)
aml_compute.wait_for_completion(show_output = True)
cts = ws.compute_targets
compute_target = cts[aml_name]
தரவுத்தொகுப்பை வேலைப்பகுதியிலிருந்து தரவுத்தொகுப்பு பெயரைப் பயன்படுத்தி பெறலாம்:
dataset = ws.datasets['heart-failure-records']
df = dataset.to_pandas_dataframe()
df.describe()
2.5.2 AutoML கட்டமைப்பு மற்றும் பயிற்சி
AutoML கட்டமைப்பை அமைக்க, AutoMLConfig வகுப்பைப் பயன்படுத்தவும்.
ஆவணத்தில் விவரிக்கப்பட்டுள்ளபடி, நீங்கள் பல அளவுருக்களுடன் விளையாடலாம். இந்த திட்டத்திற்காக, நாம் பின்வரும் அளவுருக்களைப் பயன்படுத்துவோம்:
experiment_timeout_minutes: பரிசோதனை இயங்க அனுமதிக்கப்பட்ட அதிகபட்ச நேரம் (நிமிடங்களில்).max_concurrent_iterations: பரிசோதனைக்கு அனுமதிக்கப்பட்ட அதிகபட்ச ஒரே நேர பயிற்சி மீள்பார்வைகள்.primary_metric: பரிசோதனையின் நிலையை தீர்மானிக்க பயன்படுத்தப்படும் முதன்மை அளவுகோல்.compute_target: Automated Machine Learning பரிசோதனையை இயக்க Azure Machine Learning கணிப்பொறி இலக்கு.task: இயக்க வேண்டிய பணியின் வகை. 'classification', 'regression', அல்லது 'forecasting' ஆகியவை மதிப்புகளாக இருக்கலாம்.training_data: பரிசோதனையில் பயன்படுத்தப்படும் பயிற்சி தரவுகள். இது பயிற்சி அம்சங்களையும் ஒரு லேபிள் நெடுவரிசையையும் கொண்டிருக்க வேண்டும்.label_column_name: லேபிள் நெடுவரிசையின் பெயர்.path: Azure Machine Learning திட்ட கோப்புறையின் முழு பாதை.enable_early_stopping: குறுகிய காலத்தில் மதிப்பெண் மேம்படவில்லை என்றால், முன்கூட்டியே நிறுத்தலை இயக்க வேண்டுமா என்பதைத் தீர்மானிக்கிறது.featurization: தானாக அம்சமயமாக்கல் படியைச் செய்ய வேண்டுமா அல்லது தனிப்பயன் அம்சமயமாக்கலைப் பயன்படுத்த வேண்டுமா என்பதைத் தீர்மானிக்கிறது.debug_log: பிழைதிருத்த தகவல்களை எழுதுவதற்கான பதிவு கோப்பு.
from azureml.train.automl import AutoMLConfig
project_folder = './aml-project'
automl_settings = {
"experiment_timeout_minutes": 20,
"max_concurrent_iterations": 3,
"primary_metric" : 'AUC_weighted'
}
automl_config = AutoMLConfig(compute_target=compute_target,
task = "classification",
training_data=dataset,
label_column_name="DEATH_EVENT",
path = project_folder,
enable_early_stopping= True,
featurization= 'auto',
debug_log = "automl_errors.log",
**automl_settings
)
இப்போது உங்கள் கட்டமைப்பு அமைக்கப்பட்டுள்ளதால், கீழே உள்ள குறியீட்டை பயன்படுத்தி மாதிரியை பயிற்சி செய்யலாம். இந்த படி உங்கள் கிளஸ்டர் அளவைப் பொறுத்து ஒரு மணி நேரம் வரை ஆகலாம்.
remote_run = experiment.submit(automl_config)
பரிசோதனைகளை காண RunDetails விட்ஜெட்டை இயக்கலாம்.
from azureml.widgets import RunDetails
RunDetails(remote_run).show()
3. Azure ML SDK மூலம் மாதிரி பிரசாரம் மற்றும் இறுதிப்புள்ளி பயன்பாடு
3.1 சிறந்த மாதிரியை சேமித்தல்
remote_run என்பது AutoMLRun வகையைச் சேர்ந்த ஒரு பொருள். இந்த பொருளில் get_output() என்ற முறை உள்ளது, இது சிறந்த இயக்கத்தையும் அதற்கான பொருத்தமான மாதிரியையும் திருப்பும்.
best_run, fitted_model = remote_run.get_output()
சிறந்த மாதிரிக்கான அளவுருக்களை காண, fitted_model-ஐ அச்சிட்டு, சிறந்த மாதிரியின் பண்புகளை get_properties() முறையைப் பயன்படுத்தி பார்க்கலாம்.
best_run.get_properties()
இப்போது register_model முறையைப் பயன்படுத்தி மாதிரியை பதிவு செய்யவும்.
model_name = best_run.properties['model_name']
script_file_name = 'inference/score.py'
best_run.download_file('outputs/scoring_file_v_1_0_0.py', 'inference/score.py')
description = "aml heart failure project sdk"
model = best_run.register_model(model_name = model_name,
model_path = './outputs/',
description = description,
tags = None)
3.2 மாதிரி பிரசாரம்
சிறந்த மாதிரி சேமிக்கப்பட்ட பிறகு, InferenceConfig வகுப்பைப் பயன்படுத்தி அதை பிரசாரம் செய்யலாம். InferenceConfig என்பது பிரசாரத்திற்கான தனிப்பயன் சூழலுக்கான கட்டமைப்பு அமைப்புகளை பிரதிநிதித்துவப்படுத்துகிறது. AciWebservice வகுப்பு Azure Container Instances-ல் ஒரு வலை சேவையாக பிரசாரம் செய்யப்பட்ட இயந்திரக் கற்றல் மாதிரியை பிரதிநிதித்துவப்படுத்துகிறது. பிரசாரம் செய்யப்பட்ட சேவை ஒரு மாடல், ஸ்கிரிப்ட் மற்றும் தொடர்புடைய கோப்புகளிலிருந்து உருவாக்கப்படுகிறது. முடிவில் கிடைக்கும் வலை சேவை ஒரு சுமை-மீட்டப்பட்ட, HTTP இறுதிப்புள்ளி கொண்ட REST API ஆகும். இந்த API-க்கு தரவுகளை அனுப்பி, மாதிரி திருப்பும் கணிப்பை பெறலாம்.
மாதிரி deploy முறையைப் பயன்படுத்தி பிரசாரம் செய்யப்படுகிறது.
from azureml.core.model import InferenceConfig, Model
from azureml.core.webservice import AciWebservice
inference_config = InferenceConfig(entry_script=script_file_name, environment=best_run.get_environment())
aciconfig = AciWebservice.deploy_configuration(cpu_cores = 1,
memory_gb = 1,
tags = {'type': "automl-heart-failure-prediction"},
description = 'Sample service for AutoML Heart Failure Prediction')
aci_service_name = 'automl-hf-sdk'
aci_service = Model.deploy(ws, aci_service_name, [model], inference_config, aciconfig)
aci_service.wait_for_deployment(True)
print(aci_service.state)
இந்த படி சில நிம
data = {
"data":
[
{
'age': "60",
'anaemia': "false",
'creatinine_phosphokinase': "500",
'diabetes': "false",
'ejection_fraction': "38",
'high_blood_pressure': "false",
'platelets': "260000",
'serum_creatinine': "1.40",
'serum_sodium': "137",
'sex': "false",
'smoking': "false",
'time': "130",
},
],
}
test_sample = str.encode(json.dumps(data))
பின்னர் நீங்கள் இந்த உள்ளீட்டை உங்கள் மாதிரிக்கு கணிப்பு செய்ய அனுப்பலாம்:
response = aci_service.run(input_data=test_sample)
response
இதன் வெளியீடு '{"result": [false]}' ஆக இருக்கும். இதன் பொருள், நாம் endpoint-க்கு அனுப்பிய நோயாளியின் உள்ளீடு false எனும் கணிப்பை உருவாக்கியது, இது இந்த நபர் இதயக் கோளாறு ஏற்படும் வாய்ப்பு இல்லை என்பதைக் குறிக்கிறது.
வாழ்த்துக்கள்! நீங்கள் Azure ML SDK-யை பயன்படுத்தி Azure ML-ல் பயிற்சி செய்து வெளியிட்ட மாதிரியை பயன்படுத்த முடிந்தது!
NOTE: திட்டத்தை முடித்தவுடன், அனைத்து வளங்களையும் நீக்க மறக்காதீர்கள்.
🚀 சவால்
SDK மூலம் நீங்கள் செய்யக்கூடிய பல விஷயங்கள் உள்ளன, ஆனால் இந்த பாடத்தில் அவற்றை அனைத்தையும் பார்க்க முடியாது. ஆனால் நல்ல செய்தி என்னவென்றால், SDK ஆவணங்களை எளிதாகப் புரிந்துகொள்வது உங்களை நீண்ட தூரம் முன்னேற்றும். Azure ML SDK ஆவணங்களைப் பாருங்கள் மற்றும் Pipeline வகுப்பைத் தேடுங்கள், இது பைப்ப்லைன்களை உருவாக்க அனுமதிக்கிறது. பைப்ப்லைன் என்பது ஒரு வேலைப்பாடாக செயல்படுத்தக்கூடிய படிகள் தொகுப்பாகும்.
HINT: SDK ஆவணங்கள் பக்கம் சென்று தேடுபொறியில் "Pipeline" போன்ற முக்கிய வார்த்தைகளைத் தேடுங்கள். தேடல் முடிவுகளில் azureml.pipeline.core.Pipeline வகுப்பு இருக்க வேண்டும்.
பாடத்திற்குப் பிந்தைய வினாடி வினா
மதிப்பீடு & சுயபடிப்பு
இந்த பாடத்தில், நீங்கள் Azure ML SDK-யை பயன்படுத்தி மேகத்தில் இதய கோளாறு அபாயத்தை கணிக்க ஒரு மாதிரியை பயிற்சி, வெளியீடு மற்றும் பயன்படுத்துவது எப்படி என்பதை கற்றுக்கொண்டீர்கள். Azure ML SDK பற்றிய கூடுதல் தகவலுக்கு இந்த ஆவணத்தை பாருங்கள். Azure ML SDK-யை பயன்படுத்தி உங்கள் சொந்த மாதிரியை உருவாக்க முயற்சிக்கவும்.
பணிக்கட்டளை
Azure ML SDK-யை பயன்படுத்தி தரவியல் அறிவியல் திட்டம்
குறிப்பு:
இந்த ஆவணம் Co-op Translator என்ற AI மொழிபெயர்ப்பு சேவையைப் பயன்படுத்தி மொழிபெயர்க்கப்பட்டுள்ளது. எங்கள் தரச்செயல்முறைகளுக்கு முக்கியத்துவம் அளிக்கின்றோம், ஆனால் தானியக்க மொழிபெயர்ப்புகளில் பிழைகள் அல்லது தவறான தகவல்கள் இருக்கக்கூடும் என்பதை தயவுசெய்து கவனத்தில் கொள்ளவும். அதன் இயல்பான மொழியில் உள்ள மூல ஆவணம் அதிகாரப்பூர்வ ஆதாரமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிபெயர்ப்பு பரிந்துரைக்கப்படுகிறது. இந்த மொழிபெயர்ப்பைப் பயன்படுத்துவதால் ஏற்படும் எந்த தவறான புரிதல்கள் அல்லது தவறான விளக்கங்களுக்கு நாங்கள் பொறுப்பல்ல.



