You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/sr/5-Data-Science-In-Cloud/17-Introduction
leestott 7373a19c39
🌐 Update translations via Co-op Translator
2 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

Увод у науку о подацима у облаку

 Скетч од (@sketchthedocs)
Наука о подацима у облаку: Увод - Скетч од @nitya

У овој лекцији, научићете основне принципе облака, затим ћете видети зашто може бити занимљиво користити услуге облака за покретање ваших пројеката из области науке о подацима, и погледаћемо неке примере пројеката из области науке о подацима који се изводе у облаку.

Квиз пре предавања

Шта је облак?

Облак, или рачунарство у облаку, представља испоруку широког спектра рачунарских услуга које се плаћају по употреби и хостују на инфраструктури преко интернета. Услуге укључују решења као што су складиштење, базе података, умрежавање, софтвер, аналитика и интелигентне услуге.

Обично разликујемо јавни, приватни и хибридни облак на следећи начин:

  • Јавни облак: јавни облак је у власништву и под управом трећег провајдера услуга облака који своје рачунарске ресурсе испоручује преко интернета јавности.
  • Приватни облак: односи се на рачунарске ресурсе облака који се користе искључиво од стране једног предузећа или организације, са услугама и инфраструктуром које се одржавају на приватној мрежи.
  • Хибридни облак: хибридни облак је систем који комбинује јавне и приватне облаке. Корисници се одлучују за локални дата центар, док омогућавају да се подаци и апликације изводе на једном или више јавних облака.

Већина услуга рачунарства у облаку спада у три категорије: Инфраструктура као услуга (IaaS), Платформа као услуга (PaaS) и Софтвер као услуга (SaaS).

  • Инфраструктура као услуга (IaaS): корисници изнајмљују ИТ инфраструктуру као што су сервери и виртуелне машине (VMs), складиштење, мреже, оперативни системи.
  • Платформа као услуга (PaaS): корисници изнајмљују окружење за развој, тестирање, испоруку и управљање софтверским апликацијама. Корисници не морају да брину о постављању или управљању основном инфраструктуром сервера, складиштења, мреже и база података потребних за развој.
  • Софтвер као услуга (SaaS): корисници добијају приступ софтверским апликацијама преко интернета, на захтев и обично на основу претплате. Корисници не морају да брину о хостовању и управљању софтверском апликацијом, основној инфраструктури или одржавању, као што су ажурирања софтвера и безбедносне закрпе.

Неки од највећих провајдера услуга облака су Amazon Web Services, Google Cloud Platform и Microsoft Azure.

Зашто изабрати облак за науку о подацима?

Програмери и ИТ професионалци одлучују да раде са облаком из многих разлога, укључујући следеће:

  • Иновација: можете покретати своје апликације интегришући иновативне услуге које су креирали провајдери облака директно у ваше апликације.
  • Флексибилност: плаћате само за услуге које вам требају и можете бирати из широког спектра услуга. Обично плаћате по употреби и прилагођавате своје услуге у складу са вашим потребама које се мењају.
  • Буџет: не морате да правите почетне инвестиције за куповину хардвера и софтвера, постављање и управљање локалним дата центрима, већ плаћате само за оно што користите.
  • Скалабилност: ваши ресурси могу се прилагодити потребама вашег пројекта, што значи да ваше апликације могу користити више или мање рачунарске снаге, складиштења и пропусног опсега, прилагођавајући се спољним факторима у било ком тренутку.
  • Продуктивност: можете се фокусирати на свој посао уместо да трошите време на задатке које може управљати неко други, као што је управљање дата центрима.
  • Поузданост: рачунарство у облаку нуди неколико начина за континуирано прављење резервних копија ваших података и можете поставити планове за опоравак од катастрофе како бисте одржали свој посао и услуге, чак и у кризним временима.
  • Безбедност: можете имати користи од политика, технологија и контрола које јачају безбедност вашег пројекта.

Ово су неки од најчешћих разлога зашто људи одлучују да користе услуге облака. Сада када боље разумемо шта је облак и које су његове главне предности, погледајмо конкретније послове научника о подацима и програмера који раде са подацима, и како им облак може помоћи са неколико изазова са којима се могу суочити:

  • Чување великих количина података: уместо да купујете, управљате и штитите велике сервере, можете чувати своје податке директно у облаку, са решењима као што су Azure Cosmos DB, Azure SQL Database и Azure Data Lake Storage.
  • Извођење интеграције података: интеграција података је суштински део науке о подацима, који вам омогућава да направите прелазак од прикупљања података до предузимања акција. Са услугама интеграције података које се нуде у облаку, можете прикупљати, трансформисати и интегрисати податке из различитих извора у један складиште података, уз Data Factory.
  • Обрада података: обрада великих количина података захтева много рачунарске снаге, а не сви имају приступ довољно моћним машинама за то, због чега многи људи одлучују да директно искористе огромну рачунарску снагу облака за покретање и примену својих решења.
  • Коришћење услуга аналитике података: услуге облака као што су Azure Synapse Analytics, Azure Stream Analytics и Azure Databricks помажу вам да своје податке претворите у корисне увиде.
  • Коришћење услуга машинског учења и интелигенције података: уместо да почнете од нуле, можете користити алгоритме машинског учења које нуди провајдер облака, са услугама као што је AzureML. Такође можете користити когнитивне услуге као што су претварање говора у текст, текст у говор, компјутерски вид и више.

Примери науке о подацима у облаку

Хајде да ово учинимо конкретнијим тако што ћемо погледати неколико сценарија.

Анализа сентимента на друштвеним мрежама у реалном времену

Почећемо са сценаријем који често проучавају људи који започињу са машинским учењем: анализа сентимента на друштвеним мрежама у реалном времену.

Рецимо да водите веб-сајт са вестима и желите да искористите податке уживо како бисте разумели који садржај би могао занимати ваше читаоце. Да бисте сазнали више о томе, можете направити програм који изводи анализу сентимента у реалном времену на подацима из објава на Твитеру, о темама које су релевантне за ваше читаоце.

Кључни показатељи које ћете посматрати су обим твитова о одређеним темама (хаштаговима) и сентимент, који се утврђује коришћењем аналитичких алата који изводе анализу сентимента око одређених тема.

Потребни кораци за креирање овог пројекта су следећи:

  • Направите чвориште за догађаје за стриминг улазних података, које ће прикупљати податке са Твитера.
  • Конфигуришите и покрените апликацију клијента за Твитер, која ће позивати Твитер Streaming API.
  • Направите посао за Stream Analytics.
  • Спецификујте улаз и упит за посао.
  • Направите излазни канал и спецификујте излаз посла.
  • Покрените посао.

Да бисте видели цео процес, погледајте документацију.

Анализа научних радова

Узмимо други пример пројекта који је креирао Дмитриј Сошњиков, један од аутора овог курикулума.

Дмитриј је направио алат који анализира радове о COVID-у. Прегледом овог пројекта, видећете како можете направити алат који извлачи знање из научних радова, добија увиде и помаже истраживачима да се ефикасно крећу кроз велике колекције радова.

Хајде да видимо различите кораке који су коришћени за ово:

  • Извлачење и претпроцесирање информација уз Text Analytics for Health.
  • Коришћење Azure ML за паралелизацију обраде.
  • Чување и упит информација уз Cosmos DB.
  • Креирање интерактивне контролне табле за истраживање и визуализацију података уз Power BI.

Да бисте видели цео процес, посетите Дмитријев блог.

Као што видите, можемо искористити услуге облака на много начина за извођење науке о подацима.

Фуснота

Извори:

Квиз после предавања

Квиз после предавања

Задатак

Истраживање тржишта


Одрицање од одговорности:
Овај документ је преведен коришћењем услуге за превођење помоћу вештачке интелигенције Co-op Translator. Иако се трудимо да превод буде тачан, молимо вас да имате у виду да аутоматизовани преводи могу садржати грешке или нетачности. Оригинални документ на његовом изворном језику треба сматрати меродавним извором. За критичне информације препоручује се професионални превод од стране људи. Не преузимамо одговорност за било каква погрешна тумачења или неспоразуме који могу настати услед коришћења овог превода.