chore(i18n): sync translations with latest source changes (chunk 1/1, 90 changes)

update-translations
localizeflow[bot] 17 hours ago
parent 2a898fda65
commit 7803b10dca

@ -11,12 +11,24 @@
"source_file": "1-Introduction/01-defining-data-science/assignment.md",
"language_code": "kn"
},
"1-Introduction/01-defining-data-science/notebook.ipynb": {
"original_hash": "8f5eb7b3f7cc89e6d98fb32e1de65dec",
"translation_date": "2026-02-27T10:47:14+00:00",
"source_file": "1-Introduction/01-defining-data-science/notebook.ipynb",
"language_code": "kn"
},
"1-Introduction/01-defining-data-science/solution/assignment.md": {
"original_hash": "a8f79b9c0484c35b4f26e8aec7fc4d56",
"translation_date": "2025-12-19T14:40:03+00:00",
"source_file": "1-Introduction/01-defining-data-science/solution/assignment.md",
"language_code": "kn"
},
"1-Introduction/01-defining-data-science/solution/notebook.ipynb": {
"original_hash": "090bbfbfcb0c40d3d6e3236f836164ea",
"translation_date": "2026-02-27T10:47:54+00:00",
"source_file": "1-Introduction/01-defining-data-science/solution/notebook.ipynb",
"language_code": "kn"
},
"1-Introduction/02-ethics/README.md": {
"original_hash": "58860ce9a4b8a564003d2752f7c72851",
"translation_date": "2025-12-19T14:22:03+00:00",
@ -95,6 +107,12 @@
"source_file": "2-Working-With-Data/07-python/assignment.md",
"language_code": "kn"
},
"2-Working-With-Data/07-python/notebook-covidspread.ipynb": {
"original_hash": "6335cccba01dc6ad7b15aba7a8c73f38",
"translation_date": "2026-02-27T10:48:59+00:00",
"source_file": "2-Working-With-Data/07-python/notebook-covidspread.ipynb",
"language_code": "kn"
},
"2-Working-With-Data/08-data-preparation/README.md": {
"original_hash": "1b560955ff39a2bcf2a049fce474a951",
"translation_date": "2025-12-19T15:43:47+00:00",
@ -360,8 +378,8 @@
"language_code": "kn"
},
"README.md": {
"original_hash": "8ec92ecfeb14923af733851239552146",
"translation_date": "2026-01-30T02:53:57+00:00",
"original_hash": "f671e295a294a2559fc59d1524e001b4",
"translation_date": "2026-02-27T10:55:23+00:00",
"source_file": "README.md",
"language_code": "kn"
},

@ -6,7 +6,7 @@
---
[![ಡೇಟಾ ಸೈನ್ಸ್ ವ್ಯಾಖ್ಯಾನಿಸುವ ವೀಡಿಯೊ](../../../../translated_images/kn/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.png)](https://youtu.be/beZ7Mb_oz9I)
[![ಡೇಟಾ ಸೈನ್ಸ್ ವ್ಯಾಖ್ಯಾನಿಸುವ ವೀಡಿಯೊ](../../../../translated_images/kn/video-def-ds.6623ee2392ef1abf.webp)](https://youtu.be/beZ7Mb_oz9I)
## [ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/0)
@ -144,7 +144,7 @@
ಈ ಸವಾಲಿನಲ್ಲಿ, ನಾವು ಪಠ್ಯಗಳನ್ನು ನೋಡಿ ಡೇಟಾ ಸೈನ್ಸ್ ಕ್ಷೇತ್ರಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ತತ್ವಗಳನ್ನು ಹುಡುಕಲು ಪ್ರಯತ್ನಿಸುವೆವು. ನಾವು ಡೇಟಾ ಸೈನ್ಸ್ ಕುರಿತು ವಿಕಿಪೀಡಿಯ ಲೇಖನವನ್ನು ತೆಗೆದು, ಪಠ್ಯವನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಿ, ನಂತರ ಈ ರೀತಿಯ ಪದ ಮೋಡವನ್ನು ನಿರ್ಮಿಸುವೆವು:
![Word Cloud for Data Science](../../../../translated_images/kn/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.png)
![Word Cloud for Data Science](../../../../translated_images/kn/ds_wordcloud.664a7c07dca57de0.webp)
ಕೋಡ್ ಓದಲು [`notebook.ipynb`](../../../../1-Introduction/01-defining-data-science/notebook.ipynb ':ignore') ಗೆ ಭೇಟಿ ನೀಡಿ. ನೀವು ಕೋಡ್ ಅನ್ನು ಚಲಾಯಿಸಬಹುದು ಮತ್ತು ಅದು ಎಲ್ಲಾ ಡೇಟಾ ಪರಿವರ್ತನೆಗಳನ್ನು ನೈಜ ಸಮಯದಲ್ಲಿ ಹೇಗೆ ನಿರ್ವಹಿಸುತ್ತದೆ ಎಂದು ನೋಡಬಹುದು.

@ -3,15 +3,15 @@
{
"cell_type": "markdown",
"source": [
"# ಸವಾಲು: ಡೇಟಾ ಸೈನ್ಸ್ ಬಗ್ಗೆ ಪಠ್ಯ ವಿಶ್ಲೇಷಣೆ\n",
"# ಸವಾಲು: ಡೇಟಾ ವಿಜ್ಞಾನ ಸಂಬಂಧಿತ ಪಠ್ಯ ವಿಶ್ಲೇಷಣೆ\n",
"\n",
"ಈ ಉದಾಹರಣೆಯಲ್ಲಿ, ನಾವು ಪರಂಪರাগত ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆಯ ಎಲ್ಲಾ ಹಂತಗಳನ್ನು ಒಳಗೊಂಡ ಸರಳ ವ್ಯಾಯಾಮವನ್ನು ಮಾಡೋಣ. ನೀವು ಯಾವುದೇ ಕೋಡ್ ಬರೆಯಬೇಕಾಗಿಲ್ಲ, ಕೆಳಗಿನ ಸೆಲ್‌ಗಳನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಅವುಗಳನ್ನು ನಿರ್ವಹಿಸಿ ಫಲಿತಾಂಶವನ್ನು ಗಮನಿಸಬಹುದು. ಸವಾಲಿನಾಗಿ, ನೀವು ವಿಭಿನ್ನ ಡೇಟಾ ಬಳಸಿ ಈ ಕೋಡ್ ಅನ್ನು ಪ್ರಯತ್ನಿಸಲು ಪ್ರೋತ್ಸಾಹಿತರಾಗಿದ್ದೀರಿ.\n",
"ಈ ಉದಾಹರಣೆಯಲ್ಲಿ, ಪರಂಪರাগত ಡೇಟಾ ವಿಜ್ಞಾನ ಪ್ರಕ್ರಿಯೆಯ ಎಲ್ಲಾ ಹಂತಗಳನ್ನು ಒಳಗೊಂಡ ಸರಳ ವ್ಯಾಯಾಮವನ್ನು ಮಾಡೋಣ. ನೀವು ಯಾವುದೇ ಕೋಡ್ ಬರೆಯಬೇಕಾಗಿಲ್ಲ, ಕೆಳಗಿನ ಸೆಲ್‌ಗಳನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಅವುಗಳನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಿ ಮತ್ತು ಫಲಿತಾಂಶವನ್ನು ಗಮನಿಸಬಹುದು. ಸವಾಲಿನಾಗಿ, ನೀವು ಈ ಕೋಡ್ ಅನ್ನು ವಿಭಿನ್ನ ಡೇಟಾ ಬಳಸಿ ಪ್ರಯತ್ನಿಸಲು ಪ್ರೋತ್ಸಾಹಿಸಲಾಗಿದೆ.\n",
"\n",
"## ಗುರಿ\n",
"\n",
"ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಸಂಬಂಧಿಸಿದ ವಿವಿಧ ಕಲ್ಪನೆಗಳನ್ನು ಚರ್ಚಿಸುತ್ತಿದ್ದೇವೆ. ಕೆಲವು **ಪಠ್ಯ ಗಣನೆ** ಮಾಡುವ ಮೂಲಕ ಇನ್ನಷ್ಟು ಸಂಬಂಧಿತ ಕಲ್ಪನೆಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಪ್ರಯತ್ನಿಸೋಣ. ನಾವು ಡೇಟಾ ಸೈನ್ಸ್ ಬಗ್ಗೆ ಒಂದು ಪಠ್ಯದಿಂದ ಪ್ರಾರಂಭಿಸಿ, ಅದರಿಂದ ಪ್ರಮುಖ ಪದಗಳನ್ನು ಹೊರತೆಗೆಯುತ್ತೇವೆ, ನಂತರ ಫಲಿತಾಂಶವನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತೇವೆ.\n",
"ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಡೇಟಾ ವಿಜ್ಞಾನಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ವಿವಿಧ ಕಲ್ಪನೆಗಳನ್ನು ಚರ್ಚಿಸಿರುವೆವು. ಕೆಲವು **ಪಠ್ಯ ಗಣನೆ**ಗಳನ್ನು ಮಾಡಿ ಹೆಚ್ಚು ಸಂಬಂಧಿತ ಕಲ್ಪನೆಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಪ್ರಯತ್ನಿಸೋಣ. ನಾವು ಡೇಟಾ ವಿಜ್ಞಾನ ಕುರಿತು ಪಠ್ಯದಿಂದ ಪ್ರಾರಂಭಿಸಿ, ಅದರಿಂದ ಕೀವರ್ಡ್‌ಗಳನ್ನು ಹೊರತೆಗೆಯುತ್ತೇವೆ, ನಂತರ ಫಲಿತಾಂಶವನ್ನು ದೃಶ್ಯಮಾಡಲು ಪ್ರಯತ್ನಿಸುತ್ತೇವೆ.\n",
"\n",
"ಪಠ್ಯವಾಗಿ, ನಾನು ವಿಕಿಪೀಡಿಯಾದ ಡೇಟಾ ಸೈನ್ಸ್ ಪುಟವನ್ನು ಬಳಸುತ್ತೇನೆ:\n"
"ಪಠ್ಯವಾಗಿ, ನಾನು ವಿಕಿಪೀಡಿಯಾದ ಡೇಟಾ ವಿಜ್ಞಾನ ಪೇಜ್ ಉಪಯೋಗಿಸಲಿದ್ದೇನೆ:\n"
],
"metadata": {}
},
@ -34,7 +34,7 @@
"source": [
"## ಹಂತ 1: ಡೇಟಾವನ್ನು ಪಡೆಯುವುದು\n",
"\n",
"ಪ್ರತಿ ಡೇಟಾ ವಿಜ್ಞಾನ ಪ್ರಕ್ರಿಯೆಯ ಮೊದಲ ಹಂತವು ಡೇಟಾವನ್ನು ಪಡೆಯುವುದು. ಅದಕ್ಕಾಗಿ ನಾವು `requests` ಲೈಬ್ರರಿಯನ್ನು ಬಳಸುತ್ತೇವೆ:\n"
"ಪ್ರತಿ ಡೇಟಾ ವಿಜ್ಞಾನ ಪ್ರಕ್ರಿಯೆಯ ಮೊದಲ ಹಂತವೆಂದರೆ ಡೇಟಾವನ್ನು ಪಡೆಯುವುದೆಂದು ಆಗಿದೆ. ನಾವು ಅದಕ್ಕಾಗಿ `requests` ಗ್ರಂಥಾಲಯವನ್ನು ಬಳಸುವುದು:\n"
],
"metadata": {}
},
@ -68,43 +68,41 @@
"source": [
"## ಹಂತ 2: ಡೇಟಾವನ್ನು ಪರಿವರ್ತಿಸುವುದು\n",
"\n",
"ಮುಂದಿನ ಹಂತವು ಪ್ರಕ್ರಿಯೆಗೆ ಸೂಕ್ತವಾದ ರೂಪಕ್ಕೆ ಡೇಟಾವನ್ನು ಪರಿವರ್ತಿಸುವುದಾಗಿದೆ. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ಪುಟದಿಂದ HTML ಮೂಲ ಕೋಡ್ ಡೌನ್‌ಲೋಡ್ ಮಾಡಿದ್ದೇವೆ, ಮತ್ತು ಅದನ್ನು ಸರಳ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸು ಅಗತ್ಯವಿದೆ.\n",
"ಮುಂದಿನ ಹಂತವು ಡೇಟಾವನ್ನು ಪ್ರಕ್ರಿಯೆಗೆ ಸೂಕ್ತವಾದ ರೂಪಕ್ಕೆ ಪರಿವರ್ತಿಸುವುದಾಗಿದೆ. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ಪುಟದಿಂದ HTML ಮೂಲ ಕೋಡ್ ಅನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡಿದ್ದೇವೆ, ಮತ್ತು ಅದನ್ನು ಪ್ಲೇನ್ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸು ಅಗತ್ಯವಿದೆ.\n",
"\n",
"ಇದನ್ನು ಮಾಡಲು ಹಲವಾರು ವಿಧಾನಗಳಿವೆ. ನಾವು ಪೈಥಾನ್‌ನ ಸರಳವಾದ ನಿರ್ಮಿತ [HTMLParser](https://docs.python.org/3/library/html.parser.html) ವಸ್ತುವನ್ನು ಬಳಸಲಿದ್ದೇವೆ. ನಾವು `HTMLParser` ವರ್ಗವನ್ನು ಉಪವರ್ಗಗೊಳಿಸಿ, `<script>` ಮತ್ತು `<style>` ಟ್ಯಾಗ್‌ಗಳನ್ನು ಹೊರತುಪಡಿಸಿ HTML ಟ್ಯಾಗ್‌ಗಳ ಒಳಗಿನ ಎಲ್ಲಾ ಪಠ್ಯವನ್ನು ಸಂಗ್ರಹಿಸುವ ಕೋಡ್ ಅನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಬೇಕಾಗುತ್ತದೆ.\n"
"ಇದು many ಹಲವು ವಿಧಗಳಲ್ಲಿ ಮಾಡಬಹುದು. ನಾವು [BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/) ಅನ್ನು ಬಳಸಲಿದ್ದೇವೆ, ಇದು HTML ಅನ್ನು ಪಾರ್ಸ್ ಮಾಡಲು ಪ್ರಸಿದ್ಧ Python ಗ್ರಂಥಾಲಯವಾಗಿದೆ. BeautifulSoup ನಮಗೆ ನಿರ್ದಿಷ್ಟ HTML ಅಂಶಗಳನ್ನು ಗುರಿಯಾಗಿಸಲು ಅನುಮತಿಸುತ್ತದೆ, ಆದರಿಂದ ನಾವು ವிக்கಿಪೀಡಿಯಾದ ಮುಖ್ಯ ಲೇಖನದ ವಿಷಯದ ಮೇಲೆ ಗಮನಹರಿಸಬಹುದು ಮತ್ತು ಕೆಲವು ನ್ಯಾವಿಗೇಶನ್ ಮೆನುಗಳು, ಸೈಡ್‌ಬಾರ್‌ಗಳು, ಆಟಗಳು ಮತ್ತು ಇತರ ಸಂಬಂಧವಿಲ್ಲದ ವಿಷಯವನ್ನು ಕಡಿಮೆ ಮಾಡಬಹುದು (ಆದರೆ ಕೆಲವು ಬೋಯ್ಲರ್‌ಪ್ಲೇಟ್ ಪಠ್ಯ ಇನ್ನೂ ಉಳಿಯಬಹುದು).\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"ಮೊದಲು, HTML ಪಾರ್ಸಿಂಗ್‌ಗಾಗಿ BeautifulSoup ಗ್ರಂಥಾಲಯವನ್ನು ಸ್ಥಾಪಿಸಬೇಕು:\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"import sys\r\n",
"!{sys.executable} -m pip install beautifulsoup4"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 64,
"source": [
"from html.parser import HTMLParser\r\n",
"\r\n",
"class MyHTMLParser(HTMLParser):\r\n",
" script = False\r\n",
" res = \"\"\r\n",
" def handle_starttag(self, tag, attrs):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = True\r\n",
" def handle_endtag(self, tag):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = False\r\n",
" def handle_data(self, data):\r\n",
" if str.strip(data)==\"\" or self.script:\r\n",
" return\r\n",
" self.res += ' '+data.replace('[ edit ]','')\r\n",
"\r\n",
"parser = MyHTMLParser()\r\n",
"parser.feed(text)\r\n",
"text = parser.res\r\n",
"print(text[:1000])"
"from bs4 import BeautifulSoup\r\n\r\n# Parse the HTML content\r\nsoup = BeautifulSoup(text, 'html.parser')\r\n\r\n# Extract only the main article content from Wikipedia\r\n# Wikipedia uses 'mw-parser-output' class for the main article content\r\ncontent = soup.find('div', class_='mw-parser-output')\r\n\r\ndef clean_wikipedia_content(content_node):\r\n \"\"\"Remove common non-article elements from a Wikipedia content node.\"\"\"\r\n # Strip jump links, navboxes, reference lists/superscripts, edit sections, TOC, sidebars, etc.\r\n selectors = [\r\n '.mw-jump-link',\r\n '.navbox',\r\n '.reflist',\r\n 'sup.reference',\r\n '.mw-editsection',\r\n '.hatnote',\r\n '.metadata',\r\n '.infobox',\r\n '#toc',\r\n '.toc',\r\n '.sidebar',\r\n ]\r\n for selector in selectors:\r\n for el in content_node.select(selector):\r\n el.decompose()\r\n\r\nif content:\r\n # Clean the content node to better approximate article text only.\r\n clean_wikipedia_content(content)\r\n text = content.get_text(separator=' ', strip=True)\r\n print(text[:1000])\r\nelse:\r\n print(\"Could not find main content. Using full page text.\")\r\n text = soup.get_text(separator=' ', strip=True)\r\n print(text[:1000])"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" Data science - Wikipedia Data science From Wikipedia, the free encyclopedia Jump to navigation Jump to search Interdisciplinary field of study focused on deriving knowledge and insights from data Not to be confused with information science . The existence of Comet NEOWISE (here depicted as a series of red dots) was discovered by analyzing astronomical survey data acquired by a space telescope , the Wide-field Infrared Survey Explorer . Part of a series on Machine learning and data mining Problems Classification Clustering Regression Anomaly detection AutoML Association rules Reinforcement learning Structured prediction Feature engineering Feature learning Online learning Semi-supervised learning Unsupervised learning Learning to rank Grammar induction Supervised learning ( classification  • regression ) Decision trees Ensembles Bagging Boosting Random forest k -NN Linear regression Naive Bayes Artificial neural networks Logistic regression Perceptron Relevance vector machine \n"
"Data science From Wikipedia, the free encyclopedia Interdisciplinary field of study focused on deriving knowledge and insights from data Data science is an interdisciplinary academic field that uses statistics, scientific computing, scientific methods, processes, algorithms and systems to extract or extrapolate knowledge and insights from noisy, structured, and unstructured data. Data science also integrates domain knowledge from the underlying application domain. Data science is multifaceted and can be described as a science, a research paradigm, a research method, a discipline, a workflow, and a profession.\n"
]
}
],
@ -113,11 +111,11 @@
{
"cell_type": "markdown",
"source": [
"## ಹಂತ 3: ಒಳನೋಟಗಳನ್ನು ಪಡೆಯುವುದು\n",
"## Step 3:洞察ಗಳನ್ನು ಪಡೆಯುವುದು\n",
"\n",
"ಅತ್ಯಂತ ಪ್ರಮುಖ ಹಂತವೆಂದರೆ ನಮ್ಮ ಡೇಟಾವನ್ನು ನಾವು ಒಳನೋಟಗಳನ್ನು ಪಡೆಯಬಹುದಾದ ಯಾವುದೇ ರೂಪಕ್ಕೆ ಪರಿವರ್ತಿಸುವುದು. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ಪಠ್ಯದಿಂದ ಕೀವರ್ಡ್‌ಗಳನ್ನು ಹೊರತೆಗೆಯಲು ಬಯಸುತ್ತೇವೆ, ಮತ್ತು ಯಾವ ಕೀವರ್ಡ್‌ಗಳು ಹೆಚ್ಚು ಅರ್ಥಪೂರ್ಣವಾಗಿವೆ ಎಂದು ನೋಡಬೇಕ.\n",
"ಅತ್ಯಂತ ಮುಖ್ಯವಾದ ಹಂತವೆಂದರೆ ನಮಗೆ ಕೆಲವೊಂದು ಅರ್ಥಗಳನ್ನು ನೀಡಿ ಡೇಟಾವನ್ನು ನಾವೇ ರೂಪಾಂತರಿಸುವುದು. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಮಗೆ ಪಠ್ಯದಿಂದ ಕೀವರ್ಡ್‌ಗಳನ್ನು ಹೊರ ಹಿಡಿಯಬೇಕಿದೆ ಮತ್ತು ಯಾವ ಕೀವರ್ಡ್‌ಗಳು ಹೆಚ್ಚು ಅರ್ಥಪೂರ್ಣವಾಗಿವೆ ಎಂದು ನೋಡಬೇಕಿದೆ.\n",
"\n",
"ಕೀವರ್ಡ್ ಹೊರತೆಗೆಯಲು ನಾವು Python ಗ್ರಂಥಾಲಯವಾದ [RAKE](https://github.com/aneesha/RAKE) ಅನ್ನು ಬಳಸಲಿದ್ದೇವೆ. ಮೊದಲು, ಈ ಗ್ರಂಥಾಲಯವು ಲಭ್ಯವಿಲ್ಲದಿದ್ದರೆ ಅದನ್ನು ಸ್ಥಾಪಿಸೋಣ:\n"
"ಕೀವರ್ಡ್ ನಮೂದಿಸುವಿಕೆಗೆ ನಾವು Python ಗ್ರಂಥಾಲಯ [RAKE](https://github.com/aneesha/RAKE) ಅನ್ನು ಬಳಸುತ್ತೇವೆ. ಮೊದಲನೆಯದಾಗಿ, ಈ ಗ್ರಂಥಾಲಯ ಇಲ್ಲದೇ ಇದ್ದಲ್ಲಿ ನಾವು ಅದನ್ನು ಸ್ಥಾಪಿಸೋಣ:\n"
],
"metadata": {}
},
@ -162,7 +160,7 @@
{
"cell_type": "markdown",
"source": [
"ಮುಖ್ಯ ಕಾರ್ಯಕ್ಷಮತೆ `Rake` ವಸ್ತುವಿನಿಂದ ಲಭ್ಯವಿದ್ದು, ನಾವು ಕೆಲವು ಪ್ಯಾರಾಮೀಟರ್‌ಗಳನ್ನು ಬಳಸಿ ಅದನ್ನು ಕಸ್ಟಮೈಸ್ ಮಾಡಬಹುದು. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ಕೀವರ್ಡ್‌ನ ಕನಿಷ್ಠ ಉದ್ದವನ್ನು 5 ಅಕ್ಷರಗಳಾಗಿರಿಸಲು, ಡಾಕ್ಯುಮೆಂಟ್‌ನಲ್ಲಿ ಕೀವರ್ಡ್‌ನ ಕನಿಷ್ಠ ಆವರ್ತನೆಯನ್ನು 3 ಆಗಿರಿಸಲು, ಮತ್ತು ಕೀವರ್ಡ್‌ನಲ್ಲಿ ಗರಿಷ್ಠ ಪದಗಳ ಸಂಖ್ಯೆಯನ್ನು 2 ಆಗಿರಿಸಲು ಹೊಂದಿಸುವೆವು. ಇತರ ಮೌಲ್ಯಗಳೊಂದಿಗೆ ಆಟವಾಡಿ ಫಲಿತಾಂಶವನ್ನು ಗಮನಿಸಲು ಮುಕ್ತವಾಗಿರಿ.\n"
"ಮುಖ್ಯ ಕಾರ್ಯಕ್ಷಮತೆ `Rake` ವಸ್ತುವಿನಿಂದ ಲಭ್ಯವಿರುತ್ತದೆ, ಇದನ್ನು ನಾವು ಕೆಲವು ಪಾರಮೀಟರ್‌ಗಳ ಮೂಲಕ ಕಸ್ಟಮೈಸ್ ಮಾಡಬಹುದು. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ಕೀವರ್ಡ್‌ನ ಕನಿಷ್ಠ 길ೆಯನ್ನು 5 ಅಕ್ಷರಗಳಿಗೆ, ಡಾಕ್ಯುಮೆಂಟ್‌ನಲ್ಲಿ ಕೀವರ್ಡ್‌ನ ಕನಿಷ್ಠ ಆವರ್ತನೆಯನ್ನು 3ಕ್ಕೆ, ಮತ್ತು ಕೀವರ್ಡ್‌ನಲ್ಲಿ ಗರಿಷ್ಠ ಪದಗಳ ಸಂಖ್ಯೆಯನ್ನು 2ಕ್ಕೆ ಹೊಂದಿಸಲಾಗುತ್ತದೆ. ಇತರ ಮೌಲ್ಯಗಳೊಂದಿಗೆ ಅನ್ವೇಷಣೆ ಮಾಡಿ ಫಲಿತಾಂಶವನ್ನು ಗಮನಿಸಿ.\n"
],
"metadata": {}
},
@ -211,11 +209,11 @@
{
"cell_type": "markdown",
"source": [
"ನಾವು ಸಂಬಂಧಿತ ಮಹತ್ವದ ಡಿಗ್ರಿಯೊಂದಿಗೆ ಪದಗಳ ಪಟ್ಟಿಯನ್ನು ಪಡೆದಿದ್ದೇವೆ. ನೀವು ನೋಡಬಹುದು, ಯಂತ್ರ ಅಧ್ಯಯನ ಮತ್ತು ದೊಡ್ಡ ಡೇಟಾ ಮುಂತಾದ ಅತ್ಯಂತ ಸಂಬಂಧಿತ ಶಾಖೆಗಳು ಪಟ್ಟಿಯ ಮೇಲ್ಭಾಗದಲ್ಲಿ ಇದ್ದವೆ.\n",
"ನಾವು ಪ್ರಮುಖತೆಯ ಡಿಗ್ರಿಯೊಂದಿಗೆ ಸಂಬಂಧಿಸಿದ ಪದಗಳ ಪಟ್ಟಿಯನ್ನು ಪಡೆದುಕೊಂಡಿದ್ದೇವೆ. ನೀವು ಕಾಣುವುದೇನಂದರೆ, 머신ಲರ್ನಿಂಗ್ ಮತ್ತು ಬಿಗ್ ಡೇಟಾ ಸೇರಿದಂತೆ ಅತ್ಯಂತ ಸಂಬಂಧಿತ ಶಿಸ್ತಿನವರು ಪಟ್ಟಿಯ ಮೇಲಿನ ಸ್ಥಾನಗಳಲ್ಲಿ ಬರುತ್ತಾರೆ.\n",
"\n",
"## ಹಂತ 4: ಫಲಿತಾಂಶವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು\n",
"## ಹಂತ 4: ಫಲಿತಾಂಶವನ್ನು ದೃಶ್ಯಗೊಳಿಸುವುದು\n",
"\n",
"ಜನರು ಡೇಟಾವನ್ನು ದೃಶ್ಯ ರೂಪದಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತಾರೆ. ಆದ್ದರಿಂದ ಕೆಲವು洞察ಗಳನ್ನು ಪಡೆಯಲು ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು ಅರ್ಥಪೂರ್ಣವಾಗುತ್ತದೆ. ನಾವು ಪೈಥಾನ್‌ನಲ್ಲಿ `matplotlib` ಗ್ರಂಥಾಲಯವನ್ನು ಬಳಸಿಕೊಂಡು ಕೀವರ್ಡ್‌ಗಳ ಸರಳ ವಿತರಣೆ ಮತ್ತು ಅವುಗಳ ಸಂಬಂಧವನ್ನು ಚಿತ್ರಿಸಬಹುದು:\n"
"ಜನರು ಡೇಟಾವನ್ನು ದೃಶ್ಯರೂಪದಲ್ಲಿ ಅತ್ಯಂತ સારી ಹಗಲಿಸಬಹುದು. ಆದ್ದರಿಂದ ಕೆಲವು洞ೆ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಡೇಟಾವನ್ನು ದೃಶ್ಯಗೊಳಿಸುವುದು ಅರ್ಥಪೂರ್ಣವಾಗಿರುತ್ತದೆ. ನಾವು ಪೈಥಾನ್‌ನಲ್ಲಿ `matplotlib` ಗ್ರಂಥಾಲಯವನ್ನು ಬಳಸಿಕೊಂಡು ಕೀವರ್ಡ್‌ಗಳ ಸರಳ ವಿತರಣೆಯನ್ನು ಅವುಗಳ ಸಂಬಂದಿತತೆಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ಪ್ಲಾಟ್ ಮಾಡಬಹುದು:\n"
],
"metadata": {}
},
@ -252,7 +250,7 @@
{
"cell_type": "markdown",
"source": [
"ಆದರೆ, ಪದಗಳ ಆವರ್ತನೆಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಇನ್ನೂ ಉತ್ತಮ ವಿಧಾನವಿದೆ - **ವರ್ಡ್ ಕ್ಲೌಡ್** ಬಳಸಿ. ನಮ್ಮ ಕೀವರ್ಡ್ ಪಟ್ಟಿಯಿಂದ ವರ್ಡ್ ಕ್ಲೌಡ್ ಅನ್ನು ರೇಖಾಚಿತ್ರಗೊಳಿಸಲು ನಾವು ಮತ್ತೊಂದು ಗ್ರಂಥಾಲಯವನ್ನು ಸ್ಥಾಪಿಸಬೇಕಾಗುತ್ತದೆ.\n"
"ಆದರೆ, слова ಸರಿಮೆಗಳಲ್ಲಿ ಮುಂದೆ ಎಷ್ಟೋ ಚೆನ್ನಾಗಿರುವ ವಿಧಾನವಿದೆ - **Word Cloud** ಬಳಸಿ. ನಮ್ಮ ಕೀವರ್ಡ್ ಪಟ್ಟಿಯಿಂದ ವರ್ಡ್ ಕ್ಲೌಡ್ ಅನ್ನು ಚಿತ್ರಿಸಲು ಮತ್ತೊಂದು ಲೈಬ್ರೆರಿಯನ್ನು ಸ್ಥಾಪಿಸಬೇಕಾಗುತ್ತದೆ.\n"
],
"metadata": {}
},
@ -268,7 +266,7 @@
{
"cell_type": "markdown",
"source": [
"`WordCloud` ವಸ್ತು ಮೂಲ ಪಠ್ಯವನ್ನು ಅಥವಾ ಪದಗಳ ಮತ್ತು ಅವುಗಳ ಆವರ್ತನೆಗಳ ಪೂರ್ವ-ಗಣಿತ ಪಟ್ಟಿಯನ್ನು ಸ್ವೀಕರಿಸುವ ಜವಾಬ್ದಾರಿಯಿದೆ, ಮತ್ತು ನಂತರ `matplotlib` ಬಳಸಿ ಪ್ರದರ್ಶಿಸಬಹುದಾದ ಚಿತ್ರವನ್ನ ಹಿಂತಿರುಗಿಸುತ್ತದೆ:\n"
"`WordCloud` ವಸ್ತುವು ಮೂಲ ಪಠ್ಯವನ್ನು ಅಥವಾ ಪದಗಳ ಮತ್ತು ಅವುಗಳ ಆವರ್ತನಗಳ ಪೂರ್ವ-ಗಣನೆ ಮಾಡಿಕೊಂಡ ಪಟ್ಟಿಯನ್ನು ತೆಗೆದುಕೊಳ್ಳುವ ಜವಾಬ್ದಾರಿಯನ್ನು ಹೊಂದಿದ್ದು, ಚಿತ್ರವನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ, ಅದನ್ನು ನಂತರ `matplotlib` ಬಳಸಿ ಪ್ರದರ್ಶಿಸಬಹುದು:\n"
],
"metadata": {}
},
@ -312,7 +310,7 @@
{
"cell_type": "markdown",
"source": [
"ನಾವು ಮೂಲ ಪಠ್ಯವನ್ನು `WordCloud` ಗೆ ಕೂಡ ಪಾಸ್ ಮಾಡಬಹುದು - ನಾವು ಸಮಾನ ಫಲಿತಾಂಶವನ್ನು ಪಡೆಯಲು ಸಾಧ್ಯವಾಗುತ್ತದೆಯೇ ನೋಡೋಣ:\n"
"ನಾವು ಮೂಲ ಪಠ್ಯವನ್ನು `WordCloud` ಗೆ ಕೂಡ ಪೂರೈಸರಿಸಬಹುದು - ನಾವು ಸಮಾನ ಫಲಿತಾಂಶವನ್ನು ಪಡೆಯಬಹುದೇ ಎಂದು ನೋಡೋಣ:\n"
],
"metadata": {}
},
@ -372,9 +370,9 @@
{
"cell_type": "markdown",
"source": [
"ನೀವು ಈಗಾಗಲೇ ನೋಡಬಹುದು, ಪದ ಮೋಡವು ಇನ್ನಷ್ಟು ಪ್ರಭಾವಶಾಲಿಯಾಗಿ ಕಾಣುತ್ತಿದೆ, ಆದರೆ ಇದರಲ್ಲಿ ಬಹಳಷ್ಟು ಶಬ್ದಮಾಲೆಗಳು (ಉದಾ. `Retrieved on` ಎಂಬ ಸಂಬಂಧವಿಲ್ಲದ ಪದಗಳು) ಕೂಡ ಸೇರಿವೆ. ಜೊತೆಗೆ, ಎರಡು ಪದಗಳಿಂದ ಕೂಡಿದ ಕೀವರ್ಡ್‌ಗಳು, ಉದಾಹರಣೆಗೆ *ಡೇಟಾ ಸೈನ್ಟಿಸ್ಟ್*, ಅಥವಾ *ಕಂಪ್ಯೂಟರ್ ಸೈನ್ಸ್* ಕಡಿಮೆ ಬರುತ್ತಿವೆ. ಇದಕ್ಕೆ ಕಾರಣ RAKE ಆಲ್ಗೋರಿದಮ್ ಪಠ್ಯದಿಂದ ಉತ್ತಮ ಕೀವರ್ಡ್‌ಗಳನ್ನು ಆಯ್ಕೆಮಾಡುವಲ್ಲಿ ಉತ್ತಮ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಈ ಉದಾಹರಣೆ ಡೇಟಾ ಪೂರ್ವ-ಪ್ರಕ್ರಿಯೆ ಮತ್ತು ಶುದ್ಧೀಕರಣದ ಮಹತ್ವವನ್ನು ತೋರಿಸುತ್ತದೆ, ಏಕೆಂದರೆ ಕೊನೆಯಲ್ಲಿ ಸ್ಪಷ್ಟ ಚಿತ್ರ ನಮಗೆ ಉತ್ತಮ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.\n",
"ನೀವು ಈಗ ಇದು ಪದ ಮೋಡವು ಹೆಚ್ಚು ಪ್ರಭಾವಶಾಲಿಯಾಗಿ ಕಾಣುತ್ತಿದೆ ಎಂದು ನೋಡಬಹುದು, ಆದರೆ ಇದರೊಡನೆ ತುಂಬಾ ಶಬ್ದವಿವೇಶವೂ ಇದೆ (ಉದಾ. `Retrieved on` ಎಂಬ ಸಂಬಂಧವಿಲ್ಲದ ಪದಗಳು). ಜೊತೆಗೆ, ನಾವು ಕನಿಷ್ಟ ಇಬ್ಬರ್ ಪದಗಳಿಂದ ನಿರ್ಮಿತವಾದ ಕಡಿಮೆ ಪ್ರಮುಖ ಪದಗಳನ್ನು ಪಡೆಯುತ್ತೇವೆ, ಉದಾಹರಣೆಗೆ *ಡೇಟಾ ಸೈನ್ಟಿಸ್ಟ್* ಅಥವಾ *ಕಂಪ್ಯೂಟರ್ ಸೈನ್ಸ್*. ಇದಕ್ಕೆ ಕಾರಣ RAKE ಅಲ್ಗಾರಿಥಮ್ ಪಠ್ಯದಿಂದ ಉತ್ತಮ ಪ್ರಮುಖ ಪದಗಳನ್ನು ಆರಿಸುವಲ್ಲಿ ಬಹುಮುಖವಾಗಿ ಉತ್ತಮ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಈ ಉದಾಹರಣೆ ಡೇಟಾ ಪೂರ್ವ ಪ್ರಕ್ರಿಯೆ ಮತ್ತು ಸ್ವಚ್ಛತೆ的重要ತೆಯನ್ನು ವಿವರಿಸುತ್ತದೆ, ಏಕೆಂದರೆ ಮುಂದಿನ ಹಂತದಲ್ಲಿ ಸ್ಪಷ್ಟ ಚಿತ್ರಣ ನಮಗೆ ಉತ್ತಮ ನಿರ್ಣಯಗಳನ್ನು ಮಾಡಲು ಅನುಮತಿಸುತ್ತದೆ.\n",
"\n",
"ಈ ವ್ಯಾಯಾಮದಲ್ಲಿ ನಾವು ವಿಕಿಪೀಡಿಯ ಪಠ್ಯದಿಂದ ಅರ್ಥವನ್ನು ಹೊರತೆಗೆಯುವ ಸರಳ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಅನುಸರಿಸಿದ್ದೇವೆ, ಅದು ಕೀವರ್ಡ್‌ಗಳು ಮತ್ತು ಪದ ಮೋಡದ ರೂಪದಲ್ಲಿ ಇದೆ. ಈ ಉದಾಹರಣೆ ಬಹಳ ಸರಳವಾಗಿದೆ, ಆದರೆ ಇದು ಡೇಟಾ ಸೈನ್ಟಿಸ್ಟ್ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವಾಗ ತೆಗೆದುಕೊಳ್ಳುವ ಎಲ್ಲಾ ಸಾಮಾನ್ಯ ಹಂತಗಳನ್ನು ಚೆನ್ನಾಗಿ ತೋರಿಸುತ್ತದೆ, ಡೇಟಾ ಸಂಗ್ರಹಣೆಯಿಂದ ಪ್ರಾರಂಭಿಸಿ, ದೃಶ್ಯೀಕರಣದವರೆಗೆ.\n",
"ಈ ಅಭ್ಯಾಸದಲ್ಲಿ ನಾವು ಉತ್ತಮ ಭಾಗವನ್ನು ವಿಕಿಪೀಡಿಯ ಪಠ್ಯದಿಂದ ತೆಗೆದುಕೊಳ್ಳುವ ಸರಳ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಕಂಡಿದ್ದೇವೆ, ಪ್ರಮುಖ ಪದಗಳು ಮತ್ತು ಪದ ಮೋಡದ ಆಕಾರದಲ್ಲಿ. ಈ ಉದಾಹರಣೆ ಬಹುಸರಳವಾಗಿದೆ, ಆದರೆ ಡೇಟಾ ಸೈನ್ಟಿಸ್ಟ್ ಡೇಟಾ acquisition ನಿಂದ visualization ವರೆಗೆ ಕೆಲಸ ಮಾಡಿದಾಗ ತೆಗೆದುಕೊಳ್ಳುವ ಎಲ್ಲಾ ಸಂಬಂಧಿತ ಹಂತಗಳನ್ನು ಚೆನ್ನಾಗಿ ಪ್ರದರ್ಶಿಸುತ್ತದೆ.\n",
"\n",
"ನಮ್ಮ ಕೋರ್ಸ್‌ನಲ್ಲಿ ನಾವು ಆ ಎಲ್ಲಾ ಹಂತಗಳನ್ನು ವಿವರವಾಗಿ ಚರ್ಚಿಸುವೆವು.\n"
],
@ -394,7 +392,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ಅಸ್ವೀಕಾರ**: \nಈ ದಸ್ತಾವೇಜು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಯಿಗಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ತಪ್ಪುಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ತ್ಯಾಜ್ಯವಾಣಿ**: \nಈ ದಸ್ತಾವೇಜನ್ನು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ನಿಖರತೆಗೆ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ದೋಷಗಳು ಅಥವಾ ತಪ್ಪುತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ಗಮನದಲ್ಲಿರಿಸಿಕೊಳ್ಳಿ. ಮೂಲ ಭಾಷೆಯ ದಸ್ತಾವೇಜನ್ನು ಸರ್ವೋಚ್ಚ ಪ್ರಾಮಾಣಿಕ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕಾಗಿದೆ. ಮಹತ್ವಪೂರ್ಣ ಮಾಹಿತಿಗಳಿಗೆ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ. ಈ ಅನುವಾದ ಬಳಸುವುದರಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ದೋಷ ವಿವರಣೆಗಳು ಅಥವಾ ತಪ್ಪು ಅರ್ಥಗ್ರಹಣಗಳಿಗೆ ನಾವು պատասխանದಾಯಕರಾಗಿರುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
@ -418,12 +416,6 @@
},
"interpreter": {
"hash": "c28e7b6bf4e5b397b8288a85bf0a94ea8d3585ce2b01919feb195678ec71581b"
},
"coopTranslator": {
"original_hash": "50c0f0a5204a18405611cbe7e0fec56b",
"translation_date": "2025-12-19T17:01:52+00:00",
"source_file": "1-Introduction/01-defining-data-science/notebook.ipynb",
"language_code": "kn"
}
},
"nbformat": 4,

@ -3,17 +3,17 @@
{
"cell_type": "markdown",
"source": [
"# ಸವಾಲು: ಡೇಟಾ ಸೈನ್ಸ್ ಬಗ್ಗೆ ಪಠ್ಯ ವಿಶ್ಲೇಷಣೆ\n",
"# ಸವಾಲು: ಡೇಟಾ ಸೈನ್ಸ್‌ನ ಬಗ್ಗೆ ಪಠ್ಯವನ್ನು ವಿಶ್ಲೇಷಣೆ ಮಾಡುವುದು\n",
"\n",
"> *ಈ ನೋಟ್ಬುಕ್‌ನಲ್ಲಿ, ನಾವು ವಿಭಿನ್ನ URL - ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಬಗ್ಗೆ ವಿಕಿಪೀಡಿಯಾ ಲೇಖನವನ್ನು ಬಳಸಿಕೊಂಡು ಪ್ರಯೋಗ ಮಾಡುತ್ತೇವೆ. ನೀವು ನೋಡಬಹುದು, ಡೇಟಾ ಸೈನ್ಸ್‌ನಂತೆ ಅಲ್ಲ, ಈ ಲೇಖನದಲ್ಲಿ ಅನೇಕ ಪದಗಳು ಇವೆ, ಇದು ವಿಶ್ಲೇಷಣೆಯನ್ನು ಹೆಚ್ಚು ಸಮಸ್ಯೆಯನ್ನಾಗಿಸುತ್ತದೆ. ನಾವು ಕೀವರ್ಡ್ ಎಕ್ಸ್ಟ್ರಾಕ್ಷನ್ ಮಾಡಿದ ನಂತರ ಡೇಟಾವನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸಲು ಮತ್ತೊಂದು ವಿಧಾನವನ್ನು ಕಂಡುಹಿಡಿಯಬೇಕಾಗಿದೆ, ಕೆಲವು ಸಾಮಾನ್ಯ ಆದರೆ ಅರ್ಥವಿಲ್ಲದ ಪದ ಸಂಯೋಜನೆಗಳನ್ನು ತೆಗೆದುಹಾಕಲು.*\n",
"> *ಈ ನೋಟ್ಬುಕ್‌ನಲ್ಲಿ, ನಾವು ವಿವಿಧ URLಗಳನ್ನು ಬಳಸಿ ಪ್ರಯೋಗ ಮಾಡಿದ್ದೇವೆ - ಯಂತ್ರ ಕಲಿಕೆಯ ವಿಕಿಪೀಡಿಯ ಲೇಖನ. ನೀವು ನೋಡಬಹುದು, ಡೇಟಾ ಸೈನ್ಸ್‌ನಿಂದ ಭಿನ್ನವಾಗಿ, ಈ ಲೇಖನದಲ್ಲಿ ಬಹಳಷ್ಟು ಪದಗಳಿವೆ, ಇದು ವಿಶ್ಲೇಷಣೆಯನ್ನು ಹೆಚ್ಚು ಸಂಕೀರ್ಣಗೊಳಿಸುತ್ತದೆ. ನಾವು ಕೀವರ್ಡ್ ಆಯ್ಕೆಮಾಡಿದ ನಂತರ ಡೇಟಾವನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸಲು ಒಂದು ವಿಭಿನ್ನ ವಿಧಾನವನ್ನು ಕಂಡುಹಿಡಿಯಬೇಕಾಗಿದೆ, ಅರ್ಥಪೂರ್ಣವಲ್ಲದ ಸಾಂದರ್ಭಿಕ ಪದ ಸಂಯೋಜನೆಗಳನ್ನು ತೆಗೆದುಹಾಕಲು.*\n",
"\n",
"ಈ ಉದಾಹರಣೆಯಲ್ಲಿ, ನಾವು ಸಾಂಪ್ರದಾಯಿಕ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆಯ ಎಲ್ಲಾ ಹಂತಗಳನ್ನು ಒಳಗೊಂಡ ಸರಳ ವ್ಯಾಯಾಮವನ್ನು ಮಾಡೋಣ. ನೀವು ಯಾವುದೇ ಕೋಡ್ ಬರೆಯಬೇಕಾಗಿಲ್ಲ, ಕೆಳಗಿನ ಸೆಲ್‌ಗಳನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಅವುಗಳನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಿ ಫಲಿತಾಂಶವನ್ನು ಗಮನಿಸಬಹುದು. ಸವಾಲಾಗಿ, ನೀವು ಈ ಕೋಡ್ ಅನ್ನು ವಿಭಿನ್ನ ಡೇಟಾ ಜೊತೆ ಪ್ರಯತ್ನಿಸಲು ಪ್ರೋತ್ಸಾಹಿತರಾಗಿದ್ದೀರಿ.\n",
"ಈ ಉದಾಹರಣೆಯಲ್ಲಿ, ಪಾರಂಪರಿಕ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆಯ ಎಲ್ಲಾ ಹಂತಗಳನ್ನು ಒಳಗೊಂಡ ಸರಳ ವ್ಯಾಯಾಮವನ್ನು ಮಾಡೋಣ. ನೀವು ಯಾವುದೇ ಕೋಡ್ ಬರೆಯಬೇಕಾಗಿಲ್ಲ, ಕೆಳಗಿನ ಸೆಲ್‌ಗಳನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಅವುಗಳನ್ನು ನಿರ್ವಹಿಸಿ ಮತ್ತು ಫಲಿತಾಂಶವನ್ನು ಗಮನಿಸಿ. ಸವಾಲಾಗಿ, ನೀವು ವಿಭಿನ್ನ ಡೇಟಾ ಜೊತೆಗೆ ಈ ಕೋಡ್ ಅನ್ನು ಪ್ರಯತ್ನಿಸಲು ಪ್ರೇರಿತರಾಗಿದ್ದೀರಾ.\n",
"\n",
"## ಗುರಿ\n",
"\n",
"ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಸಂಬಂಧಿಸಿದ ವಿವಿಧ ಕಲ್ಪನೆಗಳನ್ನು ಚರ್ಚಿಸಿದ್ದೇವೆ. ಕೆಲವು **ಪಠ್ಯ ಗಣನೆ** ಮಾಡುವ ಮೂಲಕ ಇನ್ನಷ್ಟು ಸಂಬಂಧಿತ ಕಲ್ಪನೆಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಪ್ರಯತ್ನಿಸೋಣ. ನಾವು ಡೇಟಾ ಸೈನ್ಸ್ ಬಗ್ಗೆ ಪಠ್ಯವನ್ನು ತೆಗೆದು, ಅದರಿಂದ ಕೀವರ್ಡ್‌ಗಳನ್ನು ಹೊರತೆಗೆಯುತ್ತೇವೆ, ನಂತರ ಫಲಿತಾಂಶವನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತೇವೆ.\n",
"ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಸಂಬಂಧಿಸಿದ ವಿವಿಧ ತತ್ವಾಂಶಗಳನ್ನು ಚರ್ಚಿಸಿದ್ದೇವೆ. **ಪಠ್ಯ ಗಣನೆ** ಮಾಡುವ ಮೂಲಕ ಇನ್ನಷ್ಟು ಸಂಬಂಧಿತ ತತ್ವಾಂಶಗಳನ್ನು ಕಂಡುಹಿಡಿಯೋಣ. ನಾವು ಡೇಟಾ ಸೈನ್ಸ್ ಬಗ್ಗೆ ಪಠ್ಯವನ್ನು ತೆಗೆದು, ಅದರಿಂದ ಕೀವರ್ಡ್‌ಗಳನ್ನು ಹೊರತೆಗೆದು, ನಂತರ ಫಲಿತಾಂಶವನ್ನು ದೃಶ್ಯರೂಪದಲ್ಲಿ ತೋರಿಸುವ ಪ್ರಯತ್ನ ಮಾಡೋಣ.\n",
"\n",
"ಪಠ್ಯವಾಗಿ, ನಾನು ವಿಕಿಪೀಡಿಯಾದ ಡೇಟಾ ಸೈನ್ಸ್ ಪುಟವನ್ನು ಬಳಸುತ್ತೇನೆ:\n"
"ಪಠ್ಯವಾಗಿ, ನಾನು ವಿಕಿಪೀಡಿಯಾದ ಡೇಟಾ ಸೈನ್ಸ್ ಪುಟವನ್ನು ಬಳಸುವುದಾಗಿದೆ:\n"
],
"metadata": {}
},
@ -35,9 +35,9 @@
{
"cell_type": "markdown",
"source": [
"## ಹಂತ 1: ಡೇಟಾವನ್ನು ಪಡೆಯುವುದು\n",
"## ನೇಪಥ್ಯ 1: ಡೇಟಾ ಪಡೆಯುವುದು\n",
"\n",
"ಪ್ರತಿ ಡೇಟಾ ವಿಜ್ಞಾನ ಪ್ರಕ್ರಿಯೆಯ ಮೊದಲ ಹಂತವು ಡೇಟಾವನ್ನು ಪಡೆಯುವುದು. ಅದಕ್ಕಾಗಿ ನಾವು `requests` ಲೈಬ್ರರಿಯನ್ನು ಬಳಸಲಿದ್ದೇವೆ:\n"
"ಪ್ರತಿಯೊಬ್ಬ ಡೇಟಾ ವೈಜ್ಞಾನಿಕ ಪ್ರಕ್ರಿಯೆಯ ಮೊದಲ ಹೆಜ್ಜೆ ಡೇಟಾ ಪಡೆಯುವುದು. ನಾವು ಅದಕ್ಕಾಗಿ `requests` ಲೈಬ್ರರಿಯನ್ನು ಬಳಸುತ್ತೇವೆ:\n"
],
"metadata": {}
},
@ -69,45 +69,43 @@
{
"cell_type": "markdown",
"source": [
"## ಹಂತ 2: ಡೇಟಾವನ್ನು ಪರಿವರ್ತಿಸುವುದು\n",
"## ಹಂತ 2: ಡೇಟಾನದ ಪರಿವರ್ತನೆ\n",
"\n",
"ಮುಂದಿನ ಹಂತವು ಪ್ರಕ್ರಿಯೆಗೆ ಸೂಕ್ತವಾದ ರೂಪಕ್ಕೆ ಡೇಟಾವನ್ನು ಪರಿವರ್ತಿಸುವುದಾಗಿದೆ. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ಪುಟದಿಂದ HTML ಮೂಲ ಕೋಡ್ ಅನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡಿದ್ದೇವೆ, ಮತ್ತು ಅದನ್ನು ಸರಳ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸುವ ಅಗತ್ಯವಿದೆ.\n",
"ಮುಂದಿನ ಹಂತವಾಗಿ, ಡೇಟಾವನ್ನು ಪ್ರಕ್ರಿಯೆgeeಗೆ ಸೂಕ್ತವಾದ ರೂಪಕ್ಕೆ ಪರಿವರ್ತಿಸಬೇಕಾಗಿದೆ. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ಪುಟದಿಂದ HTML ಮೂಲ ಕೋಡ್ ಅನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡಿಕೊಂಡಿದ್ದೇವೆ ಮತ್ತು ಅದನ್ನು ಸರಳ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸಬೇಕಾಗಿದೆ.\n",
"\n",
"ಇದನ್ನು ಮಾಡಲು ಹಲವಾರು ವಿಧಾನಗಳಿವೆ. ನಾವು ಪೈಥಾನ್‌ನ ಸರಳವಾದ ನಿರ್ಮಿತ [HTMLParser](https://docs.python.org/3/library/html.parser.html) ವಸ್ತುವನ್ನು ಬಳಸಲಿದ್ದೇವೆ. ನಾವು `HTMLParser` ವರ್ಗವನ್ನು ಉಪವರ್ಗಗೊಳಿಸಿ, `<script>` ಮತ್ತು `<style>` ಟ್ಯಾಗ್‌ಗಳನ್ನು ಹೊರತುಪಡಿಸಿ HTML ಟ್ಯಾಗ್‌ಗಳ ಒಳಗಿನ ಎಲ್ಲಾ ಪಠ್ಯವನ್ನು ಸಂಗ್ರಹಿಸುವ ಕೋಡ್ ಅನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಬೇಕಾಗುತ್ತದೆ.\n"
"ಇದನ್ನು ಮಾಡಲು ಅನೇಕ ವಿಧಾನಗಳಿವೆ. ನಾವು [BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/) ಅನ್ನು ఉపయోగಿಸುತ್ತೇವೆ, ಇದು HTML ಪಾರ್ಸಿಂಗ್ ಗೆ ಜನಪ್ರಿಯ ಪೈಥಾನ್ ಲೈಬ್ರರಿ. BeautifulSoup ನಮಗೆ ನಿರ್ದಿಷ್ಟ HTML ಅಂಶಗಳನ್ನು ಗುರಿಯಾಗಿಸಲು ಅವಕಾಶ ನೀಡುತ್ತದೆ, ಆದ್ದರಿಂದ ನಾವು ವಿಕಿಪೀಡಿಯಾದ ಮುಖ್ಯ ಲೇಖನ ವಿಷಯದ ಮೇಲೆ ಗಮನಹರಿಸಲು ಮತ್ತು ಕೆಲವು ನ್ಯಾವಿಗೇಶನ್ ಮೆನುಗಳು, ಬದಿಯ ಪಟ್ಟಿ, ಫೂಟರ್‌ಗಳು ಮತ್ತು ಇತರ ಅನಯೋಗ್ಯ ವಿಷಯಗಳನ್ನು ಕಡಿಮೆ ಮಾಡಬಹುದು (ನನ್ನಿಂದ ಕೇವಲ ಬೋಯ್ಲರ್ಪೇಪರ್ ಪಠ್ಯ ಕೆಲವು ಉಳಿದಿರಬಹುದು).\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"ಮೊದಲು, ನಮಗೆ HTML ಪಾರ್ಸಿಂಗ್‌ಗಾಗಿ BeautifulSoup ಗ್ರಂಥಾಲಯವನ್ನು ಸ್ಥಾಪಿಸಬೇಕಾಗಿದೆ:\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"import sys\r\n",
"!{sys.executable} -m pip install beautifulsoup4"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 4,
"source": [
"from html.parser import HTMLParser\r\n",
"\r\n",
"class MyHTMLParser(HTMLParser):\r\n",
" script = False\r\n",
" res = \"\"\r\n",
" def handle_starttag(self, tag, attrs):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = True\r\n",
" def handle_endtag(self, tag):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = False\r\n",
" def handle_data(self, data):\r\n",
" if str.strip(data)==\"\" or self.script:\r\n",
" return\r\n",
" self.res += ' '+data.replace('[ edit ]','')\r\n",
"\r\n",
"parser = MyHTMLParser()\r\n",
"parser.feed(text)\r\n",
"text = parser.res\r\n",
"print(text[:1000])"
"from bs4 import BeautifulSoup\r\n\r\n# Parse the HTML content\r\nsoup = BeautifulSoup(text, 'html.parser')\r\n\r\n# Extract only the main article content from Wikipedia\r\n# Wikipedia uses 'mw-parser-output' class for the main article content\r\ncontent = soup.find('div', class_='mw-parser-output')\r\n\r\ndef clean_wikipedia_content(content_node):\r\n \"\"\"Remove common non-article elements from a Wikipedia content node.\"\"\"\r\n # Strip jump links, navboxes, reference lists/superscripts, edit sections, TOC, sidebars, etc.\r\n selectors = [\r\n '.mw-jump-link',\r\n '.navbox',\r\n '.reflist',\r\n 'sup.reference',\r\n '.mw-editsection',\r\n '.hatnote',\r\n '.metadata',\r\n '.infobox',\r\n '#toc',\r\n '.toc',\r\n '.sidebar',\r\n ]\r\n for selector in selectors:\r\n for el in content_node.select(selector):\r\n el.decompose()\r\n\r\nif content:\r\n # Clean the content node to better approximate article text only.\r\n clean_wikipedia_content(content)\r\n text = content.get_text(separator=' ', strip=True)\r\n print(text[:1000])\r\nelse:\r\n print(\"Could not find main content. Using full page text.\")\r\n text = soup.get_text(separator=' ', strip=True)\r\n print(text[:1000])"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" Machine learning - Wikipedia Machine learning From Wikipedia, the free encyclopedia Jump to navigation Jump to search Study of algorithms that improve automatically through experience For the journal, see Machine Learning (journal) . \"Statistical learning\" redirects here. For statistical learning in linguistics, see statistical learning in language acquisition . Part of a series on Artificial intelligence Major goals Artificial general intelligence Planning Computer vision General game playing Knowledge reasoning Machine learning Natural language processing Robotics Approaches Symbolic Deep learning Bayesian networks Evolutionary algorithms Philosophy Ethics Existential risk Turing test Chinese room Control problem Friendly AI History Timeline Progress AI winter Technology Applications Projects Programming languages Glossary Glossary v t e Part of a series on Machine learning and data mining Problems Classification Clustering Regression Anomaly detection Data Cleaning AutoML Associ\n"
"Machine learning From Wikipedia, the free encyclopedia Study of algorithms that improve automatically through experience Machine learning (ML) is a field of study in artificial intelligence concerned with the development and study of statistical algorithms that can learn from data and generalize to unseen data, and thus perform tasks without explicit instructions. Recently, artificial neural networks have been able to surpass many previous approaches in performance. ML finds application in many fields, including natural language processing, computer vision, speech recognition, email filtering, agriculture, and medicine.\n"
]
}
],
@ -116,11 +114,11 @@
{
"cell_type": "markdown",
"source": [
"## Step 3: ಒಳನೋಟಗಳನ್ನು ಪಡೆಯುವುದು\n",
"## ಹಂತ 3: ಒಳನೋಟಗಳನ್ನು ಪಡೆಯುವುದು\n",
"\n",
"ಅತ್ಯಂತ ಪ್ರಮುಖವಾದ ಹಂತವೆಂದರೆ ನಮ್ಮ ಡೇಟಾವನ್ನು ನಾವು ಒಳನೋಟಗಳನ್ನು ಪಡೆಯಲು ಸಾಧ್ಯವಾಗುವ ರೂಪಕ್ಕೆ ಪರಿವರ್ತಿಸುವುದು. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ಪಠ್ಯದಿಂದ ಕೀವರ್ಡ್‌ಗಳನ್ನು ಹೊರತೆಗೆಯಲು ಬಯಸುತ್ತೇವೆ ಮತ್ತು ಯಾವ ಕೀವರ್ಡ್‌ಗಳು ಹೆಚ್ಚು ಅರ್ಥಪೂರ್ಣವಾಗಿವೆ ಎಂದು ನೋಡುತ್ತೇವೆ.\n",
"ಇಲ್ಲಿ ಅತ್ಯಂತ ಮುಖ್ಯವಾದ ಹಂತವೆಂದರೆ ನಮ್ಮ ಡೇಟಾವನ್ನು ಒಳನೋಟಗಳನ್ನು ಪಡೆದುಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಗುವ ರೀತಿಗೆ ಪರಿವರ್ತಿಸುವುದು. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ಪಠ್ಯದಿಂದ ಕೀಪರ್ವ್ಬದಗಳನ್ನು ತೆಗೆದುಹಾಕಲು ಬಯಸುತ್ತೇವೆ, ಮತ್ತು ಯಾವ ಕೀಪರ್ವ್ಬದಗಳು ಹೆಚ್ಚು ಅರ್ಥಪೂರ್ಣತೆ ಹೊಂದಿವೆ ಎಂಬುದನ್ನು ನೋಡಬೇಕು.\n",
"\n",
"ಕೀವರ್ಡ್ ಹೊರತೆಗೆಯಲು ನಾವು Python ಗ್ರಂಥಾಲಯವಾದ [RAKE](https://github.com/aneesha/RAKE) ಅನ್ನು ಬಳಸಲಿದ್ದೇವೆ. ಮೊದಲು, ಈ ಗ್ರಂಥಾಲಯವು ಲಭ್ಯವಿಲ್ಲದಿದ್ದರೆ ಅದನ್ನು ಸ್ಥಾಪಿಸೋಣ:\n"
"ಕೀಪರ್ವ್ಬದಗಳನ್ನು ತೆಗೆದುಹಾಕಲು ನಾವು Python ಲೈಬ್ರರಿ [RAKE](https://github.com/aneesha/RAKE) ಅನ್ನು ಬಳಸಲಿದ್ದೇವೆ. ಮೊದಲು, ಈ ಲೈಬ್ರರಿ ಇರುತ್ತದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ, ಇಲ್ಲದಿದ್ದರೆ ಅದನ್ನು ಸ್ಥಾಪಿಸೋಣ:\n"
],
"metadata": {}
},
@ -172,7 +170,7 @@
{
"cell_type": "markdown",
"source": [
"ಮುಖ್ಯ ಕಾರ್ಯಕ್ಷಮತೆ `Rake` ವಸ್ತುವಿನಿಂದ ಲಭ್ಯವಿದ್ದು, ನಾವು ಕೆಲವು ಪ್ಯಾರಾಮೀಟರ್‌ಗಳನ್ನು ಬಳಸಿ ಅದನ್ನು ಕಸ್ಟಮೈಸ್ ಮಾಡಬಹುದು. ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ಕೀವರ್ಡ್‌ನ ಕನಿಷ್ಠ ಉದ್ದವನ್ನು 5 ಅಕ್ಷರಗಳಾಗಿರಿಸಲು, ಡಾಕ್ಯುಮೆಂಟ್‌ನಲ್ಲಿ ಕೀವರ್ಡ್‌ನ ಕನಿಷ್ಠ ಆವರ್ತನೆಯನ್ನು 3 ಆಗಿರಿಸಲು, ಮತ್ತು ಕೀವರ್ಡ್‌ನಲ್ಲಿ ಗರಿಷ್ಠ ಪದಗಳ ಸಂಖ್ಯೆಯನ್ನು 2 ಆಗಿರಿಸಲು ಹೊಂದಿಸುವೆವು. ಇತರ ಮೌಲ್ಯಗಳೊಂದಿಗೆ ಆಟವಾಡಿ ಫಲಿತಾಂಶವನ್ನು ಗಮನಿಸಲು ಮುಕ್ತವಾಗಿರಿ.\n"
"ಪ್ರಮುಖ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು `Rake` ವಸ್ತುಗಳಿಂದ ಲಭ್ಯವಿದೆ, ಅದನ್ನು ನಾವು ಕೆಲವು ನಿಯಮಗಳನ್ನು ಉಪಯೋಗಿಸಿ ಕಸ್ಟಮೈಜ್ ಮಾಡಬಹುದು. ನಮ್ಮ ಘಟಕದಲ್ಲಿ, ನಾವು ಕೀವರ್ಡ್‌ಗಳ ಕನಿಷ್ಠ ನಿಗದಿ ಚಿಹ್ನೆಗಳ ಸಂಖ್ಯೆಯನ್ನು 5, ಡಾಕ್ಯುಮೆಂಟ್‌ನಲ್ಲಿ ಕೀವರ್ಡ್‌ನ ಕನಿಷ್ಠ ಪ್ರಾಮಾಣಿಕತೆಯನ್ನು 3, ಮತ್ತು ಕೀವರ್ಡ್‌ನಲ್ಲಿ ಗರಿಷ್ಠ ಪದಗಳ ಸಂಖ್ಯೆಯನ್ನು 2 ಎಂದು 세ಟ್ ಮಾಡುತ್ತೇವೆ. ಇತರ ಮೌಲ್ಯಗಳೊಂದಿಗೆ ಆಟವಾಡಲು ಹಾಗೂ ಫಲಿತಾಂಶವನ್ನು ಗಮನಿಸಲು ಮುಕ್ತವಾಗಿ ಪ್ಯತ್ನಿಸಿ.\n"
],
"metadata": {}
},
@ -353,11 +351,11 @@
{
"cell_type": "markdown",
"source": [
"ನಾವು ಸಂಬಂಧಿತ ಮಹತ್ವದ ಡಿಗ್ರಿಯೊಂದಿಗೆ ಪದಗಳ ಪಟ್ಟಿಯನ್ನು ಪಡೆದಿದ್ದೇವೆ. ನೀವು ನೋಡಬಹುದು, ಯಂತ್ರ ಅಧ್ಯಯನ ಮತ್ತು ದೊಡ್ಡ ಡೇಟಾ ಮುಂತಾದ ಅತ್ಯಂತ ಸಂಬಂಧಿತ ಶಾಖೆಗಳು ಪಟ್ಟಿಯ ಮೇಲ್ಭಾಗದಲ್ಲಿ ಇದ್ದವೆ.\n",
"ನಾವು ಮಹತ್ವದ ಡಿಗ್ರಿಯೊಂದಿಗೆ ಸಂಗೀತ ಪದಗಳ ಪಟ್ಟಿ ಪಡೆದಿದ್ದೇವೆ. ನೀವು ನೋಡಬಹುದು, ಯಂತ್ರ ಅಧ್ಯಯನ ಮತ್ತು ದೊಡ್ಡ ಡೇಟಾ ಮುಂತಾದ ಅತ್ಯಂತ ಪ್ರಾಸಂಗಿಕ ಶಿಸ್ತಿಗಳು ಪಟ್ಟಿಯ ಮೇಲ್ಭಾಗದ ಸ್ಥಾನಗಳಲ್ಲಿ ಇದ್ದಾರೆ.\n",
"\n",
"## ಹಂತ 4: ಫಲಿತಾಂಶವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು\n",
"\n",
"ಜನರು ಡೇಟಾವನ್ನು ದೃಶ್ಯ ರೂಪದಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದು. ಆದ್ದರಿಂದ ಕೆಲವು洞察ಗಳನ್ನು ಪಡೆಯಲು ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು ಅರ್ಥಪೂರ್ಣವಾಗುತ್ತದೆ. ನಾವು ಪೈಥಾನ್‌ನಲ್ಲಿ `matplotlib` ಗ್ರಂಥಾಲಯವನ್ನು ಬಳಸಿಕೊಂಡು ಕೀವರ್ಡ್‌ಗಳ ಸರಳ ವಿತರಣೆ ಮತ್ತು ಅವುಗಳ ಸಂಬಂಧವನ್ನು ಚಿತ್ರಿಸಬಹುದು:\n"
"ಜನರು ದೃಶ್ಯರೂಪದಲ್ಲಿ ಡೇಟಾವನ್ನು ಅತ್ಯಧಿಕವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದು. ಆದ್ದರಿಂದ ಕೆಲವು ತತ್ವಾಂಶಗಳನ್ನು ಕಾಣುವ ಸಲುವಾಗಿ ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು ಅನೇಕ ಸಮಯದಲ್ಲಿ ಬುದ್ಧಿವಂತಿಕೆಯಾಗಿದೆ. `matplotlib` ಗ್ರಂಥಾಲಯವನ್ನು ಪೈಥಾನ್‌ನಲ್ಲಿ ಉಪಯೋಗಿಸಿ ಕೀವರ್ಡ್‌ಗಳ ಸರಳ ವಿತರಣೆಯನ್ನು ಅವರ ಪ್ರಾಸಂಗಿಕತೆಯೊಂದಿಗೆ ಚಿತ್ರಿಸಲು ಸಾಧ್ಯ:\n"
],
"metadata": {}
},
@ -392,7 +390,7 @@
{
"cell_type": "markdown",
"source": [
"ಆದರೆ, ಪದಗಳ ಆವರ್ತನೆಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಇನ್ನೂ ಉತ್ತಮ ವಿಧಾನವಿದೆ - **ವರ್ಡ್ ಕ್ಲೌಡ್** ಬಳಸಿ. ನಮ್ಮ ಕೀವರ್ಡ್ ಪಟ್ಟಿಯಿಂದ ವರ್ಡ್ ಕ್ಲೌಡ್ ಅನ್ನು ರೇಖಾಚಿತ್ರಗೊಳಿಸಲು ಮತ್ತೊಂದು ಲೈಬ್ರರಿಯನ್ನು ಸ್ಥಾಪಿಸಬೇಕಾಗುತ್ತದೆ.\n"
"ಆದರೆ, ಪದಗಳ ಆವರ್ತನೆಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಇನ್ನೂ ಉತ್ತಮ ವಿಧಾನವಿದೆ - **ಪದ ಮেঘ** ಬಳಸಿ. ನಮ್ಮ ಕೀವರ್ಡ್ ಪಟ್ಟಿ ಇಂದ ಪದ ಮಘವನ್ನು ರೇಖೆಗೊಳಿಸಲು ಮತ್ತೊಂದು ಗ್ರಂಥಾಲಯವನ್ನು ಸ್ಥಾಪಿಸಬೇಕಾಗುತ್ತದೆ.\n"
],
"metadata": {}
},
@ -408,7 +406,7 @@
{
"cell_type": "markdown",
"source": [
"`WordCloud` ವಸ್ತು ಮೂಲ ಪಠ್ಯವನ್ನು ಅಥವಾ ಪದಗಳ ಮತ್ತು ಅವುಗಳ ಆವರ್ತನೆಗಳ ಪೂರ್ವ-ಗಣಿತ ಪಟ್ಟಿಯನ್ನು ಸ್ವೀಕರಿಸುವ ಜವಾಬ್ದಾರಿಯಿದೆ, ಮತ್ತು ನಂತರ `matplotlib` ಬಳಸಿ ಪ್ರದರ್ಶಿಸಬಹುದಾದ ಚಿತ್ರವನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ:\n"
"`WordCloud` ವಸ್ತು ಮೂಲ ಪಠ್ಯವನ್ನು ಅಥವಾ ಪದಗಳ ಮತ್ತು ಅವುಗಳ ಸಂಖ್ಯೆಗಳ ಪೂರ್ವಗಣಿತ ಪಟ್ಟಿ ತೆಗೆದುಕೊಳ್ಳಲು ಜವಾಬ್ದಾರಿಯುತವಾಗಿದೆ, ಮತ್ತು ಒಂದು ಚಿತ್ರವನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ, ಅದನ್ನು ನಂತರ `matplotlib` ಬಳಸಿ ತೋರಿಸಬಹುದು:\n"
],
"metadata": {}
},
@ -441,7 +439,7 @@
{
"cell_type": "markdown",
"source": [
"ನಾವು ಮೂಲ ಪಠ್ಯವನ್ನು `WordCloud` ಗೆ ಕೂಡಾ ಪಾಸ್ ಮಾಡಬಹುದು - ನಾವು ಸಮಾನ ಫಲಿತಾಂಶವನ್ನು ಪಡೆಯಲು ಸಾಧ್ಯವಾಗುತ್ತದೆಯೇ ನೋಡೋಣ:\n"
"ನಾವು ಮೂಲ ಪಠ್ಯವನ್ನು `WordCloud` ಗೆ ಕೂಡ ನೀಡಬಹುದು - ನಾವು ಸಮಾನ ಫಲಿತಾಂಶವನ್ನು ಪಡೆಯಲು ಸಾಧ್ಯವಾಗುತ್ತದೆಯೇ ನೋಡೋಣ:\n"
],
"metadata": {}
},
@ -490,11 +488,11 @@
{
"cell_type": "markdown",
"source": [
"ನೀವು ಈಗಾಗಲೇ ನೋಡಬಹುದು, ಪದ ಮೋಡವು ಈಗ ಹೆಚ್ಚು ಪ್ರಭಾವಶಾಲಿಯಾಗಿ ಕಾಣುತ್ತದೆ, ಆದರೆ ಇದರಲ್ಲಿ ಬಹಳಷ್ಟು ಶಬ್ದಮಾಲೆಗಳು (ಉದಾ. `Retrieved on` ಎಂಬ ಸಂಬಂಧವಿಲ್ಲದ ಪದಗಳು) ಕೂಡ ಸೇರಿವೆ. ಜೊತೆಗೆ, ಎರಡು ಪದಗಳಿಂದ ಕೂಡಿದ ಕೀವರ್ಡ್‌ಗಳು, ಉದಾಹರಣೆಗೆ *data scientist*, ಅಥವಾ *computer science* ಕಡಿಮೆ ಸಿಗುತ್ತವೆ. ಇದಕ್ಕೆ ಕಾರಣ RAKE ಆಲ್ಗೋರಿದಮ್ ಪಠ್ಯದಿಂದ ಉತ್ತಮ ಕೀವರ್ಡ್‌ಗಳನ್ನು ಆಯ್ಕೆಮಾಡುವಲ್ಲಿ ಉತ್ತಮ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಈ ಉದಾಹರಣೆ ಡೇಟಾ ಪೂರ್ವ-ಪ್ರಕ್ರಿಯೆ ಮತ್ತು ಶುದ್ಧೀಕರಣದ ಮಹತ್ವವನ್ನು ತೋರಿಸುತ್ತದೆ, ಏಕೆಂದರೆ ಕೊನೆಯಲ್ಲಿ ಸ್ಪಷ್ಟ ಚಿತ್ರ ನಮಗೆ ಉತ್ತಮ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.\n",
"ನೀವು ಈಗಾಗಲೇ ನೋಡಬಹುದು, ಪದ ಮೋಡವು ಇನ್ನಷ್ಟು ಗಂಭೀರವಾಗಿ ಕಾಣುತ್ತದೆ, ಆದರೆ ಅದು ಬಹಳಷ್ಟು ಶಬ್ದಶಬ್ದವನ್ನು ಹೊಂದಿದೆ (ಉದಾ. ಸಂಬಂಧವಿಲ್ಲದ ಪದಗಳು ಹೆಸರಾಗಿ `Retrieved on`). ಜೊತೆಗೆ, ನಾವು ಎರಡು ಪದಗಳಾದ ನಿವು ಪದಗಳ (ಕೀವುಪದಗಳು) ಕಡಿಮೆ ಪಡೆಯುತ್ತೇವೆ, ಉದಾ. *ಡೇಟಾ ಸೈಂಟಿಸ್ಟ್*, ಅಥವಾ *ಕಂಪ್ಯೂಟರ್ ಸೈನ್ಸ್*. ಇದಕ್ಕೆ ಕಾರಣ RAKE ಅಲ್ಗೋರಿದಮ್ ಪಠ್ಯದಿಂದ ಉತ್ತಮ ಕೀವರ್ಡ್ಗಳನ್ನು ಆರಿಸುವಲ್ಲಿ ಉತ್ತಮ ಕೆಲಸ ಮಾಡುತ್ತದೆ. ಈ ಉದಾಹರಣೆ ಡೇಟಾ ಮುಂಚಿತ ಸಂಸ್ಕರಣೆ ಮತ್ತು ಶುಚಿಗೊಳಿಸುವಿಕೆಯ ಮಹತ್ವವನ್ನು ವಿವರಿಸುತ್ತದೆ, ಏಕೆಂದರೆ ಸ್ಪಷ್ಟ ಚಿತ್ರ ತೆಗೆಯುವುದು ನಮಗೆ ಉತ್ತಮ ನಿರ್ಧಾರಗಳನ್ನು ಮಾಡಲು ಅನುಮತಿಸುತ್ತದೆ.\n",
"\n",
"ಈ ವ್ಯಾಯಾಮದಲ್ಲಿ ನಾವು ವಿಕಿಪೀಡಿಯಾ ಪಠ್ಯದಿಂದ ಕೆಲವು ಅರ್ಥಗಳನ್ನು ಕೀವರ್ಡ್‌ಗಳು ಮತ್ತು ಪದ ಮೋಡದ ರೂಪದಲ್ಲಿ ಹೊರತೆಗೆಯುವ ಸರಳ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಅನುಸರಿಸಿದ್ದೇವೆ. ಈ ಉದಾಹರಣೆ ಬಹಳ ಸರಳವಾಗಿದೆ, ಆದರೆ ಡೇಟಾ ವಿಜ್ಞಾನಿ ಡೇಟಾ ಸಂಗ್ರಹಣೆಯಿಂದ ಪ್ರಾರಂಭಿಸಿ ದೃಶ್ಯೀಕರಣದವರೆಗೆ ಕೆಲಸ ಮಾಡುವಾಗ ತೆಗೆದುಕೊಳ್ಳುವ ಎಲ್ಲಾ ಸಾಮಾನ್ಯ ಹಂತಗಳನ್ನು ಚೆನ್ನಾಗಿ ತೋರಿಸುತ್ತದೆ.\n",
"ಈ ಅಭ್ಯಾಸದಲ್ಲಿ ನಾವು ವಿಕಿಪೀಡಿಯಾ ಪಠ್ಯದಿಂದ ಕೆಲವು ಅರ್ಥವನ್ನು ಪಡೆದುಕೊಳ್ಳುವ ಸರಳ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನಡೆಸಿದ್ದೇವೆ, ಅದು ಕೀವರ್ಡ್ಗಳು ಮತ್ತು ಪದ ಮೋಡ ರೂಪದಲ್ಲಿ ಇದೆ. ಈ ಉದಾಹರಣೆ ಬಹಳ ಸರಳವಾಗಿದೆ, ಆದರೆ यह ಎಲ್ಲಾ ಸಾಮಾನ್ಯ ಹಂತಗಳನ್ನು ಒಳ್ಳೆಯದಾಗಿ ಪ್ರದರ್ಶಿಸುತ್ತದೆ, ಡೇಟಾ ಸೈನ್ಟಿಸ್ಟ್ ಡೇಟಾ ಸಂಗ್ರಹಣೆ, ಪ್ರಾರಂಭದಿಂದ ಜಾರಿಗೆ ಬರುತ್ತದೆ, ಮುಂದುವರೆದು ದೃಶ್ಯೀಕರಣದವರೆಗೆ.\n",
"\n",
"ನಮ್ಮ ಕೋರ್ಸ್‌ನಲ್ಲಿ ನಾವು ಆ ಎಲ್ಲಾ ಹಂತಗಳನ್ನು ವಿವರವಾಗಿ ಚರ್ಚಿಸುವೆವು.\n"
"ನಮ್ಮ ಕೋರ್ಸ್‌ನಲ್ಲಿ ನಾವು ಆ ಹಂತಗಳನ್ನೆಲ್ಲ ವಿವರವಾಗಿ ಚರ್ಚಿಸುವಾಗುತ್ತದೆ.\n"
],
"metadata": {}
},
@ -502,7 +500,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ಅಸ್ವೀಕರಣ**: \nಈ ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**ರಿದ್ಯಾಪತ್ರಿಕೆ**: \nಈ ಡೊಕ್ಯುಮೆಂಟ್ ಅನ್ನು AI ಅನುವಾದ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಅನುವದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಗಾಗಿ ಪ್ರಯತ್ನಿಸುವವರಾಗಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ಗಮನದಲ್ಲಿರಲಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿ ಇರುವ ಮೂಲ ಡೊಕ್ಯುಮೆಂಟ್ ಅನ್ನು ಅಧಿಕೃತವಾದ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ತಿಳುವಳಿಕೆಗಳು ಅಥವಾ ಅರ್ಥಗರ್ಭಿತತೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಲ್ಲ.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
@ -526,12 +524,6 @@
},
"interpreter": {
"hash": "86193a1ab0ba47eac1c69c1756090baa3b420b3eea7d4aafab8b85f8b312f0c5"
},
"coopTranslator": {
"original_hash": "dbdf34788efab64e5d817f1df38965a8",
"translation_date": "2025-12-19T17:08:04+00:00",
"source_file": "1-Introduction/01-defining-data-science/solution/notebook.ipynb",
"language_code": "kn"
}
},
"nbformat": 4,

@ -6,7 +6,7 @@
ಅಂಕಿಅಂಶಗಳು ಮತ್ತು ಸಂಭವನೀಯತೆ ಸಿದ್ಧಾಂತಗಳು ಗಣಿತದ ಎರಡು ಅತ್ಯಂತ ಸಂಬಂಧಿತ ಕ್ಷೇತ್ರಗಳು, ಮತ್ತು ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಬಹಳ ಪ್ರಾಸಂಗಿಕವಾಗಿವೆ. ಗಣಿತದ ಆಳವಾದ ಜ್ಞಾನವಿಲ್ಲದೆ ಡೇಟಾ ಜೊತೆ ಕಾರ್ಯನಿರ್ವಹಿಸುವುದು ಸಾಧ್ಯವಿದ್ದರೂ, ಕನಿಷ್ಠ ಕೆಲವು ಮೂಲಭೂತ ತತ್ವಗಳನ್ನು ತಿಳಿದುಕೊಳ್ಳುವುದು ಉತ್ತಮ. ಇಲ್ಲಿ ನಾವು ಪ್ರಾರಂಭಿಸಲು ಸಹಾಯ ಮಾಡುವ ಸಂಕ್ಷಿಪ್ತ ಪರಿಚಯವನ್ನು ನೀಡುತ್ತೇವೆ.
[![ಪರಿಚಯ ವೀಡಿಯೋ](../../../../translated_images/kn/video-prob-and-stats.e4282e5efa2f2543400843ed98b1057065c9600cebfc8a728e8931b5702b2ae4.png)](https://youtu.be/Z5Zy85g4Yjw)
[![ಪರಿಚಯ ವೀಡಿಯೋ](../../../../translated_images/kn/video-prob-and-stats.e4282e5efa2f2543.webp)](https://youtu.be/Z5Zy85g4Yjw)
## [ಪೂರ್ವ-ವ್ಯಾಖ್ಯಾನ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/6)
@ -31,7 +31,7 @@
ನಾವು ಮಾತ್ರ ಒಂದು ಮೌಲ್ಯ ಶ್ರೇಣಿಯಲ್ಲಿ ಬರುವ ಸಾಧ್ಯತೆಯ ಬಗ್ಗೆ ಮಾತನಾಡಬಹುದು, ಉದಾ. P(t<sub>1</sub>&le;X&lt;t<sub>2</sub>). ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಸಂಭವನೀಯತೆ ವಿತರಣೆಯನ್ನು **ಸಂಭವನೀಯತೆ ಸಾಂದ್ರತೆ ಕಾರ್ಯ** p(x) ಮೂಲಕ ವಿವರಿಸಲಾಗುತ್ತದೆ, ಹಾಗಾಗಿ
![P(t_1\le X<t_2)=\int_{t_1}^{t_2}p(x)dx](../../../../translated_images/kn/probability-density.a8aad29f17a14afb519b407c7b6edeb9f3f9aa5f69c9e6d9445f604e5f8a2bf7.png)
![P(t_1\le X<t_2)=\int_{t_1}^{t_2}p(x)dx](../../../../translated_images/kn/probability-density.a8aad29f17a14afb.webp)
ಸಮಾನ ವಿತರಣೆಯ ನಿರಂತರ ಸಮಾನಾರ್ಥಕವನ್ನು **ನಿರಂತರ ಸಮಾನ ವಿತರಣೆ** ಎಂದು ಕರೆಯುತ್ತಾರೆ, ಇದು ಸೀಮಿತ ಶ್ರೇಣಿಯಲ್ಲಿ ವ್ಯಾಖ್ಯಾನಿಸಲಾಗುತ್ತದೆ. ಮೌಲ್ಯ X ಒಂದು l ಉದ್ದದ ಶ್ರೇಣಿಯಲ್ಲಿ ಬರುವ ಸಾಧ್ಯತೆ l ಗೆ ಅನುಪಾತಿಕವಾಗಿದ್ದು, 1 ರವರೆಗೆ ಏರುತ್ತದೆ.
@ -56,7 +56,7 @@
ಗ್ರಾಫಿಕಲ್ ಆಗಿ, ಮಧ್ಯಮ ಮತ್ತು ಚತುರ್ಥಾಂಶಗಳ ಸಂಬಂಧವನ್ನು **ಬಾಕ್ಸ್ ಪ್ಲಾಟ್** ಎಂಬ ಚಿತ್ರದಲ್ಲಿ ಪ್ರತಿನಿಧಿಸಬಹುದು:
<img src="../../../../translated_images/kn/boxplot_explanation.4039b7de08780fd493ef798b41f7291d753f1f84de8955645f00c586e65f16a3.png" alt="ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ ವಿವರಣೆ" width="50%">
<img src="../../../../translated_images/kn/boxplot_explanation.4039b7de08780fd4.webp" alt="ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ ವಿವರಣೆ" width="50%">
ಇಲ್ಲಿ ನಾವು **ಅಂತರ-ಚತುರ್ಥಾಂಶ ವ್ಯಾಪ್ತಿ** IQR=Q3-Q1 ಅನ್ನು ಲೆಕ್ಕಿಸುತ್ತೇವೆ, ಮತ್ತು **ಔಟ್‌ಲೈಯರ್‌ಗಳು** - [Q1-1.5*IQR, Q3+1.5*IQR] ಗಡಿಗಳ ಹೊರಗಿನ ಮೌಲ್ಯಗಳು.
@ -74,11 +74,11 @@
ಇದು ನಮ್ಮ ಡೇಟಾದ ಸರಾಸರಿ, ಮಧ್ಯಮ ಮತ್ತು ಚತುರ್ಥಾಂಶಗಳನ್ನು ತೋರಿಸುವ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್:
![ತೂಕ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್](../../../../translated_images/kn/weight-boxplot.1dbab1c03af26f8a008fff4e17680082c8ab147d6df646cbac440bbf8f5b9c42.png)
![ತೂಕ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್](../../../../translated_images/kn/weight-boxplot.1dbab1c03af26f8a.webp)
ನಮ್ಮ ಡೇಟಾ ವಿಭಿನ್ನ ಆಟಗಾರರ **ಪಾತ್ರಗಳು** ಬಗ್ಗೆ ಮಾಹಿತಿಯನ್ನು ಹೊಂದಿರುವುದರಿಂದ, ನಾವು ಪಾತ್ರದ ಪ್ರಕಾರ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ ಮಾಡಬಹುದು - ಇದು ಪಾತ್ರಗಳ ನಡುವೆ ಪರಿಮಾಣ ಮೌಲ್ಯಗಳು ಹೇಗೆ ಭಿನ್ನವಾಗಿವೆ ಎಂಬುದರ ಕಲ್ಪನೆ ನೀಡುತ್ತದೆ. ಈ ಬಾರಿ ನಾವು ಎತ್ತರವನ್ನು ಪರಿಗಣಿಸುವೆವು:
![ಪಾತ್ರದ ಪ್ರಕಾರ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್](../../../../translated_images/kn/boxplot_byrole.036b27a1c3f52d42f66fba2324ec5cde0a1bca6a01a619eeb0ce7cd054b2527b.png)
![ಪಾತ್ರದ ಪ್ರಕಾರ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್](../../../../translated_images/kn/boxplot_byrole.036b27a1c3f52d42.webp)
ಈ ಚಿತ್ರಣವು ಸೂಚಿಸುತ್ತದೆ, ಸರಾಸರಿಯಾಗಿ, ಮೊದಲ ಬ್ಯಾಟ್ಸ್‌ಮನ್‌ಗಳ ಎತ್ತರ ಎರಡನೇ ಬ್ಯಾಟ್ಸ್‌ಮನ್‌ಗಳ ಎತ್ತರಕ್ಕಿಂತ ಹೆಚ್ಚು. ಈ ಪಾಠದ ನಂತರ ನಾವು ಈ ಊಹೆಯನ್ನು ಅಧಿಕೃತವಾಗಿ ಪರೀಕ್ಷಿಸುವುದು ಹೇಗೆ ಮತ್ತು ನಮ್ಮ ಡೇಟಾ ಅಂಕಿಅಂಶವಾಗಿ ಮಹತ್ವಪೂರ್ಣವಾಗಿದೆ ಎಂದು ತೋರಿಸುವುದು ಹೇಗೆ ಎಂಬುದನ್ನು ಕಲಿಯುತ್ತೇವೆ.
@ -86,7 +86,7 @@
ನಮ್ಮ ಡೇಟಾದ ವಿತರಣೆಯನ್ನು ನೋಡಲು, ನಾವು **ಹಿಸ್ಟೋಗ್ರಾಮ್** ಎಂಬ ಗ್ರಾಫ್ ಅನ್ನು ರಚಿಸಬಹುದು. X-ಅಕ್ಷದಲ್ಲಿ ವಿವಿಧ ತೂಕ ಶ್ರೇಣಿಗಳು (ಅಥವಾ **ಬಿನ್‌ಗಳು**) ಇರುತ್ತವೆ, ಮತ್ತು ಲಂಬ ಅಕ್ಷವು ನಮ್ಮ ಯಾದೃಚ್ಛಿಕ ಚರ ಮಾದರಿ ನೀಡಲಾದ ಶ್ರೇಣಿಯಲ್ಲಿ ಎಷ್ಟು ಬಾರಿ ಬಿದ್ದಿದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ.
![ನಿಜಜೀವನದ ಡೇಟಾದ ಹಿಸ್ಟೋಗ್ರಾಮ್](../../../../translated_images/kn/weight-histogram.bfd00caf7fc30b145b21e862dba7def41c75635d5280de25d840dd7f0b00545e.png)
![ನಿಜಜೀವನದ ಡೇಟಾದ ಹಿಸ್ಟೋಗ್ರಾಮ್](../../../../translated_images/kn/weight-histogram.bfd00caf7fc30b14.webp)
ಈ ಹಿಸ್ಟೋಗ್ರಾಮ್‌ನಿಂದ ನೀವು ನೋಡಬಹುದು ಎಲ್ಲಾ ಮೌಲ್ಯಗಳು ನಿರ್ದಿಷ್ಟ ಸರಾಸರಿ ತೂಕದ ಸುತ್ತಲೂ ಕೇಂದ್ರೀಕೃತವಾಗಿವೆ, ಮತ್ತು ಆ ತೂಕದಿಂದ ದೂರ ಹೋಗುವಂತೆ, ಆ ಮೌಲ್ಯದ ತೂಕಗಳ ಸಂಖ್ಯೆ ಕಡಿಮೆಯಾಗುತ್ತದೆ. ಅಂದರೆ, ಬೇಸ್‌ಬಾಲ್ ಆಟಗಾರರ ತೂಕವು ಸರಾಸರಿ ತೂಕದಿಂದ ಬಹಳ ವಿಭಿನ್ನವಾಗಿರುವುದು ಬಹಳ ಅಸಾಧ್ಯ. ತೂಕಗಳ ವ್ಯತ್ಯಾಸವು ತೂಕಗಳು ಸರಾಸರಿ ತೂಕದಿಂದ ಎಷ್ಟು ಭಿನ್ನವಾಗಬಹುದು ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ.
@ -103,7 +103,7 @@ samples = np.random.normal(mean,std,1000)
ನಾವು ರಚಿಸಿದ ಮಾದರಿಗಳ ಹಿಸ್ಟೋಗ್ರಾಮ್ ಅನ್ನು ರಚಿಸಿದರೆ, ಮೇಲಿನ ಚಿತ್ರಣಕ್ಕೆ ಬಹಳ ಸಮೀಪವಾದ ಚಿತ್ರಣವನ್ನು ನೋಡಬಹುದು. ಮತ್ತು ಮಾದರಿಗಳ ಸಂಖ್ಯೆ ಮತ್ತು ಬಿನ್‌ಗಳ ಸಂಖ್ಯೆಯನ್ನು ಹೆಚ್ಚಿಸಿದರೆ, ನಾವು ಆದರ್ಶದ ಹತ್ತಿರದ ಸಾಮಾನ್ಯ ವಿತರಣೆಯ ಚಿತ್ರಣವನ್ನು ರಚಿಸಬಹುದು:
![ಸರಾಸರಿ=0 ಮತ್ತು ಮಾನಕ ವಿಚಲನ=1 ಇರುವ ಸಾಮಾನ್ಯ ವಿತರಣೆ](../../../../translated_images/kn/normal-histogram.dfae0d67c202137d552d0015fb87581eca263925e512404f3c12d8885315432e.png)
![ಸರಾಸರಿ=0 ಮತ್ತು ಮಾನಕ ವಿಚಲನ=1 ಇರುವ ಸಾಮಾನ್ಯ ವಿತರಣೆ](../../../../translated_images/kn/normal-histogram.dfae0d67c202137d.webp)
*ಸರಾಸರಿ=0 ಮತ್ತು ಮಾನಕ ವಿಚಲನ=1 ಇರುವ ಸಾಮಾನ್ಯ ವಿತರಣೆ*
@ -222,7 +222,7 @@ array([[1. , 0.52959196],
ನಮ್ಮ ಪ್ರಕರಣದಲ್ಲಿ, 0.53 ಮೌಲ್ಯವು ತೋರಿಸುತ್ತದೆ ತೂಕ ಮತ್ತು ಎತ್ತರದ ನಡುವೆ ಕೆಲವು ಸಹಸಂಬಂಧವಿದೆ. ನಾವು ಒಂದು ಮೌಲ್ಯವನ್ನು ಇನ್ನೊಂದರ ವಿರುದ್ಧ ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ ಮಾಡಬಹುದು ಸಂಬಂಧವನ್ನು ದೃಶ್ಯವಾಗಿ ನೋಡಲು:
![ತೂಕ ಮತ್ತು ಎತ್ತರದ ನಡುವಿನ ಸಂಬಂಧ](../../../../translated_images/kn/weight-height-relationship.3f06bde4ca2aba9974182c4ef037ed602acd0fbbbbe2ca91cefd838a9e66bcf9.png)
![ತೂಕ ಮತ್ತು ಎತ್ತರದ ನಡುವಿನ ಸಂಬಂಧ](../../../../translated_images/kn/weight-height-relationship.3f06bde4ca2aba99.webp)
> ಸಹಸಂಬಂಧ ಮತ್ತು ಸಹವ್ಯತ್ಯಾಸದ ಇನ್ನಷ್ಟು ಉದಾಹರಣೆಗಳನ್ನು [ಸಹಾಯಕ ನೋಟ್ಬುಕ್](notebook.ipynb) ನಲ್ಲಿ ಕಾಣಬಹುದು.

@ -1,6 +1,6 @@
# ಡೇಟಾ ಸೈನ್ಸ್ ಪರಿಚಯ
![data in action](../../../translated_images/kn/data.48e22bb7617d8d92188afbc4c48effb920ba79f5cebdc0652cd9f34bbbd90c18.jpg)
![data in action](../../../translated_images/kn/data.48e22bb7617d8d92.webp)
> ಫೋಟೋ <a href="https://unsplash.com/@dawson2406?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಸ್ಟೀಫನ್ ಡಾಸನ್</a> ಅವರಿಂದ <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಅನ್ಸ್ಪ್ಲ್ಯಾಶ್</a> ನಲ್ಲಿ
ಈ ಪಾಠಗಳಲ್ಲಿ, ನೀವು ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ನು ಹೇಗೆ ವ್ಯಾಖ್ಯಾನಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಕಂಡುಹಿಡಿಯುತ್ತೀರಿ ಮತ್ತು ಡೇಟಾ ವಿಜ್ಞಾನಿಯೊಬ್ಬರು ಪರಿಗಣಿಸಬೇಕಾದ ನೈತಿಕ ವಿಚಾರಗಳನ್ನು ತಿಳಿಯುತ್ತೀರಿ. ನೀವು ಡೇಟಾ ಅನ್ನು ಹೇಗೆ ವ್ಯಾಖ್ಯಾನಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ತಿಳಿಯುತ್ತೀರಿ ಮತ್ತು ಡೇಟಾ ಸೈನ್ಸ್‌ನ ಮೂಲ ಶೈಕ್ಷಣಿಕ ಕ್ಷೇತ್ರಗಳಾದ ಅಂಕಿಅಂಶ ಮತ್ತು ಸಾಧ್ಯತೆಗಳ ಬಗ್ಗೆ ಸ್ವಲ್ಪ ತಿಳಿಯುತ್ತೀರಿ.

@ -12,7 +12,7 @@
ಸ್ಪ್ರೆಡ್ಶೀಟ್‌ಗಳು ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲು ಮತ್ತು ಅನ್ವೇಷಿಸಲು ಜನಪ್ರಿಯ ವಿಧಾನವಾಗಿವೆ ಏಕೆಂದರೆ ಅದನ್ನು ಸೆಟ್‌ಅಪ್ ಮಾಡುವುದು ಮತ್ತು ಪ್ರಾರಂಭಿಸುವುದು ಕಡಿಮೆ ಕೆಲಸವನ್ನು ಅಗತ್ಯವಿರುತ್ತದೆ. ಈ ಪಾಠದಲ್ಲಿ ನೀವು ಸ್ಪ್ರೆಡ್ಶೀಟ್‌ನ ಮೂಲಭೂತ ಘಟಕಗಳನ್ನು, ಜೊತೆಗೆ ಸೂತ್ರಗಳು ಮತ್ತು ಕಾರ್ಯಗಳನ್ನು ಕಲಿಯುತ್ತೀರಿ. ಉದಾಹರಣೆಗಳು ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಕ್ಸೆಲ್‌ನೊಂದಿಗೆ ಚಿತ್ರಿತವಾಗಿವೆ, ಆದರೆ ಬಹುತೇಕ ಭಾಗಗಳು ಮತ್ತು ವಿಷಯಗಳು ಇತರ ಸ್ಪ್ರೆಡ್ಶೀಟ್ ಸಾಫ್ಟ್‌ವೇರ್‌ಗಳೊಂದಿಗೆ ಹೋಲಿಕೆಯ ಹೆಸರಿನೊಂದಿಗೆ ಮತ್ತು ಹಂತಗಳೊಂದಿಗೆ ಇರುತ್ತವೆ.
![ಎರಡು ವರ್ಕ್‌ಶೀಟ್‌ಗಳೊಂದಿಗೆ ಖಾಲಿ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಕ್ಸೆಲ್ ವರ್ಕ್‌ಬುಕ್](../../../../translated_images/kn/parts-of-spreadsheet.120711c82aa18a45c3e62a491a15bba0a31ab0e9db407ec022702fed8ffd89bf.png)
![ಎರಡು ವರ್ಕ್‌ಶೀಟ್‌ಗಳೊಂದಿಗೆ ಖಾಲಿ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಕ್ಸೆಲ್ ವರ್ಕ್‌ಬುಕ್](../../../../translated_images/kn/parts-of-spreadsheet.120711c82aa18a45.webp)
ಸ್ಪ್ರೆಡ್ಶೀಟ್ ಒಂದು ಫೈಲ್ ಆಗಿದ್ದು, ಕಂಪ್ಯೂಟರ್, ಸಾಧನ ಅಥವಾ ಕ್ಲೌಡ್ ಆಧಾರಿತ ಫೈಲ್ ಸಿಸ್ಟಮ್‌ನಲ್ಲಿ ಲಭ್ಯವಿರುತ್ತದೆ. ಸಾಫ್ಟ್‌ವೇರ್ ಸ್ವತಃ ಬ್ರೌಸರ್ ಆಧಾರಿತವಾಗಿರಬಹುದು ಅಥವಾ ಕಂಪ್ಯೂಟರ್‌ನಲ್ಲಿ ಸ್ಥಾಪಿಸಬೇಕಾದ ಅಪ್ಲಿಕೇಶನ್ ಆಗಿರಬಹುದು ಅಥವಾ ಆ್ಯಪ್ ಆಗಿ ಡೌನ್‌ಲೋಡ್ ಮಾಡಬಹುದು. ಎಕ್ಸೆಲ್‌ನಲ್ಲಿ ಈ ಫೈಲ್‌ಗಳನ್ನು **ವರ್ಕ್‌ಬುಕ್‌ಗಳು** ಎಂದು ವ್ಯಾಖ್ಯಾನಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ಈ ಪದವನ್ನು ಈ ಪಾಠದ ಉಳಿದ ಭಾಗದಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ.
@ -24,11 +24,11 @@
"InventoryExample" ಎಂಬ ಸ್ಪ್ರೆಡ್ಶೀಟ್ ಫೈಲ್ ಒಂದು ಫಾರ್ಮ್ಯಾಟ್ ಮಾಡಲಾದ ಇನ್ವೆಂಟರಿಯಲ್ಲಿನ ಐಟಂಗಳ ಸ್ಪ್ರೆಡ್ಶೀಟ್ ಆಗಿದ್ದು, ಮೂರು ವರ್ಕ್‌ಶೀಟ್‌ಗಳನ್ನು ಹೊಂದಿದೆ, ಟ್ಯಾಬ್‌ಗಳು "Inventory List", "Inventory Pick List" ಮತ್ತು "Bin Lookup" ಎಂದು ಲೇಬಲ್ ಮಾಡಲ್ಪಟ್ಟಿವೆ. Inventory List ವರ್ಕ್‌ಶೀಟ್‌ನ ಸಾಲು 4 ಹೆಡರ್ ಆಗಿದ್ದು, ಹೆಡರ್ ಕಾಲಮ್‌ನ ಪ್ರತಿಯೊಂದು ಸೆಲ್‌ನ ಮೌಲ್ಯವನ್ನು ವಿವರಿಸುತ್ತದೆ.
![ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಕ್ಸೆಲ್‌ನ ಉದಾಹರಣೆಯ ಇನ್ವೆಂಟರಿ ಪಟ್ಟಿಯಿಂದ ಹೈಲೈಟ್ ಮಾಡಲಾದ ಸೂತ್ರ](../../../../translated_images/kn/formula-excel.ad1068c220892f5ead570d12f2394897961d31a5043a1dd4e6fc5d7690c7a14e.png)
![ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಕ್ಸೆಲ್‌ನ ಉದಾಹರಣೆಯ ಇನ್ವೆಂಟರಿ ಪಟ್ಟಿಯಿಂದ ಹೈಲೈಟ್ ಮಾಡಲಾದ ಸೂತ್ರ](../../../../translated_images/kn/formula-excel.ad1068c220892f5e.webp)
ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ ಒಂದು ಸೆಲ್ ಇತರ ಸೆಲ್‌ಗಳ ಮೌಲ್ಯಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ ತನ್ನ ಮೌಲ್ಯವನ್ನು ಉತ್ಪಾದಿಸಲು. Inventory List ಸ್ಪ್ರೆಡ್ಶೀಟ್ ತನ್ನ ಇನ್ವೆಂಟರಿಯಲ್ಲಿನ ಪ್ರತಿಯೊಂದು ಐಟಂನ ವೆಚ್ಚವನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತದೆ, ಆದರೆ ನಾವು ಇನ್ವೆಂಟರಿಯಲ್ಲಿನ ಎಲ್ಲವನ್ನೂ ಮೌಲ್ಯವನ್ನು ತಿಳಿಯಬೇಕಾದರೆ? [**ಸೂತ್ರಗಳು**](https://support.microsoft.com/en-us/office/overview-of-formulas-34519a4e-1e8d-4f4b-84d4-d642c4f63263) ಸೆಲ್ ಡೇಟಾದ ಮೇಲೆ ಕ್ರಿಯೆಗಳನ್ನು ನಿರ್ವಹಿಸುತ್ತವೆ ಮತ್ತು ಈ ಉದಾಹರಣೆಯಲ್ಲಿ ಇನ್ವೆಂಟರಿಯ ವೆಚ್ಚವನ್ನು ಲೆಕ್ಕಿಸಲು ಬಳಸಲಾಗುತ್ತದೆ. ಈ ಸ್ಪ್ರೆಡ್ಶೀಟ್ Inventory Value ಕಾಲಮ್‌ನಲ್ಲಿ ಸೂತ್ರವನ್ನು ಬಳಸಿಕೊಂಡು ಪ್ರತಿಯೊಂದು ಐಟಂನ ಮೌಲ್ಯವನ್ನು ಲೆಕ್ಕಿಸುತ್ತದೆ, ಅದು QTY ಹೆಡರ್ ಅಡಿಯಲ್ಲಿ ಇರುವ ಪ್ರಮಾಣ ಮತ್ತು COST ಹೆಡರ್ ಅಡಿಯಲ್ಲಿ ಇರುವ ವೆಚ್ಚಗಳನ್ನು ಗುಣಿಸುವ ಮೂಲಕ ಲೆಕ್ಕಿಸಲಾಗುತ್ತದೆ. ಸೆಲ್ ಮೇಲೆ ಡಬಲ್ ಕ್ಲಿಕ್ ಮಾಡುವುದು ಅಥವಾ ಹೈಲೈಟ್ ಮಾಡುವುದು ಸೂತ್ರವನ್ನು ತೋರಿಸುತ್ತದೆ. ನೀವು ಗಮನಿಸುವಿರಿ ಸೂತ್ರಗಳು ಸಮಾನ ಚಿಹ್ನೆಯಿಂದ ಪ್ರಾರಂಭವಾಗುತ್ತವೆ, ನಂತರ ಲೆಕ್ಕಾಚಾರ ಅಥವಾ ಕಾರ್ಯಾಚರಣೆ ಬರುತ್ತದೆ.
![ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಕ್ಸೆಲ್‌ನ ಉದಾಹರಣೆಯ ಇನ್ವೆಂಟರಿ ಪಟ್ಟಿಯಿಂದ ಹೈಲೈಟ್ ಮಾಡಲಾದ ಕಾರ್ಯ](../../../../translated_images/kn/function-excel.be2ae4feddc10ca089f3d4363040d93b7fd046c8d4f83ba975ec46483ee99895.png)
![ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಕ್ಸೆಲ್‌ನ ಉದಾಹರಣೆಯ ಇನ್ವೆಂಟರಿ ಪಟ್ಟಿಯಿಂದ ಹೈಲೈಟ್ ಮಾಡಲಾದ ಕಾರ್ಯ](../../../../translated_images/kn/function-excel.be2ae4feddc10ca0.webp)
ನಾವು ಇನ್ನೊಂದು ಸೂತ್ರವನ್ನು ಬಳಸಿಕೊಂಡು Inventory Value ನ ಎಲ್ಲಾ ಮೌಲ್ಯಗಳನ್ನು ಸೇರಿಸಿ ಒಟ್ಟು ಮೌಲ್ಯವನ್ನು ಪಡೆಯಬಹುದು. ಇದನ್ನು ಪ್ರತಿ ಸೆಲ್ ಸೇರಿಸುವ ಮೂಲಕ ಲೆಕ್ಕಿಸಬಹುದು, ಆದರೆ ಅದು ಕಷ್ಟಕರ ಕೆಲಸವಾಗಬಹುದು. ಎಕ್ಸೆಲ್ [**ಕಾರ್ಯಗಳು**](https://support.microsoft.com/en-us/office/sum-function-043e1c7d-7726-4e80-8f32-07b23e057f89) ಹೊಂದಿದೆ, ಅಥವಾ ಪೂರ್ವನಿರ್ಧರಿತ ಸೂತ್ರಗಳು, ಸೆಲ್ ಮೌಲ್ಯಗಳ ಮೇಲೆ ಲೆಕ್ಕಾಚಾರಗಳನ್ನು ನಿರ್ವಹಿಸಲು. ಕಾರ್ಯಗಳಿಗೆ ಆರ್ಗ್ಯುಮೆಂಟ್‌ಗಳು ಅಗತ್ಯವಿರುತ್ತವೆ, ಅವು ಲೆಕ್ಕಾಚಾರಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಅಗತ್ಯವಿರುವ ಮೌಲ್ಯಗಳು. ಕಾರ್ಯಗಳಿಗೆ ಒಂದುಕ್ಕಿಂತ ಹೆಚ್ಚು ಆರ್ಗ್ಯುಮೆಂಟ್‌ಗಳು ಬೇಕಾದಾಗ, ಅವುಗಳನ್ನು ನಿರ್ದಿಷ್ಟ ಕ್ರಮದಲ್ಲಿ ಪಟ್ಟಿ ಮಾಡಬೇಕು ಇಲ್ಲದಿದ್ದರೆ ಕಾರ್ಯ ಸರಿಯಾದ ಮೌಲ್ಯವನ್ನು ಲೆಕ್ಕಿಸದು. ಈ ಉದಾಹರಣೆಯಲ್ಲಿ SUM ಕಾರ್ಯವನ್ನು ಬಳಸಲಾಗಿದೆ, ಮತ್ತು Inventory Value ನ ಮೌಲ್ಯಗಳನ್ನು ಆರ್ಗ್ಯುಮೆಂಟ್ ಆಗಿ ಬಳಸಿಕೊಂಡು ಸಾಲು 3, ಕಾಲಮ್ B (B3 ಎಂದು ಕೂಡ ಕರೆಯಲಾಗುತ್ತದೆ) ಅಡಿಯಲ್ಲಿ ಒಟ್ಟು ಮೌಲ್ಯವನ್ನು ಲೆಕ್ಕಿಸುತ್ತದೆ.
@ -36,17 +36,17 @@
ನೋಎಸ್‌ಕ್ಯೂಎಲ್ ಅಸಂಬಂಧಿತ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವ ವಿವಿಧ ವಿಧಾನಗಳಿಗೆ ಒಂದು ಛತ್ರಪಟ ಪದವಾಗಿದೆ ಮತ್ತು ಇದನ್ನು "ನಾನ್-ಎಸ್‌ಕ್ಯೂಎಲ್", "ನಾನ್-ರಿಲೇಶನಲ್" ಅಥವಾ "ನಾಟ್ ಓನ್ಲಿ ಎಸ್‌ಕ್ಯೂಎಲ್" ಎಂದು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದು. ಈ ರೀತಿಯ ಡೇಟಾಬೇಸ್ ವ್ಯವಸ್ಥೆಗಳನ್ನು 4 ವಿಧಗಳಲ್ಲಿ ವರ್ಗೀಕರಿಸಬಹುದು.
![ನಾಲ್ಕು ವಿಭಿನ್ನ ಸಂಖ್ಯಾತ್ಮಕ ಕೀಲಿಗಳನ್ನು ಹೊಂದಿರುವ ಕೀ-ಮೌಲ್ಯ ಡೇಟಾ ಸ್ಟೋರ್‌ನ ಗ್ರಾಫಿಕಲ್ ಪ್ರತಿನಿಧಾನ](../../../../translated_images/kn/kv-db.e8f2b75686bbdfcba0c827b9272c10ae0821611ea0fe98429b9d13194383afa6.png)
![ನಾಲ್ಕು ವಿಭಿನ್ನ ಸಂಖ್ಯಾತ್ಮಕ ಕೀಲಿಗಳನ್ನು ಹೊಂದಿರುವ ಕೀ-ಮೌಲ್ಯ ಡೇಟಾ ಸ್ಟೋರ್‌ನ ಗ್ರಾಫಿಕಲ್ ಪ್ರತಿನಿಧಾನ](../../../../translated_images/kn/kv-db.e8f2b75686bbdfcb.webp)
> ಮೂಲ [ಮಿಚಾಲ್ ಬಿಯಾಲೆಕಿ ಬ್ಲಾಗ್](https://www.michalbialecki.com/2018/03/18/azure-cosmos-db-key-value-database-cloud/)
[ಕೀ-ಮೌಲ್ಯ](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#keyvalue-data-stores) ಡೇಟಾಬೇಸ್‌ಗಳು ವಿಶಿಷ್ಟ ಕೀಲಿಗಳನ್ನು ಜೋಡಿಸುತ್ತವೆ, ಅವು ಮೌಲ್ಯಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ವಿಶಿಷ್ಟ ಗುರುತಿಸುವಿಕೆ. ಈ ಜೋಡಿಗಳು [ಹ್ಯಾಶ್ ಟೇಬಲ್](https://www.hackerearth.com/practice/data-structures/hash-tables/basics-of-hash-tables/tutorial/) ಬಳಸಿ ಸೂಕ್ತ ಹ್ಯಾಶಿಂಗ್ ಕಾರ್ಯಾಚರಣೆಯೊಂದಿಗೆ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತವೆ.
![ಜನರು, ಅವರ ಆಸಕ್ತಿಗಳು ಮತ್ತು ಸ್ಥಳಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ತೋರಿಸುವ ಗ್ರಾಫ್ ಡೇಟಾ ಸ್ಟೋರ್‌ನ ಗ್ರಾಫಿಕಲ್ ಪ್ರತಿನಿಧಾನ](../../../../translated_images/kn/graph-db.d13629152f79a9dac895b20fa7d841d4d4d6f6008b1382227c3bbd200fd4cfa1.png)
![ಜನರು, ಅವರ ಆಸಕ್ತಿಗಳು ಮತ್ತು ಸ್ಥಳಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ತೋರಿಸುವ ಗ್ರಾಫ್ ಡೇಟಾ ಸ್ಟೋರ್‌ನ ಗ್ರಾಫಿಕಲ್ ಪ್ರತಿನಿಧಾನ](../../../../translated_images/kn/graph-db.d13629152f79a9da.webp)
> ಮೂಲ [ಮೈಕ್ರೋಸಾಫ್ಟ್](https://docs.microsoft.com/en-us/azure/cosmos-db/graph/graph-introduction#graph-database-by-example)
[ಗ್ರಾಫ್](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#graph-data-stores) ಡೇಟಾಬೇಸ್‌ಗಳು ಡೇಟಾದಲ್ಲಿನ ಸಂಬಂಧಗಳನ್ನು ವರ್ಣಿಸುತ್ತವೆ ಮತ್ತು ನೋಡ್‌ಗಳು ಮತ್ತು ಎಡ್ಜ್‌ಗಳ ಸಂಗ್ರಹವಾಗಿ ಪ್ರತಿನಿಧಿಸಲಾಗುತ್ತವೆ. ನೋಡ್ ಒಂದು ಘಟಕವನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ, ಅದು ನಿಜಜೀವನದಲ್ಲಿ ಇರುವ ಏನಾದರೂ, ಉದಾಹರಣೆಗೆ ವಿದ್ಯಾರ್ಥಿ ಅಥವಾ ಬ್ಯಾಂಕ್ ಸ್ಟೇಟ್ಮೆಂಟ್. ಎಡ್ಜ್‌ಗಳು ಎರಡು ಘಟಕಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತವೆ. ಪ್ರತಿಯೊಂದು ನೋಡ್ ಮತ್ತು ಎಡ್ಜ್‌ಗಳಿಗೆ ಗುಣಲಕ್ಷಣಗಳಿವೆ, ಅವು ಪ್ರತಿ ನೋಡ್ ಮತ್ತು ಎಡ್ಜ್ ಬಗ್ಗೆ ಹೆಚ್ಚುವರಿ ಮಾಹಿತಿಯನ್ನು ಒದಗಿಸುತ್ತವೆ.
![ಐಡೆಂಟಿಟಿ ಮತ್ತು ಸಂಪರ್ಕ ಮಾಹಿತಿ ಎಂಬ ಎರಡು ಕಾಲಮ್ ಕುಟುಂಬಗಳನ್ನು ಹೊಂದಿರುವ ಗ್ರಾಹಕ ಡೇಟಾಬೇಸ್ ಅನ್ನು ತೋರಿಸುವ ಕಾಲಮ್ನರ್ ಡೇಟಾ ಸ್ಟೋರ್‌ನ ಗ್ರಾಫಿಕಲ್ ಪ್ರತಿನಿಧಾನ](../../../../translated_images/kn/columnar-db.ffcfe73c3e9063a8c8f93f8ace85e1200863584b1e324eb5159d8ca10f62ec04.png)
![ಐಡೆಂಟಿಟಿ ಮತ್ತು ಸಂಪರ್ಕ ಮಾಹಿತಿ ಎಂಬ ಎರಡು ಕಾಲಮ್ ಕುಟುಂಬಗಳನ್ನು ಹೊಂದಿರುವ ಗ್ರಾಹಕ ಡೇಟಾಬೇಸ್ ಅನ್ನು ತೋರಿಸುವ ಕಾಲಮ್ನರ್ ಡೇಟಾ ಸ್ಟೋರ್‌ನ ಗ್ರಾಫಿಕಲ್ ಪ್ರತಿನಿಧಾನ](../../../../translated_images/kn/columnar-db.ffcfe73c3e9063a8.webp)
[ಕಾಲಮ್ನರ್](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#columnar-data-stores) ಡೇಟಾ ಸ್ಟೋರ್‌ಗಳು ಡೇಟಾವನ್ನು ಕಾಲಮ್‌ಗಳು ಮತ್ತು ಸಾಲುಗಳಾಗಿ ಸಂಘಟಿಸುತ್ತವೆ relational data structure ಹಾಗೆ, ಆದರೆ ಪ್ರತಿಯೊಂದು ಕಾಲಮ್ ಅನ್ನು ಕಾಲಮ್ ಕುಟುಂಬ ಎಂದು ಕರೆಯುವ ಗುಂಪುಗಳಾಗಿ ವಿಭಜಿಸಲಾಗುತ್ತದೆ, ಅಲ್ಲಿ ಒಂದು ಕಾಲಮ್ ಅಡಿಯಲ್ಲಿ ಇರುವ ಎಲ್ಲಾ ಡೇಟಾ ಸಂಬಂಧಿತವಾಗಿದ್ದು, ಒಂದು ಘಟಕದಲ್ಲಿ ಪಡೆಯಬಹುದು ಮತ್ತು ಬದಲಾಯಿಸಬಹುದು.
@ -79,11 +79,11 @@
ಎಮ್ಯುಲೇಟರ್ ಬ್ರೌಸರ್ ವಿಂಡೋವನ್ನು ಪ್ರಾರಂಭಿಸುತ್ತದೆ, ಅಲ್ಲಿ ಎಕ್ಸ್‌ಪ್ಲೋರರ್ ವೀಕ್ಷಣೆ ನಿಮಗೆ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ಅನುಮತಿಸುತ್ತದೆ.
![ಕೋಸ್ಮೋಸ್ ಡಿಬಿ ಎಮ್ಯುಲೇಟರ್‌ನ ಎಕ್ಸ್‌ಪ್ಲೋರರ್ ವೀಕ್ಷಣೆ](../../../../translated_images/kn/cosmosdb-emulator-explorer.a1c80b1347206fe2f30f88fc123821636587d04fc5a56a9eb350c7da6b31f361.png)
![ಕೋಸ್ಮೋಸ್ ಡಿಬಿ ಎಮ್ಯುಲೇಟರ್‌ನ ಎಕ್ಸ್‌ಪ್ಲೋರರ್ ವೀಕ್ಷಣೆ](../../../../translated_images/kn/cosmosdb-emulator-explorer.a1c80b1347206fe2.webp)
ನೀವು ಅನುಸರಿಸುತ್ತಿದ್ದರೆ, "Start with Sample" ಕ್ಲಿಕ್ ಮಾಡಿ SampleDB ಎಂಬ ಮಾದರಿ ಡೇಟಾಬೇಸ್ ರಚಿಸಿ. Sample DB ಅನ್ನು ವಿಸ್ತರಿಸಿದರೆ, `Persons` ಎಂಬ ಕಂಟೈನರ್ ಕಂಡುಬರುತ್ತದೆ, ಕಂಟೈನರ್ ಐಟಂಗಳ ಸಂಗ್ರಹವನ್ನು ಹೊಂದಿದೆ, ಅವು ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳು. ನೀವು `Items` ಅಡಿಯಲ್ಲಿ ನಾಲ್ಕು ವೈಯಕ್ತಿಕ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳನ್ನು ಅನ್ವೇಷಿಸಬಹುದು.
![ಕೋಸ್ಮೋಸ್ ಡಿಬಿ ಎಮ್ಯುಲೇಟರ್‌ನಲ್ಲಿ ಮಾದರಿ ಡೇಟಾ ಅನ್ವೇಷಣೆ](../../../../translated_images/kn/cosmosdb-emulator-persons.bf640586a7077c8985dfd3071946465c8e074c722c7c202d6d714de99a93b90a.png)
![ಕೋಸ್ಮೋಸ್ ಡಿಬಿ ಎಮ್ಯುಲೇಟರ್‌ನಲ್ಲಿ ಮಾದರಿ ಡೇಟಾ ಅನ್ವೇಷಣೆ](../../../../translated_images/kn/cosmosdb-emulator-persons.bf640586a7077c89.webp)
#### ಕೋಸ್ಮೋಸ್ ಡಿಬಿ ಎಮ್ಯುಲೇಟರ್‌ನೊಂದಿಗೆ ಡಾಕ್ಯುಮೆಂಟ್ ಡೇಟಾ ಪ್ರಶ್ನಿಸುವುದು
@ -93,7 +93,7 @@
`SELECT * FROM c where c.age < 40`
![ಕೋಸ್ಮೋಸ್ ಡಿಬಿ ಎಮ್ಯುಲೇಟರ್‌ನಲ್ಲಿ SELECT ಪ್ರಶ್ನೆಯನ್ನು ನಡೆಸುವುದು, ವಯಸ್ಸು 40 ಕ್ಕಿಂತ ಕಡಿಮೆ ಇರುವ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳನ್ನು ಹುಡುಕುವುದು](../../../../translated_images/kn/cosmosdb-emulator-persons-query.6905ebb497e3cd047cd96e55a0a03f69ce1b91b2b3d8c147e617b746b22b7e33.png)
![ಕೋಸ್ಮೋಸ್ ಡಿಬಿ ಎಮ್ಯುಲೇಟರ್‌ನಲ್ಲಿ SELECT ಪ್ರಶ್ನೆಯನ್ನು ನಡೆಸುವುದು, ವಯಸ್ಸು 40 ಕ್ಕಿಂತ ಕಡಿಮೆ ಇರುವ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳನ್ನು ಹುಡುಕುವುದು](../../../../translated_images/kn/cosmosdb-emulator-persons-query.6905ebb497e3cd04.webp)
ಪ್ರಶ್ನೆ ಎರಡು ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ, ಪ್ರತಿ ಡಾಕ್ಯುಮೆಂಟ್‌ನ ವಯಸ್ಸು ಮೌಲ್ಯ 40 ಕ್ಕಿಂತ ಕಡಿಮೆ ಇದೆ.

@ -4,7 +4,7 @@
| :-------------------------------------------------------------------------------------------------------: |
| ಪೈಥಾನ್ ಜೊತೆ ಕೆಲಸ ಮಾಡುವುದು - _[@nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್ ನೋಟ್_ |
[![ಪರಿಚಯ ವೀಡಿಯೋ](../../../../translated_images/kn/video-ds-python.245247dc811db8e4d5ac420246de8a118c63fd28f6a56578d08b630ae549f260.png)](https://youtu.be/dZjWOGbsN4Y)
[![ಪರಿಚಯ ವೀಡಿಯೋ](../../../../translated_images/kn/video-ds-python.245247dc811db8e4.webp)](https://youtu.be/dZjWOGbsN4Y)
ಡೇಟಾಬೇಸ್‌ಗಳು ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲು ಮತ್ತು ಕ್ವೇರಿ ಭಾಷೆಗಳನ್ನು ಬಳಸಿ ಅವುಗಳನ್ನು ಪ್ರಶ್ನಿಸಲು ಅತ್ಯಂತ ಪರಿಣಾಮಕಾರಿಯಾದ ಮಾರ್ಗಗಳನ್ನು ನೀಡುತ್ತವೆ, ಆದರೆ ಡೇಟಾ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವ ಅತ್ಯಂತ ಲವಚಿಕ ಮಾರ್ಗವೆಂದರೆ ನಿಮ್ಮದೇ ಪ್ರೋಗ್ರಾಂ ಬರೆಯುವುದು. ಬಹುಶಃ ಬಹಳ ಸಂದರ್ಭಗಳಲ್ಲಿ ಡೇಟಾಬೇಸ್ ಕ್ವೇರಿ ಮಾಡುವುದು ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿಯಾಗಿರುತ್ತದೆ. ಆದರೆ ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ ಹೆಚ್ಚು ಸಂಕೀರ್ಣ ಡೇಟಾ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವಿಕೆ ಅಗತ್ಯವಿದ್ದಾಗ, ಅದನ್ನು SQL ಬಳಸಿ ಸುಲಭವಾಗಿ ಮಾಡಲಾಗುವುದಿಲ್ಲ.
ಡೇಟಾ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವಿಕೆ ಯಾವುದೇ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಭಾಷೆಯಲ್ಲಿ ಮಾಡಬಹುದು, ಆದರೆ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡಲು ಕೆಲವು ಭಾಷೆಗಳು ಹೆಚ್ಚಿನ ಮಟ್ಟದಲ್ಲಿವೆ. ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಕೆಳಗಿನ ಭಾಷೆಗಳಲ್ಲೊಂದು ಆಯ್ಕೆಮಾಡುತ್ತಾರೆ:
@ -66,7 +66,7 @@ print(f"Length of index is {len(idx)}")
items_sold = pd.Series(np.random.randint(25,50,size=len(idx)),index=idx)
items_sold.plot()
```
![ಸಮಯ ಸರಣಿ ರೇಖಾಚಿತ್ರ](../../../../translated_images/kn/timeseries-1.80de678ab1cf727e50e00bcf24009fa2b0a8b90ebc43e34b99a345227d28e467.png)
![ಸಮಯ ಸರಣಿ ರೇಖಾಚಿತ್ರ](../../../../translated_images/kn/timeseries-1.80de678ab1cf727e.webp)
ಈಗ ಪ್ರತೀ ವಾರ ನಾವು ಸ್ನೇಹಿತರಿಗಾಗಿ ಪಾರ್ಟಿ ಆಯೋಜಿಸುತ್ತೇವೆ ಮತ್ತು ಪಾರ್ಟಿಗಾಗಿ ಹೆಚ್ಚುವರಿ 10 ಪ್ಯಾಕೆಟ್ ಐಸ್-ಕ್ರೀಮ್ ತೆಗೆದುಕೊಳ್ಳುತ್ತೇವೆ ಎಂದು ಊಹಿಸೋಣ. ಅದನ್ನು ತೋರಿಸಲು ವಾರದ ಸೂಚ್ಯಂಕದೊಂದಿಗೆ ಮತ್ತೊಂದು ಸರಣಿಯನ್ನು ರಚಿಸಬಹುದು:
```python
@ -77,7 +77,7 @@ additional_items = pd.Series(10,index=pd.date_range(start_date,end_date,freq="W"
total_items = items_sold.add(additional_items,fill_value=0)
total_items.plot()
```
![ಸಮಯ ಸರಣಿ ರೇಖಾಚಿತ್ರ](../../../../translated_images/kn/timeseries-2.aae51d575c55181ceda81ade8c546a2fc2024f9136934386d57b8a189d7570ff.png)
![ಸಮಯ ಸರಣಿ ರೇಖಾಚಿತ್ರ](../../../../translated_images/kn/timeseries-2.aae51d575c55181c.webp)
> **ಗಮನಿಸಿ** ನಾವು ಸರಳ `total_items+additional_items` ಸಿಂಟ್ಯಾಕ್ಸ್ ಬಳಸುತ್ತಿಲ್ಲ. ಅದನ್ನು ಮಾಡಿದರೆ, ಫಲಿತಾಂಶ ಸರಣಿಯಲ್ಲಿ ಬಹಳಷ್ಟು `NaN` (*ಸಂಖ್ಯೆ ಅಲ್ಲ*) ಮೌಲ್ಯಗಳು ಬರುತ್ತಿದ್ದವು. ಇದಕ್ಕೆ ಕಾರಣವೆಂದರೆ `additional_items` ಸರಣಿಯಲ್ಲಿ ಕೆಲವು ಸೂಚ್ಯಂಕ ಬಿಂದುಗಳಿಗೆ ಮೌಲ್ಯಗಳು ಇಲ್ಲದಿರುವುದು, ಮತ್ತು `NaN` ಅನ್ನು ಯಾವುದಕ್ಕೂ ಸೇರಿಸಿದರೆ `NaN` ಆಗುತ್ತದೆ. ಆದ್ದರಿಂದ ಸೇರಿಸುವಾಗ `fill_value` ಪರಿಮಾಣವನ್ನು ಸೂಚಿಸಬೇಕಾಗುತ್ತದೆ.
@ -86,7 +86,7 @@ total_items.plot()
monthly = total_items.resample("1M").mean()
ax = monthly.plot(kind='bar')
```
![ಮಾಸಿಕ ಸಮಯ ಸರಣಿ ಸರಾಸರಿ](../../../../translated_images/kn/timeseries-3.f3147cbc8c624881008564bc0b5d9fcc15e7374d339da91766bd0e1c6bd9e3af.png)
![ಮಾಸಿಕ ಸಮಯ ಸರಣಿ ಸರಾಸರಿ](../../../../translated_images/kn/timeseries-3.f3147cbc8c624881.webp)
### ಡೇಟಾಫ್ರೇಮ್
@ -213,7 +213,7 @@ df = pd.read_csv('file.csv')
ನಾವು ಡೇಟಾ ಹೇಗೆ ನಿರ್ವಹಿಸಬೇಕೆಂದು ತೋರಿಸಲು ಬಯಸುವ ಕಾರಣದಿಂದ, ನೀವು [`notebook-covidspread.ipynb`](notebook-covidspread.ipynb) ಅನ್ನು ತೆರೆಯಿರಿ ಮತ್ತು ಮೇಲಿನಿಂದ ಕೆಳಗೆ ಓದಿ. ನೀವು ಸೆಲ್‌ಗಳನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಬಹುದು ಮತ್ತು ನಾವು ಕೊನೆಯಲ್ಲಿ ನಿಮಗಾಗಿ ಬಿಟ್ಟಿರುವ ಕೆಲವು ಚಾಲೆಂಜ್‌ಗಳನ್ನು ಮಾಡಬಹುದು.
![COVID Spread](../../../../translated_images/kn/covidspread.f3d131c4f1d260ab0344d79bac0abe7924598dd754859b165955772e1bd5e8a2.png)
![COVID Spread](../../../../translated_images/kn/covidspread.f3d131c4f1d260ab.webp)
> ನೀವು Jupyter Notebook ನಲ್ಲಿ ಕೋಡ್ ಅನ್ನು ಹೇಗೆ ಚಾಲನೆ ಮಾಡುವುದು ಎಂದು ತಿಳಿಯದಿದ್ದರೆ, [ಈ ಲೇಖನವನ್ನು](https://soshnikov.com/education/how-to-execute-notebooks-from-github/) ನೋಡಿ.
@ -235,7 +235,7 @@ df = pd.read_csv('file.csv')
[`notebook-papers.ipynb`](notebook-papers.ipynb) ಅನ್ನು ತೆರೆಯಿರಿ ಮತ್ತು ಮೇಲಿನಿಂದ ಕೆಳಗೆ ಓದಿ. ನೀವು ಸೆಲ್‌ಗಳನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಬಹುದು ಮತ್ತು ಕೊನೆಯಲ್ಲಿ ನಾವು ಬಿಟ್ಟಿರುವ ಕೆಲವು ಚಾಲೆಂಜ್‌ಗಳನ್ನು ಮಾಡಬಹುದು.
![Covid Medical Treatment](../../../../translated_images/kn/covidtreat.b2ba59f57ca45fbcda36e0ddca3f8cfdddeeed6ca879ea7f866d93fa6ec65791.png)
![Covid Medical Treatment](../../../../translated_images/kn/covidtreat.b2ba59f57ca45fbc.webp)
## ಚಿತ್ರ ಡೇಟಾ ಪ್ರಕ್ರಿಯೆ

File diff suppressed because one or more lines are too long

@ -1,6 +1,6 @@
# ಡೇಟಾ ಜೊತೆಗೆ ಕೆಲಸ ಮಾಡುವುದು
![data love](../../../translated_images/kn/data-love.a22ef29e6742c852505ada062920956d3d7604870b281a8ca7c7ac6f37381d5a.jpg)
![data love](../../../translated_images/kn/data-love.a22ef29e6742c852.webp)
> ಫೋಟೋ <a href="https://unsplash.com/@swimstaralex?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಅಲೆಕ್ಸಾಂಡರ್ ಸಿನ್</a> ಅವರಿಂದ <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಅನ್ಸ್ಪ್ಲ್ಯಾಶ್</a> ನಲ್ಲಿ
ಈ ಪಾಠಗಳಲ್ಲಿ, ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುವ, ತಿದ್ದುಪಡಿ ಮಾಡುವ ಮತ್ತು ಅಪ್ಲಿಕೇಶನ್‌ಗಳಲ್ಲಿ ಬಳಸುವ ಕೆಲವು ವಿಧಾನಗಳನ್ನು ನೀವು ಕಲಿಯುತ್ತೀರಿ. ಸಂಬಂಧಿತ ಮತ್ತು ಅಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್‌ಗಳ ಬಗ್ಗೆ ಮತ್ತು ಅವುಗಳಲ್ಲಿ ಡೇಟಾವನ್ನು ಹೇಗೆ ಸಂಗ್ರಹಿಸಬಹುದು ಎಂಬುದನ್ನು ನೀವು ತಿಳಿದುಕೊಳ್ಳುತ್ತೀರಿ. ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸಲು ಪೈಥಾನ್‌ನೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವ ಮೂಲಭೂತಗಳನ್ನು ನೀವು ಕಲಿಯುತ್ತೀರಿ ಮತ್ತು ಪೈಥಾನ್‌ನೊಂದಿಗೆ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುವ ಮತ್ತು ಗಣನೆ ಮಾಡುವ ಅನೇಕ ವಿಧಾನಗಳನ್ನು ನೀವು ಕಂಡುಹಿಡಿಯುತ್ತೀರಿ.

@ -52,7 +52,7 @@ birds.head()
wingspan = birds['MaxWingspan']
wingspan.plot()
```
![ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ](../../../../translated_images/kn/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.png)
![ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ](../../../../translated_images/kn/max-wingspan-02.e79fd847b2640b89.webp)
ನೀವು ತಕ್ಷಣವೇ ಏನು ಗಮನಿಸುತ್ತೀರಿ? ಕನಿಷ್ಠ ಒಂದು ಹೊರಗಿನ ಮೌಲ್ಯವಿದೆ ಎಂದು ತೋರುತ್ತದೆ - ಅದು ತುಂಬಾ ದೊಡ್ಡ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯಾಗಿದೆ! 2300 ಸೆಂ.ಮೀ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ ಎಂದರೆ 23 ಮೀಟರ್ - ಮಿನೆಸೋಟಾದಲ್ಲಿ ಪ್ಟೆರೋಡ್ಯಾಕ್ಟೈಲ್ಸ್ ಓಡಾಡುತ್ತಿವೆಯೇ? ಪರಿಶೀಲಿಸೋಣ.
@ -72,7 +72,7 @@ plt.plot(x, y)
plt.show()
```
![ಲೇಬಲ್ಗಳೊಂದಿಗೆ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ](../../../../translated_images/kn/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.png)
![ಲೇಬಲ್ಗಳೊಂದಿಗೆ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ](../../../../translated_images/kn/max-wingspan-labels-02.aa90e826ca49a9d1.webp)
ಲೇಬಲ್ಗಳ ತಿರುಗುವಿಕೆ 45 ಡಿಗ್ರಿಗಳಾಗಿದ್ದರೂ, ಓದಲು ತುಂಬಾ ಹೆಚ್ಚು ಇದೆ. ಬೇರೆ ತಂತ್ರವನ್ನು ಪ್ರಯತ್ನಿಸೋಣ: ಹೊರಗಿನ ಮೌಲ್ಯಗಳಿಗೆ ಮಾತ್ರ ಲೇಬಲ್ಗಳನ್ನು ನೀಡಿ ಮತ್ತು ಲೇಬಲ್ಗಳನ್ನು ಚಾರ್ಟ್ ಒಳಗೆ ಸೆಟ್ ಮಾಡಿ. ಲೇಬಲಿಂಗ್‌ಗೆ ಹೆಚ್ಚು ಜಾಗ ನೀಡಲು ಸ್ಕ್ಯಾಟರ್ ಚಾರ್ಟ್ ಬಳಸಬಹುದು:
@ -94,7 +94,7 @@ plt.show()
ನೀವು ಏನು ಕಂಡುಹಿಡಿದಿರಿ?
![ಹೊರಗಿನ ಮೌಲ್ಯಗಳು](../../../../translated_images/kn/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.png)
![ಹೊರಗಿನ ಮೌಲ್ಯಗಳು](../../../../translated_images/kn/labeled-wingspan-02.6110e2d2401cd523.webp)
## ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿ
ಬಾಲ್ಡ್ ಈಗಲ್ ಮತ್ತು ಪ್ರೇರೀ ಫಾಲ್ಕನ್, ಬಹುಶಃ ತುಂಬಾ ದೊಡ್ಡ ಪಕ್ಷಿಗಳು ಆಗಿದ್ದರೂ, ಗರಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಗೆ ಹೆಚ್ಚುವರಿ `0` ಸೇರಿಸಿರುವುದರಿಂದ ತಪ್ಪಾಗಿ ಲೇಬಲಾದಂತೆ ತೋರುತ್ತದೆ. 25 ಮೀಟರ್ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ಬಾಲ್ಡ್ ಈಗಲ್ ಅನ್ನು ನೀವು ಭೇಟಿಯಾಗುವುದು ಸಾಧ್ಯವಿಲ್ಲ, ಆದರೆ ಹಾಗಿದ್ದರೆ ದಯವಿಟ್ಟು ನಮಗೆ ತಿಳಿಸಿ! ಆ ಎರಡು ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಹೊರತುಪಡಿಸಿ ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ ರಚಿಸೋಣ:
@ -114,7 +114,7 @@ plt.show()
ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿದ ನಂತರ, ನಿಮ್ಮ ಡೇಟಾ ಈಗ ಹೆಚ್ಚು ಸಮ್ಮಿಲಿತ ಮತ್ತು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸುಲಭವಾಗಿದೆ.
![ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಗಳ ಸ್ಕ್ಯಾಟರ್‌ಪ್ಲಾಟ್](../../../../translated_images/kn/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.png)
![ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಗಳ ಸ್ಕ್ಯಾಟರ್‌ಪ್ಲಾಟ್](../../../../translated_images/kn/scatterplot-wingspan-02.1c33790094ce36a7.webp)
ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ದೃಷ್ಟಿಯಿಂದ ಸ್ವಚ್ಛಗೊಳಿಸಿದ ಡೇಟಾಸೆಟ್ ಇದ್ದು, ಈ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳೋಣ.
@ -140,7 +140,7 @@ birds.plot(x='Category',
title='Birds of Minnesota')
```
![ಪೂರ್ಣ ಡೇಟಾ ಬಾರ್ ಚಾರ್ಟ್ ಆಗಿ](../../../../translated_images/kn/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.png)
![ಪೂರ್ಣ ಡೇಟಾ ಬಾರ್ ಚಾರ್ಟ್ ಆಗಿ](../../../../translated_images/kn/full-data-bar-02.aaa3fda71c63ed56.webp)
ಆದರೆ ಈ ಬಾರ್ ಚಾರ್ಟ್ ಓದಲು ಅಸಾಧ್ಯವಾಗಿದೆ ಏಕೆಂದರೆ ಅತಿಯಾದ ಗುಂಪುಬದ್ಧವಲ್ಲದ ಡೇಟಾ ಇದೆ. ನೀವು ಪ್ಲಾಟ್ ಮಾಡಲು ಬಯಸುವ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಆಯ್ಕೆ ಮಾಡಬೇಕು, ಆದ್ದರಿಂದ ಪಕ್ಷಿಗಳ ಉದ್ದವನ್ನು ಅವುಗಳ ವರ್ಗದ ಆಧಾರದ ಮೇಲೆ ನೋಡೋಣ.
@ -155,7 +155,7 @@ category_count = birds.value_counts(birds['Category'].values, sort=True)
plt.rcParams['figure.figsize'] = [6, 12]
category_count.plot.barh()
```
![ವರ್ಗ ಮತ್ತು ಉದ್ದ](../../../../translated_images/kn/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.png)
![ವರ್ಗ ಮತ್ತು ಉದ್ದ](../../../../translated_images/kn/category-counts-02.0b9a0a4de42275ae.webp)
ಈ ಬಾರ್ ಚಾರ್ಟ್ ಪ್ರತಿ ವರ್ಗದಲ್ಲಿನ ಪಕ್ಷಿಗಳ ಸಂಖ್ಯೆಯ ಉತ್ತಮ ದೃಶ್ಯವನ್ನು ತೋರಿಸುತ್ತದೆ. ಕ್ಷಣದಲ್ಲಿಯೇ ನೀವು ಈ ಪ್ರದೇಶದಲ್ಲಿ ಅತಿ ಹೆಚ್ಚು ಪಕ್ಷಿಗಳು ಬಾತುಗಳು/ಗೀಸೆಗಳು/ನೀರಾಜೀವಿಗಳು ವರ್ಗದಲ್ಲಿವೆ ಎಂದು ನೋಡಬಹುದು. ಮಿನೆಸೋಟಾ '10,000 ಸರೋವರಗಳ ಭೂಮಿ' ಆಗಿರುವುದರಿಂದ ಇದು ಆಶ್ಚರ್ಯಕರವಲ್ಲ!
@ -171,7 +171,7 @@ plt.barh(y=birds['Category'], width=maxlength)
plt.rcParams['figure.figsize'] = [6, 12]
plt.show()
```
![ಡೇಟಾ ಹೋಲಿಕೆ](../../../../translated_images/kn/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.png)
![ಡೇಟಾ ಹೋಲಿಕೆ](../../../../translated_images/kn/category-length-02.7304bf519375c980.webp)
ಇಲ್ಲಿ ಏನೂ ಆಶ್ಚರ್ಯಕರವಿಲ್ಲ: ಹುಮ್ಮಿಂಗ್‌ಬರ್ಡ್‌ಗಳು ಪೆಲಿಕಾನ್ಸ್ ಅಥವಾ ಗೀಸೆಗಳಿಗಿಂತ ಕಡಿಮೆ ಗರಿಷ್ಠ ಉದ್ದ ಹೊಂದಿವೆ. ಡೇಟಾ ತಾರ್ಕಿಕವಾಗಿದ್ದರೆ ಚೆನ್ನಾಗಿದೆ!
@ -189,7 +189,7 @@ plt.show()
```
ಈ ಪ್ಲಾಟ್‌ನಲ್ಲಿ, ನೀವು ಪಕ್ಷಿ ವರ್ಗದ ಪ್ರತಿ ಕನಿಷ್ಠ ಉದ್ದ ಮತ್ತು ಗರಿಷ್ಠ ಉದ್ದದ ವ್ಯಾಪ್ತಿಯನ್ನು ನೋಡಬಹುದು. ಈ ಡೇಟಾ ನೀಡಿದಂತೆ, ಪಕ್ಷಿ ದೊಡ್ಡದಾದಂತೆ ಅದರ ಉದ್ದದ ವ್ಯಾಪ್ತಿಯೂ ದೊಡ್ಡದಾಗುತ್ತದೆ ಎಂದು ನೀವು ಸುರಕ್ಷಿತವಾಗಿ ಹೇಳಬಹುದು. ಅದ್ಭುತ!
![ಒಟ್ಟುಗೂಡಿಸಿದ ಮೌಲ್ಯಗಳು](../../../../translated_images/kn/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.png)
![ಒಟ್ಟುಗೂಡಿಸಿದ ಮೌಲ್ಯಗಳು](../../../../translated_images/kn/superimposed-02.f03058536baeb2ed.webp)
## 🚀 ಸವಾಲು

@ -40,7 +40,7 @@ plt.xlabel('Max Length')
plt.show()
```
![max length per order](../../../../translated_images/kn/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.png)
![max length per order](../../../../translated_images/kn/scatter-wb.9d98b0ed7f0388af.webp)
ಇದು ಪಕ್ಷಿ ಕ್ರಮದ ಪ್ರತಿ ದೇಹ ಉದ್ದದ ಸಾಮಾನ್ಯ ವಿತರಣೆಯ ಅವಲೋಕನವನ್ನು ನೀಡುತ್ತದೆ, ಆದರೆ ಇದು ನಿಜವಾದ ವಿತರಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸಲು ಅತ್ಯುತ್ತಮ ವಿಧಾನವಲ್ಲ. ಆ ಕಾರ್ಯವನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸುವ ಮೂಲಕ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ.
## ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ
@ -51,7 +51,7 @@ Matplotlib ಡೇಟಾ ವಿತರಣೆಯನ್ನು ದೃಶ್ಯೀಕ
birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
plt.show()
```
![distribution over the entire dataset](../../../../translated_images/kn/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.png)
![distribution over the entire dataset](../../../../translated_images/kn/dist1-wb.0d0cac82e2974fbb.webp)
ನೀವು ನೋಡಬಹುದು, ಈ ಡೇಟಾಸೆಟ್‌ನ 400+ ಪಕ್ಷಿಗಳಲ್ಲಿ ಬಹುತೇಕವು Max Body Mass ಗಾಗಿ 2000 ಕ್ಕಿಂತ ಕಡಿಮೆ ಶ್ರೇಣಿಯಲ್ಲಿ ಬರುತ್ತವೆ. `bins` ಪರಿಮಾಣವನ್ನು 30 ರಂತಹ ಹೆಚ್ಚಿನ ಸಂಖ್ಯೆಗೆ ಬದಲಾಯಿಸುವ ಮೂಲಕ ಡೇಟಾದ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಒಳನೋಟವನ್ನು ಪಡೆಯಿರಿ:
@ -59,7 +59,7 @@ plt.show()
birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
plt.show()
```
![distribution over the entire dataset with larger bins param](../../../../translated_images/kn/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.png)
![distribution over the entire dataset with larger bins param](../../../../translated_images/kn/dist2-wb.2c0a7a3499b2fbf5.webp)
ಈ ಚಾರ್ಟ್ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಸೂಕ್ಷ್ಮ ರೀತಿಯಲ್ಲಿ ವಿತರಣೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ಎಡಕ್ಕೆ ಕಡಿಮೆ ತಿರುವು ಹೊಂದಿರುವ ಚಾರ್ಟ್ ಅನ್ನು ನೀವು ನೀಡಲಾದ ಶ್ರೇಣಿಯೊಳಗಿನ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಆಯ್ಕೆಮಾಡುವ ಮೂಲಕ ರಚಿಸಬಹುದು:
@ -70,7 +70,7 @@ filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]
filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
plt.show()
```
![filtered histogram](../../../../translated_images/kn/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.png)
![filtered histogram](../../../../translated_images/kn/dist3-wb.64b88db7f9780200.webp)
✅ ಇನ್ನಷ್ಟು ಫಿಲ್ಟರ್‌ಗಳು ಮತ್ತು ಡೇಟಾ ಪಾಯಿಂಟ್‌ಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ. ಡೇಟಾದ ಸಂಪೂರ್ಣ ವಿತರಣೆಯನ್ನು ನೋಡಲು, `['MaxBodyMass']` ಫಿಲ್ಟರ್ ಅನ್ನು ತೆಗೆದುಹಾಕಿ ಲೇಬಲ್ ಮಾಡಲಾದ ವಿತರಣೆಯನ್ನು ತೋರಿಸಿ.
@ -87,7 +87,7 @@ hist = ax.hist2d(x, y)
```
ಈ ಎರಡು ಅಂಶಗಳ ನಡುವೆ ನಿರೀಕ್ಷಿತ ಅಕ್ಷದ ಮೇಲೆ ನಿರೀಕ್ಷಿತ ಸಂಬಂಧವಿದೆ, ಒಂದು ವಿಶೇಷವಾಗಿ ಬಲವಾದ ಸಂಯೋಜನೆಯ ಬಿಂದುವಿನೊಂದಿಗೆ:
![2D plot](../../../../translated_images/kn/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.png)
![2D plot](../../../../translated_images/kn/2D-wb.ae22fdd33936507a.webp)
ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾಗಾಗಿ ಡೀಫಾಲ್ಟ್‌ನಲ್ಲಿ ಚೆನ್ನಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ. ಪಠ್ಯ ಡೇಟಾ ಪ್ರಕಾರ ವಿತರಣೆಯನ್ನು ನೋಡಬೇಕಾದರೆ ಏನು ಮಾಡಬೇಕು?
## ಪಠ್ಯ ಡೇಟಾ ಬಳಸಿ ವಿತರಣೆಯನ್ನು ಅನ್ವೇಷಿಸಿ
@ -126,7 +126,7 @@ plt.gca().set(title='Conservation Status', ylabel='Min Wingspan')
plt.legend();
```
![wingspan and conservation collation](../../../../translated_images/kn/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.png)
![wingspan and conservation collation](../../../../translated_images/kn/histogram-conservation-wb.3c40450eb072c14d.webp)
ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರ ಮತ್ತು ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯ ನಡುವೆ ಉತ್ತಮ ಸಂಬಂಧವಿಲ್ಲದಂತೆ ತೋರುತ್ತದೆ. ಈ ವಿಧಾನವನ್ನು ಬಳಸಿ ಡೇಟಾಸೆಟ್‌ನ ಇತರ ಅಂಶಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ. ನೀವು ಯಾವುದೇ ಸಂಬಂಧವನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತೀರಾ?
@ -144,7 +144,7 @@ import matplotlib.pyplot as plt
sns.kdeplot(filteredBirds['MinWingspan'])
plt.show()
```
![Density plot](../../../../translated_images/kn/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.png)
![Density plot](../../../../translated_images/kn/density1.8801043bd4af2567.webp)
ನೀವು ನೋಡಬಹುದು, ಈ ಪ್ಲಾಟ್ ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರದ ಡೇಟಾಗಾಗಿ ಹಿಂದಿನದನ್ನು ಪ್ರತಿಧ್ವನಿಸುತ್ತದೆ; ಅದು ಸ್ವಲ್ಪ ಸೌಮ್ಯವಾಗಿದೆ. Seaborn ನ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಪ್ರಕಾರ, "ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗೆ ಹೋಲಿಸಿದರೆ, KDE ಒಂದು ಚಾರ್ಟ್ ಅನ್ನು ಉತ್ಪಾದಿಸಬಹುದು ಅದು ಕಡಿಮೆ ಗೊಂದಲಕಾರಿಯಾಗಿದ್ದು ಮತ್ತು ಹೆಚ್ಚು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದಾಗಿದೆ, ವಿಶೇಷವಾಗಿ ಬಹು ವಿತರಣೆಗಳನ್ನು ಚಿತ್ರಿಸುವಾಗ. ಆದರೆ ಮೂಲ ವಿತರಣೆಯು ಸೀಮಿತ ಅಥವಾ ಸೌಮ್ಯವಲ್ಲದಿದ್ದರೆ ವಕ್ರತೆಯು ಬದಲಾವಣೆಗಳನ್ನು ಪರಿಚಯಿಸುವ ಸಾಧ್ಯತೆ ಇದೆ. ಹಿಸ್ಟೋಗ್ರಾಮ್ ಹೋಲಾಗಿ, ಪ್ರತಿನಿಧಾನದ ಗುಣಮಟ್ಟವು ಉತ್ತಮ ಸ್ಮೂಥಿಂಗ್ ಪರಿಮಾಣಗಳ ಆಯ್ಕೆಯ ಮೇಲೂ ಅವಲಂಬಿತವಾಗಿದೆ." [ಮೂಲ](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) ಎಂದರೆ, ಔಟ್‌ಲೈಯರ್‌ಗಳು ಯಾವಾಗಲೂ ನಿಮ್ಮ ಚಾರ್ಟ್‌ಗಳನ್ನು ಕೆಟ್ಟ ರೀತಿಯಲ್ಲಿ ವರ್ತಿಸುವಂತೆ ಮಾಡುತ್ತವೆ.
@ -154,7 +154,7 @@ plt.show()
sns.kdeplot(filteredBirds['MaxBodyMass'])
plt.show()
```
![smooth bodymass line](../../../../translated_images/kn/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.png)
![smooth bodymass line](../../../../translated_images/kn/density2.8e7647257060ff54.webp)
ನೀವು ಸ್ಮೂಥ್ ಆಗಿದ್ದರೂ ಹೆಚ್ಚು ಸ್ಮೂಥ್ ಆಗದ ರೇಖೆಯನ್ನು ಬಯಸಿದರೆ, `bw_adjust` ಪರಿಮಾಣವನ್ನು ಸಂಪಾದಿಸಿ:
@ -162,7 +162,7 @@ plt.show()
sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
plt.show()
```
![less smooth bodymass line](../../../../translated_images/kn/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.png)
![less smooth bodymass line](../../../../translated_images/kn/density3.84ae27da82f31e6b.webp)
✅ ಈ ರೀತಿಯ ಪ್ಲಾಟ್‌ಗೆ ಲಭ್ಯವಿರುವ ಪರಿಮಾಣಗಳ ಬಗ್ಗೆ ಓದಿ ಮತ್ತು ಪ್ರಯೋಗ ಮಾಡಿ!
@ -176,7 +176,7 @@ sns.kdeplot(
)
```
![bodymass per order](../../../../translated_images/kn/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.png)
![bodymass per order](../../../../translated_images/kn/density4.e9d6c033f15c500f.webp)
ನೀವು ಒಂದೇ ಚಾರ್ಟ್‌ನಲ್ಲಿ ಹಲವಾರು ಚರಗಳ ಸಾಂದ್ರತೆಯನ್ನು ನಕ್ಷೆ ಮಾಡಬಹುದು. ಪಕ್ಷಿಯ MaxLength ಮತ್ತು MinLength ಅನ್ನು ಅದರ ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯೊಂದಿಗೆ ಹೋಲಿಸಿ:
@ -184,7 +184,7 @@ sns.kdeplot(
sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")
```
![multiple densities, superimposed](../../../../translated_images/kn/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.png)
![multiple densities, superimposed](../../../../translated_images/kn/multi.56548caa9eae8d0f.webp)
ಬಹುಶಃ 'ಅಸುರಕ್ಷಿತ' ಪಕ್ಷಿಗಳ ಗುಂಪಿನ ಉದ್ದಗಳ ಪ್ರಕಾರ ಅರ್ಥಪೂರ್ಣತೆ ಇದೆ ಅಥವಾ ಇಲ್ಲವೆ ಎಂಬುದನ್ನು ಸಂಶೋಧಿಸುವುದು ಲಾಭದಾಯಕವಾಗಬಹುದು.

@ -84,7 +84,7 @@ plt.show()
```
ಇದು, ಈ ಎರಡು ಮುಷ್ರೂಮ್ ವರ್ಗಗಳ ಪ್ರಕಾರ ಈ ಡೇಟಾದ ಪ್ರಮಾಣಗಳನ್ನು ತೋರಿಸುವ ಪೈ ಚಾರ್ಟ್. ಲೇಬಲ್‌ಗಳ ಕ್ರಮವನ್ನು ಸರಿಯಾಗಿ ಪಡೆಯುವುದು ಬಹಳ ಮುಖ್ಯ, ವಿಶೇಷವಾಗಿ ಇಲ್ಲಿ, ಆದ್ದರಿಂದ ಲೇಬಲ್ ಅರೆ ಅನ್ನು ರಚಿಸುವ ಕ್ರಮವನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ!
![pie chart](../../../../translated_images/kn/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.png)
![pie chart](../../../../translated_images/kn/pie1-wb.e201f2fcc3354131.webp)
## ಡೋನಟ್ಸ್!
@ -114,7 +114,7 @@ plt.title('Mushroom Habitats')
plt.show()
```
![donut chart](../../../../translated_images/kn/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.png)
![donut chart](../../../../translated_images/kn/donut-wb.be3c12a22712302b.webp)
ಈ ಕೋಡ್ ಒಂದು ಚಾರ್ಟ್ ಮತ್ತು ಮಧ್ಯದ ವೃತ್ತವನ್ನು ರಚಿಸುತ್ತದೆ, ನಂತರ ಆ ಮಧ್ಯದ ವೃತ್ತವನ್ನು ಚಾರ್ಟ್‌ನಲ್ಲಿ ಸೇರಿಸುತ್ತದೆ. ಮಧ್ಯದ ವೃತ್ತದ ಅಗಲವನ್ನು `0.40` ಅನ್ನು ಬೇರೆ ಮೌಲ್ಯಕ್ಕೆ ಬದಲಾಯಿಸುವ ಮೂಲಕ ಸಂಪಾದಿಸಬಹುದು.
@ -162,7 +162,7 @@ fig = plt.figure(
ವಾಫಲ್ ಚಾರ್ಟ್ ಬಳಸಿ, ನೀವು ಈ ಮುಷ್ರೂಮ್ ಡೇಟಾಸೆಟ್‌ನ ಕ್ಯಾಪ್ ಬಣ್ಣಗಳ ಪ್ರಮಾಣಗಳನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ನೋಡಬಹುದು. ಆಸಕ್ತಿದಾಯಕವಾಗಿ, ಇಲ್ಲಿ ಹಲವಾರು ಹಸಿರು ಕ್ಯಾಪ್ ಮುಷ್ರೂಮ್ಗಳು ಇವೆ!
![waffle chart](../../../../translated_images/kn/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.png)
![waffle chart](../../../../translated_images/kn/waffle.5455dbae4ccf17d5.webp)
✅ Pywaffle ಚಾರ್ಟ್‌ಗಳಲ್ಲಿ [Font Awesome](https://fontawesome.com/) ನಲ್ಲಿ ಲಭ್ಯವಿರುವ ಯಾವುದೇ ಐಕಾನ್‌ಗಳನ್ನು ಬಳಸುವ ಐಕಾನ್‌ಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಚೌಕಗಳ ಬದಲು ಐಕಾನ್‌ಗಳನ್ನು ಬಳಸಿ ಇನ್ನಷ್ಟು ಆಸಕ್ತಿದಾಯಕ ವಾಫಲ್ ಚಾರ್ಟ್ ರಚಿಸಲು ಪ್ರಯೋಗ ಮಾಡಿ.

@ -42,7 +42,7 @@ honey.head()
```python
sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
```
![scatterplot 1](../../../../translated_images/kn/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.png)
![scatterplot 1](../../../../translated_images/kn/scatter1.5e1aa5fd6706c5d1.webp)
ಈಗ, ವರ್ಷಗಳ ಪ್ರಗತಿಯನ್ನು ತೋರಿಸಲು ಜೇನುತುಪ್ಪ ಬಣ್ಣದ ಯೋಜನೆಯನ್ನು ಬಳಸಿ ಅದೇ ಡೇಟಾವನ್ನು ತೋರಿಸಿ. ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಬದಲಾವಣೆಯನ್ನು ತೋರಿಸಲು 'hue' ಪರಿಮಾಣವನ್ನು ಸೇರಿಸಬಹುದು:
@ -51,7 +51,7 @@ sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
```python
sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5);
```
![scatterplot 2](../../../../translated_images/kn/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.png)
![scatterplot 2](../../../../translated_images/kn/scatter2.c0041a58621ca702.webp)
ಈ ಬಣ್ಣ ಯೋಜನೆಯ ಬದಲಾವಣೆಯಿಂದ, ಜೇನುತುಪ್ಪ ಬೆಲೆ ಪ್ರತಿ ಪೌಂಡ್ ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಸ್ಪಷ್ಟವಾಗಿ ಹೆಚ್ಚುತ್ತಿರುವುದು ಕಾಣುತ್ತದೆ. ನಿಜವಾಗಿಯೂ, ಡೇಟಾದ ಒಂದು ಮಾದರಿ ಸೆಟ್ (ಉದಾಹರಣೆಗೆ, ಅರಿಜೋನಾ ರಾಜ್ಯ) ನೋಡಿದರೆ, ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಬೆಲೆ ಏರಿಕೆಯ ಮಾದರಿಯನ್ನು ಕೆಲವು ಅಪವಾದಗಳೊಂದಿಗೆ ಕಾಣಬಹುದು:
@ -80,7 +80,7 @@ sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspec
```
ನೀವು ಬಿಂದುಗಳ ಗಾತ್ರ ಕ್ರಮೇಣ ಹೆಚ್ಚುತ್ತಿರುವುದನ್ನು ಕಾಣಬಹುದು.
![scatterplot 3](../../../../translated_images/kn/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.png)
![scatterplot 3](../../../../translated_images/kn/scatter3.3c160a3d1dcb36b3.webp)
ಇದು ಸರಳ ಸರಬರಾಜು ಮತ್ತು ಬೇಡಿಕೆ ಪ್ರಕರಣವೇ? ಹವಾಮಾನ ಬದಲಾವಣೆ ಮತ್ತು ಕಾಲೋನಿ ಕಾಲಾಪ್ಸ್ ಮುಂತಾದ ಕಾರಣಗಳಿಂದ, ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಕಡಿಮೆ ಜೇನುತುಪ್ಪ ಲಭ್ಯವಿದೆಯೇ, ಆದ್ದರಿಂದ ಬೆಲೆ ಏರಿಕೆಯಾಗುತ್ತಿದೆಯೇ?
@ -95,7 +95,7 @@ sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
```
ಉತ್ತರ: ಹೌದು, 2003 ರ ಸುತ್ತಲೂ ಕೆಲವು ಅಪವಾದಗಳೊಂದಿಗೆ:
![line chart 1](../../../../translated_images/kn/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.png)
![line chart 1](../../../../translated_images/kn/line1.f36eb465229a3b1f.webp)
✅ Seaborn ಒಂದು ಲೈನ್ ಸುತ್ತಲೂ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವುದರಿಂದ, "ಪ್ರತಿ x ಮೌಲ್ಯದ ಮೇಲೆ ಹಲವಾರು ಅಳೆಯುವಿಕೆಗಳನ್ನು ಸರಾಸರಿ ಮತ್ತು ಸರಾಸರಿಯ ಸುತ್ತಲೂ 95% ವಿಶ್ವಾಸಾಂಶವನ್ನು ಪ್ಲಾಟ್ ಮಾಡುತ್ತದೆ". [ಮೂಲ](https://seaborn.pydata.org/tutorial/relational.html). ಈ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುವ ವರ್ತನೆಯನ್ನು `ci=None` ಸೇರಿಸುವ ಮೂಲಕ ನಿಷ್ಕ್ರಿಯಗೊಳಿಸಬಹುದು.
@ -105,7 +105,7 @@ sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
sns.relplot(x="year", y="totalprod", kind="line", data=honey);
```
![line chart 2](../../../../translated_images/kn/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.png)
![line chart 2](../../../../translated_images/kn/line2.a5b3493dc01058af.webp)
ಉತ್ತರ: ಅಲ್ಲ. ಒಟ್ಟು ಉತ್ಪಾದನೆ ನೋಡಿದರೆ, ಆ ವಿಶೇಷ ವರ್ಷದಲ್ಲಿ ಅದು ಹೆಚ್ಚಿದಂತೆ ತೋರುತ್ತದೆ, ಆದರೂ ಸಾಮಾನ್ಯವಾಗಿ ಈ ವರ್ಷಗಳಲ್ಲಿ ಜೇನುತುಪ್ಪ ಉತ್ಪಾದನೆ ಕಡಿಮೆಯಾಗುತ್ತಿದೆ.
@ -130,7 +130,7 @@ sns.relplot(
```
ಈ ದೃಶ್ಯೀಕರಣದಲ್ಲಿ, ನೀವು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಮತ್ತು ಪ್ರತಿ ಕಾಲೋನಿಯ ಉತ್ಪಾದನೆಯನ್ನು ಹೋಲಿಸಬಹುದು, ಕಾಲಮ್‌ಗಳಿಗೆ 3 ರಲ್ಲಿ ರ್ಯಾಪ್ ಹೊಂದಿಸಿ:
![facet grid](../../../../translated_images/kn/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.png)
![facet grid](../../../../translated_images/kn/facet.6a34851dcd540050.webp)
ಈ ಡೇಟಾಸೆಟ್‌ಗೆ, ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಮತ್ತು ಅವರ ಉತ್ಪಾದನೆ ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಮತ್ತು ರಾಜ್ಯದಿಂದ ರಾಜ್ಯಕ್ಕೆ ವಿಶೇಷವಾಗಿ ಹೊರಹೊಮ್ಮುವುದಿಲ್ಲ. ಈ ಎರಡು ವ್ಯತ್ಯಾಸಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಬೇರೆ ವಿಧಾನವಿದೆಯೇ?
@ -153,7 +153,7 @@ sns.despine(right=False)
plt.ylabel('colony yield')
ax.figure.legend();
```
![superimposed plots](../../../../translated_images/kn/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.png)
![superimposed plots](../../../../translated_images/kn/dual-line.a4c28ce659603fab.webp)
2003 ರ ಸುತ್ತಲೂ ಯಾವುದೇ ಸ್ಪಷ್ಟ ಬದಲಾವಣೆ ಕಾಣಿಸದಿದ್ದರೂ, ಈ ಪಾಠವನ್ನು ಸ್ವಲ್ಪ ಸಂತೋಷಕರವಾಗಿ ಮುಗಿಸಲು ಇದು ಸಹಾಯ ಮಾಡುತ್ತದೆ: ಒಟ್ಟು ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಕಡಿಮೆಯಾಗುತ್ತಿದೆಯಾದರೂ, ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಸ್ಥಿರವಾಗುತ್ತಿದೆ ಮತ್ತು ಅವರ ಉತ್ಪಾದನೆ ಪ್ರತಿ ಕಾಲೋನಿಗೂ ಕಡಿಮೆಯಾಗುತ್ತಿದೆ.

@ -38,25 +38,25 @@
ಒಂದು ಡೇಟಾ ವಿಜ್ಞಾನಿ ಸರಿಯಾದ ಡೇಟಾಗೆ ಸರಿಯಾದ ಚಾರ್ಟ್ ಆಯ್ಕೆಮಾಡಿದರೂ ಸಹ, ಡೇಟಾವನ್ನು ತೋರಿಸುವ ಹಲವು ಮಾರ್ಗಗಳಿವೆ, ಅವು ಡೇಟಾವನ್ನು ಹಾಳುಮಾಡುವ ಬೆಲೆಗಾಗಿ ಒಂದು ವಿಷಯವನ್ನು ಸಾಬೀತುಪಡಿಸಲು. ಮೋಸಮಯ ಚಾರ್ಟ್‌ಗಳು ಮತ್ತು ಇನ್ಫೋಗ್ರಾಫಿಕ್ಸ್‌ಗಳ ಅನೇಕ ಉದಾಹರಣೆಗಳಿವೆ!
[![ಅಲ್ಬೆರ್ಟೋ ಕೈರೋ ಅವರ "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ"](../../../../translated_images/kn/tornado.9f42168791208f970d6faefc11d1226d7ca89518013b14aa66b1c9edcd7678d2.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ")
[![ಅಲ್ಬೆರ್ಟೋ ಕೈರೋ ಅವರ "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ"](../../../../translated_images/kn/tornado.9f42168791208f97.webp)](https://www.youtube.com/watch?v=oX74Nge8Wkw "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ")
> 🎥 ಮೇಲಿನ ಚಿತ್ರವನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಮೋಸಮಯ ಚಾರ್ಟ್‌ಗಳ ಬಗ್ಗೆ ಸಮ್ಮೇಳನ ಮಾತುಕತೆಗಾಗಿ
ಈ ಚಾರ್ಟ್ X ಅಕ್ಷವನ್ನು ತಿರುಗಿಸಿ ಸತ್ಯದ ವಿರುದ್ಧ ತೋರಿಸುತ್ತದೆ, ದಿನಾಂಕ ಆಧಾರಿತವಾಗಿ:
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 1](../../../../translated_images/kn/bad-chart-1.93130f495b748bedfb3423d91b1e754d9026e17f94ad967aecdc9ca7203373bf.png)
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 1](../../../../translated_images/kn/bad-chart-1.93130f495b748bed.webp)
[ಈ ಚಾರ್ಟ್](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) ಇನ್ನೂ ಹೆಚ್ಚು ಮೋಸಮಯವಾಗಿದೆ, ಕಣ್ಣು ಬಲಕ್ಕೆ ಸೆಳೆಯುತ್ತದೆ ಮತ್ತು ಸಮಯದೊಂದಿಗೆ COVID ಪ್ರಕರಣಗಳು ವಿವಿಧ ಜಿಲ್ಲೆಗಳಲ್ಲಿ ಕಡಿಮೆಯಾಗಿವೆ ಎಂದು ತೀರ್ಮಾನಿಸುತ್ತದೆ. ವಾಸ್ತವವಾಗಿ, ದಿನಾಂಕಗಳನ್ನು ಗಮನದಿಂದ ನೋಡಿದರೆ, ಅವು ಮೋಸಮಯ ಇಳಿಜಾರಿನ ಪ್ರವೃತ್ತಿಯನ್ನು ನೀಡಲು ಮರುಕ್ರಮಿಸಲಾಗಿದೆ.
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 2](../../../../translated_images/kn/bad-chart-2.c20e36dd4e6f617c0c325878dd421a563885bbf30a394884c147438827254e0e.jpg)
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 2](../../../../translated_images/kn/bad-chart-2.c20e36dd4e6f617c.webp)
ಈ ಪ್ರಸಿದ್ಧ ಉದಾಹರಣೆ ಬಣ್ಣ ಮತ್ತು ತಿರುಗಿದ Y ಅಕ್ಷವನ್ನು ಬಳಸಿಕೊಂಡು ಮೋಸ ಮಾಡುತ್ತದೆ: ಗನ್-ಸ್ನೇಹಿ ಕಾನೂನುಗಳ ಅಂಗೀಕಾರದ ನಂತರ ಗನ್ ಸಾವುಗಳು ಏರಿಕೆಯಾಗಿವೆ ಎಂದು ತೀರ್ಮಾನಿಸುವ ಬದಲು, ಕಣ್ಣು ವಿರುದ್ಧವನ್ನು ನಂಬುವಂತೆ ಮೋಸ ಮಾಡುತ್ತದೆ:
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 3](../../../../translated_images/kn/bad-chart-3.6865d0afac4108d737558d90a61547d23a8722896397ec792264ee51a1be4be5.jpg)
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 3](../../../../translated_images/kn/bad-chart-3.6865d0afac4108d7.webp)
ಈ ವಿಚಿತ್ರ ಚಾರ್ಟ್ ಅನುಪಾತವನ್ನು ಹೇಗೆ ಮ್ಯಾನಿಪ್ಯುಲೇಟ್ ಮಾಡಬಹುದು ಎಂಬುದನ್ನು ಹಾಸ್ಯಾಸ್ಪದ ಪರಿಣಾಮದೊಂದಿಗೆ ತೋರಿಸುತ್ತದೆ:
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 4](../../../../translated_images/kn/bad-chart-4.68cfdf4011b454471053ee1231172747e1fbec2403b4443567f1dc678134f4f2.jpg)
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 4](../../../../translated_images/kn/bad-chart-4.68cfdf4011b45447.webp)
ತೋಲಿಸಲಾಗದ ವಸ್ತುಗಳನ್ನು ಹೋಲಿಸುವುದು ಇನ್ನೊಂದು ಅನುಮಾನಾಸ್ಪದ ತಂತ್ರ. 'ಸ್ಪ್ಯೂರಿಯಸ್ ಕೊರಿಲೇಶನ್ಸ್' ಬಗ್ಗೆ ಸಂಪೂರ್ಣ ವೆಬ್‌ಸೈಟ್ ಇದೆ, ಇದು ಮೇನ್‌ನ ವಿಚ್ಛೇದನ ದರ ಮತ್ತು ಮಾರ್ಗರಿನ್ ಸೇವನೆ ಮುಂತಾದ ವಿಷಯಗಳನ್ನು ಹೊಂದಿರುವ 'ತಥ್ಯಗಳನ್ನು' ತೋರಿಸುತ್ತದೆ. ರೆಡಿಟ್ ಗುಂಪು ಕೂಡ ಡೇಟಾ ಬಳಕೆಯ [ಕಿರುಕುಳಗಳನ್ನು](https://www.reddit.com/r/dataisugly/top/?t=all) ಸಂಗ್ರಹಿಸುತ್ತದೆ.
@ -91,13 +91,13 @@
ನಿಮ್ಮ ಡೇಟಾ ಪಠ್ಯರೂಪದಲ್ಲಿದ್ದರೆ ಮತ್ತು X ಅಕ್ಷದಲ್ಲಿ ಬಹುಶಃVerbose ಆಗಿದ್ದರೆ, ಓದಲು ಸುಲಭವಾಗಲು ಪಠ್ಯವನ್ನು ತಿರುಗಿಸಬಹುದು. [Matplotlib](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) 3D ಪ್ಲಾಟಿಂಗ್ ಅನ್ನು ಒದಗಿಸುತ್ತದೆ, ನಿಮ್ಮ ಡೇಟಾ ಅದನ್ನು ಬೆಂಬಲಿಸಿದರೆ. ಸುಧಾರಿತ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳನ್ನು `mpl_toolkits.mplot3d` ಬಳಸಿ ಉತ್ಪಾದಿಸಬಹುದು.
![3D ಪ್ಲಾಟ್‌ಗಳು](../../../../translated_images/kn/3d.0cec12bcc60f0ce7284c63baed1411a843e24716f7d7425de878715ebad54a15.png)
![3D ಪ್ಲಾಟ್‌ಗಳು](../../../../translated_images/kn/3d.0cec12bcc60f0ce7.webp)
## ಅನಿಮೇಶನ್ ಮತ್ತು 3D ಚಾರ್ಟ್ ಪ್ರದರ್ಶನ
ಇಂದಿನ ಅತ್ಯುತ್ತಮ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳಲ್ಲಿ ಕೆಲವು ಅನಿಮೇಟೆಡ್ ಆಗಿವೆ. ಶಿರ್ಲಿ ವು D3 ಬಳಸಿ ಅದ್ಭುತವಾದವುಗಳನ್ನು ಮಾಡಿದ್ದಾಳೆ, ಉದಾಹರಣೆಗೆ '[ಫಿಲ್ಮ್ ಫ್ಲವರ್ಸ್](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', ಇಲ್ಲಿ ಪ್ರತಿ ಹೂವು ಒಂದು ಚಲನಚಿತ್ರದ ದೃಶ್ಯೀಕರಣವಾಗಿದೆ. ಇನ್ನೊಂದು ಉದಾಹರಣೆ ಗಾರ್ಡಿಯನ್‌ನ 'ಬಸ್ಸ್ಡ್ ಔಟ್', ಇದು ಗ್ರೀನ್ಸಾಕ್ ಮತ್ತು D3 ಜೊತೆಗೆ ಸ್ಕ್ರೋಲಿಟೆಲಿಂಗ್ ಲೇಖನ ಫಾರ್ಮ್ಯಾಟ್ ಅನ್ನು ಸಂಯೋಜಿಸಿ NYC ತನ್ನ ಬಡವರ ಸಮಸ್ಯೆಯನ್ನು ಬಸ್ಸಿಂಗ್ ಮೂಲಕ ಹೇಗೆ ನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ತೋರಿಸುವ ಇಂಟರಾಕ್ಟಿವ್ ಅನುಭವ.
![ಬಸ್ಸಿಂಗ್](../../../../translated_images/kn/busing.7b9e3b41cd4b981c6d63922cd82004cc1cf18895155536c1d98fcc0999bdd23e.png)
![ಬಸ್ಸಿಂಗ್](../../../../translated_images/kn/busing.7b9e3b41cd4b981c.webp)
> "ಬಸ್ಸ್ಡ್ ಔಟ್: ಅಮೆರಿಕ ತನ್ನ ಬಡವರನ್ನು ಹೇಗೆ ಸಾಗಿಸುತ್ತದೆ" [ಗಾರ್ಡಿಯನ್](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study) ನಿಂದ. ದೃಶ್ಯೀಕರಣಗಳು ನಾಡಿಯೆ ಬ್ರೆಮರ್ ಮತ್ತು ಶಿರ್ಲಿ ವು ಅವರಿಂದ
@ -107,7 +107,7 @@
ನೀವು ಈ ಸಾಮಾಜಿಕ ಜಾಲತಾಣದ ಅನಿಮೇಟೆಡ್ ವೀಕ್ಷಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸುವ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಪೂರ್ಣಗೊಳಿಸುವಿರಿ. ಇದು Vue.js ಮತ್ತು D3 ಬಳಸಿ [ಜಾಲತಾಣದ ದೃಶ್ಯ](https://github.com/emiliorizzo/vue-d3-network) ರಚಿಸಲು ನಿರ್ಮಿಸಲಾದ ಗ್ರಂಥಾಲಯವನ್ನು ಬಳಸುತ್ತದೆ. ಅಪ್ಲಿಕೇಶನ್ ಚಾಲನೆಯಲ್ಲಿದ್ದಾಗ, ನೀವು ಡೇಟಾವನ್ನು ಮರುಕ್ರಮಿಸಲು ಪರದೆ ಮೇಲೆ ನೋಡ್‌ಗಳನ್ನು ಎಳೆಯಬಹುದು.
![ಲಿಯಾಸನ್ಸ್](../../../../translated_images/kn/liaisons.7b440b28f6d07ea430244fdf1fc4c64ff48f473f143b8e921846eda1c302aeba.png)
![ಲಿಯಾಸನ್ಸ್](../../../../translated_images/kn/liaisons.7b440b28f6d07ea4.webp)
## ಪ್ರಾಜೆಕ್ಟ್: D3.js ಬಳಸಿ ಜಾಲತಾಣವನ್ನು ತೋರಿಸಲು ಚಾರ್ಟ್ ನಿರ್ಮಿಸಿ

@ -57,7 +57,7 @@ ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
```
ಇಲ್ಲಿ, ನೀವು `ggplot2` ಪ್ಯಾಕೇಜ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ ನಂತರ `library("ggplot2")` ಕಮಾಂಡ್ ಬಳಸಿ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ಗೆ ಆಮದುಮಾಡುತ್ತೀರಿ. ggplot ನಲ್ಲಿ ಯಾವುದೇ ಪ್ಲಾಟ್ ರಚಿಸಲು `ggplot()` ಫಂಕ್ಷನ್ ಬಳಸಲಾಗುತ್ತದೆ ಮತ್ತು ಡೇಟಾಸೆಟ್, x ಮತ್ತು y ಚರಗಳನ್ನು ಗುಣಲಕ್ಷಣಗಳಾಗಿ ಸೂಚಿಸಲಾಗುತ್ತದೆ. ಈ ಪ್ರಕರಣದಲ್ಲಿ, ನಾವು ರೇಖಾ ಪ್ಲಾಟ್ ರಚಿಸಲು `geom_line()` ಫಂಕ್ಷನ್ ಬಳಸುತ್ತೇವೆ.
![MaxWingspan-lineplot](../../../../../translated_images/kn/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.png)
![MaxWingspan-lineplot](../../../../../translated_images/kn/MaxWingspan-lineplot.b12169f99d26fdd2.webp)
ನೀವು ತಕ್ಷಣವೇ ಏನು ಗಮನಿಸುತ್ತೀರಿ? ಕನಿಷ್ಠ ಒಂದು ಹೊರಗಿನ ಮೌಲ್ಯವಿದೆ - ಅದು ತುಂಬಾ ದೊಡ್ಡ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ! 2000+ ಸೆಂ.ಮೀ. ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿ 20 ಮೀಟರ್‌ಗಿಂತ ಹೆಚ್ಚು - ಮಿನೆಸೋಟಾದಲ್ಲಿ ಪ್ಟೆರೋಡ್ಯಾಕ್ಟೈಲ್ಸ್ ಓಡಾಡುತ್ತಿವೆಯೇ? ಪರಿಶೀಲಿಸೋಣ.
@ -75,7 +75,7 @@ ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
```
ನಾವು `theme` ನಲ್ಲಿ ಕೋನವನ್ನು ಸೂಚಿಸುತ್ತೇವೆ ಮತ್ತು `xlab()` ಮತ್ತು `ylab()` ನಲ್ಲಿ ಕ್ರಮವಾಗಿ x ಮತ್ತು y ಅಕ್ಷದ ಲೇಬಲ್ಗಳನ್ನು ನಿಗದಿಪಡಿಸುತ್ತೇವೆ. `ggtitle()` ಗ್ರಾಫ್/ಪ್ಲಾಟ್‌ಗೆ ಹೆಸರು ನೀಡುತ್ತದೆ.
![MaxWingspan-lineplot-improved](../../../../../translated_images/kn/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.png)
![MaxWingspan-lineplot-improved](../../../../../translated_images/kn/MaxWingspan-lineplot-improved.04b73b4d5a59552a.webp)
ಲೇಬಲ್ಗಳ ತಿರುಗುವಿಕೆಯನ್ನು 45 ಡಿಗ್ರಿ ಗೆ ಹೊಂದಿಸಿದರೂ, ಓದಲು ತುಂಬಾ ಹೆಚ್ಚು ಇದೆ. ಬೇರೆ ತಂತ್ರವನ್ನು ಪ್ರಯತ್ನಿಸೋಣ: ಹೊರಗಿನ ಮೌಲ್ಯಗಳಿಗೆ ಮಾತ್ರ ಲೇಬಲ್ಗಳನ್ನು ನೀಡಿ ಮತ್ತು ಲೇಬಲ್ಗಳನ್ನು ಚಾರ್ಟ್ ಒಳಗೆ ಸೆಟ್ ಮಾಡಿ. ಲೇಬಲಿಂಗ್‌ಗೆ ಹೆಚ್ಚು ಜಾಗ ಮಾಡಲು ಸ್ಕ್ಯಾಟರ್ ಚಾರ್ಟ್ ಬಳಸಬಹುದು:
@ -91,7 +91,7 @@ ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
ನೀವು ಏನು ಕಂಡುಹಿಡಿದಿರಿ?
![MaxWingspan-scatterplot](../../../../../translated_images/kn/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.png)
![MaxWingspan-scatterplot](../../../../../translated_images/kn/MaxWingspan-scatterplot.60dc9e0e19d32700.webp)
## ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿ
@ -110,7 +110,7 @@ ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
```
ನಾವು ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ `birds_filtered` ರಚಿಸಿ ನಂತರ ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ ರಚಿಸಿದ್ದೇವೆ. ಹೊರಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿದ ನಂತರ, ನಿಮ್ಮ ಡೇಟಾ ಈಗ ಹೆಚ್ಚು ಸಮ್ಮಿಲಿತ ಮತ್ತು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದಾಗಿದೆ.
![MaxWingspan-scatterplot-improved](../../../../../translated_images/kn/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.png)
![MaxWingspan-scatterplot-improved](../../../../../translated_images/kn/MaxWingspan-scatterplot-improved.7d0af81658c65f3e.webp)
ಈಗ ರೆಕ್ಕೆ ವ್ಯಾಪ್ತಿಯ ದೃಷ್ಟಿಯಿಂದ ಸ್ವಚ್ಛವಾದ ಡೇಟಾಸೆಟ್ ಇದ್ದು, ಈ ಪಕ್ಷಿಗಳ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳೋಣ.
@ -150,7 +150,7 @@ birds_filtered %>% group_by(Category) %>%
```
ಕೆಳಗಿನ ಸ্নಿಪೆಟ್‌ನಲ್ಲಿ, ಡೇಟಾ ಮ್ಯಾನಿಪ್ಯುಲೇಶನ್ ಮತ್ತು ಗುಂಪು ಮಾಡಲು ಸಹಾಯ ಮಾಡುವ [dplyr](https://www.rdocumentation.org/packages/dplyr/versions/0.7.8) ಮತ್ತು [lubridate](https://www.rdocumentation.org/packages/lubridate/versions/1.8.0) ಪ್ಯಾಕೇಜ್‌ಗಳನ್ನು ಸ್ಥಾಪಿಸುತ್ತೇವೆ. ಮೊದಲು, ನೀವು ಪಕ್ಷಿಯ `Category` ಮೂಲಕ ಡೇಟಾವನ್ನು ಗುಂಪುಮಾಡಿ ನಂತರ `MinLength`, `MaxLength`, `MinBodyMass`, `MaxdyMass`, `MinWingspan`, `MaxWingspan` ಕಾಲಮ್‌ಗಳನ್ನು ಸಾರಾಂಶಗೊಳಿಸುತ್ತೀರಿ. ನಂತರ, `ggplot2` ಪ್ಯಾಕೇಜ್ ಬಳಸಿ ಬಾರ್ ಚಾರ್ಟ್ ಅನ್ನು ಪ್ಲಾಟ್ ಮಾಡಿ ವಿಭಿನ್ನ ವರ್ಗಗಳಿಗೆ ಬಣ್ಣಗಳನ್ನು ಮತ್ತು ಲೇಬಲ್ಗಳನ್ನು ಸೂಚಿಸುತ್ತೀರಿ.
![Stacked bar chart](../../../../../translated_images/kn/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.png)
![Stacked bar chart](../../../../../translated_images/kn/stacked-bar-chart.0c92264e89da7b39.webp)
ಈ ಬಾರ್ ಚಾರ್ಟ್ ಓದಲು ಅಸಾಧ್ಯವಾಗಿದೆ ಏಕೆಂದರೆ ಅತಿಯಾದ ಗುಂಪುಮಾಡದ ಡೇಟಾ ಇದೆ. ನೀವು ಪ್ಲಾಟ್ ಮಾಡಲು ಬಯಸುವ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಆಯ್ಕೆಮಾಡಬೇಕು, ಆದ್ದರಿಂದ ಪಕ್ಷಿಗಳ ಉದ್ದವನ್ನು ಅವುಗಳ ವರ್ಗದ ಆಧಾರದ ಮೇಲೆ ನೋಡೋಣ.
@ -165,7 +165,7 @@ ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()
```
ಮೊದಲು ನೀವು `Category` ಕಾಲಮ್‌ನ ವಿಶಿಷ್ಟ ಮೌಲ್ಯಗಳನ್ನು ಎಣಿಸಿ ನಂತರ ಅವುಗಳನ್ನು ಹೊಸ ಡೇಟಾಫ್ರೇಮ್ `birds_count` ಗೆ ಸರಿಸುಮಾರು ಮಾಡುತ್ತೀರಿ. ಈ ಸರಿಗೊಳಿಸಿದ ಡೇಟಾವನ್ನು ಅದೇ ಮಟ್ಟದಲ್ಲಿ ಫ್ಯಾಕ್ಟರ್ ಮಾಡಿ ಆದ್ದರಿಂದ ಅದು ಸರಿಗೊಳಿಸಿದ ರೀತಿಯಲ್ಲಿ ಪ್ಲಾಟ್ ಆಗುತ್ತದೆ. ನಂತರ `ggplot2` ಬಳಸಿ ಬಾರ್ ಚಾರ್ಟ್ ರಚಿಸುತ್ತೀರಿ. `coord_flip()` ಹೋರಿಜಾಂಟಲ್ ಬಾರ್‌ಗಳನ್ನು ಪ್ಲಾಟ್ ಮಾಡುತ್ತದೆ.
![category-length](../../../../../translated_images/kn/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.png)
![category-length](../../../../../translated_images/kn/category-length.7e34c296690e85d6.webp)
ಈ ಬಾರ್ ಚಾರ್ಟ್ ಪ್ರತಿ ವರ್ಗದಲ್ಲಿನ ಪಕ್ಷಿಗಳ ಸಂಖ್ಯೆಯ ಉತ್ತಮ ದೃಶ್ಯವನ್ನು ತೋರಿಸುತ್ತದೆ. ಕ್ಷಣದಲ್ಲಿಯೇ ನೀವು ಈ ಪ್ರದೇಶದಲ್ಲಿ Ducks/Geese/Waterfowl ವರ್ಗದಲ್ಲಿರುವ ಪಕ್ಷಿಗಳ ಸಂಖ್ಯೆ ಅತ್ಯಂತ ಹೆಚ್ಚು ಎಂದು ನೋಡಬಹುದು. ಮಿನೆಸೋಟಾ '10,000 ಸರೋವರಗಳ ಭೂಮಿ' ಆಗಿರುವುದರಿಂದ ಇದು ಆಶ್ಚರ್ಯಕರವಲ್ಲ!
@ -188,7 +188,7 @@ ggplot(birds_grouped,aes(Category,MaxLength))+geom_bar(stat="identity")+coord_fl
```
ನಾವು `birds_filtered` ಡೇಟಾವನ್ನು `Category` ಮೂಲಕ ಗುಂಪುಮಾಡಿ ನಂತರ ಬಾರ್ ಗ್ರಾಫ್ ರಚಿಸುತ್ತೇವೆ.
![comparing data](../../../../../translated_images/kn/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.png)
![comparing data](../../../../../translated_images/kn/comparingdata.f486a450d61c7ca5.webp)
ಇಲ್ಲಿ ಏನೂ ಆಶ್ಚರ್ಯಕರವಿಲ್ಲ: ಹುಮ್ಮಿಂಗ್‌ಬರ್ಡ್‌ಗಳು ಪೆಲಿಕಾನ್ಸ್ ಅಥವಾ ಗೀಸೆಗಳಿಗಿಂತ ಕಡಿಮೆ ಗರಿಷ್ಠ ಉದ್ದ ಹೊಂದಿವೆ. ಡೇಟಾ ತಾರ್ಕಿಕವಾಗಿದ್ದರೆ ಚೆನ್ನಾಗಿದೆ!
@ -200,7 +200,7 @@ ggplot(data=birds_grouped, aes(x=Category)) +
geom_bar(aes(y=MinLength), stat="identity", position="identity", fill='orange')+
coord_flip()
```
![super-imposed values](../../../../../translated_images/kn/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.png)
![super-imposed values](../../../../../translated_images/kn/superimposed-values.5363f0705a1da416.webp)
## 🚀 ಸವಾಲು

@ -36,7 +36,7 @@ ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
geom_point() +
ggtitle("Max Length per order") + coord_flip()
```
![max length per order](../../../../../translated_images/kn/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.png)
![max length per order](../../../../../translated_images/kn/max-length-per-order.e5b283d952c78c12.webp)
ಇದು ಪಕ್ಷಿ ಕ್ರಮದ ಪ್ರತಿ ದೇಹ ಉದ್ದದ ಸಾಮಾನ್ಯ ವಿತರಣೆಯ ಅವಲೋಕನವನ್ನು ನೀಡುತ್ತದೆ, ಆದರೆ ಇದು ನಿಜವಾದ ವಿತರಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸಲು ಅತ್ಯುತ್ತಮ ವಿಧಾನವಲ್ಲ. ಆ ಕಾರ್ಯವನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಹಿಸ್ಟೋಗ್ರಾಮ್ ರಚಿಸುವ ಮೂಲಕ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ.
## ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ
@ -47,7 +47,7 @@ ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
geom_histogram(bins=10)+ylab('Frequency')
```
![distribution over entire dataset](../../../../../translated_images/kn/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.png)
![distribution over entire dataset](../../../../../translated_images/kn/distribution-over-the-entire-dataset.d22afd3fa96be854.webp)
ನೀವು ನೋಡಬಹುದು, ಈ ಡೇಟಾಸೆಟ್‌ನ 400+ ಪಕ್ಷಿಗಳ ಬಹುತೇಕವು ಗರಿಷ್ಠ ದೇಹ ಭಾರದ 2000 ಕ್ಕಿಂತ ಕಡಿಮೆ ವ್ಯಾಪ್ತಿಯಲ್ಲಿ ಬರುತ್ತವೆ. `bins` ಪರಿಮಾಣವನ್ನು 30 ರಂತಹ ಹೆಚ್ಚಿನ ಸಂಖ್ಯೆಗೆ ಬದಲಾಯಿಸುವ ಮೂಲಕ ಡೇಟಾದ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಒಳನೋಟವನ್ನು ಪಡೆಯಿರಿ:
@ -55,7 +55,7 @@ ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) + geom_histogram(bins=30)+ylab('Frequency')
```
![distribution-30bins](../../../../../translated_images/kn/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.png)
![distribution-30bins](../../../../../translated_images/kn/distribution-30bins.6a3921ea7a421bf7.webp)
ಈ ಚಾರ್ಟ್ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಸೂಕ್ಷ್ಮ ರೀತಿಯಲ್ಲಿ ವಿತರಣೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ಎಡಕ್ಕೆ ಕಡಿಮೆ ತಿರುವು ಹೊಂದಿರುವ ಚಾರ್ಟ್ ಅನ್ನು ನೀವು ನಿರ್ದಿಷ್ಟ ವ್ಯಾಪ್ತಿಯೊಳಗಿನ ಡೇಟಾವನ್ನು ಮಾತ್ರ ಆಯ್ಕೆಮಾಡುವ ಮೂಲಕ ರಚಿಸಬಹುದು:
@ -67,7 +67,7 @@ ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_histogram(bins=30)+ylab('Frequency')
```
![filtered histogram](../../../../../translated_images/kn/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.png)
![filtered histogram](../../../../../translated_images/kn/filtered-histogram.6bf5d2bfd8253322.webp)
✅ ಇನ್ನಷ್ಟು ಫಿಲ್ಟರ್‌ಗಳು ಮತ್ತು ಡೇಟಾ ಪಾಯಿಂಟ್‌ಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ. ಡೇಟಾದ ಸಂಪೂರ್ಣ ವಿತರಣೆಯನ್ನು ನೋಡಲು, ಲೇಬಲ್ ಮಾಡಲಾದ ವಿತರಣೆಯನ್ನು ತೋರಿಸಲು `['MaxBodyMass']` ಫಿಲ್ಟರ್ ಅನ್ನು ತೆಗೆದುಹಾಕಿ.
@ -81,7 +81,7 @@ ggplot(data=birds_filtered_1, aes(x=MaxBodyMass, y=MaxLength) ) +
```
ಈ ಎರಡು ಅಂಶಗಳ ನಡುವೆ ನಿರೀಕ್ಷಿತ ಅಕ್ಷದ ಮೇಲೆ ನಿರೀಕ್ಷಿತ ಸಂಬಂಧವಿದೆ, ಒಂದು ವಿಶೇಷವಾಗಿ ಬಲವಾದ ಸಂಯೋಜನೆಯ ಬಿಂದುವಿನೊಂದಿಗೆ:
![2d plot](../../../../../translated_images/kn/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.png)
![2d plot](../../../../../translated_images/kn/2d-plot.c504786f439bd7eb.webp)
ಹಿಸ್ಟೋಗ್ರಾಮ್‌ಗಳು ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾಗಾಗಿ ಡೀಫಾಲ್ಟ್‌ನಲ್ಲಿ ಚೆನ್ನಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ. ಪಠ್ಯ ಡೇಟಾ ಪ್ರಕಾರ ವಿತರಣೆಯನ್ನು ನೋಡಬೇಕಾದರೆ ಏನು ಮಾಡಬೇಕು?
## ಪಠ್ಯ ಡೇಟಾ ಬಳಸಿ ವಿತರಣೆಯನ್ನು ಅನ್ವೇಷಿಸಿ
@ -112,7 +112,7 @@ ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
scale_fill_manual(name="Conservation Status",values=c("red","green","blue","pink"),labels=c("Endangered","Near Threathened","Vulnerable","Least Concern"))
```
![wingspan and conservation collation](../../../../../translated_images/kn/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.png)
![wingspan and conservation collation](../../../../../translated_images/kn/wingspan-conservation-collation.4024e9aa6910866a.webp)
ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರ ಮತ್ತು ಸಂರಕ್ಷಣಾ ಸ್ಥಿತಿಯ ನಡುವೆ ಉತ್ತಮ ಸಂಬಂಧವಿಲ್ಲದಂತೆ ತೋರುತ್ತದೆ. ಈ ವಿಧಾನವನ್ನು ಬಳಸಿ ಡೇಟಾಸೆಟ್‌ನ ಇತರ ಅಂಶಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ. ನೀವು ಯಾವುದೇ ಸಂಬಂಧವನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತೀರಾ?
@ -126,7 +126,7 @@ ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
geom_density()
```
![density plot](../../../../../translated_images/kn/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.png)
![density plot](../../../../../translated_images/kn/density-plot.675ccf865b76c690.webp)
ನೀವು ನೋಡಬಹುದು, ಈ ಪ್ಲಾಟ್ ಕನಿಷ್ಠ ರೆಕ್ಕೆ ವಿಸ್ತಾರದ ಡೇಟಾಗಾಗಿ ಹಿಂದಿನದನ್ನು ಪ್ರತಿಧ್ವನಿಸುತ್ತದೆ; ಅದು ಸ್ವಲ್ಪ ಸ್ಮೂತ್ ಆಗಿದೆ. ನೀವು ಎರಡನೇ ಚಾರ್ಟ್‌ನಲ್ಲಿ ರಚಿಸಿದ ಜಾಗೃತ MaxBodyMass ರೇಖೆಯನ್ನು ಮರುಸೃಷ್ಟಿಸುವ ಮೂಲಕ ಅದನ್ನು ಚೆನ್ನಾಗಿ ಸ್ಮೂತ್ ಮಾಡಬಹುದು:
@ -134,7 +134,7 @@ ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_density()
```
![bodymass density](../../../../../translated_images/kn/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.png)
![bodymass density](../../../../../translated_images/kn/bodymass-smooth.d31ce526d82b0a1f.webp)
ನೀವು ಸ್ಮೂತ್ ಆದರೆ ತುಂಬಾ ಸ್ಮೂತ್ ಅಲ್ಲದ ರೇಖೆಯನ್ನು ಬಯಸಿದರೆ, `adjust` ಪರಿಮಾಣವನ್ನು ಸಂಪಾದಿಸಿ:
@ -142,7 +142,7 @@ ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_density(adjust = 1/5)
```
![less smooth bodymass](../../../../../translated_images/kn/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.png)
![less smooth bodymass](../../../../../translated_images/kn/less-smooth-bodymass.10f4db8b683cc17d.webp)
✅ ಈ ರೀತಿಯ ಪ್ಲಾಟ್‌ಗೆ ಲಭ್ಯವಿರುವ ಪರಿಮಾಣಗಳ ಬಗ್ಗೆ ಓದಿ ಮತ್ತು ಪ್ರಯೋಗ ಮಾಡಿ!
@ -152,7 +152,7 @@ ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
ggplot(data=birds_filtered_1,aes(x = MaxBodyMass, fill = Order)) +
geom_density(alpha=0.5)
```
![bodymass per order](../../../../../translated_images/kn/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.png)
![bodymass per order](../../../../../translated_images/kn/bodymass-per-order.9d2b065dd931b928.webp)
## 🚀 ಸವಾಲು

@ -88,7 +88,7 @@ pie(grouped$count,grouped$class, main="Edible?")
```
ಇದು, ಈ ಡೇಟಾದ ಪ್ರಮಾಣಗಳನ್ನು ಈ ಎರಡು ಮಶ್ರೂಮ್ ವರ್ಗಗಳ ಪ್ರಕಾರ ತೋರಿಸುವ ಪೈ ಚಾರ್ಟ್. ಲೇಬಲ್‌ಗಳ ಕ್ರಮವನ್ನು ಸರಿಯಾಗಿ ಪಡೆಯುವುದು ಬಹಳ ಮುಖ್ಯ, ವಿಶೇಷವಾಗಿ ಇಲ್ಲಿ, ಆದ್ದರಿಂದ ಲೇಬಲ್ ಅರೆ ಅನ್ನು ರಚಿಸುವ ಕ್ರಮವನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ!
![pie chart](../../../../../translated_images/kn/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.png)
![pie chart](../../../../../translated_images/kn/pie1-wb.685df063673751f4.webp)
## ಡೋನಟ್ಸ್!
@ -123,7 +123,7 @@ library(webr)
PieDonut(habitat, aes(habitat, count=count))
```
![donut chart](../../../../../translated_images/kn/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.png)
![donut chart](../../../../../translated_images/kn/donut-wb.34e6fb275da9d834.webp)
ಈ ಕೋಡ್ ಎರಡು ಲೈಬ್ರರಿಗಳನ್ನು ಬಳಸುತ್ತದೆ - ggplot2 ಮತ್ತು webr. webr ಲೈಬ್ರರಿಯ PieDonut ಫಂಕ್ಷನ್ ಬಳಸಿ, ನಾವು ಸುಲಭವಾಗಿ ಡೋನಟ್ ಚಾರ್ಟ್ ರಚಿಸಬಹುದು!
@ -161,7 +161,7 @@ waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual
ವಾಫಲ್ ಚಾರ್ಟ್ ಬಳಸಿ, ನೀವು ಈ ಮಶ್ರೂಮ್ ಡೇಟಾಸೆಟ್‌ನ ಕ್ಯಾಪ್ ಬಣ್ಣಗಳ ಪ್ರಮಾಣಗಳನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ನೋಡಬಹುದು. ಆಸಕ್ತಿದಾಯಕವಾಗಿ, ಹಸಿರು ಕ್ಯಾಪ್ ಇರುವ ಮಶ್ರೂಮ್‌ಗಳು ಬಹಳಿವೆ!
![waffle chart](../../../../../translated_images/kn/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.png)
![waffle chart](../../../../../translated_images/kn/waffle.aaa75c5337735a6e.webp)
ಈ ಪಾಠದಲ್ಲಿ, ನೀವು ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಮೂರು ವಿಧಾನಗಳನ್ನು ಕಲಿತಿರಿ. ಮೊದಲು, ನಿಮ್ಮ ಡೇಟಾವನ್ನು ವರ್ಗಗಳಾಗಿ ಗುಂಪುಮಾಡಬೇಕು ಮತ್ತು ನಂತರ ಡೇಟಾವನ್ನು ಪ್ರದರ್ಶಿಸುವ ಅತ್ಯುತ್ತಮ ವಿಧಾನವನ್ನು ನಿರ್ಧರಿಸಬೇಕು - ಪೈ, ಡೋನಟ್ ಅಥವಾ ವಾಫಲ್. ಎಲ್ಲವೂ ರುಚಿಕರವಾಗಿವೆ ಮತ್ತು ಬಳಕೆದಾರರಿಗೆ ಡೇಟಾಸೆಟ್‌ನ ತಕ್ಷಣದ ದೃಶ್ಯವನ್ನು ನೀಡುತ್ತವೆ.

@ -42,7 +42,7 @@ library(ggplot2)
ggplot(honey, aes(x = priceperlb, y = state)) +
geom_point(colour = "blue")
```
![scatterplot 1](../../../../../translated_images/kn/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.png)
![scatterplot 1](../../../../../translated_images/kn/scatter1.86b8900674d88b26.webp)
ಈಗ, ವರ್ಷಗಳ ಪ್ರಗತಿಯನ್ನು ತೋರಿಸಲು ಜೇನುತುಪ್ಪ ಬಣ್ಣದ ಸ್ಕೀಮ್ ಬಳಸಿ ಅದೇ ಡೇಟಾವನ್ನು ತೋರಿಸಿ. ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಬದಲಾವಣೆಯನ್ನು ತೋರಿಸಲು 'scale_color_gradientn' ಪರಿಮಾಣವನ್ನು ಸೇರಿಸಬಹುದು:
@ -52,7 +52,7 @@ ggplot(honey, aes(x = priceperlb, y = state)) +
ggplot(honey, aes(x = priceperlb, y = state, color=year)) +
geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7))
```
![scatterplot 2](../../../../../translated_images/kn/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.png)
![scatterplot 2](../../../../../translated_images/kn/scatter2.4d1cbc693bad20e2.webp)
ಈ ಬಣ್ಣದ ಸ್ಕೀಮ್ ಬದಲಾವಣೆಯಿಂದ, ಜೇನುತುಪ್ಪದ ಪೌಂಡ್ ಪ್ರತಿ ಬೆಲೆಯು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಸ್ಪಷ್ಟವಾಗಿ ಹೆಚ್ಚುತ್ತಿರುವುದು ಕಾಣುತ್ತದೆ. ನಿಜವಾಗಿಯೂ, ಡೇಟಾದ ಒಂದು ಮಾದರಿ ಸೆಟ್ (ಉದಾಹರಣೆಗೆ ಅರೆಜೋನಾದ ಒಂದು ರಾಜ್ಯ) ನೋಡಿದರೆ, ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಬೆಲೆ ಏರಿಕೆಯ ಮಾದರಿಯನ್ನು ಕಾಣಬಹುದು, ಕೆಲವೊಂದು ಹೊರತುಪಡಿಸಿ:
@ -83,7 +83,7 @@ ggplot(honey, aes(x = priceperlb, y = state)) +
```
ನೀವು ಬಿಂದುಗಳ ಗಾತ್ರ ಕ್ರಮೇಣ ಹೆಚ್ಚುತ್ತಿರುವುದನ್ನು ಕಾಣಬಹುದು.
![scatterplot 3](../../../../../translated_images/kn/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.png)
![scatterplot 3](../../../../../translated_images/kn/scatter3.722d21e6f20b3ea2.webp)
ಇದು ಸರಳ ಸರಬರಾಜು ಮತ್ತು ಬೇಡಿಕೆ ಪ್ರಕರಣವೇ? ಹವಾಮಾನ ಬದಲಾವಣೆ ಮತ್ತು ಕಾಲೋನಿ ಕಾಲಾಪ್ಸ್ ಮುಂತಾದ ಕಾರಣಗಳಿಂದ, ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಖರೀದಿಗೆ ಲಭ್ಯವಿರುವ ಜೇನುತುಪ್ಪ ಕಡಿಮೆಯಾಗುತ್ತಿದೆಯೇ, ಆದ್ದರಿಂದ ಬೆಲೆ ಏರುತ್ತಿದೆಯೇ?
@ -98,7 +98,7 @@ qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab
```
ಉತ್ತರ: ಹೌದು, 2003 ರ ಸುತ್ತಲೂ ಕೆಲವು ಹೊರತುಪಡಿಸಿ:
![line chart 1](../../../../../translated_images/kn/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.png)
![line chart 1](../../../../../translated_images/kn/line1.299b576fbb2a59e6.webp)
ಪ್ರಶ್ನೆ: 2003 ರಲ್ಲಿ ಜೇನುತುಪ್ಪದ ಸರಬರಾಜಿನಲ್ಲಿ ಏರಿಕೆಯನ್ನು ನೋಡಬಹುದೇ? ಒಟ್ಟು ಉತ್ಪಾದನೆಯನ್ನು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ನೋಡಿದರೆ?
@ -106,7 +106,7 @@ qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab
qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod")
```
![line chart 2](../../../../../translated_images/kn/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.png)
![line chart 2](../../../../../translated_images/kn/line2.3b18fcda7176ceba.webp)
ಉತ್ತರ: ಅಷ್ಟು ಅಲ್ಲ. ಒಟ್ಟು ಉತ್ಪಾದನೆಯನ್ನು ನೋಡಿದರೆ, ಆ ವಿಶೇಷ ವರ್ಷದಲ್ಲಿ ಅದು ಹೆಚ್ಚಿದಂತೆ ತೋರುತ್ತದೆ, ಆದರೂ ಸಾಮಾನ್ಯವಾಗಿ ಈ ವರ್ಷಗಳಲ್ಲಿ ಜೇನುತುಪ್ಪದ ಉತ್ಪಾದನೆ ಕಡಿಮೆಯಾಗುತ್ತಿದೆ.
@ -126,7 +126,7 @@ ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) +
```
ಈ ದೃಶ್ಯೀಕರಣದಲ್ಲಿ, ನೀವು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಮತ್ತು ರಾಜ್ಯದಿಂದ ರಾಜ್ಯಕ್ಕೆ yield per colony ಮತ್ತು ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆಯನ್ನು ಪಕ್ಕಪಕ್ಕವಾಗಿ 3 ಕಾಲಮ್‌ಗಳೊಂದಿಗೆ ಹೋಲಿಸಬಹುದು:
![facet grid](../../../../../translated_images/kn/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.png)
![facet grid](../../../../../translated_images/kn/facet.491ad90d61c2a7cc.webp)
ಈ ಡೇಟಾಸೆಟ್‌ಗೆ, ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಮತ್ತು ಅವರ ಉತ್ಪಾದನೆಯ ಕುರಿತು ವರ್ಷದಿಂದ ವರ್ಷಕ್ಕೆ ಮತ್ತು ರಾಜ್ಯದಿಂದ ರಾಜ್ಯಕ್ಕೆ ವಿಶೇಷವಾಗಿ ಏನೂ ಹೊರಹೊಮ್ಮುವುದಿಲ್ಲ. ಈ ಎರಡು ವ್ಯತ್ಯಾಸಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಬೇರೆ ವಿಧಾನವಿದೆಯೇ?
@ -143,7 +143,7 @@ plot(honey$year, honey$yieldpercol, pch = 17, col = 3,
axis(side = 4, at = pretty(range(y2)))
mtext("colony yield", side = 4, line = 3)
```
![superimposed plots](../../../../../translated_images/kn/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.png)
![superimposed plots](../../../../../translated_images/kn/dual-line.fc4665f360a54018.webp)
2003 ರ ಸುತ್ತಲೂ ಏನೂ ವಿಶೇಷವಾಗಿ ಗಮನ ಸೆಳೆಯದಿದ್ದರೂ, ಈ ಪಾಠವನ್ನು ಸ್ವಲ್ಪ ಸಂತೋಷಕರವಾಗಿ ಮುಗಿಸಲು ಇದು ಸಹಾಯ ಮಾಡುತ್ತದೆ: ಒಟ್ಟಾರೆ ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಕಡಿಮೆಯಾಗುತ್ತಿದೆಯಾದರೂ, ಕಾಲೋನಿಗಳ ಸಂಖ್ಯೆ ಸ್ಥಿರವಾಗುತ್ತಿದೆ ಮತ್ತು ಅವರ yield per colony ಕಡಿಮೆಯಾಗುತ್ತಿದೆ.

@ -38,25 +38,25 @@
ಒಂದು ಡೇಟಾ ವಿಜ್ಞಾನಿ ಸರಿಯಾದ ಡೇಟಾ ಗೆ ಸರಿಯಾದ ಚಾರ್ಟ್ ಆಯ್ಕೆಮಾಡಿದರೂ ಸಹ, ಡೇಟಾವನ್ನು ತೋರಿಸುವ ಹಲವು ಮಾರ್ಗಗಳಿವೆ, ಅವು ಡೇಟಾವನ್ನು ಹಾಳುಮಾಡುವ ಬೆಲೆಗಾಗಿ ಒಂದು ವಿಷಯವನ್ನು ಸಾಬೀತುಪಡಿಸಲು. ಮೋಸಮಯ ಚಾರ್ಟ್‌ಗಳು ಮತ್ತು ಇನ್ಫೋಗ್ರಾಫಿಕ್ಸ್‌ಗಳ ಅನೇಕ ಉದಾಹರಣೆಗಳಿವೆ!
[![ಅಲ್ಬೆರ್ಟೋ ಕೈರೋ ಅವರ "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ"](../../../../../translated_images/kn/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ")
[![ಅಲ್ಬೆರ್ಟೋ ಕೈರೋ ಅವರ "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ"](../../../../../translated_images/kn/tornado.2880ffc7f135f82b.webp)](https://www.youtube.com/watch?v=oX74Nge8Wkw "ಹೌ ಚಾರ್ಟ್ಸ್ ಲೈ")
> 🎥 ಮೇಲಿನ ಚಿತ್ರವನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಮೋಸಮಯ ಚಾರ್ಟ್‌ಗಳ ಬಗ್ಗೆ ಸಮ್ಮೇಳನ ಮಾತುಕತೆ ನೋಡಿರಿ
ಈ ಚಾರ್ಟ್ X ಅಕ್ಷವನ್ನು ತಿರುಗಿಸಿ ಸತ್ಯದ ವಿರುದ್ಧ ತೋರಿಸುತ್ತದೆ, ದಿನಾಂಕ ಆಧಾರಿತ:
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 1](../../../../../translated_images/kn/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.png)
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 1](../../../../../translated_images/kn/bad-chart-1.596bc93425a8ac30.webp)
[ಈ ಚಾರ್ಟ್](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) ಇನ್ನೂ ಹೆಚ್ಚು ಮೋಸಮಯವಾಗಿದೆ, ಕಣ್ಣು ಬಲಕ್ಕೆ ಸೆಳೆಯುತ್ತದೆ ಮತ್ತು ಸಮಯದೊಂದಿಗೆ COVID ಪ್ರಕರಣಗಳು ವಿವಿಧ ಜಿಲ್ಲೆಗಳಲ್ಲಿ ಕಡಿಮೆಯಾದಂತೆ ತೋರುತ್ತದೆ. ನಿಜವಾಗಿ, ದಿನಾಂಕಗಳನ್ನು ಗಮನದಿಂದ ನೋಡಿದರೆ, ಅವು ಮೋಸಮಯ ಇಳಿಜಾರಿನ ಪ್ರವೃತ್ತಿಯನ್ನು ನೀಡಲು ಮರುಕ್ರಮಿಸಲಾಗಿದೆ.
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 2](../../../../../translated_images/kn/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.jpg)
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 2](../../../../../translated_images/kn/bad-chart-2.62edf4d2f30f4e51.webp)
ಈ ಪ್ರಸಿದ್ಧ ಉದಾಹರಣೆ ಬಣ್ಣ ಮತ್ತು ತಿರುಗಿದ Y ಅಕ್ಷವನ್ನು ಬಳಸಿಕೊಂಡು ಮೋಸ ಮಾಡುತ್ತದೆ: ಗನ್-ಸ್ನೇಹಿ ಕಾನೂನುಗಳ ಅಂಗೀಕಾರದ ನಂತರ ಗನ್ ಸಾವುಗಳು ಏರಿಕೆಯಾಗಿವೆ ಎಂದು ನಿರ್ಣಯಿಸುವ ಬದಲು, ಕಣ್ಣು ವಿರುದ್ಧವನ್ನು ನಂಬುವಂತೆ ಮಾಡುತ್ತದೆ:
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 3](../../../../../translated_images/kn/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.jpg)
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 3](../../../../../translated_images/kn/bad-chart-3.e201e2e915a230bc.webp)
ಈ ವಿಚಿತ್ರ ಚಾರ್ಟ್ ಅನುಪಾತವನ್ನು ಹೇಗೆ ಮ್ಯಾನಿಪ್ಯುಲೇಟ್ ಮಾಡಬಹುದು ಎಂಬುದನ್ನು ಹಾಸ್ಯಾಸ್ಪದ ಪರಿಣಾಮದೊಂದಿಗೆ ತೋರಿಸುತ್ತದೆ:
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 4](../../../../../translated_images/kn/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.jpg)
![ಕೆಟ್ಟ ಚಾರ್ಟ್ 4](../../../../../translated_images/kn/bad-chart-4.8872b2b881ffa96c.webp)
ತೂಕಮಾಡಲಾಗದ ವಸ್ತುಗಳನ್ನು ಹೋಲಿಸುವುದು ಇನ್ನೊಂದು ಅನುಮಾನಾಸ್ಪದ ತಂತ್ರ. 'ಸ್ಪ್ಯೂರಿಯಸ್ ಕೊರಿಲೇಶನ್ಸ್' ಬಗ್ಗೆ ಒಂದು [ಅದ್ಭುತ ವೆಬ್ ಸೈಟ್](https://tylervigen.com/spurious-correlations) ಇದೆ, ಇದು ಮೇನ್‌ನ ವಿಚ್ಛೇದನ ದರ ಮತ್ತು ಮಾರ್ಜರಿನ್ ಬಳಕೆಯಂತಹ ವಿಷಯಗಳನ್ನು ಹೊಂದಿರುವ 'ವಾಸ್ತವಗಳನ್ನು' ತೋರಿಸುತ್ತದೆ. ರೆಡ್ಡಿಟ್ ಗುಂಪು ಕೂಡ ಡೇಟಾ ಬಳಕೆಯ [ಕಿರುಕುಳಗಳನ್ನು](https://www.reddit.com/r/dataisugly/top/?t=all) ಸಂಗ್ರಹಿಸುತ್ತದೆ.
@ -91,13 +91,13 @@
ನಿಮ್ಮ ಡೇಟಾ ಪಠ್ಯಾತ್ಮಕ ಮತ್ತು X ಅಕ್ಷದಲ್ಲಿ ವಿಸ್ತಾರವಾಗಿದ್ದರೆ, ಓದಲು ಸುಲಭವಾಗಲು ಪಠ್ಯವನ್ನು ತಿರುಗಿಸಬಹುದು. [plot3D](https://cran.r-project.org/web/packages/plot3D/index.html) 3D ಪ್ಲಾಟಿಂಗ್ ಅನ್ನು ಒದಗಿಸುತ್ತದೆ, ನಿಮ್ಮ ಡೇಟಾ ಅದನ್ನು ಬೆಂಬಲಿಸಿದರೆ. ಅದನ್ನು ಬಳಸಿ ಸುಧಾರಿತ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಸೃಷ್ಟಿಸಬಹುದು.
![3D ಪ್ಲಾಟ್‌ಗಳು](../../../../../translated_images/kn/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.png)
![3D ಪ್ಲಾಟ್‌ಗಳು](../../../../../translated_images/kn/3d.db1734c151eee87d.webp)
## ಅನಿಮೇಷನ್ ಮತ್ತು 3D ಚಾರ್ಟ್ ಪ್ರದರ್ಶನ
ಇಂದಿನ ಅತ್ಯುತ್ತಮ ಡೇಟಾ ದೃಶ್ಯೀಕರಣಗಳಲ್ಲಿ ಕೆಲವು ಅನಿಮೇಟೆಡ್ ಆಗಿವೆ. ಶಿರ್ಲಿ ವು D3 ಬಳಸಿ ಅದ್ಭುತ ಅನಿಮೇಟೆಡ್ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಮಾಡಿದ್ದಾಳೆ, ಉದಾಹರಣೆಗೆ '[ಫಿಲ್ಮ್ ಫ್ಲವರ್ಸ್](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', ಇಲ್ಲಿ ಪ್ರತಿ ಹೂವು ಒಂದು ಚಲನಚಿತ್ರದ ದೃಶ್ಯೀಕರಣವಾಗಿದೆ. ಇನ್ನೊಂದು ಉದಾಹರಣೆ ಗಾರ್ಡಿಯನ್‌ನ 'ಬಸ್ಸ್ಡ್ ಔಟ್', ಇದು ಗ್ರೀನ್ಸಾಕ್ ಮತ್ತು D3 ಜೊತೆಗೆ ಇಂಟರಾಕ್ಟಿವ್ ಅನುಭವ ಮತ್ತು ಸ್ಕ್ರೋಲಿಟೆಲ್ಲಿಂಗ್ ಲೇಖನ ರೂಪದಲ್ಲಿ NYC ತನ್ನ ಗೃಹವಿಹೀನ ಸಮಸ್ಯೆಯನ್ನು ಬಸ್ಸಿಂಗ್ ಮೂಲಕ ಹೇಗೆ ನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ.
![ಬಸ್ಸಿಂಗ್](../../../../../translated_images/kn/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.png)
![ಬಸ್ಸಿಂಗ್](../../../../../translated_images/kn/busing.8157cf1bc89a3f65.webp)
> "ಬಸ್ಸ್ಡ್ ಔಟ್: ಅಮೆರಿಕ ಗೃಹವಿಹೀನರನ್ನು ಹೇಗೆ ಸಾಗಿಸುತ್ತದೆ" [ಗಾರ್ಡಿಯನ್](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study) ನಿಂದ. ದೃಶ್ಯೀಕರಣಗಳು ನಾಡಿಯೆ ಬ್ರೆಮರ್ ಮತ್ತು ಶಿರ್ಲಿ ವು ಅವರಿಂದ
@ -107,7 +107,7 @@
ನೀವು ಈ ಸಾಮಾಜಿಕ ಜಾಲದೃಶ್ಯೀಕರಣದ ಅನಿಮೇಟೆಡ್ ವೀಕ್ಷಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸುವ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಪೂರ್ಣಗೊಳಿಸುವಿರಿ. ಇದು Vue.js ಮತ್ತು D3 ಬಳಸಿ [ಜಾಲದೃಶ್ಯ](https://github.com/emiliorizzo/vue-d3-network) ಸೃಷ್ಟಿಸಲು ನಿರ್ಮಿಸಲಾದ ಗ್ರಂಥಾಲಯವನ್ನು ಬಳಸುತ್ತದೆ. ಅಪ್ಲಿಕೇಶನ್ ಚಾಲನೆಯಲ್ಲಿದ್ದಾಗ, ನೀವು ನೊಡ್‌ಗಳನ್ನು ಪರದೆ ಮೇಲೆ ಎಳೆಯಬಹುದು ಮತ್ತು ಡೇಟಾವನ್ನು ಮರುಸಂರಚಿಸಬಹುದು.
![ಲಿಯಾಜನ್ಸ್](../../../../../translated_images/kn/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.png)
![ಲಿಯಾಜನ್ಸ್](../../../../../translated_images/kn/liaisons.90ce7360bcf84765.webp)
## ಪ್ರಾಜೆಕ್ಟ್: D3.js ಬಳಸಿ ಜಾಲವನ್ನು ತೋರಿಸಲು ಚಾರ್ಟ್ ನಿರ್ಮಿಸಿ

@ -1,6 +1,6 @@
# ದೃಶ್ಯೀಕರಣಗಳು
![ಲ್ಯಾವೆಂಡರ್ ಹೂವಿನ ಮೇಲೆ ಒಂದು ಜೇನುತುಪ್ಪ](../../../translated_images/kn/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.jpg)
![ಲ್ಯಾವೆಂಡರ್ ಹೂವಿನ ಮೇಲೆ ಒಂದು ಜೇನುತುಪ್ಪ](../../../translated_images/kn/bee.0aa1d91132b12e3a.webp)
> ಫೋಟೋ <a href="https://unsplash.com/@jenna2980?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಜೆನ್ನಾ ಲೀ</a> ಅವರಿಂದ <a href="https://unsplash.com/s/photos/bees-in-a-meadow?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಅನ್ಸ್ಪ್ಲ್ಯಾಶ್</a> ನಲ್ಲಿ

@ -16,7 +16,7 @@
ಈ ಪಾಠವು ಜೀವನಚಕ್ರದ 3 ಭಾಗಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ: ಸೆರೆಹಿಡಿಯುವುದು, ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು ಮತ್ತು ನಿರ್ವಹಣೆ.
![ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಚಿತ್ರಣ](../../../../translated_images/kn/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.jpg)
![ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಚಿತ್ರಣ](../../../../translated_images/kn/data-science-lifecycle.a1e362637503c4fb.webp)
> ಚಿತ್ರ: [ಬರ್ಕ್ಲಿ ಮಾಹಿತಿ ಶಾಲೆ](https://ischoolonline.berkeley.edu/data-science/what-is-data-science/)
## ಸೆರೆಹಿಡಿಯುವುದು
@ -88,7 +88,7 @@
|ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ (TDSP)|ಕ್ರಾಸ್-ಇಂಡಸ್ಟ್ರಿ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಪ್ರಕ್ರಿಯೆ ಫಾರ್ ಡೇಟಾ ಮೈನಿಂಗ್ (CRISP-DM)|
|--|--|
|![ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ](../../../../translated_images/kn/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.png) | ![ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಅಲಯನ್ಸ್ ಚಿತ್ರ](../../../../translated_images/kn/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.png) |
|![ಟೀಮ್ ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ](../../../../translated_images/kn/tdsp-lifecycle2.e19029d598e2e73d.webp) | ![ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಅಲಯನ್ಸ್ ಚಿತ್ರ](../../../../translated_images/kn/CRISP-DM.8bad2b4c66e62aa7.webp) |
| ಚಿತ್ರ: [Microsoft](https://docs.microsoft.comazure/architecture/data-science-process/lifecycle) | ಚಿತ್ರ: [ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರಕ್ರಿಯೆ ಅಲಯನ್ಸ್](https://www.datascience-pm.com/crisp-dm-2/) |
## [ಪೋಸ್ಟ್-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್](https://ff-quizzes.netlify.app/en/ds/quiz/27)

@ -1,6 +1,6 @@
# ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರ
![communication](../../../translated_images/kn/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.jpg)
![communication](../../../translated_images/kn/communication.06d8e2a88d30d168.webp)
> ಫೋಟೋ <a href="https://unsplash.com/@headwayio?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಹೆಡ್‌ವೇ</a> ಅವರಿಂದ <a href="https://unsplash.com/s/photos/communication?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ಅನ್ಸ್ಪ್ಲ್ಯಾಶ್</a> ನಲ್ಲಿ
ಈ ಪಾಠಗಳಲ್ಲಿ, ನೀವು ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಕೆಲವು ಅಂಶಗಳನ್ನು, ಡೇಟಾ ಸುತ್ತಲೂ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಸಂವಹನವನ್ನು ಅನ್ವೇಷಿಸುವಿರಿ.

@ -53,7 +53,7 @@
ಯೋಜನೆಗಳನ್ನು ರಚಿಸುವುದು ಮತ್ತು ನಿರ್ಮಿಸುವುದು ನಿಮ್ಮ ಕೌಶಲ್ಯ ಮತ್ತು ಜ್ಞಾನವನ್ನು ಪರೀಕ್ಷಿಸಲು ಅತ್ಯುತ್ತಮ ಮಾರ್ಗವೆಂದು ಯಾವುದೇ ಸಂಶಯವಿಲ್ಲ. ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಅಜೂರ್ ಎಂಎಲ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ ಹೃದಯ ವೈಫಲ್ಯ ದಾಳಿಗಳ ಭವಿಷ್ಯವಾಣಿಗಾಗಿ ಡೇಟಾ ಸೈನ್ಸ್ ಯೋಜನೆಯನ್ನು ಎರಡು ವಿಭಿನ್ನ ವಿಧಾನಗಳಲ್ಲಿ ಅನ್ವೇಷಿಸುವೆವು: ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಮತ್ತು ಅಜೂರ್ ಎಂಎಲ್ SDK ಮೂಲಕ, ಕೆಳಗಿನ ಚಿತ್ರಣದಂತೆ:
![project-schema](../../../../translated_images/kn/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.png)
![project-schema](../../../../translated_images/kn/project-schema.736f6e403f321eb4.webp)
ಪ್ರತಿ ವಿಧಾನಕ್ಕೂ ತನ್ನದೇ ಆದ ಲಾಭ ಮತ್ತು ನಷ್ಟಗಳಿವೆ. ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ವಿಧಾನವು GUI (ಗ್ರಾಫಿಕಲ್ ಯೂಸರ್ ಇಂಟರ್ಫೇಸ್) ಜೊತೆಗೆ ಸಂವಹನ ಮಾಡುವುದರಿಂದ ಪ್ರಾರಂಭಿಸಲು ಸುಲಭವಾಗಿದೆ, ಕೋಡ್ ಬಗ್ಗೆ ಪೂರ್ವಜ್ಞಾನ ಅಗತ್ಯವಿಲ್ಲ. ಈ ವಿಧಾನವು ಯೋಜನೆಯ ಸಾಧ್ಯತೆಯನ್ನು ತ್ವರಿತವಾಗಿ ಪರೀಕ್ಷಿಸಲು ಮತ್ತು POC (ಪ್ರೂಫ್ ಆಫ್ ಕಾಂಸೆಪ್ಟ್) ರಚಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಆದರೆ, ಯೋಜನೆ ವಿಸ್ತಾರವಾಗುತ್ತಾ ಮತ್ತು ಉತ್ಪಾದನೆಗೆ ಸಿದ್ಧವಾಗಬೇಕಾದಾಗ, GUI ಮೂಲಕ ಸಂಪನ್ಮೂಲಗಳನ್ನು ರಚಿಸುವುದು ಸಾಧ್ಯವಿಲ್ಲ. ಸಂಪನ್ಮೂಲಗಳ ರಚನೆ, ಮಾದರಿ ನಿಯೋಜನೆ ಸೇರಿದಂತೆ ಎಲ್ಲವನ್ನೂ ಪ್ರೋಗ್ರಾಮ್ಯಾಟಿಕಾಗಿ ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸಬೇಕಾಗುತ್ತದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ ಅಜೂರ್ ಎಂಎಲ್ SDK ಬಳಕೆ ತಿಳಿದುಕೊಳ್ಳುವುದು ಅತ್ಯಂತ ಮುಖ್ಯ.
@ -106,15 +106,15 @@
1. ನಿಮ್ಮ ಅಜೂರ್ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್‌ಗೆ ಸಂಬಂಧಿಸಿದ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಕ್ರೆಡೆನ್ಷಿಯಲ್ಸ್ ಬಳಸಿ [ಅಜೂರ್ ಪೋರ್ಟಲ್](https://ms.portal.azure.com/) ಗೆ ಸೈನ್ ಇನ್ ಆಗಿ.
2. **+ಸಂಪನ್ಮೂಲ ರಚಿಸಿ** ಆಯ್ಕೆಮಾಡಿ
![workspace-1](../../../../translated_images/kn/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.png)
![workspace-1](../../../../translated_images/kn/workspace-1.ac8694d60b073ed1.webp)
ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಅನ್ನು ಹುಡುಕಿ ಮತ್ತು ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಟೈಲ್ ಆಯ್ಕೆಮಾಡಿ
![workspace-2](../../../../translated_images/kn/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.png)
![workspace-2](../../../../translated_images/kn/workspace-2.ae7c486db8796147.webp)
ರಚನೆ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ
![workspace-3](../../../../translated_images/kn/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.png)
![workspace-3](../../../../translated_images/kn/workspace-3.398ca4a5858132cc.webp)
ಕೆಳಗಿನಂತೆ ಸೆಟ್ಟಿಂಗ್‌ಗಳನ್ನು ಭರ್ತಿ ಮಾಡಿ:
- ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್: ನಿಮ್ಮ ಅಜೂರ್ ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್
@ -126,17 +126,17 @@
- ಅಪ್ಲಿಕೇಶನ್ ಇನ್ಸೈಟ್ಸ್: ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ಗೆ ಹೊಸ ಡೀಫಾಲ್ಟ್ ಅಪ್ಲಿಕೇಶನ್ ಇನ್ಸೈಟ್ಸ್ ಸಂಪನ್ಮೂಲ ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ
- ಕಂಟೈನರ್ ರಿಜಿಸ್ಟ್ರಿ: ಇಲ್ಲ (ನೀವು ಮೊದಲ ಬಾರಿಗೆ ಮಾದರಿಯನ್ನು ಕಂಟೈನರ್‌ಗೆ ನಿಯೋಜಿಸುವಾಗ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸೃಷ್ಟಿಸಲಾಗುತ್ತದೆ)
![workspace-4](../../../../translated_images/kn/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.png)
![workspace-4](../../../../translated_images/kn/workspace-4.bac87f6599c4df63.webp)
- ರಚಿಸಿ + ಪರಿಶೀಲಿಸಿ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನಂತರ ರಚನೆ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ
3. ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್ ರಚನೆಗೆ ಕೆಲವು ನಿಮಿಷಗಳು ಬೇಕಾಗಬಹುದು. ನಂತರ ಪೋರ್ಟಲ್‌ನಲ್ಲಿ ಅದಕ್ಕೆ ಹೋಗಿ. ನೀವು ಅದನ್ನು ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಅಜೂರ್ ಸೇವೆಯ ಮೂಲಕ ಹುಡುಕಬಹುದು.
4. ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ನ ಅವಲೋಕನ ಪುಟದಲ್ಲಿ, ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋವನ್ನು ಪ್ರಾರಂಭಿಸಿ (ಅಥವಾ ಹೊಸ ಬ್ರೌಸರ್ ಟ್ಯಾಬ್ ತೆರೆಯಿರಿ ಮತ್ತು https://ml.azure.com ಗೆ ಹೋಗಿ), ಮತ್ತು ನಿಮ್ಮ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಖಾತೆ ಬಳಸಿ ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ ಸೈನ್ ಇನ್ ಆಗಿ. ಕೇಳಿದರೆ, ನಿಮ್ಮ ಅಜೂರ್ ಡೈರೆಕ್ಟರಿ ಮತ್ತು ಸಬ್ಸ್ಕ್ರಿಪ್ಷನ್ ಮತ್ತು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಆಯ್ಕೆಮಾಡಿ.
![workspace-5](../../../../translated_images/kn/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.png)
![workspace-5](../../../../translated_images/kn/workspace-5.a6eb17e0a5e64200.webp)
5. ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋದಲ್ಲಿ, ಎಡಮೇಲೆ ಇರುವ ☰ ಐಕಾನ್ ಅನ್ನು ಟಾಗಲ್ ಮಾಡಿ ಇಂಟರ್ಫೇಸ್‌ನ ವಿವಿಧ ಪುಟಗಳನ್ನು ವೀಕ್ಷಿಸಿ. ನೀವು ಈ ಪುಟಗಳನ್ನು ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ನ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಬಳಸಬಹುದು.
![workspace-6](../../../../translated_images/kn/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.png)
![workspace-6](../../../../translated_images/kn/workspace-6.8dd81fe841797ee1.webp)
ನೀವು ಅಜೂರ್ ಪೋರ್ಟಲ್ ಬಳಸಿ ನಿಮ್ಮ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಅನ್ನು ನಿರ್ವಹಿಸಬಹುದು, ಆದರೆ ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಮತ್ತು ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಕಾರ್ಯಾಚರಣೆ ಇಂಜಿನಿಯರ್‌ಗಳಿಗೆ, ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಹೆಚ್ಚು ಕೇಂದ್ರೀಕೃತ ಬಳಕೆದಾರ ಇಂಟರ್ಫೇಸ್ ಒದಗಿಸುತ್ತದೆ.
@ -184,18 +184,18 @@ CPU ಮತ್ತು GPU ವಾಸ್ತುಶಿಲ್ಪದ ಮುಖ್ಯ ವ
ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ML ವರ್ಕ್‌ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ, ಗಣನೆಗೆ ಹೋಗಿ ನಾವು ಈಗಾಗಲೇ ಚರ್ಚಿಸಿದ ವಿವಿಧ ಗಣನೆ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನೋಡಬಹುದು (ಅಂದರೆ ಗಣನೆ ಉದಾಹರಣೆಗಳು, ಗಣನೆ ಕ್ಲಸ್ಟರ್‌ಗಳು, ಅನುವಾದ ಕ್ಲಸ್ಟರ್‌ಗಳು ಮತ್ತು ಸಂಯೋಜಿತ ಗಣನೆ). ಈ ಯೋಜನೆಗಾಗಿ, ನಮಗೆ ಮಾದರಿ ತರಬೇತಿಗೆ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಬೇಕಾಗುತ್ತದೆ. ಸ್ಟುಡಿಯೋದಲ್ಲಿ, "Compute" ಮೆನು ಕ್ಲಿಕ್ ಮಾಡಿ, ನಂತರ "Compute cluster" ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು "+ New" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ರಚಿಸಲು.
![22](../../../../translated_images/kn/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.png)
![22](../../../../translated_images/kn/cluster-1.b78cb630bb543729.webp)
1. ನಿಮ್ಮ ಆಯ್ಕೆಗಳನ್ನು ಆರಿಸಿ: ನಿರ್ದಿಷ್ಟ ವಿರುದ್ಧ ಕಡಿಮೆ ಪ್ರಾಥಮಿಕತೆ, CPU ಅಥವಾ GPU, VM ಗಾತ್ರ ಮತ್ತು ಕೋರ್ ಸಂಖ್ಯೆ (ಈ ಯೋಜನೆಗಾಗಿ ಡೀಫಾಲ್ಟ್ ಸೆಟ್ಟಿಂಗ್‌ಗಳನ್ನು ಇಡಬಹುದು).
2. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![23](../../../../translated_images/kn/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.png)
![23](../../../../translated_images/kn/cluster-2.ea30cdbc9f926bb9.webp)
3. ಕ್ಲಸ್ಟರ್‌ಗೆ ಗಣನೆ ಹೆಸರು ನೀಡಿ
4. ನಿಮ್ಮ ಆಯ್ಕೆಗಳನ್ನು ಆರಿಸಿ: ಕನಿಷ್ಠ/ಗರಿಷ್ಠ ನೋಡ್‌ಗಳ ಸಂಖ್ಯೆ, ಸ್ಕೇಲ್ ಡೌನ್ ಮಾಡುವ ಮೊದಲು ನಿರ್ಜೀವ ಸೆಕೆಂಡುಗಳು, SSH ಪ್ರವೇಶ. ಕನಿಷ್ಠ ನೋಡ್‌ಗಳ ಸಂಖ್ಯೆ 0 ಇದ್ದರೆ, ಕ್ಲಸ್ಟರ್ ನಿರ್ಜೀವವಾಗಿರುವಾಗ ನೀವು ಹಣ ಉಳಿಸಬಹುದು. ಗರಿಷ್ಠ ನೋಡ್‌ಗಳ ಸಂಖ್ಯೆ ಹೆಚ್ಚಾದರೆ ತರಬೇತಿ ಕಡಿಮೆ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ. ಶಿಫಾರಸು ಮಾಡಲಾದ ಗರಿಷ್ಠ ನೋಡ್‌ಗಳ ಸಂಖ್ಯೆ 3.
5. "Create" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಈ ಹಂತಕ್ಕೆ ಕೆಲವು ನಿಮಿಷಗಳು ಬೇಕಾಗಬಹುದು.
![29](../../../../translated_images/kn/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.png)
![29](../../../../translated_images/kn/cluster-3.8a334bc070ec173a.webp)
ಅದ್ಭುತ! ಈಗ ನಮಗೆ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಇದೆ, ನಾವು ಡೇಟಾವನ್ನು ಅಜೂರ್ ML ಸ್ಟುಡಿಯೋಗೆ ಲೋಡ್ ಮಾಡಬೇಕಾಗಿದೆ.
@ -203,15 +203,15 @@ CPU ಮತ್ತು GPU ವಾಸ್ತುಶಿಲ್ಪದ ಮುಖ್ಯ ವ
1. ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ML ವರ್ಕ್‌ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ, ಎಡ ಮೆನುದಲ್ಲಿ "Datasets" ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು "+ Create dataset" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಡೇಟಾಸೆಟ್ ರಚಿಸಲು. "From local files" ಆಯ್ಕೆ ಮಾಡಿ ಮತ್ತು ನಾವು ಮೊದಲು ಡೌನ್‌ಲೋಡ್ ಮಾಡಿದ ಕಾಗಲ್ ಡೇಟಾಸೆಟ್ ಆಯ್ಕೆಮಾಡಿ.
![24](../../../../translated_images/kn/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.png)
![24](../../../../translated_images/kn/dataset-1.e86ab4e10907a6e9.webp)
2. ನಿಮ್ಮ ಡೇಟಾಸೆಟ್‌ಗೆ ಹೆಸರು, ಪ್ರಕಾರ ಮತ್ತು ವಿವರಣೆ ನೀಡಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಫೈಲ್‌ಗಳಿಂದ ಡೇಟಾ ಅಪ್‌ಲೋಡ್ ಮಾಡಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![25](../../../../translated_images/kn/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.png)
![25](../../../../translated_images/kn/dataset-2.f58de1c435d5bf9c.webp)
3. ಸ್ಕೀಮಾ‌ನಲ್ಲಿ, ಕೆಳಗಿನ ವೈಶಿಷ್ಟ್ಯಗಳಿಗಾಗಿ ಡೇಟಾ ಪ್ರಕಾರವನ್ನು ಬೂಲಿಯನ್‌ಗೆ ಬದಲಾಯಿಸಿ: ಅನೀಮಿಯಾ, ಡಯಾಬಿಟಿಸ್, ಹೈ ಬ್ಲಡ್ ಪ್ರೆಶರ್, ಲಿಂಗ, ಧೂಮಪಾನ, ಮತ್ತು DEATH_EVENT. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ರಚಿಸಿ ಕ್ಲಿಕ್ ಮಾಡಿ.
![26](../../../../translated_images/kn/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.png)
![26](../../../../translated_images/kn/dataset-3.58db8c0eb783e892.webp)
ಚೆನ್ನಾಗಿದೆ! ಈಗ ಡೇಟಾಸೆಟ್ ಸಿದ್ಧವಾಗಿದೆ ಮತ್ತು ಗಣನೆ ಕ್ಲಸ್ಟರ್ ರಚಿಸಲಾಗಿದೆ, ನಾವು ಮಾದರಿ ತರಬೇತಿಯನ್ನು ಪ್ರಾರಂಭಿಸಬಹುದು!
@ -222,19 +222,19 @@ CPU ಮತ್ತು GPU ವಾಸ್ತುಶಿಲ್ಪದ ಮುಖ್ಯ ವ
1. ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ML ವರ್ಕ್‌ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ ಎಡ ಮೆನುದಲ್ಲಿ "Automated ML" ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನೀವು appena ಅಪ್‌ಲೋಡ್ ಮಾಡಿದ ಡೇಟಾಸೆಟ್ ಆಯ್ಕೆಮಾಡಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![27](../../../../translated_images/kn/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.png)
![27](../../../../translated_images/kn/aml-1.67281a85d3a1e2f3.webp)
2. ಹೊಸ ಪ್ರಯೋಗದ ಹೆಸರು, ಗುರಿ ಕಾಲಮ್ (DEATH_EVENT) ಮತ್ತು ನಾವು ರಚಿಸಿದ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ನಮೂದಿಸಿ. ಮುಂದಿನ ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![28](../../../../translated_images/kn/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.png)
![28](../../../../translated_images/kn/aml-2.c9fb9cffb39ccbbe.webp)
3. "Classification" ಆಯ್ಕೆ ಮಾಡಿ ಮತ್ತು Finish ಕ್ಲಿಕ್ ಮಾಡಿ. ಈ ಹಂತವು ನಿಮ್ಮ ಗಣನೆ ಕ್ಲಸ್ಟರ್ ಗಾತ್ರದ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿ 30 ನಿಮಿಷದಿಂದ 1 ಗಂಟೆ ತೆಗೆದುಕೊಳ್ಳಬಹುದು.
![30](../../../../translated_images/kn/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.png)
![30](../../../../translated_images/kn/aml-3.a7952e4295f38cc6.webp)
4. ರನ್ ಪೂರ್ಣಗೊಂಡ ನಂತರ, "Automated ML" ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ, ನಿಮ್ಮ ರನ್ ಕ್ಲಿಕ್ ಮಾಡಿ, ಮತ್ತು "Best model summary" ಕಾರ್ಡ್‌ನಲ್ಲಿನ ಆಲ್ಗೋರಿದಮ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![31](../../../../translated_images/kn/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.png)
![31](../../../../translated_images/kn/aml-4.7a627e09cb6f16d0.webp)
ಇಲ್ಲಿ ನೀವು AutoML ರಚಿಸಿದ ಅತ್ಯುತ್ತಮ ಮಾದರಿಯ ವಿವರವಾದ ವಿವರಣೆಯನ್ನು ನೋಡಬಹುದು. ನೀವು ಮಾದರಿಗಳ ಟ್ಯಾಬ್‌ನಲ್ಲಿ ಇತರ ಮಾದರಿಗಳನ್ನು ಸಹ ಅನ್ವೇಷಿಸಬಹುದು. ವಿವರಣೆಗಳಲ್ಲಿ (ಪೂರ್ವವೀಕ್ಷಣಾ ಬಟನ್) ಕೆಲವು ನಿಮಿಷಗಳನ್ನು ತೆಗೆದು ಮಾದರಿಗಳನ್ನು ಪರಿಶೀಲಿಸಿ. ನೀವು ಬಳಸಲು ಬಯಸುವ ಮಾದರಿಯನ್ನು ಆಯ್ಕೆಮಾಡಿದ ನಂತರ (ಇಲ್ಲಿ ನಾವು AutoML ಆಯ್ಕೆಮಾಡಿದ ಅತ್ಯುತ್ತಮ ಮಾದರಿಯನ್ನು ಆಯ್ಕೆಮಾಡುತ್ತೇವೆ), ನಾವು ಅದನ್ನು ಹೇಗೆ ನಿಯೋಜಿಸಬಹುದು ಎಂದು ನೋಡೋಣ.
@ -245,15 +245,15 @@ CPU ಮತ್ತು GPU ವಾಸ್ತುಶಿಲ್ಪದ ಮುಖ್ಯ ವ
ಅತ್ಯುತ್ತಮ ಮಾದರಿ ವಿವರಣೆಯಲ್ಲಿ, "Deploy" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![deploy-1](../../../../translated_images/kn/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.png)
![deploy-1](../../../../translated_images/kn/deploy-1.ddad725acadc84e3.webp)
15. ಅದಕ್ಕೆ ಹೆಸರು, ವಿವರಣೆ, ಗಣನೆ ಪ್ರಕಾರ (Azure Container Instance), ಪ್ರಮಾಣೀಕರಣ ಸಕ್ರಿಯಗೊಳಿಸಿ ಮತ್ತು Deploy ಕ್ಲಿಕ್ ಮಾಡಿ. ಈ ಹಂತವು ಪೂರ್ಣಗೊಳ್ಳಲು ಸುಮಾರು 20 ನಿಮಿಷ ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ನಿಯೋಜನೆ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ಮಾದರಿಯನ್ನು ನೋಂದಾಯಿಸುವುದು, ಸಂಪನ್ಮೂಲಗಳನ್ನು ರಚಿಸುವುದು ಮತ್ತು ಅವುಗಳನ್ನು ವೆಬ್ ಸೇವೆಗೆ ಸಂರಚಿಸುವುದು ಸೇರಿವೆ. Deploy ಸ್ಥಿತಿಯಡಿ ಸ್ಥಿತಿ ಸಂದೇಶ ಕಾಣಿಸುತ್ತದೆ. ನಿಯೋಜನೆ ಸ್ಥಿತಿಯನ್ನು ಪರಿಶೀಲಿಸಲು Refresh periodically ಆಯ್ಕೆಮಾಡಿ. ಸ್ಥಿತಿ "Healthy" ಆಗಿದ್ದಾಗ ಅದು ನಿಯೋಜಿತ ಮತ್ತು ಚಾಲನೆಯಲ್ಲಿ ಇದೆ.
![deploy-2](../../../../translated_images/kn/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.png)
![deploy-2](../../../../translated_images/kn/deploy-2.94dbb13f23908647.webp)
16. ನಿಯೋಜನೆಯಾದ ನಂತರ, Endpoint ಟ್ಯಾಬ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನೀವು appena ನಿಯೋಜಿಸಿದ ಎಂಡ್ಪಾಯಿಂಟ್ ಕ್ಲಿಕ್ ಮಾಡಿ. ಇಲ್ಲಿ ನೀವು ಎಂಡ್ಪಾಯಿಂಟ್ ಬಗ್ಗೆ ಬೇಕಾದ ಎಲ್ಲಾ ವಿವರಗಳನ್ನು ಕಾಣಬಹುದು.
![deploy-3](../../../../translated_images/kn/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.png)
![deploy-3](../../../../translated_images/kn/deploy-3.fecefef070e8ef3b.webp)
ಅದ್ಭುತ! ಈಗ ನಮಗೆ ಮಾದರಿ ನಿಯೋಜಿಸಲಾಗಿದೆ, ನಾವು ಎಂಡ್ಪಾಯಿಂಟ್ ಬಳಕೆಯನ್ನು ಪ್ರಾರಂಭಿಸಬಹುದು.
@ -263,7 +263,7 @@ CPU ಮತ್ತು GPU ವಾಸ್ತುಶಿಲ್ಪದ ಮುಖ್ಯ ವ
ಈ ಸ್ಕ್ರಿಪ್ಟ್ ನೇರವಾಗಿ ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರದಿಂದ ಚಾಲನೆ ಮಾಡಬಹುದು ಮತ್ತು ನಿಮ್ಮ ಎಂಡ್ಪಾಯಿಂಟ್ ಅನ್ನು ಬಳಕೆ ಮಾಡುತ್ತದೆ.
![35](../../../../translated_images/kn/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.png)
![35](../../../../translated_images/kn/consumption-1.700abd196452842a.webp)
ಆ ಎರಡು ಸಾಲುಗಳ ಕೋಡ್ ಪರಿಶೀಲಿಸಲು ಒಂದು ಕ್ಷಣ ತೆಗೆದುಕೊಳ್ಳಿ:

@ -48,7 +48,7 @@
[ಹಿಂದಿನ ಪಾಠದಲ್ಲಿ](../18-Low-Code/README.md), ನಾವು ಕಡಿಮೆ ಕೋಡ್/ಕೋಡ್ ಇಲ್ಲದ ರೀತಿಯಲ್ಲಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಬಳಕೆ ಮಾಡುವುದು ಹೇಗೆ ಎಂದು ನೋಡಿದ್ದೇವೆ. ನಾವು ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್ ಬಳಸಿ ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಮಾದರಿಯನ್ನು ರಚಿಸಿದ್ದೇವೆ. ಈ ಪಾಠದಲ್ಲಿ, ನಾವು ಅದೇ ಕಾರ್ಯವನ್ನು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಎಸ್‌ಡಿಕೆ ಬಳಸಿ ಮಾಡಲಿದ್ದೇವೆ.
![project-schema](../../../../translated_images/kn/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.png)
![project-schema](../../../../translated_images/kn/project-schema.420e56d495624541.webp)
### 1.2 ಹೃದಯ ವೈಫಲ್ಯ ಭವಿಷ್ಯವಾಣಿ ಯೋಜನೆ ಮತ್ತು ಡೇಟಾಸೆಟ್ ಪರಿಚಯ
@ -65,7 +65,7 @@
ನಾವು ಮೊದಲು ರಚಿಸಿದ [ಅಜೂರ್ ಎಂಎಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್](https://ml.azure.com/) ನಲ್ಲಿ, ಕಂಪ್ಯೂಟ್ ಮೆನುಗೆ ಹೋಗಿ ಲಭ್ಯವಿರುವ ವಿವಿಧ ಕಂಪ್ಯೂಟ್ ಸಂಪನ್ಮೂಲಗಳನ್ನು ನೋಡಬಹುದು
![compute-instance-1](../../../../translated_images/kn/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.png)
![compute-instance-1](../../../../translated_images/kn/compute-instance-1.dba347cb199ca499.webp)
ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ಪ್ರೊವಿಷನ್ ಮಾಡಲು ಕಂಪ್ಯೂಟ್ ಇನ್ಸ್ಟಾನ್ಸ್ ರಚಿಸೋಣ.
1. + New ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
@ -88,10 +88,10 @@
1. Applications ವಿಭಾಗದಲ್ಲಿ, Jupyter ಆಯ್ಕೆಯನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ.
2. "Yes, I understand" ಬಾಕ್ಸ್ ಟಿಕ್ ಮಾಡಿ ಮತ್ತು Continue ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![notebook-1](../../../../translated_images/kn/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.png)
![notebook-1](../../../../translated_images/kn/notebook-1.12998af7b02c83f5.webp)
3. ಇದು ನಿಮ್ಮ ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್ ಇನ್ಸ್ಟಾನ್ಸ್‌ನೊಂದಿಗೆ ಹೊಸ ಬ್ರೌಸರ್ ಟ್ಯಾಬ್ ತೆರೆಯುತ್ತದೆ. ನೋಟ್ಬುಕ್ ರಚಿಸಲು "New" ಬಟನ್ ಕ್ಲಿಕ್ ಮಾಡಿ.
![notebook-2](../../../../translated_images/kn/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.png)
![notebook-2](../../../../translated_images/kn/notebook-2.9a657c037e34f1cf.webp)
ನಾವು ಈಗ ನೋಟ್ಬುಕ್ ಹೊಂದಿದ್ದೇವೆ, ಅಜೂರ್ ಎಂಎಲ್ ಎಸ್‌ಡಿಕೆ ಬಳಸಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಬಹುದು.

@ -1,12 +1,12 @@
# ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್
![cloud-picture](../../../translated_images/kn/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.jpg)
![cloud-picture](../../../translated_images/kn/cloud-picture.f5526de3c6c6387b.webp)
> ಫೋಟೋ [Jelleke Vanooteghem](https://unsplash.com/@ilumire) ಅವರಿಂದ [Unsplash](https://unsplash.com/s/photos/cloud?orientation=landscape)
ಬೃಹತ್ ಡೇಟಾ ಜೊತೆಗೆ ಡೇಟಾ ಸೈನ್ಸ್ ಮಾಡುವಾಗ, ಕ್ಲೌಡ್ ಒಂದು ಆಟ ಬದಲಿಸುವುದಾಗಿ ಇರಬಹುದು. ಮುಂದಿನ ಮೂರು ಪಾಠಗಳಲ್ಲಿ, ನಾವು ಕ್ಲೌಡ್ ಎಂದರೇನು ಮತ್ತು ಅದು ಏಕೆ ಬಹಳ ಸಹಾಯಕವಾಗಬಹುದು ಎಂಬುದನ್ನು ನೋಡಲಿದ್ದೇವೆ. ನಾವು ಹೃದಯ ವೈಫಲ್ಯ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಅನ್ವೇಷಿಸಿ, ಯಾರಿಗಾದರೂ ಹೃದಯ ವೈಫಲ್ಯ ಇರುವ ಸಾಧ್ಯತೆಯನ್ನು ಅಂದಾಜಿಸಲು ಸಹಾಯ ಮಾಡುವ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಲಿದ್ದೇವೆ. ನಾವು ಮಾದರಿಯನ್ನು ತರಬೇತಿ, ನಿಯೋಜನೆ ಮತ್ತು ಬಳಕೆ ಮಾಡಲು ಕ್ಲೌಡ್ ಶಕ್ತಿಯನ್ನು ಎರಡು ವಿಭಿನ್ನ ರೀತಿಗಳಲ್ಲಿ ಬಳಸಲಿದ್ದೇವೆ. ಒಂದು ಮಾರ್ಗವು ಕೇವಲ ಬಳಕೆದಾರ ಇಂಟರ್ಫೇಸ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಲೋ ಕೋಡ್/ನೋ ಕೋಡ್ ಶೈಲಿಯಲ್ಲಿ, ಮತ್ತೊಂದು ಮಾರ್ಗವು ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸಾಫ್ಟ್‌ವೇರ್ ಡೆವಲಪರ್ ಕಿಟ್ (Azure ML SDK) ಬಳಸಿ.
![project-schema](../../../translated_images/kn/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.png)
![project-schema](../../../translated_images/kn/project-schema.420e56d495624541.webp)
### ವಿಷಯಗಳು

@ -32,7 +32,7 @@
* [ಆರೋಗ್ಯ ಸೇವೆಯಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್](https://data-flair.training/blogs/data-science-in-healthcare/) - ವೈದ್ಯಕೀಯ ಚಿತ್ರಣ (ಉದಾ: MRI, X-ರೇ, CT-ಸ್ಕ್ಯಾನ್), ಜಿನೋಮಿಕ್ಸ್ (DNA ಕ್ರಮಬದ್ಧತೆ), ಔಷಧಿ ಅಭಿವೃದ್ಧಿ (ಅಪಾಯ ಮೌಲ್ಯಮಾಪನ, ಯಶಸ್ಸಿನ ಭವಿಷ್ಯವಾಣಿ), ಭವಿಷ್ಯವಾಣಿ ವಿಶ್ಲೇಷಣೆ (ರೋಗಿ ಆರೈಕೆ ಮತ್ತು ಸರಬರಾಜು ಲಾಜಿಸ್ಟಿಕ್ಸ್), ರೋಗ ಟ್ರ್ಯಾಕಿಂಗ್ ಮತ್ತು ತಡೆ ಮುಂತಾದ ಅನ್ವಯಿಕೆಗಳನ್ನು ಹೈಲೈಟ್ ಮಾಡುತ್ತದೆ.
![ನಿಜಜೀವನದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ವಯಿಕೆಗಳು](../../../../translated_images/kn/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.png) ಚಿತ್ರ ಕ್ರೆಡಿಟ್: [ಡೇಟಾ ಫ್ಲೇರ್: 6 ಅದ್ಭುತ ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ವಯಿಕೆಗಳು](https://data-flair.training/blogs/data-science-applications/)
![ನಿಜಜೀವನದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ವಯಿಕೆಗಳು](../../../../translated_images/kn/data-science-applications.4e5019cd8790ebac.webp) ಚಿತ್ರ ಕ್ರೆಡಿಟ್: [ಡೇಟಾ ಫ್ಲೇರ್: 6 ಅದ್ಭುತ ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ವಯಿಕೆಗಳು](https://data-flair.training/blogs/data-science-applications/)
ಚಿತ್ರವು ಡೇಟಾ ಸೈನ್ಸ್ ತಂತ್ರಗಳನ್ನು ಅನ್ವಯಿಸುವ ಇತರ ಕ್ಷೇತ್ರಗಳು ಮತ್ತು ಉದಾಹರಣೆಗಳನ್ನು ತೋರಿಸುತ್ತದೆ. ಇತರ ಅನ್ವಯಿಕೆಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ಬಯಸುತ್ತೀರಾ? ಕೆಳಗಿನ [ಪರಿಶೀಲನೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) ವಿಭಾಗವನ್ನು ಪರಿಶೀಲಿಸಿ.

@ -13,7 +13,7 @@
2. ಡೇಟಾಸೆಟ್ [ಕ್ಯಾಟಲಾಗ್](https://planetarycomputer.microsoft.com/catalog) ಅನ್ನು ಅನ್ವೇಷಿಸಿ - ಪ್ರತಿ ಡೇಟಾಸೆಟ್ ಉದ್ದೇಶವನ್ನು ತಿಳಿದುಕೊಳ್ಳಿ.
3. ಎಕ್ಸ್‌ಪ್ಲೋರರ್ ಬಳಸಿ - ಆಸಕ್ತಿಯ ಡೇಟಾಸೆಟ್ ಆಯ್ಕೆಮಾಡಿ, ಸಂಬಂಧಿತ ಪ್ರಶ್ನೆ ಮತ್ತು ರೆಂಡರಿಂಗ್ ಆಯ್ಕೆಯನ್ನು ಆರಿಸಿ.
![ಗ್ರಹಣ ಕಂಪ್ಯೂಟರ್ ಎಕ್ಸ್‌ಪ್ಲೋರರ್](../../../../translated_images/kn/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.png)
![ಗ್ರಹಣ ಕಂಪ್ಯೂಟರ್ ಎಕ್ಸ್‌ಪ್ಲೋರರ್](../../../../translated_images/kn/planetary-computer-explorer.c1e95a9b053167d6.webp)
`ನಿಮ್ಮ ಕಾರ್ಯ:`
ಈಗ ಬ್ರೌಸರ್‌ನಲ್ಲಿ ರೆಂಡರ್ ಆಗಿರುವ ದೃಶ್ಯೀಕರಣವನ್ನು ಅಧ್ಯಯನ ಮಾಡಿ ಮತ್ತು ಕೆಳಗಿನ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಿ:

@ -1,253 +1,262 @@
# ಆರಂಭಿಕರಿಗಾಗಿ ಡೇಟಾ ವಿಜ್ಞಾನ - ಪಾಠ್ಯಕ್ರಮ
# Data Science for Beginners - A Curriculum
[![GitHub Codespaces ನಲ್ಲಿ ತೆರೆಯಿರಿ](https://github.com/codespaces/badge.svg)](https://github.com/codespaces/new?hide_repo_select=true&ref=main&repo=344191198)
[![Open in GitHub Codespaces](https://github.com/codespaces/badge.svg)](https://github.com/codespaces/new?hide_repo_select=true&ref=main&repo=344191198)
[![GitHub ಪರವಾನಗಿ](https://img.shields.io/github/license/microsoft/Data-Science-For-Beginners.svg)](https://github.com/microsoft/Data-Science-For-Beginners/blob/master/LICENSE)
[![GitHub ಕೊಡುಗೆದಾರರು](https://img.shields.io/github/contributors/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/graphs/contributors/)
[![GitHub ಸಮಸ್ಯೆಗಳು](https://img.shields.io/github/issues/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/issues/)
[![GitHub ಪುಲ್-ರಿಕ್ವೆಸ್ಟ್](https://img.shields.io/github/issues-pr/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/pulls/)
[![PRs ಸ್ವಾಗತ](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com)
[![GitHub license](https://img.shields.io/github/license/microsoft/Data-Science-For-Beginners.svg)](https://github.com/microsoft/Data-Science-For-Beginners/blob/master/LICENSE)
[![GitHub contributors](https://img.shields.io/github/contributors/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/graphs/contributors/)
[![GitHub issues](https://img.shields.io/github/issues/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/issues/)
[![GitHub pull-requests](https://img.shields.io/github/issues-pr/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/pulls/)
[![PRs Welcome](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com)
[![GitHub ವಾಚರ್ಸ್](https://img.shields.io/github/watchers/microsoft/Data-Science-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/Data-Science-For-Beginners/watchers/)
[![GitHub ಫೋರ್ಕ್ಸ್](https://img.shields.io/github/forks/microsoft/Data-Science-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/Data-Science-For-Beginners/network/)
[![GitHub ಸ್ಟಾರ್ಸ್](https://img.shields.io/github/stars/microsoft/Data-Science-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/Data-Science-For-Beginners/stargazers/)
[![GitHub watchers](https://img.shields.io/github/watchers/microsoft/Data-Science-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/Data-Science-For-Beginners/watchers/)
[![GitHub forks](https://img.shields.io/github/forks/microsoft/Data-Science-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/Data-Science-For-Beginners/network/)
[![GitHub stars](https://img.shields.io/github/stars/microsoft/Data-Science-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/Data-Science-For-Beginners/stargazers/)
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
[![Microsoft Foundry Developer ಫೋರಮ್](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum)
[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum)
Microsoft ನ Azure ಕ್ಲೌಡ್ ವಕೀಲರು ಡೇಟಾ ವಿಜ್ಞಾನ ಕುರಿತು 10 ವಾರಗಳ, 20 ಪಾಠಗಳ ಪಾಠ್ಯಕ್ರಮವನ್ನು ನೀಡಲು ಸಂತೋಷಪಡುತ್ತಾರೆ. ಪ್ರತಿ ಪಾಠದಲ್ಲಿ ಪಾಠ ಮೊದಲು ಮತ್ತು ನಂತರದ ಕ್ವಿಜ್‌ಗಳು, ಪಾಠವನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು ಬರಹದ ಸೂಚನೆಗಳು, ಪರಿಹಾರ ಮತ್ತು ಕಾರ್ಯನಿರ್ವಹಣೆಯ ಅಸೈನ್ಮೆಂಟ್‌ಗಳಿವೆ. ನಮ್ಮ ಪ್ರಾಜೆಕ್ಟ್ ಆಧಾರಿತ ಪಠ್ಯದ ವಿಧಾನವು ನೀವು ನಿರ್ಮಾಣ ಮಾಡುವಾಗ ಕಲಿಯಲು ಅವಕಾಶ ನೀಡುತ್ತದೆ, ಇದು ಹೊಸ ಕೌಶಲ್ಯಗಳನ್ನ "ಇಟ್ಟುಕೊಳ್ಳಲು" ಸಾಬೀತಾದ ವಿಧಾನವಾಗಿದೆ.
Microsoft ನಲ್ಲಿ Azure Cloud Advocates ಡೇಟಾ ವಿಜ್ಞಾನ ಕುರಿತ 10 ವಾರಗಳ, 20 ಪಾಠದ ಪಠ್ಯಕ್ರಮವನ್ನು ನೀಡಲು ಸಂತೋಷಪಡುತ್ತಾರೆ. ಪ್ರತಿಯೊಂದು ಪಾಠದಲ್ಲಿಯೂ ಪಾಠದ ಮೊದಲು ಮತ್ತು ನಂತರದ ಪ್ರಶ್ನೋತ್ತರಗಳು, ಪಾಠವನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು ಬರೆಯಲಾದ ಸೂಚನೆಗಳು, ಪರಿಹಾರ ಮತ್ತು ಹವಸಿಕೆಒಂದು ಸೇರಿವೆ. ನಮ್ಮ ಯೋಜನೆ ಆಧಾರಿತ ಪಠ್ಯ ಕ್ರಮದಿಂದ ನೀವು ನಿರ್ಮಿಸುತ್ತಾ ಕಲಿಯಬಹುದು, ಇದು ಹೊಸ ಕೌಶಲ್ಯಗಳಿಗೆ "ಕದ್ದಲೆ" ಆಗುವ ಸSyncೃತಿಯಾಗಿದೆ.
**ನಮ್ಮ ಲೇಖಕರಿಗೆ ಹೃದಯಪೂರ್ವಕ ಧನ್ಯವಾದಗಳು:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer).
**ನಮ್ಮ ಲೇಖಕರಿಗೆ ಹೃತ್ಪೂರ್ವಕ ಧನ್ಯವಾದಗಳು:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer).
**🙏 ವಿಶೇಷ ಧನ್ಯವಾದಗಳು 🙏 ನಮ್ಮ [Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) ಲೇಖಕರಿಗೆ, ವಿಮರ್ಶಕರಿಗೆ ಮತ್ತು ವಿಷಯದ ತೊಡಕುಗಳವರಿಗೆ,** ವಿಶೇಷವಾಗಿ Aaryan Arora, [Aditya Garg](https://github.com/AdityaGarg00), [Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/), [Ankita Singh](https://www.linkedin.com/in/ankitasingh007), [Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/), [Arpita Das](https://www.linkedin.com/in/arpitadas01/), ChhailBihari Dubey, [Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor), [Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [Majd Safi](https://www.linkedin.com/in/majd-s/), [Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/), [Miguel Correa](https://www.linkedin.com/in/miguelmque/), [Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119), [Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum), [Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/), [Rohit Yadav](https://www.linkedin.com/in/rty2423), Samridhi Sharma, [Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200),
**🙏 ನಮ್ಮ [Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) ಲೇಖಕರಿಗೆ, ವಿಮರ್ಶಕರಿಗೆ ಮತ್ತು ವಿಷಯ ದೇಣಿಗೆಯವರಿಗೆ ವಿಶೇಷ ಧನ್ಯವಾದಗಳು 🙏,** ವಿಶೇಷವಾಗಿ Aaryan Arora, [Aditya Garg](https://github.com/AdityaGarg00), [Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/), [Ankita Singh](https://www.linkedin.com/in/ankitasingh007), [Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/), [Arpita Das](https://www.linkedin.com/in/arpitadas01/), ChhailBihari Dubey, [Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor), [Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [Majd Safi](https://www.linkedin.com/in/majd-s/), [Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/), [Miguel Correa](https://www.linkedin.com/in/miguelmque/), [Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119), [Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum), [Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/), [Rohit Yadav](https://www.linkedin.com/in/rty2423), Samridhi Sharma, [Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200),
[Sheena Narula](https://www.linkedin.com/in/sheena-narua-n/), [Tauqeer Ahmad](https://www.linkedin.com/in/tauqeerahmad5201/), Yogendrasingh Pawar , [Vidushi Gupta](https://www.linkedin.com/in/vidushi-gupta07/), [Jasleen Sondhi](https://www.linkedin.com/in/jasleen-sondhi/)
|![@sketchthedocs ನಿಂದ ಸ್ಕೆಚ್‌ಡೋಕ್ https://sketchthedocs.dev](../../translated_images/kn/00-Title.8af36cd35da1ac55.webp)|
|![Sketchnote by @sketchthedocs https://sketchthedocs.dev](../../translated_images/kn/00-Title.8af36cd35da1ac55.webp)|
|:---:|
| ಆರಂಭಿಕರಿಗಾಗಿ ಡೇಟಾ ವಿಜ್ಞಾನ - _[^nitya](https://twitter.com/nitya) ಅವರ ಸ್ಕೆಚ್‌ಡೋಕ್_ |
| ಪ್ರಾರಂಭಿಕರಿಗಾಗಿ ಡೇಟಾ ಸೈನ್ಸ್ - _ಸ್ಕೆಚ್ನೋಟ್ [@nitya](https://twitter.com/nitya)ನಿಂದ_ |
### 🌐 ಬಹುಭಾಷಾ ಬೆಂಬಲ
#### GitHub ಕ್ರಿಯೆಗೇಟ್ ಮೂಲಕ ಬೆಂಬಲಿತ (ಸ್ವಯಂಚಾಲಿತ ಮತ್ತು ಸದಾ ನವೀಕರಿಸುವ)
#### GitHub Action ಮೂಲಕ ಬೆಂಬಲಿಸಲಾಗಿದೆ (ಸ್ವಯಂಚಾಲಿತ & ಸದಾ ನವೀಕರಿಸಿದ)
<!-- CO-OP TRANSLATOR LANGUAGES TABLE START -->
[Arabic](../ar/README.md) | [Bengali](../bn/README.md) | [Bulgarian](../bg/README.md) | [Burmese (Myanmar)](../my/README.md) | [Chinese (Simplified)](../zh-CN/README.md) | [Chinese (Traditional, Hong Kong)](../zh-HK/README.md) | [Chinese (Traditional, Macau)](../zh-MO/README.md) | [Chinese (Traditional, Taiwan)](../zh-TW/README.md) | [Croatian](../hr/README.md) | [Czech](../cs/README.md) | [Danish](../da/README.md) | [Dutch](../nl/README.md) | [Estonian](../et/README.md) | [Finnish](../fi/README.md) | [French](../fr/README.md) | [German](../de/README.md) | [Greek](../el/README.md) | [Hebrew](../he/README.md) | [Hindi](../hi/README.md) | [Hungarian](../hu/README.md) | [Indonesian](../id/README.md) | [Italian](../it/README.md) | [Japanese](../ja/README.md) | [Kannada](./README.md) | [Korean](../ko/README.md) | [Lithuanian](../lt/README.md) | [Malay](../ms/README.md) | [Malayalam](../ml/README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Nigerian Pidgin](../pcm/README.md) | [Norwegian](../no/README.md) | [Persian (Farsi)](../fa/README.md) | [Polish](../pl/README.md) | [Portuguese (Brazil)](../pt-BR/README.md) | [Portuguese (Portugal)](../pt-PT/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Romanian](../ro/README.md) | [Russian](../ru/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Slovak](../sk/README.md) | [Slovenian](../sl/README.md) | [Spanish](../es/README.md) | [Swahili](../sw/README.md) | [Swedish](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tamil](../ta/README.md) | [Telugu](../te/README.md) | [Thai](../th/README.md) | [Turkish](../tr/README.md) | [Ukrainian](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamese](../vi/README.md)
> **ಸ್ಥಳೀಯವಾಗಿ ಕ್ಲೋನ್ ಮಾಡಬೇಕೆ?**
> ಈ ರೆಪೋಸಿಟರಿಗೆ 50+ ಭಾಷಾ ಅನುವಾದಗಳಿವೆ, ಇದು ಡೌನ್ಲೋಡ್ ಗಾತ್ರವನ್ನು ಬಹಳ ಹೆಚ್ಚಿಸುತ್ತದೆ. ಅನುವಾದಗಳಿಲ್ಲದೆ ಕ್ಲೋನ್ ಮಾಡಲು, ಸ್ಪಾರ್ಸ್ ಚೆಕ್ಔಟ್ ಬಳಸಿ:
> **ಸ್ಥಳೀಯವಾಗಿ ಕ್ಲೋನ್ ಮಾಡಬೇಕೇ?**
>
> ಈ ಸಂಗ್ರಹಸ್ಥಳವು 50+ ಭಾಷಾ ಅನುವಾದಗಳನ್ನು ಒಳಗೊಂಡಿದೆ ಇದು ಡೌನ್ಲೋಡ್ ಗಾತ್ರವನ್ನು ಬಹಳ ಹೆಚ್ಚಿಸುತ್ತದೆ. ಅನುವಾದಗಳಿಲ್ಲದೆ ಕ್ಲೋನ್ ಮಾಡಲು sparse checkout ಬಳಸಿ:
>
> **Bash / macOS / Linux:**
> ```bash
> git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
> cd Data-Science-For-Beginners
> git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'
> ```
> ಇದರಿಂದ ನಿಮ್ಮ ಪಾಠ ನಡಿಸುವಿಕೆಗೆ ಬೇಕಾದ ಎಲ್ಲವೂ ಸಿಗುತ್ತದೆ ಮತ್ತು ಡೌನ್ಲೋಡ್ ವೇಗವಾಗಿರುತ್ತದೆ.
>
> **CMD (Windows):**
> ```cmd
> git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
> cd Data-Science-For-Beginners
> git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"
> ```
>
> ಇದು ನಿಮಗೆ ಕೊರ್ಸ್ ಪೂರ್ಣಗೊಳಿಸಲು ಅಗತ್ಯವಿರುವ ಎಲ್ಲವನ್ನೂ ಶೀಘ್ರ ಡೌನ್ಲೋಡ್ ಜೊತೆ ನೀಡುತ್ತದೆ.
<!-- CO-OP TRANSLATOR LANGUAGES TABLE END -->
**ನೀವು ಹೆಚ್ಚುವರಿ ಭಾಷಾ ಅನುವಾದಗಳನ್ನು ಬೆಂಬಲಿಸಲು ಇಚ್ಛಿಸಿದರೆ ಅವುಗಳು [ಇಲ್ಲಿ](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md) ಪಟ್ಟಿಮಾಡಲಾಗಿದೆ**
**ನೀವು ಹೆಚ್ಚುವರಿ ಭಾಷಾ ಅನುವಾದಗಳನ್ನು ಬೆಂಬಲಿಸಲು ಬಯಸಿದರೆ, ಅವು [ಇಲ್ಲಿ](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md) ಪಟ್ಟಿಮಾಡಲಾಗಿದೆ**
#### ನಮ್ಮ ಸಮುದಾಯಕ್ಕೆ ಸೇರಿ
#### ನಮ್ಮ ಸಮುದಾಯದಲ್ಲಿ ಸೇರಿಕೊಳ್ಳಿ
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
ನಮ್ಮ ಬಳಿ ಡಿಸ್ಕಾರ್ಡ್ನಲ್ಲಿ AI ಸಹಿತ ಕಲಿಯುವುದು ಸರಣಿ ಪ್ರವಾಹವಾಗಿ ಇದೆ, ಹೆಚ್ಚು ತಿಳಿದುಕೊಳ್ಳಿ ಮತ್ತು ನಮ್ಮೊಂದಿಗೆ ಸೇರಿಕೊಳ್ಳಿ [Learn with AI Series](https://aka.ms/learnwithai/discord) 2025ರ ಸೆಪ್ಟೆಂಬರ್ 18 - 30 ರವರೆಗೆ. ನೀವು GitHub Copilot ಅನ್ನು ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಬಳಸುವ ಸಲಹೆಗಳು ಮತ್ತು ತಂತ್ರಗಳನ್ನು ಪಡೆಯುತ್ತೀರಿ.
ನಮ್ಮ ಡಿಸ್ಕೋರ್ಡ್‌ನಲ್ಲಿ AI ಸರಣಿಯೊಂದಿಗೆ ಕಲಿಕಾ ಕಾರ್ಯಕ್ರಮವಾಗಿದ್ದು, 2025 ಸೆಪ್ಟೆಂಬರ್ 18 - 30 ರವರೆಗೆ ನಡೆಯುತ್ತಿದೆ. ಮತ್ತಷ್ಟು ತಿಳಿಯಲು ಮತ್ತು ಸೇರುವುದಕ್ಕೆ [Learn with AI Series](https://aka.ms/learnwithai/discord) ಗೆ ಭೇಟಿ ನೀಡಿ. ನೀವು GitHub Copilot ಯನ್ನು ಡೇಟಾ ಸೈನ್ಸ್ ಬಳಕೆಗಾಗಿ ಉಪಯೋಗಿಸುವ ಸಲಹೆ-ತಂತ್ರಗಳನ್ನು ಪಡೆಯುತ್ತೀರಿ.
![AI ಸರಣಿಯೊಂದಿಗೆ ಕಲಿಯಿರಿ](../../translated_images/kn/1.2b28cdc6205e26fe.webp)
![Learn with AI series](../../translated_images/kn/1.2b28cdc6205e26fe.webp)
# ನೀವು ವಿದ್ಯಾರ್ಥಿಗಳಾದೀರಾ?
# ನೀವು ವಿದ್ಯಾರ್ಥಿಯಾಗಿದ್ದೀರಾ?
ಕೆಳಗಿನ ಸಂಪನ್ಮೂಲಗಳಿಂದ ಪ್ರಾರಂಭಿಸಿ:
ಕೆಳಗಿನ ಸಂಪನ್ಮೂಲಗಳೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ:
- [ವಿದ್ಯಾರ್ಥಿ ಕೇಂದ್ರ ಪುಟ](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) ಈ ಪುಟದಲ್ಲಿ ಆರಂಭಿಕರಿಗೆ ಸಂಪನ್ಮೂಲಗಳು, ವಿದ್ಯಾರ್ಥಿ ಪ್ಯಾಕ್ಗಳು ಮತ್ತು ಉಚಿತ ಪ್ರಮಾಣಿ ಸರ್ಟಿಫಿಕೇಟ್ ವಚರ್ ಪಡೆಯುವ ಮಾರ್ಗಗಳಿವೆ. ಇದು ನೀವು ಸಮಯಕ್ಕೆ ಸಮಯಕ್ಕೆ ಪರಿಶೀಲಿಸಲು ಬುಕ್ಮಾರ್ಕ್ ಮಾಡಬೇಕಾದ ಒಂದು ಪುಟ.
- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) ಜಾಗತಿಕ ವಿದ್ಯಾರ್ಥಿ ಅಂಬಾಸಡರ್ ಸಮುದಾಯವನ್ನು ಸೇರಿ, ಇದು Microsoft ಗೆ ನಿಮ್ಮ ಪ್ರವೇಶವಾಗಬಹುದು.
- [Student Hub page](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) ಈ ಪುಟದಲ್ಲಿ ನೀವು ಆರಂಭಿಕ ಸಂಪನ್ಮೂಲಗಳು, ವಿದ್ಯಾರ್ಥಿ ಪ್ಯಾಕ್ಸ್ ಮತ್ತು ಉಚಿತ ಪ್ರಮಾಣಪತ್ರ ವೌಚರ್ ಪಡೆಯುವುದು ಸೇರಿದಂತೆ ಅನೇಕ ವಿಷಯಗಳನ್ನು ಕಾಣಬಹುದು. ಇದು ನೀವು ಸಮಯಕಾಲಕ್ಕೆ ಪರಿಶೀಲಿಸಬೇಕಾದ ಪುಟ.
- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) ಜಾಗತಿಕ ವಿದ್ಯಾರ್ಥಿ ಒತ್ತಾಯಕರ ಸಮುದಾಯದಲ್ಲಿ ಸೇರಿಕೊಳ್ಳಿ, ಇದು ನಿಮ್ಮ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಪ್ರವೇಶವಾಗಬಹುದು.
# ಪ್ರಾರಂಭಿಸುವುದು
## 📚 ಡಕ್ಯುಮೆಂಟೇಶನ್
## 📚 ಡಕ್ಯುಮೆಂಟೇಶನ್
- **[ಸೆಟ್ ಅಪ್ ಮಾರ್ಗದರ್ಶಿ](INSTALLATION.md)** - ಆರಂಭಿಕರಿಗಾಗಿ ಹಂತ ಹಂತದ ಸ್ಥಾಪನೆ ಸೂಚನೆಗಳು
- **[ಬಳಕೆ ಮಾರ್ಗದರ್ಶಿ](USAGE.md)** - ಉದಾಹರಣೆಗಳು ಮತ್ತು ಸಾಮಾನ್ಯ ಕಾರ್ಯವೃಂದ
- **[amas್ಯೆಗಳ ಪರಿಹಾರ](TROUBLESHOOTING.md)** - ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳಿಗೆ ಪರಿಹಾರಗಳು
- **[ ಕೊಡುಗೆ ಮಾರ್ಗದರ್ಶಿ](CONTRIBUTING.md)** - ಈ ಯೋಜನೆಗೆ ಹೇಗೆ ಕೊಡುಗೆ ನೀಡುವುದು
- **[ಶಿಕ್ಷಕರಿಗಾಗಿ](for-teachers.md)** - ಬೋಧನೆ ಮಾರ್ಗದರ್ಶನ ಮತ್ತು ತರಗತಿ ಸಂಪನ್ಮೂಲಗಳು
- **[ಇನ್ಸ್ಟಾಲೇಶನ್ ಮಾರ್ಗದರ್ಶಿ](INSTALLATION.md)** - ಹೊಸದಾಗಿ ಪ್ರಾರಂಭಿಸುವವರಿಗೆ ಹಂತ ಹಂತದ ಸ್ಥಾಪನೆ ಸೂಚನೆಗಳು
- **[ಬಳಕೆ ಮಾರ್ಗದರ್ಶಿ](USAGE.md)** - ಉದಾಹರಣೆಗಳು ಮತ್ತು ಸಾಮಾನ್ಯ ಕಾರ್ಯಚಟುವಟಿಕೆಗಳು
- **[ಮಸ್ಯಾ ಪರಿಹಾರ](TROUBLESHOOTING.md)** - ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳ ಪರಿಹಾರಗಳು
- **[ಕೇಂಪು ನೀಡುವ ಮಾರ್ಗದರ್ಶಿ](CONTRIBUTING.md)** - ಈ ಯೋಜನೆಯಲ್ಲಿ ಹೇಗೆ ಸಹಕಾರ ಮಾಡಬಹುದು
- **[ಗುರುಗಳಿಗೆ](for-teachers.md)** - ಬೋಧನಾ ಮಾರ್ಗದರ್ಶನ ಮತ್ತು ತರಗತಿ ಸಂಪನ್ಮೂಲಗಳು
## 👨‍🎓 ವಿದ್ಯಾರ್ಥಿಗಳಿಗಾಗಿ
> **ಪೂರ್ಣ ನವೀಕರು**: ಡೇಟಾ ವಿಜ್ಞಾನಕ್ಕೆ ಹೊಸದಾದರೆ? ನಮ್ಮ [ಶುರುಆತಿಗೆ ಸೂಕ್ತ ಉದಾಹರಣೆಗಳು](examples/README.md) ಅಲ್ಲಿ ಪ್ರಾರಂಭಿಸಿ! ಈ ಸರಳ, ಚೆನ್ನಾಗಿ ಟಿಪ್ಪಣಿಗಳು ಮಾಡಿದ ಉದಾಹರಣೆಗಳು ನೀವು ಪೂರ್ಣ ಪಾಠ್ಯಕ್ರಮಕ್ಕೆ ಮುಂದಾಗುವ ಮುಂಚೆ ಮೂಲಭೂತಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯಮಾಡುತ್ತವೆ.
> **[ವಿದ್ಯಾರ್ಥಿಗಳು](https://aka.ms/student-page)**: ಈ ಪಾಠ್ಯಕ್ರಮವನ್ನು ಸ್ವತಂತ್ರವಾಗಿ ಬಳಸಲು, ಸಂಪೂರ್ಣ ರೆಪೋವನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ ಮತ್ತು ಮುಂಚಿನ ಉಪನ್ಯಾಸ ಕ್ವಿಜಿನಿಂದ ಪ್ರಾರಂಭಿಸಿ ವ್ಯಾಯಾಮಗಳನ್ನು ಸ್ವತಃ ಸಂಪೂರ್ಣಗೊಳಿಸಿ. ನಂತರ ಉಪನ್ಯಾಸವನ್ನು ಓದಿ ಉಳಿದ ಚಟುವಟಿಕೆಗಳನ್ನು ಮಾಡಿರಿ. ಪರಿಹಾರಕೋಡ್ ನಕಲಿಸುವ ಬದಲು ಪಾಠಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಂಡು ಪ್ರಾಜೆಕ್ಟ್‌ಗಳನ್ನು ನಿರ್ಮಿಸಲು ಪ್ರಯತ್ನಿಸಿ; ಈ ಕೋಡ್ ಪ್ರತಿ ಪ್ರಾಜೆಕ್ಟ್ ಆಧಾರಿತ ಪಾಠದಲ್ಲಿನ /solutions ಫೋಲ್ಡರ್‌ಗಳಲ್ಲಿ ಲಭ್ಯವಿದೆ. ಇನ್ನೊಂದು ಆಲೋಚನೆ ಎಂದರೆ ಸ್ನೇಹಿತರೊಂದಿಗೆ ಅಧ್ಯಯನ ಗುಂಪು ರಚಿಸಿ ಮತ್ತು ವಿಷಯವನ್ನು ಒಂದೇಗೂಹಾಗಿ ಓದಿಕೊಳ್ಳುವುದು. ಮುಂದುವರಿದ ಅಧ್ಯಯನಕ್ಕೆ, ನಾವು [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum) ಅನ್ನು ಶಿಫಾರಸು ಮಾಡುತ್ತೇವೆ.
## 👨‍🎓 ವಿದ್ಯಾರ್ಥಿಗಳಿಗ
> **ಸಂಪೂರ್ಣ ಆರಂಭಿಕರು**: ಡೇಟಾ ಸೈನ್ಸ್ ಬಗೆಗಿನ ಹೊಸವರು? ನಮ್ಮ [ಆರಂಭಿಕ ಸ್ನೇಹಪರ ಉದಾಹರಣೆಗಳ](examples/README.md)ೊಂದರಿಂದ ಪ್ರಾರಂಭಿಸಿ! ಈ ಸರಳ, ಚೆನ್ನಾಗಿ ವರ್ಣಿಸಲಾದ ಉದಾಹರಣೆಗಳು ಪಾಠಕ್ರಮದ ಪೂರ್ಣವೂಸಲು ಮೊದಲು ಆಧಾರಭೂತ ವಿಚಾರಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
> **[ವಿದ್ಯಾರ್ಥಿಗಳು](https://aka.ms/student-page)**: ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಸ್ವತಃ ಬಳಸಲು, ಸಂಪೂರ್ಣ ಸಂಗ್ರಹಸ್ಥಳವನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ ಮತ್ತು ಪ್ರಿ-ಲೆಕ್ಚರ್ ಪ್ರಶ್ನೋತ್ತರದಿಂದ ಪ್ರಾರಂಭಿಸಿ ವೈಯಕ್ತಿಕವಾಗಿ ಅಭ್ಯಾಸಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ. ನಂತರ ಪಾಠವನ್ನು ಓದಿ ಉಳಿದ ಚಟುವಟಿಕೆಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿ. ಪರಿಹಾರ ಕೋಡ್ ನಕಲಿಸುವ ಬದಲು ಪಾಠಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಂಡು ಯೋಜನೆಗಳನ್ನು ಸೃಷ್ಟಿಸಲು ಪ್ರಯತ್ನಿಸಿ; ಆದರೂ, ಆ ಕೋಡ್ ಪ್ರತಿ ಯೋಜನೆ ಆಧಾರಿತ ಪಾಠದಲ್ಲಿಯೂ /solutions ಫೋಲ್ಡರ್‌ನಲ್ಲಿ ಲಭ್ಯವಿದೆ. ಇನ್ನೊಂದು ಆಲೋಚನೆ ಇಷ್ಟರಾದಲ್ಲಿ ಸ್ನೇಹಿತರೊಂದಿಗೆ ಅಧ್ಯಯನ ಬಳಗವನ್ನು ನಿರ್ಮಿಸಿ ಮತ್ತು ವಿಷಯಗಳನ್ನು ಸೇರಿಸಿಕೊಳ್ಳಿ. ಮುಂದಿನ ಅಧ್ಯಯನಕ್ಕಾಗಿ ನಾವು [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum) ಅನ್ನು ಶಿಫಾರಸು ಮಾಡುತ್ತೇವೆ.
**ತ್ವರಿತ ಪ್ರಾರಂಭ:**
1. ನಿಮ್ಮ ಪರಿಸರವನ್ನು ಸೆಟ್ ಅಪ್ ಮಾಡಲು [ಸೆಟ್ ಅಪ್ ಮಾರ್ಗದರ್ಶಿ](INSTALLATION.md) ಪರಿಶೀಲಿಸಿ
2. ಪಾಠ್ಯಕ್ರಮದೊಂದಿಗೆ ಹೇಗೆ ಕೆಲಸಮಾಡುವುದು ಎಂದು ತಿಳಿಯಲು [ಬಳಕೆ ಮಾರ್ಗದರ್ಶಿ](USAGE.md) ಪರಿಶೀಲಿಸಿ
3. ಪಾಠ 1 ರಿಂದ ಪ್ರಾರಂಭಿಸಿ ಮತ್ತು ಕ್ರಮೇಣ ಮುಂದುವರಿಯಿರಿ
4. ಬೆಂಬಲಕ್ಕಾಗಿ ನಮ್ಮ [Discord ಸಮುದಾಯ](https://aka.ms/ds4beginners/discord)ದಲ್ಲಿ ಸೇರಿ
**ವೇಗದ ಪ್ರಾರಂಭ:**
1. ನಿಮ್ಮ ವಾತಾವರಣವನ್ನು ಸೆಟ್ ಅಪ್ ಮಾಡಲು [ಇನ್ಸ್ಟಾಲೇಶನ್ ಮಾರ್ಗದರ್ಶಿ](INSTALLATION.md) ಪರಿಶೀಲಿಸಿ
2. ಪಠ್ಯಕ್ರಮದೊಂದಿಗೆ ಏನು ಮಾಡುವುದು ಎಂದು ತಿಳಿಯ ಬಹುದು [ಬಳಕೆ ಮಾರ್ಗದರ್ಶಿ](USAGE.md) ಓದಿ
3. ಪಾಠ 1 ರಿಂದ ಪ್ರಾರಂಭಿಸಿ ಕ್ರಮವಾಗಿ ಮುಂದುವರಿಯಿರಿ
4. ಬೆಂಬಲಕ್ಕಾಗಿ ನಮ್ಮ [ಡಿಸ್ಕೋರ್ಡ್ ಸಮುದಾಯಕ್ಕೆ](https://aka.ms/ds4beginners/discord) ಸೇರುವುದು
## 👩‍🏫 ಶಿಕ್ಷಕರಿಗಾಗಿ
## 👩‍🏫 ಗುರುಗಳಿಗೆ
> **ಶಿಕ್ಷಕರು**: ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ಹೇಗೆ ಬಳಸಬೇಕೆಂದು [ಕೆಲವು ಸಲಹೆಗಳನ್ನು ಸೇರಿಸಲಾಗಿದೆ](for-teachers.md). ನಮ್ಮ ಚರ್ಚಾ ವಿನ್ಯಾಸದಲ್ಲಿ ನಿಮ್ಮ ಅಭಿಪ್ರಾಯಗಳನ್ನು ತಿಳಿಸಲು ನಾವು ಉತ್ಸುಕರಾಗಿದ್ದೇವೆ [ನಮ್ಮ ಚರ್ಚಾ ವೇದಿಕೆಯಲ್ಲಿ](https://github.com/microsoft/Data-Science-For-Beginners/discussions)!
> **ಶಿಕ್ಷಕರು**: ಈ ಪಾಠ್ಯಕ್ರಮವನ್ನು ಹೇಗೆ ಬಳಸಬೇಕು ಎಂಬ ಕೆಲವು ಸಲಹೆಗಳನ್ನು [ನಾವು ಸೇರಿಸಿರುವೆವು](for-teachers.md). ದಯವಿಟ್ಟು ನಿಮ್ಮ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ನಮ್ಮ [ಚರ್ಚಾ ವೇದಿಕೆ](https://github.com/microsoft/Data-Science-For-Beginners/discussions) ನಲ್ಲಿ ವಂಚಿಸಬೇಡಿ!
## ತಂಡವನ್ನು ಭೇಟಿ ಮಾಡಿ
[![ಪ್ರಚಾರ ವೀಡಿಯೋ](../../ds-for-beginners.gif)](https://youtu.be/8mzavjQSMM4 "ಪ್ರಚಾರ ವೀಡಿಯೋ")
**ಗಿಫ್ ಮಾಡಿದ್ದು** [ಮೊಹಿತ್ ಜೈಸಲ್](https://www.linkedin.com/in/mohitjaisal)
**ಗಿನೀ ಚಿತ್ರವನ್ನು** [ಮೋಹಿತ್ ಜೈಸಾಲ್](https://www.linkedin.com/in/mohitjaisal) ರಚಿಸಿದ್ದಾರೆ
> 🎥 ಮೇಲಿನ ಚಿತ್ರವನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಯೋಜನೆ ಮತ್ತು ಅದನ್ನು ರಚಿಸಿದ ಅಧಿಕಾರಿಗಳ ಕುರಿತು ವೀಡಿಯೋ ವೀಕ್ಷಿಸಲು!
> 🎥 ಮೇಲಿನ ಚಿತ್ರವನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಯೋಜನೆ ಮತ್ತು ಅದನ್ನು ರಚಿಸಿದ ಜನರ ಕುರಿತು ವೀಡಿಯೋವನ್ನು ನೋಡಿ!
## ಶಿಕ್ಷಣಶಾಸ್ತ್ರ
## ಪಾಠಶಾಸ್ತ್ರ
ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ನಿರ್ಮಿಸುವ ವೇಳೆ ನಾವು ಎರಡು ಶಿಕ್ಷಣದ ತತ್ವಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಿಕೊಂಡಿದ್ದೇವೆ: ಇದು ಯೋಜನೆ ಆಧಾರಿತವಾಗಿರಬೇಕು ಮತ್ತು ಇದರಲ್ಲಿ ನಿಯಮಿತ ಪ್ರಶ್ನೋತ್ತರಗಳು ಇರಬೇಕು ಎಂಬುದನ್ನು ಖಚಿತಪಡಿಸುವುದು. ಈ ಸರಣಿಯ ಕೊನೆಯಲ್ಲಿ, ವಿದ್ಯಾರ್ಥಿಗಳು ಡೇಟಾ ಸೈನ್ಸ್‌ನ ಮೂಲಭೂತ ಸಿದ್ಧಾಂತಗಳನ್ನು, ಅದರ ಒಳಗೊಂಡ ನೈತಿಕ ವಿಚಾರಗಳನ್ನು, ಡೇಟಾ ಸಿದ್ಧತೆ, ಡೇಟಾ ಜೊತೆಗೆ ಕೆಲಸ ಮಾಡುವ ವಿವಿಧ ಮಾರ್ಗಗಳು, ಡೇಟಾ ದೃಷ್ಯೀಕರಣ, ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ, ಡೇಟಾ ಸೈನ್ಸ್‌ನ ನೈಜ ಜಾಗತಿಕ ಬಳಕೆ ಉದಾಹರಣೆಗಳು ಮತ್ತು ಇನ್ನಷ್ಟು ಕಲಿಯುತ್ತಾರೆ.
ಈ ಪಠ್ಯಕ್ರಮವನ್ನು ರಚಿಸುವಾಗ ನಾವು ಎರಡು ಪಾಠಶಾಸ್ತ್ರದ ತತ್ವಗಳನ್ನು ಆರಿಸಿಕೊಂಡಿದ್ದೇವೆ: ಅದು ಯೋಜನೆ ಆಧಾರಿತವಾಗಿದ್ದು, ನಿಯಮಿತವಾಗಿ ಕುಯಿಜ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿರುವದು. ಈ ಸರಣಿಯ ಅಂತ್ಯಕ್ಕೆ, ವಿದ್ಯಾರ್ಥಿಗಳು ಡೇಟಾ ವಿಜ್ಞಾನದ ಮೂಲ ತತ್ವಗಳನ್ನು, ಆಚಾರ ಸಂಹಿತೆಗಳ ಜೊತೆಗೆ, ಡೇಟಾ તૈયಾರಿ, ಡೇಟಾ ಕೆಲಸ ಮಾಡುವ ವಿಭಿನ್ನ ವಿಧಾನಗಳು, ಡೇಟಾ ದೃಶ್ಯೀಕರಣ, ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ, ಡೇಟಾ ವಿಜ್ಞಾನದ ನೈಜ ಜಗತ್ತಿನ ಬಳಕೆದಾರರ ವಿಚಾರಗಳು ಮತ್ತು ಇತರೆ ವಿಷಯಗಳನ್ನು ಕಲಿಯುವರು.
ಅದರಲ್ಲೂ, ತರಗತಿಗೆ ಮುನ್ನ ಒಂದು ಕಡಿಮ್ಮ ಹಂತದ ಪ್ರಶ್ನೋತ್ತರವು ವಿದ್ಯಾರ್ಥಿಯು ವಿಷಯವನ್ನು ಕಲಿಯಲು ಉದ್ದೇಶ ಹೊಂದಿದ್ದಂತೆ ಮಾಡುತ್ತದೆ, ಟ್ರಿಗರ್ ನಂತರದ ಪ್ರಶ್ನೋತ್ತರವು ಹೆಚ್ಚು ಪಟುವಿಕೆಯನ್ನು ಖಚಿತಪಡಿಸುತ್ತದೆ. ಈ ಪಠ್ಯಕ್ರಮವು ಲವಚಿಕವಾದ ಮತ್ತು ಮನರಂಜನೆಯಾಗಿದೆ, ಸಂಪೂರ್ಣವಾಗಿ ಅಥವಾ ಭಾಗವಾಗಿ ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ಯೋಜನೆಗಳು ಸಣ್ಣದು ಪ್ರಾರಂಭವಾಗಿ 10 ವಾರಗಳ ಚಕ್ರದ ಕೊನೆಯಲ್ಲಿ ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾಗುತ್ತವೆ.
ಅದರ ಜೊತೆಗೆ, ಒಂದು ಪಾಠದ ಮೊದಲಿಗೆ ಒಂದು ಕಡಿಮೆ ಒತ್ತಡದ ಕುಯಿಜ್ ವಿದ್ಯಾರ್ಥಿಯ ಕಲಿಕೆಯ ಮೇಲೆ ಆಕಾಂಕ್ಷೆಯನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ, ಮತ್ತು ಪಾಠದ ನಂತರ ಎರಡನೇ ಕುಯಿಜ್ ಉಳಿಸಿಕೊಂಡಿರುವ ಜ್ಞಾನದ ಸಮರ್ಥಿಕತೆಯನ್ನು ದೃಢಪಡಿಸುತ್ತದೆ. ಈ ಪಠ್ಯಕ್ರಮವು ಬದಲಾಯಿಸಬಹುದಾದ ಮತ್ತು ಮನರಂಜನೆಯಾಗಿರಲು ವಿನ್ಯಾಸಗೊಳ್ಳಿದೆ ಮತ್ತು ಮುಕ್ತವಾಗಿಯೂ ಅಥವಾ ಭಾಗಭಾಗವೊಂದಿಗೆ ಹಂತಗಳಲ್ಲಿ ತೆಗೆದುಕೊಳ್ಳಬಹುದಾಗಿದೆ. ಯೋಜನೆಗಳು ಸಣ್ಣದಾಗಿ ಪ್ರಾರಂಭವಾಗಿ 10 ವಾರಗಳ ಚಕ್ರದ ಅಂತ್ಯಕ್ಕೆ ಹೆಚ್ಚು ಸೊಗಸಾಗಿರುತ್ತವೆ.
> ನಮ್ಮ [ನಡವಳಿಕೆ ನಿಯಮಾವಳಿ](CODE_OF_CONDUCT.md), [ಹೊಂದಾಣಿಕೆ](CONTRIBUTING.md), [ಭಾಷಾಂತರ](TRANSLATIONS.md) ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ. ನಿಮ್ಮ ರಚನೆಯಾತ್ಮಕ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ನಾವು ಸ್ವಾಗತಿಸುತ್ತೇವೆ!
> ನಮ್ಮ [ಚಾಲನ ನಿಯಮಗಳು](CODE_OF_CONDUCT.md), [ಸಹಾಯ](CONTRIBUTING.md), [ಭಾಷಾಂತರ](TRANSLATIONS.md) ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ನೋಡಿ. ನಿಮ್ಮ ಸಂರಚನಾತ್ಮಕ ಪ್ರತಿಕ್ರಿಯೆಗಳಿಗೆ ಸ್ವಾಗತ!
## ಪ್ರತಿ ಪಾಠದಲ್ಲಿ ಸೇರಿವೆ:
## ಪ್ರತಿ ಪಾಠದಲ್ಲಿ ഉള്‍പ്പെടുത്തಲಾಗಿದೆ:
- ಐಚ್ಛಿಕ ಸ್ಕೆಚ್ ನೋಟ್
- ಐಚ್ಛಿಕ ಪೂರಕ ವೀಡಿಯೋ
- ಪಾಠ ಮುಂಚಿನ ತಯಾರಿ ಪ್ರಶ್ನೋತ್ತರ
- ಬರೆಯಲಾದ ಪಾಠ
- ಯೋಜನೆ ಆಧಾರಿತ ಪಾಠಗಳಿಗಾಗಿ, ಯೋಜನೆಯನ್ನು ನಿರ್ಮಿಸುವ ಕುರಿತು ಹಂತ-ಬಂದಿ ಮಾರ್ಗದರ್ಶನ
- ಐಚ್ಛಿಕ ಸ್ಕೆಚ್ ನೋಟ್
- ಐಚ್ಛಿಕ ಸಮರ್ಪಕ ವೀಡಿಯೋ
- ಪಾಠದ ಮುಂಚಿನ ತಂತ್ರಪರಿಕ ಪರೀಕ್ಷೆ
- ಲಿಖಿತ ಪಾಠ
- ಯೋಜನೆ ಆಧಾರಿತ ಪಾಠಗಳಿಗೆ, ಯೋಜನೆಯನ್ನು ರಚಿಸುವ ಹಂತ ಹಂತ ಮಾರ್ಗಸೂಚಿ
- ಜ್ಞಾನ ಪರಿಶೀಲನೆಗಳು
- ಒಂದು ಸವಾಲು
- ಪೂರಕ ಓದು
- ನಿಯೋಜನ
- [ಪಾಠದ ನಂತರದ ಪ್ರಶ್ನೋತ್ತರ](https://ff-quizzes.netlify.app/en/)
- ಸವಾಲು
- ಹೆಚ್ಚುವರಿ ಓದು
- ಕಾರ್ಯನಿರ್ವಹಣ
- [ಪಾಠದ ನಂತರದ ಕುಯಿಜ್](https://ff-quizzes.netlify.app/en/)
> **ಪ್ರಶ್ನೋತ್ತರಗಳ ಕುರಿತು ಒಂದು ಟಿಪ್ಪಣಿ**: ಎಲ್ಲಾ ಪ್ರಶ್ನೋತ್ತರಗಳು Quiz-App ಫೋಲ್ಡರ್‌ನಲ್ಲಿ ಇರುತ್ತವೆ, 40 ಒಟ್ಟು ಪ್ರಶ್ನೋತ್ತರಗಳು ಪ್ರತಿ 3 ಪ್ರಶ್ನೆಗಳೊಂದಿಗೆ. ಅವು ಪಾಠಗಳಲ್ಲಿ ಲಿಂಕ್ ಆಗಿವೆ, ಆದರೆ ಪ್ರಶ್ನೋತ್ತರ ಆಪ್ ಅನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಚಾಲನೆ ಮಾಡಬಹುದು ಅಥವಾ ಅಜ್ಯೂರ್‌ಗೆ ಸ್ಥಾಪಿಸಬಹುದು; `quiz-app` ಫೋಲ್ಡರ್‌ನ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ. ಅವು ಕ್ರಮೇಣ ಸ್ಥಳೀಯಗೊಳ್ಳುತ್ತಿರುವುವು.
> **ಕುಯಿಜ್‌ಗಳ ಬಗ್ಗೆ ಒಂದು ಟಿಪ್ಪಣಿ**: ಎಲ್ಲಾ ಕುಯಿಜ್‌ಗಳು Quiz-App ಫೋಲ್ಡರ್‌ನಲ್ಲಿ ಸೇರಿವೆ, ಪ್ರತಿ ಒಂದರಲ್ಲಿ ಮೂರು ಪ್ರಶ್ನೆಗಳ 40 ಕುಯಿಜ್‌ಗಳ ಒಟ್ಟು. ಅವು ಪಾಠಗಳೊಳಗಿಂದ ಲಿಂಕ್ ಮಾಡಲಾಗಿದೆ, ಆದರೆ ಕುಯಿಜ್ ಅಪ್ಲಿಕೇಶನ್ ನೇರವಾಗಿ ಲೋಕಲ್‌ನಲ್ಲಿ ಅಥವಾ ಅಜೂರ್‌ಗೆ ರವಾನಿಸಬಹುದಾಗಿದೆ; `quiz-app` ಫೋಲ್ಡರ್‌ನಲ್ಲಿ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಿ. ಅವು ಸ್ಥರಿಸಿದ ಭಾಷಾಂತರಗಳಾಗಿ ಕ್ರಮವಾಗಿ ಲಭ್ಯವಾಗುತ್ತಿರುವುವು.
## 🎓 ಆರಂಭಿಕ ಸ್ನೇಹಿ ಉದಾಹರಣೆಗಳು
## 🎓 ಆರಂಭಿಕರಿಗಾಗಿ ಸಹಾಯಕ ಉದಾಹರಣೆಗಳು
**ಡೇಟಾ ಸೈನ್ಸ್‌ಗೆ ಹೊಸವರೇ?** ನಾವು ವಿಶೇಷ [ಉದಾಹರಣೆ ಫೋಲ್ಡರ್](examples/README.md) ರಚಿಸಿದ್ದೇವೆ, ಸರಳ, ಸುಸ್ಪಷ್ಟ ಟಿಪ್ಪಣಿಗಳನ್ನೊಳಗೊಂಡ ಕೋಡ್ ಸಹಿತ ನಿಮ್ಮ ಆರಂಭಕ್ಕೆ ಸಹಾಯವಾಗುತ್ತದೆ:
**ಡೇಟಾ ಸೈನ್ಸ್ ಹೊಸದಾಗಿ ಕಲಿಯುತ್ತಿದ್ದೀರಾ?** ನಿಮ್ಮ ಆರಂಭಕ್ಕಾಗಿ ಸರಳ ಮತ್ತು ಚೆನ್ನಾಗಿ ಕಾಮೆಂಟ್ ಮಾಡಲಾದ ಕೋಡ್ ಹೊಂದಿರುವ ವಿಶೇಷ [ಉದಾಹರಣೆ ಫೋಲ್ಡರ್](examples/README.md) ರಚಿಸಿದ್ದೇವೆ:
- 🌟 **ೇಲ್\u200cಲೋ ವರ್ಲ್ಡ್** - ನಿಮ್ಮ ಮೊದಲ ಡೇಟಾ ಸೈನ್ಸ್ ಪ್ರೋಗ್ರಾಂ
- 📂 **ಡೇಟಾ ಲೋಡ್ ಮಾಡುವುದು** - ಡೇಟಾಗುಚ್ಛಗಳನ್ನು ಓದಿ ಅನ್ವೇಷಿಸಲು ಕಲಿಯಿರಿ
- 📊 **ಸರಳ ವಿಶ್ಲೇಷಣೆ** - ಅಂಕಿ ಅಂಶಗಳನ್ನು ಗಣನೆ ಮಾಡಿ ಮಾದರಿಗಳನ್ನು ಹುಡುಕಿ
- 📈 **ಮೂಲಭೂತ ದೃಷ್ಯೀಕರಣ** - ಚಾರ್ಟ್ ಮತ್ತು ಗ್ರಾಫ್ ರಚಿಸಿ
- 🔬 **ನೈಜ ಜಾಗತಿಕ ಯೋಜನೆ** - ಪ್ರಾರಂಭದಿಂದ ಕೊನೆವರೆಗೆ ಪೂರ್ಣ ಕಾರ್ಯಪ್ರವಾಹ
- 🌟 **ಲೋ ವರ್ಲ್ಡ್** - ನಿಮ್ಮ ಮೊದಲ ಡೇಟಾ ವಿಜ್ಞಾನ ಕಾರ್ಯಕ್ರಮ
- 📂 **ಡೇಟಾ ಲೋಡ್ ಮಾಡುವುದು** - ಡೇಟಾಸೆಟ್ ಗಳನ್ನು ಓದುತ್ತ ಪ್ರಯತ್ನಿಸುವುದು ಕಲಿಯಿರಿ
- 📊 **ಸರಳ ವಿಶ್ಲೇಷಣೆ** - ಸಾಂಖ್ಯಿಕ ಗಣನೆ ಮಾಡಿ ಪ್ಯಾಟರ್ನ್‌ಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ
- 📈 **ಮೂಲ ದೃಷ್ಠಾಂತ** - ಚಾನೆಲ್ನ್ನು ಮತ್ತು ಗ್ರಾಫ್‌ಗಳನ್ನು ಸೃಷ್ಟಿಸಿ
- 🔬 **ನೈಜ ಪ್ರಪಂಚ ಯೋಜನೆ** - ಪ್ರಾರಂಭದಿಂದ ಪೂರ್ಣವಾಗುವ ಕಾರ್ಯಚಟುವಟಿಕೆ
ಪ್ರತಿಯೊಂದು ಉದಾಹರಣೆಯೂ ಪ್ರತಿಯೊಂದು ಹಂತವನ್ನು ವಿವರಿಸುವ ಸ್ತರವಾದ ಟಿಪ್ಪಣಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ಇದು ಸಂಪೂರ್ಣ ಆರಂಭಿಕರಿಗೆ ಅತ್ಯುತ್ತಮ!
ಪ್ರತಿ ಉದಾಹರಣೆಯಲ್ಲಿ ಪ್ರತಿಯೊಂದು ಹಂತವನ್ನು ವಿವರಿಸುವ ನಿಯಮಿತ ಕಾಮೆಂಟ್ಸ್ ಇರುತ್ತವೆ, ಇದು ಸಂಪೂರ್ಣವಾಗಿ ಪ್ರಾರಂಭಿಕರಿಗೆ ಅತ್ಯುತ್ತಮವಾಗಿದೆ!
👉 **[ಉದಾಹರಣೆಗಳೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ](examples/README.md)** 👈
👉 **[ಉದಾಹರಣೆಗಳಿಂದ ಪ್ರಾರಂಭಿಸಿ](examples/README.md)** 👈
## ಪಾಠಗಳು
|![@sketchthedocs ರಚಿಸಿದ ಸ್ಕೆಚ್‌ನೋಟ್ https://sketchthedocs.dev](../../translated_images/kn/00-Roadmap.4905d6567dff4753.webp)|
|![ ಸ್ಕೆಚ್ ನೋಟ್ @sketchthedocs ಮೂಲಕ https://sketchthedocs.dev](../../translated_images/kn/00-Roadmap.4905d6567dff4753.webp)|
|:---:|
| ಡೇಟಾ ಸೈನ್ಸ್ ಆರಂಭಿಕರಿಗಾಗಿ: ರಸ್ತೆನಕ್ಷೆ - _ಸ್ಕೆಚ್ನೋಟ್ [@nitya](https://twitter.com/nitya) ರಚನೆ_ |
| ಡೇಟಾ ಸೈನ್ಸ್ ಆರಂಭಿಕರಿಗೆ: ರಸ್ತೆ ನಕ್ಷೆ - _ಸ್ಕೆಚ್ ನೋಟ್ [@nitya](https://twitter.com/nitya) ಮೂಲಕ_ |
| ಪಾಠ ಸಂಖ್ಯೆ | ವಿಷಯ | ಪಾಠ ಗುಂಪು | ಕಲಿಕೆ ಗುರಿಗಳು | ಲಿಂಕ್ ಪಾಠ | ಲೇಖಕ |
| ಪಾಠ ಸಂಖ್ಯೆ | ವಿಷಯ | ಪಾಠ ಗುಂಪು | ಕಲಿಕೆಯ ಉದ್ದೇಶಗಳು | ಲಿಂಕ್ ಪಡೆದ ಪಾಠ | ಲೇಖಕ |
| :-----------: | :----------------------------------------: | :--------------------------------------------------: | :-----------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :---------------------------------------------------------------------: | :----: |
| 01 | ಡೇಟಾ ಸೈನ್ಸ್ ವ್ಯಾಖ್ಯಾನ | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾ ಸೈನ್ಸ್ ಹಿನ್ನಡೆಯ ಮೂಲಭೂತ ಆಲೋಚನೆಗಳನ್ನು ಮತ್ತು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ, ಯಂತ್ರ ಅಭ್ಯಾಸ ಮತ್ತು ದೊಡ್ಡ ಡೇಟಾ ಜೊತೆಗೆ ಅದರ ಸಂಬಂಧವನ್ನು ಕಲಿಯಿರಿ. | [ಪಾಠ](1-Introduction/01-defining-data-science/README.md) [ವೀಡಿಯೋ](https://youtu.be/beZ7Mb_oz9I) | [ಮಿಟ್ರಿ](http://soshnikov.com) |
| 02 | ಡೇಟಾ ಸೈನ್ಸ್ ನೈತಿಕತೆ | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾ ನೈತಿಕತೆಯ ಆಲೋಚನೆಗಳು, ಸವಾಲುಗಳು ಮತ್ತು ಸಂರಚನೆಗಳು. | [ಪಾಠ](1-Introduction/02-ethics/README.md) | [ನಿತ್ಯ](https://twitter.com/nitya) |
| 03 | ಡೇಟಾ ವ್ಯಾಖ್ಯಾನ | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾ ఎలా ವರ್ಗೀಕರಿಸಲಾಗಿದೆ ಮತ್ತು ಅದರ ಸಾಮಾನ್ಯ ಮೂಲಗಳು. | [ಪಾಠ](1-Introduction/03-defining-data/README.md) | [ಜಾಸ್ಮಿನ್](https://www.twitter.com/paladique) |
| 04 | ಸಂಖ್ಯಾಶಾಸ್ತ್ರ ಮತ್ತು ಸಾಧ್ಯತೆಗಳ ಪರಿಚಯ | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಾಧ್ಯತೆ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಗಣಿತೀಯ ತಂತ್ರಗಳನ್ನು ತಿಳಿಯಿರಿ. | [ಪಾಠ](1-Introduction/04-stats-and-probability/README.md) [ವೀಡಿಯೋ](https://youtu.be/Z5Zy85g4Yjw) | [ಮಿಟ್ರಿ](http://soshnikov.com) |
| 05 | ಸಂಬಂಧಿತ ಡೇಟಾ ಜೊತೆಗೆ ಕೆಲಸ | [ಡೇಟಾ ಜೊತೆಯಾಗಿ ಕೆಲಸ](2-Working-With-Data/README.md) | ಸಂಬಂಧಿತ ಡೇಟಾಗೆ ಪರಿಚಯ ಮತ್ತು ವಿಷಯಮಾಡಿರುವ, ಸಂಧರ್ಭದಲ್ಲಿರುವ, ಮತ್ತು ಅರ್ಹ ಡೇಟಾಗೆ ಜಾನುವಾರು ವಿವರಣೆ ಮಾಡಲು ಮೂಲತಃ ಸ್ಕ್ಯೂಎಲ್ (SQL) ಅನ್ನು ಉಪಯೋಗಿಸುವ ಮೂಲಭೂತಗಳು. | [ಪಾಠ](2-Working-With-Data/05-relational-databases/README.md) | [ಕ್ರಿಸ್ೋಫರ್](https://www.twitter.com/geektrainer) |
| 06 | ನೋSQL ಡೇಟಾ ಜೊತೆಗೆ ಕೆಲಸ | [ಡೇಟಾ ಜೊತೆಯಾಗಿ ಕೆಲಸ](2-Working-With-Data/README.md) | ಸಂಬಂಧಹೀನ ಡೇಟಾಗೆ ಪರಿಚಯ, ಅದರ ವಿವಿಧ ಪ್ರಕಾರಗಳು ಮತ್ತು ಡಾಕ್ಯುಮೆಂಟ್ ಡೇಟಾಬೇಸ್‌ಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ಮತ್ತು ವಿಶ್ಲೇಷಿಸಲು ಮೂಲಭೂತಗಳು. | [ಪಾಠ](2-Working-With-Data/06-non-relational/README.md) | [ಜಾಸ್ಮಿನ್](https://twitter.com/paladique)|
| 07 | ಪೈಥಾನ್ ಜೊತೆಗೆ ಕೆಲಸ | [ಡೇಟಾ ಜೊತೆಯಾಗಿ ಕೆಲಸ](2-Working-With-Data/README.md) | Pandas ಮುಂತಾದ ಗ್ರಂಥಾಲಯಗಳೊಂದಿಗೆ ಡೇಟಾ ಅನ್ವೇಷಣೆಯಿಗಾಗಿ ಪೈಥಾನ್ ಬಳಕೆಯ ಮೂಲಭೂತಗಳು. ಪೈಥಾನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಆಧಾರಭೂತ ಅರ್ಥಪೂರ್ಣತೆಯನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ. | [ಪಾಠ](2-Working-With-Data/07-python/README.md) [ವೀಡಿಯೋ](https://youtu.be/dZjWOGbsN4Y) | [ಮಿಟ್ರಿ](http://soshnikov.com) |
| 08 | ಡೇಟಾ ಸಿದ್ಧತೆ | [ಡೇಟಾ ಜೊತೆಯಾಗಿ ಕೆಲಸ](2-Working-With-Data/README.md) | ಇರುವ ಡೇಟಾದ ಅಭಾವ, ತಪ್ಪು ಅಥವಾ ಅಪೂರ್ಣತೆ ಸವಾಲುಗಳನ್ನು ನಿಭಾಯಿಸಲು ಡೇಟಾ ಶುಚಿಗೊಳಿಸುವಿಕೆ ಮತ್ತು ಪರಿವರ್ತನೆ ತಂತ್ರಗಳು. | [ಪಾಠ](2-Working-With-Data/08-data-preparation/README.md) | [ಜಾಸ್ಮಿನ್](https://www.twitter.com/paladique) |
| 09 | ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | Matplotlib ಬಳಸಿಕೊಂಡು ಹಕ್ಕಿಗಳ ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು ಕಲಿಯಿರಿ 🦆 | [ಪಾಠ](3-Data-Visualization/09-visualization-quantities/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 10 | ಡೇಟಾ ವಿತರಣೆಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | engu observations ಮತ್ತು ಪ್ರವೃತ್ತಿಗಳನ್ನು ಒಂದು ಅಂತರ್ಜಾಲದಲ್ಲಿ ದೃಶ್ಯೀಕರಿಸುವುದು. | [ಪಾಠ](3-Data-Visualization/10-visualization-distributions/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 11 | ಅನುಪಾತಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ವಿಚಿತ್ರ ಮತ್ತು ಗುಂಪು ಶೇಕಡಾವಾರುಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು. | [ಪಾಠ](3-Data-Visualization/11-visualization-proportions/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 12 | ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ಡೇಟಾ ಮತ್ತು ಅದರ ಬದಲಾಗುವ ಬದಲಾವಣೆಗಳ ನಡುವಿನ ಸಂಪರ್ಕ ಮತ್ತು ಸಹಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು. | [ಪಾಠ](3-Data-Visualization/12-visualization-relationships/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 13 | ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ಪರಿಣಾಮಕಾರಿ ಸಮಸ್ಯೆ ಪರಿಹಾರ ಮತ್ತು ಒಳನೋಟಗಳಿಗಾಗಿ ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಮೌಲ್ಯಯುತವಾಗಿಸಲು ತಂತ್ರಗಳು ಮತ್ತು ಮಾರ್ಗದರ್ಶನ. | [ಪಾಠ](3-Data-Visualization/13-meaningful-visualizations/README.md) | [ ಜೆನ್](https://twitter.com/jenlooper) |
| 14 | ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚರಿತ್ರೆಯ ಪರಿಚಯ | [ಜೀವನಚರಿತ್ರೆ](4-Data-Science-Lifecycle/README.md) | ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚರಿತ್ರೆಗೆ ಪರಿಚಯ ಮತ್ತು ಅದರ ಮೊದಲ ಹಂತವಾದ ಡೇಟಾ ಸಂಗ್ರಹಣೆ ಮತ್ತು ತೆಗೆಯುವಿಕೆ. | [ಪಾಠ](4-Data-Science-Lifecycle/14-Introduction/README.md) | [ಜಾಸ್ಮಿನ್](https://twitter.com/paladique) |
| 15 | ವಿಶ್ಲೇಷಣೆ | [ಜೀವನಚರಿತ್ರೆ](4-Data-Science-Lifecycle/README.md) | ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಗೆ ಈ ಹಂತದಲ್ಲಿ ಕೇಂದ್ರೀಕರಿಸಲಾಗುವುದು. | [ಪಾಠ](4-Data-Science-Lifecycle/15-analyzing/README.md) | [ಜಾಸ್ಮಿನ್](https://twitter.com/paladique) |
| 16 | ಸಂವಹನ | [ಜೀವನಚರಿತ್ರೆ](4-Data-Science-Lifecycle/README.md) | ನಿರ್ದೇಶಕರಿಗೆ ಸುಲಭವಾಗಿ ಅರ್ಥವಾಗುವ ರೀತಿಯಲ್ಲಿ ಡೇಟಾದೊಳಗಿನ ತಿಳಿವಳಿಕೆಯನ್ನು ಪ್ರಸ್ತುತಪಡಿಸುವ ಹಂತ. | [ಪಾಠ](4-Data-Science-Lifecycle/16-communication/README.md) | [ಜೆಲೆನ್](https://twitter.com/JalenMcG) |
| 17 | ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ | [ಕ್ಲೌಡ್ ಡೇಟಾ](5-Data-Science-In-Cloud/README.md) | ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಮತ್ತು ಅದರ ಪ್ರಯೋಜನಗಳ ಪರಿಚಯ. | [ಪಾಠ](5-Data-Science-In-Cloud/17-Introduction/README.md) | [ಟಿಫನಿ](https://twitter.com/TiffanySouterre) ಮತ್ತು [ಮಾಡ್](https://twitter.com/maudstweets) |
| 18 | ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ | [ಕ್ಲೌಡ್ ಡೇಟಾ](5-Data-Science-In-Cloud/README.md) | Low Code ಉಪಕರಣಗಳನ್ನು ಬಳಸಿ ಮಾದರಿಗಳನ್ನು ತರಬೇತು ಮಾಡುವುದು. | [ಪಾಠ](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [ಟಿಫಾನಿ](https://twitter.com/TiffanySouterre) ಮತ್ತು [ಮಾಡ್](https://twitter.com/maudstweets) |
| 19 | ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ | [ಕ್ಲೌಡ್ ಡೇಟಾ](5-Data-Science-In-Cloud/README.md) | Azure Machine Learning Studio ಬಳಸಿ ಮಾದರಿಗಳನ್ನು разಸ್ತಿಸಲು. | [ಪಾಠ](5-Data-Science-In-Cloud/19-Azure/README.md) | [ಟಿಫನಿ](https://twitter.com/TiffanySouterre) ಮತ್ತು [ಮಾಡ್](https://twitter.com/maudstweets) |
| 20 | ವಲೆಗಳಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ | [ವೈಲ್ಡ್‌ನಲ್ಲಿ](6-Data-Science-In-Wild/README.md) | ನೈಜ ಜಾಗತಿಕದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಚಾಲಿತ ಯೋಜನೆಗಳು. | [ಪಾಠ](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [ನಿತ್ಯ](https://twitter.com/nitya) |
## GitHub ಕೋಡ್‌ಸ್ಪೇಸ್‌ಗಳು
ಮಾದರಿಯನ್ನು ಕೋಡ್‌ಸ್ಪೇಸ್‌ನಲ್ಲಿ ತೆಗೆಯಲು ಈ ಹಂತಗಳನ್ನು ಅನುಸರಿಸಿ:
1. ಕೋಡ್ ಡ್ರಾಪ್-ಡೌನ್ ಮೆನು ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು Open with Codespaces ಆಯ್ಕೆ ಮಾಡಿ.
2. ಪೇನೆಲ್ ಬಾಟಮ್ನಲ್ಲಿ + New codespace ಆಯ್ಕೆಮಾಡಿ.
ಮತ್ತಷ್ಟು ಮಾಹಿತಿಗೆ, [GitHub ಡಾಕ್ಯುಮೆಂಟೇಷನ್](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace) ನೋಡಿ.
## VSCode ರಿಮೋಟ್ - ಕಂಟೈನರ್ಸ್
ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರದಲ್ಲಿಯೂ ಮತ್ತು VSCode ನಲ್ಲಿ VS Code Remote - Containers ವಿಸ್ತರಣೆ ಬಳಸಿಕೊಂಡು ಈ ರೆಪೋವನ್ನು ಕಂಟೈನರ್‌ನಲ್ಲಿ ತೆಗೆಯಲು ಈ ಹಂತಗಳನ್ನು ಅನುಸರಿಸಿ:
1. ನೀವು ಡೆವಲಪ್ಮೆಂಟ್ ಕಂಟೈನರ್ ಮೊದಲ ಬಾರಿಗೆ ಬಳಸುತ್ತಿದ್ದರೆ, ನಿಮ್ಮ ವ್ಯವಸ್ಥೆಗೆ ಮೊದಲು ಅಗತ್ಯವಿರುವ ಅಂಶಗಳು (ಉದಾ. ಡೋಕರ್ ಇನ್‌ಸ್ಟಾಲ್ ಮಾಡಿರಬೇಕು) ಇದ್ದಾರೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ [Getting Started ಡಾಕ್ಯುಮೆಂಟೇನ್](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started) ನಲ್ಲಿ.
ಸಂಗ್ರಹಾಲಯವನ್ನು ಬಳಸಲು, ನೀವು ಕಡತತಂತ್ರದಲ್ಲಿಲ್ಲದೆ ಒಂದು ಡೋಕರ್ ವಾಲ್ಯೂಮ್‌ನಲ್ಲಿ ರೆಪೋ ತೆಗೆಯಬಹುದು:
**ಗಮನಿಸಿ**: ಇದನ್ನು ಬಳಸಲು ಹಿಂಭಾಗದಲ್ಲಿ Remote-Containers: **Clone Repository in Container Volume...** ಆಜ್ಞೆಯನ್ನು ಬಳಸಿ ಮೂಲ ಕೋಡ್ ಅನ್ನು ಡೋಕರ್ ವಾಲ್ಯೂಮ್‌ಗೆ ಕ್ಲೋನ್ ಮಾಡುತ್ತದೆ. [ವಾಲ್ಯೂಮ್‌ಗಳು](https://docs.docker.com/storage/volumes/) ಕಂಟೈನರ್ ಡೇಟಾವನ್ನು ಉಳಿಸುವುದಕ್ಕೆ ಉಚಿತ ಮಿಕೆನಿಸಮ್ ಆಗಿವೆ.
ಅಥವಾ ಈ ರೆಪೋನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಕ್ಲೋನ್ ಅಥವಾ ಡೌನ್ಲೋಡ್ ಮಾಡಲಾಗಿರುವ ಪ್ರತಿಯನ್ನು ತೆರೆಯಿರಿ:
- ಈ ರೆಪೋವನ್ನು ನಿಮ್ಮ ಸ್ಥಳೀಯ ಫೈಲ್ಸಿಸ್ಟಂಗೆ ಕ್ಲೋನ್ ಮಾಡಿ.
| 01 | ಡೇಟಾ ಸೈನ್ಸ್ ವ್ಯಾಖ್ಯಾನ | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾ ಸೈನ್ಸ್ ಆಧಾರದ ತತ್ವಗಳನ್ನು ಹಾಗು ಅದು искусственный интеллект, ಯಂತ್ರ ಕಲಿಕೆ ಮತ್ತು ದೊಡ್ಡ ಡೇಟಾ ಜೊತೆಗೆ ಹೇಗೆ ಸಂಬಂಧಿಸಿದೆ ಎಂಬುದನ್ನು ಕಲಿಯಿರಿ. | [ಪಾಠ](1-Introduction/01-defining-data-science/README.md) [ವೀಡಿಯೋ](https://youtu.be/beZ7Mb_oz9I) | [ಿಮಿಟ್ರಿ](http://soshnikov.com) |
| 02 | ಡೇಟಾ ಸೈನ್ಸ್ ನೈತಿಕತೆ | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾ ನೈತಿಕತೆ ತತ್ವಗಳು, ಸವಾಲುಗಳು ಮತ್ತು ರೂಪರೇಖೆಗಳು. | [ಪಾಠ](1-Introduction/02-ethics/README.md) | [ನಿತ್ಯ](https://twitter.com/nitya) |
| 03 | ಡೇಟಾ ನಿಶ್ಚಿತಮಾಡುವುದು | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾ ಹೇಗೆ ವರ್ಗೀಕರಿಸಲಾಗಿದೆ ಮತ್ತು ಅದರ ಸಾಮಾನ್ಯ ಮೂಲಗಳು ಏನು. | [ಪಾಠ](1-Introduction/03-defining-data/README.md) | [ಜಾಸ್ಮಿನ್](https://www.twitter.com/paladique) |
| 04 | ಸಮೀಕ್ಷೆ ಮತ್ತು ಸಂಭಾವ್ಯದ ಪರಿಚಯ | [ಪರಿಚಯ](1-Introduction/README.md) | ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಂಭಾವ್ಯತೆ ಮತ್ತು ಸಮೀಕ್ಷೆಯ ಗಣಿತ ತಂತ್ರಗಳು. | [ಪಾಠ](1-Introduction/04-stats-and-probability/README.md) [ವೀಡಿಯೋ](https://youtu.be/Z5Zy85g4Yjw) | [ಿಮಿಟ್ರಿ](http://soshnikov.com) |
| 05 | ಸಂಬಂಧಿತ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವುದು | [ಡೇಟಾ ಕೆಲಸ](2-Working-With-Data/README.md) | ಸಂಬಂಧಿತ ಡೇಟಾ ಮತ್ತು structured query language (SQL) ಮೂಲಕ ಸಂಬಂಧಿತ ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸುವ ಮತ್ತು ವಿಶ್ಲೇಷಿಸುವ ಮೂಲಭೂತಗಳು. | [ಪಾಠ](2-Working-With-Data/05-relational-databases/README.md) | [ಕ್ರಿಸ್ೋಫರ್](https://www.twitter.com/geektrainer) | | |
| 06 | ನಾನ್‌ SQL ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವುದು | [ಡೇಟಾ ಕೆಲಸ](2-Working-With-Data/README.md) | ಸಂಬಂಧಿಸದ ಡೇಟಾ ಪರಿಚಯ, ಅದರ ವಿಭಿನ್ನ ವಿಧಗಳು ಮತ್ತು ಡಾಕ್ಯುಮೆಂಟ್ ಡೇಟಾಬೇಸ್ ಅನ್ವೇಷಣೆ ಹಾಗೂ ವಿಶ್ಲೇಷಣೆಯ ಮೂಲಭೂತಗಳು. | [ಪಾಠ](2-Working-With-Data/06-non-relational/README.md) | [ಜಾಸ್ಮಿನ್](https://twitter.com/paladique) |
| 07 | ಪೈಥಾನ್ ಬಳಸಿ ಕೆಲಸ | [ಡೇಟಾ ಕೆಲಸ](2-Working-With-Data/README.md) | ಪ್ಯಾಂಡಾಸ್ ಸೇರಿದಂತೆ ಪೈಥಾನ್ ಲೈಬ್ರರಿಗಳು ಬಳಸಿ ಡೇಟಾ ಅನ್ವೇಷಣೆಯ ಮೂಲಭೂತಗಳು. ಪೈಥಾನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಪರಿಪೂರ್ಣವಾದ ಅರ್ಥವನ್ನು ಹೊಂದಿರುವುದು ಶಿಫಾರಸು. | [ಪಾಠ](2-Working-With-Data/07-python/README.md) [ವೀಡಿಯೋ](https://youtu.be/dZjWOGbsN4Y) | [ಿಮಿಟ್ರಿ](http://soshnikov.com) |
| 08 | ಡೇಟಾ ಸಿದ್ಧತೆ | [ಡೇಟಾ ಕೆಲಸ](2-Working-With-Data/README.md) | ಕಳೆದುಹೋದ, ತಪ್ಪಾಗಾದ ಅಥವಾ ಅಪೂರ್ಣ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸಲು ಸ್ವಚ್ಛತೆ ಮತ್ತು ಪರಿವರ್ತನೆಯ ತಂತ್ರಗಳು. | [ಪಾಠ](2-Working-With-Data/08-data-preparation/README.md) | [ಜಾಸ್ಮಿನ್](https://www.twitter.com/paladique) |
| 09 | ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ಮ್ಯಾಟ್‌ಪ್ಲಾಟ್‌ಲಿಬ್ ಬಳಸಿ ಹಕ್ಕಿ ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವಿಕೆ ಕಲಿಯಿರಿ 🦆 | [ಪಾಠ](3-Data-Visualization/09-visualization-quantities/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 10 | ಡೇಟಾ ವಿತರಣೆನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ಒಂದು ಇಂಟರ್ವಲಿನ ಒಳಗಿನ ವೀಕ್ಷಣೆಗಳು ಮತ್ತು ಪ್ರವೃತ್ತಿಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು. | [ಪಾಠ](3-Data-Visualization/10-visualization-distributions/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 11 | ಪ್ರಮಾಣಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ವಿಭಜಿತ ಮತ್ತು ಗುಂಪುಗೊಳಿಸಿದ ಶೇಕಡಾವಾರುಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು. | [ಪಾಠ](3-Data-Visualization/11-visualization-proportions/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 12 | ಸಂಬಂಧಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ಡೇಟಾ ಸೆಟ್‌ಗಳ ಮತ್ತು ಅವರ ವೈಶಿಷ್ಟ್ಯಗಳ ನಡುವಿನ ಸಂಪರ್ಕ ಮತ್ತು ಸಮ್ಮಿಲನಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು. | [ಪಾಠ](3-Data-Visualization/12-visualization-relationships/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 13 | ಅರ್ಥಪೂರ್ಣ ದೃಶ್ಯೀಕರಣಗಳು | [ಡೇಟಾ ದೃಶ್ಯೀಕರಣ](3-Data-Visualization/README.md) | ಪರಿಣಾಮಕಾರಿ ಸಮಸ್ಯೆ ಪರಿಹಾರ ಮತ್ತು洞察ಗಳಿಗಾಗಿ ನಿಮ್ಮ ದೃಶ್ಯೀಕರಣಗಳನ್ನು ಮೌಲ್ಯಯುತವಾಗಿಸಲು ತಂತ್ರಗಳು ಮತ್ತು ಮಾರ್ಗದರ್ಶನ. | [ಪಾಠ](3-Data-Visualization/13-meaningful-visualizations/README.md) | [ಜೆನ್](https://twitter.com/jenlooper) |
| 14 | ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಪರಿಚಯ | [ಜೀವನಚಕ್ರ](4-Data-Science-Lifecycle/README.md) | ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಪರಿಚಯ ಮತ್ತು ಮೊದಲ ಹಂತವಾದ ಡೇಟಾ ಪಡೆಯುವುದು ಮತ್ತು ತೆಗೆದುಹಾಕುವುದು. | [ಪಾಠ](4-Data-Science-Lifecycle/14-Introduction/README.md) | [ಜಾಸ್ಮಿನ್](https://twitter.com/paladique) |
| 15 | ವಿಶ್ಲೇಷಣೆ | [ಜೀವನಚಕ್ರ](4-Data-Science-Lifecycle/README.md) | ಡೇಟಾ ಸೈನ್ಸ್ ಜೀವನಚಕ್ರದ ಈ ಹಂತವು ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುವ ತಂತ್ರಗಳನ್ನು ಕೇಂದ್ರಿತಗೊಳಿಸುತ್ತದೆ. | [ಪಾಠ](4-Data-Science-Lifecycle/15-analyzing/README.md) | [ಜಾಸ್ಮಿನ್](https://twitter.com/paladique) | | |
| 16 | ಸಂವಹನ | [ಜೀವನಚಕ್ರ](4-Data-Science-Lifecycle/README.md) | ಈ ಹಂತದಲ್ಲಿ ಡೇಟಾದ洞察ಗಳನ್ನು ನಿರ್ಧಾರಮೇಕರ್‌ಗಳ فهمಕ್ಕೆ ಸುಲಭವಾಗುವ ರೀತಿಯಲ್ಲಿ ಪ್ರಸ್ತುತಪಡಿಸುವುದು. | [ಪಾಠ](4-Data-Science-Lifecycle/16-communication/README.md) | [ಜಾಲೆನ್](https://twitter.com/JalenMcG) | | |
| 17 | ಮೋಡದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ | [ಮೋಡು ಡೇಟಾ](5-Data-Science-In-Cloud/README.md) | ಮೋಡದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಪರಿಚಯ ಮತ್ತು ಅದರ ಲಾಭಗಳು. | [ಪಾಠ](5-Data-Science-In-Cloud/17-Introduction/README.md) | [ಟಿಫನಿ](https://twitter.com/TiffanySouterre) ಮತ್ತು [ಮಾಡ್](https://twitter.com/maudstweets) |
| 18 | ಮೋಡದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ | [ಮೋಡು ಡೇಟಾ](5-Data-Science-In-Cloud/README.md) | ಲೋ ಕೋಡ್ ಉಪಕರಣಗಳಿಂದ ಮಾದರಿಗಳನ್ನು ತರಬೇತುಗೊಳಿಸುವುದು. |[ಪಾಠ](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [ಟಿಫನಿ](https://twitter.com/TiffanySouterre) ಮತ್ತು [ಮಾಡ್](https://twitter.com/maudstweets) |
| 19 | ಮೋಡದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ | [ಮೋಡು ಡೇಟಾ](5-Data-Science-In-Cloud/README.md) | ಅಜೂರ್ ಮೆಷಿನ್ ಲರ್ನಿಂಗ್ ಸ್ಟುಡಿಯೋ ಮೂಲಕ ಮಾದರಿಗಳನ್ನು ವಹಿಸುವುದು. | [ಪಾಠ](5-Data-Science-In-Cloud/19-Azure/README.md)| [ಟಿಫನಿ](https://twitter.com/TiffanySouterre) ಮತ್ತು [ಮಾಡ್](https://twitter.com/maudstweets) |
| 20 | ನೈಜ ಜಗತ್ತಿನಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ | [ನೈಜ ಜಗತ್ತು](6-Data-Science-In-Wild/README.md) | ನೈಜ ಪ್ರಪಂಚದಲ್ಲಿ ಡೇಟಾ ಸೈನ್ಸ್ ಚಾಲಿತ ಯೋಜನೆಗಳು. | [ಪಾಠ](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [ನಿತ್ಯ](https://twitter.com/nitya) |
## GitHub Codespaces
ನುಡಿಯನ್ನು Codespace ನಲ್ಲಿ ತೆರೆಯಲು ಈ ಹಂತಗಳನ್ನು ಅನುಸರಿಸಿ:
1. ಕೋಡ್ ಡ್ರಾಪ್‌ಡೌನ್ ಮೆನು ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು "Open with Codespaces" ಆಯ್ಕೆಯನ್ನು ಆರಿಸಿ.
2. ಪಾನೆಲ್ ಕೆಳಭಾಗದಲ್ಲಿ + New codespace ಆಯ್ಕೆಮಾಡಿ.
ಹೆಚ್ಚು ಮಾಹಿತಿಗಾಗಿ, [GitHub ಡಾಕ್ಯುಮೆಂಟೇಶನ್](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace) ನೋಡಿ.
## VSCode ರಿಮೋಟ್ - ಕಂಟೈನರ್‌ಗಳು
ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರ ಮತ್ತು VSCode ರಿಮೋಟ್ - ಕಂಟೈನರ್ ವಿಸ್ತರಣೆ ಬಳಸಿ ಈ ರೆಪೋ ಕಂಟೈನರ್‌ನಲ್ಲಿ ತೆರೆಯಲು ಈ ಹಂತಗಳನ್ನು ಅನುಸರಿಸಿ:
1. ನೀವು ಮೊದಲ ಬಾರಿಗೆ ಡೆವಲಪ್‌ಮೆಂಟ್ ಕಂಟೈನರ್ ಬಳಸುತ್ತಿದ್ದರೆ, ದಯವಿಟ್ಟು ನಿಮ್ಮ ವ್ಯವಸ್ಥೆ ಅಗತ್ಯ ಕನಿಷ್ಠ ಅಂಶಗಳನ್ನು (ಅಂದರೆ ಡೋಕರ್ ಇನ್‌ಸ್ಟಾಲ್ ಮಾಡಿರಬೇಕು) [Getting Started ಡಾಕ್ಯುಮೆಂಟೇನ್](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started) ನಲ್ಲಿ ಪರಿಶೀಲಿಸಿ.
ರೆಪೋ ಬಳಸಲು, ನೀವು ಇದನ್ನು ವೆಚ್ಚ ಕಂಟೈನರ್ ವಾಲ್ಯೂಮ್ (Docker volume) ನಲ್ಲಿ ತೆರೆಯಬಹುದು:
**ಟಿಪ್**: ಆಂತರಿಕವಾಗಿ, ಇದು Remote-Containers: **Clone Repository in Container Volume...** ಆಜ್ಞೆಯನ್ನು ಬಳಸಿ ಮೂಲ ಕೋಡ್ ಅನ್ನು ಲೋಕಲ್ ಫೈಲ್‌ಸಿಸ್ಟಮ್ ಬದಲು ಡೋಕರ್ ವಾಲ್ಯೂಮ್‌ನಲ್ಲಿ ನಕಲಿಸುವುದು. [ವಾಲ್ಯೂಮ್‌ಗಳು](https://docs.docker.com/storage/volumes/) ಕಂಟೈನರ್ ಡೇಟಾ ಉಳಿಸುವ ಬಹುಮಾನ್ಯ ವಿಧಾನ.
ಅಥವಾ ಈ ರೆಪೋನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಕ್ಲೋನ್ ಅಥವಾ ಡೌನ್ಲೋಡ್ ಮಾಡಲಾದ ಪ್ರತಿ ಪ್ರತಿಯನ್ನು ತೆರೆಯಬಹುದು:
- ಈ ರೆಪೋವನ್ನು ನಿಮ್ಮ ಸ್ಥಳೀಯ ಫೈಲ್ ಸಿಸ್ಟಮ್‌ಗೆ ಕ್ಲೋನ್ ಮಾಡಿ.
- F1 ಒತ್ತಿ ಮತ್ತು **Remote-Containers: Open Folder in Container...** ಆಜ್ಞೆಯನ್ನು ಆರಿಸಿ.
- ಈ ಫೋಲ್ಡರ್‌ನ ಕ್ಲೋನ್ ಮಾಡಲಾದ ನಕಲನ್ನು ಆಯ್ಕೆಮಾಡಿ, ಕಂಟೈನರ್ ಪ್ರಾರಂಭವಾಗುವವರೆಗೆ ಕಾಯಿರಿ ಮತ್ತು ಪ್ರಯತ್ನಿಸಿ.
- ಈ ಫೋಲ್ಡರ್‌ನ ಕ್ಲೋನ್ ಮಾಡಿದ ನಕಲನ್ನು ಆರಿಸಿ, ಕಂಟೈನರ್ ಪ್ರಾರಂಭವಾಗುವ ತನಕ ಕಾಯಿರಿ ಮತ್ತು ಪ್ರಯತ್ನಿಸಿ.
## ಆಫ್‌ಲೈನ್ ಪ್ರವೇಶ
ನೀವು ಈ ಡಾಕ್ಯುಮೆಂಟೇಶನ್ ಅನ್ನು ಆಫ್‌ಲೈನ್‌ನಲ್ಲಿ Docsify (https://docsify.js.org/#/) ಬಳಸಿ ಓಡಿಸಬಹುದು. ಈ ರೆಪೋವನ್ನು Fork ಮಾಡಿ, ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರದಲ್ಲಿ Docsify ಇನ್‌ಸ್ಟಾಲ್ ಮಾಡಿ (https://docsify.js.org/#/quickstart), ನಂತರ ಈ ರೆಪೋ ರೂಟ್ ಫೋಲ್ಡರ್ನಲ್ಲಿ `docsify serve` ಟೈಪ್ ಮಾಡಿ. ವೆಬ್‌ಸೈಟ್ ನಿಮ್ಮ ಸ್ಥಳೀಯ ಹಣಗೆ 3000 ಪೋರ್ಟ್‌ನಲ್ಲಿ ಸರ್ವ್ ಆಗುತ್ತದೆ: `localhost:3000`.
ನೀವು ಈ ಡಾಕ್ಯುಮೆಂಟ್ ಅನ್ನು ಆಫ್‌ಲೈನ್ ಓದಲು [Docsify](https://docsify.js.org/#/) ಬಳಸಿ ನಡೆಸಬಹುದು. ಈ ರೆಪೋವನ್ನು ಫೋರ್ಕ್ ಮಾಡಿ, [Docsify ಇನ್‌ಸ್ಟಾಲ್ ಮಾಡಿ](https://docsify.js.org/#/quickstart) ನಿಮ್ಮ ಸ್ಥಳೀಯ ಯಂತ್ರದಲ್ಲಿ, ನಂತರ ಈ ರೆಪೋ ಮೂಲ ಫೋಲ್ಡರ್‌ನಲ್ಲಿ `docsify serve`(TYPE) ಮಾಡಿ. ವೆಬ್‌ಸೈಟ್ ನಿಮ್ಮ ಸ್ಥಳೀಯ ಹೇಂದಿಗಾವಾಗ 3000 ಪೋರ್ಟ್‌ನಲ್ಲಿ ಲಭ್ಯವಾಗುತ್ತದೆ: `localhost:3000`.
> ಗಮನಿಸಿ, ನೋಟ್ಬುಕ್‌ಗಳನ್ನು Docsify ಮೂಲಕ ರೆಂಡರ್ ಮಾಡಲಾಗುವುದಿಲ್ಲ, ಆದ್ದರಿಂದ ನೀವು ನೋಟ್ಬುಕ್ ಅನ್ನು ಓಡಿಸುವ ಅಗತ್ಯವಿದ್ದರೆ, ಅದನ್ನು VS Code ನಲ್ಲಿ Python ಕೆರ್ನೆಲ್ ಮೂಲಕ ಪ್ರತ್ಯೇಕವಾಗಿ ನಡೆಸಿ.
> ಗಮನಿಸಿ, ನೋಟ್ಬುಕ್‌ಗಳು Docsify ಮೂಲಕ ರೆಂಡರ್ ಆಗುವುದಿಲ್ಲ, ಆದ್ದರಿಂದ ನೀವು ನೋಟ್ಬುಕ್ ಅನ್ನು ನಡೆಸಬೇಕಾದರೆ, ಅದನ್ನು VS Code ಪೈಥಾನ್ ಕರ್ಣಲ್ ಮೂಲಕ ಪ್ರತ್ಯೇಕವಾಗಿ ನಡೆಸಿ.
## ಇತರೆ ಪಠ್ಯಕ್ರಮಗಳು
## ಇತರೆ ಪಠಕ್ರಮಗಳು
ನಮ್ಮ ತಂಡ ಇತರೆ ಪಠ್ಯಕ್ರಮಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ! ನೋಡಿ:
ನಮ್ಮ ತಂಡ ಇತರೆ ಪಾಠಕ್ರಮಗಳನ್ನು ನಿರ್ಮಿಸುತ್ತದೆ! ಅವುಗಳನ್ನು ನೋಡಿ:
<!-- CO-OP TRANSLATOR OTHER COURSES START -->
### ಲ್ಯಾಂಗ್‌ಚೈನ್
### ಲಾಂಗ್‌ಚೈನ್
[![LangChain4j for Beginners](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners)
[![LangChain.js ಪ್ರಾರಂಭकर्ताओंಿಗಾಗಿ](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin)
[![LangChain.js for Beginners](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin)
[![LangChain for Beginners](https://img.shields.io/badge/LangChain%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://github.com/microsoft/langchain-for-beginners?WT.mc_id=m365-94501-dwahlin)
---
### ಅಜೂರ್ / ಎಡ್ಜ್ / MCP / ಏಜೆಂಟ್‍ಗಳು
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ AZD](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst)
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ ಎಡ್ಜ್ AI](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst)
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ MCP](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst)
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ AI ಏಜೆಂಟ್‍ಗಳು](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst)
### ಅಜೂರ್ / ಎಡ್ಜ್ / ಎಂಪಿಸಿಪಿ / ಏಜೆಂಟ್ಸ್
[![AZD for Beginners](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst)
[![Edge AI for Beginners](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst)
[![MCP for Beginners](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst)
[![AI Agents for Beginners](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst)
---
### ಜನರೇಟಿವ್ AI ಸರಣಿಗಳು
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ ಜನರೇಟಿವ್ AI](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst)
[![ಜನರೇಟಿವ್ AI (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst)
[![ಜನರೇಟಿವ್ AI (ಜಾವಾ)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst)
[![ಜನರೇಟಿವ್ AI (ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್)](https://img.shields.io/badge/Generative%20AI%20(JavaScript)-E879F9?style=for-the-badge&labelColor=E5E7EB&color=E879F9)](https://github.com/microsoft/generative-ai-with-javascript?WT.mc_id=academic-105485-koreyst)
[![Generative AI for Beginners](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst)
[![Generative AI (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst)
[![Generative AI (Java)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst)
[![Generative AI (JavaScript)](https://img.shields.io/badge/Generative%20AI%20(JavaScript)-E879F9?style=for-the-badge&labelColor=E5E7EB&color=E879F9)](https://github.com/microsoft/generative-ai-with-javascript?WT.mc_id=academic-105485-koreyst)
---
### ಹೃದಯಭಾಗದ ಕಲಿಕೆ
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ ಯಂತ್ರಅಧ್ಯಯನ](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst)
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ ಡೇಟಾ ಸೈನ್ಸ್](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst)
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ AI](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst)
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ ಸೈಬರ್‌ಸುರಕ್ಷತೆ](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung)
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ ವೆಬ್ ಡೆವಲಪ್‌ಮೆಂಟ್](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst)
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ IOT](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst)
[![ಪ್ರಾರಂಭकर्तೃಗಳಿಗಾಗಿ XR ಅಭಿವೃದ್ಧಿ](https://img.shields.io/badge/XR%20Development%20for%20Beginners-38BDF8?style=for-the-badge&labelColor=E5E7EB&color=38BDF8)](https://github.com/microsoft/xr-development-for-beginners?WT.mc_id=academic-105485-koreyst)
### ಮೂಲ ಅಧ್ಯಯನ
[![ML for Beginners](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst)
[![Data Science for Beginners](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst)
[![AI for Beginners](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst)
[![Cybersecurity for Beginners](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung)
[![Web Dev for Beginners](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst)
[![IoT for Beginners](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst)
[![XR Development for Beginners](https://img.shields.io/badge/XR%20Development%20for%20Beginners-38BDF8?style=for-the-badge&labelColor=E5E7EB&color=38BDF8)](https://github.com/microsoft/xr-development-for-beginners?WT.mc_id=academic-105485-koreyst)
---
### ಕೋಪಿಲಟ್ ಸರಣಿ
[![AI ಜೋಡಣೆ ಪ್ರೋಗ್ರಾಮಿಂಗ್‌ಗೆ ಕೋಪಿಲಟ್](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst)
[![C#/.NET ಕೋಪಿಲಟ್](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst)
[![ಕೋಪಿಲಟ್ ಸಾಹಸ](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst)
### ಕೋಪಲಟ್ ಸರಣಿ
[![Copilot for AI Paired Programming](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst)
[![Copilot for C#/.NET](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst)
[![Copilot Adventure](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst)
<!-- CO-OP TRANSLATOR OTHER COURSES END -->
## ಸಹಾಯ ಪಡೆಯುವುದು
**ಸಮಸ್ಯೆ ಎದುರಿಸುತ್ತಿದ್ದೀರಾ?** ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳ ಪರಿಹಾರಕ್ಕಾಗಿ ನಮ್ಮ [ಟ್ರಬುಲ್‌ಶೂಟಿಂಗ್ ಗೈಡ್](TROUBLESHOOTING.md) ಅನ್ನು ಪರಿಶೀಲಿಸಿ.
**ಸಮಸ್ಯೆಗಳ ಸಂಕಟದಲ್ಲಿ ಇದ್ದೀರಾ?** ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳ ಪರಿಹಾರಗಳಿಗಾಗಿ ನಮ್ಮ [Troubleshooting Guide](TROUBLESHOOTING.md) ಅನ್ನು ಪರಿಶೀಲಿಸಿ.
ನೀವು ಸಾಂದರ್ಭಿಕವಾಗಿ ಅಡ್ಡಿಯಾಗಿದ್ದೀರಿ ಅಥವಾ AI ಅಪ್ಲಿಕೇಶನ್‌ಗಳನ್ನು ನಿರ್ಮಿಸುವ ಕುರಿತು ಯಾವುದಾದರೂ ಪ್ರಶ್ನೆಗಳಿದ್ದರೆ, MCP ಬಗ್ಗೆ fellow ಕಲಿಯುವವರು ಮತ್ತು ಅನುಭವসূಕ್ತ ಬೆಳವಣಿಗಾರರೊಂದಿಗೆ ಚರ್ಚೆಗಳಲ್ಲಿ ಸೇರಿ. ಇದು ಸಹಾಯಕ ಸಮುದಾಯವಾಗಿದ್ದು, ಅಲ್ಲಿ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಲು ಮತ್ತು ಜ್ಞಾನವನ್ನು ಮುಕ್ತವಾಗಿ ಹಂಚಿಕೊಳ್ಳಲು ಅವಕಾಶವಿದೆ.
ನೀವು ಅಡಚಣೆಯಲ್ಲಿದ್ದೀರಾ ಅಥವಾ AI ಅಪ್ಲಿಕೇಶನ್ಗಳ ನಿರ್ಮಾಣ ಬಗ್ಗೆ ಯಾವುದೇ ಪ್ರಶ್ನೆಗಳಿದ್ದರೆ. MCP ಕುರಿತು fellow ಕಲಿಯುವವರ ಮತ್ತು ಅನುಭವಿತ ಡೆವೆಲಪರ್‌ಗಳ ಚರ್ಚೆಗಳಲ್ಲಿ ಭಾಗವಹಿಸಿ. ಇದು ಪ್ರಶ್ನೆಗಳನ್ನು ಸ್ವಾಗತಿಸುವ ಮತ್ತು ಜ್ಞಾನವನ್ನು ಮುಕ್ತವಾಗಿ ಹಂಚಿಕೊಳ್ಳುವ ಒತ್ತಾಯಪೂರ್ಣ ಸಮುದಾಯವಾಗಿದೆ.
[![Microsoft Foundry ಡಿಸ್ಕಾರ್ಡ್](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
ನೀವು ಉತ್ಪನ್ನ ಪ್ರತಿಕ್ರಿಯೆ ಅಥವಾ ದೋಷಗಳನ್ನು ಕಂಡುಹಿಡಿದಿದ್ದರೆ, ದಯವಿಟ್ಟು ಭೇಟಿ ನೀಡಿ:
ನೀವು ಉತ್ಪನ್ನ ಪ್ರತಿಕ್ರಿಯೆ ಅಥವಾ ದೋಷಗಳನ್ನು ಕಂಡುಹಿಡಿದಿದ್ದರೆ, ಭೇಟಿ ನೀಡಿ:
[![Microsoft Foundry Developer ಫೋರಮ್](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum)
[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**ತಪ್ಪು ನೋಟ:**
ದಸ್ತಾವೇಜು [Co-op Translator](https://github.com/Azure/co-op-translator) ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿಕೊಂಡು ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಸರಿಯಾಗಿರುವುದಕ್ಕೆ ಪ್ರಯತ್ನಿಸುವಾಗ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದದಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸೂಚನೆಗಳಿರಬಹುದು ಎಂದು ಗಮನಿಸಿ. ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅದರ ಮೂಲ ಭಾಷೆಯಲ್ಲಿ ಅಧಿಕಾರಿಕ ಮೂಲವಾಗಿಯೇ ಪರಿಗಣಿಸಬೇಕು. ಪ್ರಮುಖ ಮಾಹಿತಿಗೆ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ನಿರ್ವಹಣೆ ಹಾಗೂ ಭ್ರಾಂತಿಗಳುಗಾಗಿ ನಾವು ಯಾರಿಗೂ ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
**ತ್ಯಾಗಪತ್ರ**:
ಡಾಕ್ಯುಮೆಂಟ್ ಅನ್ನು AI ಭಾಷಾಂತರ ಸೇವೆ [Co-op Translator](https://github.com/Azure/co-op-translator) ಬಳಸಿ ಭಾಷಾಂತರಿಸಲಾಗಿದೆ. ನಮಗೆ ಶುದ್ಧತೆಗೆ ಪ್ರಯತ್ನವಿದ್ದರೂ, ಸ್ವಯಂಕ್ರಿಯ ಭಾಷಾಂತರಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದೆಂದು ಗಮನಿಸಿ. ಮೂಲದ ಡಾಕ್ಯುಮೆಂಟ್ ಅದರ ಮಾತೃಭಾಷೆಯಲ್ಲಿ ಪ್ರಾಮಾಣಿಕ ಮೂಲವಾಗಿವೆ ಎಂದು ಪರಿಗಣಿಸಬೇಕು. ಮುಖ್ಯ ಮಾಹಿತಿಗೆ ವೃತ್ತಿಪರ ಮಾನವ ಭಾಷಾಂತರವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಭಾಷಾಂತರವನ್ನು ಬಳಸುವುದರಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಗ್ರಹಿಕೆಗಳು ಅಥವಾ ತಪ್ಪು ಅರ್ಥೈಸಿಕೆಗಳಿಗಾಗಿ ನಾವು ಹೊಣೆಗಾರರಲ್ಲ.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -4,7 +4,7 @@
ನಿತ್ಯ ನಾರಸಿಂಹನ್, ಕಲಾವಿದ
![roadmap sketchnote](../../../translated_images/kn/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.png)
![roadmap sketchnote](../../../translated_images/kn/00-Roadmap.4905d6567dff4753.webp)
---

@ -11,12 +11,24 @@
"source_file": "1-Introduction/01-defining-data-science/assignment.md",
"language_code": "ml"
},
"1-Introduction/01-defining-data-science/notebook.ipynb": {
"original_hash": "8f5eb7b3f7cc89e6d98fb32e1de65dec",
"translation_date": "2026-02-27T10:40:40+00:00",
"source_file": "1-Introduction/01-defining-data-science/notebook.ipynb",
"language_code": "ml"
},
"1-Introduction/01-defining-data-science/solution/assignment.md": {
"original_hash": "a8f79b9c0484c35b4f26e8aec7fc4d56",
"translation_date": "2025-12-19T14:34:45+00:00",
"source_file": "1-Introduction/01-defining-data-science/solution/assignment.md",
"language_code": "ml"
},
"1-Introduction/01-defining-data-science/solution/notebook.ipynb": {
"original_hash": "090bbfbfcb0c40d3d6e3236f836164ea",
"translation_date": "2026-02-27T10:45:37+00:00",
"source_file": "1-Introduction/01-defining-data-science/solution/notebook.ipynb",
"language_code": "ml"
},
"1-Introduction/02-ethics/README.md": {
"original_hash": "58860ce9a4b8a564003d2752f7c72851",
"translation_date": "2025-12-19T14:10:15+00:00",
@ -95,6 +107,12 @@
"source_file": "2-Working-With-Data/07-python/assignment.md",
"language_code": "ml"
},
"2-Working-With-Data/07-python/notebook-covidspread.ipynb": {
"original_hash": "6335cccba01dc6ad7b15aba7a8c73f38",
"translation_date": "2026-02-27T10:46:37+00:00",
"source_file": "2-Working-With-Data/07-python/notebook-covidspread.ipynb",
"language_code": "ml"
},
"2-Working-With-Data/08-data-preparation/README.md": {
"original_hash": "1b560955ff39a2bcf2a049fce474a951",
"translation_date": "2025-12-19T15:42:32+00:00",
@ -360,8 +378,8 @@
"language_code": "ml"
},
"README.md": {
"original_hash": "8ec92ecfeb14923af733851239552146",
"translation_date": "2026-01-30T02:52:10+00:00",
"original_hash": "f671e295a294a2559fc59d1524e001b4",
"translation_date": "2026-02-27T10:53:24+00:00",
"source_file": "README.md",
"language_code": "ml"
},

@ -6,7 +6,7 @@
---
[![Defining Data Science Video](../../../../translated_images/ml/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.png)](https://youtu.be/beZ7Mb_oz9I)
[![Defining Data Science Video](../../../../translated_images/ml/video-def-ds.6623ee2392ef1abf.webp)](https://youtu.be/beZ7Mb_oz9I)
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/0)
@ -144,7 +144,7 @@
ഈ വെല്ലുവിളിയിൽ, ഡാറ്റാ സയൻസ് മേഖലയുമായി ബന്ധപ്പെട്ട ആശയങ്ങൾ വാചകങ്ങൾ പരിശോധിച്ച് കണ്ടെത്താൻ ശ്രമിക്കും. ഡാറ്റാ സയൻസിനെക്കുറിച്ചുള്ള ഒരു വിക്കിപീഡിയ ലേഖനം എടുത്ത്, ടെക്സ്റ്റ് ഡൗൺലോഡ് ചെയ്ത് പ്രോസസ് ചെയ്ത്, താഴെ കാണുന്ന പോലെ ഒരു വാക്ക് ക്ലൗഡ് നിർമ്മിക്കും:
![Word Cloud for Data Science](../../../../translated_images/ml/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.png)
![Word Cloud for Data Science](../../../../translated_images/ml/ds_wordcloud.664a7c07dca57de0.webp)
കോഡ് വായിക്കാൻ [`notebook.ipynb`](../../../../1-Introduction/01-defining-data-science/notebook.ipynb ':ignore') സന്ദർശിക്കുക. നിങ്ങൾക്ക് കോഡ് പ്രവർത്തിപ്പിച്ച് എല്ലാ ഡാറ്റാ പരിവർത്തനങ്ങളും യഥാർത്ഥ സമയത്ത് എങ്ങനെ നടക്കുന്നതെന്ന് കാണാം.

@ -3,15 +3,15 @@
{
"cell_type": "markdown",
"source": [
"# ചലഞ്ച്: ഡാറ്റാ സയൻസിനെക്കുറിച്ചുള്ള വാചകം വിശകലനം ചെയ്യൽ\n",
"# സവാല്‍: ഡാറ്റാ സയൻസിനെക്കുറിച്ചുള്ള ടെക്സ്റ്റ് വിശകലനം\n",
"\n",
"ഈ ഉദാഹരണത്തിൽ, പരമ്പരാഗത ഡാറ്റാ സയൻസ് പ്രക്രിയയിലെ എല്ലാ ഘട്ടങ്ങളും ഉൾക്കൊള്ളുന്ന ഒരു ലളിതമായ വ്യായാമം ചെയ്യാം. നിങ്ങൾക്ക് കോഡ് എഴുതേണ്ടതില്ല, താഴെയുള്ള സെല്ലുകൾ ക്ലിക്ക് ചെയ്ത് അവ പ്രവർത്തിപ്പിച്ച് ഫലം കാണാം. ഒരു ചലഞ്ചായി, വ്യത്യസ്ത ഡാറ്റ ഉപയോഗിച്ച് ഈ കോഡ് പരീക്ഷിക്കാൻ നിങ്ങൾ പ്രേരിപ്പിക്കപ്പെടുന്നു.\n",
"ഈ ഉദാഹരണത്തിൽ, പരമ്പരാഗത ഡാറ്റാ സയൻസിനറെ പ്രക്രിയയിലെ എല്ലാ ഘടകങ്ങളും ഉൾക്കൊള്ളുന്ന ഒരു ലളിതമയമായ അഭ്യാസം ചെയ്യാം. നിങ്ങൾയ്ക്ക് ഒരു കോഡ് എഴുതേണ്ടതില്ല, താഴെയുള്ള സെല്ലുകൾ ക്ലിക്ക് ചെയ്ത് അത് പ്രവർത്തിപ്പിക്കുകയും ഫലം നിരീക്ഷിക്കുകയും ചെയ്യാം. ഒരു സവാൽ എന്ന നിലയിൽ, വ്യത്യസ്ത ഡാറ്റ ഉപയോഗിച്ച് ഈ കോഡ് പരീക്ഷിക്കാൻ നിങ്ങൾ പ്രേരിപ്പിക്കപ്പെടുന്നു.\n",
"\n",
"## ലക്ഷ്യം\n",
"\n",
"ഈ പാഠത്തിൽ, ഡാറ്റാ സയൻസുമായി ബന്ധപ്പെട്ട വിവിധ ആശയങ്ങളെക്കുറിച്ച് ഞങ്ങൾ ചർച്ച ചെയ്തു. **ടെക്സ്റ്റ് മൈനിംഗ്** ചെയ്യുന്നതിലൂടെ കൂടുതൽ ബന്ധപ്പെട്ട ആശയങ്ങൾ കണ്ടെത്താൻ ശ്രമിക്കാം. ഡാറ്റാ സയൻസിനെക്കുറിച്ചുള്ള ഒരു വാചകത്തോടെ തുടങ്ങും, അതിൽ നിന്നു കീ-വാക്കുകൾ എടുക്കും, പിന്നെ ഫലം ദൃശ്യവൽക്കരിക്കാൻ ശ്രമിക്കും.\n",
"ഈ പാഠത്തിൽ, ഡാറ്റാ സയൻസുമായി ബന്ധപ്പെട്ട വ്യത്യസ്ത ആശയങ്ങളെക്കുറിച്ച് സംസാരിച്ചിട്ടുണ്ട്. കുറച്ച് **ടെക്സ്റ്റ് മൈനിങ്** ചെയ്ത് കൂടുതൽ ബന്ധപ്പെട്ട ആശയങ്ങൾ കണ്ടെത്താൻ ശ്രമിക്കാം. ഡാറ്റാ സയൻസിനെക്കുറിച്ചുള്ള ഒരു ടെക്സ്റ്റ് എടുത്ത് അതിൽ നിന്നും കീവർഡുകൾ പുറത്തെടുത്തു, തുടർന്ന് ഫലം ദൃശ്യപ്പെടുത്താൻ ശ്രമിക്കും.\n",
"\n",
"ഒരു വാചകമായി, ഞാൻ വിക്കിപീഡിയയിലെ ഡാറ്റാ സയൻസ് പേജ് ഉപയോഗിക്കും:\n"
"ഒരു ടെക്സ്റ്റ് ആയി, ഞാൻ വിക്കിപീഡിയയിൽ നിന്ന് ഡാറ്റാ സയൻസ് പേജ് ഉപയോഗിക്കുന്നതാണ്:\n"
],
"metadata": {}
},
@ -32,9 +32,9 @@
{
"cell_type": "markdown",
"source": [
"## Step 1: ഡാറ്റ നേടൽ\n",
"## Step 1: ഡാറ്റ നേടിയെടുക്കൽ\n",
"\n",
"ഓരോ ഡാറ്റ സയൻസ് പ്രക്രിയയിലും ആദ്യപടി ഡാറ്റ നേടലാണ്. അതിനായി നാം `requests` ലൈബ്രറി ഉപയോഗിക്കും:\n"
"ഓരോ ഡാറ്റാ സയൻസ് പ്രക്രിയയുടെ ആദ്യപടിയാണ് ഡാറ്റ നേടുന്നത്. അതിനായി നാം `requests` ലൈബ്രറി ഉപയോഗിക്കും:\n"
],
"metadata": {}
},
@ -66,45 +66,43 @@
{
"cell_type": "markdown",
"source": [
"## ഘട്ടം 2: ഡാറ്റ മാറ്റം വരുത്തൽ\n",
"\n",
"അടുത്ത ഘട്ടം പ്രോസസ്സിംഗിന് അനുയോജ്യമായ രൂപത്തിലേക്ക് ഡാറ്റ മാറ്റുക എന്നതാണ്. നമ്മുടെ കേസിൽ, നാം പേജിൽ നിന്നുള്ള HTML സോഴ്‌സ് കോഡ് ഡൗൺലോഡ് ചെയ്തിട്ടുണ്ട്, അത് പ്ലെയിൻ ടെക്സ്റ്റിലേക്ക് മാറ്റേണ്ടതുണ്ട്.\n",
"\n",
"ഇത് ചെയ്യാനുള്ള നിരവധി മാർഗ്ഗങ്ങളുണ്ട്. നാം പൈത്തണിൽ നിന്നുള്ള ഏറ്റവും ലളിതമായ ബിൽറ്റ്-ഇൻ [HTMLParser](https://docs.python.org/3/library/html.parser.html) ഒബ്ജക്റ്റ് ഉപയോഗിക്കും. `HTMLParser` ക്ലാസ്സിനെ സബ്ക്ലാസ് ചെയ്ത് `<script>`യും `<style>`യും ടാഗുകൾ ഒഴികെയുള്ള HTML ടാഗുകൾക്കുള്ളിലെ എല്ലാ ടെക്സ്റ്റും ശേഖരിക്കുന്ന കോഡ് നിർവചിക്കേണ്ടതാണ്.\n"
"## ഘട്ടം 2: ഡാറ്റ ട്രാൻസ്ഫോർമിംഗ്\r\n",
"\r\n",
"അടുത്ത ഘട്ടം ഡാറ്റ പ്രോസസ്സിംഗിന് അനുയോജ്യമായ രൂപത്തിലേക്ക് മാറ്റലാണ്. നമ്മുടെ കേസിൽ, നാം പേജ് നിന്നുള്ള HTML സോഴ്‌സ് കോഡ് ഡൗൺലോഡ് ചെയ്തത്, അതിനെ പ്ലെയിൻ ടെക്സ്റ്റായി മാറಬೇಕು.\r\n",
"\r\n",
"ഇത് ചെയ്യാനുള്ള നിരവധി മാർഗ്ഗങ്ങളുണ്ട്. HTML പാർസിങ്ങിനുള്ള പ്രാദേശികമായ ഒരു പൈതൺ ലൈബ്രറി ആയ [BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/) നാം ഉപയോഗിക്കും. BeautifulSoup നമുക്ക് പ്രത്യേക HTML എലമെന്റുകൾ മനസിലാക്കാൻ സഹായിക്കുന്നു, അതിനാൽ നാം വിക്കിപീഡിയയിലെ പ്രധാന ലേഖന ഉള്ളടക്കത്തിൽ കേന്ദ്രീകരിക്കുകയും ചില നാവിഗേഷൻ മെനുക്കൾ, സൈഡ്ബാറുകൾ, ഫൂട്ടറുകൾ, മറ്റ് പ്രസക്തമല്ലാത്ത ഉള്ളടക്കങ്ങൾ കുറയ്ക്കുകയും ചെയ്യാം (എങ്കിലും ചില ബോയ്‌ലർപ്ലേറ്റ് ടെക്സ്റ്റ് ശേഷിച്ചേക്കാം).\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"ആദ്യം, HTML പാഴ്സിങ്ങിനായി BeautifulSoup ലൈബ്രറി ഇൻസ്റ്റാൾ ചെയ്യേണ്ടതാണ്:\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"import sys\r\n",
"!{sys.executable} -m pip install beautifulsoup4"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 64,
"source": [
"from html.parser import HTMLParser\r\n",
"\r\n",
"class MyHTMLParser(HTMLParser):\r\n",
" script = False\r\n",
" res = \"\"\r\n",
" def handle_starttag(self, tag, attrs):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = True\r\n",
" def handle_endtag(self, tag):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = False\r\n",
" def handle_data(self, data):\r\n",
" if str.strip(data)==\"\" or self.script:\r\n",
" return\r\n",
" self.res += ' '+data.replace('[ edit ]','')\r\n",
"\r\n",
"parser = MyHTMLParser()\r\n",
"parser.feed(text)\r\n",
"text = parser.res\r\n",
"print(text[:1000])"
"from bs4 import BeautifulSoup\r\n\r\n# Parse the HTML content\r\nsoup = BeautifulSoup(text, 'html.parser')\r\n\r\n# Extract only the main article content from Wikipedia\r\n# Wikipedia uses 'mw-parser-output' class for the main article content\r\ncontent = soup.find('div', class_='mw-parser-output')\r\n\r\ndef clean_wikipedia_content(content_node):\r\n \"\"\"Remove common non-article elements from a Wikipedia content node.\"\"\"\r\n # Strip jump links, navboxes, reference lists/superscripts, edit sections, TOC, sidebars, etc.\r\n selectors = [\r\n '.mw-jump-link',\r\n '.navbox',\r\n '.reflist',\r\n 'sup.reference',\r\n '.mw-editsection',\r\n '.hatnote',\r\n '.metadata',\r\n '.infobox',\r\n '#toc',\r\n '.toc',\r\n '.sidebar',\r\n ]\r\n for selector in selectors:\r\n for el in content_node.select(selector):\r\n el.decompose()\r\n\r\nif content:\r\n # Clean the content node to better approximate article text only.\r\n clean_wikipedia_content(content)\r\n text = content.get_text(separator=' ', strip=True)\r\n print(text[:1000])\r\nelse:\r\n print(\"Could not find main content. Using full page text.\")\r\n text = soup.get_text(separator=' ', strip=True)\r\n print(text[:1000])"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" Data science - Wikipedia Data science From Wikipedia, the free encyclopedia Jump to navigation Jump to search Interdisciplinary field of study focused on deriving knowledge and insights from data Not to be confused with information science . The existence of Comet NEOWISE (here depicted as a series of red dots) was discovered by analyzing astronomical survey data acquired by a space telescope , the Wide-field Infrared Survey Explorer . Part of a series on Machine learning and data mining Problems Classification Clustering Regression Anomaly detection AutoML Association rules Reinforcement learning Structured prediction Feature engineering Feature learning Online learning Semi-supervised learning Unsupervised learning Learning to rank Grammar induction Supervised learning ( classification  • regression ) Decision trees Ensembles Bagging Boosting Random forest k -NN Linear regression Naive Bayes Artificial neural networks Logistic regression Perceptron Relevance vector machine \n"
"Data science From Wikipedia, the free encyclopedia Interdisciplinary field of study focused on deriving knowledge and insights from data Data science is an interdisciplinary academic field that uses statistics, scientific computing, scientific methods, processes, algorithms and systems to extract or extrapolate knowledge and insights from noisy, structured, and unstructured data. Data science also integrates domain knowledge from the underlying application domain. Data science is multifaceted and can be described as a science, a research paradigm, a research method, a discipline, a workflow, and a profession.\n"
]
}
],
@ -115,9 +113,9 @@
"source": [
"## Step 3: Getting Insights\n",
"\n",
"ഏറ്റവും പ്രധാനപ്പെട്ട ഘട്ടം നമ്മുടെ ഡാറ്റയെ ഏതെങ്കിലും രൂപത്തിലേക്ക് മാറ്റുക എന്നതാണ്, അതിൽ നിന്ന് നാം洞察ങ്ങൾ നേടാൻ കഴിയും. നമ്മുടെ കേസിൽ, നാം ടെക്സ്റ്റിൽ നിന്നുള്ള കീവേഡുകൾ എടുക്കാൻ ആഗ്രഹിക്കുന്നു, കൂടാതെ ഏത് കീവേഡുകൾ കൂടുതൽ അർത്ഥവത്താണ് എന്ന് കാണണം.\n",
"The most important step is to turn our data into some form from which we can draw insights. In our case, we want to extract keywords from the text, and see which keywords are more meaningful.\n",
"\n",
"കീവേഡ് എക്സ്ട്രാക്ഷനിനായി നാം Python ലൈബ്രറി [RAKE](https://github.com/aneesha/RAKE) ഉപയോഗിക്കും. ആദ്യം, ഈ ലൈബ്രറി ഇല്ലെങ്കിൽ ഇൻസ്റ്റാൾ ചെയ്യാം:\n"
"We will use Python library called [RAKE](https://github.com/aneesha/RAKE) for keyword extraction. First, let's install this library in case it is not present: \n"
],
"metadata": {}
},
@ -162,7 +160,7 @@
{
"cell_type": "markdown",
"source": [
"പ്രധാന പ്രവർത്തനം `Rake` ഒബ്ജക്റ്റിൽ നിന്ന് ലഭ്യമാണ്, ഇത് നാം ചില പാരാമീറ്ററുകൾ ഉപയോഗിച്ച് ഇഷ്ടാനുസൃതമാക്കാ. നമ്മുടെ കേസിൽ, ഒരു കീവേഡിന്റെ കുറഞ്ഞ നീളം 5 അക്ഷരങ്ങളാക്കി, ഡോക്യുമെന്റിൽ ഒരു കീവേഡിന്റെ കുറഞ്ഞ ആവൃത്തി 3 ആയി, ഒരു കീവേഡിലെ പരമാവധി വാക്കുകളുടെ എണ്ണം 2 ആയി നമുക്ക് സജ്ജമാക്കാ. മറ്റ് മൂല്യങ്ങളുമായി പരീക്ഷിച്ച് ഫല ശ്രദ്ധിക്കാം.\n"
"പ്രധാന പ്രവർത്തനം `Rake` αντικείμενοൽ നിന്നും ലഭ്യമാണ്, ഇത് നാം ചില പാരാമീറ്ററുകൾ ഉപയോഗിച്ച് ഇഷ്ടാനുസൃതമാക്കാൻ കഴിയും. നമ്മുടെ കാര്യത്തിൽ, ഒരു কী워്റ്റെ അഭ്യന്തര നീളം 5 അക്ഷരമായി, ഒരു ഡോക്യുമെന്റിൽ ഒരു കീーワードിന്റെ കുറഞ്ഞമായ ആവൃത്തി 3 ആയി, ഒരു കീーワードിലെ പരമാവധി വാക്കുകളുടെ എണ്ണം 2 ആയി നാം സജ്ജീകരിക്കു. മറ്റ് മൂല്യങ്ങളുമായി പരീക്ഷിച്ച് ഫലങ്ങൾ കാണാൻ മടിക്കണ്ട.\n"
],
"metadata": {}
},
@ -212,11 +210,11 @@
"cell_type": "markdown",
"source": [
"\n",
"നാം ബന്ധപ്പെട്ട പ്രാധാന്യനിലവാരത്തോടുകൂടിയ പദങ്ങളുടെ ഒരു പട്ടിക ലഭിച്ചു. നിങ്ങൾക്ക് കാണാമല്ലോ, മെഷീൻ ലേണിംഗ്, ബിഗ് ഡാറ്റ തുടങ്ങിയ ഏറ്റവും പ്രസക്തമായ ശാഖകൾ പട്ടികയിലെ മുകളിൽ സ്ഥാനങ്ങളിൽ ഉണ്ട്.\n",
"നമ്മൾ പ്രാധാന്യത്തിന്റെ ഡിഗ്രിയോട് കൂടിയ ടെർമുകൾ ഒരു പട്ടികയായി ലഭിച്ചു. നിങ്ങൾ കാണുന്നതുപോലെ, മെഷീൻ ലേണിംഗും ബിഗ് ഡാറ്റയും പോലുള്ള ഏറ്റവും പ്രസക്തമായ ശാഖകൾ പട്ടികയുടെ മുകളിലത്തെ സ്ഥാനങ്ങളിൽ കാണാവുന്നതാണ്.\n",
"\n",
"## ഘട്ടം 4: ഫലത്തിന്റെ ദൃശ്യവൽക്കരണം\n",
"## ചുവട് 4: ഫലങ്ങൾ ദൃശ്യരൂപത്തിലാക്കൽ\n",
"\n",
"ജനങ്ങൾ ഡാറ്റയെ ഏറ്റവും നല്ല രീതിയിൽ ദൃശ്യരൂപത്തിൽ വ്യാഖ്യാനിക്കാം. അതിനാൽ ചില洞ങ്ങൾ കണ്ടെത്താൻ ഡാറ്റ ദൃശ്യവൽക്കരിക്കുന്നത് സാധാരണയായി ഉചിതമാണ്. പൈത്തണിലെ `matplotlib` ലൈബ്രറി ഉപയോഗിച്ച് കീവർഡുകളുടെ പ്രസക്തിയോടെയുള്ള ലളിതമായ വിതരണത്തെ പ്ലോട്ട് ചെയ്യാം:\n"
"വ്യക്തികൾ ഡാറ്റയെ ഏറ്റവും നല്ല രീതിയിൽ വ്യാഖ്യാനിക്കാൻ കഴിയും ദൃശ്യമാധ്യമത്തിലൂടെ. അതിനാൽ ചില洞നങ്ങൾ മനസ്സിലാക്കാൻ ആണ് ഡാറ്റയുടെ ദൃശ്യരൂപം ഉണ്ടാക്കുന്നത് സാധാരണയായി യോഗ്യമാണ്. കീ വാക്കുകളുടെ പ്രസക്തിയോടെയുള്ള ലളിതമായ വിതരണങ്ങൾ രേഖപ്പെടുത്താൻ Pythonൽ `matplotlib` ലൈബ്രറി ഉപയോഗിക്കാം:\n"
],
"metadata": {}
},
@ -253,7 +251,7 @@
{
"cell_type": "markdown",
"source": [
"എങ്കിലും, വാക്കുകളുടെ ആവൃത്തി കാണിക്കുന്നതിനുള്ള മറ്റൊരു മികച്ച മാർഗം ഉണ്ട് - **Word Cloud** ഉപയോഗിച്ച്. നമ്മുടെ കീവേഡ് ലിസ്റ്റിൽ നിന്ന് വാക്കുകളുടെ മേഘം വരയ്ക്കാൻ മറ്റൊരു ലൈബ്രറി ഇൻസ്റ്റാൾ ചെയ്യേണ്ടതുണ്ട്.\n"
"എങ്കിലും, വാക്കുകളുടെ ആവൃത്തികൾ കാണിക്കുന്നതിന് അതിലേക്ക് പോലും മികച്ച ഒരു മാർഗമാണ് **വർഡ് ക്ലൗഡ്** ഉപയോഗിക്കുക. നമ്മുടെ കീവേഡുകളുടെ പട്ടികയിൽ നിന്ന് വാക്കുകളുടെ ക്ലൗഡ് പ്ലോട്ട് ചെയ്യുവാൻ മറ്റൊരു ലൈബ്രറി ഇൻസ്റ്റാൾ ചെയ്തിരിക്കണം.\n"
],
"metadata": {}
},
@ -269,7 +267,7 @@
{
"cell_type": "markdown",
"source": [
"`WordCloud` ഒബ്ജക്റ്റ് യഥാർത്ഥ ടെക്സ്റ്റ് അല്ലെങ്കിൽ അവയുടെ ആവൃത്തി സഹിതം മുൻകൂട്ടി കണക്കാക്കിയ വാക്കുകളുടെ പട്ടിക സ്വീകരിച്ച്, ഒരു ചിത്രം തിരികെ നൽകുന്നതിന് ഉത്തരവാദിയാണ്, പിന്നീട് അത് `matplotlib` ഉപയോഗിച്ച് പ്രദർശിപ്പിക്കാം:\n"
"`WordCloud` ഓബ്ജക്ട് اصل લખાણമോ, പൂർവഗണനാപ്രാപ്തമായ വാക്കുകളുടെ സാന്ദ്രതാ പട്ടികയോ സ്വീകരിച്ച് ഒരു ചിത്രമാണ് നൽകുന്നത്, അത് ശേഷം `matplotlib` ഉപയോഗിച്ച് പ്രദർശിപ്പിക്കാം:\n"
],
"metadata": {}
},
@ -313,7 +311,7 @@
{
"cell_type": "markdown",
"source": [
"നാം `WordCloud`-ലേക്ക് മൗലിക വാചകം കൂടി നൽകാം - നമുക്ക് സമാനമായ ഫലം ലഭിക്കുമോ എന്ന് നോക്കാം:\n"
"നാം ഓരിജിനൽ ടെക്സ്റ്റ് `WordCloud`-ലേക്ക് നൽകാനും കഴിയും - സമാനമായ ഫലം കിട്ടുമോ എന്ന് നോക്കാം:\n"
],
"metadata": {}
},
@ -373,11 +371,11 @@
{
"cell_type": "markdown",
"source": [
"നിങ്ങൾക്ക് കാണാം, വാക്ക് ക്ലൗഡ് ഇപ്പോൾ കൂടുതൽ ആകർഷകമായി തോന്നുന്നു, പക്ഷേ അതിൽ അനേകം ശബ്ദങ്ങൾ (ഉദാ. `Retrieved on` പോലുള്ള ബന്ധപ്പെട്ടില്ലാത്ത വാക്കുകൾ) ഉൾക്കൊള്ളുന്നു. കൂടാതെ, *data scientist* അല്ലെങ്കിൽ *computer science* പോലുള്ള രണ്ട് വാക്കുകൾ അടങ്ങിയ കുറച്ച് കീവാക്കുകൾ മാത്രമേ ലഭിക്കൂ. ഇത് കാരണം RAKE ആൽഗോരിതം ടെക്സ്റ്റിൽ നിന്ന് നല്ല കീവാക്കുകൾ തിരഞ്ഞെടുക്കുന്നതിൽ വളരെ മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കുന്നു. ഈ ഉദാഹരണം ഡാറ്റ പ്രീ-പ്രോസസ്സിംഗ്, ക്ലീനിംഗ് എന്നിവയുടെ പ്രാധാന്യം വ്യക്തമാക്കുന്നു, കാരണം അവസാനം ലഭിക്കുന്ന വ്യക്തമായ ചിത്രം നമുക്ക് മികച്ച തീരുമാനങ്ങൾ എടുക്കാൻ സഹായിക്കും.\n",
"നിങ്ങൾക്ക് දැන් വാക്കുകളുടെ മേഘം കൂടുതൽ ആകർഷകമായി കാണപ്പെടുന്നുവെങ്കിലും, അതിനുള്ളിൽ ഏറെ ശബ്ദം (ഉദാ: `Retrieved on` പോലെയുള്ള ബന്ധമില്ലാത്ത വാക്കുകൾ) കൂടി അടങ്ങിയിരിക്കുന്നു. കൂടാതെ, *data scientist* അല്ലെങ്കിൽ *computer science* പോലെയുള്ള രണ്ട് വാക്കുകളുള്ള കീവേർഡുകൾ കുറവായെത്തുന്നു. ടെക്സ്റ്റിൽ നിന്ന് നല്ല കീവേർഡുകൾ തിരഞ്ഞെടുക്കുന്നതിൽ RAKE ആൽഗോറിതം വളരെ നല്ല işler ചെയ്യുന്നതിനാൽ ഇതാണ് കാരണം. ഈ ഉദാഹരണം ഡേറ്റ പ്രീ-പ്രോസസ്സിംഗ്, ക്ലീനിങ്ങിന്റെ പ്രധാന്യം കാണിക്കുന്നു, കാരണം അവസാനം ഉണ്ടാകുന്ന വ്യക്തമായ ചിത്രം നമുക്ക് നല്ല തീരുമാനങ്ങൾ എടുക്കാൻ സഹായിക്കും.\n",
"\n",
"ഈ അഭ്യാസത്തിൽ, വിക്കിപീഡിയ ടെക്സ്റ്റിൽ നിന്ന് ചില അർത്ഥങ്ങൾ കീവാക്കുകളും വാക്ക് ക്ലൗഡും രൂപത്തിൽ എടുക്കുന്ന ഒരു ലളിതമായ പ്രക്രിയയിലൂടെ നാം കടന്നുപോയിട്ടുണ്ട്. ഈ ഉദാഹരണം വളരെ ലളിതമാണ്, പക്ഷേ ഡാറ്റ സയന്റിസ്റ്റ് ഡാറ്റ കൈകാര്യം ചെയ്യുമ്പോൾ സ്വീകരിക്കുന്ന എല്ലാ സാധാരണ ഘട്ടങ്ങളും, ഡാറ്റ സമാഹരണത്തിൽ നിന്ന് ആരംഭിച്ച് ദൃശ്യവൽക്കരണത്തിലേക്ക് വരെ, നന്നായി കാണിക്കുന്നു.\n",
"ഈ അഭ്യാസത്തിൽ, വിക്കിപീഡിയ ടെക്സ്റ്റിൽ നിന്ന് കീവേർഡുകളും വാക്കുകളുടെ മേഘവും രൂപത്തിൽ ചില അർത്ഥങ്ങൾ എടുക്കാനുള്ള എളുപ്പമുള്ള ഒരു പ്രക്രിയ കണ്ടു. ഈ ഉദാഹരണം വളരെ ലളിതമാണെങ്കിലും, ഡേറ്റ ഉപയോഗിച്ച് പ്രവർത്തിക്കുമ്പോൾ ഒരു ഡേറ്റ സയന്റിസ്റ്റ് സ്വീകരിക്കുന്ന സാധാരണ ചുവടുകൾ എല്ലാം മികച്ച രീതിയിൽ പ്രദർശിപ്പിക്കുന്നു, ഡേറ്റ ശേഖരJD्र മുതൽ ദൃശ്യവൽക്കരണമ വരെയുള്ളിത്ത്ത വരെയുള്ള ചുവടുകൾ.\n",
"\n",
"നമ്മുടെ കോഴ്സിൽ നാം ആ ഘട്ടങ്ങളെല്ലാം വിശദമായി ചർച്ച ചെയ്യും.\n"
"ഞങ്ങളുടെ കോഴ്‌സിൽ നാം ആ ചുവടുകൾ എല്ലാം വിശദമായി ചർച്ച ചെയ്യുമെന്ന്.\n"
],
"metadata": {}
},
@ -395,7 +393,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെററായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**വിമർശന കുറിപ്പ്**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം സത്യസന്ധമായ വിവർത്തനത്തിനായി പരിശ്രമിച്ചെങ്കിലും, സ്വയംഭരണ വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ അസത്യതകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. യഥാർത്ഥ രേഖയുടെ സ്വദേശ ഭാഷയാണ് ഔദ്യോഗിക ഉറവിടം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മാനവ വിവർത്തനം ശുപാർശ ചെയ്യുന്നു. ഈ വിവർത്തനം ഉപയോഗിച്ചതിൽ നിന്നുണ്ടാകുന്ന എന്തെങ്കിലും തെറ്റിദ്ധാരണകൾക്ക് ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
@ -419,12 +417,6 @@
},
"interpreter": {
"hash": "c28e7b6bf4e5b397b8288a85bf0a94ea8d3585ce2b01919feb195678ec71581b"
},
"coopTranslator": {
"original_hash": "50c0f0a5204a18405611cbe7e0fec56b",
"translation_date": "2025-12-19T17:01:14+00:00",
"source_file": "1-Introduction/01-defining-data-science/notebook.ipynb",
"language_code": "ml"
}
},
"nbformat": 4,

@ -3,17 +3,17 @@
{
"cell_type": "markdown",
"source": [
"# ചലഞ്ച്: ഡാറ്റാ സയൻസിനെക്കുറിച്ചുള്ള വാചകം വിശകലനം ചെയ്യൽ\n",
"# സവാൽ: ഡാറ്റാ സയന്‍സ് സംബന്ധിച്ച ടെക്സ്റ്റ് വിശകലനംചെയ്യല്‍\n",
"\n",
"> *ഈ നോട്ട്ബുക്കിൽ, നാം വ്യത്യസ്ത URL - മെഷീൻ ലേണിങ്ങ് എന്ന വിക്കിപീഡിയ ലേഖനം ഉപയോഗിച്ച് പരീക്ഷണം നടത്തുന്നു. ഡാറ്റാ സയൻസിനേക്കാൾ വ്യത്യസ്തമായി, ഈ ലേഖനത്തിൽ നിരവധി പദങ്ങൾ ഉൾക്കൊള്ളുന്നുവെന്ന് നിങ്ങൾ കാണാം, ഇത് വിശകലനം കൂടുതൽ പ്രശ്നമാക്കുന്നു. കീവേഡ് എക്സ്ട്രാക്ഷൻ ചെയ്ത ശേഷം, ചില ആവർത്തിക്കുന്നതും എന്നാൽ അർത്ഥവത്തായില്ലാത്ത വാക്കുകളുടെ സംയോജനങ്ങൾ ഒഴിവാക്കാൻ മറ്റൊരു മാർഗം കണ്ടെത്തേണ്ടതുണ്ട്.*\n",
"> *ഈ നോട്ട്ബുക്കിൽ, വ്യത്യസ്ത URL - മെഷീൻ ലേണിംഗ് Wikipedia ലേഖനം ഉപയോഗിച്ച് പരീക്ഷണം നടത്തുന്നു. ഡാറ്റാ സയന്‍സിന് വിരുദ്ധമായി, ഈ ലേഖനം പല പദങ്ങൾ ഉൾക്കൊള്ളുന്നുണ്ട്, എങ്കിൽ വിശകലനം കൂടുതൽ പ്രശ്നമാകുന്നു. കീവർഡ് എക്സ്ട്രാക്ഷൻ കഴിഞ്ഞ്, പൊതുജനങ്ങളായ, എന്നാൽ അര്‍ഥവത്തല്ലാത്ത പദസംയോജങ്ങള്‍ നീക്കംചെയ്യാന്‍ മറ്റൊരു വഴിയൊന്നുകൂടി കണ്ടെത്തേണ്ടതാണ്.*\n",
"\n",
"ഈ ഉദാഹരണത്തിൽ, പരമ്പരാഗത ഡാറ്റാ സയൻസ് പ്രക്രിയയിലെ എല്ലാ ഘട്ടങ്ങളും ഉൾക്കൊള്ളുന്ന ഒരു ലളിതമായ അഭ്യാസം ചെയ്യാം. നിങ്ങൾക്ക് കോഡ് എഴുതേണ്ടതില്ല, താഴെയുള്ള സെല്ലുകൾ ക്ലിക്ക് ചെയ്ത് പ്രവർത്തിപ്പിച്ച് ഫലം കാണാം. ഒരു ചലഞ്ചായി, നിങ്ങൾക്ക് ഈ കോഡ് വ്യത്യസ്ത ഡാറ്റ ഉപയോഗിച്ച് പരീക്ഷിക്കാൻ പ്രോത്സാഹിപ്പിക്കുന്നു.\n",
"ഈ ഉദാഹരണത്തില്‍, പരമ്പരാഗത ഡാറ്റാ സയന്‍സ് പ്രക്രിയയുടെ എല്ലാ ഘട്ടങ്ങളും ഉൾപെടുത്തുന്ന എളുപ്പമായ ഒരു പരിശീലനം നടത്താം. നിങ്ങൾക്ക് കോഡ് എഴുതാന്‍ ആവശ്യമില്ല, താഴെ കൊടുത്തിരിക്കുന്ന സെലുകൾ ക്ലിക് ചെയ്ത് പ്രവർത്തിപ്പിക്കുകയും ഫലം കാണുകയും ചെയ്യാം. ഒരു സവാളായി, ഈ കോഡ് മാറ്റി വ്യത്യസ്ത ഡാറ്റ ഉപയോഗിച്ച് പരീക്ഷിക്കാൻ നിങ്ങളെ പ്രേരിപ്പിക്കുന്നു.\n",
"\n",
"## ലക്ഷ്യം\n",
"\n",
"ഈ പാഠത്തിൽ, നാം ഡാറ്റാ സയൻസുമായി ബന്ധപ്പെട്ട വിവിധ ആശയങ്ങൾ ചർച്ച ചെയ്തു. **ടെക്സ്റ്റ് മൈനിംഗ്** ചെയ്യുന്നതിലൂടെ കൂടുതൽ ബന്ധപ്പെട്ട ആശയങ്ങൾ കണ്ടെത്താൻ ശ്രമിക്കാം. ഡാറ്റാ സയൻസിനെക്കുറിച്ചുള്ള ഒരു വാചകം ഉപയോഗിച്ച് തുടങ്ങും, അതിൽ നിന്നു കീവേഡുകൾ എടുക്കും, പിന്നെ ഫലം ദൃശ്യവൽക്കരിക്കാൻ ശ്രമിക്കും.\n",
"ഈ പാഠത്തിൽ, ഡാറ്റാ സയന്‍സുമായി ബന്ധപ്പെട്ട വിവിധ ആശയങ്ങളെക്കുറിച്ച് ചർച്ച ചെയ്‌തിട്ടുണ്ട്. **ടെക്സ്റ്റ് മൈനിംഗ്** നടത്തിക്കൊണ്ട് കൂടുതൽ ബന്ധപ്പെട്ട ആശയങ്ങൾ കണ്ടെത്താൻ ശ്രമിക്കാം. ഡാറ്റാ സയന്‍സ് എന്നക്കുറിച്ചുള്ള ടെക്സ്റ്റ് എടുത്ത്, അതിൽ നിന്നും കീവർഡ്സ് എടുക്കുകയും ഫലം ദൃശ്യവൽക്കരിക്കാൻ ശ്രമിക്കും.\n",
"\n",
"ഒരു വാചകമായി, ഞാൻ വിക്കിപീഡിയയിൽ ഡാറ്റാ സയൻസ് പേജാണ് ഉപയോഗിക്കുന്നത്:\n"
"ടെക്സ്റ്റായി, ഞാൻ Wikipedia ലെ ഡാറ്റാ സയന്‍സ് പേജ് ഉപയോഗിക്കും:\n"
],
"metadata": {}
},
@ -35,9 +35,9 @@
{
"cell_type": "markdown",
"source": [
"## Step 1: ഡാറ്റ നേടൽ\n",
"## ഘട്ടം 1: ഡാറ്റ നേടൽ\n",
"\n",
"ഓരോ ഡാറ്റാ സയൻസ് പ്രക്രിയയിലും ആദ്യപടി ഡാറ്റ നേടലാണ്. അതിനായി നാം `requests` ലൈബ്രറി ഉപയോഗിക്കു:\n"
"എല്ലാ ഡാറ്റ ശാസ്ത്ര പ്രക്രിയയിലുമുള്ള ആദ്യഘട്ടം ഡാറ്റ നേടലാണ്. അതിനു `requests` ലൈബ്രറി ഉപയോഗിക്കാ:\n"
],
"metadata": {}
},
@ -69,45 +69,43 @@
{
"cell_type": "markdown",
"source": [
"## Step 2: ഡാറ്റ മാറ്റം\n",
"## ഘട്ടം 2: ഡാറ്റ മാറ്റിമാറ്റല്‍\n",
"\n",
"അടുത്ത ഘട്ടം പ്രോസസ്സിംഗിന് അനുയോജ്യമായ രൂപത്തിലേക്ക് ഡാറ്റ മാറ്റുകയാണ്. നമ്മുടെ കേസിൽ, നാം പേജിൽ നിന്നുള്ള HTML സോഴ്സ് കോഡ് ഡൗൺലോഡ് ചെയ്തിട്ടുണ്ട്, അത് പ്ലെയിൻ ടെക്സ്റ്റിലേക്ക് മാറ്റേണ്ടതുണ്ട്.\n",
"അടുത്ത ഘട്ടം ഡാറ്റ പ്രോസസിംഗിനായി അനുയോജ്യമായ രൂപത്തിലേക്ക് മാറ്റുകയാണ്. നമ്മുടെ കേസിൽ, നാം പേജിൽ നിന്നുള്ള HTML സോഴ്സ് കോഡ് ഡൗൺലോഡ് ചെയ്തു, അത് സാദാരണ ടെക്സ്റ്റിലേക്ക് മാറ്റേണ്ടതാണ്.\n",
"\n",
"ഇത് ചെയ്യാനുള്ള നിരവധി മാർഗ്ഗങ്ങൾ ഉണ്ട്. നാം പൈത്തണിൽ നിന്നുള്ള ഏറ്റവും ലളിതമായ ബിൽറ്റ്-ഇൻ [HTMLParser](https://docs.python.org/3/library/html.parser.html) ഒബ്ജക്റ്റ് ഉപയോഗിക്കും. `HTMLParser` ക്ലാസ്സിനെ സബ്ക്ലാസ് ചെയ്ത് `<script>`യും `<style>`യും ടാഗുകൾ ഒഴികെയുള്ള HTML ടാഗുകൾക്കുള്ളിൽ ഉള്ള എല്ലാ ടെക്സ്റ്റും ശേഖരിക്കുന്ന കോഡ് നിർവചിക്കേണ്ടതാണ്.\n"
"ഇത് ചെയ്യാനുള്ള നിരവധി മാർഗങ്ങളുണ്ട്. നാം [BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/) എന്ന പ്രചാരത്തിലുള്ള Python ലൈബ്രറി ഉപയോഗിക്കും, ഇത് HTML പാഴ്‌സിംഗിനു വേണ്ടി ഉപയോഗിക്കുന്നു. BeautifulSoup നമുക്ക് പ്രത്യേക HTML ഘടകങ്ങൾ ലക്ഷ്യംവെക്കാൻ അനുമതിയുണ്ടാക്കുന്നു, അതുവഴി നാം Wikipedia യുടെ പ്രധാന ലേഖന ഉള്ളടക്കത്തിലേക്ക് ശ്രദ്ധ ചെലുത്താനും നാവിഗേഷൻ മെനു, സൈഡ്‌ബാറുകൾ, ഫൂട്ടറുകൾ, മറ്റ് അപ്രസക്തമായ ഉള്ളടക്കം കുറയ്ക്കാനും കഴിയും (ആദി കുറച്ച് ബോണിലേറ്റ് ടെക്സ്റ്റ് ഇനി ശേഷിച്ചേക്കാം).\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"ആദ്യം, HTML പാഴ്സിംഗിനായി BeautifulSoup ലൈബ്രറി സ്ഥാപിക്കണം:\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"import sys\r\n",
"!{sys.executable} -m pip install beautifulsoup4"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 4,
"source": [
"from html.parser import HTMLParser\r\n",
"\r\n",
"class MyHTMLParser(HTMLParser):\r\n",
" script = False\r\n",
" res = \"\"\r\n",
" def handle_starttag(self, tag, attrs):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = True\r\n",
" def handle_endtag(self, tag):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = False\r\n",
" def handle_data(self, data):\r\n",
" if str.strip(data)==\"\" or self.script:\r\n",
" return\r\n",
" self.res += ' '+data.replace('[ edit ]','')\r\n",
"\r\n",
"parser = MyHTMLParser()\r\n",
"parser.feed(text)\r\n",
"text = parser.res\r\n",
"print(text[:1000])"
"from bs4 import BeautifulSoup\r\n\r\n# Parse the HTML content\r\nsoup = BeautifulSoup(text, 'html.parser')\r\n\r\n# Extract only the main article content from Wikipedia\r\n# Wikipedia uses 'mw-parser-output' class for the main article content\r\ncontent = soup.find('div', class_='mw-parser-output')\r\n\r\ndef clean_wikipedia_content(content_node):\r\n \"\"\"Remove common non-article elements from a Wikipedia content node.\"\"\"\r\n # Strip jump links, navboxes, reference lists/superscripts, edit sections, TOC, sidebars, etc.\r\n selectors = [\r\n '.mw-jump-link',\r\n '.navbox',\r\n '.reflist',\r\n 'sup.reference',\r\n '.mw-editsection',\r\n '.hatnote',\r\n '.metadata',\r\n '.infobox',\r\n '#toc',\r\n '.toc',\r\n '.sidebar',\r\n ]\r\n for selector in selectors:\r\n for el in content_node.select(selector):\r\n el.decompose()\r\n\r\nif content:\r\n # Clean the content node to better approximate article text only.\r\n clean_wikipedia_content(content)\r\n text = content.get_text(separator=' ', strip=True)\r\n print(text[:1000])\r\nelse:\r\n print(\"Could not find main content. Using full page text.\")\r\n text = soup.get_text(separator=' ', strip=True)\r\n print(text[:1000])"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" Machine learning - Wikipedia Machine learning From Wikipedia, the free encyclopedia Jump to navigation Jump to search Study of algorithms that improve automatically through experience For the journal, see Machine Learning (journal) . \"Statistical learning\" redirects here. For statistical learning in linguistics, see statistical learning in language acquisition . Part of a series on Artificial intelligence Major goals Artificial general intelligence Planning Computer vision General game playing Knowledge reasoning Machine learning Natural language processing Robotics Approaches Symbolic Deep learning Bayesian networks Evolutionary algorithms Philosophy Ethics Existential risk Turing test Chinese room Control problem Friendly AI History Timeline Progress AI winter Technology Applications Projects Programming languages Glossary Glossary v t e Part of a series on Machine learning and data mining Problems Classification Clustering Regression Anomaly detection Data Cleaning AutoML Associ\n"
"Machine learning From Wikipedia, the free encyclopedia Study of algorithms that improve automatically through experience Machine learning (ML) is a field of study in artificial intelligence concerned with the development and study of statistical algorithms that can learn from data and generalize to unseen data, and thus perform tasks without explicit instructions. Recently, artificial neural networks have been able to surpass many previous approaches in performance. ML finds application in many fields, including natural language processing, computer vision, speech recognition, email filtering, agriculture, and medicine.\n"
]
}
],
@ -116,11 +114,11 @@
{
"cell_type": "markdown",
"source": [
"## Step 3: Getting Insights\n",
"## Step 3: ഉൾക്കാഴ്ചകൾ നേടു\n",
"\n",
"ഏറ്റവും പ്രധാനപ്പെട്ട ഘട്ടം നമ്മുടെ ഡാറ്റയെ ഒരു രൂപത്തിലേക്ക് മാറ്റുക എന്നതാണ്, അതിൽ നിന്ന് നാം洞察ങ്ങൾ നേടാൻ കഴിയും. നമ്മുടെ കേസിൽ, നാം ടെക്സ്റ്റിൽ നിന്ന് കീവേഡുകൾ എടുക്കാൻ ആഗ്രഹിക്കുന്നു, ഏത് കീവേഡുകൾ കൂടുതൽ അർത്ഥവത്താണ് എന്ന് കാണാൻ.\n",
"എല്ലായിപ്പോഴും ഏറ്റവും പ്രധാനപ്പെട്ട ഘട്ടം നമ്മുടെ ഡാറ്റയെ ഏതെങ്കിലും രൂപത്തിലാക്കി അതിൽ നിന്നും ഉള്ളടക്കം കണ്ടെത്തുന്നതാണ്. നമ്മുടെ കേസിൽ, ടെക്സ്റ്റിൽ നിന്നുള്ള കീവർഡുകൾ എടുക്കാനാണ് ലക്ഷ്യം, കൂടുതൽ പ്രാധാന്യമുള്ള കീവർഡുകൾ തിരഞ്ഞെടുക്കാനും.\n",
"\n",
"കീവേഡ് എക്സ്ട്രാക്ഷനായി നാം Python ലൈബ്രറി [RAKE](https://github.com/aneesha/RAKE) ഉപയോഗിക്കും. ആദ്യം, ഈ ലൈബ്രറി ഇല്ലെങ്കിൽ ഇൻസ്റ്റാൾ ചെയ്യാം:\n"
"കീവർഡ് എക്സ്ട്രാക്ഷൻ വേണ്ടി Python ലൈബ്രറി ആയ [RAKE](https://github.com/aneesha/RAKE) എന്നതുപയോഗിക്കും. ആദ്യം, ഈ ലൈബ്രറി ഇല്ലാതെ വരുമ്പോൾ ഇൻസ്റ്റാൾ ചെയ്ത് നോക്കിയിരിക്കാം:\n"
],
"metadata": {}
},
@ -172,7 +170,7 @@
{
"cell_type": "markdown",
"source": [
"പ്രധാന പ്രവർത്തനം `Rake` ഒബ്ജക്റ്റിൽ നിന്ന് ലഭ്യമാണ്, ഇത് നാം ചില പാരാമീറ്ററുകൾ ഉപയോഗിച്ച് ഇഷ്ടാനുസൃതമാക്കാം. നമ്മുടെ കേസിൽ, ഒരു കീവേഡിന്റെ കുറഞ്ഞ നീളം 5 അക്ഷരങ്ങളാക്കി, ഡോക്യുമെന്റിൽ ഒരു കീവേഡിന്റെ കുറഞ്ഞ ആവൃത്തി 3 ആയി, ഒരു കീവേഡിലെ പരമാവധി വാക്കുകളുടെ എണ്ണം 2 ആയി നമുക്ക് സജ്ജമാക്കാം. മറ്റ് മൂല്യങ്ങളുമായി പരീക്ഷിച്ച് ഫലം ശ്രദ്ധിക്കാം.\n"
"പ്രധാന പ്രവർത്തനം `Rake` ഒബ്ജക്റ്റിൽ നിന്ന് ലഭ്യമാണ്, ഞങ്ങൾ ചില പാരാമീറ്ററുകൾ ഉപയോഗിച്ച് അതിൽ അനുകൂലനം നടത്താൻ കഴിയും. ഞങ്ങളുടെ സാഹചര്യത്തിൽ, ഒരു കീവേർഡിന്റെ കുറഞ്ഞ ദൈർഘ്യം 5 അക്ഷരമാക്കി, ഒരു ഡോക്യുമെന്റിലെ കീവേർഡിന്റെ കുറഞ്ഞ ആവൃത്തി 3 ആയി, കീവേർഡിൽ ഏറ്റവും കൂടിയ വാക്കുകളുടെ എണ്ണം 2 ആയി നിശ്ചയിക്കും. മറ്റ് മൂല്യങ്ങളുമായി കളിച്ച് ഫലം അവലോകനം ചെയ്യുന്നതിൽ സ്വതന്ത്രരാകൂ.\n"
],
"metadata": {}
},
@ -354,11 +352,11 @@
"cell_type": "markdown",
"source": [
"\n",
"നാം ബന്ധപ്പെട്ട പ്രാധാന്യനിലവാരത്തോടുകൂടിയ പദങ്ങളുടെ ഒരു പട്ടിക ലഭിച്ചു. നിങ്ങൾക്ക് കാണാമല്ലോ, മെഷീൻ ലേണിംഗ്, ബിഗ് ഡാറ്റ തുടങ്ങിയ ഏറ്റവും പ്രസക്തമായ ശാസ്ത്രശാഖകൾ പട്ടികയിലെ മുകളിൽ സ്ഥാനങ്ങളിൽ ഉണ്ട്.\n",
"നാം ബന്ധപ്പെട്ട പ്രാധാന്യത്തോടുകൂടി ചില പദങ്ങളുടെ ഒരു പട്ടിക ലഭിച്ചു. നിങ്ങൾക്ക് കാണാൻ കഴിയുന്ന പോലെ, യന്ത്രം പഠനവും വലിയ ഡാറ്റയും പോലുള്ള ഏറ്റവും പ്രസക്തമായ വിഭാഗങ്ങൾ പട്ടികയുടെ മേൽത്തലങ്ങളിൽ ഉള്ളതാണ്.\n",
"\n",
"## ഘട്ടം 4: ഫലത്തിന്റെ ദൃശ്യവൽക്കരണം\n",
"## ഘട്ടം 4: ഫലങ്ങൾ കാഴ്ചവയ്ക്കൽ\n",
"\n",
"ജനങ്ങൾ ഡാറ്റയെ ഏറ്റവും നല്ല രീതിയിൽ ദൃശ്യരൂപത്തിൽ വ്യാഖ്യാനിക്കാം. അതിനാൽ ചില洞ങ്ങൾ കണ്ടെത്താൻ ഡാറ്റ ദൃശ്യവൽക്കരിക്കുന്നത് സാധാരണയായി ഉചിതമാണ്. പൈത്തണിലെ `matplotlib` ലൈബ്രറി ഉപയോഗിച്ച് കീവേഡുകളുടെ പ്രസക്തിയോടുകൂടിയ ലളിതമായ വിതരണത്തെ പ്ലോട്ട് ചെയ്യാം:\n"
"ദത്താവ് കലാകൃതിയുടെ രൂപത്തിൽ ഏറ്റവും നല്ലതായും ആളുകൾ ഡാറ്റ വിശദീകരിക്കുന്നു. അതിനാൽ ചില洞് മെച്ചപ്പെട്ട അടയാളങ്ങൾ കണ്ടെത്താൻ ഡാറ്റ കാഴ്ചവയ്ക്കുന്നത് സാധാരണയായി ഉപയോഗപ്രദമാണ്. ഇവർക്കായി അവരുടെ പ്രസക്തിയോടുകൂടിയ കീവേഡുകളുടെ ലളിതമായ വിതരണങ്ങൾ വരയ്ക്കാൻ നാം Python ലെ `matplotlib` ലൈബ്രറി ഉപയോഗിക്കാം:\n"
],
"metadata": {}
},
@ -393,7 +391,7 @@
{
"cell_type": "markdown",
"source": [
"എങ്കിലും, വാക്കുകളുടെ ആവൃത്തി കാണിക്കുന്നതിനുള്ള മറ്റൊരു മികച്ച മാർഗം ഉണ്ട് - **വേർഡ് ക്ലൗഡ്** ഉപയോഗിച്ച്. നമ്മുടെ കീവേഡ് ലിസ്റ്റിൽ നിന്ന് വേർഡ് ക്ലൗഡ് പ്ലോട്ട് ചെയ്യാൻ മറ്റൊരു ലൈബ്രറി ഇൻസ്റ്റാൾ ചെയ്യേണ്ടതുണ്ട്.\n"
"എങ്കിലും, പദങ്ങളുടെ ആവർത്തനങ്ങൾ കാണിക്കാൻ അതിനുവേണ്ടി ഒരു മെച്ചപ്പെട്ട മാർഗമാണ് - **വേഡ് ക്ലൗഡ്** ഉപയോഗിക്കുന്നത്. നമ്മുടെ കീവർഡ് പട്ടികയിൽ നിന്നുള്ള വേഡ് ക്ലൗഡ് ചിത്രീകരിക്കാൻ നമുക്ക് മറ്റൊരു ലൈബ്രറി ഇൻസ്റ്റാൾ ചെയ്യേണ്ടതുണ്ട്.\n"
],
"metadata": {}
},
@ -409,7 +407,7 @@
{
"cell_type": "markdown",
"source": [
"`WordCloud` ഒബ്ജക്റ്റ് യഥാർത്ഥ ടെക്സ്റ്റ് അല്ലെങ്കിൽ അവയുടെ ആവൃത്തി സഹിതം മുൻകൂട്ടി കണക്കാക്കിയ വാക്കുകളുടെ പട്ടിക സ്വീകരിച്ച്, ഒരു ചിത്രം തിരികെ നൽകുന്നതിന് ഉത്തരവാദിയാണ്, പിന്നീട് അത് `matplotlib` ഉപയോഗിച്ച് പ്രദർശിപ്പിക്കാം:\n"
"`WordCloud` объек്റ്റ് യഥാർത്ഥ ടെക്‌സ്‌റ്റ് അല്ലെങ്കിൽ പൂർവ്വ расчетത്തിൽ ഉള്ള പദങ്ങളുടെ പൈസ വേരിയുന്ന ലിസ്റ്റ് സ്വീകരിക്കാൻ ഉത്തരവാദിയാണ്, തുടർന്ന് ഒരു ചിത്രം തിരികെ നൽകുന്നു, അത് പിന്നീട് `matplotlib` ഉപയോഗിച്ച് പ്രദർശിപ്പിക്കാം:\n"
],
"metadata": {}
},
@ -442,7 +440,7 @@
{
"cell_type": "markdown",
"source": [
"നാം `WordCloud`-ലേക്ക് മൗലിക വാചകം കൂടി നൽകാം - നമുക്ക് സമാനമായ ഫലം ലഭിക്കുമോ എന്ന് നോക്കാം:\n"
"നാം യഥാർത്ഥ വാചകവും `WordCloud`-ൽ നൽകി കാണാം — സമാനമായ ഫലം ലഭിക്കുന്നുണ്ടോ എന്ന് നോക്കാം:\n"
],
"metadata": {}
},
@ -491,11 +489,11 @@
{
"cell_type": "markdown",
"source": [
"നിങ്ങൾക്ക് കാണാം വാക്ക് ക്ലൗഡ് ഇപ്പോൾ കൂടുതൽ ആകർഷകമായി തോന്നുന്നു, പക്ഷേ അതിൽ അനേകം ശബ്ദങ്ങൾ (ഉദാ. `Retrieved on` പോലുള്ള അസംബന്ധമായ വാക്കുകൾ) ഉൾക്കൊള്ളുന്നു. കൂടാതെ, രണ്ട് വാക്കുകൾ അടങ്ങിയ കുറവ് കീവർഡുകൾ ലഭിക്കുന്നു, ഉദാ. *data scientist*, അല്ലെങ്കിൽ *computer science*. ഇത് കാരണം RAKE ആൽഗോരിതം ടെക്സ്റ്റിൽ നിന്ന് നല്ല കീവർഡുകൾ തിരഞ്ഞെടുക്കുന്നതിൽ വളരെ മികച്ച ജോലി ചെയ്യുന്നു. ഈ ഉദാഹരണം ഡാറ്റ പ്രീ-പ്രോസസ്സിംഗ്, ക്ലീനിംഗ് എന്നിവയുടെ പ്രാധാന്യ വ്യക്തമാക്കുന്നു, കാരണം അവസാനം ലഭിക്കുന്ന വ്യക്തമായ ചിത്രം നമുക്ക് മികച്ച തീരുമാനങ്ങൾ എടുക്കാൻ സഹായിക്കും.\n",
"നിങ്ങൾക്ക് දැන් വാക്ക് ക്ലൗഡ് കൂടുതൽ ആകര്‍ഷകമാണ് എന്ന് കാണാനാകും, പക്ഷേ അതിൽ വളരെ ശബ്ദം കൂടുതലായി ഉണ്ടാകുന്നു (ഉദാ. `Retrieved on` പോലുള്ള ബന്ധപ്പെട്ടില്ലാത്ത വാക്കുകൾ). കൂടാതെ, രണ്ട് വാക്കുകളുള്ള കീവാക്കുകൾ, ഉദാഹരണത്തിന് *data scientist* അല്ലെങ്കിൽ *computer science* പോലുള്ളവ കുറവാണ് ലഭിക്കുന്നത്. ഇത് കാരണം RAKE ആൽഗോർവിഥം ടെക്സ്റ്റിൽ നിന്ന് മികച്ച കീവാക്കുകൾ തിരഞ്ഞെടുക്കുന്നതിൽ വളരെ നല്ല പ്രകടനം കാഴ്‌ചവയ്ക്കുന്നു. ഡാറ്റ പ്രീ-പ്രോസസ്സിംഗ്, ക്ലീനിങ്ങിന്റെ പ്രാധാന്യം ഈ ഉദാഹരണ വ്യക്തമാക്കുന്നു, കാരണം അവസാനം ലഭിക്കുന്ന വ്യക്തമായ ചിത്രം നല്ല തീരുമാനം എടുക്കാൻ സഹായിക്കും.\n",
"\n",
"ഈ അഭ്യാസത്തിൽ നാം വിക്കിപീഡിയ ടെക്സ്റ്റിൽ നിന്ന് അർത്ഥം എടുക്കാനുള്ള ഒരു ലളിതമായ പ്രക്രിയയിലൂടെ കടന്നുപോയി, കീവർഡുകളും വാക്ക് ക്ലൗഡും രൂപത്തിൽ. ഈ ഉദാഹരണം വളരെ ലളിതമാണ്, പക്ഷേ ഡാറ്റ സയന്റിസ്റ്റ് ഡാറ്റ കൈകാര്യം ചെയ്യുമ്പോൾ സ്വീകരിക്കുന്ന എല്ലാ സാധാരണ ഘട്ടങ്ങളും നന്നായി പ്രദർശിപ്പിക്കുന്നു, ഡാറ്റ സമാഹരണത്തിൽ നിന്ന് ആരംഭിച്ച് ദൃശ്യവൽക്കരണത്തിലേക്ക് വരെ.\n",
"ഈ പരിശീലനത്തിൽ വിക്കിപೀഡിയാ ടെക്സ്റ്റിൽ നിന്ന് ചില അര്‍ത്ഥമുണ്ടാക്കുന്നതിന്റെ ലളിതമായ പ്രക്രിയ, കീവാക്കുകളും വാക്ക് ക്ലൗഡും രൂപത്തിലാക്കുന്നതിലൂടെ, നാം ചെറുതായി കൂടി പരിശോധിച്ചു. ഇത് വളരെ ലളിതമാണ്, എന്നാൽ ഡാറ്റ സയന്റിസ്റ്റ് ഡാറ്റ കൈകാര്യം ചെയ്യുമ്പോൾ സ്വീകരിക്കുന്ന എല്ലാ സാധാരണ നടപടികൾ კარგად പ്രതിപാദിക്കുന്നു, ഡാറ്റ ലഭ്യമാക്കലിൽ നിന്ന് visualization വരെ.\n",
"\n",
"നമ്മുടെ കോഴ്സിൽ നാം ആ ഘട്ടങ്ങളെല്ലാം വിശദമായി ചർച്ച ചെയ്യും.\n"
"നമ്മുടെ കോഴ്സിൽ നാം ആ എല്ലാ ഘട്ടങ്ങളും വിശദമായി പരിശോധിക്കും.\n"
],
"metadata": {}
},
@ -503,7 +501,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാനുഭവക്കുറിപ്പ്**: \nഈ രേഖ AI തർജ്ജമ സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് തർജ്ജമ ചെയ്തു. ഞങ്ങൾ കൃത്യതയുണ്ടാക്കാന努ർശിക്കുന്നതായിരുന്നാലും, സ്വയംക്രമിത തർജ്ജമകൾക്ക് പിഴവുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. മാർഗ്ഗനിർദ്ദേശകായ രേഖ അതിന്റെ സ്വന്തം ഭാഷയിൽ യഥാർത്ഥ പരിശീലനമൂലം ആയി നിലനിൽക്കണം. പ്രധാനപ്പെട്ട വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യതർജ്ജമ നിർദ്ദേശിക്കുന്നു. ഈ തർജ്ജമയുടെ ഉപയോഗത്തിൽ നിന്നുള്ള ഏതെങ്കിലും തെറ്റായ മനസ്സിലാക്കലുകൾക്കും വ്യാഖ്യാനം പിഴവുകൾക്കും നാം ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
@ -527,12 +525,6 @@
},
"interpreter": {
"hash": "86193a1ab0ba47eac1c69c1756090baa3b420b3eea7d4aafab8b85f8b312f0c5"
},
"coopTranslator": {
"original_hash": "dbdf34788efab64e5d817f1df38965a8",
"translation_date": "2025-12-19T17:07:29+00:00",
"source_file": "1-Introduction/01-defining-data-science/solution/notebook.ipynb",
"language_code": "ml"
}
},
"nbformat": 4,

@ -6,7 +6,7 @@
സാംഖ്യശാസ്ത്രവും സാദ്ധ്യത സിദ്ധാന്തവും ഗണിതശാസ്ത്രത്തിന്റെ രണ്ട് വളരെ ബന്ധപ്പെട്ട മേഖലകളാണ്, ഇവ ഡാറ്റാ സയൻസിനോട് വളരെ ബന്ധപ്പെട്ടവയാണ്. ഗണിതശാസ്ത്രത്തിന്റെ ആഴത്തിലുള്ള അറിവില്ലാതെ ഡാറ്റയുമായി പ്രവർത്തിക്കുന്നത് സാധ്യമാണ്, പക്ഷേ കുറഞ്ഞത് ചില അടിസ്ഥാന ആശയങ്ങൾ അറിയുന്നത് മെച്ചമാണ്. ഇവിടെ നിങ്ങൾക്ക് ആരംഭിക്കാൻ സഹായിക്കുന്ന ഒരു ചെറിയ പരിചയം നൽകുന്നു.
[![Intro Video](../../../../translated_images/ml/video-prob-and-stats.e4282e5efa2f2543400843ed98b1057065c9600cebfc8a728e8931b5702b2ae4.png)](https://youtu.be/Z5Zy85g4Yjw)
[![Intro Video](../../../../translated_images/ml/video-prob-and-stats.e4282e5efa2f2543.webp)](https://youtu.be/Z5Zy85g4Yjw)
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/6)
@ -31,7 +31,7 @@
ഒരു ചാരത്രം ഒരു നൽകിയ മൂല്യ പരിധിയിൽപ്പെടുന്ന സാദ്ധ്യതയെക്കുറിച്ച് മാത്രമേ സംസാരിക്കാനാകൂ, ഉദാഹരണത്തിന് P(t<sub>1</sub>&le;X&lt;t<sub>2</sub>). ഈ സാഹചര്യത്തിൽ, സാദ്ധ്യത വിതരണം **സാദ്ധ്യത സാന്ദ്രത ഫംഗ്ഷൻ** p(x) ഉപയോഗിച്ച് വിവരിക്കപ്പെടുന്നു, അതായത്
![P(t_1\le X<t_2)=\int_{t_1}^{t_2}p(x)dx](../../../../translated_images/ml/probability-density.a8aad29f17a14afb519b407c7b6edeb9f3f9aa5f69c9e6d9445f604e5f8a2bf7.png)
![P(t_1\le X<t_2)=\int_{t_1}^{t_2}p(x)dx](../../../../translated_images/ml/probability-density.a8aad29f17a14afb.webp)
യൂണിഫോം വിതരണത്തിന്റെ കണ്ടിന്യൂവസ് അനലോഗ് **കണ്ടിന്യൂവസ് യൂണിഫോം** എന്നാണ് വിളിക്കുന്നത്, ഇത് ഒരു പരിധിയിലായി നിർവചിക്കപ്പെടുന്നു. മൂല്യം X ഒരു l നീളമുള്ള ഇടവേളയിൽപ്പെടാനുള്ള സാദ്ധ്യത l-നോട് അനുപാതികമാണ്, കൂടാതെ 1 വരെ ഉയരും.
@ -56,7 +56,7 @@
ഗ്രാഫിക് ആയി, മീഡിയനും ക്വാർട്ടൈൽസും തമ്മിലുള്ള ബന്ധം **ബോക്സ് പ്ലോട്ട്** എന്ന ചിത്രരൂപത്തിൽ പ്രതിനിധീകരിക്കാം:
<img src="../../../../translated_images/ml/boxplot_explanation.4039b7de08780fd493ef798b41f7291d753f1f84de8955645f00c586e65f16a3.png" alt="Box Plot Explanation" width="50%">
<img src="../../../../translated_images/ml/boxplot_explanation.4039b7de08780fd4.webp" alt="Box Plot Explanation" width="50%">
ഇവിടെ **ഇന്റർ-ക്വാർട്ടൈൽ റേഞ്ച്** IQR=Q3-Q1 കണക്കാക്കുന്നു, കൂടാതെ **ഔട്ട്‌ലൈയേഴ്സ്** - [Q1-1.5*IQR, Q3+1.5*IQR] എന്ന പരിധിക്ക് പുറത്തുള്ള മൂല്യങ്ങൾ.
@ -74,11 +74,11 @@
ഇവിടെ നമ്മുടെ ഡാറ്റയുടെ ശരാശരി, മീഡിയൻ, ക്വാർട്ടൈൽസ് കാണിക്കുന്ന ബോക്സ് പ്ലോട്ട്:
![Weight Box Plot](../../../../translated_images/ml/weight-boxplot.1dbab1c03af26f8a008fff4e17680082c8ab147d6df646cbac440bbf8f5b9c42.png)
![Weight Box Plot](../../../../translated_images/ml/weight-boxplot.1dbab1c03af26f8a.webp)
നമ്മുടെ ഡാറ്റയിൽ വിവിധ കളിക്കാരുടെ **പങ്കുകൾ** സംബന്ധിച്ച വിവരങ്ങൾ ഉള്ളതിനാൽ, പങ്ക് അനുസരിച്ച് ബോക്സ് പ്ലോട്ട് ചെയ്യാം - ഇത് പങ്കുകൾക്കിടയിലെ പാരാമീറ്റർ മൂല്യങ്ങൾ എങ്ങനെ വ്യത്യസ്തമാണെന്ന് മനസ്സിലാക്കാൻ സഹായിക്കും. ഈ തവണ ഉയരം പരിഗണിക്കാം:
![Box plot by role](../../../../translated_images/ml/boxplot_byrole.036b27a1c3f52d42f66fba2324ec5cde0a1bca6a01a619eeb0ce7cd054b2527b.png)
![Box plot by role](../../../../translated_images/ml/boxplot_byrole.036b27a1c3f52d42.webp)
ഈ ചിത്രരൂപം സൂചിപ്പിക്കുന്നത്, ശരാശരിയിൽ, ഫസ്റ്റ് ബേസ്മാന്റെ ഉയരം സെക്കന്റ് ബേസ്മാന്റെ ഉയരത്തേക്കാൾ കൂടുതലാണെന്ന്. ഈ പാഠത്തിൽ പിന്നീട് നാം ഈ ഹിപോത്തസിസ് കൂടുതൽ ഔപചാരികമായി പരിശോധിക്കുന്നതും, നമ്മുടെ ഡാറ്റ സാംഖ്യശാസ്ത്രപരമായി പ്രാധാന്യമുള്ളതാണെന്ന് തെളിയിക്കുന്നതും പഠിക്കും.
@ -86,7 +86,7 @@
നമ്മുടെ ഡാറ്റയുടെ വിതരണമോ എന്താണെന്ന് കാണാൻ, **ഹിസ്റ്റോഗ്രാം** എന്ന ഗ്രാഫ് വരച്ചിടാം. X-അക്ഷത്തിൽ വ്യത്യസ്ത ഭാര ഇടവേളകൾ (അഥവാ **ബിൻസ്**) കാണിക്കും, ലംബ അക്ഷത്തിൽ ആ ഇടവേളയിൽ നമ്മുടെ യാദൃച്ഛിക ചാരത്രം എത്ര തവണപ്പെട്ടുവെന്ന് കാണിക്കും.
![Histogram of real world data](../../../../translated_images/ml/weight-histogram.bfd00caf7fc30b145b21e862dba7def41c75635d5280de25d840dd7f0b00545e.png)
![Histogram of real world data](../../../../translated_images/ml/weight-histogram.bfd00caf7fc30b14.webp)
ഈ ഹിസ്റ്റോഗ്രാമിൽ നിന്ന് കാണാം എല്ലാ മൂല്യങ്ങളും ഒരു ശരാശരി ഭാരം ചുറ്റും കേന്ദ്രീകരിച്ചിരിക്കുന്നു, ആ ഭാരം വിട്ട് ദൂരെ പോകുമ്പോൾ ആ മൂല്യത്തിന്റെ ഭാരങ്ങൾ കുറവാണ്. അഥവാ, ഒരു ബേസ്ബോൾ കളിക്കാരന്റെ ഭാരം ശരാശരി ഭാരത്തിൽ നിന്ന് വളരെ വ്യത്യസ്തമായിരിക്കാനുള്ള സാധ്യത വളരെ കുറവാണ്. ഭാരങ്ങളുടെ വ്യതിയാനം ശരാശരി മുതൽ വ്യത്യാസം എത്രത്തോളം ഉണ്ടാകാമെന്ന് കാണിക്കുന്നു.
@ -103,7 +103,7 @@ samples = np.random.normal(mean,std,1000)
സൃഷ്ടിച്ച സാമ്പിളുകളുടെ ഹിസ്റ്റോഗ്രാം വരച്ചാൽ മുകളിൽ കാണിച്ച ചിത്രത്തിന് സമാനമായ ചിത്രം കാണാം. സാമ്പിളുകളുടെ എണ്ണം കൂടുകയും ബിൻസിന്റെ എണ്ണം കൂടുകയും ചെയ്താൽ, നോർമൽ വിതരണത്തിന്റെ ഒരു കൂടുതൽ ഐഡിയൽ ചിത്രം സൃഷ്ടിക്കാം:
![Normal Distribution with mean=0 and std.dev=1](../../../../translated_images/ml/normal-histogram.dfae0d67c202137d552d0015fb87581eca263925e512404f3c12d8885315432e.png)
![Normal Distribution with mean=0 and std.dev=1](../../../../translated_images/ml/normal-histogram.dfae0d67c202137d.webp)
*ശരാശരി=0, സ്റ്റാൻഡേർഡ് ഡിവിയേഷൻ=1 ഉള്ള നോർമൽ വിതരണം*
@ -222,7 +222,7 @@ array([[1. , 0.52959196],
നമ്മുടെ കേസിൽ, 0.53 എന്ന മൂല്യം ഒരു വ്യക്തിയുടെ ഭാരം, ഉയരം എന്നിവ തമ്മിൽ ചില കോറിലേഷൻ ഉണ്ടെന്ന് സൂചിപ്പിക്കുന്നു. നാം ഒരു മൂല്യം മറ്റൊന്നിനെതിരെ സ്കാറ്റർ പ്ലോട്ട് ഉണ്ടാക്കുകയും ബന്ധം ദൃശ്യമായി കാണുകയും ചെയ്യാം:
![ഭാരം, ഉയരം തമ്മിലുള്ള ബന്ധം](../../../../translated_images/ml/weight-height-relationship.3f06bde4ca2aba9974182c4ef037ed602acd0fbbbbe2ca91cefd838a9e66bcf9.png)
![ഭാരം, ഉയരം തമ്മിലുള്ള ബന്ധം](../../../../translated_images/ml/weight-height-relationship.3f06bde4ca2aba99.webp)
> കോറിലേഷൻ, കോവേറിയൻസ് എന്നിവയുടെ കൂടുതൽ ഉദാഹരണങ്ങൾ [സഹായക നോട്ട്‌ബുക്കിൽ](notebook.ipynb) കാണാം.

@ -1,6 +1,6 @@
# ഡാറ്റാ സയൻസിലേക്ക് പരിചയം
![data in action](../../../translated_images/ml/data.48e22bb7617d8d92188afbc4c48effb920ba79f5cebdc0652cd9f34bbbd90c18.jpg)
![data in action](../../../translated_images/ml/data.48e22bb7617d8d92.webp)
> ഫോട്ടോ <a href="https://unsplash.com/@dawson2406?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">സ്റ്റീഫൻ ഡോസൺ</a> <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">അൺസ്പ്ലാഷിൽ</a>
ഈ പാഠങ്ങളിൽ, ഡാറ്റാ സയൻസ് എങ്ങനെ നിർവചിക്കപ്പെടുന്നു എന്ന് നിങ്ങൾ കണ്ടെത്തും, ഒരു ഡാറ്റാ സയന്റിസ്റ്റ് പരിഗണിക്കേണ്ട നൈതിക കാര്യങ്ങളെക്കുറിച്ച് പഠിക്കും. ഡാറ്റ എങ്ങനെ നിർവചിക്കപ്പെടുന്നു എന്നും, ഡാറ്റാ സയൻസിന്റെ മേധാവി അക്കാദമിക് മേഖലകളായ സ്ഥിതിവിവരശാസ്ത്രവും സാദ്ധ്യതയും കുറിച്ച് കുറച്ച് പഠിക്കും.

@ -12,7 +12,7 @@
സ്പ്രെഡ്‌ഷീറ്റുകൾ ഡാറ്റ സംഭരിക്കാനും പരിശോധിക്കാനും പ്രചാരത്തിലുള്ള മാർഗമാണ്, കാരണം സജ്ജീകരിക്കാനും ആരംഭിക്കാനും കുറച്ച് ശ്രമം മാത്രം ആവശ്യമാണ്. ഈ പാഠത്തിൽ നിങ്ങൾ സ്പ്രെഡ്‌ഷീറ്റിന്റെ അടിസ്ഥാന ഘടകങ്ങളും ഫോർമുലകളും ഫംഗ്ഷനുകളും പഠിക്കും. ഉദാഹരണങ്ങൾ മൈക്രോസോഫ്റ്റ് എക്സെലിൽ കാണിക്കും, പക്ഷേ മറ്റ് സ്പ്രെഡ്‌ഷീറ്റ് സോഫ്റ്റ്‌വെയറുകളുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ പല ഭാഗങ്ങളും വിഷയങ്ങളും സമാനമായ പേരുകളും ഘട്ടങ്ങളും ഉണ്ടാകും.
![രണ്ട് വർക്ക്‌ഷീറ്റുകളുള്ള ഒരു ശൂന്യമായ മൈക്രോസോഫ്റ്റ് എക്സെൽ വർക്ക്‌ബുക്ക്](../../../../translated_images/ml/parts-of-spreadsheet.120711c82aa18a45c3e62a491a15bba0a31ab0e9db407ec022702fed8ffd89bf.png)
![രണ്ട് വർക്ക്‌ഷീറ്റുകളുള്ള ഒരു ശൂന്യമായ മൈക്രോസോഫ്റ്റ് എക്സെൽ വർക്ക്‌ബുക്ക്](../../../../translated_images/ml/parts-of-spreadsheet.120711c82aa18a45.webp)
ഒരു സ്പ്രെഡ്‌ഷീറ്റ് ഒരു ഫയലാണ്, ഇത് കമ്പ്യൂട്ടർ, ഉപകരണം, അല്ലെങ്കിൽ ക്ലൗഡ് അടിസ്ഥാനമാക്കിയ ഫയൽ സിസ്റ്റത്തിൽ ലഭ്യമാണ്. സോഫ്റ്റ്‌വെയർ ബ്രൗസർ അടിസ്ഥാനമോ കമ്പ്യൂട്ടറിൽ ഇൻസ്റ്റാൾ ചെയ്യേണ്ട ആപ്ലിക്കേഷനോ ആപ്പ് ഡൗൺലോഡ് ചെയ്യേണ്ടതായിരിക്കാം. എക്സെലിൽ ഈ ഫയലുകൾ **വർക്ക്‌ബുക്കുകൾ** എന്നറിയപ്പെടുന്നു, ഈ പദം ഈ പാഠത്തിന്റെ ശേഷിക്കുന്ന ഭാഗത്ത് ഉപയോഗിക്കും.
@ -24,11 +24,11 @@
"InventoryExample" എന്ന പേരിലുള്ള സ്പ്രെഡ്‌ഷീറ്റ് ഫയൽ ഒരു ഇൻവെന്ററിയിലുള്ള വസ്തുക്കളുടെ ഫോർമാറ്റ് ചെയ്ത സ്പ്രെഡ്‌ഷീറ്റാണ്, ഇതിൽ മൂന്ന് വർക്ക്‌ഷീറ്റുകൾ ഉണ്ട്, ടാബുകൾ "Inventory List", "Inventory Pick List" , "Bin Lookup" എന്നിങ്ങനെയാണ് ലേബൽ ചെയ്തിരിക്കുന്നത്. Inventory List വർക്ക്‌ഷീറ്റിലെ 4-ആം വരി ഹെഡറാണ്, ഹെഡർ കോളത്തിലെ ഓരോ സെല്ലിന്റെ മൂല്യം വിവരിക്കുന്നു.
![മൈക്രോസോഫ്റ്റ് എക്സെലിൽ ഒരു ഉദാഹരണ ഇൻവെന്ററി ലിസ്റ്റിൽ ഹൈലൈറ്റ് ചെയ്ത ഫോർമുല](../../../../translated_images/ml/formula-excel.ad1068c220892f5ead570d12f2394897961d31a5043a1dd4e6fc5d7690c7a14e.png)
![മൈക്രോസോഫ്റ്റ് എക്സെലിൽ ഒരു ഉദാഹരണ ഇൻവെന്ററി ലിസ്റ്റിൽ ഹൈലൈറ്റ് ചെയ്ത ഫോർമുല](../../../../translated_images/ml/formula-excel.ad1068c220892f5e.webp)
ഒരു സെൽ മറ്റൊരു സെല്ലുകളുടെ മൂല്യങ്ങളിൽ ആശ്രയിച്ചിരിക്കാം അതിന്റെ മൂല്യം നിർമിക്കാൻ. Inventory List സ്പ്രെഡ്‌ഷീറ്റ് ഇൻവെന്ററിയിലെ ഓരോ വസ്തുവിന്റെ ചെലവ് ട്രാക്ക് ചെയ്യുന്നു, പക്ഷേ ഇൻവെന്ററിയിലെ എല്ലാം മൂല്യം അറിയേണ്ടതുണ്ടെങ്കിൽ? [**ഫോർമുലകൾ**](https://support.microsoft.com/en-us/office/overview-of-formulas-34519a4e-1e8d-4f4b-84d4-d642c4f63263) സെൽ ഡാറ്റയിൽ പ്രവർത്തനങ്ങൾ നടത്തുന്നു, ഈ ഉദാഹരണത്തിൽ ഇൻവെന്ററിയുടെ ചെലവ് കണക്കാക്കാൻ ഉപയോഗിക്കുന്നു. ഈ സ്പ്രെഡ്‌ഷീറ്റിൽ Inventory Value കോളത്തിൽ ഒരു ഫോർമുല ഉപയോഗിച്ച് ഓരോ വസ്തുവിന്റെ മൂല്യം കണക്കാക്കുന്നു, QTY ഹെഡറിന്റെ കീഴിലുള്ള അളവും COST ഹെഡറിന്റെ കീഴിലുള്ള ചെലവും ഗുണിച്ച്. ഒരു സെൽ ഡബിൾ ക്ലിക്കുചെയ്യുകയോ ഹൈലൈറ്റ് ചെയ്യുകയോ ചെയ്താൽ ഫോർമുല കാണാം. ഫോർമുലകൾ സമം ചിഹ്നത്തോടെ ആരംഭിക്കുന്നു, തുടർന്ന് കണക്കുകൂട്ടൽ അല്ലെങ്കിൽ പ്രവർത്തനം വരുന്നു.
![മൈക്രോസോഫ്റ്റ് എക്സെലിൽ ഒരു ഉദാഹരണ ഇൻവെന്ററി ലിസ്റ്റിൽ ഹൈലൈറ്റ് ചെയ്ത ഫംഗ്ഷൻ](../../../../translated_images/ml/function-excel.be2ae4feddc10ca089f3d4363040d93b7fd046c8d4f83ba975ec46483ee99895.png)
![മൈക്രോസോഫ്റ്റ് എക്സെലിൽ ഒരു ഉദാഹരണ ഇൻവെന്ററി ലിസ്റ്റിൽ ഹൈലൈറ്റ് ചെയ്ത ഫംഗ്ഷൻ](../../../../translated_images/ml/function-excel.be2ae4feddc10ca0.webp)
നാം മറ്റൊരു ഫോർമുല ഉപയോഗിച്ച് Inventory Value യിലെ എല്ലാ മൂല്യങ്ങളും കൂട്ടിച്ചേർത്ത് ആകെ മൂല്യം കണ്ടെത്താം. ഓരോ സെലും കൂട്ടിച്ചേർക്കുന്നത് ഒരു ബുദ്ധിമുട്ടുള്ള ജോലി ആകാം. എക്സെലിൽ [**ഫംഗ്ഷനുകൾ**](https://support.microsoft.com/en-us/office/sum-function-043e1c7d-7726-4e80-8f32-07b23e057f89) ഉണ്ട്, സെൽ മൂല്യങ്ങളിൽ കണക്കുകൂട്ടലുകൾ നടത്താൻ മുൻകൂട്ടി നിർവചിച്ച ഫോർമുലകൾ. ഫംഗ്ഷനുകൾക്ക് ആർഗ്യുമെന്റുകൾ ആവശ്യമുണ്ട്, കണക്കുകൂട്ടലുകൾ നടത്താൻ ആവശ്യമായ മൂല്യങ്ങൾ. ഫംഗ്ഷനുകൾക്ക് ഒരിലധികം ആർഗ്യുമെന്റുകൾ ആവശ്യമെങ്കിൽ, അവ ഒരു പ്രത്യേക ക്രമത്തിൽ ലിസ്റ്റ് ചെയ്യണം അല്ലെങ്കിൽ ഫംഗ്ഷൻ ശരിയായ മൂല്യം കണക്കാക്കില്ല. ഈ ഉദാഹരണത്തിൽ SUM ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു, Inventory Value യിലെ മൂല്യങ്ങൾ ആർഗ്യുമെന്റായി ഉപയോഗിച്ച് B3 (3-ആം വരി, B കോളം) ൽ ആകെ മൂല്യം കണക്കാക്കുന്നു.
@ -36,17 +36,17 @@
NoSQL എന്നത് നോൺ-റിലേഷണൽ ഡാറ്റ സംഭരിക്കുന്ന വ്യത്യസ്ത മാർഗങ്ങൾക്കുള്ള ഒരു പൊതുവായ പദമാണ്, ഇത് "non-SQL", "non-relational" അല്ലെങ്കിൽ "not only SQL" എന്നർത്ഥത്തിൽ വ്യാഖ്യാനിക്കാം. ഈ തരം ഡാറ്റാബേസ് സിസ്റ്റങ്ങൾ 4 തരം ആയി വർഗ്ഗീകരിക്കാം.
![കീ-വാല്യു ഡാറ്റ സ്റ്റോർ കാണിക്കുന്ന 4 വ്യത്യസ്ത സംഖ്യാത്മക കീകൾ 4 വ്യത്യസ്ത മൂല്യങ്ങളുമായി ബന്ധിപ്പിച്ചിരിക്കുന്ന ഗ്രാഫിക്കൽ പ്രതിനിധാനം](../../../../translated_images/ml/kv-db.e8f2b75686bbdfcba0c827b9272c10ae0821611ea0fe98429b9d13194383afa6.png)
![കീ-വാല്യു ഡാറ്റ സ്റ്റോർ കാണിക്കുന്ന 4 വ്യത്യസ്ത സംഖ്യാത്മക കീകൾ 4 വ്യത്യസ്ത മൂല്യങ്ങളുമായി ബന്ധിപ്പിച്ചിരിക്കുന്ന ഗ്രാഫിക്കൽ പ്രതിനിധാനം](../../../../translated_images/ml/kv-db.e8f2b75686bbdfcb.webp)
> സ്രോതസ്സ്: [Michał Białecki Blog](https://www.michalbialecki.com/2018/03/18/azure-cosmos-db-key-value-database-cloud/)
[കീ-വാല്യു](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#keyvalue-data-stores) ഡാറ്റാബേസുകൾ വ്യത്യസ്ത മൂല്യങ്ങളുമായി ബന്ധപ്പെട്ട ഒരു പ്രത്യേക കീ (അനന്യ തിരിച്ചറിയൽ) യെ ജോഡിക്കുന്നു. ഈ ജോഡികൾ [ഹാഷ് ടേബിൾ](https://www.hackerearth.com/practice/data-structures/hash-tables/basics-of-hash-tables/tutorial/) ഉപയോഗിച്ച് അനുയോജ്യമായ ഹാഷിംഗ് ഫംഗ്ഷൻ ഉപയോഗിച്ച് സംഭരിക്കുന്നു.
![പേര്, താൽപ്പര്യങ്ങൾ, സ്ഥലങ്ങൾ എന്നിവ തമ്മിലുള്ള ബന്ധങ്ങൾ കാണിക്കുന്ന ഗ്രാഫ് ഡാറ്റ സ്റ്റോർ ഗ്രാഫിക്കൽ പ്രതിനിധാനം](../../../../translated_images/ml/graph-db.d13629152f79a9dac895b20fa7d841d4d4d6f6008b1382227c3bbd200fd4cfa1.png)
![പേര്, താൽപ്പര്യങ്ങൾ, സ്ഥലങ്ങൾ എന്നിവ തമ്മിലുള്ള ബന്ധങ്ങൾ കാണിക്കുന്ന ഗ്രാഫ് ഡാറ്റ സ്റ്റോർ ഗ്രാഫിക്കൽ പ്രതിനിധാനം](../../../../translated_images/ml/graph-db.d13629152f79a9da.webp)
> സ്രോതസ്സ്: [Microsoft](https://docs.microsoft.com/en-us/azure/cosmos-db/graph/graph-introduction#graph-database-by-example)
[ഗ്രാഫ്](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#graph-data-stores) ഡാറ്റാബേസുകൾ ഡാറ്റയിലെ ബന്ധങ്ങൾ വിവരിക്കുന്നു, ഇത് നോഡുകളും എഡ്ജുകളും അടങ്ങിയ ഒരു ശേഖരമായി പ്രതിനിധീകരിക്കുന്നു. ഒരു നോഡ് ഒരു സত্ত്വത്തെ പ്രതിനിധീകരിക്കുന്നു, ഉദാഹരണത്തിന് ഒരു വിദ്യാർത്ഥി അല്ലെങ്കിൽ ബാങ്ക് സ്റ്റേറ്റ്മെന്റ് പോലുള്ള യാഥാർത്ഥ്യത്തിൽ ഉള്ള ഒന്നും. എഡ്ജുകൾ രണ്ട് സത്ത്വങ്ങൾ തമ്മിലുള്ള ബന്ധം പ്രതിനിധീകരിക്കുന്നു. ഓരോ നോഡിനും എഡ്ജിനും അവയുടെ അധിക വിവരങ്ങൾ നൽകുന്ന പ്രോപ്പർട്ടികൾ ഉണ്ട്.
![ഐഡന്റിറ്റി, കോൺടാക്റ്റ് ഇൻഫോ എന്നീ രണ്ട് കോളം ഫാമിലികൾ ഉള്ള ഒരു കസ്റ്റമർ ഡാറ്റാബേസ് കാണിക്കുന്ന കോളമ്നാർ ഡാറ്റ സ്റ്റോർ ഗ്രാഫിക്കൽ പ്രതിനിധാനം](../../../../translated_images/ml/columnar-db.ffcfe73c3e9063a8c8f93f8ace85e1200863584b1e324eb5159d8ca10f62ec04.png)
![ഐഡന്റിറ്റി, കോൺടാക്റ്റ് ഇൻഫോ എന്നീ രണ്ട് കോളം ഫാമിലികൾ ഉള്ള ഒരു കസ്റ്റമർ ഡാറ്റാബേസ് കാണിക്കുന്ന കോളമ്നാർ ഡാറ്റ സ്റ്റോർ ഗ്രാഫിക്കൽ പ്രതിനിധാനം](../../../../translated_images/ml/columnar-db.ffcfe73c3e9063a8.webp)
[കോളമ്നാർ](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#columnar-data-stores) ഡാറ്റ സ്റ്റോറുകൾ ഡാറ്റയെ കോളങ്ങളും വരികളും ആയി ക്രമീകരിക്കുന്നു, റിലേഷണൽ ഡാറ്റ ഘടന പോലെയാണ്, പക്ഷേ ഓരോ കോളവും കോളം ഫാമിലി എന്ന ഗ്രൂപ്പുകളായി വിഭജിച്ചിരിക്കുന്നു, ഒരു കോളത്തിലെ എല്ലാ ഡാറ്റയും ബന്ധപ്പെട്ടതാണ്, ഒറ്റ യൂണിറ്റായി തിരികെ ലഭിക്കാനും മാറ്റാനും കഴിയും.
@ -79,11 +79,11 @@ Cosmos DB ഡാറ്റാബേസ് "Not Only SQL" എന്ന നിർ
എമുലേറ്റർ ഒരു ബ്രൗസർ വിൻഡോ തുറക്കും, എക്സ്പ്ലോറർ വ്യൂ ഡോക്യുമെന്റുകൾ പരിശോധിക്കാൻ അനുവദിക്കുന്നു.
![Cosmos DB എമുലേറ്ററിന്റെ എക്സ്പ്ലോറർ വ്യൂ](../../../../translated_images/ml/cosmosdb-emulator-explorer.a1c80b1347206fe2f30f88fc123821636587d04fc5a56a9eb350c7da6b31f361.png)
![Cosmos DB എമുലേറ്ററിന്റെ എക്സ്പ്ലോറർ വ്യൂ](../../../../translated_images/ml/cosmosdb-emulator-explorer.a1c80b1347206fe2.webp)
നിങ്ങൾ പിന്തുടരുകയാണെങ്കിൽ, "Start with Sample" ക്ലിക്കുചെയ്യുക, SampleDB എന്ന സാമ്പിൾ ഡാറ്റാബേസ് സൃഷ്ടിക്കും. Sample DB-നെ ആർക്കോ ക്ലിക്കുചെയ്ത് വിപുലീകരിച്ചാൽ `Persons` എന്ന കണ്ടെയ്‌നർ കാണാം, കണ്ടെയ്‌നർ ഒരു വസ്തുക്കളുടെ ശേഖരമാണ്, ഇവ ഡോക്യുമെന്റുകളാണ്. `Items` എന്നതിൽ നാല് വ്യക്തിഗത ഡോക്യുമെന്റുകൾ പരിശോധിക്കാം.
![Cosmos DB എമുലേറ്ററിൽ സാമ്പിൾ ഡാറ്റ പരിശോധിക്കൽ](../../../../translated_images/ml/cosmosdb-emulator-persons.bf640586a7077c8985dfd3071946465c8e074c722c7c202d6d714de99a93b90a.png)
![Cosmos DB എമുലേറ്ററിൽ സാമ്പിൾ ഡാറ്റ പരിശോധിക്കൽ](../../../../translated_images/ml/cosmosdb-emulator-persons.bf640586a7077c89.webp)
#### Cosmos DB എമുലേറ്റർ ഉപയോഗിച്ച് ഡോക്യുമെന്റ് ഡാറ്റ ക്വറി ചെയ്യൽ
@ -93,7 +93,7 @@ Cosmos DB ഡാറ്റാബേസ് "Not Only SQL" എന്ന നിർ
`SELECT * FROM c where c.age < 40`
![Cosmos DB എമുലേറ്ററിൽ SELECT ക്വറി പ്രവർത്തിപ്പിച്ച് പ്രായം 40-ൽ താഴെയുള്ള ഡോക്യുമെന്റുകൾ കണ്ടെത്തൽ](../../../../translated_images/ml/cosmosdb-emulator-persons-query.6905ebb497e3cd047cd96e55a0a03f69ce1b91b2b3d8c147e617b746b22b7e33.png)
![Cosmos DB എമുലേറ്ററിൽ SELECT ക്വറി പ്രവർത്തിപ്പിച്ച് പ്രായം 40-ൽ താഴെയുള്ള ഡോക്യുമെന്റുകൾ കണ്ടെത്തൽ](../../../../translated_images/ml/cosmosdb-emulator-persons-query.6905ebb497e3cd04.webp)
ക്വറി രണ്ട് ഡോക്യുമെന്റുകൾ തിരികെ നൽകുന്നു, ഓരോ ഡോക്യുമെന്റിന്റെയും പ്രായം 40-ൽ താഴെയാണ്.

@ -4,7 +4,7 @@
| :-------------------------------------------------------------------------------------------------------: |
| Python ഉപയോഗിച്ച് പ്രവർത്തിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
[![Intro Video](../../../../translated_images/ml/video-ds-python.245247dc811db8e4d5ac420246de8a118c63fd28f6a56578d08b630ae549f260.png)](https://youtu.be/dZjWOGbsN4Y)
[![Intro Video](../../../../translated_images/ml/video-ds-python.245247dc811db8e4.webp)](https://youtu.be/dZjWOGbsN4Y)
ഡാറ്റാബേസുകൾ ഡാറ്റ സംഭരിക്കാനും ക്വറി ഭാഷകൾ ഉപയോഗിച്ച് അവയെ ക്വറി ചെയ്യാനും വളരെ കാര്യക്ഷമമായ മാർഗങ്ങൾ നൽകുമ്പോഴും, ഡാറ്റ പ്രോസസ്സിംഗിന്റെ ഏറ്റവും ലവച്ഛമായ മാർഗം ഡാറ്റ കൈകാര്യം ചെയ്യാൻ നിങ്ങളുടെ സ്വന്തം പ്രോഗ്രാം എഴുതുകയാണ്. പലപ്പോഴും, ഡാറ്റാബേസ് ക്വറി ചെയ്യുന്നത് കൂടുതൽ ഫലപ്രദമായ മാർഗമായിരിക്കും. എന്നാൽ, കൂടുതൽ സങ്കീർണ്ണമായ ഡാറ്റ പ്രോസസ്സിംഗ് ആവശ്യമായപ്പോൾ, അത് എളുപ്പത്തിൽ SQL ഉപയോഗിച്ച് ചെയ്യാനാകില്ല.
ഡാറ്റ പ്രോസസ്സിംഗ് ഏതെങ്കിലും പ്രോഗ്രാമിംഗ് ഭാഷയിൽ പ്രോഗ്രാം ചെയ്യാം, പക്ഷേ ഡാറ്റ കൈകാര്യം ചെയ്യുന്നതിൽ ഉയർന്ന തലത്തിലുള്ള ചില ഭാഷകൾ ഉണ്ട്. ഡാറ്റ സയന്റിസ്റ്റുകൾ സാധാരണയായി താഴെപ്പറയുന്ന ഭാഷകളിൽ ഒന്നിനെ മുൻഗണന നൽകുന്നു:
@ -66,7 +66,7 @@ print(f"Length of index is {len(idx)}")
items_sold = pd.Series(np.random.randint(25,50,size=len(idx)),index=idx)
items_sold.plot()
```
![Time Series Plot](../../../../translated_images/ml/timeseries-1.80de678ab1cf727e50e00bcf24009fa2b0a8b90ebc43e34b99a345227d28e467.png)
![Time Series Plot](../../../../translated_images/ml/timeseries-1.80de678ab1cf727e.webp)
ഇപ്പോൾ ഓരോ ആഴ്ചയും നാം സുഹൃത്തുക്കൾക്കായി പാർട്ടി സംഘടിപ്പിക്കുന്നു, പാർട്ടിക്കായി അധികം 10 പാക്ക് ഐസ്‌ക്രീം കൊണ്ടുവരുന്നു എന്ന് കരുതുക. ആ ആഴ്ചയുടെ ഇൻഡക്സ് ഉപയോഗിച്ച് മറ്റൊരു സീരീസ് സൃഷ്ടിക്കാം:
```python
@ -77,7 +77,7 @@ additional_items = pd.Series(10,index=pd.date_range(start_date,end_date,freq="W"
total_items = items_sold.add(additional_items,fill_value=0)
total_items.plot()
```
![Time Series Plot](../../../../translated_images/ml/timeseries-2.aae51d575c55181ceda81ade8c546a2fc2024f9136934386d57b8a189d7570ff.png)
![Time Series Plot](../../../../translated_images/ml/timeseries-2.aae51d575c55181c.webp)
> **കുറിപ്പ്**: നാം ലളിതമായ `total_items+additional_items` സിന്താക്സ് ഉപയോഗിക്കുന്നില്ല. അതുപയോഗിച്ചാൽ, ഫലസീരീസിൽ പല `NaN` (*Not a Number*) മൂല്യങ്ങളും ഉണ്ടാകുമായിരിക്കും. കാരണം `additional_items` സീരീസിൽ ചില ഇൻഡക്സ് പോയിന്റുകൾക്ക് മൂല്യങ്ങൾ ഇല്ല, `NaN` യെ ഏതെങ്കിലും മൂല്യത്തിലേക്ക് കൂട്ടിച്ചേർക്കുമ്പോൾ ഫലം `NaN` ആകുന്നു. അതിനാൽ കൂട്ടിച്ചേർക്കുമ്പോൾ `fill_value` പാരാമീറ്റർ നിർദ്ദേശിക്കേണ്ടതാണ്.
@ -86,7 +86,7 @@ total_items.plot()
monthly = total_items.resample("1M").mean()
ax = monthly.plot(kind='bar')
```
![Monthly Time Series Averages](../../../../translated_images/ml/timeseries-3.f3147cbc8c624881008564bc0b5d9fcc15e7374d339da91766bd0e1c6bd9e3af.png)
![Monthly Time Series Averages](../../../../translated_images/ml/timeseries-3.f3147cbc8c624881.webp)
### ഡാറ്റാഫ്രെയിം
@ -215,7 +215,7 @@ df = pd.read_csv('file.csv')
ഡാറ്റ കൈകാര്യം ചെയ്യുന്നത് എങ്ങനെ എന്ന് കാണിക്കാൻ, നിങ്ങൾക്ക് [`notebook-covidspread.ipynb`](notebook-covidspread.ipynb) തുറന്ന് മുകളിൽ നിന്ന് താഴേക്ക് വായിക്കാൻ ഞങ്ങൾ ക്ഷണിക്കുന്നു. സെല്ലുകൾ പ്രവർത്തിപ്പിക്കാനും, അവസാനം നാം നിങ്ങൾക്കായി വെച്ച ചില ചലഞ്ചുകൾ ചെയ്യാനും കഴിയും.
![COVID Spread](../../../../translated_images/ml/covidspread.f3d131c4f1d260ab0344d79bac0abe7924598dd754859b165955772e1bd5e8a2.png)
![COVID Spread](../../../../translated_images/ml/covidspread.f3d131c4f1d260ab.webp)
> Jupyter Notebook ൽ കോഡ് എങ്ങനെ റൺ ചെയ്യാമെന്ന് അറിയില്ലെങ്കിൽ, [ഈ ലേഖനം](https://soshnikov.com/education/how-to-execute-notebooks-from-github/) കാണുക.
@ -237,7 +237,7 @@ df = pd.read_csv('file.csv')
[`notebook-papers.ipynb`](notebook-papers.ipynb) തുറന്ന് മുകളിൽ നിന്ന് താഴേക്ക് വായിക്കുക. സെല്ലുകൾ പ്രവർത്തിപ്പിക്കാനും, അവസാനം നാം നിങ്ങൾക്കായി വെച്ച ചില ചലഞ്ചുകൾ ചെയ്യാനും കഴിയും.
![Covid Medical Treatment](../../../../translated_images/ml/covidtreat.b2ba59f57ca45fbcda36e0ddca3f8cfdddeeed6ca879ea7f866d93fa6ec65791.png)
![Covid Medical Treatment](../../../../translated_images/ml/covidtreat.b2ba59f57ca45fbc.webp)
## ചിത്ര ഡാറ്റ പ്രോസസ്സിംഗ്

File diff suppressed because one or more lines are too long

@ -1,6 +1,6 @@
# ഡാറ്റയുമായി പ്രവർത്തിക്കൽ
![data love](../../../translated_images/ml/data-love.a22ef29e6742c852505ada062920956d3d7604870b281a8ca7c7ac6f37381d5a.jpg)
![data love](../../../translated_images/ml/data-love.a22ef29e6742c852.webp)
> ഫോട്ടോ <a href="https://unsplash.com/@swimstaralex?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Alexander Sinn</a> യുടെ <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a> ൽ നിന്നാണ്
ഈ പാഠങ്ങളിൽ, ഡാറ്റ എങ്ങനെ കൈകാര്യം ചെയ്യാമെന്ന്, മാറ്റം വരുത്താമെന്ന്, ആപ്ലിക്കേഷനുകളിൽ ഉപയോഗിക്കാമെന്ന് നിങ്ങൾ പഠിക്കും. ബന്ധപരമായ (relational) ഡാറ്റാബേസുകളും ബന്ധമില്ലാത്ത (non-relational) ഡാറ്റാബേസുകളും എന്താണെന്ന്, അവയിൽ ഡാറ്റ എങ്ങനെ സൂക്ഷിക്കാമെന്ന് നിങ്ങൾ അറിയും. ഡാറ്റ കൈകാര്യം ചെയ്യാൻ പൈത്തൺ ഉപയോഗിക്കുന്നതിന്റെ അടിസ്ഥാനങ്ങൾ നിങ്ങൾ പഠിക്കും, കൂടാതെ പൈത്തൺ ഉപയോഗിച്ച് ഡാറ്റ കൈകാര്യം ചെയ്യാനും ഡാറ്റയിൽ നിന്ന് വിവരങ്ങൾ കണ്ടെത്താനും ഉള്ള നിരവധി മാർഗങ്ങൾ നിങ്ങൾ കണ്ടെത്തും.

@ -52,7 +52,7 @@ birds.head()
wingspan = birds['MaxWingspan']
wingspan.plot()
```
![Max Wingspan](../../../../translated_images/ml/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.png)
![Max Wingspan](../../../../translated_images/ml/max-wingspan-02.e79fd847b2640b89.webp)
നിങ്ങൾ ഉടൻ ശ്രദ്ധിക്കുന്നതെന്താണ്? കുറഞ്ഞത് ഒരു ഔട്ട്‌ലൈയർ ഉണ്ടെന്ന് തോന്നുന്നു - അത്ര വലിയ വിങ്‌സ്‌പാൻ! 2300 സെന്റീമീറ്റർ വിങ്‌സ്‌പാൻ 23 മീറ്ററിനാണ് തുല്യമായത് - മിന്നസോട്ടയിൽ പ്റ്റെറോഡാക്ടിലുകൾ നടക്കുകയാണോ? പരിശോധിക്കാം.
@ -72,7 +72,7 @@ plt.plot(x, y)
plt.show()
```
![wingspan with labels](../../../../translated_images/ml/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.png)
![wingspan with labels](../../../../translated_images/ml/max-wingspan-labels-02.aa90e826ca49a9d1.webp)
45 ഡിഗ്രി ലേബലുകളുടെ റൊട്ടേഷൻ സജ്ജമാക്കിയിട്ടും വായിക്കാൻ വളരെ അധികം ലേബലുകൾ ഉണ്ട്. വ്യത്യസ്തമായ ഒരു തന്ത്രം പരീക്ഷിക്കാം: ഔട്ട്‌ലൈയറുകൾ മാത്രം ലേബൽ ചെയ്യുക, ലേബലുകൾ ചാർട്ടിനുള്ളിൽ സജ്ജമാക്കുക. ലേബലിംഗിന് കൂടുതൽ സ്ഥലം നൽകാൻ സ്കാറ്റർ ചാർട്ട് ഉപയോഗിക്കാം:
@ -94,7 +94,7 @@ plt.show()
നിങ്ങൾ എന്ത് കണ്ടെത്തി?
![outliers](../../../../translated_images/ml/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.png)
![outliers](../../../../translated_images/ml/labeled-wingspan-02.6110e2d2401cd523.webp)
## നിങ്ങളുടെ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക
ബാൾഡ് ഈഗിൾക്കും പ്രെയറി ഫാൽക്കണിനും, വളരെ വലിയ പക്ഷികളായിരിക്കാം, പക്ഷേ പരമാവധി വിങ്‌സ്‌പാനിൽ ഒരു അധികം `0` ചേർത്തിട്ടുള്ള തെറ്റായ ലേബലിംഗാണ്. 25 മീറ്റർ വിങ്‌സ്‌പാൻ ഉള്ള ബാൾഡ് ഈഗിൾ കാണാൻ സാധ്യത കുറവാണ്, പക്ഷേ ഉണ്ടെങ്കിൽ ദയവായി ഞങ്ങളെ അറിയിക്കുക! ആ രണ്ട് ഔട്ട്‌ലൈയറുകൾ ഇല്ലാതെ പുതിയ ഡാറ്റാഫ്രെയിം സൃഷ്ടിക്കാം:
@ -114,7 +114,7 @@ plt.show()
ഔട്ട്‌ലൈയറുകൾ ഫിൽട്ടർ ചെയ്തതോടെ, നിങ്ങളുടെ ഡാറ്റ കൂടുതൽ ഏകീകൃതവും മനസ്സിലാക്കാൻ എളുപ്പവുമാണ്.
![scatterplot of wingspans](../../../../translated_images/ml/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.png)
![scatterplot of wingspans](../../../../translated_images/ml/scatterplot-wingspan-02.1c33790094ce36a7.webp)
ഇപ്പോൾ വിങ്‌സ്‌പാൻ സംബന്ധിച്ച് കുറഞ്ഞത് ശുദ്ധമായ ഡാറ്റാസെറ്റ് ഉണ്ടാകുമ്പോൾ, ഈ പക്ഷികളെക്കുറിച്ച് കൂടുതൽ കണ്ടെത്താം.
@ -140,7 +140,7 @@ birds.plot(x='Category',
title='Birds of Minnesota')
```
![full data as a bar chart](../../../../translated_images/ml/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.png)
![full data as a bar chart](../../../../translated_images/ml/full-data-bar-02.aaa3fda71c63ed56.webp)
എന്നാൽ ഈ ബാർ ചാർട്ട് വായിക്കാൻ കഴിയുന്നില്ല, കാരണം ഗ്രൂപ്പുചെയ്യാത്ത ഡാറ്റ വളരെ കൂടുതലാണ്. നിങ്ങൾ പ്ലോട്ട് ചെയ്യാൻ ആഗ്രഹിക്കുന്ന ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം, അതിനാൽ പക്ഷികളുടെ വിഭാഗം അടിസ്ഥാനമാക്കി നീളം നോക്കാം.
@ -155,7 +155,7 @@ category_count = birds.value_counts(birds['Category'].values, sort=True)
plt.rcParams['figure.figsize'] = [6, 12]
category_count.plot.barh()
```
![category and length](../../../../translated_images/ml/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.png)
![category and length](../../../../translated_images/ml/category-counts-02.0b9a0a4de42275ae.webp)
ഈ ബാർ ചാർട്ട് ഓരോ വിഭാഗത്തിലും പക്ഷികളുടെ എണ്ണം നല്ല കാഴ്ച നൽകുന്നു. ഒരു നിമിഷത്തിൽ, ഈ പ്രദേശത്തെ ഏറ്റവും വലിയ പക്ഷി എണ്ണം Ducks/Geese/Waterfowl വിഭാഗത്തിലാണ് എന്ന് കാണാം. മിന്നസോട്ട '10,000 തടാകങ്ങളുടെ നാട്' ആകുന്നതിനാൽ ഇത് അത്ഭുതമല്ല!
@ -171,7 +171,7 @@ plt.barh(y=birds['Category'], width=maxlength)
plt.rcParams['figure.figsize'] = [6, 12]
plt.show()
```
![comparing data](../../../../translated_images/ml/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.png)
![comparing data](../../../../translated_images/ml/category-length-02.7304bf519375c980.webp)
ഇവിടെ എന്തും അത്ഭുതപ്പെടുത്തുന്നില്ല: ഹമ്മിംഗ്‌ബേർഡുകൾക്ക് പെലിക്കാനുകളോ ഗീസുകളോ അപേക്ഷിച്ച് ഏറ്റവും കുറഞ്ഞ MaxLength ഉണ്ട്. ഡാറ്റ ലജിക്കൽ ആകുമ്പോൾ നല്ലതാണ്!
@ -189,7 +189,7 @@ plt.show()
```
ഈ പ്ലോട്ടിൽ, ഓരോ പക്ഷി വിഭാഗത്തിന്റെയും കുറഞ്ഞ നീളം, പരമാവധി നീളം കാണാം. ഈ ഡാറ്റ പ്രകാരം, പക്ഷി വലുതായാൽ, അതിന്റെ നീളം വ്യത്യാസവും വലുതാണ് എന്ന് പറയാം. അത്ഭുതകരം!
![superimposed values](../../../../translated_images/ml/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.png)
![superimposed values](../../../../translated_images/ml/superimposed-02.f03058536baeb2ed.webp)
## 🚀 ചലഞ്ച്

@ -40,7 +40,7 @@ plt.xlabel('Max Length')
plt.show()
```
![max length per order](../../../../translated_images/ml/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.png)
![max length per order](../../../../translated_images/ml/scatter-wb.9d98b0ed7f0388af.webp)
ഇത് ഓരോ പക്ഷി ഓർഡറിനും ശരീര നീളത്തിന്റെ പൊതുവായ വിതരണത്തിന്റെ ഒരു അവലോകനമാണ് നൽകുന്നത്, പക്ഷേ യഥാർത്ഥ വിതരണങ്ങൾ പ്രദർശിപ്പിക്കാൻ ഇത് ഏറ്റവും അനുയോജ്യമായ മാർഗം അല്ല. ആ ജോലി സാധാരണയായി ഹിസ്റ്റോഗ്രാം സൃഷ്ടിച്ച് നിർവഹിക്കുന്നു.
## ഹിസ്റ്റോഗ്രാമുകളുമായി പ്രവർത്തിക്കൽ
@ -51,7 +51,7 @@ Matplotlib ഡാറ്റ വിതരണങ്ങൾ ദൃശ്യവൽക
birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
plt.show()
```
![distribution over the entire dataset](../../../../translated_images/ml/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.png)
![distribution over the entire dataset](../../../../translated_images/ml/dist1-wb.0d0cac82e2974fbb.webp)
നിങ്ങൾക്ക് കാണാമല്ലോ, ഈ ഡാറ്റാസെറ്റിലെ 400+ പക്ഷികളിൽ ഭൂരിഭാഗവും അവരുടെ പരമാവധി ശരീരഭാരം 2000-ൽ താഴെ ഉള്ള പരിധിയിലാണ്. `bins` പാരാമീറ്റർ 30 പോലുള്ള ഉയർന്ന സംഖ്യയാക്കി മാറ്റി ഡാറ്റയിൽ കൂടുതൽ洞察ം നേടാം:
@ -59,7 +59,7 @@ plt.show()
birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
plt.show()
```
![distribution over the entire dataset with larger bins param](../../../../translated_images/ml/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.png)
![distribution over the entire dataset with larger bins param](../../../../translated_images/ml/dist2-wb.2c0a7a3499b2fbf5.webp)
ഈ ചാർട്ട് കൂടുതൽ സൂക്ഷ്മമായ രീതിയിൽ വിതരണത്തെ കാണിക്കുന്നു. ഇടത്തരം കുറവുള്ള ഒരു ചാർട്ട് സൃഷ്ടിക്കാൻ, നിങ്ങൾക്ക് ഒരു നിശ്ചിത പരിധിയിലുള്ള ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം:
@ -70,7 +70,7 @@ filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]
filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
plt.show()
```
![filtered histogram](../../../../translated_images/ml/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.png)
![filtered histogram](../../../../translated_images/ml/dist3-wb.64b88db7f9780200.webp)
✅ മറ്റ് ഫിൽട്ടറുകളും ഡാറ്റ പോയിന്റുകളും പരീക്ഷിക്കുക. ഡാറ്റയുടെ മുഴുവൻ വിതരണവും കാണാൻ, `['MaxBodyMass']` ഫിൽട്ടർ നീക്കം ചെയ്ത് ലേബൽ ചെയ്ത വിതരണങ്ങൾ കാണിക്കുക.
@ -87,7 +87,7 @@ hist = ax.hist2d(x, y)
```
ഈ രണ്ട് ഘടകങ്ങൾ തമ്മിൽ പ്രതീക്ഷിക്കപ്പെട്ട ബന്ധം ഒരു പ്രതീക്ഷിച്ച അക്ഷം അനുസരിച്ച് കാണപ്പെടുന്നു, പ്രത്യേകിച്ച് ശക്തമായ ഒരു സമന്വയ ബിന്ദു:
![2D plot](../../../../translated_images/ml/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.png)
![2D plot](../../../../translated_images/ml/2D-wb.ae22fdd33936507a.webp)
ഹിസ്റ്റോഗ്രാമുകൾ സംഖ്യാത്മക ഡാറ്റയ്ക്ക് സാധാരണയായി നല്ലതാണ്. ടെക്സ്റ്റ് ഡാറ്റ അനുസരിച്ച് വിതരണങ്ങൾ കാണേണ്ടത് എങ്കിൽ?
@ -127,7 +127,7 @@ plt.gca().set(title='Conservation Status', ylabel='Min Wingspan')
plt.legend();
```
![wingspan and conservation collation](../../../../translated_images/ml/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.png)
![wingspan and conservation collation](../../../../translated_images/ml/histogram-conservation-wb.3c40450eb072c14d.webp)
കുറഞ്ഞ വിങ്‌സ്‌പാനും സംരക്ഷണ നിലക്കും നല്ല ബന്ധമില്ലെന്ന് തോന്നുന്നു. ഈ രീതിയിൽ ഡാറ്റാസെറ്റിലെ മറ്റ് ഘടകങ്ങളും പരീക്ഷിക്കുക. നിങ്ങൾക്ക് ഏതെങ്കിലും ബന്ധം കണ്ടെത്താമോ?
@ -145,7 +145,7 @@ import matplotlib.pyplot as plt
sns.kdeplot(filteredBirds['MinWingspan'])
plt.show()
```
![Density plot](../../../../translated_images/ml/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.png)
![Density plot](../../../../translated_images/ml/density1.8801043bd4af2567.webp)
മുൻപത്തെ കുറഞ്ഞ വിങ്‌സ്‌പാൻ ഡാറ്റയുടെ പ്ലോട്ടിനെപ്പോലെ ഇത് കാണാം; ഇത് കുറച്ച് മൃദുവാണ്. Seaborn ഡോക്യുമെന്റേഷനുസരിച്ച്, "ഹിസ്റ്റോഗ്രാമിനോട് താരതമ്യപ്പെടുത്തുമ്പോൾ, KDE ഒരു പ്ലോട്ട് കുറച്ച് കുറവുള്ളതും കൂടുതൽ വ്യാഖ്യാനയോഗ്യവുമാകാം, പ്രത്യേകിച്ച് പല വിതരണങ്ങളും വരച്ചപ്പോൾ. എന്നാൽ അടിസ്ഥാന വിതരണത്തിന് അതിരുകൾ ഉണ്ടെങ്കിൽ അല്ലെങ്കിൽ മൃദുവായില്ലെങ്കിൽ, ഇത് വക്രതകൾ സൃഷ്ടിക്കാം. ഹിസ്റ്റോഗ്രാമുപോലെ, പ്രതിനിധാനത്തിന്റെ ഗുണമേന്മയും നല്ല മൃദുവായ പാരാമീറ്ററുകളുടെ തിരഞ്ഞെടുപ്പിൽ ആശ്രയിച്ചിരിക്കുന്നു." [source](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) മറ്റൊരു വാക്കിൽ, ഔട്ട്‌ലൈയർമാർ എപ്പോഴും നിങ്ങളുടെ ചാർട്ടുകൾക്ക് പ്രശ്നങ്ങൾ സൃഷ്ടിക്കും.
@ -155,7 +155,7 @@ plt.show()
sns.kdeplot(filteredBirds['MaxBodyMass'])
plt.show()
```
![smooth bodymass line](../../../../translated_images/ml/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.png)
![smooth bodymass line](../../../../translated_images/ml/density2.8e7647257060ff54.webp)
മൃദുവായെങ്കിലും അത്ര മൃദുവായില്ലാത്ത ഒരു ലൈനിനായി, `bw_adjust` പാരാമീറ്റർ എഡിറ്റ് ചെയ്യുക:
@ -163,7 +163,7 @@ plt.show()
sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
plt.show()
```
![less smooth bodymass line](../../../../translated_images/ml/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.png)
![less smooth bodymass line](../../../../translated_images/ml/density3.84ae27da82f31e6b.webp)
✅ ഈ തരത്തിലുള്ള പ്ലോട്ടിനുള്ള പാരാമീറ്ററുകൾക്കുറിച്ച് വായിച്ച് പരീക്ഷിക്കുക!
@ -177,7 +177,7 @@ sns.kdeplot(
)
```
![bodymass per order](../../../../translated_images/ml/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.png)
![bodymass per order](../../../../translated_images/ml/density4.e9d6c033f15c500f.webp)
ഒരേ ചാർട്ടിൽ പല വേരിയബിളുകളുടെ ഡെൻസിറ്റികളും മാപ്പ് ചെയ്യാം. ഒരു പക്ഷിയുടെ MaxLength, MinLength സംരക്ഷണ നിലയുമായി താരതമ്യം ചെയ്യുക:
@ -185,7 +185,7 @@ sns.kdeplot(
sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")
```
![multiple densities, superimposed](../../../../translated_images/ml/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.png)
![multiple densities, superimposed](../../../../translated_images/ml/multi.56548caa9eae8d0f.webp)
'Vulnerable' പക്ഷികളുടെ നീളങ്ങളുടെ ക്ലസ്റ്റർ അർത്ഥവത്താണോ അല്ലയോ എന്ന് അന്വേഷിക്കുന്നത് മൂല്യമുള്ളതായിരിക്കാം.

@ -84,7 +84,7 @@ plt.show()
```
ഇവിടെ, ഈ ഡാറ്റയുടെ അനുപാതങ്ങൾ ഈ രണ്ട് മഷ്‌റൂം ക്ലാസുകൾ അനുസരിച്ച് കാണിക്കുന്ന ഒരു പൈ ചാർട്ട്. ലേബലുകളുടെ ക്രമം ശരിയാണെന്ന് ഉറപ്പാക്കുന്നത് വളരെ പ്രധാനമാണ്, പ്രത്യേകിച്ച് ഇവിടെ, അതിനാൽ ലേബൽ അറേ എങ്ങനെ നിർമ്മിക്കപ്പെടുന്നു എന്ന് പരിശോധിക്കുക!
![pie chart](../../../../translated_images/ml/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.png)
![pie chart](../../../../translated_images/ml/pie1-wb.e201f2fcc3354131.webp)
## ഡോണട്ടുകൾ!
@ -114,7 +114,7 @@ plt.title('Mushroom Habitats')
plt.show()
```
![donut chart](../../../../translated_images/ml/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.png)
![donut chart](../../../../translated_images/ml/donut-wb.be3c12a22712302b.webp)
ഈ കോഡ് ഒരു ചാർട്ട് വരയ്ക്കുകയും മധ്യത്തിൽ ഒരു വൃത്തം വരയ്ക്കുകയും ചെയ്യുന്നു, പിന്നീട് ആ വൃത്തം ചാർട്ടിൽ ചേർക്കുന്നു. മധ്യ വൃത്തത്തിന്റെ വീതി `0.40` എന്ന മൂല്യം മാറ്റി എഡിറ്റ് ചെയ്യാം.
@ -161,7 +161,7 @@ fig = plt.figure(
വാഫിൾ ചാർട്ട് ഉപയോഗിച്ച്, ഈ മഷ്‌റൂം ഡാറ്റാസെറ്റിലെ ക്യാപ് നിറങ്ങളുടെ അനുപാതങ്ങൾ വ്യക്തമായി കാണാം. രസകരമായി, നിരവധി പച്ച ക്യാപ് മഷ്‌റൂമുകൾ ഉണ്ട്!
![waffle chart](../../../../translated_images/ml/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.png)
![waffle chart](../../../../translated_images/ml/waffle.5455dbae4ccf17d5.webp)
✅ Pywaffle ചാർട്ടുകളിൽ [Font Awesome](https://fontawesome.com/) ൽ ലഭ്യമായ ഏതെങ്കിലും ഐക്കൺ ഉപയോഗിച്ച് ഐക്കണുകൾ ഉൾപ്പെടുത്താൻ പിന്തുണ നൽകുന്നു. ചതുരങ്ങൾക്കുപകരം ഐക്കണുകൾ ഉപയോഗിച്ച് കൂടുതൽ രസകരമായ വാഫിൾ ചാർട്ട് സൃഷ്ടിക്കാൻ പരീക്ഷണങ്ങൾ നടത്തുക.

@ -42,7 +42,7 @@ honey.head()
```python
sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
```
![scatterplot 1](../../../../translated_images/ml/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.png)
![scatterplot 1](../../../../translated_images/ml/scatter1.5e1aa5fd6706c5d1.webp)
ഇപ്പോൾ, വർഷം തോറും വില എങ്ങനെ മാറിയെന്ന് കാണിക്കാൻ തേൻ നിറത്തിലുള്ള കളർ സ്കീം ഉപയോഗിച്ച് സമാന ഡാറ്റ കാണിക്കുക. വർഷം തോറും മാറ്റം കാണിക്കാൻ 'hue' പാരാമീറ്റർ ചേർക്കാം:
@ -51,7 +51,7 @@ sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
```python
sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5);
```
![scatterplot 2](../../../../translated_images/ml/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.png)
![scatterplot 2](../../../../translated_images/ml/scatter2.c0041a58621ca702.webp)
ഈ കളർ സ്കീം മാറ്റത്തോടെ, തേന്റെ പൗണ്ട് പ്രതി വില വർഷം തോറും ശക്തമായി ഉയരുന്നുവെന്ന് കാണാം. ഡാറ്റയിൽ ഒരു സാമ്പിൾ സെറ്റ് പരിശോധിച്ചാൽ (ഉദാഹരണത്തിന്, അരിസോണ), വില വർഷം തോറും ഉയരുന്ന ഒരു പാറ്റേൺ കാണാം, കുറച്ച് വ്യത്യാസങ്ങൾ ഒഴികെ:
@ -80,7 +80,7 @@ sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspec
```
ഡോട്ടുകളുടെ വലിപ്പം ക്രമാതീതമായി വർദ്ധിക്കുന്നതായി കാണാം.
![scatterplot 3](../../../../translated_images/ml/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.png)
![scatterplot 3](../../../../translated_images/ml/scatter3.3c160a3d1dcb36b3.webp)
ഇത് സപ്ലൈ ആൻഡ് ഡിമാൻഡ് എന്ന ലളിതമായ കേസ് ആണോ? കാലാവസ്ഥ മാറ്റം, കോളനി തകർച്ച തുടങ്ങിയ ഘടകങ്ങൾ കാരണം വർഷം തോറും വാങ്ങാനുളള തേൻ കുറയുന്നുണ്ടോ, അതിനാൽ വില ഉയരുന്നുണ്ടോ?
@ -95,7 +95,7 @@ sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
```
ഉത്തരം: ചില വ്യത്യാസങ്ങൾ കൂടെ 2003-ൽ ചില ഉയർച്ചകൾ കാണാം:
![line chart 1](../../../../translated_images/ml/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.png)
![line chart 1](../../../../translated_images/ml/line1.f36eb465229a3b1f.webp)
✅ Seaborn ഒരു ലൈനിൽ ഡാറ്റ സംഗ്രഹിക്കുന്നതിനാൽ, "ഓരോ x മൂല്യത്തിലും പല അളവുകൾ ശരാശരി കണക്കാക്കി ശരാശരിയുടെ ചുറ്റും 95% വിശ്വാസപരിധി കാണിക്കുന്നു". [മൂലം](https://seaborn.pydata.org/tutorial/relational.html). ഈ സമയം കൂടുതലുള്ള പ്രവർത്തനം `ci=None` ചേർത്താൽ ഒഴിവാക്കാം.
@ -105,7 +105,7 @@ sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
sns.relplot(x="year", y="totalprod", kind="line", data=honey);
```
![line chart 2](../../../../translated_images/ml/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.png)
![line chart 2](../../../../translated_images/ml/line2.a5b3493dc01058af.webp)
ഉത്തരം: അത്രയുമല്ല. മൊത്തം ഉത്പാദനം ആ വർഷം വർദ്ധിച്ചിട്ടുണ്ടെങ്കിലും, സാധാരണയായി ഈ വർഷങ്ങളിൽ തേൻ ഉത്പാദനം കുറയുകയാണ്.
@ -130,7 +130,7 @@ sns.relplot(
```
ഈ ദൃശ്യവൽക്കരണത്തിൽ, കോളനി പ്രതി ഉത്പാദനവും കോളനികളുടെ എണ്ണവും വർഷം തോറും, 3 കോളങ്ങൾ വച്ച് വശം വശം താരതമ്യം ചെയ്യാം:
![facet grid](../../../../translated_images/ml/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.png)
![facet grid](../../../../translated_images/ml/facet.6a34851dcd540050.webp)
ഈ ഡാറ്റാസെറ്റിൽ, കോളനികളുടെ എണ്ണം, അവയുടെ ഉത്പാദനം വർഷം തോറും, സംസ്ഥാനങ്ങൾ തമ്മിൽ പ്രത്യേകമായ വ്യത്യാസം കാണുന്നില്ല. ഈ രണ്ട് വേരിയബിളുകൾ തമ്മിൽ സഹബന്ധം കണ്ടെത്താൻ മറ്റൊരു മാർഗം ഉണ്ടോ?
@ -153,7 +153,7 @@ sns.despine(right=False)
plt.ylabel('colony yield')
ax.figure.legend();
```
![superimposed plots](../../../../translated_images/ml/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.png)
![superimposed plots](../../../../translated_images/ml/dual-line.a4c28ce659603fab.webp)
2003-ൽ പ്രത്യേകമായി ഒന്നും കാണാനില്ലെങ്കിലും, ഈ പാഠം ഒരു സന്തോഷകരമായ നോട്ടിൽ അവസാനിപ്പിക്കാം: കോളനികളുടെ എണ്ണം കുറയുന്നുണ്ടെങ്കിലും, അവയുടെ എണ്ണം സ്ഥിരതയുള്ളതും, കോളനി പ്രതി ഉത്പാദനം കുറയുന്നുണ്ടെങ്കിലും.

@ -38,25 +38,25 @@
ഒരു ഡാറ്റ സയന്റിസ്റ്റ് ശരിയായ ഡാറ്റയ്ക്ക് ശരിയായ ചാർട്ട് തിരഞ്ഞെടുക്കാൻ ശ്രദ്ധിച്ചാലും, ഡാറ്റയെ തെളിയിക്കാൻ പലവിധം വഞ്ചനാപരമായി പ്രദർശിപ്പിക്കാനുള്ള മാർഗ്ഗങ്ങൾ ധാരാളമാണ്, പലപ്പോഴും ഡാറ്റയെ തന്നെ അപഹസിക്കുന്ന വിലക്ക് വരുത്തി. വഞ്ചനാപരമായ ചാർട്ടുകളും ഇൻഫോഗ്രാഫിക്സും ധാരാളം ഉദാഹരണങ്ങളുണ്ട്!
[![How Charts Lie by Alberto Cairo](../../../../translated_images/ml/tornado.9f42168791208f970d6faefc11d1226d7ca89518013b14aa66b1c9edcd7678d2.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
[![How Charts Lie by Alberto Cairo](../../../../translated_images/ml/tornado.9f42168791208f97.webp)](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
> 🎥 വഞ്ചനാപരമായ ചാർട്ടുകൾക്കുറിച്ചുള്ള കോൺഫറൻസ് ടോക്കിനായി മുകളിൽ ചിത്രത്തിൽ ക്ലിക്ക് ചെയ്യുക
ഈ ചാർട്ട് X അക്ഷം മറിച്ച് സത്യം മറിച്ച് കാണിക്കുന്നു, തീയതി അടിസ്ഥാനമാക്കി:
![bad chart 1](../../../../translated_images/ml/bad-chart-1.93130f495b748bedfb3423d91b1e754d9026e17f94ad967aecdc9ca7203373bf.png)
![bad chart 1](../../../../translated_images/ml/bad-chart-1.93130f495b748bed.webp)
[ഈ ചാർട്ട്](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) കൂടുതൽ വഞ്ചനാപരമാണ്, കാരണം കണ്ണ് വലത്തേക്ക് ആകർഷിക്കപ്പെടുന്നു, സമയാനുസൃതമായി COVID കേസുകൾ വിവിധ കൗണ്ടികളിൽ കുറയുകയാണെന്ന് നിഗമനം ചെയ്യാൻ. എന്നാൽ, തീയതികൾ ശ്രദ്ധാപൂർവ്വം നോക്കിയാൽ, അവ വഞ്ചനാപരമായ താഴ്ന്ന ട്രെൻഡ് നൽകാൻ പുനഃക്രമീകരിച്ചിട്ടുള്ളതായി കാണാം.
![bad chart 2](../../../../translated_images/ml/bad-chart-2.c20e36dd4e6f617c0c325878dd421a563885bbf30a394884c147438827254e0e.jpg)
![bad chart 2](../../../../translated_images/ml/bad-chart-2.c20e36dd4e6f617c.webp)
ഈ പ്രശസ്ത ഉദാഹരണം നിറവും മറിച്ച Y അക്ഷവും ഉപയോഗിച്ച് വഞ്ചന ചെയ്യുന്നു: തോക്കു-സഹായക നിയമം പാസായതിന് ശേഷം തോക്ക് മരണങ്ങൾ വർധിച്ചതായി നിഗമനം ചെയ്യേണ്ടതിനു പകരം, കണ്ണ് മറിച്ച് സത്യം മറിച്ച് കാണുന്നു:
![bad chart 3](../../../../translated_images/ml/bad-chart-3.6865d0afac4108d737558d90a61547d23a8722896397ec792264ee51a1be4be5.jpg)
![bad chart 3](../../../../translated_images/ml/bad-chart-3.6865d0afac4108d7.webp)
ഈ വിചിത്രമായ ചാർട്ട് അനുപാതം എങ്ങനെ മാനിപ്പുലേറ്റ് ചെയ്യാമെന്ന് ഹാസ്യകരമായി കാണിക്കുന്നു:
![bad chart 4](../../../../translated_images/ml/bad-chart-4.68cfdf4011b454471053ee1231172747e1fbec2403b4443567f1dc678134f4f2.jpg)
![bad chart 4](../../../../translated_images/ml/bad-chart-4.68cfdf4011b45447.webp)
തുല്യമായവ അല്ലാത്തവ താരതമ്യം ചെയ്യുക മറ്റൊരു സംശയാസ്പദമായ തന്ത്രമാണ്. 'സ്പ്യൂറിയസ് കോറിലേഷൻസ്' എന്ന വിഷയത്തിൽ 'മെയ്നിലെ വിവാഹമോചന നിരക്കും മാർഗറിൻ ഉപഭോഗവും' പോലുള്ള കാര്യങ്ങൾ തമ്മിലുള്ള 'വാസ്തവങ്ങൾ' പ്രദർശിപ്പിക്കുന്ന [അദ്ഭുതകരമായ വെബ്‌സൈറ്റ്](https://tylervigen.com/spurious-correlations) ഉണ്ട്. Reddit ഗ്രൂപ്പ് ഡാറ്റയുടെ [കീഴടക്കം ഉപയോഗങ്ങൾ](https://www.reddit.com/r/dataisugly/top/?t=all) ശേഖരിക്കുന്നു.
@ -91,13 +91,13 @@
നിങ്ങളുടെ ഡാറ്റ ടെക്സ്റ്റ് ആണെങ്കിൽ, X അക്ഷ上的 വാചകം വായനാസൗകര്യത്തിനായി കോണിൽ വയ്ക്കാം. [Matplotlib](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) 3D പ്ലോട്ടിംഗ് നൽകുന്നു, നിങ്ങളുടെ ഡാറ്റ അത് പിന്തുണയ്ക്കുന്നുവെങ്കിൽ. സങ്കീർണ്ണമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങൾ `mpl_toolkits.mplot3d` ഉപയോഗിച്ച് നിർമ്മിക്കാം.
![3d plots](../../../../translated_images/ml/3d.0cec12bcc60f0ce7284c63baed1411a843e24716f7d7425de878715ebad54a15.png)
![3d plots](../../../../translated_images/ml/3d.0cec12bcc60f0ce7.webp)
## അനിമേഷൻ, 3D ചാർട്ട് പ്രദർശനം
ഇന്നത്തെ മികച്ച ഡാറ്റാ ദൃശ്യവത്കരണങ്ങളിൽ ചിലത് അനിമേറ്റഡ് ആണ്. Shirley Wu D3 ഉപയോഗിച്ച് '[film flowers](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)' പോലുള്ള അത്ഭുതകരമായവ ഉണ്ടാക്കി, ഓരോ പൂവും ഒരു സിനിമയുടെ ദൃശ്യവത്കരണമാണ്. Guardian-നായി മറ്റൊരു ഉദാഹരണം 'bussed out' ആണ്, Greensock, D3 എന്നിവയുമായി സംയോജിപ്പിച്ച ഒരു ഇന്ററാക്ടീവ് അനുഭവം, സ്ക്രോൾടെല്ലിംഗ് ലേഖന ഫോർമാറ്റിൽ, NYC എങ്ങനെ നഗരത്തിലെ ഹോമ്ലെസ്സ് പ്രശ്നം ബസ്സിലൂടെ പുറത്തേക്ക് കൊണ്ടുപോകുന്നു എന്ന് കാണിക്കുന്നു.
![busing](../../../../translated_images/ml/busing.7b9e3b41cd4b981c6d63922cd82004cc1cf18895155536c1d98fcc0999bdd23e.png)
![busing](../../../../translated_images/ml/busing.7b9e3b41cd4b981c.webp)
> "Bussed Out: How America Moves its Homeless" from [the Guardian](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). Visualizations by Nadieh Bremer & Shirley Wu
@ -107,7 +107,7 @@
നിങ്ങൾ ഒരു വെബ് ആപ്പ് പൂർത്തിയാക്കും, ഇത് ഈ സോഷ്യൽ നെറ്റ്‌വർക്ക് അനിമേറ്റഡ് ദൃശ്യമായി കാണിക്കും. ഇത് Vue.js, D3 ഉപയോഗിച്ച് [നെറ്റ്‌വർക്ക് ദൃശ്യവത്കരണം](https://github.com/emiliorizzo/vue-d3-network) സൃഷ്ടിക്കാൻ നിർമ്മിച്ച ഒരു ലൈബ്രറി ഉപയോഗിക്കുന്നു. ആപ്പ് പ്രവർത്തിക്കുമ്പോൾ, സ്ക്രീനിൽ നോഡുകൾ നീക്കി ഡാറ്റ മാറ്റാം.
![liaisons](../../../../translated_images/ml/liaisons.7b440b28f6d07ea430244fdf1fc4c64ff48f473f143b8e921846eda1c302aeba.png)
![liaisons](../../../../translated_images/ml/liaisons.7b440b28f6d07ea4.webp)
## പ്രോജക്ട്: D3.js ഉപയോഗിച്ച് ഒരു നെറ്റ്‌വർക്ക് കാണിക്കുന്ന ചാർട്ട് നിർമ്മിക്കുക

@ -57,7 +57,7 @@ ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
```
ഇവിടെ, `ggplot2` പാക്കേജ് ഇൻസ്റ്റാൾ ചെയ്ത് `library("ggplot2")` കമാൻഡ് ഉപയോഗിച്ച് വർക്ക്‌സ്പേസിലേക്ക് ഇറക്കുമതി ചെയ്യുന്നു. ggplot-ൽ ഏതെങ്കിലും പ്ലോട്ട് ചെയ്യാൻ `ggplot()` ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു, ഡാറ്റാസെറ്റ്, x, y വേരിയബിളുകൾ ആട്രിബ്യൂട്ടുകളായി നിശ്ചയിക്കുന്നു. ഈ കേസിൽ, ലൈൻ പ്ലോട്ട് സൃഷ്ടിക്കാനാണ് ഉദ്ദേശം, അതിനാൽ `geom_line()` ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നു.
![MaxWingspan-lineplot](../../../../../translated_images/ml/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.png)
![MaxWingspan-lineplot](../../../../../translated_images/ml/MaxWingspan-lineplot.b12169f99d26fdd2.webp)
നിങ്ങൾ ഉടൻ ശ്രദ്ധിക്കുന്നതെന്താണ്? കുറഞ്ഞത് ഒരു ഔട്ട്‌ലൈയർ ഉണ്ടെന്ന് തോന്നുന്നു - അത്ര വലിയ വിങ്‌സ്പാൻ! 2000+ സെന്റീമീറ്റർ വിങ്‌സ്പാൻ 20 മീറ്ററിലധികമാണ് - മിന്നസോട്ടയിൽ പ്റ്റെറോഡാക്റ്റിലുകൾ നടക്കുകയാണോ? പരിശോധിക്കാം.
@ -75,7 +75,7 @@ ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
```
`theme`-ൽ ആംഗിൾ നിശ്ചയിച്ച് `xlab()`-ൽ x അക്ഷ ലേബൽ, `ylab()`-ൽ y അക്ഷ ലേബൽ നിശ്ചയിക്കുന്നു. `ggtitle()` ഗ്രാഫ്/പ്ലോട്ടിന് പേര് നൽകുന്നു.
![MaxWingspan-lineplot-improved](../../../../../translated_images/ml/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.png)
![MaxWingspan-lineplot-improved](../../../../../translated_images/ml/MaxWingspan-lineplot-improved.04b73b4d5a59552a.webp)
45 ഡിഗ്രി ലേബലുകൾ തിരിയിച്ചിട്ടും വായിക്കാൻ വളരെ അധികം ലേബലുകൾ ഉണ്ട്. വ്യത്യസ്തമായ ഒരു തന്ത്രം പരീക്ഷിക്കാം: ആ ഔട്ട്‌ലൈയറുകൾക്ക് മാത്രമേ ലേബലുകൾ നൽകൂ, ലേബലുകൾ ചാർട്ടിനുള്ളിൽ സജ്ജമാക്കൂ. ലേബലിംഗിന് കൂടുതൽ സ്ഥലം നൽകാൻ സ്കാറ്റർ ചാർട്ട് ഉപയോഗിക്കാം:
@ -91,7 +91,7 @@ ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
നിങ്ങൾ എന്ത് കണ്ടെത്തുന്നു?
![MaxWingspan-scatterplot](../../../../../translated_images/ml/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.png)
![MaxWingspan-scatterplot](../../../../../translated_images/ml/MaxWingspan-scatterplot.60dc9e0e19d32700.webp)
## നിങ്ങളുടെ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക
@ -110,7 +110,7 @@ ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
```
പുതിയ ഡാറ്റാഫ്രെയിം `birds_filtered` സൃഷ്ടിച്ച് സ്കാറ്റർ പ്ലോട്ട് ചെയ്തു. ഔട്ട്‌ലൈയറുകൾ ഫിൽട്ടർ ചെയ്തതിനാൽ, നിങ്ങളുടെ ഡാറ്റ കൂടുതൽ ഏകീകൃതവും മനസ്സിലാക്കാൻ എളുപ്പവുമാണ്.
![MaxWingspan-scatterplot-improved](../../../../../translated_images/ml/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.png)
![MaxWingspan-scatterplot-improved](../../../../../translated_images/ml/MaxWingspan-scatterplot-improved.7d0af81658c65f3e.webp)
ഇപ്പോൾ വിങ്‌സ്പാൻ സംബന്ധിച്ച് കുറഞ്ഞത് ശുദ്ധമായ ഡാറ്റാസെറ്റ് ഉണ്ടെന്ന് കരുതി, ഈ പക്ഷികളെക്കുറിച്ച് കൂടുതൽ കണ്ടെത്താം.
@ -151,7 +151,7 @@ birds_filtered %>% group_by(Category) %>%
```
താഴെ കൊടുത്തിരിക്കുന്ന കോഡിൽ, ഡാറ്റ മാനിപ്പുലേറ്റ് ചെയ്ത് ഗ്രൂപ്പ് ചെയ്യാൻ സഹായിക്കുന്ന [dplyr](https://www.rdocumentation.org/packages/dplyr/versions/0.7.8)യും [lubridate](https://www.rdocumentation.org/packages/lubridate/versions/1.8.0)യും പാക്കേജുകൾ ഇൻസ്റ്റാൾ ചെയ്യുന്നു. ആദ്യം, പക്ഷികളുടെ `Category` പ്രകാരം ഡാറ്റ ഗ്രൂപ്പ് ചെയ്ത് `MinLength`, `MaxLength`, `MinBodyMass`, `MaxBodyMass`, `MinWingspan`, `MaxWingspan` കോളങ്ങൾ സംഗ്രഹിക്കുന്നു. പിന്നെ `ggplot2` ഉപയോഗിച്ച് ബാർ ചാർട്ട് പ്ലോട്ട് ചെയ്യുന്നു, വ്യത്യസ്ത വിഭാഗങ്ങൾക്ക് നിറങ്ങൾ നിശ്ചയിച്ച് ലേബലുകൾ ചേർക്കുന്നു.
![Stacked bar chart](../../../../../translated_images/ml/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.png)
![Stacked bar chart](../../../../../translated_images/ml/stacked-bar-chart.0c92264e89da7b39.webp)
ഈ ബാർ ചാർട്ട് വായിക്കാൻ ബുദ്ധിമുട്ടാണ്, കാരണം ഗ്രൂപ്പ് ചെയ്യാത്ത ഡാറ്റ വളരെ കൂടുതലാണ്. നിങ്ങൾ പ്ലോട്ട് ചെയ്യാൻ ആഗ്രഹിക്കുന്ന ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം, അതിനാൽ പക്ഷികളുടെ നീളം അവരുടെ വിഭാഗം അടിസ്ഥാനമാക്കി നോക്കാം.
@ -166,7 +166,7 @@ ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()
```
`Category` കോളത്തിൽ ഉള്ള വ്യത്യസ്ത മൂല്യങ്ങൾ എണ്ണുകയും അവ `birds_count` എന്ന പുതിയ ഡാറ്റാഫ്രെയിമിൽ ക്രമീകരിക്കുകയും ചെയ്യുന്നു. ഈ ക്രമീകരിച്ച ഡാറ്റയെ ഫാക്ടർ ലെവലിൽ ഉൾപ്പെടുത്തി ക്രമീകരിച്ച രീതിയിൽ പ്ലോട്ട് ചെയ്യുന്നു. `ggplot2` ഉപയോഗിച്ച് ബാർ ചാർട്ട് സൃഷ്ടിക്കുന്നു. `coord_flip()` ഉപയോഗിച്ച് ഹോരിസോണ്ടൽ ബാറുകൾ പ്ലോട്ട് ചെയ്യുന്നു.
![category-length](../../../../../translated_images/ml/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.png)
![category-length](../../../../../translated_images/ml/category-length.7e34c296690e85d6.webp)
ഈ ബാർ ചാർട്ട് ഓരോ വിഭാഗത്തിലും പക്ഷികളുടെ എണ്ണം നല്ല രീതിയിൽ കാണിക്കുന്നു. ഒരു നിമിഷത്തിൽ, ഈ പ്രദേശത്തെ ഏറ്റവും വലിയ പക്ഷി എണ്ണം Ducks/Geese/Waterfowl വിഭാഗത്തിലാണ് എന്ന് കാണാം. മിന്നസോട്ട '10,000 തടാകങ്ങളുടെ നാട്' ആകുന്നതിനാൽ ഇത് അത്ഭുതകരമല്ല!
@ -189,7 +189,7 @@ ggplot(birds_grouped,aes(Category,MaxLength))+geom_bar(stat="identity")+coord_fl
```
`birds_filtered` ഡാറ്റ `Category` പ്രകാരം ഗ്രൂപ്പ് ചെയ്ത് ബാർ ഗ്രാഫ് പ്ലോട്ട് ചെയ്യുന്നു.
![comparing data](../../../../../translated_images/ml/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.png)
![comparing data](../../../../../translated_images/ml/comparingdata.f486a450d61c7ca5.webp)
ഇവിടെ അത്ഭുതകരമായ ഒന്നുമില്ല: ഹമ്മിംഗ്‌ബർഡുകൾക്ക് പെലിക്കാനുകളോ ഗീസുകളോ അപേക്ഷിച്ച് ഏറ്റവും കുറഞ്ഞ MaxLength ഉണ്ട്. ഡാറ്റ ലജിക്കൽ ആകുമ്പോൾ നല്ലതാണ്!
@ -201,7 +201,7 @@ ggplot(data=birds_grouped, aes(x=Category)) +
geom_bar(aes(y=MinLength), stat="identity", position="identity", fill='orange')+
coord_flip()
```
![super-imposed values](../../../../../translated_images/ml/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.png)
![super-imposed values](../../../../../translated_images/ml/superimposed-values.5363f0705a1da416.webp)
## 🚀 ചലഞ്ച്

@ -36,7 +36,7 @@ ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
geom_point() +
ggtitle("Max Length per order") + coord_flip()
```
![max length per order](../../../../../translated_images/ml/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.png)
![max length per order](../../../../../translated_images/ml/max-length-per-order.e5b283d952c78c12.webp)
ഇത് ഓരോ പക്ഷി ഓർഡറിനും ശരീര നീളത്തിന്റെ പൊതുവായ വിതരണത്തിന്റെ ഒരു അവലോകനമാണ് നൽകുന്നത്, പക്ഷേ യഥാർത്ഥ വിതരണങ്ങൾ പ്രദർശിപ്പിക്കാൻ ഇത് ഏറ്റവും അനുയോജ്യമായ മാർഗം അല്ല. ആ ജോലി സാധാരണയായി ഹിസ്റ്റോഗ്രാം സൃഷ്ടിച്ച് കൈകാര്യം ചെയ്യുന്നു.
## ഹിസ്റ്റോഗ്രാമുകളുമായി പ്രവർത്തിക്കൽ
@ -47,7 +47,7 @@ ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
geom_histogram(bins=10)+ylab('Frequency')
```
![distribution over entire dataset](../../../../../translated_images/ml/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.png)
![distribution over entire dataset](../../../../../translated_images/ml/distribution-over-the-entire-dataset.d22afd3fa96be854.webp)
നിങ്ങൾക്ക് കാണാമല്ലോ, ഈ ഡാറ്റാസെറ്റിലെ 400+ പക്ഷികളിൽ ഭൂരിഭാഗവും അവരുടെ പരമാവധി ശരീരഭാരം 2000-ൽ താഴെ വരുന്ന പരിധിയിലാണ്. `bins` പാരാമീറ്റർ ഉയർന്ന ഒരു സംഖ്യയാക്കി, ഉദാഹരണത്തിന് 30 ആക്കി, ഡാറ്റയിൽ കൂടുതൽ洞察ം നേടാം:
@ -55,7 +55,7 @@ ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) + geom_histogram(bins=30)+ylab('Frequency')
```
![distribution-30bins](../../../../../translated_images/ml/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.png)
![distribution-30bins](../../../../../translated_images/ml/distribution-30bins.6a3921ea7a421bf7.webp)
ഈ ചാർട്ട് വിതരണത്തെ കുറച്ച് കൂടുതൽ സൂക്ഷ്മമായി കാണിക്കുന്നു. ഇടതുവശത്തേക്ക് കുറച്ച് കുറവുള്ള ചാർട്ട് സൃഷ്ടിക്കാൻ, നിങ്ങൾക്ക് ഒരു നിശ്ചിത പരിധിയിലുള്ള ഡാറ്റ മാത്രം തിരഞ്ഞെടുക്കണം:
@ -67,7 +67,7 @@ ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_histogram(bins=30)+ylab('Frequency')
```
![filtered histogram](../../../../../translated_images/ml/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.png)
![filtered histogram](../../../../../translated_images/ml/filtered-histogram.6bf5d2bfd8253322.webp)
✅ മറ്റ് ഫിൽട്ടറുകളും ഡാറ്റ പോയിന്റുകളും പരീക്ഷിക്കുക. ഡാറ്റയുടെ മുഴുവൻ വിതരണവും കാണാൻ, `['MaxBodyMass']` ഫിൽട്ടർ നീക്കം ചെയ്ത് ലേബൽ ചെയ്ത വിതരണങ്ങൾ കാണിക്കുക.
@ -81,7 +81,7 @@ ggplot(data=birds_filtered_1, aes(x=MaxBodyMass, y=MaxLength) ) +
```
ഈ രണ്ട് ഘടകങ്ങൾ തമ്മിൽ പ്രതീക്ഷിക്കപ്പെട്ട ബന്ധം ഒരു പ്രതീക്ഷിച്ച അക്ഷരേഖയിൽ കാണപ്പെടുന്നു, പ്രത്യേകിച്ച് ശക്തമായ ഒരു സമന്വയ ബിന്ദു:
![2d plot](../../../../../translated_images/ml/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.png)
![2d plot](../../../../../translated_images/ml/2d-plot.c504786f439bd7eb.webp)
ഹിസ്റ്റോഗ്രാമുകൾ സംഖ്യാത്മക ഡാറ്റയ്ക്ക് സാധാരണയായി നല്ല രീതിയിൽ പ്രവർത്തിക്കുന്നു. എന്നാൽ നിങ്ങൾക്ക് ടെക്സ്റ്റ് ഡാറ്റയുടെ അടിസ്ഥാനത്തിൽ വിതരണങ്ങൾ കാണേണ്ടതുണ്ടെങ്കിൽ?
@ -113,7 +113,7 @@ ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
scale_fill_manual(name="Conservation Status",values=c("red","green","blue","pink"),labels=c("Endangered","Near Threathened","Vulnerable","Least Concern"))
```
![wingspan and conservation collation](../../../../../translated_images/ml/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.png)
![wingspan and conservation collation](../../../../../translated_images/ml/wingspan-conservation-collation.4024e9aa6910866a.webp)
കുറഞ്ഞ വിങ്‌സ്‌പാനും സംരക്ഷണ നിലയ്ക്കും ഇടയിൽ നല്ല ബന്ധമില്ലെന്ന് തോന്നുന്നു. ഈ രീതിയിൽ ഡാറ്റാസെറ്റിലെ മറ്റ് ഘടകങ്ങളും പരീക്ഷിക്കുക. നിങ്ങൾക്ക് ഏതെങ്കിലും ബന്ധം കണ്ടെത്താമോ?
@ -127,7 +127,7 @@ ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
geom_density()
```
![density plot](../../../../../translated_images/ml/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.png)
![density plot](../../../../../translated_images/ml/density-plot.675ccf865b76c690.webp)
മുൻപത്തെ കുറഞ്ഞ വിങ്‌സ്‌പാൻ ഡാറ്റയ്ക്കുള്ള പ്ലോട്ടിനെ പോലെ ഇത് കാണാം; ഇത് കുറച്ച് സ്മൂത്താണ്. നിങ്ങൾ രണ്ടാമത്തെ ചാർട്ടിൽ നിർമ്മിച്ച ജാഗ്ഗഡ് MaxBodyMass ലൈനിനെ സ്മൂത്ത് ആക്കാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, ഈ രീതിയിൽ പുനഃസൃഷ്ടിച്ച് വളരെ നന്നായി സ്മൂത്ത് ആക്കാം:
@ -135,7 +135,7 @@ ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_density()
```
![bodymass density](../../../../../translated_images/ml/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.png)
![bodymass density](../../../../../translated_images/ml/bodymass-smooth.d31ce526d82b0a1f.webp)
കുറച്ച് സ്മൂത്ത്, എന്നാൽ വളരെ സ്മൂത്ത് അല്ലാത്ത ഒരു ലൈനിനായി, `adjust` പാരാമീറ്റർ എഡിറ്റ് ചെയ്യുക:
@ -143,7 +143,7 @@ ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_density(adjust = 1/5)
```
![less smooth bodymass](../../../../../translated_images/ml/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.png)
![less smooth bodymass](../../../../../translated_images/ml/less-smooth-bodymass.10f4db8b683cc17d.webp)
✅ ഈ തരം പ്ലോട്ടിനുള്ള പാരാമീറ്ററുകൾക്കുറിച്ച് വായിച്ച് പരീക്ഷണങ്ങൾ നടത്തുക!
@ -153,7 +153,7 @@ ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
ggplot(data=birds_filtered_1,aes(x = MaxBodyMass, fill = Order)) +
geom_density(alpha=0.5)
```
![bodymass per order](../../../../../translated_images/ml/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.png)
![bodymass per order](../../../../../translated_images/ml/bodymass-per-order.9d2b065dd931b928.webp)
## 🚀 വെല്ലുവിളി

@ -88,7 +88,7 @@ pie(grouped$count,grouped$class, main="Edible?")
```
ഇവിടെ, ഈ ഡാറ്റയുടെ അനുപാതങ്ങൾ ഈ രണ്ട് മഷ്‌റൂം ക്ലാസുകൾ അനുസരിച്ച് കാണിക്കുന്ന ഒരു പൈ ചാർട്ട്. ലേബലുകളുടെ ക്രമം ശരിയാണെന്ന് ഉറപ്പാക്കുന്നത് വളരെ പ്രധാനമാണ്, പ്രത്യേകിച്ച് ഇവിടെ, അതിനാൽ ലേബൽ അറേ എങ്ങനെ നിർമ്മിക്കപ്പെടുന്നു എന്ന് പരിശോധിക്കുക!
![pie chart](../../../../../translated_images/ml/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.png)
![pie chart](../../../../../translated_images/ml/pie1-wb.685df063673751f4.webp)
## ഡോണട്ടുകൾ!
@ -123,7 +123,7 @@ library(webr)
PieDonut(habitat, aes(habitat, count=count))
```
![donut chart](../../../../../translated_images/ml/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.png)
![donut chart](../../../../../translated_images/ml/donut-wb.34e6fb275da9d834.webp)
ഈ കോഡ് രണ്ട് ലൈബ്രറികൾ ഉപയോഗിക്കുന്നു - ggplot2, webr. webr ലൈബ്രറിയുടെ PieDonut ഫംഗ്ഷൻ ഉപയോഗിച്ച്, ഡോണട്ട് ചാർട്ട് എളുപ്പത്തിൽ സൃഷ്ടിക്കാം!
@ -160,7 +160,7 @@ waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual
വാഫിൾ ചാർട്ട് ഉപയോഗിച്ച്, ഈ മഷ്‌റൂം dataset-ലെ ക്യാപ് നിറങ്ങളുടെ അനുപാതങ്ങൾ വ്യക്തമായി കാണാം. രസകരമായി, പച്ച ക്യാപ് ഉള്ള മഷ്‌റൂമുകൾ വളരെ കൂടുതലാണ്!
![waffle chart](../../../../../translated_images/ml/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.png)
![waffle chart](../../../../../translated_images/ml/waffle.aaa75c5337735a6e.webp)
ഈ പാഠത്തിൽ, നിങ്ങൾക്ക് അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കുന്ന മൂന്ന് മാർഗങ്ങൾ പഠിച്ചു. ആദ്യം, ഡാറ്റയെ വിഭാഗങ്ങളായി ഗ്രൂപ്പ് ചെയ്യണം, പിന്നെ ഡാറ്റ പ്രദർശിപ്പിക്കാൻ ഏറ്റവും നല്ല മാർഗം - പൈ, ഡോണട്ട്, അല്ലെങ്കിൽ വാഫിൾ - തിരഞ്ഞെടുക്കണം. എല്ലാം രുചികരവും ഉപയോക്താവിന് dataset-ന്റെ ഉടൻ ഒരു ദൃശ്യസംഗ്രഹം നൽകുന്നതുമാണ്.

@ -42,7 +42,7 @@ library(ggplot2)
ggplot(honey, aes(x = priceperlb, y = state)) +
geom_point(colour = "blue")
```
![scatterplot 1](../../../../../translated_images/ml/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.png)
![scatterplot 1](../../../../../translated_images/ml/scatter1.86b8900674d88b26.webp)
ഇപ്പോൾ, വർഷം തോറും വില എങ്ങനെ മാറിയെന്ന് കാണിക്കാൻ തേൻ നിറത്തിലുള്ള കളർ സ്കീം ഉപയോഗിച്ച് സമാന ഡാറ്റ കാണിക്കുക. വർഷം തോറും മാറ്റം കാണിക്കാൻ 'scale_color_gradientn' പാരാമീറ്റർ ചേർക്കാം:
@ -52,7 +52,7 @@ ggplot(honey, aes(x = priceperlb, y = state)) +
ggplot(honey, aes(x = priceperlb, y = state, color=year)) +
geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7))
```
![scatterplot 2](../../../../../translated_images/ml/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.png)
![scatterplot 2](../../../../../translated_images/ml/scatter2.4d1cbc693bad20e2.webp)
ഈ കളർ സ്കീം മാറ്റത്തോടെ, പൗണ്ട് പ്രതി തേൻ വില വർഷം തോറും ശക്തമായി ഉയരുന്നുവെന്ന് വ്യക്തമായി കാണാം. ഡാറ്റയിൽ ഒരു സാമ്പിൾ സെറ്റ് പരിശോധിച്ചാൽ (ഉദാഹരണത്തിന്, അരിസോണ), വില വർഷം തോറും ഉയരുന്ന ഒരു പാറ്റേൺ കാണാം, കുറച്ച് ഒഴിവുകൾ കൂടെ:
@ -83,7 +83,7 @@ ggplot(honey, aes(x = priceperlb, y = state)) +
```
ഡോട്ടുകളുടെ വലിപ്പം ക്രമാനുസൃതമായി വർദ്ധിക്കുന്നതായി കാണാം.
![scatterplot 3](../../../../../translated_images/ml/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.png)
![scatterplot 3](../../../../../translated_images/ml/scatter3.722d21e6f20b3ea2.webp)
ഇത് സപ്ലൈ-ഡിമാൻഡ് സാദ്ധ്യതയുള്ള ഒരു ലളിതമായ കേസ് ആണോ? കാലാവസ്ഥ മാറ്റം, കോളനി തകർച്ച തുടങ്ങിയ ഘടകങ്ങൾ കാരണം, വർഷം തോറും വാങ്ങാനുളള തേൻ കുറയുന്നുണ്ടോ, അതുകൊണ്ട് വില ഉയരുന്നുണ്ടോ?
@ -98,7 +98,7 @@ qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab
```
ഉത്തരം: ചില ഒഴിവുകൾ കൂടെ, 2003-ൽ ചില വ്യത്യാസങ്ങൾ കാണാം:
![line chart 1](../../../../../translated_images/ml/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.png)
![line chart 1](../../../../../translated_images/ml/line1.299b576fbb2a59e6.webp)
ചോദ്യം: 2003-ൽ തേൻ സപ്ലൈയിൽ ഒരു പീക്ക് കാണാമോ? മൊത്തം ഉത്പാദനം വർഷം തോറും നോക്കിയാൽ?
@ -106,7 +106,7 @@ qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab
qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod")
```
![line chart 2](../../../../../translated_images/ml/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.png)
![line chart 2](../../../../../translated_images/ml/line2.3b18fcda7176ceba.webp)
ഉത്തരം: അത്രയുമല്ല. മൊത്തം ഉത്പാദനം ആ വർഷം വർദ്ധിച്ചിട്ടുണ്ടെന്ന് തോന്നുന്നു, എങ്കിലും സാധാരണയായി ഈ വർഷങ്ങളിൽ തേൻ ഉത്പാദനം കുറയുകയാണ്.
@ -126,7 +126,7 @@ ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) +
```
ഈ ദൃശ്യവൽക്കരണത്തിൽ, കോളനി പ്രതി ഉത്പാദനവും കോളനികളുടെ എണ്ണവും വർഷം തോറും, 3 കോളങ്ങൾ വച്ച് വച്ച് താരതമ്യം ചെയ്യാം:
![facet grid](../../../../../translated_images/ml/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.png)
![facet grid](../../../../../translated_images/ml/facet.491ad90d61c2a7cc.webp)
ഈ ഡാറ്റാസെറ്റിൽ, കോളനികളുടെ എണ്ണം, അവയുടെ ഉത്പാദനം വർഷം തോറും, സംസ്ഥാനങ്ങൾ അനുസരിച്ച് പ്രത്യേകമായ ഒന്നും കാണാനില്ല. ഈ രണ്ട് വേരിയബിളുകൾ തമ്മിൽ സഹബന്ധം കണ്ടെത്താൻ മറ്റൊരു മാർഗ്ഗമുണ്ടോ?
@ -143,7 +143,7 @@ plot(honey$year, honey$yieldpercol, pch = 17, col = 3,
axis(side = 4, at = pretty(range(y2)))
mtext("colony yield", side = 4, line = 3)
```
![superimposed plots](../../../../../translated_images/ml/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.png)
![superimposed plots](../../../../../translated_images/ml/dual-line.fc4665f360a54018.webp)
2003-ൽ പ്രത്യേകമായി ഒന്നും കാണാനില്ലെങ്കിലും, ഈ പാഠം ഒരു സന്തോഷകരമായ നോട്ടിൽ അവസാനിപ്പിക്കാൻ സഹായിക്കുന്നു: മൊത്തം കോളനികളുടെ എണ്ണം കുറയുന്നുണ്ടെങ്കിലും, അവയുടെ എണ്ണം സ്ഥിരതയുള്ളതും, കോളനി പ്രതി ഉത്പാദനം കുറയുന്നുണ്ടെങ്കിലും.

@ -38,25 +38,25 @@
ഒരു ഡാറ്റ സയന്റിസ്റ്റ് ശരിയായ ഡാറ്റയ്ക്ക് ശരിയായ ചാർട്ട് തിരഞ്ഞെടുക്കാൻ ശ്രദ്ധിച്ചാലും, ഡാറ്റയെ തന്നെ തകർക്കുന്ന വിധത്തിൽ ഒരു കാര്യം തെളിയിക്കാൻ ഡാറ്റ പ്രദർശിപ്പിക്കുന്ന നിരവധി മാർഗ്ഗങ്ങൾ ഉണ്ട്. വഞ്ചനാപരമായ ചാർട്ടുകളും ഇൻഫോഗ്രാഫിക്സും നിരവധി ഉദാഹരണങ്ങളുണ്ട്!
[![How Charts Lie by Alberto Cairo](../../../../../translated_images/ml/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
[![How Charts Lie by Alberto Cairo](../../../../../translated_images/ml/tornado.2880ffc7f135f82b.webp)](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
> 🎥 വഞ്ചനാപരമായ ചാർട്ടുകൾക്കുറിച്ചുള്ള കോൺഫറൻസ് ടോക്കിനായി മുകളിൽ ചിത്രത്തിൽ ക്ലിക്ക് ചെയ്യുക
ഈ ചാർട്ട് X അക്ഷം മറിച്ച് സത്യം മറിച്ച് കാണിക്കുന്നു, തീയതി അടിസ്ഥാനമാക്കി:
![bad chart 1](../../../../../translated_images/ml/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.png)
![bad chart 1](../../../../../translated_images/ml/bad-chart-1.596bc93425a8ac30.webp)
[ഈ ചാർട്ട്](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) കൂടുതൽ വഞ്ചനാപരമാണ്, കാരണം കണ്ണ് വലത്തേക്ക് ആകർഷിക്കപ്പെടുന്നു, കാലക്രമത്തിൽ COVID കേസുകൾ വിവിധ കൗണ്ടികളിൽ കുറയുകയാണെന്ന് നിഗമനം ചെയ്യാൻ. എന്നാൽ, തീയതികൾ സൂക്ഷ്മമായി നോക്കിയാൽ, അവ വഞ്ചനാപരമായ താഴ്ന്ന ട്രെൻഡ് നൽകാൻ പുനഃക്രമീകരിച്ചിട്ടുള്ളതായി കാണാം.
![bad chart 2](../../../../../translated_images/ml/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.jpg)
![bad chart 2](../../../../../translated_images/ml/bad-chart-2.62edf4d2f30f4e51.webp)
ഈ പ്രശസ്ത ഉദാഹരണം നിറവും മറിച്ച Y അക്ഷവും ഉപയോഗിച്ച് വഞ്ചന ചെയ്യുന്നു: തോക്കു-സഹായക നിയമം പാസായതിന് ശേഷം തോക്ക് മരണങ്ങൾ ഉയർന്നതായി നിഗമനം ചെയ്യേണ്ടതിനു പകരം, കണ്ണ് മറിച്ച് സത്യം തെറ്റായി കാണുന്നു:
![bad chart 3](../../../../../translated_images/ml/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.jpg)
![bad chart 3](../../../../../translated_images/ml/bad-chart-3.e201e2e915a230bc.webp)
ഈ വിചിത്രമായ ചാർട്ട് അനുപാതം എങ്ങനെ മാനിപ്പുലേറ്റ് ചെയ്യാമെന്ന് ഹാസ്യകരമായി കാണിക്കുന്നു:
![bad chart 4](../../../../../translated_images/ml/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.jpg)
![bad chart 4](../../../../../translated_images/ml/bad-chart-4.8872b2b881ffa96c.webp)
തുല്യമായവയെ താരതമ്യം ചെയ്യുന്നത് മറ്റൊരു സംശയാസ്പദമായ തന്ത്രമാണ്. 'സ്പ്യൂറിയസ് കോറിലേഷൻസ്' എന്ന വിഷയത്തെക്കുറിച്ച് മുഴുവൻ വെബ്‌സൈറ്റ് [wonderful web site](https://tylervigen.com/spurious-correlations) ഉണ്ട്, മെയ്ൻയിലെ വിവാഹമോചന നിരക്കും മാർഗറിൻ ഉപഭോഗവും തമ്മിലുള്ള 'തथ്യങ്ങൾ' correlated ആയി പ്രദർശിപ്പിക്കുന്നു. Reddit ഗ്രൂപ്പ് ഡാറ്റയുടെ [അസൗന്ദര്യ ഉപയോഗങ്ങൾ](https://www.reddit.com/r/dataisugly/top/?t=all) ശേഖരിക്കുന്നു.
@ -91,13 +91,13 @@
നിങ്ങളുടെ ഡാറ്റ ടെക്സ്റ്റ് ആണെങ്കിൽ, X അക്ഷ上的 വാചകം വായനാസൗകര്യത്തിനായി കോണിൽ കാണിക്കാം. [plot3D](https://cran.r-project.org/web/packages/plot3D/index.html) 3D പ്ലോട്ടിംഗ് നൽകുന്നു, നിങ്ങളുടെ ഡാറ്റ അത് പിന്തുണച്ചാൽ. അതുപയോഗിച്ച് സങ്കീർണ്ണമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കാം.
![3d plots](../../../../../translated_images/ml/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.png)
![3d plots](../../../../../translated_images/ml/3d.db1734c151eee87d.webp)
## അനിമേഷൻ, 3D ചാർട്ട് പ്രദർശനം
ഇന്നത്തെ മികച്ച ഡാറ്റാ ദൃശ്യവത്കരണങ്ങളിൽ ചിലത് അനിമേറ്റഡ് ആണ്. Shirley Wu D3 ഉപയോഗിച്ച് '[film flowers](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)' പോലുള്ള അത്ഭുതകരമായവ ഉണ്ടാക്കി, ഓരോ പൂവും ഒരു സിനിമയുടെ ദൃശ്യവത്കരണമാണ്. Guardian-നായി മറ്റൊരു ഉദാഹരണം 'bussed out' ആണ്, Greensock, D3 എന്നിവയുമായി സംയോജിപ്പിച്ച ഇന്ററാക്ടീവ് അനുഭവം, സ്ക്രോൾടെല്ലിംഗ് ലേഖന ഫോർമാറ്റിൽ NYC എങ്ങനെ നഗരത്തിലെ ഹോമ്ലെസ്സ് പ്രശ്നം ബസ്സിലൂടെ പുറത്തേക്ക് കൊണ്ടുപോകുന്നു എന്ന് കാണിക്കുന്നു.
![busing](../../../../../translated_images/ml/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.png)
![busing](../../../../../translated_images/ml/busing.8157cf1bc89a3f65.webp)
> "Bussed Out: How America Moves its Homeless" from [the Guardian](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). Visualizations by Nadieh Bremer & Shirley Wu
@ -107,7 +107,7 @@
നിങ്ങൾ ഒരു വെബ് ആപ്പ് പൂർത്തിയാക്കും, ഇത് ഈ സോഷ്യൽ നെറ്റ്‌വർക്ക് അനിമേറ്റഡ് ദൃശ്യവത്കരണം പ്രദർശിപ്പിക്കും. ഇത് Vue.js, D3 ഉപയോഗിച്ച് [നെറ്റ്‌വർക്ക് ദൃശ്യവത്കരണം](https://github.com/emiliorizzo/vue-d3-network) സൃഷ്ടിക്കാൻ നിർമ്മിച്ച ഒരു ലൈബ്രറി ഉപയോഗിക്കുന്നു. ആപ്പ് പ്രവർത്തിക്കുമ്പോൾ, സ്ക്രീനിൽ നോഡുകൾ നീക്കി ഡാറ്റ മാറ്റാം.
![liaisons](../../../../../translated_images/ml/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.png)
![liaisons](../../../../../translated_images/ml/liaisons.90ce7360bcf84765.webp)
## പ്രോജക്ട്: D3.js ഉപയോഗിച്ച് ഒരു നെറ്റ്‌വർക്ക് കാണിക്കുന്ന ചാർട്ട് നിർമ്മിക്കുക

@ -1,6 +1,6 @@
# ദൃശ്യവത്കരണങ്ങൾ
![a bee on a lavender flower](../../../translated_images/ml/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.jpg)
![a bee on a lavender flower](../../../translated_images/ml/bee.0aa1d91132b12e3a.webp)
> ഫോട്ടോ <a href="https://unsplash.com/@jenna2980?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ജെന്ന ലി</a> യുടെ <a href="https://unsplash.com/s/photos/bees-in-a-meadow?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">അൺസ്പ്ലാഷിൽ</a> നിന്നാണ്

@ -16,7 +16,7 @@
ഈ പാഠം ലൈഫ്‌സൈക്കിളിന്റെ 3 ഭാഗങ്ങളായ പിടിച്ചെടുക്കൽ, പ്രോസസ്സിംഗ്, പരിപാലനം എന്നിവയിൽ കേന്ദ്രീകരിക്കുന്നു.
![Diagram of the data science lifecycle](../../../../translated_images/ml/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.jpg)
![Diagram of the data science lifecycle](../../../../translated_images/ml/data-science-lifecycle.a1e362637503c4fb.webp)
> ഫോട്ടോ: [ബർക്ക്ലി സ്കൂൾ ഓഫ് ഇൻഫർമേഷൻ](https://ischoolonline.berkeley.edu/data-science/what-is-data-science/)
## പിടിച്ചെടുക്കൽ
@ -88,7 +88,7 @@
|ടീം ഡാറ്റാ സയൻസ് പ്രോസസ് (TDSP)|ക്രോസ്-ഇൻഡസ്ട്രി സ്റ്റാൻഡേർഡ് പ്രോസസ് ഫോർ ഡാറ്റ മൈനിംഗ് (CRISP-DM)|
|--|--|
|![Team Data Science Lifecycle](../../../../translated_images/ml/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.png) | ![Data Science Process Alliance Image](../../../../translated_images/ml/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.png) |
|![Team Data Science Lifecycle](../../../../translated_images/ml/tdsp-lifecycle2.e19029d598e2e73d.webp) | ![Data Science Process Alliance Image](../../../../translated_images/ml/CRISP-DM.8bad2b4c66e62aa7.webp) |
| ചിത്രം: [Microsoft](https://docs.microsoft.comazure/architecture/data-science-process/lifecycle) | ചിത്രം: [Data Science Process Alliance](https://www.datascience-pm.com/crisp-dm-2/) |
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/27)

@ -1,6 +1,6 @@
# ഡാറ്റ സയൻസ് ലൈഫ്‌സൈക്കിൾ
![communication](../../../translated_images/ml/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.jpg)
![communication](../../../translated_images/ml/communication.06d8e2a88d30d168.webp)
> ഫോട്ടോ <a href="https://unsplash.com/@headwayio?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ഹെഡ്‌വേ</a> യുടെ <a href="https://unsplash.com/s/photos/communication?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">അൺസ്പ്ലാഷിൽ</a>
ഈ പാഠങ്ങളിൽ, ഡാറ്റ സയൻസ് ലൈഫ്‌സൈക്കിളിന്റെ ചില ഭാഗങ്ങൾ, ഡാറ്റ ചുറ്റിപ്പറ്റിയുള്ള വിശകലനവും ആശയവിനിമയവും ഉൾപ്പെടെ, നിങ്ങൾ അന്വേഷിക്കും.

@ -53,7 +53,7 @@
പ്രോജക്ടുകൾ നിർമ്മിച്ച് പരീക്ഷണങ്ങൾ നടത്തുന്നത് നിങ്ങളുടെ കഴിവുകളും അറിവുകളും പരീക്ഷിക്കാൻ ഏറ്റവും നല്ല മാർഗമാണ്. ഈ പാഠത്തിൽ, ആസ്യൂർ ML സ്റ്റുഡിയോയിൽ ഹാർട്ട് ഫെയില്യർ ആക്രമണങ്ങൾ പ്രവചിക്കുന്ന ഡാറ്റാ സയൻസ് പ്രോജക്ട് നിർമ്മിക്കുന്ന രണ്ട് വ്യത്യസ്ത മാർഗങ്ങൾ പരിശോധിക്കാം: ലോ കോഡ്/നോ കോഡ് വഴി, ആസ്യൂർ ML SDK വഴി, താഴെ കാണുന്ന സ്കീമ പ്രകാരം:
![project-schema](../../../../translated_images/ml/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.png)
![project-schema](../../../../translated_images/ml/project-schema.736f6e403f321eb4.webp)
ഓരോ മാർഗത്തിനും സ്വന്തം ഗുണങ്ങളും ദോഷങ്ങളും ഉണ്ട്. ലോ കോഡ്/നോ കോഡ് വഴി GUI (ഗ്രാഫിക്കൽ യൂസർ ഇന്റർഫേസ്) ഉപയോഗിച്ച് ആരംഭിക്കാൻ എളുപ്പമാണ്, കോഡ് അറിവ് ആവശ്യമില്ല. ഈ രീതിയിൽ പ്രോജക്ടിന്റെ സാധുത വേഗത്തിൽ പരിശോധിക്കാനും POC (പ്രൂഫ് ഓഫ് കോൺസെപ്റ്റ്) സൃഷ്ടിക്കാനും കഴിയും. എന്നാൽ, പ്രോജക്ട് വളരുമ്പോൾ പ്രൊഡക്ഷൻ റെഡിയാക്കേണ്ടതുണ്ടെങ്കിൽ GUI വഴി റിസോഴ്‌സുകൾ സൃഷ്ടിക്കുന്നത് പ്രായോഗികമല്ല. റിസോഴ്‌സുകൾ സൃഷ്ടിക്കുന്നതിൽ നിന്നും മോഡൽ ഡിപ്ലോയ്മെന്റിലേക്കുള്ള എല്ലാ കാര്യങ്ങളും പ്രോഗ്രാമാറ്റിക്കായി ഓട്ടോമേറ്റ് ചെയ്യേണ്ടതുണ്ട്. ആസ്യൂർ ML SDK ഉപയോഗിക്കുന്നതിന്റെ പ്രാധാന്യം ഇവിടെ വരുന്നു.
@ -106,15 +106,15 @@
1. നിങ്ങളുടെ ആസ്യൂർ സബ്സ്ക്രിപ്ഷനുമായി ബന്ധപ്പെട്ട മൈക്രോസോഫ്റ്റ് ക്രെഡൻഷ്യലുകൾ ഉപയോഗിച്ച് [ആസ്യൂർ പോർട്ടലിൽ](https://ms.portal.azure.com/) സൈൻ ഇൻ ചെയ്യുക.
2. **Create a resource** തിരഞ്ഞെടുക്കുക
![workspace-1](../../../../translated_images/ml/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.png)
![workspace-1](../../../../translated_images/ml/workspace-1.ac8694d60b073ed1.webp)
മെഷീൻ ലേണിംഗ് തിരയുക, മെഷീൻ ലേണിംഗ് ടൈൽ തിരഞ്ഞെടുക്കുക
![workspace-2](../../../../translated_images/ml/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.png)
![workspace-2](../../../../translated_images/ml/workspace-2.ae7c486db8796147.webp)
സൃഷ്ടിക്കുക ബട്ടൺ ക്ലിക്ക് ചെയ്യുക
![workspace-3](../../../../translated_images/ml/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.png)
![workspace-3](../../../../translated_images/ml/workspace-3.398ca4a5858132cc.webp)
ക്രമീകരണങ്ങൾ താഴെപോലെ പൂരിപ്പിക്കുക:
- സബ്സ്ക്രിപ്ഷൻ: നിങ്ങളുടെ ആസ്യൂർ സബ്സ്ക്രിപ്ഷൻ
@ -126,17 +126,17 @@
- അപ്ലിക്കേഷൻ ഇൻസൈറ്റ്സ്: നിങ്ങളുടെ വർക്ക്സ്പേസിനായി സൃഷ്ടിക്കപ്പെടുന്ന ഡിഫോൾട്ട് പുതിയ അപ്ലിക്കേഷൻ ഇൻസൈറ്റ്സ് റിസോഴ്‌സ് ശ്രദ്ധിക്കുക
- കണ്ടെയ്‌നർ രജിസ്ട്രി: ഇല്ല (മോഡൽ ആദ്യമായി കണ്ടെയ്‌നറിൽ ഡിപ്ലോയ് ചെയ്യുമ്പോൾ സ്വയം സൃഷ്ടിക്കും)
![workspace-4](../../../../translated_images/ml/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.png)
![workspace-4](../../../../translated_images/ml/workspace-4.bac87f6599c4df63.webp)
- സൃഷ്ടിക്കുക + അവലോകനം ക്ലിക്ക് ചെയ്ത് പിന്നീട് സൃഷ്ടിക്കുക ബട്ടൺ ക്ലിക്ക് ചെയ്യുക
3. നിങ്ങളുടെ വർക്ക്സ്പേസ് സൃഷ്ടിക്കപ്പെടുന്നത് കാത്തിരിക്കുക (ചില മിനിറ്റുകൾ എടുക്കാം). ശേഷം പോർട്ടലിൽ അതിലേക്ക് പോകുക. ഇത് മെഷീൻ ലേണിംഗ് ആസ്യൂർ സേവനത്തിലൂടെ കണ്ടെത്താം.
4. നിങ്ങളുടെ വർക്ക്സ്പേസ് ഓവർവ്യൂ പേജിൽ, ആസ്യൂർ മെഷീൻ ലേണിംഗ് സ്റ്റുഡിയോ ആരംഭിക്കുക (അല്ലെങ്കിൽ പുതിയ ബ്രൗസർ ടാബ് തുറന്ന് https://ml.azure.com-ൽ പോകുക), നിങ്ങളുടെ മൈക്രോസോഫ്റ്റ് അക്കൗണ്ട് ഉപയോഗിച്ച് സൈൻ ഇൻ ചെയ്യുക. ആവശ്യമായാൽ, നിങ്ങളുടെ ആസ്യൂർ ഡയറക്ടറി, സബ്സ്ക്രിപ്ഷൻ, ആസ്യൂർ ML വർക്ക്സ്പേസ് തിരഞ്ഞെടുക്കുക.
![workspace-5](../../../../translated_images/ml/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.png)
![workspace-5](../../../../translated_images/ml/workspace-5.a6eb17e0a5e64200.webp)
5. ആസ്യൂർ ML സ്റ്റുഡിയോയിൽ, ഇടത് മുകളിൽ ☰ ഐക്കൺ ടോഗിൾ ചെയ്ത് ഇന്റർഫേസ് ഉള്ള വിവിധ പേജുകൾ കാണുക. ഈ പേജുകൾ ഉപയോഗിച്ച് നിങ്ങളുടെ വർക്ക്സ്പേസ് റിസോഴ്‌സുകൾ നിയന്ത്രിക്കാം.
![workspace-6](../../../../translated_images/ml/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.png)
![workspace-6](../../../../translated_images/ml/workspace-6.8dd81fe841797ee1.webp)
നിങ്ങൾ ആസ്യൂർ പോർട്ടൽ ഉപയോഗിച്ച് വർക്ക്സ്പേസ് നിയന്ത്രിക്കാം, എന്നാൽ ഡാറ്റാ സയന്റിസ്റ്റുകൾക്കും മെഷീൻ ലേണിംഗ് ഓപ്പറേഷൻസ് എഞ്ചിനീയർമാർക്കും, ആസ്യൂർ ML സ്റ്റുഡിയോ വർക്ക്സ്പേസ് റിസോഴ്‌സുകൾ നിയന്ത്രിക്കാൻ കൂടുതൽ കേന്ദ്രീകൃതമായ യൂസർ ഇന്റർഫേസ് നൽകുന്നു.
@ -184,18 +184,18 @@ Low-priority instance എന്നത് ഇടപെടാവുന്നതാ
മുൻപ് സൃഷ്ടിച്ച [Azure ML workspace](https://ml.azure.com/) ൽ, compute ലേക്ക് പോകുക, നിങ്ങൾ ഇപ്പോൾ ചർച്ച ചെയ്ത വിവിധ കംപ്യൂട്ട് റിസോഴ്‌സുകൾ കാണാൻ കഴിയും (ഉദാ: compute instances, compute clusters, inference clusters, attached compute). ഈ പ്രോജക്ടിനായി, മോഡൽ പരിശീലനത്തിനായി ഒരു compute cluster ആവശ്യമുണ്ട്. സ്റ്റുഡിയോയിൽ, "Compute" മെനുവിൽ ക്ലിക്ക് ചെയ്യുക, തുടർന്ന് "Compute cluster" ടാബിൽ ക്ലിക്ക് ചെയ്ത് "+ New" ബട്ടൺ ക്ലിക്ക് ചെയ്ത് compute cluster സൃഷ്ടിക്കുക.
![22](../../../../translated_images/ml/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.png)
![22](../../../../translated_images/ml/cluster-1.b78cb630bb543729.webp)
1. നിങ്ങളുടെ ഓപ്ഷനുകൾ തിരഞ്ഞെടുക്കുക: Dedicated vs Low priority, CPU അല്ലെങ്കിൽ GPU, VM വലുപ്പം, കോർ എണ്ണം (ഈ പ്രോജക്ടിനായി ഡിഫോൾട്ട് സെറ്റിംഗുകൾ നിലനിർത്താം).
2. Next ബട്ടൺ ക്ലിക്ക് ചെയ്യുക.
![23](../../../../translated_images/ml/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.png)
![23](../../../../translated_images/ml/cluster-2.ea30cdbc9f926bb9.webp)
3. ക്ലസ്റ്ററിന് ഒരു കംപ്യൂട്ട് പേര് നൽകുക
4. നിങ്ങളുടെ ഓപ്ഷനുകൾ തിരഞ്ഞെടുക്കുക: കുറഞ്ഞ/പരമാവധി നോഡുകളുടെ എണ്ണം, സ്കെയിൽ ഡൗൺ ചെയ്യുന്നതിന് മുമ്പുള്ള ഐഡിൽ സെക്കൻഡുകൾ, SSH ആക്‌സസ്. കുറഞ്ഞ നോഡുകളുടെ എണ്ണം 0 ആണെങ്കിൽ, ക്ലസ്റ്റർ ഐഡിൽ ആയപ്പോൾ പണം ലാഭിക്കും. പരമാവധി നോഡുകളുടെ എണ്ണം കൂടുതലായാൽ പരിശീലനം കുറച്ച് സമയം എടുക്കും. പരമാവധി നോഡുകളുടെ ശുപാർശ 3 ആണ്.
5. "Create" ബട്ടൺ ക്ലിക്ക് ചെയ്യുക. ഈ ഘട്ടം കുറച്ച് മിനിറ്റുകൾ എടുക്കാം.
![29](../../../../translated_images/ml/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.png)
![29](../../../../translated_images/ml/cluster-3.8a334bc070ec173a.webp)
അദ്ഭുതം! ഇപ്പോൾ ഒരു Compute cluster ഉണ്ടാകുമ്പോൾ, ഡാറ്റ Azure ML Studio-യിൽ ലോഡ് ചെയ്യേണ്ടതാണ്.
@ -203,15 +203,15 @@ Low-priority instance എന്നത് ഇടപെടാവുന്നതാ
1. മുൻപ് സൃഷ്ടിച്ച [Azure ML workspace](https://ml.azure.com/) ൽ, ഇടത് മെനുവിൽ "Datasets" ക്ലിക്ക് ചെയ്ത് "+ Create dataset" ബട്ടൺ ക്ലിക്ക് ചെയ്ത് ഒരു dataset സൃഷ്ടിക്കുക. "From local files" ഓപ്ഷൻ തിരഞ്ഞെടുക്കുക, മുൻപ് ഡൗൺലോഡ് ചെയ്ത Kaggle dataset തിരഞ്ഞെടുക്കുക.
![24](../../../../translated_images/ml/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.png)
![24](../../../../translated_images/ml/dataset-1.e86ab4e10907a6e9.webp)
2. നിങ്ങളുടെ dataset-ന് ഒരു പേര്, തരം, വിവരണം നൽകുക. Next ക്ലിക്ക് ചെയ്യുക. ഫയലുകളിൽ നിന്ന് ഡാറ്റ അപ്‌ലോഡ് ചെയ്യുക. Next ക്ലിക്ക് ചെയ്യുക.
![25](../../../../translated_images/ml/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.png)
![25](../../../../translated_images/ml/dataset-2.f58de1c435d5bf9c.webp)
3. Schema-യിൽ, താഴെപ്പറയുന്ന ഫീച്ചറുകൾക്ക് ഡാറ്റ ടൈപ്പ് Boolean ആയി മാറ്റുക: anaemia, diabetes, high blood pressure, sex, smoking, DEATH_EVENT. Next ക്ലിക്ക് ചെയ്ത് Create ക്ലിക്ക് ചെയ്യുക.
![26](../../../../translated_images/ml/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.png)
![26](../../../../translated_images/ml/dataset-3.58db8c0eb783e892.webp)
ശ്രേഷ്ഠം! Dataset സജ്ജമായപ്പോൾ, compute cluster സൃഷ്ടിച്ചതിനുശേഷം, മോഡൽ പരിശീലനം ആരംഭിക്കാം!
@ -222,19 +222,19 @@ Automated machine learning (AutoML) മെഷീൻ ലേണിംഗ് മോ
1. മുൻപ് സൃഷ്ടിച്ച [Azure ML workspace](https://ml.azure.com/) ൽ, ഇടത് മെനുവിൽ "Automated ML" ക്ലിക്ക് ചെയ്ത് നിങ്ങൾ അപ്‌ലോഡ് ചെയ്ത dataset തിരഞ്ഞെടുക്കുക. Next ക്ലിക്ക് ചെയ്യുക.
![27](../../../../translated_images/ml/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.png)
![27](../../../../translated_images/ml/aml-1.67281a85d3a1e2f3.webp)
2. പുതിയ experiment പേര് നൽകുക, target column (DEATH_EVENT) തിരഞ്ഞെടുക്കുക, സൃഷ്ടിച്ച compute cluster തിരഞ്ഞെടുക്കുക. Next ക്ലിക്ക് ചെയ്യുക.
![28](../../../../translated_images/ml/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.png)
![28](../../../../translated_images/ml/aml-2.c9fb9cffb39ccbbe.webp)
3. "Classification" തിരഞ്ഞെടുക്കുക, Finish ക്ലിക്ക് ചെയ്യുക. ഈ ഘട്ടം compute cluster വലുപ്പം അനുസരിച്ച് 30 മിനിറ്റിൽ 1 മണിക്കൂർ വരെ എടുക്കാം.
![30](../../../../translated_images/ml/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.png)
![30](../../../../translated_images/ml/aml-3.a7952e4295f38cc6.webp)
4. റൺ പൂർത്തിയായ ശേഷം, "Automated ML" ടാബിൽ ക്ലിക്ക് ചെയ്യുക, നിങ്ങളുടെ റൺ തിരഞ്ഞെടുക്കുക, "Best model summary" കാർഡിലെ Algorithm ക്ലിക്ക് ചെയ്യുക.
![31](../../../../translated_images/ml/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.png)
![31](../../../../translated_images/ml/aml-4.7a627e09cb6f16d0.webp)
ഇവിടെ AutoML സൃഷ്ടിച്ച മികച്ച മോഡലിന്റെ വിശദമായ വിവരണം കാണാം. Models ടാബിൽ മറ്റ് മോഡലുകളും പരിശോധിക്കാം. Explanations (preview ബട്ടൺ) ൽ മോഡലുകൾ പരിശോധിക്കാൻ കുറച്ച് സമയം ചെലവഴിക്കുക. നിങ്ങൾ ഉപയോഗിക്കാൻ ആഗ്രഹിക്കുന്ന മോഡൽ തിരഞ്ഞെടുക്കുമ്പോൾ (ഇവിടെ AutoML തിരഞ്ഞെടുത്ത മികച്ച മോഡൽ തിരഞ്ഞെടുക്കും), അതിനെ എങ്ങനെ വിന്യസിക്കാമെന്ന് കാണാം.
@ -245,15 +245,15 @@ Automated machine learning ഇന്റർഫേസ് മികച്ച മോ
മികച്ച മോഡൽ വിവരണത്തിൽ "Deploy" ബട്ടൺ ക്ലിക്ക് ചെയ്യുക.
![deploy-1](../../../../translated_images/ml/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.png)
![deploy-1](../../../../translated_images/ml/deploy-1.ddad725acadc84e3.webp)
15. ഒരു പേര്, വിവരണം, കംപ്യൂട്ട് തരം (Azure Container Instance), authentication സജ്ജമാക്കുക, Deploy ക്ലിക്ക് ചെയ്യുക. ഈ ഘട്ടം പൂർത്തിയാകാൻ ഏകദേശം 20 മിനിറ്റ് എടുക്കാം. വിന്യാസ പ്രക്രിയയിൽ മോഡൽ രജിസ്റ്റർ ചെയ്യൽ, റിസോഴ്‌സുകൾ സൃഷ്ടിക്കൽ, വെബ് സേവനത്തിനായി അവ ക്രമീകരിക്കൽ ഉൾപ്പെടുന്നു. Deploy status കീഴിൽ സ്റ്റാറ്റസ് സന്ദേശം കാണാം. സ്റ്റാറ്റസ് "Healthy" ആണെങ്കിൽ വിന്യസിച്ചും പ്രവർത്തിക്കുന്നുമാണ്.
![deploy-2](../../../../translated_images/ml/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.png)
![deploy-2](../../../../translated_images/ml/deploy-2.94dbb13f23908647.webp)
16. വിന്യസിച്ച ശേഷം, Endpoint ടാബിൽ ക്ലിക്ക് ചെയ്ത് നിങ്ങൾ വിന്യസിച്ച എൻഡ്‌പോയിന്റ് തിരഞ്ഞെടുക്കുക. ഇവിടെ എൻഡ്‌പോയിന്റ് സംബന്ധിച്ച എല്ലാ വിവരങ്ങളും കാണാം.
![deploy-3](../../../../translated_images/ml/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.png)
![deploy-3](../../../../translated_images/ml/deploy-3.fecefef070e8ef3b.webp)
അദ്ഭുതം! ഇപ്പോൾ ഒരു മോഡൽ വിന്യസിച്ചിരിക്കുന്നു, എൻഡ്‌പോയിന്റ് ഉപഭോഗം ആരംഭിക്കാം.
@ -263,7 +263,7 @@ Automated machine learning ഇന്റർഫേസ് മികച്ച മോ
ഈ സ്ക്രിപ്റ്റ് നിങ്ങളുടെ ലോക്കൽ മെഷീനിൽ നിന്ന് നേരിട്ട് പ്രവർത്തിപ്പിക്കാം, നിങ്ങളുടെ എൻഡ്‌പോയിന്റ് ഉപഭോഗിക്കും.
![35](../../../../translated_images/ml/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.png)
![35](../../../../translated_images/ml/consumption-1.700abd196452842a.webp)
ഈ 2 കോഡ് ലൈൻ പരിശോധിക്കുക:

@ -48,7 +48,7 @@ SDKയുടെ പ്രധാന മേഖലകൾ:
[മുൻപത്തെ പാഠത്തിൽ](../18-Low-Code/README.md) നാം ലോ കോഡ്/നോ കോഡ് രീതിയിൽ മോഡൽ പരിശീലിപ്പിക്കുകയും വിന്യസിക്കുകയും ഉപയോഗിക്കുകയും ചെയ്തിരുന്നു. ഹാർട്ട് ഫെയില്യർ ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് ഹാർട്ട് ഫെയില്യർ പ്രവചന മോഡൽ സൃഷ്ടിച്ചു. ഈ പാഠത്തിൽ, നാം അതേ പ്രവർത്തി Azure Machine Learning SDK ഉപയോഗിച്ച് ചെയ്യാൻ പോകുന്നു.
![project-schema](../../../../translated_images/ml/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.png)
![project-schema](../../../../translated_images/ml/project-schema.420e56d495624541.webp)
### 1.2 ഹാർട്ട് ഫെയില്യർ പ്രവചനം പ്രോജക്ടും ഡാറ്റാസെറ്റും പരിചയം
@ -65,7 +65,7 @@ SDKയുടെ പ്രധാന മേഖലകൾ:
മുൻപ് സൃഷ്ടിച്ച [Azure ML വർക്ക്‌സ്‌പേസിൽ](https://ml.azure.com/) കംപ്യൂട്ട് മെനുവിലേക്ക് പോകുക, അവിടെ ലഭ്യമായ വിവിധ കംപ്യൂട്ട് വിഭവങ്ങൾ കാണാം
![compute-instance-1](../../../../translated_images/ml/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.png)
![compute-instance-1](../../../../translated_images/ml/compute-instance-1.dba347cb199ca499.webp)
Jupyter നോട്ട്‌ബുക്ക് പ്രൊവിഷൻ ചെയ്യാൻ ഒരു കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് സൃഷ്ടിക്കാം.
1. + New ബട്ടൺ ക്ലിക്ക് ചെയ്യുക.
@ -88,10 +88,10 @@ Jupyter നോട്ട്‌ബുക്ക് പ്രൊവിഷൻ ചെ
1. Applications വിഭാഗത്തിൽ Jupyter ഓപ്ഷൻ ക്ലിക്ക് ചെയ്യുക.
2. "Yes, I understand" ബോക്സ് ടിക്ക് ചെയ്ത് Continue ബട്ടൺ ക്ലിക്ക് ചെയ്യുക.
![notebook-1](../../../../translated_images/ml/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.png)
![notebook-1](../../../../translated_images/ml/notebook-1.12998af7b02c83f5.webp)
3. ഇത് പുതിയ ബ്രൗസർ ടാബിൽ നിങ്ങളുടെ ജുപിറ്റർ നോട്ട്‌ബുക്ക് ഇൻസ്റ്റൻസ് തുറക്കും. "New" ബട്ടൺ ക്ലിക്ക് ചെയ്ത് നോട്ട്‌ബുക്ക് സൃഷ്ടിക്കുക.
![notebook-2](../../../../translated_images/ml/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.png)
![notebook-2](../../../../translated_images/ml/notebook-2.9a657c037e34f1cf.webp)
ഇപ്പോൾ നോട്ട്‌ബുക്ക് ഉണ്ടാകുമ്പോൾ, Azure ML SDK ഉപയോഗിച്ച് മോഡൽ പരിശീലനം ആരംഭിക്കാം.

@ -1,12 +1,12 @@
# ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്
![cloud-picture](../../../translated_images/ml/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.jpg)
![cloud-picture](../../../translated_images/ml/cloud-picture.f5526de3c6c6387b.webp)
> ഫോട്ടോ [Jelleke Vanooteghem](https://unsplash.com/@ilumire) യുടെ [Unsplash](https://unsplash.com/s/photos/cloud?orientation=landscape) ൽ നിന്നാണ്
വലിയ ഡാറ്റയുമായി ഡാറ്റാ സയൻസ് ചെയ്യുമ്പോൾ, ക്ലൗഡ് ഒരു ഗെയിം ചേഞ്ചർ ആകാം. അടുത്ത മൂന്ന് പാഠങ്ങളിൽ, ക്ലൗഡ് എന്താണെന്നും അത് എങ്ങനെ സഹായകരമാകാമെന്നും നാം കാണാൻ പോകുന്നു. ഹൃദയ പരാജയ ഡാറ്റാസെറ്റ് പരിശോധിച്ച്, ആരെങ്കിലും ഹൃദയ പരാജയ സാധ്യതയുള്ളതെന്ന് വിലയിരുത്താൻ സഹായിക്കുന്ന ഒരു മോഡൽ നിർമ്മിക്കാനും നാം പോകുന്നു. മോഡൽ പരിശീലിപ്പിക്കാൻ, വിന്യസിക്കാൻ, ഉപയോഗിക്കാൻ ക്ലൗഡിന്റെ ശക്തി ഉപയോഗിക്കും. ഒരു വഴി കുറഞ്ഞ കോഡ്/കോഡ് ഇല്ലാത്ത രീതിയിൽ മാത്രം ഉപയോക്തൃ ഇന്റർഫേസ് ഉപയോഗിച്ച്, മറ്റൊരു വഴി Azure മെഷീൻ ലേണിംഗ് സോഫ്റ്റ്വെയർ ഡെവലപ്പർ കിറ്റ് (Azure ML SDK) ഉപയോഗിച്ച്.
![project-schema](../../../translated_images/ml/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.png)
![project-schema](../../../translated_images/ml/project-schema.420e56d495624541.webp)
### വിഷയങ്ങൾ

@ -32,7 +32,7 @@ AI-യുടെ ജനാധിപത്യവൽക്കരണത്തിന
* [Data Science in Healthcare](https://data-flair.training/blogs/data-science-in-healthcare/) - മെഡിക്കൽ ഇമേജിംഗ് (MRI, X-Ray, CT-സ്കാൻ), ജീനോമിക്സ് (DNA സീക്വൻസിംഗ്), മരുന്ന് വികസനം (റിസ്‌ക് വിലയിരുത്തൽ, വിജയ പ്രവചന), പ്രവചനാത്മക വിശകലനം (രോഗി പരിചരണം & വിതരണ ലജിസ്റ്റിക്സ്), രോഗം ട്രാക്കിംഗ് & പ്രതിരോധം തുടങ്ങിയ പ്രയോഗങ്ങൾ ഹൈലൈറ്റ് ചെയ്യുന്നു.
![Data Science Applications in The Real World](../../../../translated_images/ml/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.png) ചിത്രം ക്രെഡിറ്റ്: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/)
![Data Science Applications in The Real World](../../../../translated_images/ml/data-science-applications.4e5019cd8790ebac.webp) ചിത്രം ക്രെഡിറ്റ്: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/)
ചിത്രം ഡാറ്റാ സയൻസ് സാങ്കേതിക വിദ്യകൾ പ്രയോഗിക്കാവുന്ന മറ്റ് മേഖലകളും ഉദാഹരണങ്ങളും കാണിക്കുന്നു. മറ്റ് പ്രയോഗങ്ങൾ അന്വേഷിക്കണോ? താഴെയുള്ള [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) വിഭാഗം പരിശോധിക്കുക.

@ -13,7 +13,7 @@ Explorer ഇന്റർഫേസ് (താഴെ സ്ക്രീൻഷോ
2. ഡാറ്റാസെറ്റ് [കാറ്റലോഗ്](https://planetarycomputer.microsoft.com/catalog) പരിശോധിക്കുക - ഓരോന്നിന്റെയും ഉദ്ദേശ്യം പഠിക്കുക.
3. Explorer ഉപയോഗിക്കുക - താൽപ്പര്യമുള്ള ഒരു ഡാറ്റാസെറ്റ് തിരഞ്ഞെടുക്കുക, പ്രസക്തമായ ക്വറി & റെൻഡറിംഗ് ഓപ്ഷൻ തിരഞ്ഞെടുക്കുക.
![The Planetary Computer Explorer](../../../../translated_images/ml/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.png)
![The Planetary Computer Explorer](../../../../translated_images/ml/planetary-computer-explorer.c1e95a9b053167d6.webp)
`നിങ്ങളുടെ ജോലി:`
ഇപ്പോൾ ബ്രൗസറിൽ റെൻഡർ ചെയ്ത വിസ്വലൈസേഷൻ പഠിച്ച് താഴെ പറയുന്നവയ്ക്ക് ഉത്തരം നൽകുക:

@ -1,206 +1,216 @@
# ഡാറ്റാ സയൻസ് ഫോ ബെഗിനേഴ്സ് - ഒരു കോഴ്സ് പ്രോഗ്രാം
# പുതിയവർക്കുള്ള ഡാറ്റാ സയൻസ് - ഒരു പ്രഥമ കോഴ്സ്
[![GitHub കോഡ്സ്പേസിൽ തുറക്കുക](https://github.com/codespaces/badge.svg)](https://github.com/codespaces/new?hide_repo_select=true&ref=main&repo=344191198)
[![GitHub Codespaces-ൽ തുറക്കൂ](https://github.com/codespaces/badge.svg)](https://github.com/codespaces/new?hide_repo_select=true&ref=main&repo=344191198)
[![GitHub ലൈസൻസ്](https://img.shields.io/github/license/microsoft/Data-Science-For-Beginners.svg)](https://github.com/microsoft/Data-Science-For-Beginners/blob/master/LICENSE)
[![GitHub സംഭാവനകർ](https://img.shields.io/github/contributors/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/graphs/contributors/)
[![GitHub പ്രശ്നങ്ങൾ](https://img.shields.io/github/issues/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/issues/)
[![GitHub സംഭാവനക്കാർ](https://img.shields.io/github/contributors/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/graphs/contributors/)
[![GitHub പ്രശ്നങ്ങൾ](https://img.shields.io/github/issues/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/issues/)
[![GitHub പുൾ-റിക്വസ്റ്റുകൾ](https://img.shields.io/github/issues-pr/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/pulls/)
[![പുൾ-റിക്വസ്റ്റുകൾ സ്വാഗതം](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com)
[![PRs വരവേൽക്കുന്നു](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com)
[![GitHub വാച്ചേഴ്സ്](https://img.shields.io/github/watchers/microsoft/Data-Science-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/Data-Science-For-Beginners/watchers/)
[![GitHub ഫോർക്സ്](https://img.shields.io/github/forks/microsoft/Data-Science-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/Data-Science-For-Beginners/network/)
[![GitHub ഫോർക്സ്](https://img.shields.io/github/forks/microsoft/Data-Science-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/Data-Science-For-Beginners/network/)
[![GitHub സ്റ്റാർസ്](https://img.shields.io/github/stars/microsoft/Data-Science-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/Data-Science-For-Beginners/stargazers/)
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
[![Microsoft Foundry ഡിസ്‌കോർഡ്](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
[![Microsoft Foundry ഡെവലപ്പർ ഫോറം](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum)
മൈക്രോസോഫ്റ്റിലെ അസ്യൂർ ക്ലൗഡ് അഭിമുഖീകരിക്കുന്നവർ ഡാറ്റാ സയൻസിനെക്കുറിച്ച് 10 ആഴ്ച, 20 പാഠങ്ങൾ അടങ്ങിയ ഒരു കോഴ്‌സ് പ്രോഗ്രാം Bern കൊടുക്കാൻ സന്തോഷവാന്മാർ ആണ്. ഓരോ പാഠത്തിലേക്കും പൂർവ്വപാഠ ക്യൂഇസുകൾ, മുന്നറിയിപ്പ് മുതൽ പാഠം പൂർത്തിയാക്കാനുള്ള എഴുതിയ നിർദ്ദേശങ്ങൾ, ഒരു പരിഹാരം, ഏൽപ്പിക്കൽ എന്നിവ ഉൾപ്പെടുത്തുന്നുണ്ട്. ഞങ്ങളുടെ പ്രോജക്റ്റ് അധിഷ്ഠിത പഠന രീതി ഉള്ളതിനാൽ നിങ്ങൾ നിർമ്മിക്കുകയായി പഠിക്കാം, ഇത് പുതിയ കഴിവുകൾ 'ബാധകമായി' മാറാനുള്ള ഉറപ്പുള്ള മാർഗം ആണ്.
Microsoft-യിലെ Azure Cloud Advocates-മെമ്പറെന്ന് ഈ 10 വാരവും 20 പാഠങ്ങളും ഉൾക്കുന്ന ഡാറ്റാ സയൻസ് കോഴ്സ് നിങ്ങളെ പരിചയപ്പെടുത്താൻ സന്തോഷമുണ്ടാക്കുന്നു. ഓരോ പാഠത്തിലും പാഠം തുടങ്ങുന്നതിനും അവസാനം നല്‍കുന്ന ക്വിസുകളുണ്ട്, പാഠം നിർവ്വഹിക്കാൻ എഴുതിയുന്ന നിർദ്ദേശങ്ങൾ, പരിഹാരം, ഹോംവർക്ക് എന്നിവ ഉൾപ്പെടുന്നു. പ്രോജക്ട് അടിസ്ഥാനത്തിലുള്ള വിദ്യാസമ്പ്രദായം നിങ്ങളുടെ പുതിയ കഴിവുകൾ തുടർച്ചയായി നിലനിൽക്കാൻ സഹായിക്കുന്ന നല്ല മാർഗമാണ്, നിങ്ങൾ നിർമ്മിക്കുന്നതിനിടയിൽ പഠിക്കാനും കഴിയും.
**ഞങ്ങളുടെ രചയിതാക്കൾക്ക് ആഴത്തിലുള്ള നന്ദി:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer).
**നമ്മുടെ എഴുത്തുകാര്ക്ക് ഹൃദയം നിറഞ്ഞ നന്ദി:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer).
**🙏 പ്രത്യേക നന്ദി 🙏 നമ്മുടെ [Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) രചയിതാക്കളും, അവലോകനക്കാരുമായും ഉള്ളടക്ക സംഭാവന്കാരുമായും,** പ്രധാനമായും Aaryan Arora, [Aditya Garg](https://github.com/AdityaGarg00), [Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/), [Ankita Singh](https://www.linkedin.com/in/ankitasingh007), [Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/), [Arpita Das](https://www.linkedin.com/in/arpitadas01/), ChhailBihari Dubey, [Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor), [Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [Majd Safi](https://www.linkedin.com/in/majd-s/), [Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/), [Miguel Correa](https://www.linkedin.com/in/miguelmque/), [Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119), [Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum), [Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/), [Rohit Yadav](https://www.linkedin.com/in/rty2423), Samridhi Sharma, [Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200),
**🙏 പ്രത്യേക നന്ദി 🙏 നമ്മുടെ [Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) എഴുത്തുകാരാണ്, വിലയിരുത്തുന്നവര്‍, ഉള്ളടക്കം സംഭാവനക്കാർ,** പ്രത്യേകിച്ച് Aaryan Arora, [Aditya Garg](https://github.com/AdityaGarg00), [Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/), [Ankita Singh](https://www.linkedin.com/in/ankitasingh007), [Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/), [Arpita Das](https://www.linkedin.com/in/arpitadas01/), ChhailBihari Dubey, [Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor), [Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [Majd Safi](https://www.linkedin.com/in/majd-s/), [Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/), [Miguel Correa](https://www.linkedin.com/in/miguelmque/), [Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119), [Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum), [Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/), [Rohit Yadav](https://www.linkedin.com/in/rty2423), Samridhi Sharma, [Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200),
[Sheena Narula](https://www.linkedin.com/in/sheena-narua-n/), [Tauqeer Ahmad](https://www.linkedin.com/in/tauqeerahmad5201/), Yogendrasingh Pawar , [Vidushi Gupta](https://www.linkedin.com/in/vidushi-gupta07/), [Jasleen Sondhi](https://www.linkedin.com/in/jasleen-sondhi/)
|![@sketchthedocs ഒരുക്കിയ സ്കെച്ച്നോട്ട് https://sketchthedocs.dev](../../translated_images/ml/00-Title.8af36cd35da1ac55.webp)|
|![@sketchthedocs വൃത്താന്തരേഖ https://sketchthedocs.dev](../../translated_images/ml/00-Title.8af36cd35da1ac55.webp)|
|:---:|
| ഡാറ്റാ സയൻസ് ഫോ ബെഗിനേഴ്സ് - _സ്കെച്ച്നോട്ട് [@nitya](https://twitter.com/nitya) ഒരുക്കിയത്_ |
| പുതിയവർക്കുള്ള ഡാറ്റാ സയൻസ് - _വൃത്താന്തരേഖ [@nitya](https://twitter.com/nitya) അംഗീകാരം_ |
### 🌐 ബഹുഭാഷാ പിന്തുണ
#### GitHub ആക്ഷൻ വഴി പിന്തുണയ്ക്കപ്പെടുന്നു (സ്വയം പ്രവർത്തിക്കുന്നതും എప్పഴും പുതുക്കപ്പെട്ടതു)
#### GitHub Action വഴി പിന്തുണ (സ്വയംസഞ്ചാരവും എല്ലായ്പ്പോഴും അപ്ഡേറ്റ്-ഉ)
<!-- CO-OP TRANSLATOR LANGUAGES TABLE START -->
[Arabic](../ar/README.md) | [Bengali](../bn/README.md) | [Bulgarian](../bg/README.md) | [Burmese (Myanmar)](../my/README.md) | [Chinese (Simplified)](../zh-CN/README.md) | [Chinese (Traditional, Hong Kong)](../zh-HK/README.md) | [Chinese (Traditional, Macau)](../zh-MO/README.md) | [Chinese (Traditional, Taiwan)](../zh-TW/README.md) | [Croatian](../hr/README.md) | [Czech](../cs/README.md) | [Danish](../da/README.md) | [Dutch](../nl/README.md) | [Estonian](../et/README.md) | [Finnish](../fi/README.md) | [French](../fr/README.md) | [German](../de/README.md) | [Greek](../el/README.md) | [Hebrew](../he/README.md) | [Hindi](../hi/README.md) | [Hungarian](../hu/README.md) | [Indonesian](../id/README.md) | [Italian](../it/README.md) | [Japanese](../ja/README.md) | [Kannada](../kn/README.md) | [Korean](../ko/README.md) | [Lithuanian](../lt/README.md) | [Malay](../ms/README.md) | [Malayalam](./README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Nigerian Pidgin](../pcm/README.md) | [Norwegian](../no/README.md) | [Persian (Farsi)](../fa/README.md) | [Polish](../pl/README.md) | [Portuguese (Brazil)](../pt-BR/README.md) | [Portuguese (Portugal)](../pt-PT/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Romanian](../ro/README.md) | [Russian](../ru/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Slovak](../sk/README.md) | [Slovenian](../sl/README.md) | [Spanish](../es/README.md) | [Swahili](../sw/README.md) | [Swedish](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tamil](../ta/README.md) | [Telugu](../te/README.md) | [Thai](../th/README.md) | [Turkish](../tr/README.md) | [Ukrainian](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamese](../vi/README.md)
> **പ്രദേശീയമായി ക്ലോൺ ചെയ്യാൻ ഇഷ്ടപ്പെടുന്നുവോ?**
[അറബിക്](../ar/README.md) | [ബംഗാളി](../bn/README.md) | [ബൾഗേറിയൻ](../bg/README.md) | [ബർമ്മീസ് (മ്യാന്മാർ)](../my/README.md) | [ചൈനീസ് (സാധാരണ)](../zh-CN/README.md) | [ചൈനീസ് (പാരമ്പര്യം, ഹോങ്കോങ്ങ്)](../zh-HK/README.md) | [ചൈനീസ് (പാരമ്പര്യം, മകാവ്)](../zh-MO/README.md) | [ചൈനീസ് (പാരമ്പര്യം, തായ്‌വാൻ)](../zh-TW/README.md) | [ക്രമോത്തരം](../hr/README.md) | [ചെക്ക്](../cs/README.md) | [ഡാനിഷ്](../da/README.md) | [ഡച്ച്](../nl/README.md) | [എസ്റ്റോണിയൻ](../et/README.md) | [ഫിന്നിഷ്](../fi/README.md) | [ഫ്രഞ്ച്](../fr/README.md) | [ജർമ്മൻ](../de/README.md) | [ഗ്രീക്ക്](../el/README.md) | [ഹെബ്രു](../he/README.md) | [ഹിന്ദി](../hi/README.md) | [ഹംഗറിയൻ](../hu/README.md) | [ഇന്തോനേഷ്യൻ](../id/README.md) | [ഇറ്റാലിയൻ](../it/README.md) | [ജാപ്പനീസ്](../ja/README.md) | [കനഡ](../kn/README.md) | [കൊറിയൻ](../ko/README.md) | [ലിതുവേനിയൻ](../lt/README.md) | [മലയാളം](./README.md) | [മറാത്തി](../mr/README.md) | [നെപാളി](../ne/README.md) | [നൈജീരിയൻ പിഡ്ജിൻ](../pcm/README.md) | [നോർവീജിയൻ](../no/README.md) | [ഫേഴ്സി (ഫാർസി)](../fa/README.md) | [പോളിഷ്](../pl/README.md) | [പോർച്ചുഗീസ് (ബ്രസീൽ)](../pt-BR/README.md) | [പോർച്ചുഗീസ് (പോർച്ചുഗൽ)](../pt-PT/README.md) | [പഞ്ചാബി (ഗുരുമുഖി)](../pa/README.md) | [റൊമാനിയൻ](../ro/README.md) | [റഷ്യൻ](../ru/README.md) | [സെർബിയൻ (സിറിലിക്)](../sr/README.md) | [സ്ലൊവാക്ക്](../sk/README.md) | [സ്ലൊവേനിയൻ](../sl/README.md) | [സ്പാനിഷ്](../es/README.md) | [സ്വാഹിലി](../sw/README.md) | [സ്വീഡിഷ്](../sv/README.md) | [തഗാലോഗ് (ഫിലിപ്പിനോ)](../tl/README.md) | [തമിഴ്](../ta/README.md) | [തെലുങ്കു](../te/README.md) | [തായ്](../th/README.md) | [ടർക്കിഷ്](../tr/README.md) | [ഉക്രെയ്നിയൻ](../uk/README.md) | [ഉർദു](../ur/README.md) | [വിയറ്റ്നാമീസ്](../vi/README.md)
> ഈ റിപോസിറ്ററിയിൽ 50-ലധികം ഭാഷാ വിവർത്തനങ്ങൾ ഉൾക്കൊള്ളുന്നുണ്ടു, ഇത് ഡൗൺലോഡ് വലിപ്പം വലിയതാക്കുന്നു. വിവർത്തനങ്ങൾ ഇല്ലാതെ ക്ലോൺ ചെയ്യാൻ sparse checkout ഉപയോഗിക്കുക:
> **ദയവായി പ്രാദേശികമായി ക്ലോൺ ചെയ്യാൻ ആഗ്രഹിക്കുന്നുണ്ടോ?**
>
> ഈ സംഭരണം 50+ ഭാഷാ വിവർത്തനങ്ങൾ ഉൾക്കൊള്ളുന്നു, ഇത് ഡൗൺലോഡ് വലിപ്പം വളരെ വർധിപ്പിക്കുന്നു. വിവർത്തനങ്ങൾ ഇല്ലാതെ ക്ലോൺ ചെയ്യാൻ sparse checkout ഉപയോഗിക്കുക:
>
> **Bash / macOS / Linux:**
> ```bash
> git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
> cd Data-Science-For-Beginners
> git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'
> ```
> ഇത് നിങ്ങൾക്ക് കോഴ്സ് പൂർത്തിയാക്കാൻ ആവശ്യമായ എല്ലാ കാര്യങ്ങളും വേഗത്തിൽ നൽകുന്നു.
>
> **CMD (Windows):**
> ```cmd
> git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
> cd Data-Science-For-Beginners
> git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"
> ```
>
> ഇതിലൂടെ കോഴ്‌സ് പൂർത്തിയാക്കാൻ ആവശ്യമുള്ള എല്ലാ കാര്യങ്ങളും വളരെ വേഗത്തിലുള്ള ഡൗൺലോഡോടെ ലഭിക്കും.
<!-- CO-OP TRANSLATOR LANGUAGES TABLE END -->
**കൂടുതൽ വിവർത്തന ഭാഷകൾ പിന്തുണയ്ക്കണമെങ്കിൽ ഇവയും [ഇവിടെ](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md) പ്രദർശിപ്പിച്ചിരിക്കുന്നു**
**കൂടുതൽ വിവർത്തനഭാഷകൾ ആവശ്യമാണ് എങ്കിൽ അവ [ഇവിടെ](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md) നൽക്കിയിരിക്കുന്നു**
#### നമ്മുടെ കമ്മ്യൂണിറ്റിയിൽ ചേരുക
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
#### നമ്മുടെ കമ്മ്യൂണിറ്റിയിൽ ചേർക്കുക
[![Microsoft Foundry ഡിസ്‌കോർഡ്](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
നമ്മുടെ Discord-ൽ AI-യോടൊപ്പം പഠന പരമ്പര തുടരുകയാണ്, കൂടുതൽ അറിഞ്ഞ് [Learn with AI Series](https://aka.ms/learnwithai/discord) ലേക്ക് 2025 സെപ്റ്റംബർ 18 മുതൽ 30 വരെയുള്ള കാലയളവിൽ ചേരുക. GitHub Copilot ഉപയോഗിച്ച് ഡാറ്റാ സയൻസിനുള്ള ടിപ്പുകളും തന്ത്രങ്ങളും നിങ്ങൾക്ക് ലഭിക്കും.
ാം ഒരു Discord ലേണുമായ AI സീരീസ് നടത്തുന്നു, കൂടുതൽ അറിയാനും ഞങ്ങളോടൊപ്പം ചേരാനും [Learn with AI Series](https://aka.ms/learnwithai/discord) സന്ദർശിക്കുക, സെപ്റ്റംബർ 18 - 30, 2025 നടന്നു പോകുന്നു. GitHub Copilot ഉപയോഗിച്ച് ഡാറ്റാ സയൻസിന് ടിപ്പുകളും ട്രിക്കുകളും ഈ സീരീസിൽ നൽകും.
![Learn with AI series](../../translated_images/ml/1.2b28cdc6205e26fe.webp)
# നിങ്ങൾ വിദ്യാർത്ഥിയാണോ?
# നിങ്ങൾ ഒരു വിദ്യാർത്ഥിയാണോ?
തുടങ്ങാൻ താഴെ കൊടുത്ത റിസോഴ്‌സുകൾ ഉപയോഗിക്കുക:
ഇനിപ്പറയുന്ന സ്രോതസുകൾ ഉപയോഗിച്ച് തുടങ്ങുക:
- [Student Hub പേജ്](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) ഈ പേജിൽ നിങ്ങൾക്ക് ആരംഭകർക്കുള്ള റിസോഴ്‌സുകൾ, വിദ്യാർത്ഥി പാക്കുകൾ, സൗജന്യ സർട്ടിഫിക്കറ്റ് വൗച്ചറുകൾ എന്നിവ ലഭിക്കും. ഇതാണ് നിങ്ങൾക്ക് ബുക്ക് മാർക്ക് ചെയ്ത് സമയവും സമയം ചെക്ക് ചെയ്യേണ്ട ഒരു പേജ്, കാരണം ഞങ്ങൾ സ محتويات് പ്രതിമാസം മാറ്റുന്നു.
- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) ആഗോള വിദ്യാർത്ഥി അംബാസിഡർ കമ്മ്യൂണിറ്റിയിൽ ചേർക്കുക, ഇതാണ് മൈക്രോസോഫ്റ്റിലേക്ക് എത്താനുള്ള ഒരു വഴി.
- [സ്റ്റുഡന്റ് ഹബ് പേജ്](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) ഇവിടെ തുടക്കംവരെയുള്ള വൃക്ഷങ്ങൾ, വിദ്യാർത്ഥി പാക്കുകൾ, സൗജന്യ സർട്ടിഫിക്കറ്റ് വൗച്ചർ ലഭിക്കുന്ന മാർഗങ്ങൾ എന്നിവ കാണാം. ഈ പേജ് മാർക്ക് ചെയ്യാനും ഗതി മാറ്റങ്ങൾ ഈ പേജ് മാസത്തിൽ താഴെ അറിയാനും ഉത്സാഹദായകമാണ്.
- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) ഒരു ആഗോള വിദ്യാർത്ഥി എംബസഡർ സമൂഹത്തിൽ ചേരുക, ഇത് Microsoftൽ പ്രവേശിക്കാൻ ഒരു വഴിയാകും.
# തുടങ്ങാം
# ആരംഭിക്കൽ
## 📚 ഡോക്യുമെന്റേഷൻ
- **[ഇൻസ്റ്റലേഷൻ ഗൈഡ്](INSTALLATION.md)** - ആരംഭകർക്കായി ഘട്ടം ഘട്ടമായിലാണ് സെറ്റപ്പ് നിർദ്ദേശങ്ങൾ
- **[ഉപയോഗ വേർപ്പ്](USAGE.md)** - ഉദാഹരണങ്ങളും പൊതു പ്രവൃത്തികളെഴുപ്പുകളും
- **[പ്രശ്നപരിഹാരം](TROUBLESHOOTING.md)** - പൊതു പ്രശ്നങ്ങളുടെ പരിഹാരങ്ങൾ
- **[സംഭാവന ഗൈഡ്](CONTRIBUTING.md)** - ഈ പദ്ധതിയിലേക്ക് സംഭാവന ചെയ്യാനുള്ള മാർഗങ്ങൾ
- **[അധ്യാപകർക്ക്](for-teachers.md)** - പഠന ദിശാനിർദ്ദേശങ്ങളും ക്ലാസ് മുറി റിസോഴ്‌സുകളും
- **[ഇൻസ്റ്റലേഷൻ ഗൈഡ്](INSTALLATION.md)** - തുടക്കംവരെയുള്ളവർക്കുള്ള ഘട്ടങ്ങളായി ക്രമീകരിക്കൽ നിർദ്ദേശങ്ങൾ
- **[ഉപയോഗ ഗൈഡ്](USAGE.md)** - ഉദാഹരണങ്ങൾ കൂടിയ പൊതുവായ പ്രവൃത്തി രീതികൾ
- **[പ്രശ് പരിഹാരം](TROUBLESHOOTING.md)** - സാധാരണ പ്രശ്‌നങ്ങൾക്കുള്ള പരിഹാരങ്ങൾ
- **[സംഭാവന ഗൈഡ്](CONTRIBUTING.md)** - ഈ പദ്ധതി ക്ക് സംഭാവനം ചെയ്യാനുള്ള മാർഗങ്ങൾ
- **[അധ്യാപകർക്ക്](for-teachers.md)** - പാഠം നിർവഹണത്തിനും ക്ലാസ് റിസോഴ്സുകൾക്കുമായി മാർഗനിർദ്ദേശങ്ങൾ
## 👨‍🎓 വിദ്യാർത്ഥികൾക്ക്
> **പൂർണ്ണമായി പുതിയവർക്കായി**: ഡാറ്റാ സയൻസില് പുതുമകാണുന്നുണ്ടോ? ഞങ്ങളുടെ [ആരംഭകർക്കുള്ള ഉദാഹരണങ്ങൾ](examples/README.md) ഉപയോഗിച്ച് തുടങ്ങുക! ഈ ലളിതവും നല്ല രീതിയിൽ ഓരോള സംഭവത്തെ വിശദീകരിച്ചിരിക്കുന്ന ഉദാഹരണങ്ങൾ, പൂർണ്ണ കോഴ്സിൽ പ്രവേശിക്കുന്നതിന് മുമ്പ് അടിസ്ഥാനങ്ങൾ മനസ്സിലാക്കാൻ സഹായിക്കും.
> **[വിദ്യാർത്ഥികൾ](https://aka.ms/student-page)**: ഈ കോഴ്‌സ് സ്വയം പഠിക്കാൻ, പൂർണ്ണ റിപൊ ഫോർക്ക് ചെയ്ത് മുൻ പാഠം ക്യൂഇസോടെ ആരംഭിച്ച്, തുടർചിന്തിച്ചും പാഠം വായിച്ച് ബാക്കിയുള്ള പ്രവർത്തനങ്ങൾ പൂർത്തിയാക്കുക. പരിഹാര കോഡ് എഴുതാതെ പാഠങ്ങൾ മനസ്സിലാക്കി പ്രോജക്റ്റുകൾ സൃഷ്ടിക്കുക; എന്നാൽ പരിഹാരകോഡുകൾ ഓരോ പ്രോജക്റ്റ് അധിഷ്ഠിത പാഠങ്ങളിൽ /solutions ഫോൾഡറുകളിൽ ലഭ്യമാണ്. മറ്റൊരു മാർഗം സുഹൃത്തുക്കളോടൊപ്പം പഠന ഗ്രൂപ്പ് രൂപീകരിച്ച് സംവദിക്കുക. കൂടുതൽ പഠനത്തിനായി, [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum) പ്രോത്സാഹിപ്പിക്കുന്നു.
## 👨‍🎓 വിദ്യാർത്ഥികൾക്ക്
> **പൂർണ തുടക്കക്കാർ**: ഡാറ്റാ സയൻസിലേക്ക് പുതുവനോ? ഞങ്ങളുടെ [തുടക്കം സുഹൃത്തായ ഉദാഹരണങ്ങൾ](examples/README.md) കണ്ടെത്തുക! ഈ ലളിതമാരിയ, അധിക കൂട്ടമായ ഉദാഹരണങ്ങൾ അടിസ്ഥാനങ്ങൾ മനസ്സിലാക്കാൻ സഹായിക്കും, മുഴുവൻ കോഴ്‌സിൽ നീങ്ങുന്നതിന് മുമ്പ്.
> **[വിദ്യാർത്ഥികൾ](https://aka.ms/student-page)**: ഈ കോഴ്സ് സ്വയം പഠിക്കാൻ, മുഴുവനായ റീപ്പോ ഫോর্ক് ചെയ്ത് മുൻപുള്ള ക്വിസ് ചെയ്ത് ശേഷം പ്രഭാഷണം വായിച്ച് മറ്റുള്ള പ്രവർത്തികൾ നിർവഹിക്കുക. പരിഹാര കോഡ് പകർത്തുന്നതുപകരം പാഠങ്ങൾ മനസ്സിലാക്കി പ്രോജക്ടുകൾ സൃഷ്ടിക്കുക; പക്ഷേ, പരിഹാര കോഡ് /solutions ഫോൾഡറുകളിൽ ലഭ്യമാണ്. കൂട്ടുകാരുമായുള്ള പഠന ഗ്രൂപ്പ് രൂപീകരിച്ച് ഒന്നിച്ച് പാഠങ്ങൾ പഠിച്ചുകൊണ്ടിരിക്കുക. കൂടുതൽ പഠനത്തിനായി [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum) ഉപയോഗിക്കുക.
**ത്വരിതാരംഭ:**
1. നിങ്ങളുടെ പരിസ്ഥിതി തയ്യാറാക്കാൻ [ഇൻസ്റ്റലേഷൻ ഗൈഡ്](INSTALLATION.md) പരിശോധിക്കുക
2. കോഴ്‌സ് എങ്ങനെ പ്രവർത്തിക്കുമെന്ന് മനസ്സിലാക്കാൻ [ഉപയോഗ വേർപ്പ്](USAGE.md) വായിക്കുക
3. പാഠം 1 മുതൽ തുടക്കം കുറിച്ച് ക്രമത്തിലായി മുന്നോട്ട് പോവുക
4. പിന്തുണക്കായി ഞങ്ങളുടെ [Discord കമ്മ്യൂണിറ്റിയിൽ](https://aka.ms/ds4beginners/discord) ചേരുക
**വേഗത്തോടെയുള്ള തുടക്ക:**
1. പരിസ്ഥിതി ക്രമീകരണത്തിനു [ഇൻസ്റ്റലേഷൻ ഗൈഡ്](INSTALLATION.md) തിരയുക
2. കോഴ്സിനെ എങ്ങനെ പ്രവർത്തിക്കാമെന്ന് [ഉപയോഗം ഗൈഡ്](USAGE.md) വായിക്കുക
3. പാഠം 1-നു തുടങ്ങി തുടർക്രമത്തിൽ പഠിക്കൂ
4. സഹായത്തിനായി ഞങ്ങളുടെ [ഡിസ്‌കോർഡ് കമ്മ്യൂണിറ്റി](https://aka.ms/ds4beginners/discord) ഞങ്ങളോടൊപ്പം ചേർന്ന് സഹായം നേടുക
## 👩‍🏫 അധ്യാപകർക്ക്
> **അധ്യാപകർ**: ഈ പാഠ്യപദ്ധതിയെ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് പറ്റിയ [ചില നിർദ്ദേശങ്ങൾ ഞങ്ങൾ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്](for-teachers.md). നിങ്ങളുടെ അഭിപ്രായങ്ങൾ ഞങ്ങളുടെ ചർച്ചാ ഫോറത്തിൽ [വാങ്ങാമെന്നു ആസ്വദിക്കും](https://github.com/microsoft/Data-Science-For-Beginners/discussions)!
> **അധ്യാപകർക്ക്**: ഈ കോഴ്സ് എങ്ങനെ ഉപയോഗിക്കാമെന്ന് കുറച്ച് [ശുപാർശകൾ](for-teachers.md) നൽകിയിട്ടുണ്ട്. നിങ്ങളുടെ അഭിപ്രായം ഞങ്ങളുടെ [ചർച്ച ഫോറത്തിൽ](https://github.com/microsoft/Data-Science-For-Beginners/discussions) പങ്കുവെയ്ക്കുക!
## ടീം പരിചയപ്പെടുക
## സംഘത്തെ പരിചയപ്പെടുക
[![പ്രമോ വീഡിയോ](../../ds-for-beginners.gif)](https://youtu.be/8mzavjQSMM4 "പ്രമോ വീഡിയോ")
[![പ്രമോ വീഡിയോ](../../ds-for-beginners.gif)](https://youtu.be/8mzavjQSMM4 "പ്രമോ വീഡിയോ")
**ഗിഫ്** [മോഹിത് ജയ്സൽ](https://www.linkedin.com/in/mohitjaisal)
**ഗിഫ്** [മോഹിത് ജയ്സൽ](https://www.linkedin.com/in/mohitjaisal)
> 🎥 പ്രോജക്ട് ആയും അതിനെ സൃഷ്ടിച്ചവരാണ് എന്നുള്ള ഒരു വീഡിയോക്കായി മുകളിൽ ചിത്രത്തിൽ ക്ലിക്കുചെയ്യൂ!
> 🎥 ഉരച്ചു നിർമ്മിച്ച പ്രോജക്റ്റ് സെറ്റിന്റെ വീഡിയോക്കായി മുകളിൽ കാണുന്ന ചിത്രം ക്ലിക്ക് ചെയ്യുക!
## പാഠശാസ്ത്രം
## പഠനരീതിയ നിയമങ്ങൾ
ഈ പഠനക്രമം നിർമ്മിക്കുമ്പോൾ ഞങ്ങൾ രണ്ട് പാഠശാസ്ത്ര തത്വങ്ങൾ തിരഞ്ഞെടுக்கியിട്ടുണ്ട്: പ്രോജക്ട് അടിസ്ഥാനമായിരിക്കുക എന്നതും നിരന്തരം ക്വിസ് ഉൾപ്പെടുത്തുക എന്നതും. ഈ പരമ്പരയിലൂടെ വിദ്യാർത്ഥികൾ ഡാറ്റാ സയൻസിന്റെ അടിസ്ഥാന സിദ്ധാന്തങ്ങൾ, സഹജമായ ധാർമിക കാഴ്ചക്കാഴ്ചകൾ, ഡാറ്റാ തയ്യാറാക്കൽ, ഡാറ്റ ഉപയോഗിക്കുന്ന വ്യത്യസ്ത രീതി, ഡാറ്റാ ദൃശ്യീകരണം, ഡാറ്റാ വിശകലനം, ഡാറ്റാ സയൻസിന്റെ യഥാർത്ഥ ലോക ഉപയോഗക്കേസുകൾ എന്നിവ പഠിക്കും.
ഈ പാഠ്യപദ്ധതി നിർമ്മിക്കുമ്പോൾ ഞങ്ങൾ തിരഞ്ഞെടുത്ത രണ്ട് പഠനരീതിയ തത്വങ്ങൾ ഉണ്ട്: അത് പ്രോജക്റ്റ് അടിസ്ഥാനമാക്കിയത് എന്നതും, കൂടാതെ പതിവായി ക്വിസുകൾ ഉൾപ്പെടുത്തിയത്. ഈ സീരീസ് അവസാനിക്കുന്നത് വരെ വിദ്യാർഥികൾ പ്രാഥമിക ഡാറ്റാ സയൻസ് തത്വങ്ങൾ പഠിക്കും, ധാർമിക ആശയങ്ങൾ ഉൾപ്പെടെ, ഡാറ്റാ തയ്യാറാക്കൽ, ഡാറ്റാ കൈകാര്യം ചെയ്യാനുള്ള വ്യത്യസ്ത മാർഗങ്ങൾ, ഡാറ്റാ ദൃശ്യവൽക്കരണം, ഡാറ്റാ വിശകലനം, ഡേറ്റാ സയൻസ് യാഥാർത്ഥ്യ ഉപയോഗകേസുകൾ മറ്റും.
അതുപോലെ, ക്ലാസിന് മുൻപുള്ള ഒരു കുറഞ്ഞ സമ്മർദ്ദം ഉള്ള ക്വിസ് വിദ്യാർത്ഥിയുടെ പഠന സാധ്യതയ്ക്ക് ഉദ്ദേശ്യം നിശ്ചയിക്കുന്നു, ക്ലാസിനു ശേഷം രണ്ടാമത്തെ ക്വിസ് കൂടുതൽ നിലനിർത്തൽ ഉറപ്പു വരുത്തുന്നു. ഈ പഠനക്രമം സുഖകരവും സുഖത്തോടെ പകർന്നെടുക്കാവുന്നതുമായ രീതിയിലുള്ളതാണ്. 10 ആഴ്ചകളുടെ ചക്രത്തിൽ പ്രോജക്ടുകൾ ചെറിയതിൽ ആരംഭിച്ച് ക്രമാതീതമായി ക്രമേണ പ്രയാസപരവും സങ്കീർണവുമായിരിക്കും.
കൂടാതെ, ഒരു ക്ലാസിന് മുൻപ് കൃത്യമായ കലാകൃതി ഇല്ലാത്ത ഒരു ക്വിസ് വിദ്യാർത്ഥിയെ ഒരു വിഷയത്തിൽ പഠനത്തിന്റെ ഉദ്ദേശിക്കുന്നതിൽ സഹായിക്കുന്നു, ക്ലാസിനു ശേഷമുള്ള രണ്ടാമത്തെ ക്വിസ് കൂടുതലായി ഓർമ്മിപ്പിക്കുന്നു. ഈ പാഠ്യപദ്ധതി ലക്ഷ്യമിട്ടിരിക്കുന്നത് സൗകര്യപ്രദവും രസകരവുമാണ്, മുഴുവൻ അല്ലെങ്കിൽ ഭാഗികമായി സ്വീകരിക്കാവുന്നതാണ്. പ്രോജക്റ്റുകൾ ചെറിയതിൽ തുടങ്ങുകയും പത്തു ആഴ്ച കൂടി കഴിഞ്ഞ് സങ്കീർണ്ണമായതായിത്തീരുമെന്ന്.
> ഞങ്ങളുടെ [നിയമനിർദ്ദേശങ്ങൾ](CODE_OF_CONDUCT.md), [ഒപ്പം സംഭാവന](CONTRIBUTING.md), [പരിശോധന](TRANSLATIONS.md) മാർഗനിർദ്ദേശങ്ങൾ കാണുക. നിങ്ങളുടെ രചനാത്മക ഫീഡ്ബാക്ക് ഞങ്ങൾ സ്വാഗതം ചെയ്യുന്നു!
> ഞങ്ങളുടെ [കണ്ടക്ട് കോഡ്](CODE_OF_CONDUCT.md), [സംഭാവന മാർഗ്ഗനിർദ്ദേശങ്ങൾ](CONTRIBUTING.md), [പരിവർത്തനം](TRANSLATIONS.md) മാർഗ്ഗനിർദേശങ്ങളുണ്ട്. നിങ്ങളുടെ സൃഷ്ടിപരമായ അഭിപ്രായങ്ങൾ ഞങ്ങൾ സ്വാഗതം ചെയ്യുന്നു!
## ഓരോ പാഠവും ഉൾപ്പെടുത്തുന്നു:
## പ്രതേകം പാഠത്തിൽ ഉൾപ്പെടുത്തിയിട്ടുള്ളത്:
- ഐച്ഛിക സ്കെട്നോട്ട്
- ഐച്ഛിക കൂട്ടിച്ചേർത്ത വീഡിയോ
- പാഠ മുമ്പുള്ള വാഴ്മപ്പ് ക്വിസ്
- എഴുതുന്ന പാഠം
- പ്രോജക്ട് അടിസ്ഥാനത്തിലുള്ള പാഠങ്ങൾക്ക്, പ്രോജക്ട് നിർമ്മിക്കാൻ ഘട്ടം ഘട്ടമായുള്ള മാർഗനിർദ്ദേശങ്ങ
- അറിവ് പരിശോധനകൾ
- ഒരു ചലഞ്ച്
- കൂട്ടിച്ചേർത്ത വായന
- ഐച്ഛിക സ്‌കെച്ച്നോട്ട്
- ഐച്ഛിക പൂരക വീഡിയോ
- പാഠത്തിന് മുൻപുള്ള വാര്മപ്പ് ക്വിസ്
- എഴുതിയ പാഠം
- പ്രോജക്റ്റ് അടിസ്ഥാന പാഠങ്ങൾക്ക്, പ്രോജക്റ്റ് നിർമ്മിക്കുന്നതിനുള്ള ക്രമക്രമ ഗൈഡ്‌സുക
- വിജഞാന പരിശോധനകൾ
- ഒരു ചലഞ്ച്
- പൂരക വായന
- അസൈൻമെന്റ്
- [പാഠ കഴിഞ്ഞുള്ള ക്വിസ്](https://ff-quizzes.netlify.app/en/)
- [പാഠാനന്തര ക്വിസ്](https://ff-quizzes.netlify.app/en/)
> **ക്വിസുകളെ കുറിച്ചുള്ള കുറിപ്പുകൾ**: എല്ലാ ക്വിസുകളും Quiz-App ഫോൾഡറിലാണ് സൂക്ഷിച്ചിരിക്കുന്നതും, ഓരോതിലും മൂന്ന് ചോദ്യങ്ങളുള്ള 40 മൊത്തം ക്വിസുകളാണ് ഉള്ളത്. അവ പാഠങ്ങളിൽ നിന്ന് ലിങ്ക് ചെയ്തിട്ടുള്ളതായിരിക്കുകയാണ്, എന്നാൽ ക്വിസ് ആപ്പ് പ്രാദേശികമോ ഡെപ്ലോയ്മെന്റിനോ ഉപയോഗിക്കാം; `quiz-app` ഫോൾഡറിലെ നിർദ്ദേശങ്ങൾ പിന്തുടരുക. അവ ക്രമമേറിയും പ്രാദേശികമാക്കപ്പെട്ടു വരുന്നു.
> **ക്വിസുകൾക്കുറിച്ചുള്ള കുറിപ്പ്**: എല്ലാ ക്വിസുകളും Quiz-App ഫോൾഡറിലുണ്ട്, മൂന്ന് ചോദ്യങ്ങൾ ഉള്ള 40 മൊത്തം ക്വിസുകൾ. ഇവ പാഠങ്ങളിൽ നിന്നാണ് ലിങ്ക് ചെയ്യപ്പെട്ടിരിക്കുന്നത്, എങ്കിലും ക്വിസ് ആപ്പ് സാമാന്യമായി ലോക്കലിൽ പ്രവർത്തിക്കാവുന്നതുമായ അല്ലെങ്കിൽ Azure-ല് വിന്യാസം ചെയ്യാവുന്നതുമായ ആപ്ലിക്കേഷൻ ആണ്; `quiz-app` ഫോൾഡറിൽ നൽകരുന്ന നിർദ്ദേശങ്ങൾ പിന്തുടരുക. അവ ക്രമാതീതമായി പ്രാദേശികമാകുന്നു.
## 🎓 ആരംഭക്കാർക്കായി സൗഹൃദം ഉള്ള ഉദാഹരണങ്ങൾ
## 🎓 തുടങ്ങുന്നവർക്ക് സുഹൃത്ത് ഉദാഹരണങ്ങൾ
**ഡാറ്റാ സയൻസിൽ പുതിയോ?** ചെറുതും വിശദമായി കമന്റ് ചെയ്ത കോഡും ഉൾപ്പെടുത്തിയ [ഉദാഹരണങ്ങൾ ഡയറക്ടറി](examples/README.md) ഞങ്ങൾ സൃഷ്ടിച്ചു, നിങ്ങളെ സഹായിക്കാൻ:
**ഡാറ്റാ സയൻസിൽ പുതിയവനോ?** നിങ്ങൾക്ക് തുടങ്ങാൻ സഹായിക്കുന്ന ലളിതവും വിശദമായ കുറിപ്പുകളുള്ള പ്രത്യേക [ഉദാഹരണ ഡയറക്ടറി](examples/README.md) ഞങ്ങൾ സൃഷ്ടിച്ചിരിക്കുന്നു:
- 🌟 **ഹലോ വേൾഡ്** - നിങ്ങളുടെ ആദ്യ ഡാറ്റാ സയൻസ് പ്രോഗ്രാം
- 📂 **ഡാറ്റാ ലോഡിംഗ്** - ഡാറ്റാസെറ്റുകൾ വായിക്കുകയും പരിശോധിക്കുകയും ചെയ്യുന്നത് പഠിക്കുക
- 📊 **ാധാരണ വിശകലനം** - സാ‌ഖ്യങ്ങൾ കണക്കുകൂട്ടുകയും മാതൃകകൾ കണ്ടെത്തുകയും ചെയ്യുക
- 📈 **അടിസ്ഥാന ദൃശ്യീകരണം** - ചാർട്ടുകളും ഗ്രാഫുകളും സൃഷ്ടിക്കുക
- 🔬 **യഥാർത്ഥ ലോക പ്രോജക്ട്** - തുടങ്ങിയിടത്തുനിന്നും പൂർത്തിയാക്കുന്നവരെപ്പം പൂർത്തിയാക്കുക
- 📂 **ഡാറ്റ എടുക്കൽ** - ഡാറ്റാസെറ്റുകൾ വായിച്ചു പഠിക്കാൻ പഠിക്കുക
- 📊 **ിമ്പിൾ അനാലിസിസ്** - സ്‌റ്റാറ്റിസ്റ്റിക്സ് കണക്കാക്കുക, മാതൃകകൾ കണ്ടെത്തുക
- 📈 **ബേസിക് ദൃശ്യവൽക്കരണം** - ചാർട്ടുകളും ഗ്രാഫുകളും സൃഷ്ടിക്കുക
- 🔬 **യഥാർത്ഥ പ്രോജക്റ്റ്** - ആരംഭം മുതൽ സമാപന വരെ മുഴുവൻ പ്രവൃത്തി നിർവ്വഹണം
ഓരോ ഉദാഹരണവും ഓരോ ഘട്ടവും വിശദമായി വിവരിക്കുന്ന കോമന്റുകളോടെയുള്ളതുകൊണ്ട്, പൂർണ്ണ սկսിച്ചവർക്കും അനുയോജ്യമാണ്!
ഏറ്റവും പഠാരണീയരായവർക്കായി ഓരോ ഘടകവും വിശദമായ കമന്റുകളൊടുകൂടി നൽകപ്പെട്ടിരിക്കുന്നു!
👉 **[ഉദാഹരണങ്ങളോടൊപ്പം ആരംഭിക്കുക](examples/README.md)** 👈
👉 **[ഉദാഹരണങ്ങളിൽ നിന്ന് ആരംഭിക്കുക](examples/README.md)** 👈
## പാഠങ്ങൾ
|![ @sketchthedocs നൽകിയ സ്കെട്നോട്ട് https://sketchthedocs.dev](../../translated_images/ml/00-Roadmap.4905d6567dff4753.webp)|
|![ @sketchthedocs-ന്റെ സ്‌കെച്ച്നോട്ട് https://sketchthedocs.dev](../../translated_images/ml/00-Roadmap.4905d6567dff4753.webp)|
|:---:|
| ഡാറ്റ സയൻസ് ഫോർ ബിഗിന്നേഴ്സ്: റോഡ്‌മാപ്പ് - _സ്കെട്നോട്ട് [@nitya](https://twitter.com/nitya)_ |
| ഡാറ്റ സയൻസ് ഫോർ ബിഗിന്നേഴ്സ്: റോഡ് മാപ്പ് - _സ്കെച്ച്നോട്ട് [@nitya](https://twitter.com/nitya) tarafından_ |
| പാഠ നമ്പർ | വിഷയപരിധി | പാഠ വിഭാഗം | പഠന ലക്ഷ്യങ്ങൾ | ലിങ്കുചെയ്‌ത പാഠം | എഴുത്തുകാരന്‍ |
| പാഠ നമ്പർ | വിഷയം | പാഠ ഗ്രൂപ്പിങ്ങ് | പഠന ലക്ഷ്യങ്ങൾ | ലിങ്ക് ചെയ്ത പാഠം | ലേഖകൻ |
| :-----------: | :----------------------------------------: | :--------------------------------------------------: | :-----------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :---------------------------------------------------------------------: | :----: |
| 01 | ഡാറ്റാ സയൻസ് നിർവചിക്കൽ | [പരിചയം](1-Introduction/README.md) | ഡാറ്റാ സയസിന്റെ അടിസ്ഥാന ആശയങ്ങൾ പഠിക്കുകയും, അതാണ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്, മെഷീൻ ലേണിങ്, വലിയ ഡാറ്റ എന്നിവയും എങ്ങനെ ബന്ധപ്പെട്ടു പ്രവർത്തിക്കുന്നുവെന്ന് മനസ്സിലാക്കുക. | [lesson](1-Introduction/01-defining-data-science/README.md) [video](https://youtu.be/beZ7Mb_oz9I) | [ഡിമിട്രി](http://soshnikov.com) |
| 02 | ഡാറ്റാ സയൻസ് ധാർമിക | [പരിചയം](1-Introduction/README.md) | ഡാറ്റാ ധാർമികതയുടെ ആശയങ്ങൾ, വെല്ലുവിളികൾ, നിബന്ധനകൾ. | [lesson](1-Introduction/02-ethics/README.md) | [നിത്യ](https://twitter.com/nitya) |
| 03 | ഡാറ്റ നിർവചിക്കൽ | [പരിചയം](1-Introduction/README.md) | ഡാറ്റ എങ്ങിനെ വർഗീകരിക്കപ്പെടുന്നു, അതിന്റെ സാധാരണ ഉറവിടങ്ങൾ. | [lesson](1-Introduction/03-defining-data/README.md) | [ജാസ്മിൻ](https://www.twitter.com/paladique) |
| 04 | സ്റ്റാറ്റിസ്റ്റിക്സിനും പരസ്യങ്ങൾക്കും പരിചയം | [പരിചയം](1-Introduction/README.md) | ദിവസവുമുള്ള ഡാറ്റ മനസ്സിലാക്കാൻ പരസ്യവും സ്റ്റാറ്റിസ്റ്റിക്സും ഉപയോഗിച്ച ഗണിത സാങ്കേതിക വിദ്യകൾ. | [lesson](1-Introduction/04-stats-and-probability/README.md) [video](https://youtu.be/Z5Zy85g4Yjw) | [ഡിമിട്രി](http://soshnikov.com) |
| 05 | റിലേഷണൽ ഡാറ്റ ഉപയോഗപ്പെടുത്താം | [ഡാറ്റയുമായി പ്രവർത്തിക്കൽ](2-Working-With-Data/README.md) | റിലേഷണൽ ഡാറ്റയിലേക്കുള്ള പരിചയവും, ഘടിത ചോദ്യം ഭാഷയായി അറിയപ്പെടുന്ന SQL ഉപയോഗിച്ച് റിലേഷണൽ ഡാറ്റ പരിശോധിക്കുന്നതിന്റെ അടിസ്ഥാന കാര്യങ്ങൾ. | [lesson](2-Working-With-Data/05-relational-databases/README.md) | [ക്രിസ്റ്റഫർ](https://www.twitter.com/geektrainer) | | |
| 06 | നോൺ-SQL ഡാറ്റയുമായി പ്രവർത്തിക്കുക | [ഡാറ്റയുമായി പ്രവർത്തിക്കൽ](2-Working-With-Data/README.md) | നോൺ-രിലേഷണൽ ഡാറ്റയിലേക്കുള്ള പരിചയവും, അതിന്റെ പല തരങ്ങളും രേഖ ഡാറ്റാബേസുകൾ പരിശോധിക്കുകയും വിശകലനം ചെയ്യുകയും ചെയ്യുന്നതിന്റെ അടിസ്ഥാന കാര്യങ്ങൾ. | [lesson](2-Working-With-Data/06-non-relational/README.md) | [ജാസ്മിൻ](https://twitter.com/paladique)|
| 07 | പൈഥൺ ഉപയോഗിച്ച് പ്രവർത്തിക്കുക | [ഡാറ്റയുമായി പ്രവർത്തിക്കൽ](2-Working-With-Data/README.md) | Pandas പോലുള്ള ലൈബ്രറികൾ ഉപയോഗിച്ച് ഡാറ്റ പരിശോധിക്കാൻ പൈഥൺക്ക് അടിസ്ഥാനങ്ങൾ. പൈഥൺ പ്രോഗ്രാമിംഗിൽ അടിസ്ഥാന അറിവ് നിർബന്ധം. | [lesson](2-Working-With-Data/07-python/README.md) [video](https://youtu.be/dZjWOGbsN4Y) | [ഡിമിട്രി](http://soshnikov.com) |
| 08 | ഡാറ്റ ഒരുക്കൽ | [ഡാറ്റയുമായി പ്രവർത്തിക്കൽ](2-Working-With-Data/README.md) | മിസ്സിംഗ്, തെറ്റായ, അപൂർണ്ണമായ ഡാറ്റ കൈകാര്യം ചെയ്യുന്നതിന് ഡാറ്റ ശുചീകരണവും പരിവർത്തനവും സംബന്ധിച്ച സാങ്കേതിക വിശദാംശങ്ങൾ. | [lesson](2-Working-With-Data/08-data-preparation/README.md) | [ജാസ്മിൻ](https://www.twitter.com/paladique) |
| 09 | മാസ്പ്ളോട്ട്‌ലിബ് ഉപയോഗിച്ച് അളവുകൾ ദൃശ്യവത്കരിക്കൽ | [ഡാറ്റ ദൃശ്യീകരണം](3-Data-Visualization/README.md) | പറവികളുടെ ഡാറ്റാ ദൃശ്യവത്കരിക്കാൻ Matplotlib ഉപയോഗിക്കുക 🦆 | [lesson](3-Data-Visualization/09-visualization-quantities/README.md) | [ജെൻ](https://twitter.com/jenlooper) |
| 10 | ഡാറ്റാ വിതരണങ്ങളുടെ ദൃശ്യവത്കരണം | [ഡാറ്റ ദൃശ്യീകരണം](3-Data-Visualization/README.md) | ഒരു ഇടവേളയിലുള്ള നിരീക്ഷണങ്ങളും പ്രവണതകളും ദൃശ്യവത്കരിക്കൽ. | [lesson](3-Data-Visualization/10-visualization-distributions/README.md) | [ജെൻ](https://twitter.com/jenlooper) |
| 11 | അനുപാതങ്ങൾ ദൃശ്യവത്കരിക്കൽ | [ഡാറ്റ ദൃശ്യീകരണം](3-Data-Visualization/README.md) | വ്യത്യസ്തമായ ഗ്രൂപ്പ് ചെയ്ത ശതമാനങ്ങൾ ദൃശ്യമാക്കുക. | [lesson](3-Data-Visualization/11-visualization-proportions/README.md) | [ജെൻ](https://twitter.com/jenlooper) |
| 12 | ബന്ധങ്ങൾ ദൃശ്യവത്കരിക്കൽ | [ഡാറ്റ ദൃശ്യീകരണം](3-Data-Visualization/README.md) | ഡാറ്റയും അതിലെ ചാരിത്രങ്ങളുമുള്ള സെറ്റുകൾ തമ്മിലുള്ള ബന്ധങ്ങളും സാന്ദ്രതകളും ദൃശ്യമാക്കുക. | [lesson](3-Data-Visualization/12-visualization-relationships/README.md) | [ജെൻ](https://twitter.com/jenlooper) |
| 13 | പ്രധാനം ഉള്ള ദൃശ്യവത്കരണം | [ഡാറ്റ ദൃശ്യമാക്കൽ](3-Data-Visualization/README.md) | സജീവ പ്രശ്നപരിഹാരത്തിനും തിരിച്ചറിവിനും‍റെ മൂല്യം വർദ്ധിപ്പിക്കാൻ ഉപകരിക്കുന്ന സാങ്കേതിക വിദ്യകളും മാർഗനിർദ്ദേശങ്ങളും. | [lesson](3-Data-Visualization/13-meaningful-visualizations/README.md) | [ജെൻ](https://twitter.com/jenlooper) |
| 14 | ഡാറ്റാ സയൻസ് ജീവിത ചക്രത്തിനുള്ള പരിചയം | [ജീവിതചക്രം](4-Data-Science-Lifecycle/README.md) | ഡാറ്റാ സയൻസ് ജീവിത ചക്രം പരിചയപ്പെടുക, ആദ്യ ഘട്ടമായ ഡാറ്റാ സമാഹരണവും ഉൽപ്പാദനവുമാണ്. | [lesson](4-Data-Science-Lifecycle/14-Introduction/README.md) | [ജാസ്മിൻ](https://twitter.com/paladique) |
| 15 | വിശകലനം | [ജീവിതചക്രം](4-Data-Science-Lifecycle/README.md) | ഡാറ്റാ സയൻസ് ജീവിതചക്രത്തിൽ ഡാറ്റ വിശകലനം നടത്തുന്നതിനുള്ള സാങ്കേതികതകൾ സൂചിപ്പിക്കുന്നു. | [lesson](4-Data-Science-Lifecycle/15-analyzing/README.md) | [ജാസ്മിൻ](https://twitter.com/paladique) | | |
| 16 | സംവാദം | [ജീവിതചക്രം](4-Data-Science-Lifecycle/README.md) | ഡാറ്റയിലുള്ള തിരിച്ചറിവുകൾ സ്വീകാര്യമായ വിധത്തിൽ നയതന്ത്ര നിർണായകർക്കായി സമർപ്പിക്കുന്ന ഘട്ടം. | [lesson](4-Data-Science-Lifecycle/16-communication/README.md) | [ജാലൻ](https://twitter.com/JalenMcG) | | |
| 17 | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് | [ക്ലൗഡ് ഡാറ്റ](5-Data-Science-In-Cloud/README.md) | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് പരിചയപ്പെടുക കൂടാതെ അതിന്റെ ഗുണങ്ങൾ. | [lesson](5-Data-Science-In-Cloud/17-Introduction/README.md) | [റ്റിഫാനി](https://twitter.com/TiffanySouterre) & [മോഡ്](https://twitter.com/maudstweets) |
| 18 | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് | [ക്ലൗഡ് ഡാറ്റ](5-Data-Science-In-Cloud/README.md) | ലോ കോഡ് ഉപകരണങ്ങൾ ഉപയോഗിച്ച് മാതൃകകൾ പരിശീലിപ്പിക്കൽ. |[lesson](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [റ്റിഫാനി](https://twitter.com/TiffanySouterre) & [മോഡ്](https://twitter.com/maudstweets) |
| 19 | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് | [ക്ലൗഡ് ഡാറ്റ](5-Data-Science-In-Cloud/README.md) | Azure Machine Learning Studio ഉപയോഗിച്ചു മാതൃകകൾ വിനിയോഗിക്കൽ. | [lesson](5-Data-Science-In-Cloud/19-Azure/README.md)| [റ്റിഫാനി](https://twitter.com/TiffanySouterre) & [മോഡ്](https://twitter.com/maudstweets) |
| 20 | യഥാർത്ഥ ലോകത്തെ ഡാറ്റാ സയൻസ് | [വനം നിറത്തിൽ](6-Data-Science-In-Wild/README.md) | യഥാർത്ഥ ലോകം പ്രോജക്റ്റുകളിൽ ഡാറ്റാ സയൻസിന്റെ പ്രയോജനം. | [lesson](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [നിത്യ](https://twitter.com/nitya) |
## GitHub കോഡ്‌സ്പേസസ്
ഈ സാമ്പിൾ Codespace ൽ തുറക്കുന്നതിനുള്ള ചുവടു പിന്തുടരുക:
1. കോഡ് ഡ്രോപ്പ്-ഡൗൺ മെനുവിൽ നിന്ന് Open with Codespaces തിരഞ്ഞെടുക്കുക.
2. പാനൽ അടിവരിയിൽ + New codespace തിരഞ്ഞെടുക്കുക.
കൂടുതൽ വിവരങ്ങൾക്കായി [GitHub ഡോക്യുമെന്റേഷൻ](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace) കാണുക.
## VSCode റിമോട്ട് - കണ്ടെയ്‌നറുകൾ
നിങ്ങളുടെ ലൊക്കൽ മെഷീനിൽ VSCode ഉപയോഗിച്ച് ഈ റെപ്പോ ഒരു കണ്ടെയ്‌നറിൽ തുറക്കാൻ, VS Code Remote - Containers എക്സ്റ്റൻഷൻ ഉപയോഗിച്ച് ചുവടു പിന്തുടരുക:
1. ഇത് നിങ്ങളുടെ ആദ്യ ഡെവലപ്പ്മെന്റ് കണ്ടെയ്‌നർ സംവിധാനം ആയിരിക്കുകയാണെങ്കിൽ, ദയവായി നിങ്ങളുടെ സിസ്റ്റം പ്രീ-റിക്വിസിറ്റുകൾ (ഉദാ: Docker ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെന്ന്) [Getting started ഡോക്യുമെന്റേഷൻ](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started) ൽ ഉറപ്പാക്കുക.
റെപ്പോ സമ്പൂർണമായും ഡോക്കർ വോൾയത്തിൽ ക്ലോൺ ചെയ്യുക എന്ന് ഉപയോഗിക്കാം:
**ഗమనിക്കുക**: ഇതിന്റെ പിന്നിൽ, Remote-Containers: **Clone Repository in Container Volume...** കമാൻഡ് ഉപയോഗിച്ച് കോഡ്ഡാറ്റയെ ലൊക്കൽ ഫയൽ സിസ്റ്റത്തിലെ പകരം ഡോക്കർ വോൾയത്തിൽ ക്ലോൺ ചെയ്യും. [Volumes](https://docs.docker.com/storage/volumes/) കണ്ടെയ്‌നർ ഡാറ്റ പിന്തുണയ്ക്കാൻ മുൻഗണനാ സംവിധാനമാണ്.
അല്ലെങ്കിൽ ലൊക്കലായി ക്ലോൺ ചെയ്ത റെപ്പോ തുറക്കുക:
- ഈ റെപ്പോ നിങ്ങളുടെ ലൊക്കൽ ഫയൽസിസ്റ്റത്തിലേക്ക് ക്ലോൺ ചെയ്യുക.
| 01 | ഡാറ്റാ സയൻസ് നിർവ്വചിക്കൽ | [പരിചയം](1-Introduction/README.md) | ഡാറ്റാ സയന്‍സിന്റെ അടിസ്ഥാന ആശയങ്ങൾ, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസുമായി, മെഷീൻ ലേണിങ്ങുമായി, ബിഗ് ഡാറ്റയുമായുള്ള ബന്ധം പഠിക്കുക. | [പാഠം](1-Introduction/01-defining-data-science/README.md) [വീഡിയോ](https://youtu.be/beZ7Mb_oz9I) | [ഡ്മിത്രി](http://soshnikov.com) |
| 02 | ഡാറ്റാ സയൻസ് ധാർമിക | [പരിചയം](1-Introduction/README.md) | ഡാറ്റാ ധാർമിക ആശയങ്ങൾ, വെല്ലുവിളികൾ & ഫ്രെയിംവർക്കുകൾ. | [പാഠം](1-Introduction/02-ethics/README.md) | [നിത്യ](https://twitter.com/nitya) |
| 03 | ഡാറ്റ നിർവ്വചിക്കൽ | [പരിചയം](1-Introduction/README.md) | ഡാറ്റ എങ്ങനെ വർഗ്ഗീകരിക്കപ്പെടുന്നു, അതിന്റെ സാധാരണ സ്രോതസ്സ്. | [പാഠം](1-Introduction/03-defining-data/README.md) | [ജാസ്മിൻ](https://www.twitter.com/paladique) |
| 04 | സ്റ്റാറ്റിസ്റ്റിക്ക്സിന്റെയും സാധ്യതാപരമായതിന്റെയും പരിചയം | [പരിചയം](1-Introduction/README.md) | ഡാറ്റയെ മനസ്സിലാക്കാൻ സാധ്യതയും സ്റ്റാറ്റിസ്റ്റിക്‌സും ഉപയോഗിക്കുന്ന ഗണിത തന്ത്രങ്ങൾ. | [പാഠം](1-Introduction/04-stats-and-probability/README.md) [വീഡിയോ](https://youtu.be/Z5Zy85g4Yjw) | [ഡ്മിത്രി](http://soshnikov.com) |
| 05 | റിലേഷണൽ ഡാറ്റയിൽ പ്രവർത്തനം | [ഡാറ്റയുമായി ജോലി ചെയ്യൽ](2-Working-With-Data/README.md) | റിലേഷണൽ ഡാറ്റയുടെ പരിചയം, ഉറച്ചു ചോദ്യം ഭാഷ ഉപയോഗിച്ച് അതേ ബന്ധമുള്ള ഡാറ്റ പരിശോധിച്ചും അനാലിസിസ് ചെയ്യുന്ന അടിസ്ഥാനങ്ങൾ. SQL (പറയുന്നത് “സി-ക്വെല്ല്”) എന്നും അറിയപ്പെടുന്നു. | [പാഠം](2-Working-With-Data/05-relational-databases/README.md) | [ക്രിസ്റ്റഫർ](https://www.twitter.com/geektrainer) | | |
| 06 | നോൺ-SQL ഡാറ്റയിൽ പ്രവർത്തനം | [ഡാറ്റയുമായി ജോലി ചെയ്യൽ](2-Working-With-Data/README.md) | നോൺ-റിലേഷണൽ ഡാറ്റയുടെ പരിചയം, അവയുടെ വിവിധ തരങ്ങൾ, ഡോക്യുമെന്റ് ഡാറ്റാബേസുകൾ പരിശോധിക്കുകയും വിശകലനം ചെയ്യുന്നതിന്റെ അടിസ്ഥാനങ്ങൾ. | [പാഠം](2-Working-With-Data/06-non-relational/README.md) | [ജാസ്മിൻ](https://twitter.com/paladique)|
| 07 | പൈതലിൽ പ്രവർത്തനം | [ഡാറ്റയുമായി ജോലി ചെയ്യൽ](2-Working-With-Data/README.md) | പണ്ഡാസ് പോലുള്ള ലൈബ്രറികൾ ഉപയോഗിച്ച് പൈതൺ ഡാറ്റാ എക്‌സ്‌പ്ലോറേഷനിൽ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് അടിസ്ഥാനങ്ങൾ. പൈതൺ പ്രോഗ്രാമിംഗിൽ അടിസ്ഥാന പഠനം ശുപാർശ ചെയ്യുന്നു. | [പാഠം](2-Working-With-Data/07-python/README.md) [വീഡിയോ](https://youtu.be/dZjWOGbsN4Y) | [ഡ്മിത്രി](http://soshnikov.com) |
| 08 | ഡാറ്റാ തയ്യാറാക്കൽ | [ഡാറ്റയുമായി ജോലി ചെയ്യൽ](2-Working-With-Data/README.md) | നഷ്ടപ്പെട്ട, തെറ്റായ, അപ്രാപ്തമായ ഡാറ്റ കൈകാര്യം ചെയ്യുന്നതിനുള്ള ശുദ്ധിയാക്കൽ, രൂപാന്തര്ണം തുടങ്ങിയ ഡാറ്റാ സാങ്കേതികതകൾ. | [പാഠം](2-Working-With-Data/08-data-preparation/README.md) | [ജാസ്മിൻ](https://www.twitter.com/paladique) |
| 09 | അളവുകൾ ദൃശ്യവൽക്കരിക്കുക | [ഡാറ്റാ ദൃശ്യവൽക്കരണം](3-Data-Visualization/README.md) | മാറ്റ്plotlib ഉപയോഗിച്ചുകൊണ്ട് പക്ഷികളുടെ ഡാറ്റ ദൃശ്യവൽക്കരിക്കുക 🦆 | [പാഠം](3-Data-Visualization/09-visualization-quantities/README.md) | [ജെൻ](https://twitter.com/jenlooper) |
| 10 | ഡാറ്റയുടെ വിതരണം ദൃശ്യവൽക്കരിക്കൽ | [ഡാറ്റാ ദൃശ്യവൽക്കരണം](3-Data-Visualization/README.md) | ഒരു ഇടവേളയിലുണ്ടായ നിരീക്ഷണങ്ങളും പ്രവണതകളും ദൃശ്യവൽക്കരിക്കൽ. | [പാഠം](3-Data-Visualization/10-visualization-distributions/README.md) | [ജെൻ](https://twitter.com/jenlooper) |
| 11 | അനുപാത ദൃശ്യവൽക്കരിക്കൽ | [ഡാറ്റാ ദൃശ്യവൽക്കരണം](3-Data-Visualization/README.md) | വിവർത്തനാംശങ്ങളും കൂട്ടിച്ചേർക്കപ്പെട്ട ശതമാനങ്ങളും ദൃശ്യമാക്കൽ. | [പാഠം](3-Data-Visualization/11-visualization-proportions/README.md) | [ജെൻ](https://twitter.com/jenlooper) |
| 12 | ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ | [ഡാറ്റാ ദൃശ്യവൽക്കരണം](3-Data-Visualization/README.md) | ഡാറ്റാ സെറ്റുകളും അവരുടെ ഘടകങ്ങളും ഇടയിൽ ബന്ധങ്ങളും സഹബന്ധങ്ങളും ദൃശ്യവൽക്കരിക്കൽ. | [പാഠം](3-Data-Visualization/12-visualization-relationships/README.md) | [ജെൻ](https://twitter.com/jenlooper) |
| 13 | സാരമായ ദൃശ്യവൽക്കരണങ്ങൾ | [ഡാറ്റാ ദൃശ്യവൽക്കരണം](3-Data-Visualization/README.md) | പ്രശ്നപരിഹാരവും അറിവ് കണ്ടെത്തലും ലാഭകരമാക്കുന്നതിനുള്ള പ്രാധ്യമങ്ങൾക്കും മാർഗ്ഗനിർദ്ദേശങ്ങൾക്കും. | [പാഠം](3-Data-Visualization/13-meaningful-visualizations/README.md) | [ജെൻ](https://twitter.com/jenlooper) |
| 14 | ഡാറ്റാ സയൻസ് ലൈഫ്‌സൈക്കിൾ പരിചയം | [ലൈഫ്‌സൈക്കിൾ](4-Data-Science-Lifecycle/README.md) | ഡാറ്റാ ശേഖരണവും ഉഷിച്ചെടുക്കലും ഉള്‍പ്പെടെ ഡാറ്റാ സയൻസ് ജീവിതചക്രത്തെ പരിചയപ്പെടുത്തുക. | [പാഠം](4-Data-Science-Lifecycle/14-Introduction/README.md) | [ജാസ്മിൻ](https://twitter.com/paladique) |
| 15 | വിശകലനം | [ലൈഫ്‌സൈക്കിൾ](4-Data-Science-Lifecycle/README.md) | ഡാറ്റ അനാലിസിസിനായുള്ള സാങ്കേതിക തന്ത്രങ്ങൾ വിവാഹരഹിതമാക്കുന്ന ജീവിതഘട്ടം. | [പാഠം](4-Data-Science-Lifecycle/15-analyzing/README.md) | [ജാസ്മിൻ](https://twitter.com/paladique) | | |
| 16 | ആശയവിനിമയം | [ലൈഫ്‌സൈക്കിൾ](4-Data-Science-Lifecycle/README.md) | ഡാറ്റയിൽ നിന്നുള്ള അറിവ് എളുപ്പത്തിൽ തീരുമാനം എടുക്കുന്നവരുടെ മനസ്സിലാകുവാൻ പ്രദർശിപ്പിക്കുന്ന അവസ്ഥ. | [പാഠം](4-Data-Science-Lifecycle/16-communication/README.md) | [ജാലൻ](https://twitter.com/JalenMcG) | | |
| 17 | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് | [ക്ലൗഡ്ഡാറ്റ](5-Data-Science-In-Cloud/README.md) | ഈ സീരീസിൽ ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് പരിചയപ്പെടുത്തുകയും അതിന്റെ ഗുണങ്ങൾ വിശദീകരിക്കുകയും ചെയ്യുന്നു. | [പാഠം](5-Data-Science-In-Cloud/17-Introduction/README.md) | [ടിഫനി](https://twitter.com/TiffanySouterre) and [മോഡ്](https://twitter.com/maudstweets) |
| 18 | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് | [ക്ലൗഡ്ഡാറ്റ](5-Data-Science-In-Cloud/README.md) | ലോ കൊഡ് ഉപകരണങ്ങൾ ഉപയോഗിച്ചു മോഡലുകൾ പരിശീലിപ്പിക്കൽ. |[പാഠം](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [ടിഫനി](https://twitter.com/TiffanySouterre) and [മോഡ്](https://twitter.com/maudstweets) |
| 19 | ക്ലൗഡിൽ ഡാറ്റാ സയൻസ് | [ക്ലൗഡ്ഡാറ്റ](5-Data-Science-In-Cloud/README.md) | അജ്യൂർ മെഷീൻ ലേണിങ്ങ് സ്റ്റുഡിയോ ഉപയോഗിച്ച് മോഡലുകൾ വിന്യസിക്കൽ. | [പാഠം](5-Data-Science-In-Cloud/19-Azure/README.md)| [ടിഫനി](https://twitter.com/TiffanySouterre) and [മോഡ്](https://twitter.com/maudstweets) |
| 20 | കാട്ടിൽ ഡാറ്റാ സയൻസ് | [കാട്ടിൽ](6-Data-Science-In-Wild/README.md) | യാഥാര്‍ത്ഥ്യ ലോകത്തിലെ ഡാറ്റാ സയൻസ് മൂലമുണ്ടായ പ്രോജക്റ്റുകൾ. | [പാഠം](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [നിത്യ](https://twitter.com/nitya) |
## GitHub കോഡ്സ்பെയ്‌സുകൾ
ഈ സാമ്പിൾ കോഡ്സ്‌പെയ്‌സ് തുറക്കാൻ താഴെ പറയുന്ന നടപടി ക്രമങ്ങൾ പിന്തുടരുക:
1. കോഡ് ഡ്രോപ്പ്-ഡൗൺ മెనു ക്ലിക്ക് ചെയ്ത് Open with Codespaces ഓപ്ഷൻ തിരഞ്ഞെടുക്കുക.
2. പേനിന്റെ താഴെയാണ് + New codespace തിരഞ്ഞെടുക്കുക.
കൂടുതൽ വിവരങ്ങൾക്ക്, [GitHub ഡോകുമെന്റേഷൻ](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace) പരിശോധിക്കുക.
## VSCode Remote - Containers
നിങ്ങളുടെ ലൊക്കൽ മെഷീനും VSCode ഉപയോഗിച്ച് VS Code Remote - Containers വിപുലീകരണം ഉപയോഗിച്ച് ഈ റിപ്പോസിറ്ററി ഒരു കണ്ടെയ്‌നറിൽ തുറക്കുന്നതിന് താഴെ നൽകിയ ക്രമീകരണം പിന്തുടരുക:
1. ആദ്യമായി ഡെവലപ്പ്മെന്റ് കണ്ടെയ്‌നർ ഉപയോഗിക്കുന്നുവെങ്കിൽ, സിസ്റ്റം മുൻകൂട്ടി ആവശ്യകതകൾ (മൂല്യവത്തായ ഡോക്കർ ഇൻസ്റ്റാൾ ചെയ്യുക) [getting started documentation](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started) പരിശോധിക്കുക.
രീതി ഉപയോഗിച്ച്, നിങ്ങൾക്ക് റിപ്പോസിറ്ററി ഒരു ഐസൊലേറ്റഡ് ഡോക്കർ വോളിയത്തിൽ തുറക്കാം:
**കുറിപ്പ്**: ബാക്ക്എൻഡ് ഇപ്രകാരം Remote-Containers: **Clone Repository in Container Volume...** എന്ന കമാൻഡ് ഉപയോഗിച്ച് ഡോക്കർ വോളിയത്തിൽ സോഴ്‌സ് കോഡ് ക്ലോൺ ചെയ്യും, ലോക്കൽ ഫയൽസിസ്റ്റം അല്ല. [വോളിയങ്ങൾ](https://docs.docker.com/storage/volumes/) കണ്ടെയ്ൻർ ഡാറ്റ സംരക്ഷിക്കുന്നതിനുള്ള ഏറ്റവും അനുയോജ്യമായ മാർഗ്ഗമാണ്.
അല്ലെങ്കിൽ ലോക്കലിൽ ക്ലോൺ ചെയ്‌തോ ഡൗൺലോഡ് ചെയ്‌തോ രൂപം തുറക്കുക:
- റിപ്പോസിറ്ററി നിങ്ങളുടെ ഫയൽസിസ്റ്റത്തിലേക്ക് ക്ലോൺ ചെയ്യുക.
- F1 അമർത്തി **Remote-Containers: Open Folder in Container...** കമാൻഡ് തിരഞ്ഞെടുക്കുക.
- ഫോളഡറിന്റെ ക്ലോൺ ചെയ്യുന്ന പകർപ്പ് തിരഞ്ഞെടുക്കുക, കണ്ടെയ്‌നർ ആരംഭിക്കാൻ കാത്തിരിക്കുക, തുടർന്ന് പരീക്ഷിച്ച് നോക്കുക.
- ക്ലോൺ ചെയ്ത ഫോൾഡർ തിരഞ്ഞെടുക്കുക, കണ്ടെയ്‌നർ ആരംഭിക്കുമ്പോൾ കാത്തിരിക്കുക, തുടർന്ന് പരീക്ഷണം നടത്തുക.
## ഓഫ്ലൈൻ ആക്സസ്
## ഓഫ്ലൈൻ ആക്സസ്
[Docsify](https://docsify.js.org/#/) ഉപയോഗിച്ച് ഈ ഡോക്യുമെന്റേഷൻ ഓഫ്‌ലൈൻ ചോന്ന് പ്രവർത്തിപ്പിക്കാൻ കഴിയും. ഈ റെപ്പോ ഫോർക്ക് ചെയ്യുക, [Docsify ഇൻസ്റ്റാൾ](https://docsify.js.org/#/quickstart) ചെയ്യുക നിങ്ങളുടെ ലൊക്കൽ മെഷീനിൽ, തുടർന്ന് ഈ റെപ്പോയുടെ റൂട്ടിൽ `docsify serve` ടൈപ് ചെയ്യുക. വെബ്സൈറ്റ് `localhost:3000` പോർട്ടിൽ ലഭ്യമാണ്.
[Docsify](https://docsify.js.org/#/) ഉപയോഗിച്ച് ഈ ഡോക്യമെന്റേഷൻ ഓഫ്ലൈനിൽ പ്രവർത്തിപ്പിക്കാം. ഈ റിപ്പോസിറ്ററി ഫോർക്കുചെയ്‌തു, ലോക്കലിൽ [Docsify ഇൻസ്റ്റാൾ](https://docsify.js.org/#/quickstart) ചെയ്ത ശേഷം, ഇവിടെ ഡോക്വുമെന്റ് ഇൻഡക്സിൽ നിന്ന് `docsify serve` ടൈപ്പ് ചെയ്യുക. വെബ്സൈറ്റ് സ്ഥലീയം പോർട്ട് 3000 ല്‌ ലഭിക്കും: `localhost:3000`.
> കുറിപ്പ്: നോട്ട് ബുക്കുകൾ Docsify വഴിയില്ലാതെ, അതിനാൽ നിങ്ങൾക്ക് നോട്ട് ബുക്ക് ഓടിക്കേണ്ടത് വേണം എങ്കിൽ വേർപെടുത്തി VS കോഡിൽ പൈതൺ കൺറോളറോടെ നടത്തണം.
> ശ്രദ്ധിക്കുക, നോട്ട്ബുക്കുകൾ Docsify വഴി റെൻഡർ ചെയ്യില്ല, അതിനാൽ ഒരു നോട്ട്ബുക്ക് ഓടിക്കേണ്ടത് വേണമെങ്കിൽ, അത് വേർതിരിച്ച് VS Code-ൽ 파이ത്തൺ കർണൽ ഉപയോഗിച്ച് നടത്തുക.
## മറ്റൊരു പാഠ്യപദ്ധതി
## മറ്റ് പാഠ്യപദ്ധതികൾ
ഞങ്ങളുടെ ടീം മറ്റു പാഠ്യപധതികളും സൃഷ്ടിക്കുന്നു! നോക്കൂ:
ഞങ്ങളുടെ ടീം മറ്റ് പാഠ്യപദ്ധതികളും സൃഷ്ടിക്കുന്നു! പരിശോധിക്കുക:
<!-- CO-OP TRANSLATOR OTHER COURSES START -->
### LangChain
[![LangChain4j for Beginners](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners)
[![LangChain.js for Beginners](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin)
[![LangChain for Beginners](https://img.shields.io/badge/LangChain%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://github.com/microsoft/langchain-for-beginners?WT.mc_id=m365-94501-dwahlin)
---
### ആസ്യൂർ / എഡ്‌ജ് / MCP / ഏജന്റുകൾ
### അസ്യൂർ / എഡ്ജ് / MCP / ഏജന്റുമാർ
[![AZD for Beginners](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst)
[![Edge AI for Beginners](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst)
[![MCP for Beginners](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst)
@ -208,7 +218,7 @@
---
### ജനറേറ്റീവ് AI പരമ്പര
### ജനറേറ്റീവ് AI സീരീസ്
[![Generative AI for Beginners](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst)
[![Generative AI (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst)
[![Generative AI (Java)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst)
@ -227,27 +237,27 @@
---
### കോ‌പൈലട്ട് പരമ്പര
### കോപൈലറ്റ് സീരീസ്
[![Copilot for AI Paired Programming](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst)
[![Copilot for C#/.NET](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst)
[![Copilot Adventure](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst)
<!-- CO-OP TRANSLATOR OTHER COURSES END -->
## സഹായം നേടുന്നതിന്
## സഹായം നേടു
**പ്രശ്നങ്ങൾ നേരിടുകയാണോ?** സാധാരണ പ്രശ്നങ്ങൾക്ക് പരിഹാരങ്ങൾക്കായി നമ്മുടെ [Troubleshooting Guide](TROUBLESHOOTING.md) പരിശോധിക്കുക.
**പ്രശ്നങ്ങൾ നേരിട്ടുണ്ടോ?** സാധാരണ പ്രശ്നങ്ങൾക്ക് പരിഹാരങ്ങൾ കണ്ടെത്താൻ ഞങ്ങളുടെ [ത്തറിച്ചൊല്ലല്‍ഗൈഡ്](TROUBLESHOOTING.md) പരിശോധിക്കുക.
AI ആപ്പുകൾ നിർമ്മിക്കുന്നതിൽ നിങ്ങൾക്ക് തടസ്സമുണ്ടെങ്കിൽ അല്ലെങ്കിൽ സംശയങ്ങളുണ്ടെങ്കിൽ MCP-യെക്കുറിച്ച് fellow learners ഉം പരിചയസമ്പന്നരും ആയ ഡെവലപ്പർമാരുമായുള്ള ചർച്ചകളിൽ ചേർത്ത് വെക്കുക. ചോദ്യങ്ങൾക്ക് സ്വാഗതം പറയുന്നു, അറിയിപ്പ് സ്വതന്ത്രമായി പങ്കുവെക്കപ്പെടുന്നു എന്നു ഈ സാമുദായികം ആണ്.
AI ആപ്പുകൾ നിർമ്മിക്കുന്നതു സംബന്ധിച്ച് നിങ്ങൾക്ക് സംശയങ്ങളുണ്ടോ? MCP പരിചയസമ്പന്നരും മറ്റ് പഠനാർഥികളും ചേർന്ന് നടക്കുന്ന സംവാദങ്ങളിൽ പങ്കെടുക്കൂ. ചോദ്യങ്ങൾ സ്വാഗതം ചെയ്യുന്ന, അറിവ് സ്വതന്ത്രമായി പങ്കുവെക്കപ്പെടുന്ന ഒരു അനുഭവസമ്പന്നമായ സമൂഹമാണ് ഇത്.
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
ഉൽപ്പന്ന പ്രതികരണങ്ങൾക്കോ തകരാറുകൾക്കോ വേണ്ടി നിർമ്മിക്കാന്‍ വരുമ്പോൾ സന്ദർശിക്കുക:
ഉൽപ്പന്ന ഫീഡ്ബാക്കോ നിർമ്മാണത്തിലെ പിശകുകളോ ഉണ്ടെങ്കിൽ സന്ദർശിക്കുക:
[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**വിവരണക്കുറിപ്പ്**:
ഈ ഡോക്യുമെന്റ് AI പരിഭാഷാ സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് പരിഭാഷപ്പെടുത്തിയതാണ്. നമ്മൾ നിഷ്‌ക്കളങ്കതയ്ക്ക് ശ്രമിക്കുന്നുവെങ്കിലും, ഓട്ടോമേറ്റഡ് പരിഭാഷകളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. മൂല ഭാഷയിൽ ഉള്ള അത്യന്താപേക്ഷിത ഡോക്യുമെന്റ് ആയാണ് വിശ്വസിക്കേണ്ടത്. പ്രധാനപ്പെട്ട വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ പരിഭാഷ ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ പരിഭാഷയുടെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന എന്തെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായി വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
**അൽപസൂചനം**:
ഈ ഡോക്യുമെന്റ് AI വിവർത്തന സേവനമായ [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നമുക്ക് കൃത്യതയ്ക്കായി ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയമേധയാ പരിഭാഷകളിൽ പിഴവുകളും അശുദ്ധികളുമുണ്ടാകാൻ സാധ്യതയുണ്ട്. അതിന്റെ പ്രാദേശിക ഭാഷയിലെ യഥാർത്ഥ ഡോക്യുമെന്റ് ആത്മാർത്ഥമായ ഉറവിടമായി കണക്കാക്കണം. നിർണ്ണായകമായ വിവരങ്ങൾക്ക് പ്രൊഫഷണൽ മാനവ വിവർത്തനം നിർദ്ദേശിക്കപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകാവുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ വ്യാഖ്യാനഭ്രമങ്ങളിലേക്കോ ഞങ്ങൾ ഉത്തരവാദിത്വം ഏറ്റെടുക്കുന്നില്ല.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -4,7 +4,7 @@
നിത്യ നരസിംഹൻ, കലാകാരൻ
![roadmap sketchnote](../../../translated_images/ml/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.png)
![roadmap sketchnote](../../../translated_images/ml/00-Roadmap.4905d6567dff4753.webp)
---

@ -11,12 +11,24 @@
"source_file": "1-Introduction/01-defining-data-science/assignment.md",
"language_code": "te"
},
"1-Introduction/01-defining-data-science/notebook.ipynb": {
"original_hash": "8f5eb7b3f7cc89e6d98fb32e1de65dec",
"translation_date": "2026-02-27T10:38:12+00:00",
"source_file": "1-Introduction/01-defining-data-science/notebook.ipynb",
"language_code": "te"
},
"1-Introduction/01-defining-data-science/solution/assignment.md": {
"original_hash": "a8f79b9c0484c35b4f26e8aec7fc4d56",
"translation_date": "2025-12-19T14:29:26+00:00",
"source_file": "1-Introduction/01-defining-data-science/solution/assignment.md",
"language_code": "te"
},
"1-Introduction/01-defining-data-science/solution/notebook.ipynb": {
"original_hash": "090bbfbfcb0c40d3d6e3236f836164ea",
"translation_date": "2026-02-27T10:38:54+00:00",
"source_file": "1-Introduction/01-defining-data-science/solution/notebook.ipynb",
"language_code": "te"
},
"1-Introduction/02-ethics/README.md": {
"original_hash": "58860ce9a4b8a564003d2752f7c72851",
"translation_date": "2025-12-19T14:02:12+00:00",
@ -95,6 +107,12 @@
"source_file": "2-Working-With-Data/07-python/assignment.md",
"language_code": "te"
},
"2-Working-With-Data/07-python/notebook-covidspread.ipynb": {
"original_hash": "6335cccba01dc6ad7b15aba7a8c73f38",
"translation_date": "2026-02-27T10:39:57+00:00",
"source_file": "2-Working-With-Data/07-python/notebook-covidspread.ipynb",
"language_code": "te"
},
"2-Working-With-Data/08-data-preparation/README.md": {
"original_hash": "1b560955ff39a2bcf2a049fce474a951",
"translation_date": "2025-12-19T15:41:26+00:00",
@ -360,8 +378,8 @@
"language_code": "te"
},
"README.md": {
"original_hash": "8ec92ecfeb14923af733851239552146",
"translation_date": "2026-01-30T02:50:20+00:00",
"original_hash": "f671e295a294a2559fc59d1524e001b4",
"translation_date": "2026-02-27T10:51:11+00:00",
"source_file": "README.md",
"language_code": "te"
},

@ -6,7 +6,7 @@
---
[![డేటా సైన్స్ నిర్వచనం వీడియో](../../../../translated_images/te/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.png)](https://youtu.be/beZ7Mb_oz9I)
[![డేటా సైన్స్ నిర్వచనం వీడియో](../../../../translated_images/te/video-def-ds.6623ee2392ef1abf.webp)](https://youtu.be/beZ7Mb_oz9I)
## [పూర్వ-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/0)
@ -144,7 +144,7 @@
ఈ సవాలలో, మేము డేటా సైన్స్ రంగానికి సంబంధించిన భావనలను పాఠ్యాలను పరిశీలించడం ద్వారా కనుగొనడానికి ప్రయత్నిస్తాము. మేము డేటా సైన్స్ పై వికీపీడియా వ్యాసాన్ని తీసుకుని, టెక్స్ట్‌ను డౌన్లోడ్ చేసి ప్రాసెస్ చేసి, ఈ విధమైన పద మేఘాన్ని నిర్మిస్తాము:
![Word Cloud for Data Science](../../../../translated_images/te/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.png)
![Word Cloud for Data Science](../../../../translated_images/te/ds_wordcloud.664a7c07dca57de0.webp)
కోడ్‌ను చదవడానికి [`notebook.ipynb`](../../../../1-Introduction/01-defining-data-science/notebook.ipynb ':ignore') ను సందర్శించండి. మీరు కోడ్‌ను కూడా నడిపించి, అన్ని డేటా మార్పిడి ప్రక్రియలను ప్రత్యక్షంగా చూడవచ్చు.

@ -3,15 +3,15 @@
{
"cell_type": "markdown",
"source": [
"# సవాలు: డేటా సైన్స్ గురించి టెక్స్ట్ విశ్లేషణ\n",
"# సవాలు: డేటా సైన్స్ గురించి పాఠ్య విశ్లేషణ\n",
"\n",
"ఈ ఉదాహరణలో, సంప్రదాయ డేటా సైన్స్ ప్రక్రియలోని అన్ని దశలను కవర్ చేసే ఒక సులభమైన వ్యాయామం చేద్దాం. మీరు ఏ కోడ్ రాయాల్సిన అవసరం లేదు, కింద ఉన్న సెల్స్‌పై క్లిక్ చేసి వాటిని అమలు చేసి ఫలితాన్ని పరిశీలించవచ్చు. ఒక సవాలుగా, మీరు ఈ కోడ్‌ను వేరే డేటాతో ప్రయత్నించమని ప్రోత్సహించబడుతున్నారు.\n",
"ఈ ఉదాహరణలో, సంప్రదాయ డేటా సైన్స్ ప్రక్రియలో ఉన్న అన్ని దశలను కవర్ చేసే సులభమైన వ్యాయామం చేద్దాం. మీరు కో드를 రాయాల్సిన అవసరం లేదు, కింది సెల్స్‌పై క్లిక్ చేసి వాటిని అమలు చేసి ఫలితాన్ని చూడవచ్చు. ఒక సవాలుగా, విభిన్న డేటాతో ఈ కోడ్‌ను ప్రయత్నించమని మీరు ప్రోత్సహించబడుతున్నారు.\n",
"\n",
"## లక్ష్యం\n",
"\n",
"ఈ పాఠంలో, మేము డేటా సైన్స్‌కు సంబంధించిన వివిధ భావనలను చర్చిస్తున్నాము. **టెక్స్ట్ మైనింగ్** చేయడం ద్వారా మరిన్ని సంబంధిత భావనలను కనుగొనడానికి ప్రయత్నిద్దాం. మేము డేటా సైన్స్ గురించి ఒక టెక్స్ట్‌తో ప్రారంభించి, దానిలోని కీలకపదాలను తీసుకుని, ఆ తర్వాత ఫలితాన్ని దృశ్యీకరించడానికి ప్రయత్నిస్తాము.\n",
"ఈ పాఠంలో, మనం డేటా సైన్స్‌కు సంబంధించిన విభిన్న భావనలను చర్చించాము. కొన్ని **పాఠ్య మైనింగ్** ద్వారా మరింత సంబంధిత భావనలను కనుగొనగలమా అనేదాన్ని ప్రయత్నిద్దాం. డేటా సైన్స్ గురించి ఒక పాఠ్యాన్ని తీసుకుని, దానిలోని కీలకపదాలను తీసుకుని, ఆపై ఫలితాన్ని విజువలైజ్ చేయడానికి ప్రయత్నిస్తాము.\n",
"\n",
"టెక్స్ట్‌గా, నేను వికీపీడియా నుండి డేటా సైన్స్ పేజీని ఉపయోగిస్తాను:\n"
"ఒక పాఠ్యంగా, న్యూటుపిడియాలోని డేటా సైన్స్ గురించి పేజీని ఉపయోగిస్తాను:\n"
],
"metadata": {}
},
@ -34,7 +34,7 @@
"source": [
"## Step 1: డేటా పొందడం\n",
"\n",
"ప్రతి డేటా సైన్స్ ప్రక్రియలో మొదటి దశ డేటాను పొందడం. దీని కోసం మనం `requests` లైబ్రరీని ఉపయోగిస్తాము:\n"
"ప్రతి డేటా సైన్స్ ప్రాసెస్‌లో మొదటి దశ డేటాను పొందటం. మేము ఇది చేయడానికి `requests` లైబ్రరీని ఉపయోగించగలము:\n"
],
"metadata": {}
},
@ -66,45 +66,43 @@
{
"cell_type": "markdown",
"source": [
"## Step 2: డేటాను మార్చడం\n",
"## దశ 2: డేటాను మార్చడం\n",
"\n",
"తదుపరి దశ డేటాను ప్రాసెసింగ్‌కు అనుకూలమైన రూపంలోకి మార్చడం. మన సందర్భంలో, పేజీ నుండి HTML మూల కోడ్‌ను డౌన్లోడ్ చేసుకున్నాము, మరియు దాన్ని సాదా పాఠ్యంగా మార్చాలి.\n",
"తదుపరి దశ డేటాను ప్రాసెసింగ్ కు అనువైన రూపంలోకి మార్చడం. మన కేసులో, మనం పేజీ నుండి HTML సోర్సు కోడ్ డౌన్లోడ్ చేసుకున్నాము, మరియు దాన్ని సాదారణ టెక్స్ట్ గా మార్చాలి.\n",
"\n",
"ఇది చేయడానికి అనేక మార్గాలు ఉన్నాయి. మనం సులభమైన Python లోని [HTMLParser](https://docs.python.org/3/library/html.parser.html) ఆబ్జెక్ట్‌ను ఉపయోగిస్తాము. `HTMLParser` క్లాస్‌ను సబ్‌క్లాస్ చేసి, `<script>` మరియు `<style>` ట్యాగ్‌లను తప్పించి HTML ట్యాగ్‌లలోని అన్ని పాఠ్యాన్ని సేకరించే కోడ్‌ను నిర్వచించాలి.\n"
"ఇది చేయడానికి ఎన్నో మార్గాలు ఉన్నాయి. మనం [BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/), ఒక ప్రాచుర్యం పొందిన Python లైబ్రరీ ని ఉపయోగిస్తాము, ఇది HTML ని పార్స్ చేయడానికి ఉపయోగిస్తారు. BeautifulSoup మనకు నిర్దిష్ట HTML మూలకాలను టార్గెట్ చేయడాన్ని అనుమతిస్తుంది, కాబట్టి మనం Wikipedia యొక్క ప్రధాన వ్యాస కంటెంట్ పై concentration చేయగలుగుతాము మరియు కొన్ని నావిగేషన్ మెనూలు, సైడ్ బార్లు, ఫుటర్లు మరియు ఇతర సంబంధం లేని కంటెంట్ ను తగ్గించగలుగుతాము (అయితే కొంత బాయిలర్‌ప్లేట్ టెక్స్ట్ ఇంకా ఉండవచ్చు).\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"మొదట, మేము HTML పార్సింగ్ కోసం BeautifulSoup లైబ్రరీని ఇన్‌స్టాల్ చేయాలి:\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"import sys\r\n",
"!{sys.executable} -m pip install beautifulsoup4"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 64,
"source": [
"from html.parser import HTMLParser\r\n",
"\r\n",
"class MyHTMLParser(HTMLParser):\r\n",
" script = False\r\n",
" res = \"\"\r\n",
" def handle_starttag(self, tag, attrs):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = True\r\n",
" def handle_endtag(self, tag):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = False\r\n",
" def handle_data(self, data):\r\n",
" if str.strip(data)==\"\" or self.script:\r\n",
" return\r\n",
" self.res += ' '+data.replace('[ edit ]','')\r\n",
"\r\n",
"parser = MyHTMLParser()\r\n",
"parser.feed(text)\r\n",
"text = parser.res\r\n",
"print(text[:1000])"
"from bs4 import BeautifulSoup\r\n\r\n# Parse the HTML content\r\nsoup = BeautifulSoup(text, 'html.parser')\r\n\r\n# Extract only the main article content from Wikipedia\r\n# Wikipedia uses 'mw-parser-output' class for the main article content\r\ncontent = soup.find('div', class_='mw-parser-output')\r\n\r\ndef clean_wikipedia_content(content_node):\r\n \"\"\"Remove common non-article elements from a Wikipedia content node.\"\"\"\r\n # Strip jump links, navboxes, reference lists/superscripts, edit sections, TOC, sidebars, etc.\r\n selectors = [\r\n '.mw-jump-link',\r\n '.navbox',\r\n '.reflist',\r\n 'sup.reference',\r\n '.mw-editsection',\r\n '.hatnote',\r\n '.metadata',\r\n '.infobox',\r\n '#toc',\r\n '.toc',\r\n '.sidebar',\r\n ]\r\n for selector in selectors:\r\n for el in content_node.select(selector):\r\n el.decompose()\r\n\r\nif content:\r\n # Clean the content node to better approximate article text only.\r\n clean_wikipedia_content(content)\r\n text = content.get_text(separator=' ', strip=True)\r\n print(text[:1000])\r\nelse:\r\n print(\"Could not find main content. Using full page text.\")\r\n text = soup.get_text(separator=' ', strip=True)\r\n print(text[:1000])"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" Data science - Wikipedia Data science From Wikipedia, the free encyclopedia Jump to navigation Jump to search Interdisciplinary field of study focused on deriving knowledge and insights from data Not to be confused with information science . The existence of Comet NEOWISE (here depicted as a series of red dots) was discovered by analyzing astronomical survey data acquired by a space telescope , the Wide-field Infrared Survey Explorer . Part of a series on Machine learning and data mining Problems Classification Clustering Regression Anomaly detection AutoML Association rules Reinforcement learning Structured prediction Feature engineering Feature learning Online learning Semi-supervised learning Unsupervised learning Learning to rank Grammar induction Supervised learning ( classification  • regression ) Decision trees Ensembles Bagging Boosting Random forest k -NN Linear regression Naive Bayes Artificial neural networks Logistic regression Perceptron Relevance vector machine \n"
"Data science From Wikipedia, the free encyclopedia Interdisciplinary field of study focused on deriving knowledge and insights from data Data science is an interdisciplinary academic field that uses statistics, scientific computing, scientific methods, processes, algorithms and systems to extract or extrapolate knowledge and insights from noisy, structured, and unstructured data. Data science also integrates domain knowledge from the underlying application domain. Data science is multifaceted and can be described as a science, a research paradigm, a research method, a discipline, a workflow, and a profession.\n"
]
}
],
@ -113,11 +111,11 @@
{
"cell_type": "markdown",
"source": [
"## Step 3: Getting Insights\n",
"## Step 3: అవగాహన పొందడం\n",
"\n",
"ముఖ్యమైన దశ మా డేటాను ఏదైనా రూపంలోకి మార్చడం, దానినుండి మనం అవగాహనలను పొందగలగడం. మన సందర్భంలో, మనం టెక్స్ట్ నుండి కీవర్డ్స్‌ను తీసుకోవాలనుకుంటున్నాము, మరియు ఏ కీవర్డ్స్ ఎక్కువ అర్థవంతమైనవో చూడాలి.\n",
"ముఖ్యమైన దశ మన డేటాను నిర్దిష్ట రూపంలోకి మార్చడం, ఆ రూపం నుంచి మనం అవగాహన పొందగలగడం. మన సందర్భంలో, మనం టెక్స్ట్ నుండి కీవర్డ్లను ఆంక్షించాలనుకుంటున్నాం, మరియు ఏ కీవర్డ్లు ఎక్కువ అర్థవంతమై ఉన్నాయో చూడగలగాలి.\n",
"\n",
"కీవర్డ్ ఎక్స్‌ట్రాక్షన్ కోసం మనం Python లైబ్రరీ [RAKE](https://github.com/aneesha/RAKE) ఉపయోగించబోతున్నాము. మొదట, ఈ లైబ్రరీ అందుబాటులో లేకపోతే ఇన్‌స్టాల్ చేసుకుందాం:\n"
"మనం కీవర్డ్ ఎక్స్‌ట్రాక్షన్ కోసం Python లైబ్రరీ అయిన [RAKE](https://github.com/aneesha/RAKE) ఉపయోగించబోతున్నా. మొదట, ఈ లైబ్రరీ లేకపోతే ఇన్‌స్టాల్ చేద్దాం:\n"
],
"metadata": {}
},
@ -162,7 +160,7 @@
{
"cell_type": "markdown",
"source": [
"ప్రధాన ఫంక్షనాలిటీ `Rake` ఆబ్జెక్ట్ నుండి అందుబాటులో ఉంటుంది, దీన్ని కొన్ని పారామితుల ద్వారా అనుకూలీకరించవచ్చు. మన సందర్భంలో, కీవర్డ్ కనీస పొడవును 5 అక్షరాలు, డాక్యుమెంట్‌లో కీవర్డ్ కనీస సాంద్రతను 3, మరియు కీవర్డ్‌లో గరిష్ట పదాల సంఖ్యను 2 గా సెట్ చేస్తాము. ఇతర విలువలతో ఆడుకుంటూ ఫలితాన్ని పరిశీలించండి.\n"
"ప్రధాన కార్యాచరణ `Rake` ఆబ్జెక్ట్ నుండి అందుబాటులో ఉంది, దీన్ని మేము కొన్ని పారామితులతో అనుకూలీకరించవచ్చు. మా సందర్భంలో, ఒక కీవర్డ్ కనీస పొడవును 5 అక్షరాలు, డాక్యుమెంట్‌లో ఒక కీవర్డ్ కనీస సాంద్రతను 3, మరియు ఒక కీవర్డ్‌లో గరిష్టపదాల సంఖ్యను 2 గా సెట్ చేస్తాము. ఇతర విలువలతో ఆడుకుంటూ ఫలితాన్ని గమనించడంలో సంకోచించకండి.\n"
],
"metadata": {}
},
@ -211,11 +209,12 @@
{
"cell_type": "markdown",
"source": [
"మేము సంబంధిత ప్రాధాన్యత డిగ్రీతో కూడిన పదాల జాబితాను పొందాము. మీరు చూడగలిగినట్లుగా, మెషీన్ లెర్నింగ్ మరియు బిగ్ డేటా వంటి అత్యంత సంబంధిత శాస్త్రాలు జాబితాలో టాప్ స్థానాల్లో ఉన్నాయి.\n",
"\n",
"## Step 4: ఫలితాన్ని దృశ్యరూపంలో చూపించడం\n",
"మేము సంబంధిత ప్రాధాన్యత స్థాయితో కూడిన పదాల జాబితాను పొందాము. మీరు చూస్తున్నట్లుగా, మెషీన్ లెర్నింగ్ మరియు బిగ్ డేటా వంటి అత్యంత సంబంధిత విభాగాలు జాబితాలో టాప్ స్థానాల్లో ఉన్నాయి.\n",
"\n",
"మనం డేటాను దృశ్య రూపంలోనే బాగా అర్థం చేసుకోవచ్చు. కాబట్టి కొన్ని అవగాహనలను పొందడానికి డేటాను దృశ్యరూపంలో చూపించడం చాలా ఉపయోగకరం. కీవర్డ్ల యొక్క సంబంధితతతో సహా సరళమైన పంపిణీని ప్లాట్ చేయడానికి Python లో `matplotlib` లైబ్రరీని ఉపయోగించవచ్చు:\n"
"## Step 4: ఫలితాన్ని visual చేయడం\n",
"\n",
"ప్రజలు డేటాను ఉత్తమంగా దృశ్య రూపంలో అర్థం చేసుకుంటారు. కాబట్టి కొంత అవగాహనకు డేటాను visual చేయడం ఎక్కువగా సమంజసంగా ఉంటుంది. కీవర్డ్లను సంబంధితతతో సాదారణ పంపిణీగా ప్లాట్ చేయడానికి మనం Python లో `matplotlib` లైబ్రరీ ఉపయోగించవచ్చు:\n"
],
"metadata": {}
},
@ -252,7 +251,7 @@
{
"cell_type": "markdown",
"source": [
"కానీ, పదాల సాంద్రతలను చూపించడానికి మరింత మంచి విధానం ఉంది - **వర్డ్ క్లౌడ్** ఉపయోగించడం. మన కీవర్డ్ జాబితా నుండి వర్డ్ క్లౌడ్ చిత్రీకరించడానికి మరో లైబ్రరీని ఇన్‌స్టాల్ చేయాల్సి ఉంటుంది.\n"
"కాని, పదపు తరచుదలలను దర్శించడానికి ఇంకా మంచిది ఒక విధానం ఉంది - **పద మేఘం** ఉపయోగించడం. మనం కీవర్డ్ జాబితా నుండి పద మేఘాన్ని చిత్రీకరించడానికి మరో లైబ్రరీని ఇన్‌స్టాల్ చేయాల్సి ఉంటుంది.\n"
],
"metadata": {}
},
@ -268,7 +267,7 @@
{
"cell_type": "markdown",
"source": [
"`WordCloud` ఆబ్జెక్ట్ అసలు టెక్స్ట్ లేదా వారి ఫ్రీక్వెన్సీలతో ముందుగా లెక్కించబడిన పదాల జాబితాను తీసుకుని, ఒక చిత్రం తిరిగి ఇస్తుంది, దీన్ని తరువాత `matplotlib` ఉపయోగించి ప్రదర్శించవచ్చు:\n"
"`WordCloud` ఆబ్జెక్ట్ అసలు టెక్ట్స్ లేదా పదాల వాటిల్లిన జాబితాను తీసుకుని, వాటి తరచుదలతో, ఒక చిత్రం అందిస్తుంది, ఆ చిత్రం తరువాత `matplotlib` ఉపయోగించి ప్రదర్శించవచ్చు:\n"
],
"metadata": {}
},
@ -312,7 +311,7 @@
{
"cell_type": "markdown",
"source": [
"మేము అసలు టెక్స్ట్‌ను కూడా `WordCloud` కు పంపవచ్చు - మనం సమాన ఫలితాన్ని పొందగలమో చూద్దాం:\n"
"మనం మూలపాఠ్యాన్ని కూడా `WordCloud` కు అందించవచ్చు - మనం సమాన ఫలితాన్ని పొందగలమేమో చూద్దాం:\n"
],
"metadata": {}
},
@ -372,11 +371,11 @@
{
"cell_type": "markdown",
"source": [
"మీరు ఇప్పుడు వర్డ్ క్లౌడ్ మరింత ఆకర్షణీయంగా కనిపిస్తున్నదని చూడవచ్చు, కానీ ఇందులో చాలా శబ్దం కూడా ఉంది (ఉదా: `Retrieved on` వంటి సంబంధం లేని పదాలు). అలాగే, రెండు పదాల కలయికలైన కీవర్డ్స్, ఉదా: *data scientist*, లేదా *computer science* వంటి పదాలు తక్కువగా వస్తున్నాయి. ఇది RAKE అల్గోరిథం టెక్స్ట్ నుండి మంచి కీవర్డ్స్ ఎంచుకోవడంలో చాలా మెరుగ్గా పనిచేస్తుంది కాబట్టి. ఈ ఉదాహరణ డేటా ప్రీ-ప్రాసెసింగ్ మరియు శుభ్రపరిచే ప్రక్రియ యొక్క ప్రాముఖ్యతను చూపిస్తుంది, ఎందుకంటే చివరికి స్పష్టమైన చిత్రం మనకు మెరుగైన నిర్ణయాలు తీసుకోవడానికి సహాయపడుతుంది.\n",
"మీరు ఇప్పుడు word cloud మరింత ఆకర్షణీయంగా కనిపిస్తున్నదని చూడవచ్చు, కానీ ఇందులో చాలా శబ్దం కూడా ఉంది (ఉదాహరణకు, `Retrieved on` వంటి సంబంధం లేని పదాలు). అలాగే, రెండు పదాలతో కూడిన కొన్ని కీలక పదాలు, ఉదాహరణకు *data scientist* లేదా *computer science* వంటి పదాలు తక్కువగా వస్తున్నాయి. ఇది ఎందుకంటే RAKE అల్గోరిథం టెక్స్ట్ నుండి మంచి కీలక పదాలను ఎంపిక చేసుకోవడంలో మెరుగైన పని చేస్తుంది. ఈ ఉదాహరణ డేటా ప్రీ-ప్రాసెసింగ్ మరియు శుభ్రపరిచే ప్రక్రియ ఎంత ముఖ్యమో వివరిస్తుంది, ఎందుకంటే చివరలో స్పష్టమైన చిత్రం మాకు మెరుగైన నిర్ణయాలు తీసుకోవడానికి సహాయపడుతుంది.\n",
"\n",
"ఈ వ్యాయామంలో మనం వికీపీడియా టెక్స్ట్ నుండి కీవర్డ్స్ మరియు వర్డ్ క్లౌడ్ రూపంలో కొంత అర్థం తీసుకోవడం అనే సులభమైన ప్రక్రియను అనుసరించాము. ఈ ఉదాహరణ చాలా సులభమైనది, కానీ డేటా సైంటిస్ట్ డేటాతో పని చేసే సమయంలో తీసుకునే అన్ని సాధారణ దశలను బాగా చూపిస్తుంది, డేటా సేకరణ నుండి ప్రారంభించి విజువలైజేషన్ వరకు.\n",
"ఈ వ్యాయామంలో మనం Wikipedia టెక్స్ట్ నుండి కొన్ని అర్థాలను, కీలక పదాలు మరియు word cloud రూపంలో తీయటానికి సాదారణ ప్రక్రియను చూసాము. ఈ ఉదాహరణ చాలా సాధారణమైనది, కానీ ఇది డేటా సైన్టిస్ట్ ఒకటి, డేటాతో పనిచేసేటప్పుడు సాధారణంగా తీసుకునే అన్ని దశలను, డేటా పొందడం నుండి విజువలైజేషన్ వరకు, బాగా చూపిస్తుంది.\n",
"\n",
"మన కోర్సులో మనం ఆ దశలన్నింటినీ వివరంగా చర్చించబోతున్నాము.\n"
"మన కోర్సులో వాటి అన్ని దశలను వివరంగా చర్చిస్తాము.\n"
],
"metadata": {}
},
@ -394,7 +393,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**అస్పష్టత**: \nఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వలన కలిగే ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**అస్పష్టత**:\nఈ పత్రం AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి యత్నిస్తున్నప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో లోపాలు లేదా అపరిశుద్ధతలు ఉండొచ్చు. మౌలిక పత్రాన్ని దాని స్థానిక భాషలోనే అధికారిక మూలంగా భావించాలి. కీలక సమాచారం కోసం, ప్రొఫెషనల్ మానవ అనువాదాన్ని సూచించబడుతుంది. ఈ అనువాదం వలన కలిగే ఏవిధమైన అవగాహన లోపాలు లేదా తప్పు అర్థం చేసుకోలేకపోవడంపై మేము బాధ్యులము కావునం.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
@ -418,12 +417,6 @@
},
"interpreter": {
"hash": "c28e7b6bf4e5b397b8288a85bf0a94ea8d3585ce2b01919feb195678ec71581b"
},
"coopTranslator": {
"original_hash": "50c0f0a5204a18405611cbe7e0fec56b",
"translation_date": "2025-12-19T17:00:38+00:00",
"source_file": "1-Introduction/01-defining-data-science/notebook.ipynb",
"language_code": "te"
}
},
"nbformat": 4,

@ -3,15 +3,15 @@
{
"cell_type": "markdown",
"source": [
"# సవాలు: డేటా సైన్స్ గురించి టెక్స్ట్ విశ్లేషణ\n",
"# సవాలు: డేటా సైన్సు గురించి పాఠ్యాన్ని విశ్లేషించడం\n",
"\n",
"> *ఈ నోట్‌బుక్‌లో, మేము వేరే URL - మెషీన్ లెర్నింగ్ పై వికీపీడియా వ్యాసం ఉపయోగించి ప్రయోగం చేస్తున్నాము. డేటా సైన్స్‌తో పోలిస్తే, ఈ వ్యాసంలో చాలా పదాలు ఉన్నాయి, ఇది విశ్లేషణను మరింత సమస్యాత్మకంగా చేస్తుంది. కీవర్డ్ ఎక్స్‌ట్రాక్షన్ చేసిన తర్వాత, కొంత సార్వత్రికమైన కానీ అర్థవంతమైన కాని పద సంయోజనాలను తొలగించడానికి డేటాను శుభ్రం చేసే మరో మార్గాన్ని కనుగొనాలి.*\n",
"> *ఈ నోట్‌బుక్‌లో, మేము వేరే URL - మిషీన్ లెర్నింగ్‌పై వికీపీడియా ఆర్టికల్‌ను ఉపయోగిస్తూ ప్రయోగం చేస్తున్నాము. డేటా సైన్సుతో పోలిస్తే, ఈ ఆర్టికల్‌లో చాలావరకు పదాలు ఉన్నాయి, ఇది విశ్లేషణను మరింత క్లిష్టతరం చేస్తోంది. కీలక పదాలు తీసుకున్న తర్వాత, కొంతసేపు తరుచుగా ఉండే, కానీ అర్థవంతంగా olmayan పద సమూహాలను తీసివేయడానికి మేము మరొక విధానాన్ని కనుగొనాలి.*\n",
"\n",
"ఈ ఉదాహరణలో, సంప్రదాయ డేటా సైన్స్ ప్రక్రియలోని అన్ని దశలను కవర్ చేసే ఒక సులభమైన వ్యాయామం చేద్దాం. మీరు ఏ కోడ్ రాయాల్సిన అవసరం లేదు, కేవలం క్రింద ఉన్న సెల్స్‌పై క్లిక్ చేసి వాటిని అమలు చేసి ఫలితాన్ని గమనించవచ్చు. ఒక సవాలుగా, మీరు ఈ కోడ్‌ను వేరే డేటాతో ప్రయత్నించమని ప్రోత్సహించబడుతున్నారు.\n",
"ఈ ఉదాహరణలో, సంప్రదాయ డేటా సైన్స్ ప్రాసెస్ యొక్క అన్ని దశలను కవర్ చేసే సరళమైన వ్యాయామం చేద్దాం. మీరు ఏ కోడ్‌ను వ్రాయాల్సిన అవసరం లేదు, క్రింద సెల్‌పై క్లిక్ చేసి వాటిని అమలు చేసి ఫలితాన్ని గమనించవచ్చు. ఒక సవాలుగా, మీరు ఈ కోడ్‌ను వేరే డేటాతో ప్రయత్నించడానికి ప్రోత్సహించబడుతున్నారు.\n",
"\n",
"## లక్ష్యం\n",
"\n",
"ఈ పాఠంలో, మేము డేటా సైన్స్‌కు సంబంధించిన వివిధ భావనలను చర్చిస్తున్నాము. కొంత **టెక్స్ట్ మైనింగ్** చేయడం ద్వారా మరిన్ని సంబంధిత భావనలను కనుగొనడానికి ప్రయత్నిద్దాం. మేము డేటా సైన్స్ గురించి ఒక టెక్స్ట్‌తో ప్రారంభించి, దానిలోని కీవర్డ్స్‌ను తీసుకుని, ఆ తర్వాత ఫలితాన్ని విజువలైజ్ చేయడానికి ప్రయత్నిస్తాము.\n",
"ఈ పాఠంలో, మేము డేటా సైన్స్‌తో సంబంధిత వివిధ భావాలను చర్చించాము. **టెక్స్ట్ మైనింగ్** ద్వారా మరిన్ని సంబంధిత భావాలను కనుగొనేందుకు ప్రయత్నిద్దాం. మేము డేటా సైన్స్ గురించి పాఠ్యాన్ని తీసుకుని, దానిలోని కీలకపదాలను వెలికి తీసుకొని, తరువాత ఫలితాన్ని విజువలైజ్ చేయడానికి ప్రయత్నిస్తాము.\n",
"\n",
"టెక్స్ట్‌గా, నేను వికీపీడియా నుండి డేటా సైన్స్ పేజీని ఉపయోగిస్తాను:\n"
],
@ -35,9 +35,9 @@
{
"cell_type": "markdown",
"source": [
"## Step 1: డేటాను పొందడం\n",
"## Step 1: డేటా సేకరణ\n",
"\n",
"ప్రతి డేటా సైన్స్ ప్రక్రియలో మొదటి దశ డేటాను పొందడం. దీని కోసం మనం `requests` లైబ్రరీని ఉపయోగిస్తాము:\n"
"ప్రతి డేటా సైన్స్ ప్రక్రియలో మొదటి దశ డేటాను సేకరించడం. దీని కోసం మేము `requests` లైబ్రరీని ఉపయోగిస్తాము:\n"
],
"metadata": {}
},
@ -69,45 +69,43 @@
{
"cell_type": "markdown",
"source": [
"## Step 2: డేటాను మార్చడం\n",
"## Step 2: డేటాను మార్పిడి ేయడం\n",
"\n",
"తదుపరి దశ డేటాను ప్రాసెసింగ్‌కు అనుకూలమైన రూపంలోకి మార్చడం. మన సందర్భంలో, మేము పేజీ నుండి HTML మూల కోడ్‌ను డౌన్లోడ్ చేసుకున్నాము, మరియు దాన్ని సాదా పాఠ్యంగా మార్చాలి.\n",
"తదుపరి దశ డేటాను ప్రక్రియకు అనువైన రూపంలోకి మార్చడం. మా సందర్భంలో, మేము పేజీ నుండి HTML సోర్స్ కోడ్‌ను డౌన్‌లోడ్ చేసుకున్నాము, మరియు దాన్ని సాదా పాఠ్యంగా మార్చాలి.\n",
"\n",
"ఇది చేయడానికి అనేక మార్గాలు ఉన్నాయి. మేము Python నుండి సులభమైన బిల్ట్-ఇన్ [HTMLParser](https://docs.python.org/3/library/html.parser.html) ఆబ్జెక్ట్‌ను ఉపయోగిస్తాము. మేము `HTMLParser` క్లాస్‌ను సబ్‌క్లాస్ చేయాలి మరియు `<script>` మరియు `<style>` ట్యాగ్‌లను తప్పించి HTML ట్యాగ్‌లలోని అన్ని పాఠ్యాన్ని సేకరించే కోడ్‌ను నిర్వచించాలి.\n"
" దీనిని చేయడానికి అనేక మార్గాలు ఉన్నాయి. మేము [BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/), HTML పార్స్ చేసేందుకు ఒక ప్రముఖ Python లైబ్రరీని ఉపయోగిస్తాము. BeautifulSoup మాకు నిర్దిష్ట HTML అంశాలను లక్ష్యంగా పెట్టగలుగుతుంది, కాబట్టి మేము వికీపీడియా నుండి ప్రధాన వ్యాస కంటెంట్‌పై దృష్టి పెట్టవచ్చు మరియు కొన్ని నావిగేషన్ మెనూలు, సైడ్బార్లు, ఫుటర్లు మరియు ఇతర అనవసర కంటెంట్‌ను తగ్గించవచ్చును (ఏదైనా బోైలర్‌ప్లేట్ పాఠ్యం ఇంకా ఉండవచ్చు).\n"
],
"metadata": {}
},
{
"cell_type": "markdown",
"source": [
"ముందుగా, HTML పార్సింగ్ కోసం BeautifulSoup లైబ్రరీని ఇన్‌స్టాల్ చేయాలి:\n"
],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": null,
"source": [
"import sys\r\n",
"!{sys.executable} -m pip install beautifulsoup4"
],
"outputs": [],
"metadata": {}
},
{
"cell_type": "code",
"execution_count": 4,
"source": [
"from html.parser import HTMLParser\r\n",
"\r\n",
"class MyHTMLParser(HTMLParser):\r\n",
" script = False\r\n",
" res = \"\"\r\n",
" def handle_starttag(self, tag, attrs):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = True\r\n",
" def handle_endtag(self, tag):\r\n",
" if tag.lower() in [\"script\",\"style\"]:\r\n",
" self.script = False\r\n",
" def handle_data(self, data):\r\n",
" if str.strip(data)==\"\" or self.script:\r\n",
" return\r\n",
" self.res += ' '+data.replace('[ edit ]','')\r\n",
"\r\n",
"parser = MyHTMLParser()\r\n",
"parser.feed(text)\r\n",
"text = parser.res\r\n",
"print(text[:1000])"
"from bs4 import BeautifulSoup\r\n\r\n# Parse the HTML content\r\nsoup = BeautifulSoup(text, 'html.parser')\r\n\r\n# Extract only the main article content from Wikipedia\r\n# Wikipedia uses 'mw-parser-output' class for the main article content\r\ncontent = soup.find('div', class_='mw-parser-output')\r\n\r\ndef clean_wikipedia_content(content_node):\r\n \"\"\"Remove common non-article elements from a Wikipedia content node.\"\"\"\r\n # Strip jump links, navboxes, reference lists/superscripts, edit sections, TOC, sidebars, etc.\r\n selectors = [\r\n '.mw-jump-link',\r\n '.navbox',\r\n '.reflist',\r\n 'sup.reference',\r\n '.mw-editsection',\r\n '.hatnote',\r\n '.metadata',\r\n '.infobox',\r\n '#toc',\r\n '.toc',\r\n '.sidebar',\r\n ]\r\n for selector in selectors:\r\n for el in content_node.select(selector):\r\n el.decompose()\r\n\r\nif content:\r\n # Clean the content node to better approximate article text only.\r\n clean_wikipedia_content(content)\r\n text = content.get_text(separator=' ', strip=True)\r\n print(text[:1000])\r\nelse:\r\n print(\"Could not find main content. Using full page text.\")\r\n text = soup.get_text(separator=' ', strip=True)\r\n print(text[:1000])"
],
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
" Machine learning - Wikipedia Machine learning From Wikipedia, the free encyclopedia Jump to navigation Jump to search Study of algorithms that improve automatically through experience For the journal, see Machine Learning (journal) . \"Statistical learning\" redirects here. For statistical learning in linguistics, see statistical learning in language acquisition . Part of a series on Artificial intelligence Major goals Artificial general intelligence Planning Computer vision General game playing Knowledge reasoning Machine learning Natural language processing Robotics Approaches Symbolic Deep learning Bayesian networks Evolutionary algorithms Philosophy Ethics Existential risk Turing test Chinese room Control problem Friendly AI History Timeline Progress AI winter Technology Applications Projects Programming languages Glossary Glossary v t e Part of a series on Machine learning and data mining Problems Classification Clustering Regression Anomaly detection Data Cleaning AutoML Associ\n"
"Machine learning From Wikipedia, the free encyclopedia Study of algorithms that improve automatically through experience Machine learning (ML) is a field of study in artificial intelligence concerned with the development and study of statistical algorithms that can learn from data and generalize to unseen data, and thus perform tasks without explicit instructions. Recently, artificial neural networks have been able to surpass many previous approaches in performance. ML finds application in many fields, including natural language processing, computer vision, speech recognition, email filtering, agriculture, and medicine.\n"
]
}
],
@ -116,11 +114,11 @@
{
"cell_type": "markdown",
"source": [
"## Step 3: అవగాహన పొందడం\n",
"## Step 3: అవగాహనలు పొందడం\n",
"\n",
"ముఖ్యమైన దశ మా డేటాను మనం అవగాహన పొందగలిగే రూపంలోకి మార్చడం. మన సందర్భంలో, మనం టెక్స్ట్ నుండి కీలకపదాలను తీసుకోవాలనుకుంటున్నాము, మరియు ఏ కీలకపదాలు ఎక్కువ అర్థవంతమైనవో చూడాలి.\n",
"మాతీయమైన దశ మా డేటాను ఇలాంటి రూపంలోకి మార్చడం, దానితో మనం అవగాహనలు తీసుకోగలిగేలా చేయడం. మన పరిస్థితిలో, టెక్స్ట్ నుండి కీలకపదాలు తీసుకోవాలని, మరియు ఏ కీలకపదాలు మరింత అర్థవంతంగా ఉన్నాయో చూడాలని ఉన్నది.\n",
"\n",
"కీలకపదాల తీసుకోవడానికి మనం [RAKE](https://github.com/aneesha/RAKE) అనే Python లైబ్రరీని ఉపయోగించబోతున్నాము. మొదట, ఈ లైబ్రరీ అందుబాటులో లేకపోతే ఇన్‌స్టాల్ చేసుకుందాం:\n"
"కీలకపదాల తీసుకోవడానికి Python లైబ్రరీ అయిన [RAKE](https://github.com/aneesha/RAKE) ఉపయోగిస్తాము. మొదట, ఈ లైబ్రరీ అందుబాటులో ఉన్న లేకపోవడమైతే, దీనిని ఇన్స్టాల్ చేద్దాం:\n"
],
"metadata": {}
},
@ -172,7 +170,7 @@
{
"cell_type": "markdown",
"source": [
"ప్రధాన ఫంక్షనాలిటీ `Rake` ఆబ్జెక్ట్ నుండి అందుబాటులో ఉంటుంది, దీన్ని కొన్ని పారామితుల ద్వారా అనుకూలీకరించవచ్చు. మన సందర్భంలో, కీవర్డ్ కనీస పొడవును 5 అక్షరాలు, డాక్యుమెంట్‌లో కీవర్డ్ కనీస సాంద్రతను 3, మరియు కీవర్డ్‌లో గరిష్ట పదాల సంఖ్యను 2 గా సెట్ చేస్తాము. ఇతర విలువలతో ఆడుకుంటూ ఫలితాన్ని పరిశీలించండి.\n"
"ప్రధాన కార్యాచరణ `Rake` ఆబ్జెక్ట్ నుండి అందుబాటులో ఉంటుంది, దీన్ని కొన్ని పరామితులు ఉపయోగించి మేము కస్టమైజ్ చేయవచ్చు. మా సందర్భంలో, కీవర్డ్ కనీస పొడవును 5 అక్షరాలుగా, డాక్యుమెంట్‌లో కీవర్డ్ కనీస తరచుదనాన్ని 3 గా, మరియు కీవర్డ్‌లో గరిష్ట పదాల సంఖ్యను 2గా సెట్ చేస్తాము. ఇతర విలువలతో ఆడుకోవడానికి స్వేచ్ఛగా ఉండండి మరియు ఫలితాన్ని గమనించండి.\n"
],
"metadata": {}
},
@ -354,11 +352,11 @@
"cell_type": "markdown",
"source": [
"\n",
"మేము సంబంధి ప్రాధాన్యత డిగ్రీతో కూడిన పదాల జాబితాను పొందాము. మీరు చూడగలిగినట్లుగా, మెషీన్ లెర్నింగ్ మరియు బిగ్ డేటా వంటి అత్యంత సంబంధిత శాస్త్రాలు జాబితాలో టాప్ స్థానాల్లో ఉన్నాయి.\n",
"మేము సంబంధించిన ప్రాధాన్యత డిగ్రీతో కూడిన పదాల జాబితాను పొందాము. మీరు చూడగలిగింది ప్రకారం, అత్యంత సంబంధంవంతమైన శాస్త్రాలు, ఉదాహరణకు యంత్ర అభ్యాసం మరియు పెద్ద డేటా, జాబితాలో పై స్థానాలలో ఉన్నాయి.\n",
"\n",
"## Step 4: ఫలితాన్ని దృశ్యీకరించడం\n",
"## 4వ దశ: ఫలితాన్ని దృశ్యీకరించడం\n",
"\n",
"మనం డేటాను దృశ్య రూపంలో ఉత్తమంగా అర్థం చేసుకోవచ్చు. కాబట్టి కొన్ని అవగాహనలను పొందడానికి డేటాను దృశ్యీకరించడం తరచుగా అర్థవంతంగా ఉంటుంది. కీవర్డ్లను వారి సంబంధితతతో సరళమైన పంపిణీని ప్లాట్ చేయడానికి Python లో `matplotlib` లైబ్రరీని ఉపయోగించవచ్చు:\n"
"మనం డేటాను దృశ్య రూపంలోనే మెరుగ్గా అర్థం చేసుకోవచ్చు. అందుచేత, కొన్ని అవగాహనలను పొందడానికి డేటాను దృశ్యీకరించడం చాలా ఉపయోగకరంగా ఉంటుంది. కీవర్డ్లను వారి సంబంధంతో సాదా పంపిణీగా పైన అలంకరించడానికి Python లో `matplotlib` లైబ్రరీని ఉపయోగించవచ్చు:\n"
],
"metadata": {}
},
@ -393,7 +391,7 @@
{
"cell_type": "markdown",
"source": [
"అయితే, పదాల సాంద్రతలను చూపించడానికి మరింత మంచి విధానం ఉంది - **వర్డ్ క్లౌడ్** ఉపయోగించడం. మన కీవర్డ్ జాబితా నుండి వర్డ్ క్లౌడ్ చిత్రీకరించడానికి మరో లైబ్రరీని ఇన్‌స్టాల్ చేయాల్సి ఉంటుంది.\n"
"కానీ, పదాల భాగస్వామ్యం చూపించడానికి మరొక మరింత మంచి విధానం ఉంది - **వర్డ్ క్లౌడ్** ఉపయోగించడం. మన కీవర్డ్ గ ది నుండి వర్డ్ క్లౌడ్ ప్లాట్ చేయడానికి మరొక లైబ్రరీని ఇన్స్టాల్ చేయాల్సి ఉంటుంది.\n"
],
"metadata": {}
},
@ -409,7 +407,7 @@
{
"cell_type": "markdown",
"source": [
"`WordCloud` ఆబ్జెక్ట్ అసలు టెక్స్ట్ లేదా వారి ఫ్రీక్వెన్సీలతో ముందుగా లెక్కించబడిన పదాల జాబితాను తీసుకుని, ఒక చిత్రం తిరిగి ఇస్తుంది, దీన్ని తరువాత `matplotlib` ఉపయోగించి ప్రదర్శించవచ్చు:\n"
"`WordCloud` ఆబ్జెక్ట్ ప్రాథమికంగా అసలు టెక్స్ట్‌ను తీసుకోవడం లేదా ముందు నుండే గణించిన పదాలు మరియు వాటి సామాన్యతలు ఉన్న జాబితాను తీసుకుని, ఒక చిత్రం (ఇమేజ్) ను ఇస్తుంది, దీనిని తరువాత `matplotlib` ఉపయోగించి ప్రదర్శించవచ్చు:\n"
],
"metadata": {}
},
@ -442,7 +440,7 @@
{
"cell_type": "markdown",
"source": [
"మేము అసలు టెక్స్ట్‌ను కూడా `WordCloud` కు పంపవచ్చు - మనం సమాన ఫలితాన్ని పొందగలమో చూద్దాం:\n"
"మేము అసలు వచనాన్ని కూడా `WordCloud` కు పంపవచ్చు - మనం సమాన ఫలితం పొందగలమో చూద్దాం:\n"
],
"metadata": {}
},
@ -491,11 +489,11 @@
{
"cell_type": "markdown",
"source": [
"మీరు ఇప్పుడు వర్డ్ క్లౌడ్ మరింత ఆకర్షణీయంగా కనిపిస్తున్నదని చూడవచ్చు, కానీ ఇందులో చాలా శబ్దం కూడా ఉంది (ఉదా: `Retrieved on` వంటి సంబంధం లేని పదాలు). అలాగే, రెండు పదాల కలయికలైన కీవర్డ్స్, ఉదా: *data scientist*, లేదా *computer science* వంటి పదాలు తక్కువగా వస్తున్నాయి. ఇది RAKE అల్గోరిథం టెక్స్ట్ నుండి మంచి కీవర్డ్స్ ఎంచుకోవడంలో చాలా మెరుగ్గా పనిచేస్తుంది కాబట్టి. ఈ ఉదాహరణ డేటా ప్రీ-ప్రాసెసింగ్ మరియు శుభ్రపరిచే ప్రక్రియ యొక్క ప్రాముఖ్యతను చూపిస్తుంది, ఎందుకంటే చివరికి స్పష్టమైన చిత్రం మనకు మెరుగైన నిర్ణయాలు తీసుకోవడానికి సహాయపడుతుంది.\n",
"మీరు ఇప్పుడు వర్డ్ క్లౌడ్ మరింత ఆకట్టుకునేటట్టు కనిపిస్తుందని చూడొచ్చు, కానీ ఇందులో చాలా శబ్దం కూడా ఉంటుంది (ఉదా: `Retrieved on` వంటి సంబంధం లేని పదాలు). అలాగే, రెండు పదాలతో కూడిన కీలకపదాలు మాకు తక్కువగా వస్తాయి, ఉదాహరణకు *data scientist* లేదా *computer science*. ఇది RAKE ఆల్గోరిదం వచనం నుండి మంచి కీలకపదాలను ఎంచుకోవడంలో మెరుగైన పని చేస్తుంది కాబట్టి జరుగుతుంది. ఈ ఉదాహరణ డేటా ప్రీ-ప్రాసెసింగ్ మరియు శుభ్రపరిచే ప్రాముఖ్యతను చూపుతుంది, ఎందుకంటే చివర్లో స్పష్టమైన చిత్రం మనకు మంచి నిర్ణయాలకు అవకాశం ఇస్తుంది.\n",
"\n",
"ఈ వ్యాయామంలో మనం వికీపీడియా టెక్స్ట్ నుండి కీవర్డ్స్ మరియు వర్డ్ క్లౌడ్ రూపంలో కొంత అర్థం తీసుకోవడం అనే సులభమైన ప్రక్రియను అనుసరించాము. ఈ ఉదాహరణ చాలా సులభమైనది, కానీ డేటా సైంటిస్ట్ డేటాతో పని చేసే సమయంలో తీసుకునే అన్ని సాధారణ దశలను బాగా చూపిస్తుంది, డేటా సేకరణ నుండి ప్రారంభించి విజువలైజేషన్ వరకు.\n",
"ఈ వ్యాయామంలో మేము వికీపైడియా టెక్స్ట్ నుండి కొన్ని అర్థాన్ని తీసుకురావడంలో ఒక సులభమైన ప్రక్రియను చూశాము, ఇది కీలకపదాలు మరియు వర్డ్ క్లౌడ్ రూపంలో ఉంది. ఈ ఉదాహరణ చాలా సింపుల్ అయినప్పటికీ, డేటా శాస్త్రవేత్త డేటాతో పని చేసే సమయంలో ప్రారంభ నివేదిక నుండి విజువలైజేషన్ వరకు తీసుకునే అన్ని సాధారణ దశలను బాగా చూపిస్తుంది.\n",
"\n",
"మన కోర్సులో మనం ఆ దశలన్నింటినీ వివరంగా చర్చించబోతున్నాము.\n"
"మన కోర్సులో మేము ఆ దశలన్నిటినీ వివరంగా చర్చిస్తాము.\n"
],
"metadata": {}
},
@ -503,7 +501,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**అస్పష్టత**: \nఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**వ్యాఖ్యానం**:\nఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వ కోసం ప్రయత్నిస్తున్నప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో తప్పులు లేదా అపరిశుద్ధతలు ఉండవచ్చు. స్థానిక భాషలో ఉన్న మౌలిక పత్రాన్ని ప్రాధాన్యమైన మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారం కోసం, నిపుణుల చేత అనువాదం తీసుకోవడం మంచిది. ఈ అనువాదం వలన కలిగే ఏవైనా తప్పుడు అర్థం లేదా అవగాహనల పరంగా మేము బాధ్యత వహించము.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
]
}
],
@ -527,12 +525,6 @@
},
"interpreter": {
"hash": "86193a1ab0ba47eac1c69c1756090baa3b420b3eea7d4aafab8b85f8b312f0c5"
},
"coopTranslator": {
"original_hash": "dbdf34788efab64e5d817f1df38965a8",
"translation_date": "2025-12-19T17:06:52+00:00",
"source_file": "1-Introduction/01-defining-data-science/solution/notebook.ipynb",
"language_code": "te"
}
},
"nbformat": 4,

@ -6,7 +6,7 @@
గణాంకాలు మరియు సంభావ్యత సిద్ధాంతం గణితశాస్త్రంలోని రెండు అత్యంత సంబంధిత విభాగాలు, ఇవి డేటా సైన్స్‌కు చాలా సంబంధం కలిగి ఉంటాయి. గణితంపై లోతైన జ్ఞానం లేకుండా కూడా డేటాతో పని చేయవచ్చు, కానీ కనీసం కొన్ని ప్రాథమిక భావనలను తెలుసుకోవడం మంచిది. ఇక్కడ మేము మీకు ప్రారంభం కావడానికి సహాయపడే సంక్షిప్త పరిచయాన్ని అందిస్తాము.
[![పరిచయ వీడియో](../../../../translated_images/te/video-prob-and-stats.e4282e5efa2f2543400843ed98b1057065c9600cebfc8a728e8931b5702b2ae4.png)](https://youtu.be/Z5Zy85g4Yjw)
[![పరిచయ వీడియో](../../../../translated_images/te/video-prob-and-stats.e4282e5efa2f2543.webp)](https://youtu.be/Z5Zy85g4Yjw)
## [పాఠం ముందు క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/6)
@ -31,7 +31,7 @@
మేము ఒక విలువ ఇచ్చిన పరిధిలో పడే సంభావ్యత గురించి మాత్రమే మాట్లాడవచ్చు, ఉదా. P(t<sub>1</sub>&le;X&lt;t<sub>2</sub>). ఈ సందర్భంలో, సంభావ్యత పంపిణీని **సంభావ్యత సాంద్రత ఫంక్షన్** p(x) ద్వారా వివరించవచ్చు, అలా
![P(t_1\le X<t_2)=\int_{t_1}^{t_2}p(x)dx](../../../../translated_images/te/probability-density.a8aad29f17a14afb519b407c7b6edeb9f3f9aa5f69c9e6d9445f604e5f8a2bf7.png)
![P(t_1\le X<t_2)=\int_{t_1}^{t_2}p(x)dx](../../../../translated_images/te/probability-density.a8aad29f17a14afb.webp)
సమాన పంపిణీకి అనురూపమైన అనంతర పంపిణీని **అనంతర సమాన పంపిణీ** అంటారు, ఇది ఒక పరిమిత పరిధిలో నిర్వచించబడుతుంది. విలువ X ఒక l పొడవు ఉన్న పరిధిలో పడే సంభావ్యత l కు అనుపాతంగా ఉంటుంది, మరియు 1 వరకు పెరుగుతుంది.
@ -56,7 +56,7 @@
గ్రాఫికల్‌గా మాధ్యమం మరియు క్వార్టైల్‌ల సంబంధాన్ని **బాక్స్ ప్లాట్** అనే చిత్రంలో చూపవచ్చు:
<img src="../../../../translated_images/te/boxplot_explanation.4039b7de08780fd493ef798b41f7291d753f1f84de8955645f00c586e65f16a3.png" alt="Box Plot Explanation" width="50%">
<img src="../../../../translated_images/te/boxplot_explanation.4039b7de08780fd4.webp" alt="Box Plot Explanation" width="50%">
ఇక్కడ మేము **ఇంటర్-క్వార్టైల్ పరిధి** IQR=Q3-Q1 ను లెక్కిస్తాము, మరియు **అత్యధిక విలువలు** (outliers) - [Q1-1.5*IQR,Q3+1.5*IQR] పరిధికి వెలుపల ఉన్న విలువలు.
@ -73,11 +73,11 @@
ఇది మా డేటా కోసం సగటు, మాధ్యమం మరియు క్వార్టైల్‌లను చూపించే బాక్స్ ప్లాట్:
![బరువు బాక్స్ ప్లాట్](../../../../translated_images/te/weight-boxplot.1dbab1c03af26f8a008fff4e17680082c8ab147d6df646cbac440bbf8f5b9c42.png)
![బరువు బాక్స్ ప్లాట్](../../../../translated_images/te/weight-boxplot.1dbab1c03af26f8a.webp)
మా డేటాలో వేర్వేరు ఆటగాళ్ల **పాత్రలు** గురించి సమాచారం ఉన్నందున, పాత్రల వారీగా బాక్స్ ప్లాట్ కూడా చేయవచ్చు - ఇది పాత్రల మధ్య పరిమాణాల విలువలు ఎలా భిన్నమవుతాయో అర్థం చేసుకోవడానికి సహాయపడుతుంది. ఈసారి మేము ఎత్తును పరిగణిస్తాము:
![పాత్రల వారీగా బాక్స్ ప్లాట్](../../../../translated_images/te/boxplot_byrole.036b27a1c3f52d42f66fba2324ec5cde0a1bca6a01a619eeb0ce7cd054b2527b.png)
![పాత్రల వారీగా బాక్స్ ప్లాట్](../../../../translated_images/te/boxplot_byrole.036b27a1c3f52d42.webp)
ఈ చిత్రణ సూచిస్తుంది, సగటున మొదటి బేస్‌మెన్ ఎత్తు రెండవ బేస్‌మెన్ కంటే ఎక్కువ. ఈ పాఠంలో తర్వాత మేము ఈ హైపోథిసిస్‌ను మరింత అధికారికంగా పరీక్షించడం మరియు మా డేటా గణాంకపరంగా ప్రామాణికమని చూపడం నేర్చుకుంటాము.
@ -85,7 +85,7 @@
మా డేటా పంపిణీని చూడటానికి, మేము **హిస్టోగ్రామ్** అనే గ్రాఫ్‌ను చిత్రించవచ్చు. X-అక్షంలో వివిధ బరువు పరిధులు (అంటే **బిన్లు**) ఉంటాయి, మరియు నిలువు అక్షం ఆ పరిధిలో మా యాదృచ్ఛిక చరము నమూనా ఉన్న సార్లు చూపిస్తుంది.
![వాస్తవ ప్రపంచ డేటా హిస్టోగ్రామ్](../../../../translated_images/te/weight-histogram.bfd00caf7fc30b145b21e862dba7def41c75635d5280de25d840dd7f0b00545e.png)
![వాస్తవ ప్రపంచ డేటా హిస్టోగ్రామ్](../../../../translated_images/te/weight-histogram.bfd00caf7fc30b14.webp)
ఈ హిస్టోగ్రామ్ నుండి మీరు చూడవచ్చు అన్ని విలువలు ఒక నిర్దిష్ట సగటు బరువు చుట్టూ కేంద్రీకృతమై ఉన్నాయి, మరియు ఆ బరువునుండి దూరంగా పోతే ఆ బరువుల సంఖ్య తక్కువగా ఉంటుంది. అంటే, బేస్‌బాల్ ఆటగాడి బరువు సగటు బరువుతో చాలా భిన్నంగా ఉండటం చాలా అసంభావ్యం. బరువుల వ్యత్యాసం సగటు నుండి బరువులు ఎంత భిన్నంగా ఉండవచ్చో చూపిస్తుంది.
@ -101,7 +101,7 @@ samples = np.random.normal(mean,std,1000)
సృష్టించిన నమూనాల హిస్టోగ్రామ్‌ను చిత్రిస్తే, పై చూపిన చిత్రానికి చాలా సమీపంగా ఉంటుంది. నమూనాల సంఖ్య మరియు బిన్ల సంఖ్య పెంచితే, మేము సిద్దాంతానికి మరింత దగ్గరగా ఉన్న సాధారణ పంపిణీ చిత్రాన్ని సృష్టించవచ్చు:
![సగటు=0 మరియు ప్రమాణ విభిన్నత=1 ఉన్న సాధారణ పంపిణీ](../../../../translated_images/te/normal-histogram.dfae0d67c202137d552d0015fb87581eca263925e512404f3c12d8885315432e.png)
![సగటు=0 మరియు ప్రమాణ విభిన్నత=1 ఉన్న సాధారణ పంపిణీ](../../../../translated_images/te/normal-histogram.dfae0d67c202137d.webp)
*సగటు=0 మరియు ప్రమాణ విభిన్నత=1 ఉన్న సాధారణ పంపిణీ*
@ -220,7 +220,7 @@ array([[1. , 0.52959196],
మన సందర్భంలో, 0.53 విలువ వ్యక్తి బరువు మరియు ఎత్తు మధ్య కొంత సహసంబంధం ఉందని సూచిస్తుంది. మనం ఒక విలువను మరొకదానిపై స్కాటర్ ప్లాట్ కూడా చేయవచ్చు సంబంధాన్ని దృశ్యంగా చూడటానికి:
![బరువు మరియు ఎత్తు మధ్య సంబంధం](../../../../translated_images/te/weight-height-relationship.3f06bde4ca2aba9974182c4ef037ed602acd0fbbbbe2ca91cefd838a9e66bcf9.png)
![బరువు మరియు ఎత్తు మధ్య సంబంధం](../../../../translated_images/te/weight-height-relationship.3f06bde4ca2aba99.webp)
> సహసంబంధం మరియు కోవేరియన్స్ పై మరిన్ని ఉదాహరణలు [సహాయక నోట్బుక్](notebook.ipynb) లో చూడవచ్చు.

@ -1,6 +1,6 @@
# డేటా సైన్స్ పరిచయం
![data in action](../../../translated_images/te/data.48e22bb7617d8d92188afbc4c48effb920ba79f5cebdc0652cd9f34bbbd90c18.jpg)
![data in action](../../../translated_images/te/data.48e22bb7617d8d92.webp)
> ఫోటో <a href="https://unsplash.com/@dawson2406?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">స్టీఫెన్ డాసన్</a> ద్వారా <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">అన్స్ప్లాష్</a>లో
ఈ పాఠాలలో, మీరు డేటా సైన్స్ ఎలా నిర్వచించబడిందో తెలుసుకుంటారు మరియు డేటా శాస్త్రవేత్తలు పరిగణించవలసిన నైతిక అంశాలను తెలుసుకుంటారు. మీరు డేటా ఎలా నిర్వచించబడిందో తెలుసుకుంటారు మరియు డేటా సైన్స్ యొక్క ప్రాథమిక అకాడమిక్ విభాగాలు అయిన గణాంకాలు మరియు సంభావ్యత గురించి కొంత తెలుసుకుంటారు.

@ -12,7 +12,7 @@
స్ప్రెడ్షీట్స్ డేటాను నిల్వ చేయడానికి మరియు అన్వేషించడానికి ప్రాచుర్యం పొందిన మార్గం, ఎందుకంటే దీన్ని సెటప్ చేయడం మరియు ప్రారంభించడం తక్కువ పని అవసరం. ఈ పాఠంలో మీరు స్ప్రెడ్షీట్ యొక్క ప్రాథమిక భాగాలు, అలాగే ఫార్మూలాలు మరియు ఫంక్షన్లను నేర్చుకుంటారు. ఉదాహరణలు మైక్రోసాఫ్ట్ ఎక్సెల్‌తో చూపబడతాయి, కానీ చాలా భాగాలు మరియు విషయాలు ఇతర స్ప్రెడ్షీట్ సాఫ్ట్‌వేర్‌తో పోలిస్తే సమాన పేర్లు మరియు దశలను కలిగి ఉంటాయి.
![రెండు వర్క్‌షీట్లతో ఖాళీ మైక్రోసాఫ్ట్ ఎక్సెల్ వర్క్‌బుక్](../../../../translated_images/te/parts-of-spreadsheet.120711c82aa18a45c3e62a491a15bba0a31ab0e9db407ec022702fed8ffd89bf.png)
![రెండు వర్క్‌షీట్లతో ఖాళీ మైక్రోసాఫ్ట్ ఎక్సెల్ వర్క్‌బుక్](../../../../translated_images/te/parts-of-spreadsheet.120711c82aa18a45.webp)
స్ప్రెడ్షీట్ ఒక ఫైల్ మరియు కంప్యూటర్, పరికరం లేదా క్లౌడ్ ఆధారిత ఫైల్ సిస్టమ్‌లో అందుబాటులో ఉంటుంది. సాఫ్ట్‌వేర్ బ్రౌజర్ ఆధారితంగా ఉండవచ్చు లేదా కంప్యూటర్‌లో ఇన్‌స్టాల్ చేయాల్సిన అనువర్తనం లేదా యాప్‌గా డౌన్లోడ్ చేయవలసినది కావచ్చు. ఎక్సెల్‌లో ఈ ఫైళ్లను **వర్క్‌బుక్స్** అని కూడా నిర్వచిస్తారు మరియు ఈ పదజాలం ఈ పాఠం మిగిలిన భాగంలో ఉపయోగించబడుతుంది.
@ -24,11 +24,11 @@
"InventoryExample" అనే స్ప్రెడ్షీట్ ఫైల్ ఒక ఫార్మాట్ చేయబడిన ఇన్వెంటరీలోని అంశాల స్ప్రెడ్షీట్, ఇది మూడు వర్క్‌షీట్లను కలిగి ఉంటుంది, టాబ్‌లు "Inventory List", "Inventory Pick List" మరియు "Bin Lookup" అని లేబుల్ చేయబడ్డాయి. Inventory List వర్క్‌షీట్‌లో నాల్గవ వరుస హెడర్, ఇది హెడర్ కాలమ్‌లోని ప్రతి సెల్ విలువను వివరిస్తుంది.
![మైక్రోసాఫ్ట్ ఎక్సెల్‌లో ఉదాహరణ ఇన్వెంటరీ జాబితా నుండి హైలైట్ చేయబడిన ఫార్ములా](../../../../translated_images/te/formula-excel.ad1068c220892f5ead570d12f2394897961d31a5043a1dd4e6fc5d7690c7a14e.png)
![మైక్రోసాఫ్ట్ ఎక్సెల్‌లో ఉదాహరణ ఇన్వెంటరీ జాబితా నుండి హైలైట్ చేయబడిన ఫార్ములా](../../../../translated_images/te/formula-excel.ad1068c220892f5e.webp)
కొన్ని సందర్భాల్లో ఒక సెల్ విలువను ఉత్పత్తి చేయడానికి ఇతర సెల్స్ విలువలపై ఆధారపడి ఉంటుంది. ఇన్వెంటరీ జాబితా స్ప్రెడ్షీట్ తన ఇన్వెంటరీలోని ప్రతి అంశం యొక్క ఖర్చును ట్రాక్ చేస్తుంది, కానీ ఇన్వెంటరీలోని మొత్తం విలువ తెలుసుకోవాలంటే? [**ఫార్మూలాలు**](https://support.microsoft.com/en-us/office/overview-of-formulas-34519a4e-1e8d-4f4b-84d4-d642c4f63263) సెల్ డేటాపై చర్యలు నిర్వహిస్తాయి మరియు ఈ ఉదాహరణలో ఇన్వెంటరీ ఖర్చును లెక్కించడానికి ఉపయోగిస్తారు. ఈ స్ప్రెడ్షీట్ ఇన్వెంటరీ విలువ కాలమ్‌లో ఫార్ములాను ఉపయోగించి ప్రతి అంశం విలువను లెక్కిస్తుంది, ఇది QTY హెడర్ కింద ఉన్న పరిమాణాన్ని COST హెడర్ కింద ఉన్న ఖర్చులతో గుణిస్తుంది. ఒక సెల్‌ను డబుల్ క్లిక్ చేయడం లేదా హైలైట్ చేయడం ద్వారా ఫార్ములా కనిపిస్తుంది. మీరు గమనిస్తారు ఫార్మూలాలు సమాన చిహ్నంతో ప్రారంభమవుతాయి, తరువాత లెక్కింపు లేదా ఆపరేషన్ ఉంటుంది.
![మైక్రోసాఫ్ట్ ఎక్సెల్‌లో ఉదాహరణ ఇన్వెంటరీ జాబితా నుండి హైలైట్ చేయబడిన ఫంక్షన్](../../../../translated_images/te/function-excel.be2ae4feddc10ca089f3d4363040d93b7fd046c8d4f83ba975ec46483ee99895.png)
![మైక్రోసాఫ్ట్ ఎక్సెల్‌లో ఉదాహరణ ఇన్వెంటరీ జాబితా నుండి హైలైట్ చేయబడిన ఫంక్షన్](../../../../translated_images/te/function-excel.be2ae4feddc10ca0.webp)
మేము మరో ఫార్ములాను ఉపయోగించి ఇన్వెంటరీ విలువలన్నింటినీ కలిపి మొత్తం విలువను పొందవచ్చు. ప్రతి సెల్‌ను జోడించడం ద్వారా మొత్తం లెక్కించవచ్చు, కానీ అది కష్టమైన పని. ఎక్సెల్ [**ఫంక్షన్లు**](https://support.microsoft.com/en-us/office/sum-function-043e1c7d-7726-4e80-8f32-07b23e057f89) కలిగి ఉంది, ఇవి సెల్ విలువలపై లెక్కింపులు నిర్వహించడానికి ముందుగా నిర్వచించబడిన ఫార్మూలాలు. ఫంక్షన్లు ఆర్గ్యుమెంట్లను అవసరం చేస్తాయి, ఇవి లెక్కింపులు నిర్వహించడానికి అవసరమైన విలువలు. ఫంక్షన్లు ఒక కంటే ఎక్కువ ఆర్గ్యుమెంట్లు అవసరం అయితే, అవి నిర్దిష్ట క్రమంలో జాబితా చేయబడాలి లేకపోతే ఫంక్షన్ సరైన విలువను లెక్కించకపోవచ్చు. ఈ ఉదాహరణ SUM ఫంక్షన్‌ను ఉపయోగిస్తుంది, ఇది ఇన్వెంటరీ విలువల విలువలను ఆర్గ్యుమెంట్‌గా ఉపయోగించి వరుస 3, కాలమ్ B (B3 అని కూడా పిలవబడుతుంది) కింద మొత్తం లెక్కిస్తుంది.
@ -36,17 +36,17 @@
నోస్క్యూఎల్ అనేది నాన్-రిలేషనల్ డేటాను నిల్వ చేయడానికి వివిధ మార్గాలకు umbrella పదం, దీన్ని "నాన్-ఎస్‌క్యూఎల్", "నాన్-రిలేషనల్" లేదా "నాట్ ఓన్లీ SQL" అని అర్థం చేసుకోవచ్చు. ఈ రకమైన డేటాబేస్ సిస్టమ్స్ 4 రకాలుగా వర్గీకరించబడతాయి.
![కీ-విలువ డేటా స్టోర్ యొక్క గ్రాఫికల్ ప్రాతినిధ్యం, 4 ప్రత్యేక సంఖ్యా కీలు 4 వివిధ విలువలతో అనుసంధానించబడ్డాయి](../../../../translated_images/te/kv-db.e8f2b75686bbdfcba0c827b9272c10ae0821611ea0fe98429b9d13194383afa6.png)
![కీ-విలువ డేటా స్టోర్ యొక్క గ్రాఫికల్ ప్రాతినిధ్యం, 4 ప్రత్యేక సంఖ్యా కీలు 4 వివిధ విలువలతో అనుసంధానించబడ్డాయి](../../../../translated_images/te/kv-db.e8f2b75686bbdfcb.webp)
> మూలం [Michał Białecki Blog](https://www.michalbialecki.com/2018/03/18/azure-cosmos-db-key-value-database-cloud/)
[కీ-విలువ](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#keyvalue-data-stores) డేటాబేస్‌లు ప్రత్యేక కీలు, అంటే విలువతో అనుసంధానించబడిన ప్రత్యేక గుర్తింపును జతచేస్తాయి. ఈ జంటలు సరైన హాషింగ్ ఫంక్షన్‌తో [హాష్ టేబుల్](https://www.hackerearth.com/practice/data-structures/hash-tables/basics-of-hash-tables/tutorial/) ఉపయోగించి నిల్వ చేయబడతాయి.
![గ్రాఫ్ డేటా స్టోర్ యొక్క గ్రాఫికల్ ప్రాతినిధ్యం, వ్యక్తులు, వారి ఆసక్తులు మరియు ప్రదేశాల మధ్య సంబంధాలను చూపిస్తుంది](../../../../translated_images/te/graph-db.d13629152f79a9dac895b20fa7d841d4d4d6f6008b1382227c3bbd200fd4cfa1.png)
![గ్రాఫ్ డేటా స్టోర్ యొక్క గ్రాఫికల్ ప్రాతినిధ్యం, వ్యక్తులు, వారి ఆసక్తులు మరియు ప్రదేశాల మధ్య సంబంధాలను చూపిస్తుంది](../../../../translated_images/te/graph-db.d13629152f79a9da.webp)
> మూలం [Microsoft](https://docs.microsoft.com/en-us/azure/cosmos-db/graph/graph-introduction#graph-database-by-example)
[గ్రాఫ్](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#graph-data-stores) డేటాబేస్‌లు డేటాలో సంబంధాలను వివరించడానికి ఉపయోగిస్తారు మరియు నోడ్స్ మరియు ఎడ్జెస్ సేకరణగా ప్రాతినిధ్యం వహిస్తాయి. ఒక నోడ్ ఒక ఎంటిటీని సూచిస్తుంది, ఇది వాస్తవ ప్రపంచంలో ఉన్న ఏదైనా, ఉదాహరణకు ఒక విద్యార్థి లేదా బ్యాంక్ స్టేట్‌మెంట్. ఎడ్జెస్ రెండు ఎంటిటీల మధ్య సంబంధాన్ని సూచిస్తాయి. ప్రతి నోడ్ మరియు ఎడ్జ్‌కు అదనపు సమాచారం అందించే లక్షణాలు ఉంటాయి.
![కస్టమర్ డేటాబేస్‌తో కాలమ్నార్ డేటా స్టోర్ యొక్క గ్రాఫికల్ ప్రాతినిధ్యం, రెండు కాలమ్ ఫ్యామిలీలు Identity మరియు Contact Info పేర్లతో](../../../../translated_images/te/columnar-db.ffcfe73c3e9063a8c8f93f8ace85e1200863584b1e324eb5159d8ca10f62ec04.png)
![కస్టమర్ డేటాబేస్‌తో కాలమ్నార్ డేటా స్టోర్ యొక్క గ్రాఫికల్ ప్రాతినిధ్యం, రెండు కాలమ్ ఫ్యామిలీలు Identity మరియు Contact Info పేర్లతో](../../../../translated_images/te/columnar-db.ffcfe73c3e9063a8.webp)
[కాలమ్నార్](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#columnar-data-stores) డేటా స్టోర్‌లు డేటాను కాలమ్స్ మరియు వరుసలుగా ఏర్పాటు చేస్తాయి, ఇది రిలేషనల్ డేటా నిర్మాణంలా ఉంటుంది, కానీ ప్రతి కాలమ్ కాలమ్ ఫ్యామిలీ అని పిలవబడే సమూహాలుగా విభజించబడుతుంది, ఒక కాలమ్ కింద ఉన్న అన్ని డేటా సంబంధితంగా ఉంటుంది మరియు ఒక యూనిట్‌గా పొందవచ్చు మరియు మార్చవచ్చు.
@ -79,11 +79,11 @@ Cosmos DB డేటాబేస్ "నాట్ ఓన్లీ SQL" నిర
ఎమ్యులేటర్ బ్రౌజర్ విండోను ప్రారంభిస్తుంది, ఇక్కడ ఎక్స్‌ప్లోరర్ వీక్షణ డాక్యుమెంట్లను అన్వేషించడానికి అనుమతిస్తుంది.
![Cosmos DB ఎమ్యులేటర్ యొక్క ఎక్స్‌ప్లోరర్ వీక్షణ](../../../../translated_images/te/cosmosdb-emulator-explorer.a1c80b1347206fe2f30f88fc123821636587d04fc5a56a9eb350c7da6b31f361.png)
![Cosmos DB ఎమ్యులేటర్ యొక్క ఎక్స్‌ప్లోరర్ వీక్షణ](../../../../translated_images/te/cosmosdb-emulator-explorer.a1c80b1347206fe2.webp)
మీరు అనుసరిస్తున్నట్లయితే, "Start with Sample" క్లిక్ చేసి SampleDB అనే నమూనా డేటాబేస్‌ను సృష్టించండి. Sample DB ను ఎర్రో క్లిక్ చేసి విస్తరించండి, మీరు `Persons` అనే కంటైనర్‌ను కనుగొంటారు, కంటైనర్ ఒక అంశాల సేకరణను కలిగి ఉంటుంది, ఇవి కంటైనర్‌లోని డాక్యుమెంట్లు. మీరు `Items` కింద ఉన్న నాలుగు వ్యక్తిగత డాక్యుమెంట్లను అన్వేషించవచ్చు.
![Cosmos DB ఎమ్యులేటర్‌లో నమూనా డేటాను అన్వేషించడం](../../../../translated_images/te/cosmosdb-emulator-persons.bf640586a7077c8985dfd3071946465c8e074c722c7c202d6d714de99a93b90a.png)
![Cosmos DB ఎమ్యులేటర్‌లో నమూనా డేటాను అన్వేషించడం](../../../../translated_images/te/cosmosdb-emulator-persons.bf640586a7077c89.webp)
#### Cosmos DB ఎమ్యులేటర్‌తో డాక్యుమెంట్ డేటాను క్వెరీ చేయడం
@ -93,7 +93,7 @@ Cosmos DB డేటాబేస్ "నాట్ ఓన్లీ SQL" నిర
`SELECT * FROM c where c.age < 40`
![Cosmos DB ఎమ్యులేటర్‌లో SELECT క్వెరీ నడుపుతూ, వయస్సు 40 కంటే తక్కువ ఉన్న డాక్యుమెంట్లను కనుగొనడం](../../../../translated_images/te/cosmosdb-emulator-persons-query.6905ebb497e3cd047cd96e55a0a03f69ce1b91b2b3d8c147e617b746b22b7e33.png)
![Cosmos DB ఎమ్యులేటర్‌లో SELECT క్వెరీ నడుపుతూ, వయస్సు 40 కంటే తక్కువ ఉన్న డాక్యుమెంట్లను కనుగొనడం](../../../../translated_images/te/cosmosdb-emulator-persons-query.6905ebb497e3cd04.webp)
క్వెరీ రెండు డాక్యుమెంట్లను తిరిగి ఇస్తుంది, ప్రతి డాక్యుమెంట్ వయస్సు విలువ 40 కంటే తక్కువగా ఉంది.

@ -4,7 +4,7 @@
| :-------------------------------------------------------------------------------------------------------: |
| Python తో పని చేయడం - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
[![Intro Video](../../../../translated_images/te/video-ds-python.245247dc811db8e4d5ac420246de8a118c63fd28f6a56578d08b630ae549f260.png)](https://youtu.be/dZjWOGbsN4Y)
[![Intro Video](../../../../translated_images/te/video-ds-python.245247dc811db8e4.webp)](https://youtu.be/dZjWOGbsN4Y)
డేటాబేసులు డేటాను నిల్వ చేయడానికి మరియు క్వెరీ భాషలను ఉపయోగించి వాటిని క్వెరీ చేయడానికి చాలా సమర్థవంతమైన మార్గాలను అందించినప్పటికీ, డేటాను ప్రాసెస్ చేయడానికి అత్యంత అనుకూలమైన మార్గం మీ స్వంత ప్రోగ్రామ్ రాయడం. చాలా సందర్భాల్లో, డేటాబేస్ క్వెరీ చేయడం మరింత సమర్థవంతమైన మార్గం అవుతుంది. అయితే, కొన్ని సందర్భాల్లో, మరింత సంక్లిష్టమైన డేటా ప్రాసెసింగ్ అవసరం అయితే, అది SQL ఉపయోగించి సులభంగా చేయలేము.
డేటా ప్రాసెసింగ్ ఏ ప్రోగ్రామింగ్ భాషలోనైనా ప్రోగ్రామ్ చేయవచ్చు, కానీ డేటాతో పని చేయడంలో కొంతమంది భాషలు ఉన్నత స్థాయిలో ఉంటాయి. డేటా సైంటిస్టులు సాధారణంగా క్రింది భాషలలో ఒకదాన్ని ఇష్టపడతారు:
@ -66,7 +66,7 @@ print(f"Length of index is {len(idx)}")
items_sold = pd.Series(np.random.randint(25,50,size=len(idx)),index=idx)
items_sold.plot()
```
![Time Series Plot](../../../../translated_images/te/timeseries-1.80de678ab1cf727e50e00bcf24009fa2b0a8b90ebc43e34b99a345227d28e467.png)
![Time Series Plot](../../../../translated_images/te/timeseries-1.80de678ab1cf727e.webp)
ఇప్పుడు ప్రతీ వారం మేము స్నేహితుల కోసం పార్టీ నిర్వహిస్తున్నాము, మరియు పార్టీ కోసం అదనంగా 10 ఐస్-క్రీమ్ ప్యాకెట్లు తీసుకుంటాము అనుకోండి. మేము వారానికి ఇండెక్స్ చేయబడిన మరో సిరీస్ సృష్టించవచ్చు, దీన్ని చూపించడానికి:
```python
@ -77,7 +77,7 @@ additional_items = pd.Series(10,index=pd.date_range(start_date,end_date,freq="W"
total_items = items_sold.add(additional_items,fill_value=0)
total_items.plot()
```
![Time Series Plot](../../../../translated_images/te/timeseries-2.aae51d575c55181ceda81ade8c546a2fc2024f9136934386d57b8a189d7570ff.png)
![Time Series Plot](../../../../translated_images/te/timeseries-2.aae51d575c55181c.webp)
> **గమనిక** మేము సాదారణ సింటాక్స్ `total_items+additional_items` ఉపయోగించట్లేదు. అలా చేస్తే, ఫలిత సిరీస్‌లో చాలా `NaN` (*Not a Number*) విలువలు వస్తాయి. ఇది ఎందుకంటే `additional_items` సిరీస్‌లో కొన్ని ఇండెక్స్ పాయింట్లకు విలువలు లేవు, మరియు `NaN` ను ఏదైనా విలువకు జోడిస్తే ఫలితం `NaN` అవుతుంది. అందువల్ల జోడింపు సమయంలో `fill_value` పారామీటర్‌ను నిర్దేశించాలి.
@ -86,7 +86,7 @@ total_items.plot()
monthly = total_items.resample("1M").mean()
ax = monthly.plot(kind='bar')
```
![Monthly Time Series Averages](../../../../translated_images/te/timeseries-3.f3147cbc8c624881008564bc0b5d9fcc15e7374d339da91766bd0e1c6bd9e3af.png)
![Monthly Time Series Averages](../../../../translated_images/te/timeseries-3.f3147cbc8c624881.webp)
### డేటాఫ్రేమ్
@ -213,7 +213,7 @@ df = pd.read_csv('file.csv')
మనం డేటాతో ఎలా వ్యవహరించాలో చూపించాలనుకుంటున్నందున, మీరు [`notebook-covidspread.ipynb`](notebook-covidspread.ipynb) ను తెరిచి పై నుండి క్రింద వరకు చదవమని ఆహ్వానిస్తున్నాము. మీరు సెల్స్‌ను కూడా నడిపించవచ్చు, మరియు చివరలో మేము మీ కోసం వదిలిన కొన్ని ఛాలెంజ్‌లను చేయవచ్చు.
![COVID Spread](../../../../translated_images/te/covidspread.f3d131c4f1d260ab0344d79bac0abe7924598dd754859b165955772e1bd5e8a2.png)
![COVID Spread](../../../../translated_images/te/covidspread.f3d131c4f1d260ab.webp)
> మీరు Jupyter Notebook లో కోడ్ ఎలా నడుపాలో తెలియకపోతే, [ఈ వ్యాసం](https://soshnikov.com/education/how-to-execute-notebooks-from-github/)ను చూడండి.
@ -235,7 +235,7 @@ df = pd.read_csv('file.csv')
[`notebook-papers.ipynb`](notebook-papers.ipynb) ను తెరిచి పై నుండి క్రింద వరకు చదవండి. మీరు సెల్స్‌ను కూడా నడిపించవచ్చు, మరియు చివరలో మేము మీ కోసం వదిలిన కొన్ని ఛాలెంజ్‌లను చేయవచ్చు.
![Covid Medical Treatment](../../../../translated_images/te/covidtreat.b2ba59f57ca45fbcda36e0ddca3f8cfdddeeed6ca879ea7f866d93fa6ec65791.png)
![Covid Medical Treatment](../../../../translated_images/te/covidtreat.b2ba59f57ca45fbc.webp)
## చిత్ర డేటా ప్రాసెసింగ్

File diff suppressed because one or more lines are too long

@ -1,6 +1,6 @@
# డేటాతో పని చేయడం
![data love](../../../translated_images/te/data-love.a22ef29e6742c852505ada062920956d3d7604870b281a8ca7c7ac6f37381d5a.jpg)
![data love](../../../translated_images/te/data-love.a22ef29e6742c852.webp)
> ఫోటో <a href="https://unsplash.com/@swimstaralex?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Alexander Sinn</a> ద్వారా <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a>లో
ఈ పాఠాలలో, డేటాను ఎలా నిర్వహించవచ్చు, మార్చవచ్చు మరియు అనువర్తనాలలో ఉపయోగించవచ్చు అనే కొన్ని మార్గాలను మీరు నేర్చుకుంటారు. మీరు సంబంధిత మరియు అసంబంధిత డేటాబేస్‌ల గురించి మరియు వాటిలో డేటాను ఎలా నిల్వ చేయవచ్చో తెలుసుకుంటారు. డేటాను నిర్వహించడానికి Pythonతో పని చేసే ప్రాథమిక అంశాలను మీరు నేర్చుకుంటారు, మరియు Pythonతో డేటాను నిర్వహించడానికి మరియు తవ్వడానికి మీరు ఉపయోగించగల అనేక మార్గాలను మీరు కనుగొంటారు.

@ -52,7 +52,7 @@ birds.head()
wingspan = birds['MaxWingspan']
wingspan.plot()
```
![గరిష్ఠ రెక్కల వ్యాప్తి](../../../../translated_images/te/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.png)
![గరిష్ఠ రెక్కల వ్యాప్తి](../../../../translated_images/te/max-wingspan-02.e79fd847b2640b89.webp)
మీకు వెంటనే ఏమి కనిపిస్తుంది? కనీసం ఒక అవుట్లయర్ ఉన్నట్లు కనిపిస్తోంది - అది చాలా పెద్ద రెక్కల వ్యాప్తి! 2300 సెంటీమీటర్ల రెక్కల వ్యాప్తి అంటే 23 మీటర్లు - మినెసోటాలో ప్టెరోడాక్టిల్స్ తిరుగుతున్నారా? పరిశీలిద్దాం.
@ -72,7 +72,7 @@ plt.plot(x, y)
plt.show()
```
![లేబుల్స్ తో రెక్కల వ్యాప్తి](../../../../translated_images/te/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.png)
![లేబుల్స్ తో రెక్కల వ్యాప్తి](../../../../translated_images/te/max-wingspan-labels-02.aa90e826ca49a9d1.webp)
లేబుల్స్ 45 డిగ్రీల కోణంలో తిప్పినా కూడా చదవడానికి చాలా ఉన్నాయి. వేరే వ్యూహం ప్రయత్నిద్దాం: అవుట్లయర్లకు మాత్రమే లేబుల్స్ ఇవ్వండి మరియు లేబుల్స్‌ను చార్ట్ లోపల ఉంచండి. లేబలింగ్ కోసం మరింత స్థలం కోసం స్కాటర్ చార్ట్ ఉపయోగించవచ్చు:
@ -94,7 +94,7 @@ plt.show()
మీరు ఏమి కనుగొన్నారు?
![అవుట్లయర్లు](../../../../translated_images/te/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.png)
![అవుట్లయర్లు](../../../../translated_images/te/labeled-wingspan-02.6110e2d2401cd523.webp)
## మీ డేటాను ఫిల్టర్ చేయండి
బాల్డ్ ఈగిల్ మరియు ప్రేరి ఫాల్కన్, చాలా పెద్ద పక్షులు కావచ్చు, గరిష్ఠ రెక్కల వ్యాప్తికి అదనపు `0` తప్పుగా జోడించబడినట్లు కనిపిస్తున్నాయి. 25 మీటర్ల రెక్కల వ్యాప్తి ఉన్న బాల్డ్ ఈగిల్‌ను మీరు కలుసుకోవడం అసాధ్యమే, అయితే ఉంటే, దయచేసి మాకు తెలియజేయండి! ఆ రెండు అవుట్లయర్లను తీసేసి కొత్త డేటాఫ్రేమ్ సృష్టిద్దాం:
@ -114,7 +114,7 @@ plt.show()
అవుట్లయర్లను ఫిల్టర్ చేయడం ద్వారా, మీ డేటా ఇప్పుడు మరింత సమగ్రంగా మరియు అర్థమయ్యేలా మారింది.
![రెక్కల వ్యాప్తుల స్కాటర్‌ప్లాట్](../../../../translated_images/te/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.png)
![రెక్కల వ్యాప్తుల స్కాటర్‌ప్లాట్](../../../../translated_images/te/scatterplot-wingspan-02.1c33790094ce36a7.webp)
ఇప్పుడు రెక్కల వ్యాప్తి పరంగా కనీసం శుభ్రమైన డేటాసెట్ ఉన్నందున, ఈ పక్షుల గురించి మరింత తెలుసుకుందాం.
@ -140,7 +140,7 @@ birds.plot(x='Category',
title='Birds of Minnesota')
```
![పూర్తి డేటా బార్ చార్ట్](../../../../translated_images/te/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.png)
![పూర్తి డేటా బార్ చార్ట్](../../../../translated_images/te/full-data-bar-02.aaa3fda71c63ed56.webp)
ఈ బార్ చార్ట్ చదవలేనిది ఎందుకంటే చాలా ఎక్కువ గుంపు కాని డేటా ఉంది. మీరు ప్లాట్ చేయదలచుకున్న డేటాను మాత్రమే ఎంచుకోవాలి, కాబట్టి పక్షుల పొడవును వారి వర్గం ఆధారంగా చూద్దాం.
@ -155,7 +155,7 @@ category_count = birds.value_counts(birds['Category'].values, sort=True)
plt.rcParams['figure.figsize'] = [6, 12]
category_count.plot.barh()
```
![వర్గం మరియు సంఖ్య](../../../../translated_images/te/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.png)
![వర్గం మరియు సంఖ్య](../../../../translated_images/te/category-counts-02.0b9a0a4de42275ae.webp)
ఈ బార్ చార్ట్ ప్రతి వర్గంలో పక్షుల సంఖ్యను బాగా చూపిస్తుంది. ఒక చూపులోనే, ఈ ప్రాంతంలో అత్యధిక సంఖ్యలో పక్షులు డక్స్/గీస్స్/వాటర్‌ఫౌల్ వర్గంలో ఉన్నాయని మీరు చూడవచ్చు. మినెసోటా '10,000 సరస్సుల భూమి' కాబట్టి ఇది ఆశ్చర్యకరం కాదు!
@ -171,7 +171,7 @@ plt.barh(y=birds['Category'], width=maxlength)
plt.rcParams['figure.figsize'] = [6, 12]
plt.show()
```
![డేటా పోలిక](../../../../translated_images/te/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.png)
![డేటా పోలిక](../../../../translated_images/te/category-length-02.7304bf519375c980.webp)
ఇక్కడ ఏ ఆశ్చర్యం లేదు: హమ్మింగ్‌బర్డ్స్ పెలికాన్స్ లేదా గీస్స్ కంటే తక్కువ MaxLength కలిగి ఉంటాయి. డేటా తార్కికంగా అర్థం కావడం మంచిది!
@ -189,7 +189,7 @@ plt.show()
```
ఈ ప్లాట్‌లో, మీరు పక్షి వర్గం ప్రకారం కనిష్ఠ పొడవు మరియు గరిష్ఠ పొడవు పరిధిని చూడవచ్చు. ఈ డేటా ప్రకారం, పక్షి పెద్దదైతే, దాని పొడవు పరిధి కూడా పెద్దదని మీరు సురక్షితంగా చెప్పవచ్చు. ఆసక్తికరం!
![సూపర్ ఇంపోజ్ చేసిన విలువలు](../../../../translated_images/te/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.png)
![సూపర్ ఇంపోజ్ చేసిన విలువలు](../../../../translated_images/te/superimposed-02.f03058536baeb2ed.webp)
## 🚀 సవాలు

@ -40,7 +40,7 @@ plt.xlabel('Max Length')
plt.show()
```
![max length per order](../../../../translated_images/te/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.png)
![max length per order](../../../../translated_images/te/scatter-wb.9d98b0ed7f0388af.webp)
ఇది పక్షుల ఆర్డర్ ప్రకారం శరీర పొడవు యొక్క సాధారణ పంపిణీకి అవలోకనం ఇస్తుంది, కానీ ఇది నిజమైన పంపిణీలను ప్రదర్శించడానికి ఉత్తమ మార్గం కాదు. ఆ పని సాధారణంగా హిస్టోగ్రామ్ సృష్టించడం ద్వారా నిర్వహించబడుతుంది.
## హిస్టోగ్రామ్‌లతో పని చేయడం
@ -51,7 +51,7 @@ Matplotlib డేటా పంపిణీని హిస్టోగ్రా
birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
plt.show()
```
![distribution over the entire dataset](../../../../translated_images/te/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.png)
![distribution over the entire dataset](../../../../translated_images/te/dist1-wb.0d0cac82e2974fbb.webp)
మీరు చూడగలిగినట్లుగా, ఈ డేటాసెట్‌లో 400+ పక్షులలో ఎక్కువ భాగం వారి గరిష్ట శరీర ద్రవ్యరాశి 2000 కంటే తక్కువ పరిధిలో ఉంటాయి. `bins` పారామీటర్‌ను 30 లాంటి ఎక్కువ సంఖ్యకు మార్చి డేటా గురించి మరింత అవగాహన పొందండి:
@ -59,7 +59,7 @@ plt.show()
birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
plt.show()
```
![distribution over the entire dataset with larger bins param](../../../../translated_images/te/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.png)
![distribution over the entire dataset with larger bins param](../../../../translated_images/te/dist2-wb.2c0a7a3499b2fbf5.webp)
ఈ చార్ట్ మరింత సూక్ష్మంగా పంపిణీని చూపిస్తుంది. ఎడమవైపు తక్కువ వంకరగా ఉన్న చార్ట్‌ను మీరు ఒక నిర్దిష్ట పరిధిలో మాత్రమే డేటాను ఎంచుకోవడం ద్వారా సృష్టించవచ్చు:
@ -70,7 +70,7 @@ filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]
filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
plt.show()
```
![filtered histogram](../../../../translated_images/te/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.png)
![filtered histogram](../../../../translated_images/te/dist3-wb.64b88db7f9780200.webp)
✅ మరిన్ని ఫిల్టర్లు మరియు డేటా పాయింట్లను ప్రయత్నించండి. డేటా యొక్క పూర్తి పంపిణీని చూడటానికి, `['MaxBodyMass']` ఫిల్టర్‌ను తీసివేయండి మరియు లేబుల్ చేసిన పంపిణీలను చూపించండి.
@ -87,7 +87,7 @@ hist = ax.hist2d(x, y)
```
ఈ రెండు అంశాల మధ్య ఒక అంచనా సంబంధం కనిపిస్తుంది, ఒక ప్రత్యేకంగా బలమైన సమీకరణ బిందువు తో:
![2D plot](../../../../translated_images/te/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.png)
![2D plot](../../../../translated_images/te/2D-wb.ae22fdd33936507a.webp)
హిస్టోగ్రామ్‌లు సంఖ్యాత్మక డేటాకు డిఫాల్ట్‌గా బాగా పనిచేస్తాయి. మీరు టెక్స్ట్ డేటా ప్రకారం పంపిణీలను చూడాలనుకుంటే ఏమవుతుంది?
## టెక్స్ట్ డేటా ఉపయోగించి పంపిణీల కోసం డేటాసెట్‌ను అన్వేషించండి
@ -126,7 +126,7 @@ plt.gca().set(title='Conservation Status', ylabel='Min Wingspan')
plt.legend();
```
![wingspan and conservation collation](../../../../translated_images/te/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.png)
![wingspan and conservation collation](../../../../translated_images/te/histogram-conservation-wb.3c40450eb072c14d.webp)
కనిష్ట రెక్కపట్టు మరియు సంరక్షణ స్థితి మధ్య మంచి సంబంధం కనిపించడం లేదు. ఈ పద్ధతిని ఉపయోగించి డేటాసెట్ యొక్క ఇతర అంశాలను పరీక్షించండి. మీరు ఏదైనా సంబంధం కనుగొంటారా?
@ -144,7 +144,7 @@ import matplotlib.pyplot as plt
sns.kdeplot(filteredBirds['MinWingspan'])
plt.show()
```
![Density plot](../../../../translated_images/te/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.png)
![Density plot](../../../../translated_images/te/density1.8801043bd4af2567.webp)
మీరు చూడవచ్చు, ఈ ప్లాట్ కనిష్ట రెక్కపట్టు డేటాకు ముందు ప్లాట్‌ను ప్రతిధ్వనిస్తుంది; ఇది కేవలం కొంచెం మృదువుగా ఉంటుంది. Seaborn డాక్యుమెంటేషన్ ప్రకారం, "హిస్టోగ్రామ్‌తో పోలిస్తే, KDE ఒక ప్లాట్‌ను తక్కువ గందరగోళంగా మరియు మరింత అర్థం చేసుకునేలా ఉత్పత్తి చేయగలదు, ముఖ్యంగా బహుళ పంపిణీలను డ్రా చేస్తున్నప్పుడు. కానీ ఇది ప్రాథమిక పంపిణీ పరిమితమైన లేదా మృదువుగా లేనప్పుడు వక్రీకరణలను పరిచయం చేసే అవకాశం ఉంది. హిస్టోగ్రామ్ లాగా, ప్రాతినిధ్యం నాణ్యత కూడా మంచి స్మూతింగ్ పారామీటర్ల ఎంపికపై ఆధారపడి ఉంటుంది." [మూలం](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) అంటే, అవుట్లయర్లు ఎప్పుడూ మీ చార్ట్లను చెడగొడతాయి.
@ -154,7 +154,7 @@ plt.show()
sns.kdeplot(filteredBirds['MaxBodyMass'])
plt.show()
```
![smooth bodymass line](../../../../translated_images/te/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.png)
![smooth bodymass line](../../../../translated_images/te/density2.8e7647257060ff54.webp)
మీకు మృదువైనది కావాలి కానీ చాలా మృదువైనది కాదు అనుకుంటే, `bw_adjust` పారామీటర్‌ను సవరించండి:
@ -162,7 +162,7 @@ plt.show()
sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
plt.show()
```
![less smooth bodymass line](../../../../translated_images/te/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.png)
![less smooth bodymass line](../../../../translated_images/te/density3.84ae27da82f31e6b.webp)
✅ ఈ రకమైన ప్లాట్ కోసం అందుబాటులో ఉన్న పారామీటర్ల గురించి చదవండి మరియు ప్రయోగాలు చేయండి!
@ -176,7 +176,7 @@ sns.kdeplot(
)
```
![bodymass per order](../../../../translated_images/te/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.png)
![bodymass per order](../../../../translated_images/te/density4.e9d6c033f15c500f.webp)
మీరు ఒకే చార్ట్‌లో అనేక వేరియబుల్స్ డెన్సిటీని కూడా మ్యాప్ చేయవచ్చు. పక్షుల గరిష్ట పొడవు మరియు కనిష్ట పొడవును వారి సంరక్షణ స్థితితో పోల్చండి:
@ -184,7 +184,7 @@ sns.kdeplot(
sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")
```
![multiple densities, superimposed](../../../../translated_images/te/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.png)
![multiple densities, superimposed](../../../../translated_images/te/multi.56548caa9eae8d0f.webp)
వозможно, 'Vulnerable' పక్షుల పొడవుల ప్రకారం క్లస్టర్ అర్థవంతమో లేదో పరిశోధించడం విలువైనది.

@ -84,7 +84,7 @@ plt.show()
```
ఇది, ఈ రెండు మష్రూమ్ తరగతుల ప్రకారం ఈ డేటా భాగాలను చూపించే పై చార్ట్. లేబుల్స్ క్రమం సరిగ్గా ఉండటం చాలా ముఖ్యం, కాబట్టి లేబుల్ అర్రే ఎలా నిర్మించబడిందో నిర్ధారించుకోండి!
![pie chart](../../../../translated_images/te/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.png)
![pie chart](../../../../translated_images/te/pie1-wb.e201f2fcc3354131.webp)
## డోనట్స్!
@ -114,7 +114,7 @@ plt.title('Mushroom Habitats')
plt.show()
```
![donut chart](../../../../translated_images/te/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.png)
![donut chart](../../../../translated_images/te/donut-wb.be3c12a22712302b.webp)
ఈ కోడ్ ఒక చార్ట్ మరియు మధ్యలో ఒక వృత్తాన్ని గీయడం, ఆ మధ్య వృత్తాన్ని చార్ట్‌లో చేర్చడం చేస్తుంది. మధ్య వృత్తం వెడల్పును మార్చడానికి `0.40` ను మరొక విలువగా మార్చండి.
@ -162,7 +162,7 @@ fig = plt.figure(
వాఫిల్ చార్ట్ ఉపయోగించి, మీరు ఈ మష్రూమ్ dataset క్యాప్ రంగుల భాగాలను స్పష్టంగా చూడవచ్చు. ఆసక్తికరంగా, చాలా గ్రీన్-క్యాప్ మష్రూమ్‌లు ఉన్నాయి!
![waffle chart](../../../../translated_images/te/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.png)
![waffle chart](../../../../translated_images/te/waffle.5455dbae4ccf17d5.webp)
✅ Pywaffle చార్ట్లలో [Font Awesome](https://fontawesome.com/)లో అందుబాటులో ఉన్న ఏ ఐకాన్ అయినా ఉపయోగించగలదు. చతురస్రాల స్థానంలో ఐకాన్లను ఉపయోగించి మరింత ఆసక్తికరమైన వాఫిల్ చార్ట్ సృష్టించడానికి ప్రయోగాలు చేయండి.

@ -42,7 +42,7 @@ honey.head()
```python
sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
```
![scatterplot 1](../../../../translated_images/te/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.png)
![scatterplot 1](../../../../translated_images/te/scatter1.5e1aa5fd6706c5d1.webp)
ఇప్పుడు, తేనె రంగు ప్యాలెట్ ఉపయోగించి అదే డేటాను చూపించండి, సంవత్సరాల వారీగా ధర ఎలా మారిందో చూపించడానికి. మీరు 'hue' పారామీటర్ జోడించడం ద్వారా సంవత్సరాల మార్పును చూపవచ్చు:
@ -51,7 +51,7 @@ sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
```python
sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5);
```
![scatterplot 2](../../../../translated_images/te/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.png)
![scatterplot 2](../../../../translated_images/te/scatter2.c0041a58621ca702.webp)
ఈ రంగు ప్యాలెట్ మార్పుతో, తేనె ధరలో సంవత్సరాల వారీగా స్పష్టమైన పెరుగుదల ఉందని మీరు చూడవచ్చు. నిజంగా, డేటాలో ఒక ఉదాహరణ రాష్ట్రం (ఉదాహరణకు అరిజోనా) తీసుకుని పరిశీలిస్తే, సంవత్సరాల వారీగా ధర పెరుగుదల ఒక నమూనా కనిపిస్తుంది, కొన్ని తప్పులతో:
@ -80,7 +80,7 @@ sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspec
```
డాట్ల పరిమాణం క్రమంగా పెరుగుతున్నట్లు మీరు చూడవచ్చు.
![scatterplot 3](../../../../translated_images/te/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.png)
![scatterplot 3](../../../../translated_images/te/scatter3.3c160a3d1dcb36b3.webp)
ఇది సరళమైన సరఫరా మరియు డిమాండ్ కేసా కాదా? వాతావరణ మార్పు మరియు కాలనీ కాలాప్స్ వంటి కారణాల వల్ల, సంవత్సరాల వారీగా తేనె కొరకు అందుబాటు తగ్గుతుందా, అందువల్ల ధర పెరుగుతుందా?
@ -95,7 +95,7 @@ sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
```
జవాబు: అవును, 2003 సంవత్సరానికి చుట్టూ కొన్ని తప్పులతో:
![line chart 1](../../../../translated_images/te/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.png)
![line chart 1](../../../../translated_images/te/line1.f36eb465229a3b1f.webp)
✅ Seaborn ఒకే లైన్ చుట్టూ డేటాను సమీకరించడంతో, "ప్రతి x విలువ వద్ద బహుళ కొలతలను సగటు మరియు సగటు చుట్టూ 95% విశ్వాస అంతరాన్ని ప్లాట్ చేస్తుంది". [మూలం](https://seaborn.pydata.org/tutorial/relational.html). ఈ సమయం తీసుకునే ప్రవర్తనను `ci=None` జోడించడం ద్వారా నిలిపివేయవచ్చు.
@ -105,7 +105,7 @@ sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
sns.relplot(x="year", y="totalprod", kind="line", data=honey);
```
![line chart 2](../../../../translated_images/te/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.png)
![line chart 2](../../../../translated_images/te/line2.a5b3493dc01058af.webp)
జవాబు: అంతగా కాదు. మొత్తం ఉత్పత్తిని చూస్తే, ఆ ప్రత్యేక సంవత్సరంలో పెరిగినట్లు కనిపిస్తుంది, అయితే సాధారణంగా ఈ సంవత్సరాలలో తేనె ఉత్పత్తి తగ్గుతోంది.
@ -130,7 +130,7 @@ sns.relplot(
```
ఈ దృశ్యీకరణలో, మీరు సంవత్సరాల వారీగా కాలనీకి ఉత్పత్తి మరియు కాలనీల సంఖ్యను పక్కపక్కనే 3 కాలమ్స్ లో ర్యాప్ సెట్ తో పోల్చవచ్చు:
![facet grid](../../../../translated_images/te/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.png)
![facet grid](../../../../translated_images/te/facet.6a34851dcd540050.webp)
ఈ డేటాసెట్ కోసం, కాలనీల సంఖ్య మరియు వారి ఉత్పత్తి విషయంలో సంవత్సరాల వారీగా మరియు రాష్ట్రాల వారీగా ప్రత్యేకంగా ఏమీ కనిపించదు. ఈ రెండు వేరియబుల్స్ మధ్య సంబంధం కనుగొనడానికి వేరే దృశ్య పద్ధతి ఉందా?
@ -153,7 +153,7 @@ sns.despine(right=False)
plt.ylabel('colony yield')
ax.figure.legend();
```
![superimposed plots](../../../../translated_images/te/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.png)
![superimposed plots](../../../../translated_images/te/dual-line.a4c28ce659603fab.webp)
2003 సంవత్సరానికి చుట్టూ ఏదీ ప్రత్యేకంగా కనిపించకపోయినా, ఈ పాఠాన్ని కొంత సంతోషకరమైన నోటుతో ముగించడానికి ఇది సహాయపడుతుంది: మొత్తం కాలనీల సంఖ్య తగ్గుతున్నప్పటికీ, వారి ఉత్పత్తి తగ్గుతున్నా కాలనీల సంఖ్య స్థిరపడుతోంది.

@ -38,25 +38,25 @@
డేటా సైంటిస్ట్ సరైన డేటాకు సరైన చార్ట్ ఎంచుకోవడంలో జాగ్రత్తగా ఉన్నా కూడా, డేటాను ఒక పాయింట్ నిరూపించడానికి ప్రదర్శించే అనేక మార్గాలు ఉన్నాయి, తరచుగా డేటాను తక్కువగా చూపించే ఖర్చుతో. మోసపూరిత చార్టులు మరియు ఇన్ఫోగ్రాఫిక్స్ అనేక ఉదాహరణలు ఉన్నాయి!
[![అల్బెర్టో కైరో ద్వారా "హౌ చార్ట్స్ లై"](../../../../translated_images/te/tornado.9f42168791208f970d6faefc11d1226d7ca89518013b14aa66b1c9edcd7678d2.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
[![అల్బెర్టో కైరో ద్వారా "హౌ చార్ట్స్ లై"](../../../../translated_images/te/tornado.9f42168791208f97.webp)](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
> 🎥 మోసపూరిత చార్టుల గురించి కాన్ఫరెన్స్ టాక్ కోసం పై చిత్రం క్లిక్ చేయండి
ఈ చార్ట్ X అక్షాన్ని తిరగబెడుతుంది, తేదీ ఆధారంగా నిజానికి వ్యతిరేకంగా చూపించడానికి:
![తప్పు చార్ట్ 1](../../../../translated_images/te/bad-chart-1.93130f495b748bedfb3423d91b1e754d9026e17f94ad967aecdc9ca7203373bf.png)
![తప్పు చార్ట్ 1](../../../../translated_images/te/bad-chart-1.93130f495b748bed.webp)
[ఈ చార్ట్](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) మరింత మోసపూరితంగా ఉంది, కళ్ళు కుడి వైపు ఆకర్షించబడి, కాలక్రమేణా COVID కేసులు వివిధ కౌంటీలలో తగ్గాయని తేల్చుకుంటుంది. నిజానికి, తేదీలను జాగ్రత్తగా పరిశీలిస్తే, అవి మోసపూరిత దిగువ ధోరణిని ఇవ్వడానికి తిరగబడినట్లు కనుగొంటారు.
![తప్పు చార్ట్ 2](../../../../translated_images/te/bad-chart-2.c20e36dd4e6f617c0c325878dd421a563885bbf30a394884c147438827254e0e.jpg)
![తప్పు చార్ట్ 2](../../../../translated_images/te/bad-chart-2.c20e36dd4e6f617c.webp)
ఈ ప్రసిద్ధ ఉదాహరణ రంగు మరియు తిరగబడిన Y అక్షాన్ని ఉపయోగించి మోసం చేస్తుంది: తుపాకీ మిత్ర చట్టం ఆమోదం తర్వాత తుపాకీ మరణాలు పెరిగాయని తేల్చుకోవడం కాకుండా, కళ్ళు వ్యతిరేకం నిజమని భావించడానికి మోసం చేస్తాయి:
![తప్పు చార్ట్ 3](../../../../translated_images/te/bad-chart-3.6865d0afac4108d737558d90a61547d23a8722896397ec792264ee51a1be4be5.jpg)
![తప్పు చార్ట్ 3](../../../../translated_images/te/bad-chart-3.6865d0afac4108d7.webp)
ఈ విచిత్ర చార్ట్ భాగస్వామ్యాన్ని ఎలా మోసం చేయవచ్చో హాస్యాస్పదంగా చూపిస్తుంది:
![తప్పు చార్ట్ 4](../../../../translated_images/te/bad-chart-4.68cfdf4011b454471053ee1231172747e1fbec2403b4443567f1dc678134f4f2.jpg)
![తప్పు చార్ట్ 4](../../../../translated_images/te/bad-chart-4.68cfdf4011b45447.webp)
అసమానమైన వాటిని పోల్చడం మరొక మోసపూరిత ట్రిక్. 'స్పూరియస్ కారెలేషన్స్' గురించి ఒక [అద్భుతమైన వెబ్ సైట్](https://tylervigen.com/spurious-correlations) ఉంది, ఇది మైన్లో విడాకుల రేటు మరియు మార్జరిన్ వినియోగం వంటి విషయాలను కలిపి 'వాస్తవాలు' చూపిస్తుంది. Reddit గ్రూప్ కూడా డేటా యొక్క [అందం లేని ఉపయోగాలను](https://www.reddit.com/r/dataisugly/top/?t=all) సేకరిస్తుంది.
@ -91,13 +91,13 @@
మీ డేటా X అక్షంపై వర్ణనాత్మకంగా ఉంటే, చదవడానికి మెరుగ్గా ఉండేందుకు టెక్స్ట్‌ను కోణంలో చూపించవచ్చు. [Matplotlib](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) 3D ప్లాటింగ్ అందిస్తుంది, మీ డేటా మద్దతు ఇస్తే. సున్నితమైన డేటా విజువలైజేషన్లు `mpl_toolkits.mplot3d` ఉపయోగించి తయారు చేయవచ్చు.
![3D ప్లాట్లు](../../../../translated_images/te/3d.0cec12bcc60f0ce7284c63baed1411a843e24716f7d7425de878715ebad54a15.png)
![3D ప్లాట్లు](../../../../translated_images/te/3d.0cec12bcc60f0ce7.webp)
## యానిమేషన్ మరియు 3D చార్ట్ ప్రదర్శన
ఈ రోజుల్లో కొన్ని ఉత్తమ డేటా విజువలైజేషన్లు యానిమేటెడ్ ఉంటాయి. షిర్లీ వూ D3 తో అద్భుతమైనవి చేసింది, ఉదాహరణకు '[ఫిల్మ్ ఫ్లవర్స్](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', ఇందులో ప్రతి పువ్వు ఒక సినిమా విజువలైజేషన్. గార్డియన్ కోసం మరో ఉదాహరణ 'బస్స్డ్ అవుట్', ఇది గ్రీన్సాక్ మరియు D3 తో విజువలైజేషన్లను కలిపి స్క్రోలిటెల్లింగ్ ఆర్టికల్ ఫార్మాట్‌లో ఇంటరాక్టివ్ అనుభవం, NYC తన హోంలెస్ సమస్యను నగరానికి బయటికి బస్సు ద్వారా ఎలా నిర్వహిస్తుందో చూపిస్తుంది.
![బస్సింగ్](../../../../translated_images/te/busing.7b9e3b41cd4b981c6d63922cd82004cc1cf18895155536c1d98fcc0999bdd23e.png)
![బస్సింగ్](../../../../translated_images/te/busing.7b9e3b41cd4b981c.webp)
> "బస్స్డ్ అవుట్: హౌ అమెరికా మూవ్స్ ఇట్ హోంలెస్" [గార్డియన్](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study) నుండి. విజువలైజేషన్లు: నాడీహ్ బ్రెమర్ & షిర్లీ వూ
@ -107,7 +107,7 @@
మీరు ఈ సోషల్ నెట్‌వర్క్ యొక్క యానిమేటెడ్ వీక్షణను ప్రదర్శించే వెబ్ యాప్‌ను పూర్తి చేస్తారు. ఇది Vue.js మరియు D3 ఉపయోగించి [నెట్‌వర్క్ విజువల్](https://github.com/emiliorizzo/vue-d3-network) సృష్టించడానికి రూపొందించిన లైబ్రరీని ఉపయోగిస్తుంది. యాప్ నడుస్తున్నప్పుడు, మీరు స్క్రీన్‌పై నోడ్లను తీయవచ్చు, డేటాను తిరగరాయడానికి.
![లియాజన్స్](../../../../translated_images/te/liaisons.7b440b28f6d07ea430244fdf1fc4c64ff48f473f143b8e921846eda1c302aeba.png)
![లియాజన్స్](../../../../translated_images/te/liaisons.7b440b28f6d07ea4.webp)
## ప్రాజెక్ట్: D3.js ఉపయోగించి నెట్‌వర్క్ చూపించే చార్ట్ నిర్మించండి

@ -57,7 +57,7 @@ ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
```
ఇక్కడ, మీరు `ggplot2` ప్యాకేజీని ఇన్‌స్టాల్ చేసి, తరువాత `library("ggplot2")` కమాండ్ ఉపయోగించి వర్క్‌స్పేస్‌లో దిగుమతి చేసుకుంటారు. ggplot లో ఏదైనా ప్లాట్ చేయడానికి `ggplot()` ఫంక్షన్ ఉపయోగిస్తారు మరియు డేటాసెట్, x మరియు y వేరియబుల్స్‌ను లక్షణాలుగా పేర్కొంటారు. ఈ సందర్భంలో, లైన్ ప్లాట్ చేయాలనుకున్నందున `geom_line()` ఫంక్షన్ ఉపయోగిస్తారు.
![MaxWingspan-lineplot](../../../../../translated_images/te/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.png)
![MaxWingspan-lineplot](../../../../../translated_images/te/MaxWingspan-lineplot.b12169f99d26fdd2.webp)
మీకు వెంటనే ఏమి కనిపిస్తుంది? కనీసం ఒక అవుట్లయర్ ఉన్నట్లు కనిపిస్తోంది - అది చాలా పెద్ద రెక్కల వ్యాప్తి! 2000+ సెంటీమీటర్ల రెక్కల వ్యాప్తి అంటే 20 మీటర్లకు పైగా - మినెసోటాలో ప్టెరోడాక్టిల్స్ తిరుగుతున్నారా? పరిశీలిద్దాం.
@ -75,7 +75,7 @@ ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
```
`theme` లో కోణాన్ని పేర్కొంటాము మరియు `xlab()` మరియు `ylab()` లో వరుసగా x మరియు y అక్ష లేబుల్స్‌ను పేర్కొంటాము. `ggtitle()` గ్రాఫ్/ప్లాట్‌కు పేరు ఇస్తుంది.
![MaxWingspan-lineplot-improved](../../../../../translated_images/te/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.png)
![MaxWingspan-lineplot-improved](../../../../../translated_images/te/MaxWingspan-lineplot-improved.04b73b4d5a59552a.webp)
లేబుల్స్ 45 డిగ్రీల కోణంలో తిరిగినా, చదవడానికి చాలా ఉన్నాయి. వేరే వ్యూహం ప్రయత్నిద్దాం: అవుట్లయర్లకు మాత్రమే లేబుల్స్ ఇవ్వండి మరియు లేబుల్స్‌ను చార్ట్ లోపల సెట్ చేయండి. లేబులింగ్‌కు మరింత స్థలం కోసం స్కాటర్ చార్ట్ ఉపయోగించవచ్చు:
@ -91,7 +91,7 @@ ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
మీరు ఏమి కనుగొంటారు?
![MaxWingspan-scatterplot](../../../../../translated_images/te/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.png)
![MaxWingspan-scatterplot](../../../../../translated_images/te/MaxWingspan-scatterplot.60dc9e0e19d32700.webp)
## మీ డేటాను ఫిల్టర్ చేయండి
@ -110,7 +110,7 @@ ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
```
మేము కొత్త డేటాఫ్రేమ్ `birds_filtered` సృష్టించి స్కాటర్ ప్లాట్ చేశాము. అవుట్లయర్లను తీసివేసిన తర్వాత, మీ డేటా మరింత సమగ్రమైనది మరియు అర్థమయ్యేలా మారింది.
![MaxWingspan-scatterplot-improved](../../../../../translated_images/te/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.png)
![MaxWingspan-scatterplot-improved](../../../../../translated_images/te/MaxWingspan-scatterplot-improved.7d0af81658c65f3e.webp)
ఇప్పుడు రెక్కల వ్యాప్తి పరంగా కనీసం శుభ్రమైన డేటాసెట్ ఉన్నందున, ఈ పక్షుల గురించి మరింత తెలుసుకుందాం.
@ -151,7 +151,7 @@ birds_filtered %>% group_by(Category) %>%
```
తదుపరి కోడ్‌లో, డేటాను మానిప్యులేట్ చేసి గ్రూప్ చేయడానికి సహాయపడే [dplyr](https://www.rdocumentation.org/packages/dplyr/versions/0.7.8) మరియు [lubridate](https://www.rdocumentation.org/packages/lubridate/versions/1.8.0) ప్యాకేజీలను ఇన్‌స్టాల్ చేస్తారు. మొదట, పక్షుల `Category` ప్రకారం డేటాను గ్రూప్ చేసి, `MinLength`, `MaxLength`, `MinBodyMass`, `MaxBodyMass`, `MinWingspan`, `MaxWingspan` కాలమ్స్‌ను సమ్మరీ చేస్తారు. తరువాత, `ggplot2` ప్యాకేజీ ఉపయోగించి బార్ చార్ట్ ప్లాట్ చేసి వేర్వేరు వర్గాల రంగులు మరియు లేబుల్స్‌ను పేర్కొంటారు.
![Stacked bar chart](../../../../../translated_images/te/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.png)
![Stacked bar chart](../../../../../translated_images/te/stacked-bar-chart.0c92264e89da7b39.webp)
ఈ బార్ చార్ట్ చదవడానికి కష్టమైనది ఎందుకంటే చాలా డేటా గ్రూప్ చేయబడలేదు. మీరు ప్లాట్ చేయదలచుకున్న డేటాను మాత్రమే ఎంచుకోవాలి, కాబట్టి పక్షుల వర్గం ఆధారంగా వారి పొడవును చూద్దాం.
@ -166,7 +166,7 @@ ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()
```
ముందుగా `Category` కాలమ్‌లోని ప్రత్యేక విలువలను లెక్కించి, వాటిని కొత్త డేటాఫ్రేమ్ `birds_count` లో సర్దుబాటు చేస్తారు. ఈ సర్దుబాటు చేసిన డేటాను అదే స్థాయిలో ఫ్యాక్టర్ చేసి, సర్దుబాటు చేసిన విధంగా ప్లాట్ చేయబడుతుంది. `ggplot2` ఉపయోగించి బార్ చార్ట్ ప్లాట్ చేస్తారు. `coord_flip()` హారిజాంటల్ బార్లను ప్లాట్ చేస్తుంది.
![category-length](../../../../../translated_images/te/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.png)
![category-length](../../../../../translated_images/te/category-length.7e34c296690e85d6.webp)
ఈ బార్ చార్ట్ ప్రతి వర్గంలో పక్షుల సంఖ్యను బాగా చూపిస్తుంది. ఒక చూపులోనే, ఈ ప్రాంతంలో అత్యధిక సంఖ్యలో పక్షులు Ducks/Geese/Waterfowl వర్గంలో ఉన్నాయని మీరు చూడవచ్చు. మినెసోటా '10,000 సరస్సుల భూమి' కాబట్టి ఇది ఆశ్చర్యకరం కాదు!
@ -189,7 +189,7 @@ ggplot(birds_grouped,aes(Category,MaxLength))+geom_bar(stat="identity")+coord_fl
```
`birds_filtered` డేటాను `Category` ప్రకారం గ్రూప్ చేసి బార్ గ్రాఫ్ ప్లాట్ చేస్తారు.
![comparing data](../../../../../translated_images/te/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.png)
![comparing data](../../../../../translated_images/te/comparingdata.f486a450d61c7ca5.webp)
ఇక్కడ ఏ ఆశ్చర్యం లేదు: హమ్మింగ్‌బర్డ్స్‌కు పెలికాన్స్ లేదా గీస్లతో పోలిస్తే తక్కువ MaxLength ఉంటుంది. డేటా తార్కికంగా అర్థమయ్యేలా ఉండటం మంచిది!
@ -201,7 +201,7 @@ ggplot(data=birds_grouped, aes(x=Category)) +
geom_bar(aes(y=MinLength), stat="identity", position="identity", fill='orange')+
coord_flip()
```
![super-imposed values](../../../../../translated_images/te/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.png)
![super-imposed values](../../../../../translated_images/te/superimposed-values.5363f0705a1da416.webp)
## 🚀 సవాలు

@ -36,7 +36,7 @@ ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
geom_point() +
ggtitle("Max Length per order") + coord_flip()
```
![max length per order](../../../../../translated_images/te/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.png)
![max length per order](../../../../../translated_images/te/max-length-per-order.e5b283d952c78c12.webp)
ఇది పక్షుల ఆర్డర్ ప్రకారం శరీర పొడవు యొక్క సాధారణ పంపిణీకి అవలోకనం ఇస్తుంది, కానీ ఇది నిజమైన పంపిణీలను ప్రదర్శించడానికి ఉత్తమ మార్గం కాదు. ఆ పని సాధారణంగా హిస్టోగ్రామ్ సృష్టించడం ద్వారా నిర్వహించబడుతుంది.
## హిస్టోగ్రామ్లతో పని చేయడం
@ -47,7 +47,7 @@ ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
geom_histogram(bins=10)+ylab('Frequency')
```
![distribution over entire dataset](../../../../../translated_images/te/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.png)
![distribution over entire dataset](../../../../../translated_images/te/distribution-over-the-entire-dataset.d22afd3fa96be854.webp)
మీరు చూడగలిగినట్లుగా, ఈ డేటాసెట్‌లో 400+ పక్షులలో ఎక్కువ భాగం వారి గరిష్ట శరీర ద్రవ్యరాశి 2000 కంటే తక్కువ పరిధిలో ఉంటాయి. `bins` పారామీటర్‌ను 30 లాంటి ఎక్కువ సంఖ్యకు మార్చి డేటా గురించి మరింత అవగాహన పొందండి:
@ -55,7 +55,7 @@ ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) + geom_histogram(bins=30)+ylab('Frequency')
```
![distribution-30bins](../../../../../translated_images/te/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.png)
![distribution-30bins](../../../../../translated_images/te/distribution-30bins.6a3921ea7a421bf7.webp)
ఈ చార్ట్ పంపిణీని మరింత సూక్ష్మంగా చూపిస్తుంది. ఎడమవైపు తక్కువ వంకరగా ఉన్న చార్ట్‌ను మీరు ఇచ్చిన పరిధిలో మాత్రమే డేటాను ఎంచుకోవడం ద్వారా సృష్టించవచ్చు:
@ -67,7 +67,7 @@ ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_histogram(bins=30)+ylab('Frequency')
```
![filtered histogram](../../../../../translated_images/te/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.png)
![filtered histogram](../../../../../translated_images/te/filtered-histogram.6bf5d2bfd8253322.webp)
✅ మరిన్ని ఫిల్టర్లు మరియు డేటా పాయింట్లను ప్రయత్నించండి. డేటా యొక్క పూర్తి పంపిణీని చూడటానికి, లేబుల్ చేయబడిన పంపిణీలను చూపించడానికి `['MaxBodyMass']` ఫిల్టర్‌ను తీసివేయండి.
@ -81,7 +81,7 @@ ggplot(data=birds_filtered_1, aes(x=MaxBodyMass, y=MaxLength) ) +
```
ఈ రెండు అంశాల మధ్య అంచనా వేయదగిన సంబంధం కనిపిస్తుంది, ఒక ప్రత్యేకంగా బలమైన సమీకరణ బిందువు తో:
![2d plot](../../../../../translated_images/te/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.png)
![2d plot](../../../../../translated_images/te/2d-plot.c504786f439bd7eb.webp)
హిస్టోగ్రామ్లు సంఖ్యాత్మక డేటాకు డిఫాల్ట్‌గా బాగా పనిచేస్తాయి. మీరు టెక్స్ట్ డేటా ప్రకారం పంపిణీలను చూడాలనుకుంటే ఏమవుతుంది?
## టెక్స్ట్ డేటా ఉపయోగించి పంపిణీలను అన్వేషించండి
@ -112,7 +112,7 @@ ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
scale_fill_manual(name="Conservation Status",values=c("red","green","blue","pink"),labels=c("Endangered","Near Threathened","Vulnerable","Least Concern"))
```
![wingspan and conservation collation](../../../../../translated_images/te/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.png)
![wingspan and conservation collation](../../../../../translated_images/te/wingspan-conservation-collation.4024e9aa6910866a.webp)
కనిష్ట రెక్కపట్టు మరియు సంరక్షణ స్థితి మధ్య మంచి సంబంధం కనిపించట్లేదు. ఈ పద్ధతిని ఉపయోగించి డేటాసెట్ యొక్క ఇతర అంశాలను పరీక్షించండి. మీరు ఏదైనా సంబంధం కనుగొంటారా?
@ -126,7 +126,7 @@ ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
geom_density()
```
![density plot](../../../../../translated_images/te/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.png)
![density plot](../../../../../translated_images/te/density-plot.675ccf865b76c690.webp)
మీరు చూడగలరు, ఈ ప్లాట్ కనిష్ట రెక్కపట్టు డేటాకు ముందు ప్లాట్‌ను ప్రతిధ్వనిస్తుంది; ఇది కేవలం కొంచెం మృదువుగా ఉంటుంది. మీరు రెండవ చార్ట్‌లో ఉన్న ఆ జాగ్గీడ్ MaxBodyMass లైన్‌ను మృదువుగా చేయాలనుకుంటే, ఈ పద్ధతిని ఉపయోగించి దాన్ని బాగా సృష్టించవచ్చు:
@ -134,7 +134,7 @@ ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_density()
```
![bodymass density](../../../../../translated_images/te/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.png)
![bodymass density](../../../../../translated_images/te/bodymass-smooth.d31ce526d82b0a1f.webp)
మీకు చాలా మృదువుగా కాకుండా కొంత మృదువుగా ఉండే లైన్ కావాలంటే, `adjust` పారామీటర్‌ను సవరించండి:
@ -142,7 +142,7 @@ ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
geom_density(adjust = 1/5)
```
![less smooth bodymass](../../../../../translated_images/te/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.png)
![less smooth bodymass](../../../../../translated_images/te/less-smooth-bodymass.10f4db8b683cc17d.webp)
✅ ఈ రకమైన ప్లాట్ కోసం అందుబాటులో ఉన్న పారామీటర్ల గురించి చదవండి మరియు ప్రయోగాలు చేయండి!
@ -152,7 +152,7 @@ ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
ggplot(data=birds_filtered_1,aes(x = MaxBodyMass, fill = Order)) +
geom_density(alpha=0.5)
```
![bodymass per order](../../../../../translated_images/te/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.png)
![bodymass per order](../../../../../translated_images/te/bodymass-per-order.9d2b065dd931b928.webp)
## 🚀 సవాలు

@ -88,7 +88,7 @@ pie(grouped$count,grouped$class, main="Edible?")
```
ఇది, ఈ రెండు మష్రూమ్ తరగతుల ప్రకారం డేటా యొక్క నిష్పత్తులను చూపించే పై చార్ట్. లేబుల్స్ క్రమం సరిగ్గా ఉండటం చాలా ముఖ్యం, కాబట్టి లేబుల్ అర్రే ఎలా తయారవుతుందో నిర్ధారించుకోండి!
![pie chart](../../../../../translated_images/te/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.png)
![pie chart](../../../../../translated_images/te/pie1-wb.685df063673751f4.webp)
## డోనట్స్!
@ -123,7 +123,7 @@ library(webr)
PieDonut(habitat, aes(habitat, count=count))
```
![donut chart](../../../../../translated_images/te/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.png)
![donut chart](../../../../../translated_images/te/donut-wb.34e6fb275da9d834.webp)
ఈ కోడ్ రెండు లైబ్రరీలు - ggplot2 మరియు webr ఉపయోగిస్తుంది. webr లైబ్రరీలో PieDonut ఫంక్షన్ ఉపయోగించి, డోనట్ చార్ట్ సులభంగా సృష్టించవచ్చు!
@ -161,7 +161,7 @@ waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual
వాఫిల్ చార్ట్ ఉపయోగించి, ఈ మష్రూమ్ dataset లో క్యాప్ రంగుల నిష్పత్తులను స్పష్టంగా చూడవచ్చు. ఆసక్తికరంగా, చాలా గ్రీన్ క్యాప్ మష్రూమ్స్ ఉన్నాయి!
![waffle chart](../../../../../translated_images/te/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.png)
![waffle chart](../../../../../translated_images/te/waffle.aaa75c5337735a6e.webp)
ఈ పాఠంలో, మీరు నిష్పత్తులను విజువలైజ్ చేయడానికి మూడు మార్గాలు నేర్చుకున్నారు. మొదట, డేటాను వర్గాలుగా వర్గీకరించి, ఆ తర్వాత డేటాను ప్రదర్శించడానికి ఉత్తమ మార్గం - పై, డోనట్ లేదా వాఫిల్ ఎంచుకోవాలి. ఇవన్నీ రుచికరమైనవి మరియు dataset యొక్క తక్షణ స్నాప్‌షాట్ తో వినియోగదారుని సంతృప్తి పరుస్తాయి.

@ -42,7 +42,7 @@ library(ggplot2)
ggplot(honey, aes(x = priceperlb, y = state)) +
geom_point(colour = "blue")
```
![scatterplot 1](../../../../../translated_images/te/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.png)
![scatterplot 1](../../../../../translated_images/te/scatter1.86b8900674d88b26.webp)
ఇప్పుడు, అదే డేటాను తేనె రంగు స్కీమ్‌తో చూపించి, సంవత్సరాల వారీగా ధర ఎలా మారిందో చూపించండి. మీరు 'scale_color_gradientn' పారామీటర్ జోడించడం ద్వారా సంవత్సరాల మార్పును చూపవచ్చు:
@ -52,7 +52,7 @@ ggplot(honey, aes(x = priceperlb, y = state)) +
ggplot(honey, aes(x = priceperlb, y = state, color=year)) +
geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7))
```
![scatterplot 2](../../../../../translated_images/te/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.png)
![scatterplot 2](../../../../../translated_images/te/scatter2.4d1cbc693bad20e2.webp)
ఈ రంగు స్కీమ్ మార్పుతో, తేనె ధరలో సంవత్సరాల వారీగా స్పష్టమైన పెరుగుదల ఉందని మీరు చూడవచ్చు. నిజంగా, డేటాలో ఒక నమూనా సెట్ (ఉదాహరణకు అరిజోనా రాష్ట్రం) పరిశీలిస్తే, కొన్నిసార్లు తప్పులు ఉన్నా, ధర సంవత్సరాల వారీగా పెరుగుతుందని కనిపిస్తుంది:
@ -83,7 +83,7 @@ ggplot(honey, aes(x = priceperlb, y = state)) +
```
డాట్ల పరిమాణం క్రమంగా పెరుగుతున్నట్లు మీరు చూడవచ్చు.
![scatterplot 3](../../../../../translated_images/te/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.png)
![scatterplot 3](../../../../../translated_images/te/scatter3.722d21e6f20b3ea2.webp)
ఇది సరఫరా మరియు డిమాండ్ యొక్క సాదారణ ఉదాహరణనా? వాతావరణ మార్పులు మరియు కాలనీ కాలపనితీరు వంటి కారణాల వల్ల, సంవత్సరాల వారీగా తేనె కొంత తక్కువగా అందుబాటులో ఉండి, అందువల్ల ధర పెరుగుతుందా?
@ -98,7 +98,7 @@ qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab
```
జవాబు: అవును, 2003 సంవత్సరానికి చుట్టూ కొన్ని మినహాయింపులతో:
![line chart 1](../../../../../translated_images/te/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.png)
![line chart 1](../../../../../translated_images/te/line1.299b576fbb2a59e6.webp)
ప్రశ్న: 2003లో తేనె సరఫరాలో కూడా పెరుగుదల కనిపిస్తుందా? సంవత్సరాల వారీగా మొత్తం ఉత్పత్తిని చూస్తే?
@ -106,7 +106,7 @@ qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab
qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod")
```
![line chart 2](../../../../../translated_images/te/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.png)
![line chart 2](../../../../../translated_images/te/line2.3b18fcda7176ceba.webp)
జవాబు: అంతగా కాదు. మొత్తం ఉత్పత్తిని చూస్తే, ఆ ప్రత్యేక సంవత్సరంలో పెరిగినట్లు కనిపిస్తుంది, అయితే సాధారణంగా ఈ సంవత్సరాలలో తేనె ఉత్పత్తి తగ్గుతోంది.
@ -126,7 +126,7 @@ ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) +
```
ఈ దృశ్యీకరణలో, మీరు కాలనీకి ఉత్పత్తి మరియు కాలనీల సంఖ్యను సంవత్సరాల వారీగా, 3 కాలమ్స్‌తో wrap సెట్‌తో పక్కపక్కనే పోల్చవచ్చు:
![facet grid](../../../../../translated_images/te/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.png)
![facet grid](../../../../../translated_images/te/facet.491ad90d61c2a7cc.webp)
ఈ డేటాసెట్ కోసం, కాలనీల సంఖ్య మరియు వాటి ఉత్పత్తి విషయంలో సంవత్సరాల వారీగా మరియు రాష్ట్రాల వారీగా ప్రత్యేకంగా ఏమీ కనిపించదు. ఈ రెండు వేరియబుల్స్ మధ్య సంబంధం కనుగొనడానికి వేరే దృశ్య పద్ధతి ఉందా?
@ -143,7 +143,7 @@ plot(honey$year, honey$yieldpercol, pch = 17, col = 3,
axis(side = 4, at = pretty(range(y2)))
mtext("colony yield", side = 4, line = 3)
```
![superimposed plots](../../../../../translated_images/te/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.png)
![superimposed plots](../../../../../translated_images/te/dual-line.fc4665f360a54018.webp)
2003 సంవత్సరానికి చుట్టూ ఏదీ స్పష్టంగా కనిపించకపోయినా, ఈ పాఠాన్ని కొంత సంతోషకరంగా ముగించడానికి ఇది సహాయపడుతుంది: మొత్తం కాలనీల సంఖ్య తగ్గుతున్నప్పటికీ, వాటి ఉత్పత్తి తగ్గుతున్నా, కాలనీల సంఖ్య స్థిరపడుతోంది.

@ -38,25 +38,25 @@
డేటా సైంటిస్ట్ సరైన డేటాకు సరైన చార్ట్ ఎంచుకోవడానికి జాగ్రత్తగా ఉన్నా కూడా, డేటాను ఒక పాయింట్ నిరూపించడానికి ప్రదర్శించే అనేక మార్గాలు ఉన్నాయి, ఇది తరచుగా డేటాను తక్కువగా చూపించడంలో దోషం కలిగిస్తుంది. మోసపూరిత చార్టులు మరియు ఇన్ఫోగ్రాఫిక్స్ యొక్క అనేక ఉదాహరణలు ఉన్నాయి!
[![అల్బెర్టో కైరో ద్వారా How Charts Lie](../../../../../translated_images/te/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.png)](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
[![అల్బెర్టో కైరో ద్వారా How Charts Lie](../../../../../translated_images/te/tornado.2880ffc7f135f82b.webp)](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
> 🎥 మోసపూరిత చార్టుల గురించి కాన్ఫరెన్స్ టాక్ కోసం పై చిత్రాన్ని క్లిక్ చేయండి
ఈ చార్ట్ X అక్షాన్ని తిరగబెడుతుంది, నిజానికి వ్యతిరేకంగా చూపించడానికి, తేదీ ఆధారంగా:
![తప్పు చార్ట్ 1](../../../../../translated_images/te/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.png)
![తప్పు చార్ట్ 1](../../../../../translated_images/te/bad-chart-1.596bc93425a8ac30.webp)
[ఈ చార్ట్](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) మరింత మోసపూరితంగా ఉంది, కళ్ళు కుడి వైపు ఆకర్షించబడి, కాలక్రమేణా వివిధ కౌంటీలలో COVID కేసులు తగ్గాయని తేల్చుకుంటుంది. నిజానికి, తేదీలను జాగ్రత్తగా పరిశీలిస్తే, అవి మోసపూరిత దిగువ ధోరణిని ఇవ్వడానికి తిరగబడినట్లు కనబడతాయి.
![తప్పు చార్ట్ 2](../../../../../translated_images/te/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.jpg)
![తప్పు చార్ట్ 2](../../../../../translated_images/te/bad-chart-2.62edf4d2f30f4e51.webp)
ఈ ప్రసిద్ధ ఉదాహరణ రంగు మరియు తిరగబడిన Y అక్షాన్ని ఉపయోగించి మోసం చేస్తుంది: తుపాకీ మిత్ర చట్టం ఆమోదం తర్వాత తుపాకీ మరణాలు పెరిగాయని తేల్చుకోవడం కాకుండా, కళ్ళు వ్యతిరేకం నిజమని భావించడానికి మోసం చేస్తాయి:
![తప్పు చార్ట్ 3](../../../../../translated_images/te/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.jpg)
![తప్పు చార్ట్ 3](../../../../../translated_images/te/bad-chart-3.e201e2e915a230bc.webp)
ఈ విచిత్ర చార్ట్ భాగస్వామ్యాన్ని ఎలా మోసం చేయవచ్చో హాస్యాస్పదంగా చూపిస్తుంది:
![తప్పు చార్ట్ 4](../../../../../translated_images/te/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.jpg)
![తప్పు చార్ట్ 4](../../../../../translated_images/te/bad-chart-4.8872b2b881ffa96c.webp)
సమానమైన వాటిని పోల్చడం మరొక అన్యాయమైన ట్రిక్. 'స్పూరియస్ కారెలేషన్స్' గురించి ఒక [అద్భుతమైన వెబ్ సైట్](https://tylervigen.com/spurious-correlations) ఉంది, ఇది మైన్లో విడాకుల రేటు మరియు మార్జరిన్ వినియోగం వంటి విషయాలను కలిపి 'వాస్తవాలు' చూపిస్తుంది. Reddit గ్రూప్ కూడా డేటా యొక్క [అందం లేని ఉపయోగాలను](https://www.reddit.com/r/dataisugly/top/?t=all) సేకరిస్తుంది.
@ -91,13 +91,13 @@
మీ డేటా X అక్షంపై వర్ణనాత్మకంగా ఉంటే, చదవడానికి మెరుగ్గా ఉండేందుకు టెక్స్ట్‌ను కోణంలో చూపించవచ్చు. [plot3D](https://cran.r-project.org/web/packages/plot3D/index.html) 3D ప్లాటింగ్ అందిస్తుంది, మీ డేటా దీనికి మద్దతు ఇస్తే. దీని ద్వారా సున్నితమైన డేటా విజువలైజేషన్లు తయారు చేయవచ్చు.
![3D ప్లాట్లు](../../../../../translated_images/te/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.png)
![3D ప్లాట్లు](../../../../../translated_images/te/3d.db1734c151eee87d.webp)
## యానిమేషన్ మరియు 3D చార్ట్ ప్రదర్శన
ఈ రోజుల్లో కొన్ని ఉత్తమ డేటా విజువలైజేషన్లు యానిమేటెడ్ ఉంటాయి. షిర్లీ వూ D3తో అద్భుతమైనవి చేసింది, ఉదాహరణకు '[ఫిల్మ్ ఫ్లవర్స్](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', ఇందులో ప్రతి పువ్వు ఒక సినిమా విజువలైజేషన్. గార్డియన్ కోసం మరో ఉదాహరణ 'బస్స్డ్ అవుట్', ఇది విజువలైజేషన్లను Greensock మరియు D3తో కలిపి NYC తన హోంలెస్ సమస్యను నగరానికి బయటికి బస్సు ద్వారా ఎలా నిర్వహిస్తుందో చూపించే స్క్రోలిటెల్లింగ్ ఆర్టికల్ ఫార్మాట్.
![బస్సింగ్](../../../../../translated_images/te/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.png)
![బస్సింగ్](../../../../../translated_images/te/busing.8157cf1bc89a3f65.webp)
> "Bussed Out: How America Moves its Homeless" [గార్డియన్](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study) నుండి. విజువలైజేషన్లు: నాడీహ్ బ్రెమర్ & షిర్లీ వూ
@ -107,7 +107,7 @@
మీరు ఈ సోషల్ నెట్‌వర్క్ యొక్క యానిమేటెడ్ వీక్షణను ప్రదర్శించే వెబ్ యాప్‌ను పూర్తి చేస్తారు. ఇది Vue.js మరియు D3 ఉపయోగించి [నెట్‌వర్క్ విజువలైజేషన్](https://github.com/emiliorizzo/vue-d3-network) సృష్టించడానికి రూపొందించిన లైబ్రరీని ఉపయోగిస్తుంది. యాప్ నడుస్తున్నప్పుడు, మీరు స్క్రీన్‌పై నోడ్లను తీయవచ్చు, డేటాను తిరగరాయడానికి.
![లియాజన్స్](../../../../../translated_images/te/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.png)
![లియాజన్స్](../../../../../translated_images/te/liaisons.90ce7360bcf84765.webp)
## ప్రాజెక్ట్: D3.js ఉపయోగించి నెట్‌వర్క్ చూపించే చార్ట్ నిర్మించండి

@ -1,6 +1,6 @@
# విజువలైజేషన్లు
![a bee on a lavender flower](../../../translated_images/te/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.jpg)
![a bee on a lavender flower](../../../translated_images/te/bee.0aa1d91132b12e3a.webp)
> ఫోటో <a href="https://unsplash.com/@jenna2980?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">జెన్నా లీ</a> చేత <a href="https://unsplash.com/s/photos/bees-in-a-meadow?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">అన్స్ప్లాష్</a> లో

@ -16,7 +16,7 @@
ఈ పాఠం లైఫ్‌సైకిల్ యొక్క 3 భాగాలపై దృష్టి సారిస్తుంది: సేకరణ, ప్రాసెసింగ్ మరియు నిర్వహణ.
![డేటా సైన్స్ లైఫ్‌సైకిల్ యొక్క డయాగ్రామ్](../../../../translated_images/te/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.jpg)
![డేటా సైన్స్ లైఫ్‌సైకిల్ యొక్క డయాగ్రామ్](../../../../translated_images/te/data-science-lifecycle.a1e362637503c4fb.webp)
> ఫోటో [బర్క్లీ స్కూల్ ఆఫ్ ఇన్ఫర్మేషన్](https://ischoolonline.berkeley.edu/data-science/what-is-data-science/) ద్వారా
## సేకరణ
@ -89,7 +89,7 @@
|టీమ్ డేటా సైన్స్ ప్రాసెస్ (TDSP)|క్రాస్-ఇండస్ట్రీ స్టాండర్డ్ ప్రాసెస్ ఫర్ డేటా మైనింగ్ (CRISP-DM)|
|--|--|
|![టీమ్ డేటా సైన్స్ లైఫ్‌సైకిల్](../../../../translated_images/te/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.png) | ![డేటా సైన్స్ ప్రాసెస్ అలయన్స్ చిత్రం](../../../../translated_images/te/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.png) |
|![టీమ్ డేటా సైన్స్ లైఫ్‌సైకిల్](../../../../translated_images/te/tdsp-lifecycle2.e19029d598e2e73d.webp) | ![డేటా సైన్స్ ప్రాసెస్ అలయన్స్ చిత్రం](../../../../translated_images/te/CRISP-DM.8bad2b4c66e62aa7.webp) |
| చిత్రం [Microsoft](https://docs.microsoft.comazure/architecture/data-science-process/lifecycle) ద్వారా | చిత్రం [డేటా సైన్స్ ప్రాసెస్ అలయన్స్](https://www.datascience-pm.com/crisp-dm-2/) ద్వారా |
## [పోస్ట్-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/27)

@ -1,6 +1,6 @@
# డేటా సైన్స్ లైఫ్‌సైకిల్
![communication](../../../translated_images/te/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.jpg)
![communication](../../../translated_images/te/communication.06d8e2a88d30d168.webp)
> ఫోటో <a href="https://unsplash.com/@headwayio?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">హెడ్‌వే</a> ద్వారా <a href="https://unsplash.com/s/photos/communication?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">అన్స్ప్లాష్</a>లో
ఈ పాఠాలలో, మీరు డేటా సైన్స్ లైఫ్‌సైకిల్ యొక్క కొన్ని అంశాలను, డేటా చుట్టూ విశ్లేషణ మరియు కమ్యూనికేషన్ సహా, అన్వేషించబోతున్నారు.

@ -53,7 +53,7 @@
ప్రాజెక్టులు తయారు చేయడం మరియు నిర్మించడం మీ నైపుణ్యాలు మరియు జ్ఞానాన్ని పరీక్షించడానికి ఉత్తమ మార్గం అని సందేహం లేదు. ఈ పాఠంలో, అజ్యూర్ ML స్టూడియోలో హార్ట్ ఫెయిల్యూర్ దాడుల ప్రిడిక్షన్ కోసం డేటా సైన్స్ ప్రాజెక్ట్‌ను రెండు వేర్వేరు మార్గాల్లో నిర్మించడం గురించి తెలుసుకోబోతున్నాము, లో కోడ్/నో కోడ్ ద్వారా మరియు అజ్యూర్ ML SDK ద్వారా, క్రింది స్కీమా ప్రకారం:
![project-schema](../../../../translated_images/te/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.png)
![project-schema](../../../../translated_images/te/project-schema.736f6e403f321eb4.webp)
ప్రతి విధానానికి తన స్వంత లాభాలు మరియు నష్టాలు ఉన్నాయి. లో కోడ్/నో కోడ్ విధానం GUI (గ్రాఫికల్ యూజర్ ఇంటర్‌ఫేస్)తో ఇంటరాక్ట్ చేయడం వల్ల ప్రారంభించడానికి సులభం, కోడ్ గురించి ముందస్తు జ్ఞానం అవసరం లేదు. ఈ పద్ధతి ప్రాజెక్ట్ యొక్క సాధ్యతను త్వరగా పరీక్షించడానికి మరియు POC (ప్రూఫ్ ఆఫ్ కాన్సెప్ట్) సృష్టించడానికి అనుమతిస్తుంది. అయితే, ప్రాజెక్ట్ పెరిగినప్పుడు మరియు ప్రొడక్షన్ సిద్ధంగా ఉండాల్సినప్పుడు, GUI ద్వారా వనరులను సృష్టించడం సాధ్యం కాదు. వనరుల సృష్టి నుండి మోడల్ డిప్లాయ్‌మెంట్ వరకు ప్రతిదీ ప్రోగ్రామాటిక్‌గా ఆటోమేట్ చేయాలి. అప్పుడు అజ్యూర్ ML SDK ఉపయోగించడం చాలా ముఖ్యం అవుతుంది.
@ -106,15 +106,15 @@ Kaggle ఒక [Heart Failure dataset](https://www.kaggle.com/andrewmvd/heart-fai
1. మీ అజ్యూర్ సబ్‌స్క్రిప్షన్‌కు సంబంధించిన Microsoft క్రెడెన్షియల్స్ ఉపయోగించి [Azure పోర్టల్](https://ms.portal.azure.com/)లో సైన్ ఇన్ అవ్వండి.
2. **Create a resource** ఎంచుకోండి
![workspace-1](../../../../translated_images/te/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.png)
![workspace-1](../../../../translated_images/te/workspace-1.ac8694d60b073ed1.webp)
మెషీన్ లెర్నింగ్ కోసం శోధించి, మెషీన్ లెర్నింగ్ టైల్ ఎంచుకోండి
![workspace-2](../../../../translated_images/te/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.png)
![workspace-2](../../../../translated_images/te/workspace-2.ae7c486db8796147.webp)
క్రియేట్ బటన్ క్లిక్ చేయండి
![workspace-3](../../../../translated_images/te/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.png)
![workspace-3](../../../../translated_images/te/workspace-3.398ca4a5858132cc.webp)
క్రింది విధంగా సెట్టింగ్స్ నింపండి:
- సబ్‌స్క్రిప్షన్: మీ అజ్యూర్ సబ్‌స్క్రిప్షన్
@ -126,17 +126,17 @@ Kaggle ఒక [Heart Failure dataset](https://www.kaggle.com/andrewmvd/heart-fai
- అప్లికేషన్ ఇన్సైట్స్: మీ వర్క్‌స్పేస్ కోసం సృష్టించబడే డిఫాల్ట్ కొత్త అప్లికేషన్ ఇన్సైట్స్ వనరు గమనించండి
- కంటైనర్ రిజిస్ట్రీ: లేదు (మొదటి సారి మోడల్‌ను కంటైనర్‌కు డిప్లాయ్ చేసినప్పుడు ఒకటి ఆటోమేటిక్‌గా సృష్టించబడుతుంది)
![workspace-4](../../../../translated_images/te/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.png)
![workspace-4](../../../../translated_images/te/workspace-4.bac87f6599c4df63.webp)
- create + review క్లిక్ చేసి, తరువాత create బటన్ క్లిక్ చేయండి
3. మీ వర్క్‌స్పేస్ సృష్టించబడే వరకు వేచి ఉండండి (కొన్ని నిమిషాలు పట్టవచ్చు). తరువాత పోర్టల్‌లో దానికి వెళ్లండి. మీరు మెషీన్ లెర్నింగ్ అజ్యూర్ సర్వీస్ ద్వారా దాన్ని కనుగొనవచ్చు.
4. మీ వర్క్‌స్పేస్ యొక్క ఓవర్వ్యూ పేజీలో, అజ్యూర్ మెషీన్ లెర్నింగ్ స్టూడియో ప్రారంభించండి (లేదా కొత్త బ్రౌజర్ ట్యాబ్ తెరిచి https://ml.azure.com కి వెళ్లండి), మరియు మీ Microsoft ఖాతాతో సైన్ ఇన్ అవ్వండి. ప్రాంప్ట్ అయితే, మీ అజ్యూర్ డైరెక్టరీ, సబ్‌స్క్రిప్షన్ మరియు అజ్యూర్ మెషీన్ లెర్నింగ్ వర్క్‌స్పేస్ ఎంచుకోండి.
![workspace-5](../../../../translated_images/te/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.png)
![workspace-5](../../../../translated_images/te/workspace-5.a6eb17e0a5e64200.webp)
5. అజ్యూర్ మెషీన్ లెర్నింగ్ స్టూడియోలో, ఎడమ పైభాగంలో ☰ ఐకాన్‌ను టోగుల్ చేసి ఇంటర్‌ఫేస్‌లోని వివిధ పేజీలను చూడండి. మీరు ఈ పేజీలను ఉపయోగించి మీ వర్క్‌స్పేస్ వనరులను నిర్వహించవచ్చు.
![workspace-6](../../../../translated_images/te/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.png)
![workspace-6](../../../../translated_images/te/workspace-6.8dd81fe841797ee1.webp)
మీరు అజ్యూర్ పోర్టల్ ఉపయోగించి మీ వర్క్‌స్పేస్‌ను నిర్వహించవచ్చు, కానీ డేటా శాస్త్రవేత్తలు మరియు మెషీన్ లెర్నింగ్ ఆపరేషన్స్ ఇంజనీర్ల కోసం, అజ్యూర్ మెషీన్ లెర్నింగ్ స్టూడియో వర్క్‌స్పేస్ వనరులను నిర్వహించడానికి మరింత కేంద్రీకృత యూజర్ ఇంటర్‌ఫేస్‌ను అందిస్తుంది.
@ -184,18 +184,18 @@ Low-priority instance అంటే అది అంతరాయం కలిగ
ముందుగా సృష్టించిన [Azure ML వర్క్‌స్పేస్](https://ml.azure.com/)లో, compute కి వెళ్లండి మరియు మనం చర్చించిన వివిధ compute వనరులను చూడగలుగుతారు (అంటే compute instances, compute clusters, inference clusters మరియు attached compute). ఈ ప్రాజెక్ట్ కోసం, మోడల్ శిక్షణకు compute cluster అవసరం. స్టూడియోలో, "Compute" మెనూకి క్లిక్ చేయండి, తరువాత "Compute cluster" ట్యాబ్ మరియు "+ New" బటన్ క్లిక్ చేసి compute cluster సృష్టించండి.
![22](../../../../translated_images/te/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.png)
![22](../../../../translated_images/te/cluster-1.b78cb630bb543729.webp)
1. మీ ఎంపికలను ఎంచుకోండి: Dedicated vs Low priority, CPU లేదా GPU, VM పరిమాణం మరియు కోర్ సంఖ్య (ఈ ప్రాజెక్ట్ కోసం డిఫాల్ట్ సెట్టింగ్స్ ఉంచవచ్చు).
2. Next బటన్ క్లిక్ చేయండి.
![23](../../../../translated_images/te/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.png)
![23](../../../../translated_images/te/cluster-2.ea30cdbc9f926bb9.webp)
3. క్లస్టర్‌కు compute పేరు ఇవ్వండి
4. మీ ఎంపికలను ఎంచుకోండి: కనీస/గరిష్ట నోడ్స్ సంఖ్య, scale down కు ముందు idle సెకన్లు, SSH యాక్సెస్. కనీస నోడ్స్ సంఖ్య 0 అయితే, క్లస్టర్ idle ఉన్నప్పుడు మీరు డబ్బు ఆదా చేస్తారు. గరిష్ట నోడ్స్ సంఖ్య ఎక్కువగా ఉంటే శిక్షణ తక్కువ సమయం తీసుకుంటుంది. గరిష్ట నోడ్స్ సంఖ్య 3 సిఫార్సు చేయబడింది.
5. "Create" బటన్ క్లిక్ చేయండి. ఈ దశ కొంత సమయం తీసుకోవచ్చు.
![29](../../../../translated_images/te/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.png)
![29](../../../../translated_images/te/cluster-3.8a334bc070ec173a.webp)
అద్భుతం! ఇప్పుడు మనకు Compute cluster ఉంది, Azure ML Studioకి డేటాను లోడ్ చేయాలి.
@ -203,15 +203,15 @@ Low-priority instance అంటే అది అంతరాయం కలిగ
1. ముందుగా సృష్టించిన [Azure ML వర్క్‌స్పేస్](https://ml.azure.com/)లో, ఎడమ మెనూలో "Datasets" క్లిక్ చేసి "+ Create dataset" బటన్ క్లిక్ చేసి dataset సృష్టించండి. "From local files" ఎంపికను ఎంచుకుని ముందుగా డౌన్లోడ్ చేసిన Kaggle dataset ఎంచుకోండి.
![24](../../../../translated_images/te/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.png)
![24](../../../../translated_images/te/dataset-1.e86ab4e10907a6e9.webp)
2. మీ dataset కు పేరు, రకం మరియు వివరణ ఇవ్వండి. Next క్లిక్ చేయండి. ఫైళ్ల నుండి డేటాను అప్‌లోడ్ చేయండి. Next క్లిక్ చేయండి.
![25](../../../../translated_images/te/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.png)
![25](../../../../translated_images/te/dataset-2.f58de1c435d5bf9c.webp)
3. Schema లో, క్రింది ఫీచర్ల కోసం డేటా రకాన్ని Boolean గా మార్చండి: anaemia, diabetes, high blood pressure, sex, smoking, మరియు DEATH_EVENT. Next క్లిక్ చేసి Create క్లిక్ చేయండి.
![26](../../../../translated_images/te/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.png)
![26](../../../../translated_images/te/dataset-3.58db8c0eb783e892.webp)
చాలా బాగుంది! ఇప్పుడు dataset సెట్ అయింది మరియు compute cluster సృష్టించబడింది, మోడల్ శిక్షణ ప్రారంభించవచ్చు!
@ -222,19 +222,19 @@ Automated machine learning (AutoML) అనేది మెషీన్ లెర
1. ముందుగా సృష్టించిన [Azure ML వర్క్‌స్పేస్](https://ml.azure.com/)లో, ఎడమ మెనూలో "Automated ML" క్లిక్ చేసి మీరు అప్‌లోడ్ చేసిన dataset ఎంచుకోండి. Next క్లిక్ చేయండి.
![27](../../../../translated_images/te/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.png)
![27](../../../../translated_images/te/aml-1.67281a85d3a1e2f3.webp)
2. కొత్త ఎక్స్‌పెరిమెంట్ పేరు, లక్ష్య కాలమ్ (DEATH_EVENT) మరియు మనం సృష్టించిన compute cluster ఎంచుకోండి. Next క్లిక్ చేయండి.
![28](../../../../translated_images/te/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.png)
![28](../../../../translated_images/te/aml-2.c9fb9cffb39ccbbe.webp)
3. "Classification" ఎంచుకుని Finish క్లిక్ చేయండి. ఈ దశ compute cluster పరిమాణం ఆధారంగా 30 నిమిషాల నుండి 1 గంట వరకు పడవచ్చు.
![30](../../../../translated_images/te/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.png)
![30](../../../../translated_images/te/aml-3.a7952e4295f38cc6.webp)
4. రన్ పూర్తయిన తర్వాత, "Automated ML" ట్యాబ్ క్లిక్ చేసి మీ రన్ ఎంచుకోండి, "Best model summary" కార్డులో Algorithm క్లిక్ చేయండి.
![31](../../../../translated_images/te/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.png)
![31](../../../../translated_images/te/aml-4.7a627e09cb6f16d0.webp)
ఇక్కడ మీరు AutoML రూపొందించిన ఉత్తమ మోడల్ యొక్క వివరమైన వివరణ చూడవచ్చు. మీరు Models ట్యాబ్‌లో ఇతర మోడల్స్‌ను కూడా అన్వేషించవచ్చు. Explanations (preview button) లో మోడల్స్‌ను కొంత సమయం తీసుకుని పరిశీలించండి. మీరు ఉపయోగించదలచుకున్న మోడల్ ఎంచుకున్న తర్వాత (ఇక్కడ మనం AutoML ఎంచుకున్న ఉత్తమ మోడల్ తీసుకుంటాం), దాన్ని ఎలా డిప్లాయ్ చేయాలో చూద్దాం.
@ -245,15 +245,15 @@ Automated machine learning (AutoML) అనేది మెషీన్ లెర
ఉత్తమ మోడల్ వివరణలో, "Deploy" బటన్ క్లిక్ చేయండి.
![deploy-1](../../../../translated_images/te/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.png)
![deploy-1](../../../../translated_images/te/deploy-1.ddad725acadc84e3.webp)
15. దానికి పేరు, వివరణ, compute రకం (Azure Container Instance), authentication ఎనేబుల్ చేసి Deploy క్లిక్ చేయండి. ఈ దశ సుమారు 20 నిమిషాలు పడవచ్చు. డిప్లాయ్‌మెంట్ ప్రక్రియలో మోడల్ రిజిస్టర్ చేయడం, వనరులు సృష్టించడం మరియు వాటిని వెబ్ సర్వీస్ కోసం కాన్ఫిగర్ చేయడం ఉంటాయి. Deploy స్థితి క్రింద ఒక స్థితి సందేశం కనిపిస్తుంది. Deploy స్థితి "Healthy" అయినప్పుడు అది డిప్లాయ్ అయి నడుస్తోంది అని అర్థం.
![deploy-2](../../../../translated_images/te/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.png)
![deploy-2](../../../../translated_images/te/deploy-2.94dbb13f23908647.webp)
16. డిప్లాయ్ అయిన తర్వాత, Endpoint ట్యాబ్ క్లిక్ చేసి మీరు డిప్లాయ్ చేసిన ఎండ్‌పాయింట్ ఎంచుకోండి. ఇక్కడ ఎండ్‌పాయింట్ గురించి అవసరమైన అన్ని వివరాలు ఉంటాయి.
![deploy-3](../../../../translated_images/te/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.png)
![deploy-3](../../../../translated_images/te/deploy-3.fecefef070e8ef3b.webp)
అద్భుతం! ఇప్పుడు మోడల్ డిప్లాయ్ అయింది, ఎండ్‌పాయింట్ వినియోగం ప్రారంభించవచ్చు.
@ -263,7 +263,7 @@ Automated machine learning (AutoML) అనేది మెషీన్ లెర
ఈ స్క్రిప్ట్ మీ స్థానిక యంత్రం నుండి నేరుగా నడిపించవచ్చు మరియు మీ ఎండ్‌పాయింట్‌ను వినియోగిస్తుంది.
![35](../../../../translated_images/te/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.png)
![35](../../../../translated_images/te/consumption-1.700abd196452842a.webp)
ఈ 2 కోడ్ లైన్లను ఒకసారి పరిశీలించండి:

@ -48,7 +48,7 @@ SDK యొక్క ముఖ్యమైన ప్రాంతాలు:
[మునుపటి పాఠంలో](../18-Low-Code/README.md), మేము ఎలా మోడల్‌ను శిక్షణ, డిప్లాయ్ మరియు వినియోగించాలో చూశాము, అది Low code/No code విధానంలో జరిగింది. మేము హార్ట్ ఫెయిల్యూర్ డేటాసెట్ ఉపయోగించి హార్ట్ ఫెయిల్యూర్ ప్రిడిక్షన్ మోడల్‌ను సృష్టించాము. ఈ పాఠంలో, అదే పని Azure Machine Learning SDK ఉపయోగించి చేయబోతున్నాము.
![project-schema](../../../../translated_images/te/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.png)
![project-schema](../../../../translated_images/te/project-schema.420e56d495624541.webp)
### 1.2 హార్ట్ ఫెయిల్యూర్ ప్రిడిక్షన్ ప్రాజెక్ట్ మరియు డేటాసెట్ పరిచయం
@ -65,7 +65,7 @@ SDK యొక్క ముఖ్యమైన ప్రాంతాలు:
ముందుగా సృష్టించిన [Azure ML వర్క్‌స్పేస్](https://ml.azure.com/)లో, కంప్యూట్ మెనూకి వెళ్లండి, అక్కడ మీరు అందుబాటులో ఉన్న వివిధ కంప్యూట్ వనరులను చూడవచ్చు
![compute-instance-1](../../../../translated_images/te/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.png)
![compute-instance-1](../../../../translated_images/te/compute-instance-1.dba347cb199ca499.webp)
జూపిటర్ నోట్బుక్ ప్రావిజన్ చేయడానికి కంప్యూట్ ఇన్స్టాన్స్ సృష్టిద్దాం.
1. + New బటన్‌పై క్లిక్ చేయండి.
@ -88,10 +88,10 @@ SDK యొక్క ముఖ్యమైన ప్రాంతాలు:
1. Applications విభాగంలో, Jupyter ఎంపికపై క్లిక్ చేయండి.
2. "Yes, I understand" బాక్స్‌ను టిక్ చేసి Continue బటన్‌పై క్లిక్ చేయండి.
![notebook-1](../../../../translated_images/te/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.png)
![notebook-1](../../../../translated_images/te/notebook-1.12998af7b02c83f5.webp)
3. ఇది మీ జూపిటర్ నోట్బుక్ ఇన్స్టాన్స్‌తో కొత్త బ్రౌజర్ ట్యాబ్‌ను తెరుస్తుంది. నూతన నోట్బుక్ సృష్టించడానికి "New" బటన్‌పై క్లిక్ చేయండి.
![notebook-2](../../../../translated_images/te/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.png)
![notebook-2](../../../../translated_images/te/notebook-2.9a657c037e34f1cf.webp)
ఇప్పుడు మనకు నోట్బుక్ ఉన్నందున, Azure ML SDK తో మోడల్ శిక్షణ ప్రారంభించవచ్చు.

@ -1,12 +1,12 @@
# క్లౌడ్‌లో డేటా సైన్స్
![cloud-picture](../../../translated_images/te/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.jpg)
![cloud-picture](../../../translated_images/te/cloud-picture.f5526de3c6c6387b.webp)
> ఫోటో [Jelleke Vanooteghem](https://unsplash.com/@ilumire) నుండి [Unsplash](https://unsplash.com/s/photos/cloud?orientation=landscape)
బిగ్ డేటాతో డేటా సైన్స్ చేయడంలో, క్లౌడ్ ఒక గేమ్ చేంజర్ కావచ్చు. తదుపరి మూడు పాఠాలలో, క్లౌడ్ అంటే ఏమిటి మరియు అది ఎందుకు చాలా సహాయకరమో మనం చూడబోతున్నాము. మనం హార్ట్ ఫెయిల్యూర్ డేటాసెట్‌ను కూడా పరిశీలించి, ఎవరికైనా హార్ట్ ఫెయిల్యూర్ ఉండే అవకాశాన్ని అంచనా వేయడానికి ఒక మోడల్‌ను నిర్మించబోతున్నాము. మోడల్‌ను శిక్షణ ఇవ్వడం, డిప్లాయ్ చేయడం మరియు రెండు వేర్వేరు మార్గాల్లో వినియోగించడం కోసం క్లౌడ్ శక్తిని ఉపయోగిస్తాము. ఒక మార్గం లో కోడ్/నో కోడ్ ఫ్యాషన్‌లో కేవలం యూజర్ ఇంటర్‌ఫేస్ ఉపయోగించడం, మరొక మార్గం Azure మెషీన్ లెర్నింగ్ సాఫ్ట్‌వేర్ డెవలపర్ కిట్ (Azure ML SDK) ఉపయోగించడం.
![project-schema](../../../translated_images/te/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.png)
![project-schema](../../../translated_images/te/project-schema.420e56d495624541.webp)
### విషయాలు

@ -31,7 +31,7 @@ AI ప్రజాస్వామ్యీకరణకు కృతజ్ఞత
* [Data Science in Healthcare](https://data-flair.training/blogs/data-science-in-healthcare/) - వైద్య ఇమేజింగ్ (ఉదా: MRI, X-Ray, CT-స్కాన్), జెనోమిక్స్ (DNA సీక్వెన్సింగ్), ఔషధ అభివృద్ధి (ప్రమాద అంచనా, విజయ అంచనా), పూర్వానుమాన విశ్లేషణ (రోగి సంరక్షణ & సరఫరా లాజిస్టిక్స్), వ్యాధి ట్రాకింగ్ & నివారణ వంటి అనువర్తనాలను హైలైట్ చేస్తుంది.
![Data Science Applications in The Real World](../../../../translated_images/te/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.png) చిత్రం క్రెడిట్: [Data Flair: 6 అద్భుతమైన డేటా సైన్స్ అనువర్తనాలు](https://data-flair.training/blogs/data-science-applications/)
![Data Science Applications in The Real World](../../../../translated_images/te/data-science-applications.4e5019cd8790ebac.webp) చిత్రం క్రెడిట్: [Data Flair: 6 అద్భుతమైన డేటా సైన్స్ అనువర్తనాలు](https://data-flair.training/blogs/data-science-applications/)
ఈ చిత్రం ఇతర డొమైన్‌లు మరియు డేటా సైన్స్ సాంకేతికతలను అన్వయించడానికి ఉదాహరణలను చూపిస్తుంది. ఇతర అనువర్తనాలను అన్వేషించాలనుకుంటున్నారా? క్రింద [సమీక్ష & స్వీయ అధ్యయనం](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) విభాగాన్ని చూడండి.

@ -13,7 +13,7 @@ Explorer ఇంటర్‌ఫేస్ (క్రింద స్క్రీ
2. డేటాసెట్ [క్యాటలాగ్](https://planetarycomputer.microsoft.com/catalog) అన్వేషించండి - ప్రతి డేటాసెట్ యొక్క ఉద్దేశ్యాన్ని తెలుసుకోండి.
3. Explorer ఉపయోగించండి - ఆసక్తికరమైన డేటాసెట్ ఎంచుకోండి, సంబంధిత క్వెరీ & రేండరింగ్ ఆప్షన్ ఎంచుకోండి.
![The Planetary Computer Explorer](../../../../translated_images/te/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.png)
![The Planetary Computer Explorer](../../../../translated_images/te/planetary-computer-explorer.c1e95a9b053167d6.webp)
`మీ పని:`
ఇప్పుడు బ్రౌజర్‌లో రేండర్ అయిన విజువలైజేషన్‌ను అధ్యయనం చేసి క్రింది ప్రశ్నలకు సమాధానం ఇవ్వండి:

@ -1,204 +1,216 @@
# డేటా సైన్స్ ఫర్ బేగిన్నర్స్ - ఒక పాఠ్యక్రమం
# కొత్తవారికి డేటా సైన్స్ - ఒక పాఠ్యక్రమం
[![GitHub Codespacesలో తెరవండి](https://github.com/codespaces/badge.svg)](https://github.com/codespaces/new?hide_repo_select=true&ref=main&repo=344191198)
[![GitHub లైసెన్స్](https://img.shields.io/github/license/microsoft/Data-Science-For-Beginners.svg)](https://github.com/microsoft/Data-Science-For-Beginners/blob/master/LICENSE)
[![GitHub కంట్రీబ్యూటర్లు](https://img.shields.io/github/contributors/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/graphs/contributors/)
[![GitHub సమస్యలు](https://img.shields.io/github/issues/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/issues/)
[![GitHub సహకారులు](https://img.shields.io/github/contributors/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/graphs/contributors/)
[![GitHub ఇష్యూస్](https://img.shields.io/github/issues/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/issues/)
[![GitHub పుల్-రిక్వెస్టులు](https://img.shields.io/github/issues-pr/microsoft/Data-Science-For-Beginners.svg)](https://GitHub.com/microsoft/Data-Science-For-Beginners/pulls/)
[![PRs స్వాగతం](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com)
[![పుల్-రిక్వెస్టులు స్వాగతం](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com)
[![GitHub వీక్షకులు](https://img.shields.io/github/watchers/microsoft/Data-Science-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/Data-Science-For-Beginners/watchers/)
[![GitHub ఫోర్క్](https://img.shields.io/github/forks/microsoft/Data-Science-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/Data-Science-For-Beginners/network/)
[![GitHub స్టార్‌లు](https://img.shields.io/github/stars/microsoft/Data-Science-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/Data-Science-For-Beginners/stargazers/)
[![GitHub వాచర్స్](https://img.shields.io/github/watchers/microsoft/Data-Science-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/Data-Science-For-Beginners/watchers/)
[![GitHub ఫోర్క్స్](https://img.shields.io/github/forks/microsoft/Data-Science-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/Data-Science-For-Beginners/network/)
[![GitHub స్టార్స్](https://img.shields.io/github/stars/microsoft/Data-Science-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/Data-Science-For-Beginners/stargazers/)
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum)
మైక్రోసాఫ్ట్ లో Azure క్లౌడ్ అడ్వకేట్స్ డేటా సైన్స్ పై 10 వారాలు, 20 పాఠాలను కలిగిన పూర్తి పాఠ్యక్రమాన్ని అందించడం ఆనందంగా ఉంది. ప్రతి పాఠం పూర్వ పాఠం మరియు పశ్చాత్పాఠం క్విజిలను, పాఠాన్ని పూర్తి చేయటానికి రాయబడిన సూచనలను, ఒక పరిష్కారాన్ని మరియు అసైన్‌మెంట్‌ను కలిగి ఉంటుంది. మా ప్రాజెక్ట్ ఆధారిత పాఠశాల పద్ధతి మీరు నేర్పుకునే సమయానికి నిర్మించడానికి అనుమతిస్తుంది, ఇది కొత్త నైపుణ్యాలు మగ్గించడానికి పరీక్షించిన మార్గం.
మైక్రోసాఫ్ట్‌లో Azure క్లౌడ్ అడ్వోకేట్స్ డాటా సైన్స్ గురించి 10 వారాల, 20 పాఠాల పూర్తి పాఠ్యక్రమాన్ని అందించడంలో సంతోషిస్తున్నాము. ప్రతి పాఠం ముందు మరియు తర్వాత క్విజ్‌లు, పాఠం పూర్తి చేయడానికి రాత సూచనలు, ఒక సమాధానం మరియు అసైన్మెంట్‌ను కలిగి ఉంటుంది. మా ప్రాజెక్ట్-ఆధారిత విద్యా విధానం మీరు నేర్చుకోవడానికి తోడ్పడుతుంది, అది కొత్త నైపుణ్యాలు 'జరిగే' పద్ధతి.
**మన రచయితలకు హృదయపూర్వక ధన్యవాదాలు:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer).
**మా రచయితలకు హృదయపూర్వక కృతజ్ఞతలు:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer).
**🙏 ప్రత్యేక ధన్యవాదాలు 🙏 మా [Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) రచయితలు, సమీక్షకులు మరియు కంటెంట్ కంట్రీబ్యూటర్లకు,** ముఖ్యంగా Aaryan Arora, [Aditya Garg](https://github.com/AdityaGarg00), [Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/), [Ankita Singh](https://www.linkedin.com/in/ankitasingh007), [Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/), [Arpita Das](https://www.linkedin.com/in/arpitadas01/), ChhailBihari Dubey, [Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor), [Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [Majd Safi](https://www.linkedin.com/in/majd-s/), [Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/), [Miguel Correa](https://www.linkedin.com/in/miguelmque/), [Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119), [Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum), [Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/), [Rohit Yadav](https://www.linkedin.com/in/rty2423), Samridhi Sharma, [Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200),
**🙏 మన [Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) రచయితలు, సమీక్షకులు మరియు కంటెంట్ సహకారులకు ప్రత్యేక ధన్యవాదాలు 🙏,** ముఖ్యంగా Aaryan Arora, [Aditya Garg](https://github.com/AdityaGarg00), [Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/), [Ankita Singh](https://www.linkedin.com/in/ankitasingh007), [Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/), [Arpita Das](https://www.linkedin.com/in/arpitadas01/), ChhailBihari Dubey, [Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor), [Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [Majd Safi](https://www.linkedin.com/in/majd-s/), [Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/), [Miguel Correa](https://www.linkedin.com/in/miguelmque/), [Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119), [Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum), [Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/), [Rohit Yadav](https://www.linkedin.com/in/rty2423), Samridhi Sharma, [Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200),
[Sheena Narula](https://www.linkedin.com/in/sheena-narua-n/), [Tauqeer Ahmad](https://www.linkedin.com/in/tauqeerahmad5201/), Yogendrasingh Pawar , [Vidushi Gupta](https://www.linkedin.com/in/vidushi-gupta07/), [Jasleen Sondhi](https://www.linkedin.com/in/jasleen-sondhi/)
|![@sketchthedocs https://sketchthedocs.dev ద్వారా స్కెచ్‌నోట్](../../translated_images/te/00-Title.8af36cd35da1ac55.webp)|
|![@sketchthedocs గీయడం https://sketchthedocs.dev](../../translated_images/te/00-Title.8af36cd35da1ac55.webp)|
|:---:|
| డేటా సైన్స్ ఫర్ బేగిన్నర్స్ - _@nitya ద్వారా స్కెచ్‌నోట్_ |
| కొత్తవారికి డేటా సైన్స్ - _గీయడం [@nitya](https://twitter.com/nitya) ద్వారా_ |
### 🌐 బహుభాషా మద్దతు
### 🌐 బహుళ భాషా మద్ధతు
#### GitHub యాక్షన్ ద్వారా మద్దతు (ఆటోమేటెడ్ & ఎప్పుడూ తాజా)
#### GitHub చర్య ద్వారా మద్దతు (ఆటోమేటెడ్ & ఎప్పుడూ నవీకరించబడిన)
<!-- CO-OP TRANSLATOR LANGUAGES TABLE START -->
[Arabic](../ar/README.md) | [Bengali](../bn/README.md) | [Bulgarian](../bg/README.md) | [Burmese (Myanmar)](../my/README.md) | [Chinese (Simplified)](../zh-CN/README.md) | [Chinese (Traditional, Hong Kong)](../zh-HK/README.md) | [Chinese (Traditional, Macau)](../zh-MO/README.md) | [Chinese (Traditional, Taiwan)](../zh-TW/README.md) | [Croatian](../hr/README.md) | [Czech](../cs/README.md) | [Danish](../da/README.md) | [Dutch](../nl/README.md) | [Estonian](../et/README.md) | [Finnish](../fi/README.md) | [French](../fr/README.md) | [German](../de/README.md) | [Greek](../el/README.md) | [Hebrew](../he/README.md) | [Hindi](../hi/README.md) | [Hungarian](../hu/README.md) | [Indonesian](../id/README.md) | [Italian](../it/README.md) | [Japanese](../ja/README.md) | [Kannada](../kn/README.md) | [Korean](../ko/README.md) | [Lithuanian](../lt/README.md) | [Malay](../ms/README.md) | [Malayalam](../ml/README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Nigerian Pidgin](../pcm/README.md) | [Norwegian](../no/README.md) | [Persian (Farsi)](../fa/README.md) | [Polish](../pl/README.md) | [Portuguese (Brazil)](../pt-BR/README.md) | [Portuguese (Portugal)](../pt-PT/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Romanian](../ro/README.md) | [Russian](../ru/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Slovak](../sk/README.md) | [Slovenian](../sl/README.md) | [Spanish](../es/README.md) | [Swahili](../sw/README.md) | [Swedish](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tamil](../ta/README.md) | [Telugu](./README.md) | [Thai](../th/README.md) | [Turkish](../tr/README.md) | [Ukrainian](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamese](../vi/README.md)
> **స్థానికంగా క్లోన్ చేయాలనుకుంటున్నారా?**
> ఈ రిపాజిటరీ 50+ భాషా అనువాదాలను కలిగి ఉంటుంది, ఇది డౌన్‌లోడ్ పరిమాణాన్ని గణనీయంగా పెంచుతుంది. అనువాదాలు లేకుండా క్లోన్ చేయడానికి, స్పార్స్ చెకౌట్ ఉపయోగించండి:
> **స్థానికంగా క్లోన్ చేయాలని ఇష్టపడుతున్నారా?**
>
> ఈ రెపోజిటరీలో 50+ భాషా అనువాదాలు ఉన్నాయి, ఇవి డౌన్లోడ్ పరిమాణాన్ని గణనీయంగా పెంచుతాయి. అనువాదాలు లేకుండా క్లోన్ చేయడానికి sparse checkout ఉపయోగించండి:
>
> **Bash / macOS / Linux:**
> ```bash
> git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
> cd Data-Science-For-Beginners
> git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'
> ```
> ఇది మీరు కోర్సును పూర్తి చేయడానికి అవసరమైన అన్ని విషయాలను చాలా వేగంగా డౌన్‌లోడ్ చేస్తుంది.
>
> **CMD (Windows):**
> ```cmd
> git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
> cd Data-Science-For-Beginners
> git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"
> ```
>
> కోర్సు పూర్తి చేయడానికి మీకు కావలసిన మొత్తం ఇది, మరి వేగంగా డౌన్లోడ్ అవుతుంది.
<!-- CO-OP TRANSLATOR LANGUAGES TABLE END -->
**అదనపు అనువాద భాషల మద్దతు కావాలంటే [ఇక్కడ](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md) జాబితా చేయబడ్డాయి**
**మీకు అదనపు అనువాద భాషల మద్దతు కావాలంటే వాటిని ఇక్కడ చూడండి [ఇక్కడ](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md)**
#### మన కమ్యూనిటీలో చేరండి
#### మన సంఘంలో చేరండి
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
మా వద్ద Discordలో AIతో నేర్చుకునే సిరీస్ ఉంటుంది, దీన్ని మరింత తెలుసుకోండి మరియు [Learn with AI Series](https://aka.ms/learnwithai/discord) లో 18 - 30 సెప్టెంబర్, 2025 సమయాల్లో చేరండి. మీరు GitHub Copilot ఉపయోగించడం కోసం చిట్కాలు మరియు మార్గదర్శకాలను పొందుతారు.
నం Discordలో AI తో నేర్చుకునే సిరీస్ నిర్వహిస్తున్నాము, మరింత తెలుసుకోండి మరియు 2025 సెప్టెంబర్ 18 - 30 తేదీల మధ్య [Learn with AI Series](https://aka.ms/learnwithai/discord) లో చేరండి. మీరు GitHub Copilot ను డేటా సైన్స్ కోసం ఉపయోగించే చిట్కాలు మరియు టిప్స్ పొందగలుగుతారు.
![AIతో నేర్చుకోండి సిరీస్](../../translated_images/te/1.2b28cdc6205e26fe.webp)
![Learn with AI series](../../translated_images/te/1.2b28cdc6205e26fe.webp)
# మీరు విద్యార్థి అయితే?
# మీరు విద్యార్థి కాబోయేరు?
ింది వనరులతో మొదలవ్వండి:
్రింది వనరులతో ప్రారంభించండి:
- [స్టూడెంట్ హబ్ పేజీ](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) ఈ పేజీలో మీరు ప్రారంభ దశలో ఉపయోగపడే వనరులు, స్టూడెంట్ ప్యాక్స్ మరియు ఉచిత సర్టిఫికెట్ వోచర్ అందుకునే మార్గాలు కనుగొంటారు. ఇది మీకు ఒక బుక్‌మార్క్ చేయదగిన పేజీ, మరియు కంటెంట్ మద్య మద్య మార్చుకుంటే, మీరు తరచూ తనిఖీ చేయాలి.
- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) గ్లోబల్ విద్యార్థి రూపొందింపబడ్డ కమ్యూనిటీలో చేరండి, ఇది మైక్రోసాఫ్ట్ లో చేరే మీ మార్గం కావచ్చు.
- [Student Hub పేజీ](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) ఈ పేజీలో మీరు ప్రాథమిక వనరులు, విద్యార్థి ప్యాక్స్ మరియు ఫ్రీ సర్టిఫికెట్ వౌచర్ పొందడానికి మార్గాలను కనుగొంటారు. ఇది ఒక పేజీ మీరు బుక్‌మార్క్ చేసి తరచుగా చెక్ చేసుకోవాలి ఎందుకంటే మనం కంటెంట్ మాసానికి కనీసం ఒకసారి మార్చుతూ ఉంటాము.
- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) ఒక గ్లోబల్ విద్యార్థి అంబాసిడార్ సంఘంలో చేరండి, ఇది మీకు మైక్రోసాఫ్ట్‌లో అడుగు పెట్టే మార్గం కావచ్చు.
# ప్రారంభం
# ప్రారంభిచడమే
## 📚 డాక్యుమెంటేషన్
- **[ఇన్‌స్టాలేషన్ గైడ్](INSTALLATION.md)** - ప్రారంభదశల వారికి ఎలాంటి సౌకర్యాలతో స్థాపన సూచనలు
- **[ఉపయోగ గైడ్](USAGE.md)** - ఉదాహరణలు మరియు సాధారణ వర్క్‌ఫ్లోస్
- **[ట్రబుల్‌షూటింగ్](TROUBLESHOOTING.md)** - సామాన్య సమస్యలకు పరిష్కారాలు
- **[ంట్రీబ్యూటింగ్ గైడ్](CONTRIBUTING.md)** - ప్రాజెక్టుకు ఎలా కంట్రీబ్యూట్ ేయాలి
- **[గురువులకు](for-teachers.md)** - బోధనా సూచనాలు మరియు తరగతి వనరులు
- **[ఇన్‌స్టాలేషన్ గైడ్](INSTALLATION.md)** - కొత్తవారికి దశలవారీ సెటప్ సూచనలు
- **[వినియోగ గైడ్](USAGE.md)** - ఉదాహరణలూ సాధారణ వర్క్‌ఫ్లోలు
- **[పరిష్కార మార్గాలు](TROUBLESHOOTING.md)** - సాధారణ సమస్యలకు పరిష్కారాలు
- **[ాంట్రిబ్యూటింగ్ గైడ్](CONTRIBUTING.md)** - ప్రాజెక్టుకు ఎలా సహరించాలి
- **[ఉపాధ్యాయులకు](for-teachers.md)** - బోధన మార్గదర్శకాలు మరియు క్లాస్‌రిం వనరులు
## 👨‍🎓 విద్యార్థులకు
> **పూర్తి కొత్తవారికి**: డేటా సైన్స్ కొత్తగా ఉంటే, మా [బేగిన్నర్-ఫ్రెండ్లీ ఉదాహరణలు](examples/README.md) తో ప్రారంభించండి! ఈ సరళమైన మరియు బాగా వ్యాఖ్యానించిన ఉదాహరణలు మిమ్మల్ని పాఠ్యక్రమం పూర్తి మునిగిపోవడానికి ముందు ప్రాథమికాలు అర్థం చేసుకోవచ్చు.
> **[విద్యార్థులు](https://aka.ms/student-page)**: ఈ పాఠ్యక్రమాన్ని మీ స్వంతంగా ఉపయోగించాలంటే, మొత్తం రీపోను ఫోర్క్ చేసి ముందుగా యుక్తి-పరీక్షతో మొదలుపెట్టి, తర్వాత పాఠం చదివి మరింత కార్యకలాపాలు పూర్తిచేయండి. పరిష్కార కోడ్ కాపీ చేయడం కాకుండా పాఠాలను అర్థం చేసుకుని ప్రాజెక్టులు రూపొందించడానికి ప్రయత్నించండి; అయినప్పటికీ, ఆ కోడ్ /solutions ఫోల్డర్లలో అందుబాటులో ఉంటుంది. మరో యోచన, మిత్రులతో ఒక అధ్యయన సమూహం ఏర్పాటు చేసి కలసి విషయం చదవడం. మరింత అధ్యయనానికి, మేము [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum) ని సూచిస్తాము.
> **కలుపు గల కొత్తవారికి**: డేటా సైన్స్‌లో కొత్తవారా? మన [అరలి అనుకూల ఉదాహరణలు](examples/README.md) తో ప్రారంభించండి! ఈ సులభ గమనించే ఉదాహరణలు మీరు పాఠ్యక్రమం మొత్తం లోతుగా చేరడానికి ముందే మూలాంశాలను అర్థం చేసుకోవడంలో సహాయపడతాయి.
> **[విద్యార్థులు](https://aka.ms/student-page)**: ఈ పాఠ్యక్రమాన్ని స్వయంగా ఉపయోగించేందుకు, మొత్తం రెపోజిటరీని ఫోర్క్ చేసుకుని వ్యాయామాలు పూర్తిచేయండి, ప్రీ-లెక్చర్ క్విజ్ తో ప్రారంభించి తరువాత పాఠాలు చదివి మిగిలిన కార్యకలాపాలను పూర్తిచేయండి. పరిష్కార కోడ్‌ను కాపీ చేయడం కంటే పాఠాలను అర్థం చేసుకోవడమే ప్రాజెక్టులను సృష్టించడానికి ప్రయత్నించండి; ఆ కోడ్ ప్రాజెక్ట్-కేంద్రిత పాఠాల్లో /solutions ఫోల్డర్లలో అందుబాటులో ఉంటుంది. మరో ఆలోచన మీరు స్నేహితులతో అధ్యయన గ్రూప్ ఏర్పాటు చేసి కంటెంట్ కలిసి చూడడం. మరింత అధ్యయనానికి [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum) ని మనస్పూర్తిగా సిఫార్సు చేస్తున్నాము.
**త్వరిత ప్రారంభం:**
1. మీ పరిసరాలను సెటప్ చేసేందుకు [ఇన్‌స్టాలేషన్ గైడ్](INSTALLATION.md) ను తనిఖీ చేయండి
2. పాఠ్యక్రమంతో ఎలా పని చేయాలో తెలుసుకోడానికి [ఉపయోగ గైడ్](USAGE.md) ను సమీక్షించండి
3. పాఠం 1 నుండి ప్రారంభించి సీక్వెన్షియల్ గా పని చేయండి
4. మద్దతు కోసం మా [Discord కమ్యూనిటీ](https://aka.ms/ds4beginners/discord) లో చేరండి
**తక్షణ ప్రారంభం:**
1. మీ పరిసర వాతావరణాన్ని సెటప్ చేసేందుకు [ఇన్‌స్టాలేషన్ గైడ్](INSTALLATION.md) ని చూడండి
2. పాఠ్యక్రమంతో ఎలా పని చేయాలో తెలుసుకోవడానికి [వినియోగ గైడ్](USAGE.md) ని సమీక్షించండి
3. పాఠం 1 తో మొదలుపెట్టి వరుసగా పూర్తి చేయండి
4. మద్ధతు కోసం మన [Discord కమ్యూనిటీ](https://aka.ms/ds4beginners/discord) లో చేరండి
## 👩‍🏫 గురువులకు
## 👩‍🏫 ఉపాధ్యాయులకు
> **ఉపాధ్యాయులు**: ఈ పాఠ్యాంశాన్ని ఎలా ఉపయోగించాలో కొన్ని సూచనలను మేము [జోడించాము](for-teachers.md). మీ అభిప్రాయాలను [మా చర్చా మંચంలో](https://github.com/microsoft/Data-Science-For-Beginners/discussions) తెలపండి!
> **గురువులు**: ఈ పాఠ్యక్రమాన్ని ఎలా ఉపయోగించాలో [చిన్న సూచనలు](for-teachers.md) మేము చేర్చాము. మా [చర్చ ఫోరంలో](https://github.com/microsoft/Data-Science-For-Beginners/discussions) మీ అభిప్రాయాలు తెలపండి!
## బృందాన్ని కలవండి
## టీమ్‌ను కలుసుకోండి
[![ప్రోమో వీడియో](../../ds-for-beginners.gif)](https://youtu.be/8mzavjQSMM4 "ప్రోమో వీడియో")
[![ప్రచార వీడియో](../../ds-for-beginners.gif)](https://youtu.be/8mzavjQSMM4 "ప్రచార వీడియో")
**గిఫ్** [మోహిత్ జాయిసల్](https://www.linkedin.com/in/mohitjaisal)
**గిఫ్ చేసిన వ్యక్తి** [మోహిత్ జైసల్](https://www.linkedin.com/in/mohitjaisal)
> 🎥 ప్రాజెక్ట్ గురించి మరియు దాన్ని సృష్టించిన వారిపై వీడియో కోసం పై చిత్రాన్ని క్లిక్ చేయండి!
> 🎥 ప్రాజెక్ట్ గురించి మరియు దాన్ని సృష్టించిన వారిని గురించి వీడియో కోసం పై చిత్రాన్ని క్లిక్ చేయండి!
## పాఠశాస్త్రశాస్త్రం
## పాఠ్యశాస్త్ర నిబంధనలు
ఈ పాఠ్యक्रमాన్ని రూపొందించే సమయంలో మేము రెండు పాఠశాస్త్ర ప్రిన్సిపళ్లు ఎంచుకున్నాం: ప్రాజెక్ట్ ఆధారితంగా ఉండటం మరియు తరచూ క్విజ్లు ఉండటం. ఈ సిరీస్ చివరికి, విద్యార్థులు డేటా సైన్స్ యొక్క ప్రాథమిక సూత్రాలు నేర్చుకుంటారు, ఇందులో నైతిక సూత్రాలు, డేటా సిద్ధత, డేటాతో పని చేసే వివిధ విధానాలు, డేటా విజువలైజేషన్, డేటా విశ్లేషణ, డేటా సైన్స్ యొక్క వాస్తవ ప్రపంచ ఉపయోగాల గురించి కూడా ఉంటుంది.
ఈ పాఠ్యాంశాన్ని రూపొందించడం వలన మేము రెండు పాఠ్యశాస్త్ర సిద్ధాంతాలను ఎంచుకున్నాము: అది ప్రాజెక్ట్ ఆధారితంగా ఉండాలని మరియు తరచూ క్విజ్‌లను కలిగించడం. ఈ సిరీస్ ముగింపులో, విద్యార్థులు డేటా సైన్స్ యొక్క ప్రాథమిక సూత్రాలను తెలుసుకుంటారు, వాటిలో నైతిక అంశాలు, డేటా ప్రిపరేషన్, డేటాతో పని చేసే వివిధ మార్గాలు, డేటా విజువలైజేషన్, డేటా విశ్లేషణ, డేటా సైన్స్ యొక్క నిజజీవిత ఉపయోగాలు మరియు మరిన్ని ఉన్నాయి.
ంతేకాక, తరగతి ముందు ఒక తక్కువ-జోరు క్విజ్ విద్యార్థి ఒక విషయం నేర్చుకోవాలని ఉద్దేశ్యాన్ని సృష్టిస్తుంది, మరియు తరగతి తర్వాత రెండో క్విజ్ మరింత ఉండు సంపాదనను నిర్ధారిస్తుంది. ఈ పాఠ్యక్రమం సులభంగా మరియు సరదాగా ఉండేటట్లు రూపొందించబడింది మరియు మొత్తం గా లేదా భాగంగా తీసుకోవచ్చు. ప్రాజెక్టులు చిన్నగా మొదలవుతాయి మరియు 10 వారాల చక్రం చివరికి progressively క్లిష్టత ఎక్కువ అవుతుంది.
దనంగా, తరగతి ముందు తక్కువ పెట్టుబడి ఉన్న క్విజ్ విద్యార్థి నేర్చుకోవడంపై పట్టుదల సృష్టిస్తుంది, తరగతి తర్వాత రెండవ క్విజ్ జ్ఞాపకాన్ని మరింత పెంచుతుంది. ఈ పాఠ్యాంశం సడలింపు మరియు సరదాగా ఉండే విధంగా రూపొందించింది మరియు మొత్తంగా లేదా భాగంగా తీసుకోవచ్చు. ప్రాజెక్టులు చిన్నగా ప్రారంభమయ్యి 10 వారాల చక్రం ముగింపు వ‌ర‌కు సుదీర్ఘంగా క్లిష్టమవుతాయి.
> మా [పని నిబంధనలు](CODE_OF_CONDUCT.md), [కాంట్రిబ్యూటింగ్](CONTRIBUTING.md), [భాషాంతరాలు](TRANSLATIONS.md) మార్గదర్శకాలను చూడండి. మీ సానుకూలమైన అభిప్రాయాన్ని స్వాగతిస్తున్నాము!
> మా [ఆచరణా నియమాలు](CODE_OF_CONDUCT.md), [కాంట్రిబ్యూటింగ్](CONTRIBUTING.md), [অনువাদ](TRANSLATIONS.md) మార్గదర్శకాలను చూడండి. మీ నిర్మాణాత్మక అభిప్రాయాలను స్వాగతిస్తున్నాము!
## ప్రతి పాఠం లో సగము:
## ప్రతి పాఠం లో ఉంటుంది:
- ఐచ్ఛిక స్కెట్ట్నోట్
- ఐచ్ఛిక అనుబంధ వీడియో
- ఐచ్ఛిక స్కెచ్‌నోట్
- ఐచ్ఛిక అు వీడియో
- పాఠం ముందు వార్మప్ క్విజ్
- రచించిన పాఠం
- ప్రాజెక్ట్ ఆధారిత పాఠాల కోసం ప్రాజెక్ట్ నిర్మాణం పై స్టెప్-బై-స్టెప్ గైడ్‌లు
- వ్రాత పాఠం
- ప్రాజెక్ట్ ఆధారిత పాఠాల కోసం, ప్రాజెక్టును నిర్మించేందుకు దశల వారీ మార్గదర్శకాలు
- జ్ఞాన తనిఖీలు
- ఒక ఛాలెంజ్
- అనుబంధ స్పందన
- ఒక సవాలు
- అదనపు రీడింగ్
- అసైన్‌మెంట్
- [పాఠం తరువాతి క్విజ్](https://ff-quizzes.netlify.app/en/)
- [పాఠం తర్వాత క్విజ్](https://ff-quizzes.netlify.app/en/)
> **క్విజ్ల గురించి ఒక గమనిక**: అన్ని క్విజ్లు Quiz-App ఫోల్డర్‌లో ఉంటాయి, మొత్తం 40 క్విజ్లు, ఒక్కో క్విజ్ మూడు ప్రశ్నలతో ఉంటాయి. ఇవి పాఠాల నుంచి లింక్ చేయబడ్డాయి, కానీ క్విజ్ యాప్ ని స్థానికంగా అమలు చేయవచ్చు లేదా Azureకి పంపవచ్చు; దీని కోసం `quiz-app` ఫోల్డర్‌లో ఉన్న సూచనలను అనుసరించండి. అవి క్రమంగా స్థానికీకరించబడుతున్నాయి.
> **క్విజ్‌ల గురించి ఒక నోటు**: మొత్తం 40 క్విజ్‌లు, ఒక్కో క్విజ్ మూడు ప్రశ్నలతో, Quiz-App ఫోల్డర్లో ఉన్నాయి. ఈ క్విజ్‌లు పాఠాల నుండి లింక్ చేయబడ్డాయి, కానీ క్విజ్ యాప్‌ను స్థానికంగా నడపవచ్చు లేదా Azureలో నిర్వ‌హించవచ్చు; `quiz-app` ఫోల్డర్లో సూచనలను అనుసరించండి. అవి నెమ్మదిగా స్థానికీకృతమవుతున్నాయి.
## 🎓 ప్రారంభానికి అనుకూలమైన ఉదాహరణలు
## 🎓 ప్రారంభ కారులకు స్నేహపూర్వక ఉదాహరణలు
**డేటా సైన్స్ కొత్తవాడా?** మీకు సహాయం చేయడానికి, మేము ప్రత్యేక [ఉదాహరణల డైరెక్టరీ](examples/README.md) రూపొందించాము, సులభమైన, మెరుగ్గా వ్యాఖ్యానించబడిన కోడ్‌తో:
**డేటా సైన్స్ కొత్తవారా?** మేము ప్రారంభించడానికి సహాయపడే సరళమైన, బాగా వ్యాఖ్యానించిన కోడ్ కలిగిన ప్రత్యేక [ఉదాహరణల డైరెక్టరీ](examples/README.md)ను సృష్టించాము:
- 🌟 **హలో వరల్డ్** - మీ మొదటి డేటా సైన్స్ ప్రోగ్రామ్
- 📂 **డేటా లోడ్ చేయడం** - డేటాసెట్‌లు చదవడం మరియు అన్వేషించడం నేర్చుకోండి
- 📊 **ులభ విశ్లేషణ** - గణాంకాలు లెక్కించడం మరియు నమూనాలను కనుగొనడం
- 🌟 **హలో వరల్డ్** - మీ మొదటి డేటా సైన్స్ ప్రోగ్రా
- 📂 **డేటా లోడింగ్** - డేటాసెట్‌లు చదివి అన్వేషించడం నేర్చుకోండి
- 📊 **ాధారణ విశ్లేషణ** - గణాంకాలు లెక్కించండి మరియు నమూనాలను కనుగొనండి
- 📈 **ప్రాథమిక విజువలైజేషన్** - చార్ట్లు మరియు గ్రాఫ్‌లు సృష్టించండి
- 🔬 **వాస్తవ ప్రాజెక్ట్** - ప్రారంభం నుండి ముగింపు వరకు పూర్తి వర్క్‌ఫ్లో
- 🔬 **నిజమైన ప్రపంచ ప్రాజెక్టు** - ప్రారంభం నుండి పూర్తిఅవ్వడం వరకు వర్క్‌ఫ్లో
ప్రతి ఉదాహరణలో ప్రతి దశను వివరిస్తూ సవివర వ్యాఖ్యలు ఉంటాయి, ఇది పూర్తిగా ప్రారంభకులు కోసం అనుకూలం!
ప్రతి ఉదాహరణలో ప్రతి దశను వివరిస్తున్న విపులమైన వ్యాఖ్యలు ఉంటాయి, అది పూర్తిగా కొత్తవారికి అనువుగా ఉంటుంది!
👉 **[ఉదాహరణలతో మొదలుకోండి](examples/README.md)** 👈
👉 **[ఉదాహరణలతో ప్రారంభించండి](examples/README.md)** 👈
## పాఠాలు
|![ @sketchthedocs యొక్క స్కెట్ట్నోట్ https://sketchthedocs.dev](../../translated_images/te/00-Roadmap.4905d6567dff4753.webp)|
|![sketchnote by @sketchthedocs https://sketchthedocs.dev](../../translated_images/te/00-Roadmap.4905d6567dff4753.webp)|
|:---:|
| డేటా సైన్స్ ఫర్ బిగినర్స్: రోడ్‌మాప్ - _స్కెట్ట్నోట్: [@nitya](https://twitter.com/nitya)_ |
| డేటా సైన్స్ ఫర్ బిగినర్స్: రోడ్‌మాప్ - _స్కెచ్నోట్ చేసిన వారు [@nitya](https://twitter.com/nitya)_ |
| పాఠ సంఖ్య | విషయం | పాఠ గ్రూపింగ్ | నేర్చుకోవడం లక్ష్యాలు | లింక్ చేయబడిన పాఠం | రచయిత |
| పాఠ సంఖ్య | విషయం | పాఠం గుంపు | నేర్చుకోవాల్సిన లక్ష్యాలు | లింక్ చేయబడిన పాఠం | రచయిత |
| :-----------: | :----------------------------------------: | :--------------------------------------------------: | :-----------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :---------------------------------------------------------------------: | :----: |
| 01 | డేటా సైన్స్ నిర్వచనం | [పరిచయము](1-Introduction/README.md) | డేటా సైన్స్ వెనుక ప్రాథమిక సూత్రాలు మరియు ఇ౦టెలిజెన్స్, మెషీన్ లెర్నింగ్, బిగ్ డేటాతో సంబంధం నేర్చుకోండి. | [పాఠం](1-Introduction/01-defining-data-science/README.md) [వీడియో](https://youtu.be/beZ7Mb_oz9I) | [Dmitry](http://soshnikov.com) |
| 02 | డేటా సైన్స్ నైతికత | [పరిచయము](1-Introduction/README.md) | డేటా నైతికత సూత్రాలు, సవాళ్లు & ఫ్రమ్రోక్స్ | [పాఠం](1-Introduction/02-ethics/README.md) | [Nitya](https://twitter.com/nitya) |
| 03 | డేటా నిర్వచనం | [పరిచయము](1-Introduction/README.md) | డేటా ఎలా వర్గీకరించబడుతుందో మరియు సాధారణ మూలాలు. | [పాఠం](1-Introduction/03-defining-data/README.md) | [Jasmine](https://www.twitter.com/paladique) |
| 04 | గణాంకాలు & ప్రాయిసంభావ్యత పరిచయం | [పరిచయము](1-Introduction/README.md) | డేటా అర్థం చేసుకోవడానికి ప్రాయిసంభావ్యత మరియు గణాంకాల గణిత శాస్త్ర పద్ధతులు. | [పాఠం](1-Introduction/04-stats-and-probability/README.md) [వీడియో](https://youtu.be/Z5Zy85g4Yjw) | [Dmitry](http://soshnikov.com) |
| 05 | రిలేషనల్ డేటాతో పని చేయడం | [డేటాతో పని](2-Working-With-Data/README.md) | రిలేషన్ డేటా పరిచయం మరియు Structured Query Language (SQL - “సీ-క్వెల్” గా ఉచ్చరిస్తారు) తో రిలేషన్ డేటాను అన్వేషించడం, విశ్లేషించడం. | [పాఠం](2-Working-With-Data/05-relational-databases/README.md) | [Christopher](https://www.twitter.com/geektrainer) | | |
| 06 | నాన్-SQL డేటాతో పని చేయడం | [డేటాతో పని](2-Working-With-Data/README.md) | నాన్-రిలేషనల్ డేటా పరిచయం, దాని రకాలు మరియు డాక్యుమెంట్ డేటాబేస్లను అన్వేషించడం, విశ్లేషణ. | [పాఠం](2-Working-With-Data/06-non-relational/README.md) | [Jasmine](https://twitter.com/paladique)|
| 07 | పైథాన్ తో పని | [డేటాతో పని](2-Working-With-Data/README.md) | Pandas లాంటి లైబ్రరీలతో డేటా అన్వేషణ కోసం పైథాన్ ఉపయోగించడం ప్రాథమికాలు. పైథాన్ ప్రోగ్రామింగ్ యొక్క ప్రాథమిక అవగాహన అవసరం. | [పాఠం](2-Working-With-Data/07-python/README.md) [వీడియో](https://youtu.be/dZjWOGbsN4Y) | [Dmitry](http://soshnikov.com) |
| 08 | డేటా సిద్ధత | [డేటాతో పని](2-Working-With-Data/README.md) | మానుకున్న, తప్పైన, లేదా అసంపూర్ణ డేటా సవాళ్లను ఎదుర్కోవడానికి డేటాను శుభ్రపరచడం మరియు మార్చడం సాంకేతికతలు. | [పాఠం](2-Working-With-Data/08-data-preparation/README.md) | [Jasmine](https://www.twitter.com/paladique) |
| 09 | పరిమాణాలను విజువలైజ్ చేయడం | [డేటా విజువలైజేషన్](3-Data-Visualization/README.md) | Matplotlib ఉపయోగించి బర్డ్ డేటాను విజువలైజ్ చేయడం నేర్చుకోండి 🦆 | [పాఠం](3-Data-Visualization/09-visualization-quantities/README.md) | [Jen](https://twitter.com/jenlooper) |
| 10 | డేటా పంపిణీలను విజువలైజ్ చేయడం | [డేటా విజువలైజేషన్](3-Data-Visualization/README.md) | ఒక ఇంటర్వెల్‌లోని పరిశీలనల మరియు ధోరణులను విజువలైజ్ చేయడం. | [పాఠం](3-Data-Visualization/10-visualization-distributions/README.md) | [Jen](https://twitter.com/jenlooper) |
| 11 | భాగాల విజువలైజేషన్ | [డేటా విజువలైజేషన్](3-Data-Visualization/README.md) | విడివిడిగా మరియు సమూహాల శాతాలను విజువలైజ్ చేయడం. | [పాఠం](3-Data-Visualization/11-visualization-proportions/README.md) | [Jen](https://twitter.com/jenlooper) |
| 12 | సంబంధాల విజువలైజేషన్ | [డేటా విజువలైజేషన్](3-Data-Visualization/README.md) | డేటా మరియు వేరియబుల్స్ మధ్య సంబంధాలు, సహ సంబంధాలను విజువలైజ్ చేయడం. | [పాఠం](3-Data-Visualization/12-visualization-relationships/README.md) | [Jen](https://twitter.com/jenlooper) |
| 13 | అర్థపూర్వక విజువలైజేషన్లు | [డేటా విజువలైజేషన్](3-Data-Visualization/README.md) | మీ విజువలైజేషన్లను సమస్య పరిష్కారానికి మరియు అవగాహనలకు విలువైనదిగా చేయడానికి సాంకేతికతలు మరియు మార్గదర్శకాలు. | [పాఠం](3-Data-Visualization/13-meaningful-visualizations/README.md) | [Jen](https://twitter.com/jenlooper) |
| 14 | డేటా సైన్స్ లైఫ్‌సైకిల్ పరిచయం | [లైఫ్‌సైకిల్](4-Data-Science-Lifecycle/README.md) | డేటా సైన్స్ లైఫ్‌సైకల్ పరిచయం మరియు మొదటి దశ - డేటాను సంపాదించడం మరియు తొలగించడం. | [పాఠం](4-Data-Science-Lifecycle/14-Introduction/README.md) | [Jasmine](https://twitter.com/paladique) |
| 15 | విశ్లేషణ | [లైఫ్‌సైకిల్](4-Data-Science-Lifecycle/README.md) | డేటా సైన్స్ లైఫ్‌సైకిల్‌లో ఈ దశ డేటా విశ్లేషణ సాంకేతికతలపై కేంద్రీకృతమైంది. | [పాఠం](4-Data-Science-Lifecycle/15-analyzing/README.md) | [Jasmine](https://twitter.com/paladique) | | |
| 16 | కమ్యూనికేషన్ | [లైఫ్‌సైకిల్](4-Data-Science-Lifecycle/README.md) | డేటా నుండి పొందిన అవగాహనలను నిర్ణయదారులు సులభంగా అర్థం చేసుకునే విధంగా అందించడంపై ఈ దశ కేంద్రీకృతమైంది. | [పాఠం](4-Data-Science-Lifecycle/16-communication/README.md) | [Jalen](https://twitter.com/JalenMcG) | | |
| 17 | క్లౌడ్ లో డేటా సైన్స్ | [క్లౌడ్ డేటా](5-Data-Science-In-Cloud/README.md) | ఈ పాఠాల శ్రేణి క్లౌడ్ లో డేటా సైన్స్ మరియు దాని లాభాల పరిచయం చేస్తుంది. | [పాఠం](5-Data-Science-In-Cloud/17-Introduction/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) మరియు [Maud](https://twitter.com/maudstweets) |
| 18 | క్లౌడ్ లో డేటా సైన్స్ | [క్లౌడ్ డేటా](5-Data-Science-In-Cloud/README.md) | లో కోడ్ టూల్స్ ఉపయోగించి మోడల్స్ శిక్షణ. | [పాఠం](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) మరియు [Maud](https://twitter.com/maudstweets) |
| 19 | క్లౌడ్ లో డేటా సైన్స్ | [క్లౌడ్ డేటా](5-Data-Science-In-Cloud/README.md) | Azure Machine Learning Studio తో మోడల్స్ ను డిప్లాయ్ చేయడం. | [పాఠం](5-Data-Science-In-Cloud/19-Azure/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) మరియు [Maud](https://twitter.com/maudstweets) |
| 20 | వనాలలో డేటా సైన్స్ | [వనంలో](6-Data-Science-In-Wild/README.md) | వాస్తవ ప్రపంచంలో డేటా సైన్స్ ఆధారిత ప్రాజెక్టులు. | [పాఠం](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [Nitya](https://twitter.com/nitya) |
## GitHub కోడ్స్పేస్లు
ఈ నమూనాను ఒక కోడ్స్పేస్‌లో తెరవడానికి ఈ దశలను అనుసరించండి:
1. కోడ్ డ్రాప్-డౌన్ మెనూని క్లిక్ చేసి Open with Codespaces ఎంపికను ఎంచుకోండి.
2. పానెల్ దిగువన + New codespace ఎంచుకోండి.
మరింత సమాచారం కోసం [GitHub డాక్యుమెంటేషన్](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace) చూడండి.
## VSCode రిమోట్ - కంటైనర్లు
తొలి సారి డెవలప్మెంట్ కంటైనర్ ఉపయోగిస్తుంటే, మీ సిస్టమ్ ముందుగా అవసరాలు తీర్చుకున్నదని నిర్ధారించుకోండి (అంటే Docker ఇన్‌స్టాల్ చేయబడినది) [గెంటింగ్ స్టార్టెడ్ డాక్యుమెంటేషన్](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started)లో.
ఈ రిపోజిటరీను ఉపయోగించడానికి, మీరు రిపోజిటరీని డాకర్ వాల్యూమ్‌లో ఒంటరిగా ఓపెన్ చేయవచ్చు:
**గమనిక**: ఈ విధానం Remote-Containers: **Clone Repository in Container Volume...** కమాండ్ ఉపయోగించి సోర్స్ కోడ్‌ని డాకర్ వాల్యూమ్‌లో క్లోన్ చేస్తుంది స్థానిక ఫైల్ సిస్టమ్ స్దలంలో కాకుండా. [వాల్యూమ్స్](https://docs.docker.com/storage/volumes/) కంటైనర్ డేటాను నిల్వ చేయడానికి ప్రాధాన్యమిస్తున్న యంత్రము.
లేదా స్థానికంగా క్లోన్ చేసిన లేదా డౌన్లోడ్ చేసిన రిపోజిటరీను ఓపెన్ చేయండి:
- ఈ రిపోజిటరీని మీ స్థానిక ఫైల్ సిస్టమ్‌కు క్లోన్ చేయండి.
| 01 | డేటా సైన్స్ నిర్వచనం | [పరిచయము](1-Introduction/README.md) | డేటా సైన్స్ తాత్వికాలు మరియు అది ఆర్టిఫిషియల్ ఇంటెలిజెన్స్, మెషిన్ లెర్నింగ్, మరియు పెద్ద డేటాతో ఎలా సంబంధించి ఉండొచ్చో నేర్చుకోండి. | [పాఠం](1-Introduction/01-defining-data-science/README.md) [వీడియో](https://youtu.be/beZ7Mb_oz9I) | [ద్మిత్రి](http://soshnikov.com) |
| 02 | డేటా సైన్స్ నైతికత | [పరిచయము](1-Introduction/README.md) | డేటా నైతికత భావనలు, సవాళ్లు & ఫ్రేమ్‌వర్క్‌లు. | [పాఠం](1-Introduction/02-ethics/README.md) | [నిత్య](https://twitter.com/nitya) |
| 03 | డేటా నిర్వచనం | [పరిచయము](1-Introduction/README.md) | డేటాను ఎలా వర్గీకరిస్తారు మరియు దాని సాధారణ మూలాలు. | [పాఠం](1-Introduction/03-defining-data/README.md) | [జాస్మిన్](https://www.twitter.com/paladique) |
| 04 | గణితం & సంభావ్యత పరిచయం | [పరిచయము](1-Introduction/README.md) | డేటా అర్థం చేసుకోవడానికి సంభావ్యత మరియు గణాంకాల గణిత సాంకేతికతలు. | [పాఠం](1-Introduction/04-stats-and-probability/README.md) [వీడియో](https://youtu.be/Z5Zy85g4Yjw) | [ద్మిత్రి](http://soshnikov.com) |
| 05 | రిలేషనల్ డేటాతో పని | [డేటాతో పని](2-Working-With-Data/README.md) | రిలేషనల్ డేటాకు పరిచయం మరియు SQL (‘‘సీ-క్వెల్’’ గా ఉచ్చరించబడుతుంది) తో రిలేషనల్ డేటాను అన్వేషించడం మరియు విశ్లేషించడం. | [పాఠం](2-Working-With-Data/05-relational-databases/README.md) | [క్రిస్టఫర్](https://www.twitter.com/geektrainer) | | |
| 06 | నాన్-SQL డేటాతో పని | [డేటాతో పని](2-Working-With-Data/README.md) | నాన్-రిలేషనల్ డేటాకు పరిచయం, దాని వివిధ రకాలు మరియు డాక్యుమెంట్ డేటాబేస్‌లను అన్వేషించడం మరియు విశ్లేషించడం. | [పాఠం](2-Working-With-Data/06-non-relational/README.md) | [జాస్మిన్](https://twitter.com/paladique)|
| 07 | పైథాన్‌తో పని | [డేటాతో పని](2-Working-With-Data/README.md) | పాండాస్ వంటి లైబ్రరీలతో డేటా అన్వేషణకు పైథాన్‌ను ఉపయోగించడం యొక్క ప్రాథమికాలు. పైథాన్ ప్రోగ్రామింగ్ పునాది అవగాహన సిఫార్సు చేయబడింది. | [పాఠం](2-Working-With-Data/07-python/README.md) [వీడియో](https://youtu.be/dZjWOGbsN4Y) | [ద్మిత్రి](http://soshnikov.com) |
| 08 | డేటా ప్రిపరేషన్ | [డేటాతో పని](2-Working-With-Data/README.md) | డేటాను శుభ్రపరచడం మరియు మార్చడం కోసం సాంకేతిక పాఠాలు, లేపి, తప్పు, లేదా అసంపూర్ణ డేటా యొక్క సవాళ్లను ఎదుర్కోవడం. | [పాఠం](2-Working-With-Data/08-data-preparation/README.md) | [జాస్మిన్](https://www.twitter.com/paladique) |
| 09 | పరిమాణాల దృశ్యీకరణ | [డేటా విజువలైజేషన్](3-Data-Visualization/README.md) | మ్యాట్ప్లాట్‌లిబ్ ఉపయోగించి పైజనుల డేటా విజువలైజ్ చేయడం నేర్చుకోండి 🦆 | [పాఠం](3-Data-Visualization/09-visualization-quantities/README.md) | [జెన్](https://twitter.com/jenlooper) |
| 10 | డేటా పంపిణీల దృశ్యీకరణ | [డేటా విజువలైజేషన్](3-Data-Visualization/README.md) | మధ్యాంతరంలో పర్యవేక్షణలు మరియు ధోరణులను దర్శించడం. | [పాఠం](3-Data-Visualization/10-visualization-distributions/README.md) | [జెన్](https://twitter.com/jenlooper) |
| 11 | అనుపాతాల దృశ్యీకరణ | [డేటా విజువలైజేషన్](3-Data-Visualization/README.md) | విడినిమయ మరియు సమూహీకృత శాతం విజువలైజ్ చేయడం. | [పాఠం](3-Data-Visualization/11-visualization-proportions/README.md) | [జెన్](https://twitter.com/jenlooper) |
| 12 | సంబంధాల దృశ్యీకరణ | [డేటా విజువలైజేషన్](3-Data-Visualization/README.md) | డేటా సెట్‌లు మరియు వాటి చరాల మధ్య సంబంధాలు మరియు సహసంబంధాలను చూపించడం. | [పాఠం](3-Data-Visualization/12-visualization-relationships/README.md) | [జెన్](https://twitter.com/jenlooper) |
| 13 | అర్థవంతమైన విజువలైజేషన్స్ | [డేటా విజువలైజేషన్](3-Data-Visualization/README.md) | మీ విజువలైజేషన్స్‌ను సమర్థవంతమైన సమస్య పరిష్కారం మరియు అవగాహన కోసం విలువైనవిగా చేయడానికి సాంకేతికతలు మరియు మార్గనిర్దేశం. | [పాఠం](3-Data-Visualization/13-meaningful-visualizations/README.md) | [జెన్](https://twitter.com/jenlooper) |
| 14 | డేటా సైన్స్ జీవనచక్ర పరిచయము | [జీవనచక్రం](4-Data-Science-Lifecycle/README.md) | డేటా సైన్స్ జీవనచక్రం పరిచయం మరియు డేటాను సేకరించి వెలికి తీయడం మొదటి దశ. | [పాఠం](4-Data-Science-Lifecycle/14-Introduction/README.md) | [జాస్మిన్](https://twitter.com/paladique) |
| 15 | విశ్లేషణ | [జీవనచక్రం](4-Data-Science-Lifecycle/README.md) | డేటాను విశ్లేషించడానికి ఈ దశలో సాంకేతికతలకు దృష్టి. | [పాఠం](4-Data-Science-Lifecycle/15-analyzing/README.md) | [జాస్మిన్](https://twitter.com/paladique) | | |
| 16 | కమ్యూనికేషన్ | [జీవనచక్రం](4-Data-Science-Lifecycle/README.md) | డేటా వెనుక ఉన్న అవగాహనలను తీసుకుని నిర్ణయాలు తీసుకునేవారికి అర్థమయ్యే రీతిలో ప్రవృత్తి చేసే దశ. | [పాఠం](4-Data-Science-Lifecycle/16-communication/README.md) | [జాలెన్](https://twitter.com/JalenMcG) | | |
| 17 | క్లౌడ్‌లో డేటా సైన్స్ | [క్లౌడ్ డేటా](5-Data-Science-In-Cloud/README.md) | క్లౌడ్‌లో డేటా సైన్స్ పరిచయం మరియు దాని ప్రయోజనాలు. | [పాఠం](5-Data-Science-In-Cloud/17-Introduction/README.md) | [టిఫాని](https://twitter.com/TiffanySouterre) మరియు [మాడ్](https://twitter.com/maudstweets) |
| 18 | క్లౌడ్‌లో డేటా సైన్స్ | [క్లౌడ్ డేటా](5-Data-Science-In-Cloud/README.md) | లో కోడ్ టూల్స్ ఉపయోగించి ట్రైనింగ్ మోడల్స్. |[పాఠం](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [టిఫాని](https://twitter.com/TiffanySouterre) మరియు [మాడ్](https://twitter.com/maudstweets) |
| 19 | క్లౌడ్‌లో డేటా సైన్స్ | [క్లౌడ్ డేటా](5-Data-Science-In-Cloud/README.md) | Azure Machine Learning స్టూడియోతో మోడల్స్ క్రియేట్ చేయడం. | [పాఠం](5-Data-Science-In-Cloud/19-Azure/README.md)| [టిఫాని](https://twitter.com/TiffanySouterre) మరియు [మాడ్](https://twitter.com/maudstweets) |
| 20 | వనంలో డేటా సైన్స్ | [వనంలో](6-Data-Science-In-Wild/README.md) | నిజమైన ప్రపంచంలో డేటా సైన్స్ ఆధారిత ప్రాజెక్టులు. | [పాఠం](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [నిత్య](https://twitter.com/nitya) |
## GitHub కోడ్స్‌పేసెస్
ఈ నమూనాను కోడ్స్‌పేస్‌లో ఓపెన్ చేయడానికి ఈ దశలను అనుసరించండి:
1. కోడ్ డ్రాప్-డౌన్ మెనును క్లిక్ చేసి Open with Codespaces ఎంపికను ఎంచుకోండి.
2. ప్యానెల్ దిగువన + New codespace ఎంచుకోండి.
మరిన్ని వివరాలకు, [GitHub డొక్యుమెంటేషన్](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace) చూడండి.
## VSCode రిమోట్ - కంటేనర్లు
మీ స్థానిక యంత్రం మరియు VSCode ఉపయోగించి VS Code Remote - Containers విస్తరణతో ఈ రెపోను కంటైనర్‌లో ఓపెన్ చేయడానికి ఈ దశలను అనుసరించండి:
1. మీరు మొదటిసారి డెవలప్‌మెంట్ కంటైనర్ ఉపయోగించేటప్పుడు, మీ సిస్టమ్ ప్రీ-రకల నిబంధనలను (అంటే Docker ఇన్‌స్టాల్ చేసినట్లు) [Getting Started డాక్యుమెంటేషన్](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started)లో చూసుకోండి.
ఈ రెపోను ఉపయోగించడానికి, మీరు రిపాజిటరీని వేరుచేసిన Docker వాల్యూమ్‌లో ఓపెన్ చేయవచ్చు:
**గమనిక**: ఇది Remote-Containers: **Clone Repository in Container Volume...** కమాండ్ ఉపయోగించి స్థానిక ఫైల్ సిస్టమ్ బదులుగా Docker వాల్యూమ్‌లో సోర్స్ కోడ్‌ను క్లోన్ చేస్తుంది. [Volumes](https://docs.docker.com/storage/volumes/) కంటైనర్ డేటాను నిల్వ చేయడానికి అత్యంత ప్రాధాన్యత కలిగిన మెకానిజం.
లేదా స్థానికంగా క్లోన్ చెయ్యబడిన లేదా డౌన్లోడ్ చేసిన రెపోను ఓపెన్ చేయండి:
- ఈ రెపోను మీ స్థానిక ఫైల్ సిస్టమ్‌కి క్లోన్ చేయండి.
- F1 నొక్కి **Remote-Containers: Open Folder in Container...** కమాండ్ ఎంచుకోండి.
- ఈ ఫోల్డర్ క్లోన్ చేసిన కాపీని ఎంచుకోండి, కంటైనర్ స్టార్ట్ అయ్యే వరకు వేచి చూడండి, మరియు ప్రయత్నించండి.
- ఈ ఫోల్డర్ యొక్క క్లోన్ చేసిన ప్రతిని ఎంచుకుని, కంటైనర్ ప్రారంభమయ్యేవరకు వేచి ఉండండి, మరియు ప్రయత్నించండి.
## ఆఫ్‌లైన్ యాక్సెస్
[Docsify](https://docsify.js.org/#/) ఉపయోగించి ఈ డాక్యుమెంటేషన్ ని ఆఫ్‌లైన్‌లో నడుపవచ్చు. ఈ రిపోను ఫోర్క్ చేసి, [Docsify ఇన్‌స్టాల్](https://docsify.js.org/#/quickstart) చేసి తో, ఈ రిపో యొక్క రూట్ ఫోల్డర్లో `docsify serve` టైప్ చేయండి. వెబ్‌సైట్ మీ లోకల్ హోస్ట్ లో 3000 పోర్ట్ పై సర్వ్ అవుతుంది: `localhost:3000`.
మీరు ఈ డాక్యుమెంటేషన్‌ను ఆఫ్‌లైన్‌లో [Docsify](https://docsify.js.org/#/) ఉపయోగించి నడపవచ్చు. ఈ రెపోను ఫార్క్ చేసి, మీ స్థానిక యంత్రంపై [Docsify ఇన్‌స్టాల్](https://docsify.js.org/#/quickstart)చేసి, ఈ రెపో యొక్క రూట్ ఫోల్డర్లో `docsify serve` టైప్ చేయండి. వెబ్‌సైట్ స్థానికహోస్ట్ 3000 పోర్టులో అందుబాటులో ఉంటుంది: `localhost:3000`.
> గమనిక, నొట్బుక్‌లు Docsify ద్వారా రెండర్ కావు, కాబట్టి మీరు నొట్బుక్ నడపాలంటే, అది వేరేలా VS Code లో Python కర్నల్ నడుపుతూ చేయండి.
> గమనిక, నోట్‌బుక్స్ Docsify ద్వారా రేండర్ అవవు, కాబట్టి మీరు నోట్‌బుక్ నడపవలసినప్పుడు, దాన్ని వేరుగా VS Codeలో పైథాన్ కర్నల్ నడుపుతూ చేయండి.
## ఇతర పాఠ్యక్రమాలు
## ఇతర పాఠ్యాంశాలు
ా బృందం ఇతర పాఠ్యక్రమాలు కూడా తయారు చేస్తుంది! చూడండి:
న టీమ్ ఇతర పాఠ్యాంశాలను తయారుచేస్తుంది! చూడండి:
<!-- CO-OP TRANSLATOR OTHER COURSES START -->
### LangChain
[![LangChain4j for Beginners](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners)
[![LangChain.js for Beginners](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin)
[![LangChain for Beginners](https://img.shields.io/badge/LangChain%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://github.com/microsoft/langchain-for-beginners?WT.mc_id=m365-94501-dwahlin)
---
### Azure / Edge / MCP / ఏజెంట్లు
### ఆజ్యూర్ / ఎజ్ / MCP / ఏజెంట్లు
[![AZD for Beginners](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst)
[![Edge AI for Beginners](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst)
[![MCP for Beginners](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst)
@ -225,27 +237,27 @@
---
### కపిలట్ సిరీస్
### కపిలట్ సిరీస్
[![Copilot for AI Paired Programming](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst)
[![Copilot for C#/.NET](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst)
[![Copilot Adventure](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst)
<!-- CO-OP TRANSLATOR OTHER COURSES END -->
## సహాయం పొందట
## సహాయం పొంద
**సమస్యలు ఎదుర్కోచ్చా?** సాధారణ సమస్యల పరిష్కారాల కోసం మా [ట్రబుల్షూటింగ్ గైడ్](TROUBLESHOOTING.md) ను పరిశీలించండి.
**సమస్యలు ఎదుర్కొంటున్నారా?** సాధారణ సమస్యలకు పరిష్కారాల కోసం మా [ట్రబ్బుల్షూటింగ్ గైడ్](TROUBLESHOOTING.md) ను తనిఖీ చేయండి.
మీరు అడ్డకట్టబడితే లేదా AI యాప్‌ల నిర్మాణం గురించి మీకు ఎలాంటి ప్రశ్నలు ఉంటే. MCP గురించి చర్చల్లో ఇతర అభ్యసకులు మరియు అనుభవజ్ఞులైన డెవలపర్లతో 합류 చేయండి. ఇది ప్రశ్నలు స్వాగతం మరియు జ్ఞానం స్వేచ్ఛగా పంచుకునే సహాయక సమాజం.
మీరు అడ్డుకుపోవడం లేదా AI యాప్‌ల నిర్మాణంపై ఏదైనా ప్రశ్నలు ఉన్నట్లయితే, ఇతర పాఠకులు మరియు అనుభవజ్ఞులైన డెవలపర్లతో MCP గురించి చర్చలకు చేరండి. ఇది ప్రశ్నలు అడగడానికి మరియు జ్ఞానం ఉచితంగా పంచుకోవడానికి ఒక మద్దతు సమాజం.
[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG)
మీకు ఉత్పత్తి ప్రతిస్పందనలు లేదా లోపాలు ఉంటే:
మీకు ఉత్పత్తి అభిప్రాయాలు లేదా నిర్మాణ సమయంలో లోపాలు ఉంటే సందర్శించండి:
[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum)
---
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**అస్పృష్టం**:
పత్రం AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము సరైనతకు ప్రయత్నిస్తున్నప్పటికీ, స్వయంచాలిత అనువాదాల్లో తప్పులు లేదా అవాస్తవతలు ఉండవచ్చు. అసలు పత్రం తన స్వదేశీ భాషలో అధికారిక వనరుగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదాన్ని సిఫార్సు చేయబడాలి. ఈ అనువాదం వలన వచ్చే ఏ సందేహాలు లేదా తప్పుదృక్పథాలకు మేము బాధ్యత వహించము.
**అస్పృశ్యం**:
డాక్యుమెంట్ AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మనం ఖచ్చితత్వం కోసం ప్రయత్నిస్తున్నప్పటికీ, ఆటోమేటెడ్ అనువాదాలలో తప్పులూ లేదా లోపాలూ ఉండవచ్చు. స్వదేశ భాషలో ఉన్న మూల డాక్యుమెంట్‌ను అధికారిక మూలంగా పరిగణించడం మంచిది. కీలక సమాచారానికి, వృత్తిపరమైన మానవ అనువాదం అర్హత సాధించేది. ఈ అనువాదం వాడుక వల్ల సంభవించే ఏయే అపార్థాలు లేదా తప్పుగా అర్థం చేసుకోవడాలు ఆ జవాబుదారీత మనది కాదు.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->

@ -4,7 +4,7 @@
నిత్య నరసింహన్, కళాకారుడు
![roadmap sketchnote](../../../translated_images/te/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.png)
![roadmap sketchnote](../../../translated_images/te/00-Roadmap.4905d6567dff4753.webp)
---

Loading…
Cancel
Save