parent
c945bd6341
commit
b985ee1af0
@ -0,0 +1,181 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a33c5d4b4156a2b41788d8720b6f724c",
|
||||
"translation_date": "2025-12-19T16:24:50+00:00",
|
||||
"source_file": "3-Data-Visualization/R/12-visualization-relationships/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ: തേൻ 🍯 സംബന്ധിച്ച എല്ലാം
|
||||
|
||||
| ](../../../sketchnotes/12-Visualizing-Relationships.png)|
|
||||
|:---:|
|
||||
|ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
നമ്മുടെ ഗവേഷണത്തിന്റെ പ്രകൃതി കേന്ദ്രീകൃതമായ ഭാഗം തുടർന്നുകൊണ്ട്, [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php) നിന്നുള്ള ഡാറ്റാസെറ്റിൽ നിന്നുള്ള വിവിധ തരത്തിലുള്ള തേനുകളുടെ ബന്ധങ്ങൾ കാണിക്കുന്ന രസകരമായ ദൃശ്യവൽക്കരണങ്ങൾ കണ്ടെത്താം.
|
||||
|
||||
ഏകദേശം 600 ഇനങ്ങളുള്ള ഈ ഡാറ്റാസെറ്റ് പല യു.എസ്. സംസ്ഥാനങ്ങളിലെ തേൻ ഉത്പാദനം പ്രദർശിപ്പിക്കുന്നു. ഉദാഹരണത്തിന്, ഓരോ സംസ്ഥാനത്തെയും ഓരോ വർഷത്തെയും കോളനികളുടെ എണ്ണം, ഓരോ കോളനിക്കുള്ള ഉത്പാദനം, മൊത്തം ഉത്പാദനം, സ്റ്റോക്കുകൾ, പൗണ്ട് പ്രതി വില, ഉത്പാദന മൂല്യം എന്നിവ കാണാം.
|
||||
|
||||
ഒരു സംസ്ഥാനത്തിന്റെ ഓരോ വർഷവും ഉത്പാദനവും, ഉദാഹരണത്തിന്, ആ സംസ്ഥാനത്തെ തേൻ വിലയുമായി ഉള്ള ബന്ധം ദൃശ്യവൽക്കരിക്കുന്നത് രസകരമായിരിക്കും. അല്ലെങ്കിൽ, സംസ്ഥാനങ്ങളുടെ കോളനി പ്രതി തേൻ ഉത്പാദനത്തിന്റെ ബന്ധം ദൃശ്യവൽക്കരിക്കാം. 2006-ൽ ആദ്യമായി കണ്ട 'CCD' അല്ലെങ്കിൽ 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) ഉൾപ്പെടുന്ന ഈ വർഷപരിധി പഠിക്കാൻ ഒരു പ്രാധാന്യമുള്ള ഡാറ്റാസെറ്റാണ്. 🐝
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/22)
|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾ മുമ്പ് ഉപയോഗിച്ചിട്ടുള്ള ggplot2 ഉപയോഗിച്ച് വ്യത്യസ്ത വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കാൻ കഴിയും. പ്രത്യേകിച്ച്, ggplot2-യുടെ `geom_point`യും `qplot` ഫംഗ്ഷനുകളും ഉപയോഗിച്ച് സ്കാറ്റർ പ്ലോട്ടുകളും ലൈൻ പ്ലോട്ടുകളും എളുപ്പത്തിൽ '[സാങ്കേതിക ബന്ധങ്ങൾ](https://ggplot2.tidyverse.org/)' കാണിക്കാൻ കഴിയും, ഇത് ഡാറ്റാ സയന്റിസ്റ്റിന് വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം മനസ്സിലാക്കാൻ സഹായിക്കുന്നു.
|
||||
|
||||
## സ്കാറ്റർപ്ലോട്ടുകൾ
|
||||
|
||||
തേൻ വില വർഷം തോറും ഓരോ സംസ്ഥാനത്തും എങ്ങനെ മാറിയെന്ന് കാണിക്കാൻ സ്കാറ്റർപ്ലോട്ട് ഉപയോഗിക്കുക. ggplot2, `ggplot`യും `geom_point`ഉം ഉപയോഗിച്ച് സംസ്ഥാന ഡാറ്റ ഗ്രൂപ്പുചെയ്ത് കാറ്റഗോറിയും സംഖ്യാത്മക ഡാറ്റയും കാണിക്കുന്ന ഡാറ്റ പോയിന്റുകൾ പ്രദർശിപ്പിക്കുന്നു.
|
||||
|
||||
ഡാറ്റയും Seaborn-ഉം ഇറക്കുമതി ചെയ്യുന്നതിൽ നിന്ന് തുടങ്ങാം:
|
||||
|
||||
```r
|
||||
honey=read.csv('../../data/honey.csv')
|
||||
head(honey)
|
||||
```
|
||||
തേൻ ഡാറ്റയിൽ വർഷവും പൗണ്ട് പ്രതി വിലയും ഉൾപ്പെടെ പല രസകരമായ കോളങ്ങളുണ്ട്. യു.എസ്. സംസ്ഥാനങ്ങൾ അനുസരിച്ച് ഗ്രൂപ്പുചെയ്ത് ഈ ഡാറ്റ പരിശോധിക്കാം:
|
||||
|
||||
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|
||||
| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
|
||||
| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
|
||||
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
|
||||
| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
|
||||
| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
|
||||
| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
|
||||
| FL | 230000 | 98 |22540000 | 4508000 | 0.64 | 14426000 | 1998 |
|
||||
|
||||
തേൻ പൗണ്ട് പ്രതി വിലയും അതിന്റെ യു.എസ്. സംസ്ഥാന ഉത്ഭവവും തമ്മിലുള്ള ബന്ധം കാണിക്കുന്ന ഒരു അടിസ്ഥാന സ്കാറ്റർപ്ലോട്ട് സൃഷ്ടിക്കുക. എല്ലാ സംസ്ഥാനങ്ങളും കാണാൻ `y` അക്ഷം ഉയരം നൽകുക:
|
||||
|
||||
```r
|
||||
library(ggplot2)
|
||||
ggplot(honey, aes(x = priceperlb, y = state)) +
|
||||
geom_point(colour = "blue")
|
||||
```
|
||||

|
||||
|
||||
ഇപ്പോൾ, വർഷം തോറും വില എങ്ങനെ മാറിയെന്ന് കാണിക്കാൻ തേൻ നിറത്തിലുള്ള കളർ സ്കീം ഉപയോഗിച്ച് സമാന ഡാറ്റ കാണിക്കുക. വർഷം തോറും മാറ്റം കാണിക്കാൻ 'scale_color_gradientn' പാരാമീറ്റർ ചേർക്കാം:
|
||||
|
||||
> ✅ [scale_color_gradientn](https://www.rdocumentation.org/packages/ggplot2/versions/0.9.1/topics/scale_colour_gradientn) കുറിച്ച് കൂടുതൽ പഠിക്കൂ - മനോഹരമായ റെയിൻബോ കളർ സ്കീം പരീക്ഷിക്കൂ!
|
||||
|
||||
```r
|
||||
ggplot(honey, aes(x = priceperlb, y = state, color=year)) +
|
||||
geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7))
|
||||
```
|
||||

|
||||
|
||||
ഈ കളർ സ്കീം മാറ്റത്തോടെ, പൗണ്ട് പ്രതി തേൻ വില വർഷം തോറും ശക്തമായി ഉയരുന്നുവെന്ന് വ്യക്തമായി കാണാം. ഡാറ്റയിൽ ഒരു സാമ്പിൾ സെറ്റ് പരിശോധിച്ചാൽ (ഉദാഹരണത്തിന്, അരിസോണ), വില വർഷം തോറും ഉയരുന്ന ഒരു പാറ്റേൺ കാണാം, കുറച്ച് ഒഴിവുകൾ കൂടെ:
|
||||
|
||||
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|
||||
| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
|
||||
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
|
||||
| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
|
||||
| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
|
||||
| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
|
||||
| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
|
||||
| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
|
||||
| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
|
||||
| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
|
||||
| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
|
||||
| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
|
||||
| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
|
||||
| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
|
||||
| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
|
||||
| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
|
||||
| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
|
||||
|
||||
ഈ പുരോഗതി കാണിക്കാൻ കളറിന് പകരം വലിപ്പം ഉപയോഗിക്കാം. കളർബ്ലൈൻഡ് ഉപയോക്താക്കൾക്ക് ഇത് നല്ല ഓപ്ഷൻ ആകാം. ഡോട്ട് വലിപ്പം വർദ്ധിപ്പിച്ച് വില വർദ്ധനവ് കാണിക്കുന്ന വിധം നിങ്ങളുടെ ദൃശ്യവൽക്കരണം തിരുത്തുക:
|
||||
|
||||
```r
|
||||
ggplot(honey, aes(x = priceperlb, y = state)) +
|
||||
geom_point(aes(size = year),colour = "blue") +
|
||||
scale_size_continuous(range = c(0.25, 3))
|
||||
```
|
||||
ഡോട്ടുകളുടെ വലിപ്പം ക്രമാനുസൃതമായി വർദ്ധിക്കുന്നതായി കാണാം.
|
||||
|
||||

|
||||
|
||||
ഇത് സപ്ലൈ-ഡിമാൻഡ് സാദ്ധ്യതയുള്ള ഒരു ലളിതമായ കേസ് ആണോ? കാലാവസ്ഥ മാറ്റം, കോളനി തകർച്ച തുടങ്ങിയ ഘടകങ്ങൾ കാരണം, വർഷം തോറും വാങ്ങാനുളള തേൻ കുറയുന്നുണ്ടോ, അതുകൊണ്ട് വില ഉയരുന്നുണ്ടോ?
|
||||
|
||||
ഈ ഡാറ്റാസെറ്റിലെ ചില വേരിയബിളുകൾ തമ്മിലുള്ള സഹബന്ധം കണ്ടെത്താൻ, ചില ലൈൻ ചാർട്ടുകൾ പരിശോധിക്കാം.
|
||||
|
||||
## ലൈൻ ചാർട്ടുകൾ
|
||||
|
||||
ചോദ്യം: തേൻ പൗണ്ട് പ്രതി വില വർഷം തോറും വ്യക്തമായി ഉയരുന്നുണ്ടോ? ഇത് കണ്ടെത്താൻ ഏറ്റവും എളുപ്പം ഒരു സിംപിൾ ലൈൻ ചാർട്ട് സൃഷ്ടിക്കുക:
|
||||
|
||||
```r
|
||||
qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab = "priceperlb")
|
||||
```
|
||||
ഉത്തരം: ചില ഒഴിവുകൾ കൂടെ, 2003-ൽ ചില വ്യത്യാസങ്ങൾ കാണാം:
|
||||
|
||||

|
||||
|
||||
ചോദ്യം: 2003-ൽ തേൻ സപ്ലൈയിൽ ഒരു പീക്ക് കാണാമോ? മൊത്തം ഉത്പാദനം വർഷം തോറും നോക്കിയാൽ?
|
||||
|
||||
```python
|
||||
qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod")
|
||||
```
|
||||
|
||||

|
||||
|
||||
ഉത്തരം: അത്രയുമല്ല. മൊത്തം ഉത്പാദനം ആ വർഷം വർദ്ധിച്ചിട്ടുണ്ടെന്ന് തോന്നുന്നു, എങ്കിലും സാധാരണയായി ഈ വർഷങ്ങളിൽ തേൻ ഉത്പാദനം കുറയുകയാണ്.
|
||||
|
||||
ചോദ്യം: അപ്പോൾ 2003-ൽ തേൻ വിലയിൽ ഉണ്ടായ പീക്ക് എന്തുകൊണ്ടാണ്?
|
||||
|
||||
ഇത് കണ്ടെത്താൻ, ഫേസറ്റ് ഗ്രിഡ് പരിശോധിക്കാം.
|
||||
|
||||
## ഫേസറ്റ് ഗ്രിഡുകൾ
|
||||
|
||||
ഫേസറ്റ് ഗ്രിഡുകൾ നിങ്ങളുടെ ഡാറ്റാസെറ്റിന്റെ ഒരു ഫേസറ്റ് (ഇവിടെ 'year' തിരഞ്ഞെടുക്കാം, വളരെ ഫേസറ്റുകൾ ഉണ്ടാകാതിരിക്കാൻ) എടുത്ത്, ഓരോ ഫേസറ്റിനും x, y കോർഡിനേറ്റുകൾ ഉപയോഗിച്ച് പ്ലോട്ടുകൾ സൃഷ്ടിക്കുന്നു, എളുപ്പത്തിൽ താരതമ്യം ചെയ്യാൻ. 2003 ഈ താരതമ്യത്തിൽ വ്യത്യസ്തമാണോ?
|
||||
|
||||
[ggplot2-യുടെ ഡോക്യുമെന്റേഷൻ](https://ggplot2.tidyverse.org/reference/facet_wrap.html) പ്രകാരം `facet_wrap` ഉപയോഗിച്ച് ഫേസറ്റ് ഗ്രിഡ് സൃഷ്ടിക്കുക.
|
||||
|
||||
```r
|
||||
ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) +
|
||||
geom_line() + facet_wrap(vars(year))
|
||||
```
|
||||
ഈ ദൃശ്യവൽക്കരണത്തിൽ, കോളനി പ്രതി ഉത്പാദനവും കോളനികളുടെ എണ്ണവും വർഷം തോറും, 3 കോളങ്ങൾ വച്ച് വച്ച് താരതമ്യം ചെയ്യാം:
|
||||
|
||||

|
||||
|
||||
ഈ ഡാറ്റാസെറ്റിൽ, കോളനികളുടെ എണ്ണം, അവയുടെ ഉത്പാദനം വർഷം തോറും, സംസ്ഥാനങ്ങൾ അനുസരിച്ച് പ്രത്യേകമായ ഒന്നും കാണാനില്ല. ഈ രണ്ട് വേരിയബിളുകൾ തമ്മിൽ സഹബന്ധം കണ്ടെത്താൻ മറ്റൊരു മാർഗ്ഗമുണ്ടോ?
|
||||
|
||||
## ഡ്യുവൽ-ലൈൻ പ്ലോട്ടുകൾ
|
||||
|
||||
R-ന്റെ `par`യും `plot`ഉം ഉപയോഗിച്ച് രണ്ട് ലൈൻ പ്ലോട്ടുകൾ ഒരുമിച്ച് സൂപ്പറിംപോസ് ചെയ്ത് മൾട്ടി-ലൈൻ പ്ലോട്ട് പരീക്ഷിക്കുക. x അക്ഷത്തിൽ വർഷം, y അക്ഷത്തിൽ രണ്ട് അക്ഷങ്ങൾ പ്രദർശിപ്പിക്കുക. കോളനി പ്രതി ഉത്പാദനവും കോളനികളുടെ എണ്ണവും സൂപ്പറിംപോസ് ചെയ്ത് കാണിക്കുക:
|
||||
|
||||
```r
|
||||
par(mar = c(5, 4, 4, 4) + 0.3)
|
||||
plot(honey$year, honey$numcol, pch = 16, col = 2,type="l")
|
||||
par(new = TRUE)
|
||||
plot(honey$year, honey$yieldpercol, pch = 17, col = 3,
|
||||
axes = FALSE, xlab = "", ylab = "",type="l")
|
||||
axis(side = 4, at = pretty(range(y2)))
|
||||
mtext("colony yield", side = 4, line = 3)
|
||||
```
|
||||

|
||||
|
||||
2003-ൽ പ്രത്യേകമായി ഒന്നും കാണാനില്ലെങ്കിലും, ഈ പാഠം ഒരു സന്തോഷകരമായ നോട്ടിൽ അവസാനിപ്പിക്കാൻ സഹായിക്കുന്നു: മൊത്തം കോളനികളുടെ എണ്ണം കുറയുന്നുണ്ടെങ്കിലും, അവയുടെ എണ്ണം സ്ഥിരതയുള്ളതും, കോളനി പ്രതി ഉത്പാദനം കുറയുന്നുണ്ടെങ്കിലും.
|
||||
|
||||
പോകൂ, തേൻതട്ടികൾ, പോകൂ!
|
||||
|
||||
🐝❤️
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഈ പാഠത്തിൽ, സ്കാറ്റർപ്ലോട്ടുകളും ലൈൻ ഗ്രിഡുകളും, ഫേസറ്റ് ഗ്രിഡുകളും ഉൾപ്പെടെ മറ്റു ഉപയോഗങ്ങൾ കുറച്ച് പഠിച്ചു. മറ്റൊരു ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് ഫേസറ്റ് ഗ്രിഡ് സൃഷ്ടിക്കാൻ ശ്രമിക്കുക, മുൻപുള്ള പാഠങ്ങളിൽ ഉപയോഗിച്ച ഡാറ്റാസെറ്റ് ആയിരിക്കാം. എത്ര സമയം എടുക്കുന്നു, എത്ര ഗ്രിഡുകൾ വരയ്ക്കേണ്ടിവരുന്നു എന്നതിൽ ശ്രദ്ധിക്കുക.
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/23)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
ലൈൻ പ്ലോട്ടുകൾ ലളിതമായതോ സങ്കീർണ്ണമായതോ ആകാം. [ggplot2 ഡോക്യുമെന്റേഷൻ](https://ggplot2.tidyverse.org/reference/geom_path.html#:~:text=geom_line()%20connects%20them%20in,which%20cases%20are%20connected%20together) വായിച്ച് വിവിധ രീതികൾ പഠിക്കൂ. ഈ പാഠത്തിൽ നിർമ്മിച്ച ലൈൻ ചാർട്ടുകൾ മറ്റ് രീതികളാൽ മെച്ചപ്പെടുത്താൻ ശ്രമിക്കൂ.
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[തേൻതട്ടിയിൽ ഡൈവ് ചെയ്യുക](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,185 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "b4039f1c76548d144a0aee0bf28304ec",
|
||||
"translation_date": "2025-12-19T16:38:09+00:00",
|
||||
"source_file": "3-Data-Visualization/R/13-meaningful-vizualizations/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# അർത്ഥവത്തായ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കൽ
|
||||
|
||||
| ](../../../sketchnotes/13-MeaningfulViz.png)|
|
||||
|:---:|
|
||||
| അർത്ഥവത്തായ ദൃശ്യവത്കരണങ്ങൾ - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
> "നിങ്ങൾ ഡാറ്റയെ മതിയായ സമയം പീഡിപ്പിച്ചാൽ, അത് എന്തിനും സമ്മതിക്കും" -- [Ronald Coase](https://en.wikiquote.org/wiki/Ronald_Coase)
|
||||
|
||||
ഒരു ഡാറ്റ സയന്റിസ്റ്റിന്റെ അടിസ്ഥാന കഴിവുകളിൽ ഒന്നാണ് നിങ്ങൾക്കുണ്ടാകാവുന്ന ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ സഹായിക്കുന്ന അർത്ഥവത്തായ ഡാറ്റാ ദൃശ്യവത്കരണം സൃഷ്ടിക്കാൻ കഴിയുക. നിങ്ങളുടെ ഡാറ്റ ദൃശ്യവത്കരിക്കുന്നതിന് മുമ്പ്, അത് മുൻപത്തെ പാഠങ്ങളിൽ ചെയ്തതുപോലെ ശുദ്ധീകരിക്കുകയും തയ്യാറാക്കുകയും ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കണം. അതിനുശേഷം, ഡാറ്റ എങ്ങനെ മികച്ച രീതിയിൽ അവതരിപ്പിക്കാമെന്ന് തീരുമാനിക്കാം.
|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾ അവലോകനം ചെയ്യും:
|
||||
|
||||
1. ശരിയായ ചാർട്ട് തരം എങ്ങനെ തിരഞ്ഞെടുക്കാം
|
||||
2. വഞ്ചനാപരമായ ചാർട്ടിംഗ് ഒഴിവാക്കാൻ എങ്ങനെ
|
||||
3. നിറവുമായി എങ്ങനെ പ്രവർത്തിക്കാം
|
||||
4. വായനാസൗകര്യത്തിനായി നിങ്ങളുടെ ചാർട്ടുകൾ എങ്ങനെ സ്റ്റൈൽ ചെയ്യാം
|
||||
5. അനിമേറ്റഡ് അല്ലെങ്കിൽ 3D ചാർട്ടിംഗ് പരിഹാരങ്ങൾ എങ്ങനെ നിർമ്മിക്കാം
|
||||
6. സൃഷ്ടിപരമായ ഒരു ദൃശ്യവത്കരണം എങ്ങനെ നിർമ്മിക്കാം
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/24)
|
||||
|
||||
## ശരിയായ ചാർട്ട് തരം തിരഞ്ഞെടുക്കുക
|
||||
|
||||
മുൻപത്തെ പാഠങ്ങളിൽ, Matplotlib, Seaborn എന്നിവ ഉപയോഗിച്ച് വിവിധ തരം രസകരമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കാൻ നിങ്ങൾ പരീക്ഷിച്ചു. സാധാരണയായി, നിങ്ങൾ ചോദിക്കുന്ന ചോദ്യത്തിന് അനുയോജ്യമായ [ശരിയായ ചാർട്ട് തരം](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) ഈ പട്ടിക ഉപയോഗിച്ച് തിരഞ്ഞെടുക്കാം:
|
||||
|
||||
| നിങ്ങൾ ചെയ്യേണ്ടത്: | നിങ്ങൾ ഉപയോഗിക്കേണ്ടത്: |
|
||||
| -------------------------- | ------------------------------- |
|
||||
| സമയാനുസൃത ഡാറ്റ ട്രെൻഡുകൾ കാണിക്കുക | ലൈൻ |
|
||||
| വിഭാഗങ്ങൾ താരതമ്യം ചെയ്യുക | ബാർ, പൈ |
|
||||
| മൊത്തം താരതമ്യം ചെയ്യുക | പൈ, സ്റ്റാക്ക് ബാർ |
|
||||
| ബന്ധങ്ങൾ കാണിക്കുക | സ്കാറ്റർ, ലൈൻ, ഫേസറ്റ്, ഡ്യുവൽ ലൈൻ |
|
||||
| വിതരണങ്ങൾ കാണിക്കുക | സ്കാറ്റർ, ഹിസ്റ്റോഗ്രാം, ബോക്സ് |
|
||||
| അനുപാതങ്ങൾ കാണിക്കുക | പൈ, ഡോണട്ട്, വാഫിൾ |
|
||||
|
||||
> ✅ നിങ്ങളുടെ ഡാറ്റയുടെ ഘടന അനുസരിച്ച്, ഒരു നൽകിയ ചാർട്ട് പിന്തുണയ്ക്കാൻ അത് ടെക്സ്റ്റിൽ നിന്ന് സംഖ്യാത്മകത്തിലേക്ക് മാറ്റേണ്ടിവരാം.
|
||||
|
||||
## വഞ്ചന ഒഴിവാക്കുക
|
||||
|
||||
ഒരു ഡാറ്റ സയന്റിസ്റ്റ് ശരിയായ ഡാറ്റയ്ക്ക് ശരിയായ ചാർട്ട് തിരഞ്ഞെടുക്കാൻ ശ്രദ്ധിച്ചാലും, ഡാറ്റയെ തന്നെ തകർക്കുന്ന വിധത്തിൽ ഒരു കാര്യം തെളിയിക്കാൻ ഡാറ്റ പ്രദർശിപ്പിക്കുന്ന നിരവധി മാർഗ്ഗങ്ങൾ ഉണ്ട്. വഞ്ചനാപരമായ ചാർട്ടുകളും ഇൻഫോഗ്രാഫിക്സും നിരവധി ഉദാഹരണങ്ങളുണ്ട്!
|
||||
|
||||
[](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
|
||||
|
||||
> 🎥 വഞ്ചനാപരമായ ചാർട്ടുകൾക്കുറിച്ചുള്ള കോൺഫറൻസ് ടോക്കിനായി മുകളിൽ ചിത്രത്തിൽ ക്ലിക്ക് ചെയ്യുക
|
||||
|
||||
ഈ ചാർട്ട് X അക്ഷം മറിച്ച് സത്യം മറിച്ച് കാണിക്കുന്നു, തീയതി അടിസ്ഥാനമാക്കി:
|
||||
|
||||

|
||||
|
||||
[ഈ ചാർട്ട്](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) കൂടുതൽ വഞ്ചനാപരമാണ്, കാരണം കണ്ണ് വലത്തേക്ക് ആകർഷിക്കപ്പെടുന്നു, കാലക്രമത്തിൽ COVID കേസുകൾ വിവിധ കൗണ്ടികളിൽ കുറയുകയാണെന്ന് നിഗമനം ചെയ്യാൻ. എന്നാൽ, തീയതികൾ സൂക്ഷ്മമായി നോക്കിയാൽ, അവ വഞ്ചനാപരമായ താഴ്ന്ന ട്രെൻഡ് നൽകാൻ പുനഃക്രമീകരിച്ചിട്ടുള്ളതായി കാണാം.
|
||||
|
||||

|
||||
|
||||
ഈ പ്രശസ്ത ഉദാഹരണം നിറവും മറിച്ച Y അക്ഷവും ഉപയോഗിച്ച് വഞ്ചന ചെയ്യുന്നു: തോക്കു-സഹായക നിയമം പാസായതിന് ശേഷം തോക്ക് മരണങ്ങൾ ഉയർന്നതായി നിഗമനം ചെയ്യേണ്ടതിനു പകരം, കണ്ണ് മറിച്ച് സത്യം തെറ്റായി കാണുന്നു:
|
||||
|
||||

|
||||
|
||||
ഈ വിചിത്രമായ ചാർട്ട് അനുപാതം എങ്ങനെ മാനിപ്പുലേറ്റ് ചെയ്യാമെന്ന് ഹാസ്യകരമായി കാണിക്കുന്നു:
|
||||
|
||||

|
||||
|
||||
തുല്യമായവയെ താരതമ്യം ചെയ്യുന്നത് മറ്റൊരു സംശയാസ്പദമായ തന്ത്രമാണ്. 'സ്പ്യൂറിയസ് കോറിലേഷൻസ്' എന്ന വിഷയത്തെക്കുറിച്ച് മുഴുവൻ വെബ്സൈറ്റ് [wonderful web site](https://tylervigen.com/spurious-correlations) ഉണ്ട്, മെയ്ൻയിലെ വിവാഹമോചന നിരക്കും മാർഗറിൻ ഉപഭോഗവും തമ്മിലുള്ള 'തथ്യങ്ങൾ' correlated ആയി പ്രദർശിപ്പിക്കുന്നു. Reddit ഗ്രൂപ്പ് ഡാറ്റയുടെ [അസൗന്ദര്യ ഉപയോഗങ്ങൾ](https://www.reddit.com/r/dataisugly/top/?t=all) ശേഖരിക്കുന്നു.
|
||||
|
||||
വഞ്ചനാപരമായ ചാർട്ടുകൾ കണ്ണിനെ എളുപ്പത്തിൽ എങ്ങനെ വഞ്ചിക്കാമെന്ന് മനസ്സിലാക്കുന്നത് പ്രധാനമാണ്. ഡാറ്റ സയന്റിസ്റ്റിന്റെ ഉദ്ദേശ്യം നല്ലതായാലും, പൈ ചാർട്ട് പോലുള്ള തെറ്റായ തരം തിരഞ്ഞെടുക്കുന്നത്, അതിൽ വളരെ അധികം വിഭാഗങ്ങൾ കാണിക്കുന്നത്, വഞ്ചനാപരമായിരിക്കാം.
|
||||
|
||||
## നിറം
|
||||
|
||||
മുകളിൽ 'ഫ്ലോറിഡ ഗൺ വയലൻസ്' ചാർട്ടിൽ നിങ്ങൾ കണ്ടതുപോലെ, നിറം ചാർട്ടുകൾക്ക് അധിക അർത്ഥം നൽകാൻ സഹായിക്കുന്നു, പ്രത്യേകിച്ച് ggplot2, RColorBrewer പോലുള്ള ലൈബ്രറികൾ ഉപയോഗിക്കാതെ നിർമ്മിച്ച ചാർട്ടുകളിൽ. നിങ്ങൾ കൈകൊണ്ട് ഒരു ചാർട്ട് നിർമ്മിക്കുമ്പോൾ, [നിറ സിദ്ധാന്തം](https://colormatters.com/color-and-design/basic-color-theory) കുറച്ച് പഠിക്കുക.
|
||||
|
||||
> ✅ ചാർട്ടുകൾ രൂപകൽപ്പന ചെയ്യുമ്പോൾ, ആക്സസിബിലിറ്റി ഒരു പ്രധാന ഘടകമാണെന്ന് ശ്രദ്ധിക്കുക. നിങ്ങളുടെ ചില ഉപയോക്താക്കൾക്ക് നിറം കാണാനാകാതെ പോകാം - നിങ്ങളുടെ ചാർട്ട് ദൃശ്യ വൈകല്യമുള്ള ഉപയോക്താക്കൾക്ക് നന്നായി കാണുന്നുണ്ടോ?
|
||||
|
||||
നിങ്ങളുടെ ചാർട്ടിനായി നിറങ്ങൾ തിരഞ്ഞെടുക്കുമ്പോൾ ശ്രദ്ധിക്കുക, കാരണം നിറം നിങ്ങൾ ഉദ്ദേശിക്കുന്നതിൽ വ്യത്യസ്തമായ അർത്ഥം നൽകാം. മുകളിൽ 'ഉയരം' ചാർട്ടിലെ 'പിങ്ക് ലേഡീസ്' ഒരു വ്യക്തമായ 'സ്ത്രീലിംഗ' അർത്ഥം നൽകുന്നു, ഇത് ചാർട്ടിന്റെ വിചിത്രതയിൽ കൂടി കൂട്ടിച്ചേർക്കുന്നു.
|
||||
|
||||
[നിറത്തിന്റെ അർത്ഥം](https://colormatters.com/color-symbolism/the-meanings-of-colors) ലോകത്തിന്റെ വിവിധ ഭാഗങ്ങളിൽ വ്യത്യസ്തമായിരിക്കാം, കൂടാതെ അവയുടെ ഷേഡിന്റെ അടിസ്ഥാനത്തിൽ അർത്ഥം മാറാം. പൊതുവെ, നിറങ്ങളുടെ അർത്ഥങ്ങൾ ഉൾപ്പെടുന്നു:
|
||||
|
||||
| നിറം | അർത്ഥം |
|
||||
| ------ | -------------------- |
|
||||
| ചുവപ്പ് | ശക്തി |
|
||||
| നീലം | വിശ്വാസം, വിശ്വസ്തത |
|
||||
| മഞ്ഞ | സന്തോഷം, ജാഗ്രത |
|
||||
| പച്ച | പരിസ്ഥിതി, ഭാഗ്യം, ഇർഷ്യ |
|
||||
| പർപ്പിൾ | സന്തോഷം |
|
||||
| ഓറഞ്ച് | ഉജ്ജ്വലത |
|
||||
|
||||
നിങ്ങൾക്ക് കസ്റ്റം നിറങ്ങളുള്ള ഒരു ചാർട്ട് നിർമ്മിക്കേണ്ടതുണ്ടെങ്കിൽ, നിങ്ങളുടെ ചാർട്ടുകൾ ആക്സസിബിൾ ആണെന്ന് ഉറപ്പാക്കുക, കൂടാതെ നിങ്ങൾ തിരഞ്ഞെടുക്കുന്ന നിറം നിങ്ങൾ നൽകാൻ ശ്രമിക്കുന്ന അർത്ഥത്തോട് പൊരുത്തപ്പെടുന്നു.
|
||||
|
||||
## വായനാസൗകര്യത്തിനായി നിങ്ങളുടെ ചാർട്ടുകൾ സ്റ്റൈൽ ചെയ്യുക
|
||||
|
||||
ചാർട്ടുകൾ വായിക്കാൻ കഴിയാത്ത പക്ഷം അർത്ഥവത്തായിരിക്കില്ല! നിങ്ങളുടെ ഡാറ്റയ്ക്ക് അനുസരിച്ച് ചാർട്ടിന്റെ വീതി, ഉയരം എന്നിവ സ്റ്റൈൽ ചെയ്യാൻ ഒരു നിമിഷം ചെലവഴിക്കുക. ഒരു വേരിയബിൾ (ഉദാ: എല്ലാ 50 സംസ്ഥാനങ്ങളും) പ്രദർശിപ്പിക്കേണ്ടതുണ്ടെങ്കിൽ, സാധ്യമായെങ്കിൽ Y അക്ഷത്തിൽ ലംബമായി കാണിക്കുക, അതിനാൽ കൂറ്റൻ ഹോരിസോണ്ടൽ സ്ക്രോൾ ചെയ്യേണ്ടി വരാതിരിക്കും.
|
||||
|
||||
നിങ്ങളുടെ അക്ഷങ്ങൾ ലേബൽ ചെയ്യുക, ആവശ്യമെങ്കിൽ ലെജൻഡ് നൽകുക, ഡാറ്റയുടെ മികച്ച മനസ്സിലാക്കലിനായി ടൂൾടിപ്പുകൾ നൽകുക.
|
||||
|
||||
നിങ്ങളുടെ ഡാറ്റ ടെക്സ്റ്റ് ആണെങ്കിൽ, X അക്ഷ上的 വാചകം വായനാസൗകര്യത്തിനായി കോണിൽ കാണിക്കാം. [plot3D](https://cran.r-project.org/web/packages/plot3D/index.html) 3D പ്ലോട്ടിംഗ് നൽകുന്നു, നിങ്ങളുടെ ഡാറ്റ അത് പിന്തുണച്ചാൽ. അതുപയോഗിച്ച് സങ്കീർണ്ണമായ ഡാറ്റാ ദൃശ്യവത്കരണങ്ങൾ നിർമ്മിക്കാം.
|
||||
|
||||

|
||||
|
||||
## അനിമേഷൻ, 3D ചാർട്ട് പ്രദർശനം
|
||||
|
||||
ഇന്നത്തെ മികച്ച ഡാറ്റാ ദൃശ്യവത്കരണങ്ങളിൽ ചിലത് അനിമേറ്റഡ് ആണ്. Shirley Wu D3 ഉപയോഗിച്ച് '[film flowers](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)' പോലുള്ള അത്ഭുതകരമായവ ഉണ്ടാക്കി, ഓരോ പൂവും ഒരു സിനിമയുടെ ദൃശ്യവത്കരണമാണ്. Guardian-നായി മറ്റൊരു ഉദാഹരണം 'bussed out' ആണ്, Greensock, D3 എന്നിവയുമായി സംയോജിപ്പിച്ച ഇന്ററാക്ടീവ് അനുഭവം, സ്ക്രോൾടെല്ലിംഗ് ലേഖന ഫോർമാറ്റിൽ NYC എങ്ങനെ നഗരത്തിലെ ഹോമ്ലെസ്സ് പ്രശ്നം ബസ്സിലൂടെ പുറത്തേക്ക് കൊണ്ടുപോകുന്നു എന്ന് കാണിക്കുന്നു.
|
||||
|
||||

|
||||
|
||||
> "Bussed Out: How America Moves its Homeless" from [the Guardian](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). Visualizations by Nadieh Bremer & Shirley Wu
|
||||
|
||||
ഈ പാഠം ഈ ശക്തമായ ദൃശ്യവത്കരണ ലൈബ്രറികൾ പഠിപ്പിക്കാൻ മതിയാകാത്തതിനാൽ, Vue.js ആപ്പിൽ D3 ഉപയോഗിച്ച് "Dangerous Liaisons" എന്ന പുസ്തകത്തിന്റെ അനിമേറ്റഡ് സോഷ്യൽ നെറ്റ്വർക്ക് ദൃശ്യവത്കരണം പ്രദർശിപ്പിക്കാൻ ശ്രമിക്കുക.
|
||||
|
||||
> "Les Liaisons Dangereuses" ഒരു കത്ത് നോവലാണ്, അഥവാ കത്തുകളുടെ ഒരു പരമ്പരയായി അവതരിപ്പിച്ച നോവൽ. 1782-ൽ Choderlos de Laclos എഴുതിയ ഇത് ഫ്രഞ്ച് അരിപ്പ്രതിഷ്ഠിതരുടെ രണ്ട് മുഖ്യ കഥാപാത്രങ്ങളായ Vicomte de Valmont, Marquise de Merteuil എന്നിവരുടെ ക്രൂരവും നൈതികമായി തകർന്ന സാമൂഹിക തന്ത്രങ്ങളുടെ കഥ പറയുന്നു. ഇരുവരും അവസാനം മരണപ്പെടുന്നു, പക്ഷേ വലിയ സാമൂഹിക നാശം സൃഷ്ടിച്ചുകൊണ്ട്. നോവൽ അവരുടെ വൃത്തങ്ങളിൽ വിവിധ ആളുകൾക്ക് എഴുതിയ കത്തുകളുടെ പരമ്പരയായി തുറക്കുന്നു, പ്രതികാരം ചെയ്യാനോ പ്രശ്നങ്ങൾ സൃഷ്ടിക്കാനോ. ഈ കത്തുകളുടെ ദൃശ്യവത്കരണം സൃഷ്ടിച്ച് കഥയിലെ പ്രധാന കഥാപാത്രങ്ങളെ ദൃശ്യമായി കണ്ടെത്തുക.
|
||||
|
||||
നിങ്ങൾ ഒരു വെബ് ആപ്പ് പൂർത്തിയാക്കും, ഇത് ഈ സോഷ്യൽ നെറ്റ്വർക്ക് അനിമേറ്റഡ് ദൃശ്യവത്കരണം പ്രദർശിപ്പിക്കും. ഇത് Vue.js, D3 ഉപയോഗിച്ച് [നെറ്റ്വർക്ക് ദൃശ്യവത്കരണം](https://github.com/emiliorizzo/vue-d3-network) സൃഷ്ടിക്കാൻ നിർമ്മിച്ച ഒരു ലൈബ്രറി ഉപയോഗിക്കുന്നു. ആപ്പ് പ്രവർത്തിക്കുമ്പോൾ, സ്ക്രീനിൽ നോഡുകൾ നീക്കി ഡാറ്റ മാറ്റാം.
|
||||
|
||||

|
||||
|
||||
## പ്രോജക്ട്: D3.js ഉപയോഗിച്ച് ഒരു നെറ്റ്വർക്ക് കാണിക്കുന്ന ചാർട്ട് നിർമ്മിക്കുക
|
||||
|
||||
> ഈ പാഠം ഫോൾഡറിൽ `solution` ഫോൾഡർ ഉൾപ്പെടുന്നു, അവിടെ പൂർത്തിയായ പ്രോജക്ട് നിങ്ങളുടെ റഫറൻസിനായി ലഭ്യമാണ്.
|
||||
|
||||
1. സ്റ്റാർട്ടർ ഫോൾഡറിന്റെ റൂട്ടിലുള്ള README.md ഫയലിലെ നിർദ്ദേശങ്ങൾ പിന്തുടരുക. നിങ്ങളുടെ മെഷീനിൽ NPM, Node.js പ്രവർത്തിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക, തുടർന്ന് പ്രോജക്ടിന്റെ ഡിപ്പൻഡൻസികൾ ഇൻസ്റ്റാൾ ചെയ്യുക.
|
||||
|
||||
2. `starter/src` ഫോൾഡർ തുറക്കുക. അവിടെ ഒരു `assets` ഫോൾഡർ കാണും, അതിൽ നോവലിലെ എല്ലാ കത്തുകളും നമ്പർ ചെയ്തും 'to' 'from' അനോട്ടേഷനോടും ഉള്ള .json ഫയൽ കാണാം.
|
||||
|
||||
3. `components/Nodes.vue`-ൽ കോഡ് പൂർത്തിയാക്കുക, ദൃശ്യവത്കരണം സജ്ജമാക്കാൻ. `createLinks()` എന്ന മെത്തഡ് കണ്ടെത്തി താഴെ കൊടുത്ത നസ്റ്റഡ് ലൂപ്പ് ചേർക്കുക.
|
||||
|
||||
.json ഒബ്ജക്റ്റിൽ 'to' 'from' ഡാറ്റ പിടിച്ച് `links` ഒബ്ജക്റ്റ് നിർമ്മിക്കുക, ദൃശ്യവത്കരണ ലൈബ്രറി അത് ഉപയോഗിക്കാനായി:
|
||||
|
||||
```javascript
|
||||
//അക്ഷരങ്ങളിലൂടെ ലൂപ്പ് ചെയ്യുക
|
||||
let f = 0;
|
||||
let t = 0;
|
||||
for (var i = 0; i < letters.length; i++) {
|
||||
for (var j = 0; j < characters.length; j++) {
|
||||
|
||||
if (characters[j] == letters[i].from) {
|
||||
f = j;
|
||||
}
|
||||
if (characters[j] == letters[i].to) {
|
||||
t = j;
|
||||
}
|
||||
}
|
||||
this.links.push({ sid: f, tid: t });
|
||||
}
|
||||
```
|
||||
|
||||
|
||||
ടെർമിനലിൽ നിന്ന് നിങ്ങളുടെ ആപ്പ് ഓടിക്കുക (npm run serve) ദൃശ്യവത്കരണം ആസ്വദിക്കുക!
|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഇന്റർനെറ്റിൽ വഞ്ചനാപരമായ ദൃശ്യവത്കരണങ്ങൾ കണ്ടെത്താൻ ഒരു യാത്ര നടത്തുക. എഴുത്തുകാരൻ ഉപയോക്താവിനെ എങ്ങനെ വഞ്ചിക്കുന്നു, അത് ഉദ്ദേശിച്ചിട്ടുള്ളതാണോ? ദൃശ്യവത്കരണങ്ങൾ ശരിയാക്കാൻ ശ്രമിക്കുക, അവ എങ്ങനെ കാണിക്കേണ്ടതാണെന്ന് കാണിക്കാൻ.
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/25)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
വഞ്ചനാപരമായ ഡാറ്റാ ദൃശ്യവത്കരണത്തെക്കുറിച്ച് വായിക്കാനുള്ള ചില ലേഖനങ്ങൾ:
|
||||
|
||||
https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
|
||||
|
||||
http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
|
||||
|
||||
ചരിത്ര ആസ്തികളും വസ്തുക്കളും സംബന്ധിച്ച രസകരമായ ദൃശ്യവത്കരണങ്ങൾ കാണുക:
|
||||
|
||||
https://handbook.pubpub.org/
|
||||
|
||||
അനിമേഷൻ നിങ്ങളുടെ ദൃശ്യവത്കരണങ്ങൾ എങ്ങനെ മെച്ചപ്പെടുത്താമെന്ന് ഈ ലേഖനം കാണുക:
|
||||
|
||||
https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[നിങ്ങളുടെ സ്വന്തം കസ്റ്റം ദൃശ്യവത്കരണം നിർമ്മിക്കുക](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,45 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "1441550a0d789796b2821e04f7f4cc94",
|
||||
"translation_date": "2025-12-19T13:35:23+00:00",
|
||||
"source_file": "3-Data-Visualization/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ദൃശ്യവത്കരണങ്ങൾ
|
||||
|
||||

|
||||
> ഫോട്ടോ <a href="https://unsplash.com/@jenna2980?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ജെന്ന ലി</a> യുടെ <a href="https://unsplash.com/s/photos/bees-in-a-meadow?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">അൺസ്പ്ലാഷിൽ</a> നിന്നാണ്
|
||||
|
||||
|
||||
ഡാറ്റാ സയന്റിസ്റ്റിന്റെ ഏറ്റവും പ്രധാനപ്പെട്ട ജോലികളിലൊന്നാണ് ഡാറ്റ ദൃശ്യവത്കരിക്കൽ. ചിത്രങ്ങൾ 1000 വാക്കുകൾക്ക് തുല്യമാണ്, ഒരു ദൃശ്യവത്കരണം നിങ്ങളുടെ ഡാറ്റയിലെ സ്പൈക്കുകൾ, ഔട്ട്ലൈയേഴ്സ്, ഗ്രൂപ്പിംഗുകൾ, പ്രവണതകൾ തുടങ്ങിയ വിവിധ രസകരമായ ഭാഗങ്ങൾ തിരിച്ചറിയാൻ സഹായിക്കും, ഇത് നിങ്ങളുടെ ഡാറ്റ പറയാൻ ശ്രമിക്കുന്ന കഥ മനസ്സിലാക്കാൻ സഹായിക്കും.
|
||||
|
||||
ഈ അഞ്ചു പാഠങ്ങളിൽ, നിങ്ങൾ പ്രകൃതിയിൽ നിന്നുള്ള ഡാറ്റ പരിശോധിച്ച് വിവിധ സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് രസകരവും മനോഹരവുമായ ദൃശ്യവത്കരണങ്ങൾ സൃഷ്ടിക്കും.
|
||||
|
||||
| വിഷയം നമ്പർ | വിഷയം | ലിങ്കുചെയ്ത പാഠം | രചയിതാവ് |
|
||||
| :-----------: | :--: | :-----------: | :----: |
|
||||
| 1. | അളവുകൾ ദൃശ്യവത്കരിക്കൽ | <ul> <li> [Python](09-visualization-quantities/README.md)</li> <li>[R](../../../3-Data-Visualization/R/09-visualization-quantities) </li> </ul>|<ul> <li> [ജെൻ ലൂപ്പർ](https://twitter.com/jenlooper)</li><li> [വിദുഷി ഗുപ്ത](https://github.com/Vidushi-Gupta)</li> <li>[ജസ്ലീൻ സോന്ധി](https://github.com/jasleen101010)</li></ul> |
|
||||
| 2. | വിതരണ ദൃശ്യവത്കരിക്കൽ | <ul> <li> [Python](10-visualization-distributions/README.md)</li> <li>[R](../../../3-Data-Visualization/R/10-visualization-distributions) </li> </ul>|<ul> <li> [ജെൻ ലൂപ്പർ](https://twitter.com/jenlooper)</li><li> [വിദുഷി ഗുപ്ത](https://github.com/Vidushi-Gupta)</li> <li>[ജസ്ലീൻ സോന്ധി](https://github.com/jasleen101010)</li></ul> |
|
||||
| 3. | അനുപാതങ്ങൾ ദൃശ്യവത്കരിക്കൽ | <ul> <li> [Python](11-visualization-proportions/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [ജെൻ ലൂപ്പർ](https://twitter.com/jenlooper)</li><li> [വിദുഷി ഗുപ്ത](https://github.com/Vidushi-Gupta)</li> <li>[ജസ്ലീൻ സോന്ധി](https://github.com/jasleen101010)</li></ul> |
|
||||
| 4. | ബന്ധങ്ങൾ ദൃശ്യവത്കരിക്കൽ | <ul> <li> [Python](12-visualization-relationships/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [ജെൻ ലൂപ്പർ](https://twitter.com/jenlooper)</li><li> [വിദുഷി ഗുപ്ത](https://github.com/Vidushi-Gupta)</li> <li>[ജസ്ലീൻ സോന്ധി](https://github.com/jasleen101010)</li></ul> |
|
||||
| 5. | അർത്ഥപൂർണമായ ദൃശ്യവത്കരണങ്ങൾ സൃഷ്ടിക്കൽ | <ul> <li> [Python](13-meaningful-visualizations/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [ജെൻ ലൂപ്പർ](https://twitter.com/jenlooper)</li><li> [വിദുഷി ഗുപ്ത](https://github.com/Vidushi-Gupta)</li> <li>[ജസ്ലീൻ സോന്ധി](https://github.com/jasleen101010)</li></ul> |
|
||||
|
||||
### ക്രെഡിറ്റുകൾ
|
||||
|
||||
ഈ ദൃശ്യവത്കരണ പാഠങ്ങൾ 🌸 [ജെൻ ലൂപ്പർ](https://twitter.com/jenlooper), [ജസ്ലീൻ സോന്ധി](https://github.com/jasleen101010) , [വിദുഷി ഗുപ്ത](https://github.com/Vidushi-Gupta) എന്നിവരാൽ എഴുതപ്പെട്ടതാണ്.
|
||||
|
||||
🍯 US ഹണി പ്രൊഡക്ഷൻ ഡാറ്റ ജെസിക്ക ലിയുടെ [Kaggle](https://www.kaggle.com/jessicali9530/honey-production) പ്രോജക്ടിൽ നിന്നാണ് ലഭിച്ചത്. [ഡാറ്റ](https://usda.library.cornell.edu/concern/publications/rn301137d) യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് ഡിപ്പാർട്ട്മെന്റ് ഓഫ് അഗ്രിക്കൾച്ചർ [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php) യിൽ നിന്നാണ് ലഭിച്ചത്.
|
||||
|
||||
🍄 കൂൺമഷ്റൂം ഡാറ്റയും [Kaggle](https://www.kaggle.com/hatterasdunton/mushroom-classification-updated-dataset) യിൽ നിന്നാണ്, ഹാറ്ററാസ് ഡൺടൺ തിരുത്തിയതാണ്. ഈ ഡാറ്റാസെറ്റിൽ അഗാരിക്കസ്, ലെപിയോട്ട കുടുംബത്തിലെ 23 സ്പീഷീസുകളിലെ ഗില്ലഡ് കൂൺമഷ്റൂമുകളുടെ സങ്കൽപ്പിത സാമ്പിളുകളുടെ വിവരണങ്ങൾ ഉൾപ്പെടുന്നു. കൂൺമഷ്റൂം ദി ഓഡുബോൺ സൊസൈറ്റി ഫീൽഡ് ഗൈഡ് ടു നോർത്ത് അമേരിക്കൻ മഷ്റൂമ്സ് (1981) ൽ നിന്നാണ് വരച്ചത്. ഈ ഡാറ്റാസെറ്റ് 1987-ൽ UCI ML 27-ന് ദാനം ചെയ്തതാണ്.
|
||||
|
||||
🦆 മിന്നസോട്ട ബേർഡ്സ് ഡാറ്റ [Kaggle](https://www.kaggle.com/hannahcollins/minnesota-birds) യിൽ നിന്നാണ്, ഹന്നാ കോളിൻസ് [Wikipedia](https://en.wikipedia.org/wiki/List_of_birds_of_Minnesota) യിൽ നിന്നുള്ള ഡാറ്റ സ്ക്രാപ്പ് ചെയ്തതാണ്.
|
||||
|
||||
ഈ എല്ലാ ഡാറ്റാസെറ്റുകളും [CC0: Creative Commons](https://creativecommons.org/publicdomain/zero/1.0/) ലൈസൻസിൽ ലഭ്യമാണ്.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,121 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "07e12a25d20b8f191e3cb651c27fdb2b",
|
||||
"translation_date": "2025-12-19T15:27:04+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/14-Introduction/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഡാറ്റാ സയൻസ് ലൈഫ്സൈക്കിൾ പരിചയം
|
||||
|
||||
| ](../../sketchnotes/14-DataScience-Lifecycle.png)|
|
||||
|:---:|
|
||||
| ഡാറ്റാ സയൻസ് ലൈഫ്സൈക്കിൾ പരിചയം - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/26)
|
||||
|
||||
ഇപ്പോൾ നിങ്ങൾക്ക് ഡാറ്റാ സയൻസ് ഒരു പ്രക്രിയയാണ് എന്ന് മനസ്സിലായിരിക്കാം. ഈ പ്രക്രിയ 5 ഘട്ടങ്ങളായി വിഭജിക്കാം:
|
||||
|
||||
- പിടിച്ചെടുക്കൽ
|
||||
- പ്രോസസ്സിംഗ്
|
||||
- വിശകലനം
|
||||
- ആശയവിനിമയം
|
||||
- പരിപാലനം
|
||||
|
||||
ഈ പാഠം ലൈഫ്സൈക്കിളിന്റെ 3 ഭാഗങ്ങളായ പിടിച്ചെടുക്കൽ, പ്രോസസ്സിംഗ്, പരിപാലനം എന്നിവയിൽ കേന്ദ്രീകരിക്കുന്നു.
|
||||
|
||||

|
||||
> ഫോട്ടോ: [ബർക്ക്ലി സ്കൂൾ ഓഫ് ഇൻഫർമേഷൻ](https://ischoolonline.berkeley.edu/data-science/what-is-data-science/)
|
||||
|
||||
## പിടിച്ചെടുക്കൽ
|
||||
|
||||
ലൈഫ്സൈക്കിളിന്റെ ആദ്യ ഘട്ടം വളരെ പ്രധാനമാണ്, കാരണം അടുത്ത ഘട്ടങ്ങൾ ഇതിൽ ആശ്രയിച്ചിരിക്കുന്നു. ഇത് പ്രായോഗികമായി രണ്ട് ഘട്ടങ്ങൾ ഒന്നിച്ച് ചേർന്നതാണ്: ഡാറ്റാ സമാഹരണം, ഉദ്ദേശ്യവും പരിഹരിക്കേണ്ട പ്രശ്നങ്ങളും നിർവചിക്കൽ.
|
||||
പ്രോജക്ടിന്റെ ലക്ഷ്യങ്ങൾ നിർവചിക്കാൻ പ്രശ്നം അല്ലെങ്കിൽ ചോദ്യത്തെക്കുറിച്ചുള്ള കൂടുതൽ പശ്ചാത്തലം ആവശ്യമുണ്ട്. ആദ്യം, പ്രശ്നം പരിഹരിക്കേണ്ടവരെ തിരിച്ചറിയുകയും സമാഹരിക്കുകയും ചെയ്യണം. ഇവ ബിസിനസിലെ സ്റ്റേക്ക്ഹോൾഡർമാരോ പ്രോജക്ടിന്റെ സ്പോൺസർമാരോ ആയിരിക്കാം, അവർക്ക് ഈ പ്രോജക്ടിൽ നിന്നു ആരോ എന്തോ പ്രയോജനം ലഭിക്കുമെന്ന് തിരിച്ചറിയാൻ സഹായിക്കും, കൂടാതെ എന്ത്, എന്തുകൊണ്ട് അതു ആവശ്യമാണ് എന്നും. നന്നായി നിർവചിച്ച ലക്ഷ്യം അളക്കാവുന്നതും കണക്കാക്കാവുന്നതുമായിരിക്കണം, അംഗീകരിക്കാവുന്ന ഫലം നിർവചിക്കാൻ.
|
||||
|
||||
ഡാറ്റാ സയന്റിസ്റ്റ് ചോദിക്കാവുന്ന ചോദ്യങ്ങൾ:
|
||||
- ഈ പ്രശ്നം മുമ്പ് സമീപിച്ചിട്ടുണ്ടോ? എന്താണ് കണ്ടെത്തിയത്?
|
||||
- പങ്കാളികളിൽ എല്ലാവർക്കും ഉദ്ദേശ്യവും ലക്ഷ്യവും മനസ്സിലായിട്ടുണ്ടോ?
|
||||
- സംശയം ഉണ്ടോ, അത് കുറയ്ക്കാൻ എങ്ങനെ?
|
||||
- നിയന്ത്രണങ്ങൾ എന്തെല്ലാം?
|
||||
- അവസാനം ഫലം എങ്ങനെ കാണപ്പെടും?
|
||||
- എത്ര വിഭവങ്ങൾ (സമയം, ആളുകൾ, കംപ്യൂട്ടേഷൻ) ലഭ്യമാണ്?
|
||||
|
||||
അടുത്തത് നിർവചിച്ച ലക്ഷ്യങ്ങൾ നേടാൻ ആവശ്യമായ ഡാറ്റ തിരിച്ചറിയൽ, ശേഖരണം, പിന്നീട് പരിശോധിക്കൽ. സമാഹരണ ഘട്ടത്തിൽ, ഡാറ്റാ സയന്റിസ്റ്റുകൾ ഡാറ്റയുടെ അളവും ഗുണനിലവാരവും വിലയിരുത്തണം. ഇത് ആവശ്യമായ ഫലം നേടാൻ സഹായിക്കുന്ന ഡാറ്റ സമാഹരിച്ചതാണെന്ന് സ്ഥിരീകരിക്കാൻ ഡാറ്റാ എക്സ്പ്ലോറേഷൻ ആവശ്യമാണ്.
|
||||
|
||||
ഡാറ്റയെക്കുറിച്ച് ഡാറ്റാ സയന്റിസ്റ്റ് ചോദിക്കാവുന്ന ചോദ്യങ്ങൾ:
|
||||
- എനിക്ക് ഇതിനകം ലഭ്യമായ ഡാറ്റ എന്തെല്ലാം?
|
||||
- ഈ ഡാറ്റയുടെ ഉടമ ആരാണ്?
|
||||
- സ്വകാര്യത സംബന്ധിച്ച ആശങ്കകൾ എന്തെല്ലാം?
|
||||
- ഈ പ്രശ്നം പരിഹരിക്കാൻ എനിക്ക് മതിയായ ഡാറ്റ ഉണ്ടോ?
|
||||
- ഈ പ്രശ്നത്തിന് ഡാറ്റയുടെ ഗുണനിലവാരം അംഗീകരിക്കാവുന്നതാണോ?
|
||||
- ഈ ഡാറ്റ വഴി അധിക വിവരങ്ങൾ കണ്ടെത്തിയാൽ, ലക്ഷ്യങ്ങൾ മാറ്റം വരുത്തണോ?
|
||||
|
||||
## പ്രോസസ്സിംഗ്
|
||||
|
||||
ലൈഫ്സൈക്കിളിന്റെ പ്രോസസ്സിംഗ് ഘട്ടം ഡാറ്റയിൽ പാറ്റേണുകൾ കണ്ടെത്തലും മോഡലിംഗ് ചെയ്യലും ആണ്. ഈ ഘട്ടത്തിൽ ചില സാങ്കേതിക വിദ്യകൾ പാറ്റേണുകൾ കണ്ടെത്താൻ സാംഖ്യിക രീതികൾ ഉപയോഗിക്കുന്നു. സാധാരണയായി വലിയ ഡാറ്റാ സെറ്റിൽ മനുഷ്യൻക്ക് ഇത് ബുദ്ധിമുട്ടുള്ള ജോലി ആയിരിക്കും, അതിനാൽ കംപ്യൂട്ടറുകൾ പ്രക്രിയ വേഗത്തിലാക്കാൻ സഹായിക്കും. ഈ ഘട്ടത്തിലാണ് ഡാറ്റാ സയൻസ്, മെഷീൻ ലേണിംഗ് തമ്മിൽ മുട്ടിച്ചേരുന്നത്. ആദ്യ പാഠത്തിൽ പഠിച്ചതുപോലെ, മെഷീൻ ലേണിംഗ് ഡാറ്റ മനസ്സിലാക്കാൻ മോഡലുകൾ നിർമ്മിക്കുന്ന പ്രക്രിയയാണ്. മോഡലുകൾ ഡാറ്റയിലെ വ്യത്യസ്ത വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം പ്രതിനിധീകരിച്ച് ഫലങ്ങൾ പ്രവചിക്കാൻ സഹായിക്കുന്നു.
|
||||
|
||||
ഈ ഘട്ടത്തിൽ ഉപയോഗിക്കുന്ന സാധാരണ സാങ്കേതിക വിദ്യകൾ ML for Beginners പാഠ്യപദ്ധതിയിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. അവയെക്കുറിച്ച് കൂടുതൽ അറിയാൻ താഴെയുള്ള ലിങ്കുകൾ പിന്തുടരുക:
|
||||
|
||||
- [ക്ലാസിഫിക്കേഷൻ](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification): ഡാറ്റയെ വർഗ്ഗങ്ങളായി ക്രമീകരിച്ച് കൂടുതൽ ഫലപ്രദമായി ഉപയോഗിക്കുക.
|
||||
- [ക്ലസ്റ്ററിംഗ്](https://github.com/microsoft/ML-For-Beginners/tree/main/5-Clustering): സമാനമായ ഗ്രൂപ്പുകളായി ഡാറ്റ കൂട്ടിച്ചേർക്കുക.
|
||||
- [റെഗ്രഷൻ](https://github.com/microsoft/ML-For-Beginners/tree/main/2-Regression): മൂല്യങ്ങൾ പ്രവചിക്കാൻ വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം കണ്ടെത്തുക.
|
||||
|
||||
## പരിപാലനം
|
||||
ലൈഫ്സൈക്കിൾ ഡയഗ്രാമിൽ, പരിപാലനം പിടിച്ചെടുക്കലിനും പ്രോസസ്സിംഗിനും ഇടയിൽ കാണാം. പരിപാലനം ഒരു പ്രോജക്ടിന്റെ മുഴുവൻ കാലയളവിലും ഡാറ്റ മാനേജ്മെന്റ്, സംഭരണം, സുരക്ഷ എന്നിവയുടെ തുടർച്ചയായ പ്രക്രിയയാണ്.
|
||||
|
||||
### ഡാറ്റ സംഭരണം
|
||||
ഡാറ്റ എങ്ങനെ എവിടെ സംഭരിക്കപ്പെടുന്നു എന്നത് സംഭരണ ചെലവും ഡാറ്റ എത്ര വേഗത്തിൽ ആക്സസ് ചെയ്യാമെന്നതും ബാധിക്കുന്നു. ഈ വിധത്തിലുള്ള തീരുമാനങ്ങൾ സാധാരണയായി ഡാറ്റാ സയന്റിസ്റ്റ് മാത്രം എടുക്കാറില്ല, പക്ഷേ ഡാറ്റ എങ്ങനെ സംഭരിച്ചിരിക്കുന്നു എന്നതിനെ അടിസ്ഥാനമാക്കി ഡാറ്റ കൈകാര്യം ചെയ്യുന്നതിൽ അവർ തീരുമാനങ്ങൾ എടുക്കേണ്ടി വരാം.
|
||||
|
||||
ഇവിടെ ആധുനിക ഡാറ്റ സംഭരണ സംവിധാനങ്ങളുടെ ചില ഘടകങ്ങൾ ഉണ്ട്, ഇവ ഈ തീരുമാനങ്ങളെ ബാധിക്കാം:
|
||||
|
||||
**ഓൺ പ്രെമൈസ് vs ഓഫ് പ്രെമൈസ് vs പബ്ലിക് അല്ലെങ്കിൽ പ്രൈവറ്റ് ക്ലൗഡ്**
|
||||
|
||||
ഓൺ പ്രെമൈസ് എന്നത് നിങ്ങളുടെ സ്വന്തം ഉപകരണങ്ങളിൽ ഡാറ്റ ഹോസ്റ്റ് ചെയ്ത് മാനേജുചെയ്യുന്നതാണ്, ഉദാഹരണത്തിന് ഹാർഡ് ഡ്രൈവ് ഉള്ള സെർവർ. ഓഫ് പ്രെമൈസ് എന്നാൽ നിങ്ങൾക്ക് സ്വന്തമല്ലാത്ത ഉപകരണങ്ങളിൽ ആശ്രയിച്ചിരിക്കുന്നു, ഉദാഹരണത്തിന് ഡാറ്റ സെന്റർ. പബ്ലിക് ക്ലൗഡ് ഡാറ്റ എവിടെ എങ്ങനെ സംഭരിക്കപ്പെടുന്നു എന്നറിയാതെ ഡാറ്റ സംഭരിക്കാൻ ജനപ്രിയമായ ഒരു തിരഞ്ഞെടുപ്പാണ്, ഇവിടെ പബ്ലിക് എന്നത് ക്ലൗഡ് ഉപയോഗിക്കുന്ന എല്ലാവർക്കും പങ്കുവെക്കുന്ന ഏകീകൃത അടിസ്ഥാന ഘടനയെ സൂചിപ്പിക്കുന്നു. ചില സംഘടനകൾക്ക് കർശനമായ സുരക്ഷാ നയങ്ങൾ ഉണ്ട്, അവയ്ക്ക് ഡാറ്റ ഹോസ്റ്റ് ചെയ്യുന്ന ഉപകരണങ്ങളിൽ പൂർണ്ണ ആക്സസ് വേണം, അതിനാൽ അവർ സ്വന്തം ക്ലൗഡ് സേവനങ്ങൾ നൽകുന്ന പ്രൈവറ്റ് ക്ലൗഡിൽ ആശ്രയിക്കുന്നു. ക്ലൗഡിലെ ഡാറ്റയെക്കുറിച്ച് കൂടുതൽ അറിയാൻ [പിന്നീട് പാഠങ്ങൾ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/5-Data-Science-In-Cloud) കാണുക.
|
||||
|
||||
**കൂൾ vs ഹോട്ട് ഡാറ്റ**
|
||||
|
||||
മോഡലുകൾ പരിശീലിപ്പിക്കുമ്പോൾ കൂടുതൽ പരിശീലന ഡാറ്റ ആവശ്യമാകാം. മോഡലിൽ തൃപ്തിയുണ്ടെങ്കിൽ, കൂടുതൽ ഡാറ്റ മോഡലിന്റെ ലക്ഷ്യം നിറവേറ്റാൻ എത്തും. എങ്കിലും, ഡാറ്റ സംഭരിക്കുന്നതും ആക്സസ് ചെയ്യുന്നതും ചെലവ് കൂടും. അപൂർവമായി ഉപയോഗിക്കുന്ന ഡാറ്റ (കൂൾ ഡാറ്റ) സ്ഥിരമായി ആക്സസ് ചെയ്യുന്ന ഡാറ്റ (ഹോട്ട് ഡാറ്റ) മുതൽ വേർതിരിക്കുന്നത് ഹാർഡ്വെയർ അല്ലെങ്കിൽ സോഫ്റ്റ്വെയർ സേവനങ്ങളിലൂടെ ചെലവുകുറഞ്ഞ ഡാറ്റ സംഭരണ ഓപ്ഷൻ ആകാം. കൂൾ ഡാറ്റ ആക്സസ് ചെയ്യേണ്ടിവന്നാൽ, ഹോട്ട് ഡാറ്റയേക്കാൾ കുറച്ച് കൂടുതൽ സമയം എടുക്കാം.
|
||||
|
||||
### ഡാറ്റ മാനേജ്മെന്റ്
|
||||
ഡാറ്റ ഉപയോഗിക്കുമ്പോൾ, [ഡാറ്റാ പ്രിപറേഷൻ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/08-data-preparation) പാഠത്തിൽ ഉൾപ്പെടുത്തിയ ചില സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് ഡാറ്റ ശുദ്ധമാക്കേണ്ടതുണ്ടെന്ന് കണ്ടെത്താം, ഇത് കൃത്യമായ മോഡലുകൾ നിർമ്മിക്കാൻ സഹായിക്കും. പുതിയ ഡാറ്റ എത്തുമ്പോൾ, ഗുണനിലവാരം നിലനിർത്താൻ സമാനമായ പ്രയോഗങ്ങൾ ആവശ്യമാകും. ചില പ്രോജക്ടുകൾ ഡാറ്റ അന്തിമ സ്ഥലത്തേക്ക് മാറ്റുന്നതിന് മുമ്പ് ശുദ്ധീകരണം, സംഗ്രഹണം, കംപ്രഷൻ എന്നിവയ്ക്ക് ഓട്ടോമേറ്റഡ് ടൂൾ ഉപയോഗിക്കും. Azure Data Factory ഇതിന്റെ ഉദാഹരണമാണ്.
|
||||
|
||||
### ഡാറ്റ സുരക്ഷ
|
||||
ഡാറ്റ സുരക്ഷയുടെ പ്രധാന ലക്ഷ്യങ്ങളിൽ ഒന്നാണ് ഡാറ്റ കൈകാര്യം ചെയ്യുന്നവർ എന്ത് ശേഖരിക്കുന്നു, ഏത് സാഹചര്യത്തിൽ ഉപയോഗിക്കുന്നു എന്നിവ നിയന്ത്രണത്തിൽ വയ്ക്കുക. ഡാറ്റ സുരക്ഷിതമാക്കുന്നത് ആക്സസ് അവശ്യമായവർക്കു മാത്രം പരിമിതപ്പെടുത്തുക, പ്രാദേശിക നിയമങ്ങളും നയങ്ങളും പാലിക്കുക, [നൈതികതാ പാഠത്തിൽ](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/1-Introduction/02-ethics) ഉൾപ്പെടുത്തിയതുപോലെ നൈതിക മാനദണ്ഡങ്ങൾ പാലിക്കുക എന്നിവ ഉൾപ്പെടുന്നു.
|
||||
|
||||
സുരക്ഷയെക്കുറിച്ച് ഒരു ടീം ചെയ്യാവുന്ന ചില കാര്യങ്ങൾ:
|
||||
- എല്ലാ ഡാറ്റയും എൻക്രിപ്റ്റ് ചെയ്തിട്ടുണ്ടെന്ന് സ്ഥിരീകരിക്കുക
|
||||
- ഉപഭോക്താക്കൾക്ക് അവരുടെ ഡാറ്റ എങ്ങനെ ഉപയോഗിക്കുന്നു എന്ന വിവരം നൽകുക
|
||||
- പ്രോജക്ട് വിട്ടുപോയവരുടെ ഡാറ്റ ആക്സസ് നീക്കംചെയ്യുക
|
||||
- ചില പ്രോജക്ട് അംഗങ്ങൾക്കു മാത്രമേ ഡാറ്റ മാറ്റാൻ അനുവാദം നൽകൂ
|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
ഡാറ്റാ സയൻസ് ലൈഫ്സൈക്കിളിന്റെ പല പതിപ്പുകൾ ഉണ്ട്, ഓരോ ഘട്ടത്തിനും വ്യത്യസ്ത പേരുകളും ഘട്ടങ്ങളുടെ എണ്ണം വ്യത്യസ്തമായിരിക്കാം, പക്ഷേ ഈ പാഠത്തിൽ പരാമർശിച്ച പ്രക്രിയകൾ എല്ലാം ഉൾക്കൊള്ളും.
|
||||
|
||||
[ടീം ഡാറ്റാ സയൻസ് പ്രോസസ് ലൈഫ്സൈക്കിൾ](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/lifecycle)യും [ക്രോസ്-ഇൻഡസ്ട്രി സ്റ്റാൻഡേർഡ് പ്രോസസ് ഫോർ ഡാറ്റ മൈനിംഗ്](https://www.datascience-pm.com/crisp-dm-2/)യും പരിശോധിച്ച്, അവയുടെ 3 സാമ്യമുകളും വ്യത്യാസങ്ങളും പറയുക.
|
||||
|
||||
|ടീം ഡാറ്റാ സയൻസ് പ്രോസസ് (TDSP)|ക്രോസ്-ഇൻഡസ്ട്രി സ്റ്റാൻഡേർഡ് പ്രോസസ് ഫോർ ഡാറ്റ മൈനിംഗ് (CRISP-DM)|
|
||||
|--|--|
|
||||
| |  |
|
||||
| ചിത്രം: [Microsoft](https://docs.microsoft.comazure/architecture/data-science-process/lifecycle) | ചിത്രം: [Data Science Process Alliance](https://www.datascience-pm.com/crisp-dm-2/) |
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/27)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
ഡാറ്റാ സയൻസ് ലൈഫ്സൈക്കിൾ പ്രയോഗിക്കുന്നത് പല വേഷങ്ങളും ജോലികളും ഉൾക്കൊള്ളുന്നു, ചിലർ ഓരോ ഘട്ടത്തിന്റെ പ്രത്യേക ഭാഗങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കും. ടീം ഡാറ്റാ സയൻസ് പ്രോസസ് പ്രോജക്ടിൽ ഒരാൾക്കുണ്ടാകാവുന്ന വേഷങ്ങളും ജോലികളും വിശദീകരിക്കുന്ന ചില വിഭവങ്ങൾ നൽകുന്നു.
|
||||
|
||||
* [ടീം ഡാറ്റാ സയൻസ് പ്രോസസ് വേഷങ്ങളും ജോലികളും](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/roles-tasks)
|
||||
* [ഡാറ്റാ സയൻസ് ജോലികൾ നിർവഹിക്കുക: എക്സ്പ്ലോറേഷൻ, മോഡലിംഗ്, ഡിപ്ലോയ്മെന്റ്](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/execute-data-science-tasks)
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[ഡാറ്റാസെറ്റ് വിലയിരുത്തൽ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,38 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "564445c39ad29a491abcb9356fc4d47d",
|
||||
"translation_date": "2025-12-19T15:28:43+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/14-Introduction/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഒരു ഡാറ്റാസെറ്റ് വിലയിരുത്തൽ
|
||||
|
||||
നിങ്ങളുടെ ടീമിന് ഒരു ക്ലയന്റ് ന്യൂയോർക്ക് സിറ്റിയിലെ ടാക്സി ഉപഭോക്താവിന്റെ സീസണൽ ചെലവഴിക്കൽ ശീലങ്ങൾ അന്വേഷിക്കുന്നതിന് സഹായം തേടിയിട്ടുണ്ട്.
|
||||
|
||||
അവർ അറിയാൻ ആഗ്രഹിക്കുന്നത്: **ന്യൂയോർക്ക് സിറ്റിയിലെ മഞ്ഞ ടാക്സി യാത്രക്കാർ ശീതകാലത്തോ വേനൽക്കാലത്തോ ഡ്രൈവർമാർക്ക് കൂടുതൽ ടിപ്പ് നൽകുന്നുണ്ടോ?**
|
||||
|
||||
ഡാറ്റാ സയൻസ് ലൈഫ്സൈക്കിളിന്റെ [Capturing](Readme.md#Capturing) ഘട്ടത്തിലാണ് നിങ്ങളുടെ ടീം, നിങ്ങൾ ഡാറ്റാസെറ്റ് കൈകാര്യം ചെയ്യുന്നതിന് ഉത്തരവാദിയാണ്. പരിശോധിക്കാൻ നിങ്ങൾക്ക് ഒരു നോട്ട്ബുക്ക് കൂടാതെ [ഡാറ്റ](../../../../data/taxi.csv) നൽകിയിട്ടുണ്ട്.
|
||||
|
||||
ഈ ഡയറക്ടറിയിൽ [നോട്ട്ബുക്ക്](notebook.ipynb) ഉണ്ട്, ഇത് പൈത്തൺ ഉപയോഗിച്ച് [NYC Taxi & Limousine Commission](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets) നിന്നുള്ള മഞ്ഞ ടാക്സി യാത്രാ ഡാറ്റ ലോഡ് ചെയ്യുന്നു. ടാക്സി ഡാറ്റ ഫയൽ ടെക്സ്റ്റ് എഡിറ്റർ അല്ലെങ്കിൽ എക്സൽ പോലുള്ള സ്പ്രെഡ്ഷീറ്റ് സോഫ്റ്റ്വെയർ ഉപയോഗിച്ച് തുറക്കാനും കഴിയും.
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
- ഈ ഡാറ്റാസെറ്റിലുള്ള ഡാറ്റ ഈ ചോദ്യം ഉത്തരം നൽകാൻ സഹായിക്കുന്നുണ്ടോ എന്ന് വിലയിരുത്തുക.
|
||||
- [NYC Open Data കാറ്റലോഗ്](https://data.cityofnewyork.us/browse?sortBy=most_accessed&utf8=%E2%9C%93) പരിശോധിക്കുക. ക്ലയന്റിന്റെ ചോദ്യം ഉത്തരം നൽകുന്നതിൽ സഹായകമായ മറ്റൊരു ഡാറ്റാസെറ്റ് കണ്ടെത്തുക.
|
||||
- പ്രശ്നത്തെ കൂടുതൽ വ്യക്തമായി മനസിലാക്കാനും വിശദീകരിക്കാനും ക്ലയന്റിനോട് ചോദിക്കേണ്ട 3 ചോദ്യങ്ങൾ എഴുതുക.
|
||||
|
||||
ഡാറ്റയെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾക്ക് [ഡാറ്റാസെറ്റിന്റെ നിഘണ്ടു](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf)യും [ഉപയോക്തൃ ഗൈഡ്](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf)യും കാണുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,140 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# ശീതകാലത്തും വേനൽക്കാലത്തും NYC ടാക്സി ഡാറ്റ\r\n",
|
||||
"\r\n",
|
||||
"നൽകിയിരിക്കുന്ന കോളങ്ങളേക്കുറിച്ച് കൂടുതൽ അറിയാൻ [ഡാറ്റ ഡിക്ഷണറി](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) കാണുക.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"#Install the pandas library\r\n",
|
||||
"!pip install pandas"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {
|
||||
"scrolled": true
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 7,
|
||||
"source": [
|
||||
"import pandas as pd\r\n",
|
||||
"\r\n",
|
||||
"path = '../../data/taxi.csv'\r\n",
|
||||
"\r\n",
|
||||
"#Load the csv file into a dataframe\r\n",
|
||||
"df = pd.read_csv(path)\r\n",
|
||||
"\r\n",
|
||||
"#Print the dataframe\r\n",
|
||||
"print(df)\r\n"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "stream",
|
||||
"name": "stdout",
|
||||
"text": [
|
||||
" VendorID tpep_pickup_datetime tpep_dropoff_datetime passenger_count \\\n",
|
||||
"0 2.0 2019-07-15 16:27:53 2019-07-15 16:44:21 3.0 \n",
|
||||
"1 2.0 2019-07-17 20:26:35 2019-07-17 20:40:09 6.0 \n",
|
||||
"2 2.0 2019-07-06 16:01:08 2019-07-06 16:10:25 1.0 \n",
|
||||
"3 1.0 2019-07-18 22:32:23 2019-07-18 22:35:08 1.0 \n",
|
||||
"4 2.0 2019-07-19 14:54:29 2019-07-19 15:19:08 1.0 \n",
|
||||
".. ... ... ... ... \n",
|
||||
"195 2.0 2019-01-18 08:42:15 2019-01-18 08:56:57 1.0 \n",
|
||||
"196 1.0 2019-01-19 04:34:45 2019-01-19 04:43:44 1.0 \n",
|
||||
"197 2.0 2019-01-05 10:37:39 2019-01-05 10:42:03 1.0 \n",
|
||||
"198 2.0 2019-01-23 10:36:29 2019-01-23 10:44:34 2.0 \n",
|
||||
"199 2.0 2019-01-30 06:55:58 2019-01-30 07:07:02 5.0 \n",
|
||||
"\n",
|
||||
" trip_distance RatecodeID store_and_fwd_flag PULocationID DOLocationID \\\n",
|
||||
"0 2.02 1.0 N 186 233 \n",
|
||||
"1 1.59 1.0 N 141 161 \n",
|
||||
"2 1.69 1.0 N 246 249 \n",
|
||||
"3 0.90 1.0 N 229 141 \n",
|
||||
"4 4.79 1.0 N 237 107 \n",
|
||||
".. ... ... ... ... ... \n",
|
||||
"195 1.18 1.0 N 43 237 \n",
|
||||
"196 2.30 1.0 N 148 234 \n",
|
||||
"197 0.83 1.0 N 237 263 \n",
|
||||
"198 1.12 1.0 N 144 113 \n",
|
||||
"199 2.41 1.0 N 209 107 \n",
|
||||
"\n",
|
||||
" payment_type fare_amount extra mta_tax tip_amount tolls_amount \\\n",
|
||||
"0 1.0 12.0 1.0 0.5 4.08 0.0 \n",
|
||||
"1 2.0 10.0 0.5 0.5 0.00 0.0 \n",
|
||||
"2 2.0 8.5 0.0 0.5 0.00 0.0 \n",
|
||||
"3 1.0 4.5 3.0 0.5 1.65 0.0 \n",
|
||||
"4 1.0 19.5 0.0 0.5 5.70 0.0 \n",
|
||||
".. ... ... ... ... ... ... \n",
|
||||
"195 1.0 10.0 0.0 0.5 2.16 0.0 \n",
|
||||
"196 1.0 9.5 0.5 0.5 2.15 0.0 \n",
|
||||
"197 1.0 5.0 0.0 0.5 1.16 0.0 \n",
|
||||
"198 2.0 7.0 0.0 0.5 0.00 0.0 \n",
|
||||
"199 1.0 10.5 0.0 0.5 1.00 0.0 \n",
|
||||
"\n",
|
||||
" improvement_surcharge total_amount congestion_surcharge \n",
|
||||
"0 0.3 20.38 2.5 \n",
|
||||
"1 0.3 13.80 2.5 \n",
|
||||
"2 0.3 11.80 2.5 \n",
|
||||
"3 0.3 9.95 2.5 \n",
|
||||
"4 0.3 28.50 2.5 \n",
|
||||
".. ... ... ... \n",
|
||||
"195 0.3 12.96 0.0 \n",
|
||||
"196 0.3 12.95 0.0 \n",
|
||||
"197 0.3 6.96 0.0 \n",
|
||||
"198 0.3 7.80 0.0 \n",
|
||||
"199 0.3 12.30 0.0 \n",
|
||||
"\n",
|
||||
"[200 rows x 18 columns]\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"name": "python3",
|
||||
"display_name": "Python 3.9.7 64-bit ('venv': venv)"
|
||||
},
|
||||
"language_info": {
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"pygments_lexer": "ipython3",
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"version": "3.9.7",
|
||||
"nbconvert_exporter": "python",
|
||||
"file_extension": ".py"
|
||||
},
|
||||
"name": "04-nyc-taxi-join-weather-in-pandas",
|
||||
"notebookId": 1709144033725344,
|
||||
"interpreter": {
|
||||
"hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "3bd4c20c4e8f3158f483f0f1cc543bb1",
|
||||
"translation_date": "2025-12-19T17:11:50+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/14-Introduction/notebook.ipynb",
|
||||
"language_code": "ml"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
@ -0,0 +1,60 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "661dad02c3ac239644d34c1eb51e76f8",
|
||||
"translation_date": "2025-12-19T15:24:36+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/15-analyzing/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഡാറ്റ സയൻസ് ലൈഫ്സൈക്കിൾ: വിശകലനം
|
||||
|
||||
| ](../../sketchnotes/15-Analyzing.png)|
|
||||
|:---:|
|
||||
| ഡാറ്റ സയൻസ് ലൈഫ്സൈക്കിൾ: വിശകലനം - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/28)
|
||||
|
||||
ഡാറ്റ ലൈഫ്സൈക്കിളിലെ വിശകലനം, നിർദ്ദേശിച്ച ചോദ്യങ്ങൾക്ക് ഡാറ്റ ഉത്തരം നൽകാമോ എന്നതും ഒരു പ്രത്യേക പ്രശ്നം പരിഹരിക്കാമോ എന്നതും സ്ഥിരീകരിക്കുന്നു. ഈ ഘട്ടം, ഒരു മോഡൽ ഈ ചോദ്യങ്ങളും പ്രശ്നങ്ങളും ശരിയായി പരിഹരിക്കുന്നുണ്ടോ എന്ന് സ്ഥിരീകരിക്കുന്നതിലും കേന്ദ്രീകരിക്കാം. ഈ പാഠം എക്സ്പ്ലോറേറ്ററി ഡാറ്റ അനാലിസിസ് അല്ലെങ്കിൽ EDA-യെക്കുറിച്ചാണ്, ഇത് ഡാറ്റയിലെ ഫീച്ചറുകളും ബന്ധങ്ങളും നിർവചിക്കുന്ന സാങ്കേതിക വിദ്യകളാണ്, കൂടാതെ മോഡലിംഗിനായി ഡാറ്റ തയ്യാറാക്കാൻ ഉപയോഗിക്കാം.
|
||||
|
||||
Python-ഉം Pandas ലൈബ്രറിയും ഉപയോഗിച്ച് ഇത് എങ്ങനെ പ്രയോഗിക്കാമെന്ന് കാണിക്കാൻ [Kaggle](https://www.kaggle.com/balaka18/email-spam-classification-dataset-csv/version/1) നിന്നുള്ള ഒരു ഉദാഹരണ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കും. ഈ ഡാറ്റാസെറ്റിൽ ഇമെയിലുകളിൽ കാണപ്പെടുന്ന ചില സാധാരണ വാക്കുകളുടെ എണ്ണം ഉൾക്കൊള്ളുന്നു, ഈ ഇമെയിലുകളുടെ ഉറവിടങ്ങൾ അനാമികമാണ്. ഈ ഡയറക്ടറിയിലുള്ള [നോട്ട്ബുക്ക്](notebook.ipynb) ഉപയോഗിച്ച് പിന്തുടരുക.
|
||||
|
||||
## എക്സ്പ്ലോറേറ്ററി ഡാറ്റ അനാലിസിസ്
|
||||
|
||||
ലൈഫ്സൈക്കിളിന്റെ ക്യാപ്ചർ ഘട്ടം ഡാറ്റ സമ്പാദിക്കുകയും പ്രശ്നങ്ങളും ചോദ്യങ്ങളും കൈകാര്യം ചെയ്യുകയും ചെയ്യുന്ന ഘട്ടമാണ്, പക്ഷേ ഡാറ്റ അവസാന ഫലത്തെ പിന്തുണയ്ക്കുമെന്ന് എങ്ങനെ അറിയാം?
|
||||
ഡാറ്റ സയന്റിസ്റ്റ് ഡാറ്റ സമ്പാദിക്കുമ്പോൾ താഴെപ്പറയുന്ന ചോദ്യങ്ങൾ ചോദിക്കാമെന്ന് ഓർക്കുക:
|
||||
- ഈ പ്രശ്നം പരിഹരിക്കാൻ എനിക്ക് മതിയായ ഡാറ്റ ഉണ്ടോ?
|
||||
- ഈ പ്രശ്നത്തിന് ഡാറ്റയുടെ ഗുണമേന്മ സ്വീകരിക്കാവുന്നതാണോ?
|
||||
- ഈ ഡാറ്റ വഴി അധിക വിവരങ്ങൾ കണ്ടെത്തിയാൽ, ലക്ഷ്യങ്ങൾ മാറ്റുകയോ പുനർനിർവചിക്കുകയോ ചെയ്യണോ?
|
||||
എക്സ്പ്ലോറേറ്ററി ഡാറ്റ അനാലിസിസ് ആ ഡാറ്റയെ അറിയാനുള്ള പ്രക്രിയയാണ്, ഇത് ഈ ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാനും ഡാറ്റാസെറ്റുമായി പ്രവർത്തിക്കുമ്പോഴുള്ള വെല്ലുവിളികൾ തിരിച്ചറിയാനും സഹായിക്കുന്നു. ഇതു നേടാൻ ഉപയോഗിക്കുന്ന ചില സാങ്കേതിക വിദ്യകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കാം.
|
||||
|
||||
## ഡാറ്റ പ്രൊഫൈലിംഗ്, വിവരണാത്മക സ്ഥിതിവിവരക്കണക്കുകൾ, Pandas
|
||||
ഈ പ്രശ്നം പരിഹരിക്കാൻ എത്രമാത്രം ഡാറ്റ വേണ്ടെന്ന് എങ്ങനെ വിലയിരുത്താം? ഡാറ്റ പ്രൊഫൈലിംഗ്, വിവരണാത്മക സ്ഥിതിവിവരക്കണക്കുകളുടെ സാങ്കേതിക വിദ്യകൾ വഴി നമ്മുടെ ഡാറ്റാസെറ്റിനെക്കുറിച്ചുള്ള പൊതുവായ വിവരങ്ങൾ സംഗ്രഹിക്കുകയും ശേഖരിക്കുകയും ചെയ്യാം. ഡാറ്റ പ്രൊഫൈലിംഗ് നമ്മെ ലഭ്യമായതെന്താണെന്ന് മനസ്സിലാക്കാൻ സഹായിക്കുന്നു, വിവരണാത്മക സ്ഥിതിവിവരക്കണക്കുകൾ എത്രമാത്രം ലഭ്യമാണ് എന്ന് മനസ്സിലാക്കാൻ സഹായിക്കുന്നു.
|
||||
|
||||
മുമ്പത്തെ ചില പാഠങ്ങളിൽ, Pandas ഉപയോഗിച്ച് [`describe()` ഫംഗ്ഷൻ]( https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html) ഉപയോഗിച്ച് ചില വിവരണാത്മക സ്ഥിതിവിവരക്കണക്കുകൾ നൽകിയിട്ടുണ്ട്. ഇത് എണ്ണവും പരമാവധി, കുറഞ്ഞ മൂല്യങ്ങളും, ശരാശരി, സ്റ്റാൻഡേർഡ് ഡിവിയേഷൻ, ക്വാണ്ടൈലുകൾ എന്നിവ നൽകുന്നു. `describe()` പോലുള്ള വിവരണാത്മക സ്ഥിതിവിവരക്കണക്കുകൾ ഉപയോഗിച്ച് നിങ്ങൾക്ക് എത്രമാത്രം ഡാറ്റയുണ്ട് എന്നും കൂടുതൽ ആവശ്യമുണ്ടോ എന്നും വിലയിരുത്താൻ കഴിയും.
|
||||
|
||||
## സാമ്പിളിംഗ്, ക്വറി ചെയ്യൽ
|
||||
വലിയ ഡാറ്റാസെറ്റിലെ എല്ലാം പരിശോധിക്കുന്നത് വളരെ സമയം കഴിക്കുന്നതും സാധാരണയായി കമ്പ്യൂട്ടറിന് വിട്ടുകൊടുക്കുന്ന ജോലിയുമാണ്. എന്നാൽ സാമ്പിളിംഗ് ഡാറ്റയെ മനസ്സിലാക്കാൻ സഹായിക്കുന്ന ഉപകരണം ആണ്, ഇത് ഡാറ്റാസെറ്റിൽ എന്തുണ്ട് എന്നും അത് എന്താണ് പ്രതിനിധാനം ചെയ്യുന്നത് എന്നും നമുക്ക് മികച്ച ബോധം നൽകുന്നു. സാമ്പിള് ഉപയോഗിച്ച്, നിങ്ങൾക്ക് പ്രൊബബിലിറ്റി, സ്ഥിതിവിവരക്കണക്കുകൾ പ്രയോഗിച്ച് ഡാറ്റയെക്കുറിച്ചുള്ള പൊതുവായ നിഗമനങ്ങൾ വരുത്താം. എത്രമാത്രം ഡാറ്റ സാമ്പിൾ ചെയ്യണം എന്നതിന് നിർദ്ദിഷ്ട നിയമമില്ലെങ്കിലും, കൂടുതൽ ഡാറ്റ സാമ്പിൾ ചെയ്താൽ, ഡാറ്റയെക്കുറിച്ചുള്ള പൊതുവായ നിഗമനങ്ങൾ കൂടുതൽ കൃത്യമായിരിക്കും.
|
||||
Pandas-ൽ [`sample()` ഫംഗ്ഷൻ](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sample.html) ഉണ്ട്, ഇതിൽ നിങ്ങൾക്ക് എത്ര റാൻഡം സാമ്പിളുകൾ വേണമെന്നു പാരാമീറ്ററായി നൽകാം.
|
||||
|
||||
ഡാറ്റയുടെ പൊതുവായ ചോദ്യങ്ങൾക്കും സിദ്ധാന്തങ്ങൾക്കും ഉത്തരം കണ്ടെത്താൻ ജനറൽ ക്വറി ചെയ്യലും സഹായിക്കുന്നു. സാമ്പിളിംഗിനോട് വ്യത്യസ്തമായി, ക്വറികൾ നിങ്ങൾക്ക് ഡാറ്റയിലെ പ്രത്യേക ഭാഗങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കാനും നിയന്ത്രണം നൽകുന്നു.
|
||||
Pandas ലൈബ്രറിയിലെ [`query()` ഫംഗ്ഷൻ](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.query.html) കോളങ്ങൾ തിരഞ്ഞെടുക്കാനും തിരഞ്ഞെടുത്ത വരികളിലൂടെ ഡാറ്റയെക്കുറിച്ചുള്ള ലളിതമായ ഉത്തരം ലഭിക്കാനും സഹായിക്കുന്നു.
|
||||
|
||||
## ദൃശ്യവൽക്കരണങ്ങളിലൂടെ അന്വേഷിക്കൽ
|
||||
ഡാറ്റ പൂർണ്ണമായി ശുദ്ധീകരിക്കപ്പെടുകയും വിശകലനം ചെയ്യപ്പെടുകയും ചെയ്യുന്നത് വരെ കാത്തിരിക്കേണ്ടതില്ല. അന്വേഷിക്കുമ്പോൾ ദൃശ്യവൽക്കരണങ്ങൾ ഉണ്ടാകുന്നത് പാറ്റേണുകൾ, ബന്ധങ്ങൾ, പ്രശ്നങ്ങൾ തിരിച്ചറിയാൻ സഹായിക്കുന്നു. കൂടാതെ, ദൃശ്യവൽക്കരണങ്ങൾ ഡാറ്റ കൈകാര്യം ചെയ്യാത്തവരുമായി ആശയവിനിമയം നടത്താനുള്ള മാർഗ്ഗവും, ക്യാപ്ചർ ഘട്ടത്തിൽ പരിഗണിക്കപ്പെടാത്ത അധിക ചോദ്യങ്ങൾ പങ്കുവെക്കാനും വ്യക്തത നൽകാനും അവസരവുമാണ്. ദൃശ്യവൽക്കരണങ്ങളെക്കുറിച്ചുള്ള കൂടുതൽ അറിയാൻ [Visualizations വിഭാഗം](../../../../../../../../../3-Data-Visualization) കാണുക.
|
||||
|
||||
## അസംഘടിതത്വങ്ങൾ തിരിച്ചറിയാൻ അന്വേഷിക്കൽ
|
||||
ഈ പാഠത്തിലെ എല്ലാ വിഷയങ്ങളും നഷ്ടപ്പെട്ട അല്ലെങ്കിൽ അസംഘടിത മൂല്യങ്ങൾ തിരിച്ചറിയാൻ സഹായിക്കും, Pandas ചില ഫംഗ്ഷനുകൾ ഇതിന് നൽകുന്നു. [isna() അല്ലെങ്കിൽ isnull()](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.isna.html) നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ പരിശോധിക്കാൻ ഉപയോഗിക്കാം. നിങ്ങളുടെ ഡാറ്റയിൽ ഈ മൂല്യങ്ങൾ എന്തുകൊണ്ട് അങ്ങനെ വന്നുവെന്ന് അന്വേഷിക്കുന്നത് വളരെ പ്രധാനമാണ്. ഇത് [അവ പരിഹരിക്കാൻ സ്വീകരിക്കേണ്ട നടപടികൾ](/2-Working-With-Data/08-data-preparation/notebook.ipynb) തീരുമാനിക്കാൻ സഹായിക്കും.
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/29)
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[ഉത്തരം അന്വേഷിക്കൽ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,154 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# ശീതകാലത്തും വേനലിലും NYC ടാക്സി ഡാറ്റ\r\n",
|
||||
"\r\n",
|
||||
"നൽകിയിരിക്കുന്ന കോളങ്ങളേക്കുറിച്ച് കൂടുതൽ അറിയാൻ [ഡാറ്റാ നിഘണ്ടു](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) കാണുക.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"#Install the pandas library\r\n",
|
||||
"!pip install pandas"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {
|
||||
"scrolled": true
|
||||
}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 7,
|
||||
"source": [
|
||||
"import pandas as pd\r\n",
|
||||
"\r\n",
|
||||
"path = '../../data/taxi.csv'\r\n",
|
||||
"\r\n",
|
||||
"#Load the csv file into a dataframe\r\n",
|
||||
"df = pd.read_csv(path)\r\n",
|
||||
"\r\n",
|
||||
"#Print the dataframe\r\n",
|
||||
"print(df)\r\n"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "stream",
|
||||
"name": "stdout",
|
||||
"text": [
|
||||
" VendorID tpep_pickup_datetime tpep_dropoff_datetime passenger_count \\\n",
|
||||
"0 2.0 2019-07-15 16:27:53 2019-07-15 16:44:21 3.0 \n",
|
||||
"1 2.0 2019-07-17 20:26:35 2019-07-17 20:40:09 6.0 \n",
|
||||
"2 2.0 2019-07-06 16:01:08 2019-07-06 16:10:25 1.0 \n",
|
||||
"3 1.0 2019-07-18 22:32:23 2019-07-18 22:35:08 1.0 \n",
|
||||
"4 2.0 2019-07-19 14:54:29 2019-07-19 15:19:08 1.0 \n",
|
||||
".. ... ... ... ... \n",
|
||||
"195 2.0 2019-01-18 08:42:15 2019-01-18 08:56:57 1.0 \n",
|
||||
"196 1.0 2019-01-19 04:34:45 2019-01-19 04:43:44 1.0 \n",
|
||||
"197 2.0 2019-01-05 10:37:39 2019-01-05 10:42:03 1.0 \n",
|
||||
"198 2.0 2019-01-23 10:36:29 2019-01-23 10:44:34 2.0 \n",
|
||||
"199 2.0 2019-01-30 06:55:58 2019-01-30 07:07:02 5.0 \n",
|
||||
"\n",
|
||||
" trip_distance RatecodeID store_and_fwd_flag PULocationID DOLocationID \\\n",
|
||||
"0 2.02 1.0 N 186 233 \n",
|
||||
"1 1.59 1.0 N 141 161 \n",
|
||||
"2 1.69 1.0 N 246 249 \n",
|
||||
"3 0.90 1.0 N 229 141 \n",
|
||||
"4 4.79 1.0 N 237 107 \n",
|
||||
".. ... ... ... ... ... \n",
|
||||
"195 1.18 1.0 N 43 237 \n",
|
||||
"196 2.30 1.0 N 148 234 \n",
|
||||
"197 0.83 1.0 N 237 263 \n",
|
||||
"198 1.12 1.0 N 144 113 \n",
|
||||
"199 2.41 1.0 N 209 107 \n",
|
||||
"\n",
|
||||
" payment_type fare_amount extra mta_tax tip_amount tolls_amount \\\n",
|
||||
"0 1.0 12.0 1.0 0.5 4.08 0.0 \n",
|
||||
"1 2.0 10.0 0.5 0.5 0.00 0.0 \n",
|
||||
"2 2.0 8.5 0.0 0.5 0.00 0.0 \n",
|
||||
"3 1.0 4.5 3.0 0.5 1.65 0.0 \n",
|
||||
"4 1.0 19.5 0.0 0.5 5.70 0.0 \n",
|
||||
".. ... ... ... ... ... ... \n",
|
||||
"195 1.0 10.0 0.0 0.5 2.16 0.0 \n",
|
||||
"196 1.0 9.5 0.5 0.5 2.15 0.0 \n",
|
||||
"197 1.0 5.0 0.0 0.5 1.16 0.0 \n",
|
||||
"198 2.0 7.0 0.0 0.5 0.00 0.0 \n",
|
||||
"199 1.0 10.5 0.0 0.5 1.00 0.0 \n",
|
||||
"\n",
|
||||
" improvement_surcharge total_amount congestion_surcharge \n",
|
||||
"0 0.3 20.38 2.5 \n",
|
||||
"1 0.3 13.80 2.5 \n",
|
||||
"2 0.3 11.80 2.5 \n",
|
||||
"3 0.3 9.95 2.5 \n",
|
||||
"4 0.3 28.50 2.5 \n",
|
||||
".. ... ... ... \n",
|
||||
"195 0.3 12.96 0.0 \n",
|
||||
"196 0.3 12.95 0.0 \n",
|
||||
"197 0.3 6.96 0.0 \n",
|
||||
"198 0.3 7.80 0.0 \n",
|
||||
"199 0.3 12.30 0.0 \n",
|
||||
"\n",
|
||||
"[200 rows x 18 columns]\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# നിങ്ങളുടെ സ്വന്തം എക്സ്പ്ലോറട്ടറി ഡാറ്റാ അനാലിസിസ് ചെയ്യാൻ താഴെയുള്ള സെല്ലുകൾ ഉപയോഗിക്കുക\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"name": "python3",
|
||||
"display_name": "Python 3.9.7 64-bit ('venv': venv)"
|
||||
},
|
||||
"language_info": {
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"pygments_lexer": "ipython3",
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"version": "3.9.7",
|
||||
"nbconvert_exporter": "python",
|
||||
"file_extension": ".py"
|
||||
},
|
||||
"name": "04-nyc-taxi-join-weather-in-pandas",
|
||||
"notebookId": 1709144033725344,
|
||||
"interpreter": {
|
||||
"hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "7bca1c1abc1e55842817b62e44e1a963",
|
||||
"translation_date": "2025-12-19T17:11:31+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/15-analyzing/assignment.ipynb",
|
||||
"language_code": "ml"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
@ -0,0 +1,38 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "fcc7547171f4530f159676dd73ed772e",
|
||||
"translation_date": "2025-12-19T15:26:03+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/15-analyzing/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഉത്തരം അന്വേഷിക്കൽ
|
||||
|
||||
ഇത് മുൻപത്തെ പാഠത്തിന്റെ [അസൈൻമെന്റ്](../14-Introduction/assignment.md) തുടർച്ചയാണ്, അവിടെ നാം ഡാറ്റാ സെറ്റിനെ കുറിച്ച് സംക്ഷിപ്തമായി നോക്കിയിരുന്നു. ഇപ്പോൾ നാം ഡാറ്റയെ കൂടുതൽ ആഴത്തിൽ പരിശോധിക്കാനാണ് പോകുന്നത്.
|
||||
|
||||
വീണ്ടും, ക്ലയന്റ് അറിയാൻ ആഗ്രഹിക്കുന്ന ചോദ്യം: **ന്യൂയോർക്ക് സിറ്റിയിലെ മഞ്ഞ ടാക്സി യാത്രക്കാരൻമാർ ശീതകാലത്തോ വേനൽക്കാലത്തോ ഡ്രൈവർമാർക്ക് കൂടുതൽ ടിപ്പ് നൽകുന്നുണ്ടോ?**
|
||||
|
||||
നിങ്ങളുടെ ടീം ഡാറ്റ സയൻസ് ലൈഫ്സൈക്കിളിന്റെ [വിശകലനം](README.md) ഘട്ടത്തിലാണ്, ഇവിടെ നിങ്ങൾക്ക് ഡാറ്റാസെറ്റിൽ എക്സ്പ്ലോറട്ടറി ഡാറ്റാ അനാലിസിസ് നടത്തേണ്ടതാണ്. 2019 ജനുവരി, ജൂലൈ മാസങ്ങളിൽ നിന്നുള്ള 200 ടാക്സി ഇടപാടുകൾ അടങ്ങിയ ഒരു നോട്ട്ബുക്ക്, ഡാറ്റാസെറ്റ് എന്നിവ നിങ്ങൾക്ക് നൽകിയിട്ടുണ്ട്.
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ഈ ഡയറക്ടറിയിൽ [നോട്ട്ബുക്ക്](assignment.ipynb) ഉം [ടാക്സി & ലിമോസിൻ കമ്മീഷൻ](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets) നിന്നുള്ള ഡാറ്റയും ഉണ്ട്. ഡാറ്റയെക്കുറിച്ച് കൂടുതൽ വിവരങ്ങൾക്ക് [ഡാറ്റാസെറ്റിന്റെ നിഘണ്ടു](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) ഉം [ഉപയോക്തൃ ഗൈഡ്](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) ഉം കാണുക.
|
||||
|
||||
ഈ പാഠത്തിലെ ചില സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് നോട്ട്ബുക്കിൽ നിങ്ങളുടെ സ്വന്തം EDA നടത്തുക (ആവശ്യമായാൽ സെല്ലുകൾ ചേർക്കാം) കൂടാതെ താഴെക്കാണുന്ന ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകുക:
|
||||
|
||||
- ടിപ്പ് തുകയെ ബാധിക്കാവുന്ന മറ്റ് ഡാറ്റാ സ്വാധീനങ്ങൾ എന്തെല്ലാം ഉണ്ടാകാം?
|
||||
- ക്ലയന്റിന്റെ ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ ഏത് കോളങ്ങൾ ആവശ്യമില്ലാതിരിക്കാം?
|
||||
- ഇതുവരെ നൽകിയ ഡാറ്റ അടിസ്ഥാനമാക്കി, സീസണൽ ടിപ്പിംഗ് പെരുമാറ്റത്തിന് ഏതെങ്കിലും തെളിവുകൾ ഡാറ്റ നൽകുന്നുണ്ടോ?
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ പ്രാമാണികമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,193 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# ഡാറ്റ വിശകലനം \n",
|
||||
"[പാഠം](README.md)യിൽ പരാമർശിച്ച പാൻഡാസ് ഫംഗ്ഷനുകളുടെ ഉദാഹരണങ്ങൾ.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 1,
|
||||
"source": [
|
||||
"import pandas as pd\r\n",
|
||||
"import glob\r\n",
|
||||
"\r\n",
|
||||
"#Loading the dataset\r\n",
|
||||
"path = '../../data/emails.csv'\r\n",
|
||||
"email_df = pd.read_csv(path)"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 2,
|
||||
"source": [
|
||||
"# Using Describe on the email dataset\r\n",
|
||||
"print(email_df.describe())"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "stream",
|
||||
"name": "stdout",
|
||||
"text": [
|
||||
" the to ect and for of \\\n",
|
||||
"count 406.000000 406.000000 406.000000 406.000000 406.000000 406.000000 \n",
|
||||
"mean 7.022167 6.519704 4.948276 3.059113 3.502463 2.662562 \n",
|
||||
"std 10.945522 9.801907 9.293820 6.267806 4.901372 5.443939 \n",
|
||||
"min 0.000000 0.000000 1.000000 0.000000 0.000000 0.000000 \n",
|
||||
"25% 1.000000 1.000000 1.000000 0.000000 1.000000 0.000000 \n",
|
||||
"50% 3.000000 3.000000 2.000000 1.000000 2.000000 1.000000 \n",
|
||||
"75% 9.000000 7.750000 4.000000 3.000000 4.750000 3.000000 \n",
|
||||
"max 99.000000 88.000000 79.000000 69.000000 39.000000 57.000000 \n",
|
||||
"\n",
|
||||
" a you in on is this \\\n",
|
||||
"count 406.000000 406.000000 406.000000 406.000000 406.000000 406.000000 \n",
|
||||
"mean 57.017241 2.394089 10.817734 11.591133 5.901478 1.485222 \n",
|
||||
"std 78.868243 4.067015 19.050972 16.407175 8.793103 2.912473 \n",
|
||||
"min 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 \n",
|
||||
"25% 15.000000 0.000000 1.250000 3.000000 1.000000 0.000000 \n",
|
||||
"50% 29.000000 1.000000 5.000000 6.000000 3.000000 0.000000 \n",
|
||||
"75% 61.000000 3.000000 12.000000 13.000000 7.000000 2.000000 \n",
|
||||
"max 843.000000 31.000000 223.000000 125.000000 61.000000 24.000000 \n",
|
||||
"\n",
|
||||
" i be that will \n",
|
||||
"count 406.000000 406.000000 406.000000 406.000000 \n",
|
||||
"mean 47.155172 2.950739 1.034483 0.955665 \n",
|
||||
"std 71.043009 4.297865 1.904846 2.042271 \n",
|
||||
"min 0.000000 0.000000 0.000000 0.000000 \n",
|
||||
"25% 11.000000 1.000000 0.000000 0.000000 \n",
|
||||
"50% 24.000000 1.000000 0.000000 0.000000 \n",
|
||||
"75% 50.750000 3.000000 1.000000 1.000000 \n",
|
||||
"max 754.000000 40.000000 14.000000 24.000000 \n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 5,
|
||||
"source": [
|
||||
"# Sampling 10 emails\r\n",
|
||||
"print(email_df.sample(10))"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "stream",
|
||||
"name": "stdout",
|
||||
"text": [
|
||||
" Email No. the to ect and for of a you in on is this i \\\n",
|
||||
"150 Email 151 0 1 2 0 3 0 15 0 0 5 0 0 7 \n",
|
||||
"380 Email 5147 0 3 2 0 0 0 7 0 1 1 0 0 3 \n",
|
||||
"19 Email 20 3 4 11 0 4 2 32 1 1 3 9 5 25 \n",
|
||||
"300 Email 301 2 1 1 0 1 1 15 2 2 3 2 0 8 \n",
|
||||
"307 Email 308 0 0 1 0 0 0 1 0 1 0 0 0 2 \n",
|
||||
"167 Email 168 2 2 2 1 5 1 24 2 5 6 4 0 30 \n",
|
||||
"320 Email 321 10 12 4 6 8 6 187 5 26 28 23 2 171 \n",
|
||||
"61 Email 62 0 1 1 0 4 1 15 4 4 3 3 0 19 \n",
|
||||
"26 Email 27 5 4 1 1 4 4 51 0 8 6 6 2 44 \n",
|
||||
"73 Email 74 0 0 1 0 0 0 7 0 4 3 0 0 6 \n",
|
||||
"\n",
|
||||
" be that will \n",
|
||||
"150 1 0 0 \n",
|
||||
"380 0 0 0 \n",
|
||||
"19 3 0 1 \n",
|
||||
"300 0 0 0 \n",
|
||||
"307 0 0 0 \n",
|
||||
"167 2 0 0 \n",
|
||||
"320 5 1 1 \n",
|
||||
"61 2 0 0 \n",
|
||||
"26 6 0 0 \n",
|
||||
"73 0 0 0 \n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 14,
|
||||
"source": [
|
||||
"# Returns rows where there are more occurrences of \"to\" than \"the\"\r\n",
|
||||
"print(email_df.query('the < to'))"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "stream",
|
||||
"name": "stdout",
|
||||
"text": [
|
||||
" Email No. the to ect and for of a you in on is this i \\\n",
|
||||
"1 Email 2 8 13 24 6 6 2 102 1 18 21 13 0 61 \n",
|
||||
"3 Email 4 0 5 22 0 5 1 51 2 1 5 9 2 16 \n",
|
||||
"5 Email 6 4 5 1 4 2 3 45 1 16 12 8 1 52 \n",
|
||||
"7 Email 8 0 2 2 3 1 2 21 6 2 6 2 0 28 \n",
|
||||
"13 Email 14 4 5 7 1 5 1 37 1 8 8 6 1 43 \n",
|
||||
".. ... ... .. ... ... ... .. ... ... .. .. .. ... .. \n",
|
||||
"390 Email 5157 4 13 1 0 3 1 48 2 8 26 9 1 45 \n",
|
||||
"393 Email 5160 2 13 1 0 2 1 38 2 7 24 6 1 34 \n",
|
||||
"396 Email 5163 2 3 1 2 1 2 32 0 7 3 2 0 26 \n",
|
||||
"404 Email 5171 2 7 1 0 2 1 28 2 8 11 7 1 39 \n",
|
||||
"405 Email 5172 22 24 5 1 6 5 148 8 23 13 5 4 99 \n",
|
||||
"\n",
|
||||
" be that will \n",
|
||||
"1 4 2 0 \n",
|
||||
"3 2 0 0 \n",
|
||||
"5 2 0 0 \n",
|
||||
"7 1 0 1 \n",
|
||||
"13 1 0 1 \n",
|
||||
".. .. ... ... \n",
|
||||
"390 1 0 0 \n",
|
||||
"393 1 0 0 \n",
|
||||
"396 3 0 0 \n",
|
||||
"404 1 0 0 \n",
|
||||
"405 6 4 1 \n",
|
||||
"\n",
|
||||
"[169 rows x 17 columns]\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python",
|
||||
"version": "3.9.7",
|
||||
"mimetype": "text/x-python",
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"pygments_lexer": "ipython3",
|
||||
"nbconvert_exporter": "python",
|
||||
"file_extension": ".py"
|
||||
},
|
||||
"kernelspec": {
|
||||
"name": "python3",
|
||||
"display_name": "Python 3.9.7 64-bit ('venv': venv)"
|
||||
},
|
||||
"interpreter": {
|
||||
"hash": "6b9b57232c4b57163d057191678da2030059e733b8becc68f245de5a75abe84e"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "9d102c8c3cdbc8ea4e92fc32593462c6",
|
||||
"translation_date": "2025-12-19T17:11:08+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb",
|
||||
"language_code": "ml"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
@ -0,0 +1,28 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "8980d7efd101c82d6d6ffc3458214120",
|
||||
"translation_date": "2025-12-19T15:22:59+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/16-communication/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഒരു കഥ പറയുക
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ഡാറ്റാ സയൻസ് മുഴുവനും കഥ പറയലിനെക്കുറിച്ചാണ്. ഏതെങ്കിലും ഒരു ഡാറ്റാസെറ്റ് തിരഞ്ഞെടുക്കുക, അതിനെക്കുറിച്ച് നിങ്ങൾ പറയാൻ കഴിയുന്ന ഒരു ചെറിയ പ്രബന്ധം എഴുതുക. നിങ്ങളുടെ ഡാറ്റാസെറ്റ് എന്ത് വെളിപ്പെടുത്തുമെന്ന് നിങ്ങൾ പ്രതീക്ഷിക്കുന്നു? അതിന്റെ വെളിപ്പെടുത്തലുകൾ പ്രശ്നകരമാകുകയാണെങ്കിൽ നിങ്ങൾ എന്ത് ചെയ്യും? നിങ്ങളുടെ ഡാറ്റ അതിന്റെ രഹസ്യങ്ങൾ എളുപ്പത്തിൽ തുറക്കാൻ കഴിയുന്നില്ലെങ്കിൽ എന്ത് ചെയ്യും? നിങ്ങളുടെ ഡാറ്റാസെറ്റ് അവതരിപ്പിക്കാവുന്ന സാഹചര്യങ്ങളെക്കുറിച്ച് ചിന്തിച്ച് അവയെ എഴുതുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
ഉദാഹരണമായി | മതിയായത് | മെച്ചപ്പെടുത്തേണ്ടത്
|
||||
--- | --- | -- |
|
||||
|
||||
ഡാറ്റാസെറ്റ് വിശദീകരിച്ചും, രേഖപ്പെടുത്തിയും, ക്രെഡിറ്റ് നൽകിയും, അതിനെക്കുറിച്ചുള്ള സുസ്ഥിരമായ ഒരു കഥ വിശദമായ ഉദാഹരണങ്ങളോടെ .doc ഫോർമാറ്റിൽ ഒരു പേജ് പ്രബന്ധം അവതരിപ്പിക്കുന്നു.| കുറച്ച് കുറവുള്ള രൂപത്തിൽ ഒരു ചെറിയ പ്രബന്ധം അവതരിപ്പിക്കുന്നു | മുകളിൽ പറയപ്പെട്ട വിശദാംശങ്ങളിൽ ഒന്നിൽ പ്രബന്ധം കുറവാണെന്ന് കണ്ടെത്തുന്നു.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,32 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "dd173fd30fc039a7a299898920680723",
|
||||
"translation_date": "2025-12-19T13:24:32+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഡാറ്റ സയൻസ് ലൈഫ്സൈക്കിൾ
|
||||
|
||||

|
||||
> ഫോട്ടോ <a href="https://unsplash.com/@headwayio?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">ഹെഡ്വേ</a> യുടെ <a href="https://unsplash.com/s/photos/communication?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">അൺസ്പ്ലാഷിൽ</a>
|
||||
|
||||
ഈ പാഠങ്ങളിൽ, ഡാറ്റ സയൻസ് ലൈഫ്സൈക്കിളിന്റെ ചില ഭാഗങ്ങൾ, ഡാറ്റ ചുറ്റിപ്പറ്റിയുള്ള വിശകലനവും ആശയവിനിമയവും ഉൾപ്പെടെ, നിങ്ങൾ അന്വേഷിക്കും.
|
||||
|
||||
### വിഷയങ്ങൾ
|
||||
|
||||
1. [പരിചയം](14-Introduction/README.md)
|
||||
2. [വിശകലനം](15-analyzing/README.md)
|
||||
3. [ആശയവിനിമയം](16-communication/README.md)
|
||||
|
||||
### ക്രെഡിറ്റുകൾ
|
||||
|
||||
ഈ പാഠങ്ങൾ ❤️ കൊണ്ട് എഴുതിയത് [ജാലൻ മക്ഗീ](https://twitter.com/JalenMCG)യും [ജാസ്മിൻ ഗ്രീൻവേ](https://twitter.com/paladique)യും ആണ്.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,17 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "5f8e7cdefa096664ae86f795be571580",
|
||||
"translation_date": "2025-12-19T15:10:58+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/17-Introduction/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
Translation for chunk 1 of 'README.md' skipped due to timeout.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "96f3696153d9ed54b19a1bb65438c104",
|
||||
"translation_date": "2025-12-19T15:17:51+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/17-Introduction/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# മാർക്കറ്റ് റിസർച്ച്
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ഈ പാഠത്തിൽ നിങ്ങൾ പഠിച്ചത് വിവിധ പ്രധാന ക്ലൗഡ് പ്രൊവൈഡർമാർ ഉണ്ടെന്ന് ആണ്. ഓരോ പ്രൊവൈഡറും ഡാറ്റാ സയന്റിസ്റ്റിന് എന്തെല്ലാം നൽകാൻ കഴിയുമെന്ന് കണ്ടെത്താൻ മാർക്കറ്റ് റിസർച്ച് നടത്തുക. അവയുടെ ഓഫറിങ്ങുകൾ താരതമ്യപ്പെടുത്താവുന്നതാണോ? ഈ ക്ലൗഡ് പ്രൊവൈഡർമാരിൽ മൂന്ന് അല്ലെങ്കിൽ അതിലധികം പ്രൊവൈഡർമാരുടെ ഓഫറിങ്ങുകൾ വിവരിക്കുന്ന ഒരു പേപ്പർ എഴുതുക.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
Exemplary | Adequate | Needs Improvement
|
||||
--- | --- | -- |
|
||||
ഒരു പേജ് പേപ്പറിൽ മൂന്ന് ക്ലൗഡ് പ്രൊവൈഡർമാരുടെ ഡാറ്റാ സയൻസ് ഓഫറിങ്ങുകൾ വിവരിക്കുകയും അവ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ വ്യക്തമാക്കുകയും ചെയ്യുന്നു. | ഒരു ചെറിയ പേപ്പർ സമർപ്പിച്ചിരിക്കുന്നു | വിശകലനം പൂർത്തിയാക്കാതെ ഒരു പേപ്പർ സമർപ്പിച്ചിരിക്കുന്നു
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "8fdc4a5fd9bc27a8d2ebef995dfbf73f",
|
||||
"translation_date": "2025-12-19T15:03:50+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/18-Low-Code/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ലോ കോഡ്/നോ കോഡ് ഡാറ്റാ സയൻസ് പ്രോജക്ട് ആസ്യൂർ ML-ൽ
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
ലോ കോഡ്/നോ കോഡ് രീതിയിൽ ഒരു മോഡൽ ട്രെയിൻ ചെയ്യാനും, ഡിപ്ലോയ് ചെയ്യാനും, ഉപയോഗിക്കാനും ആസ്യൂർ ML പ്ലാറ്റ്ഫോം എങ്ങനെ ഉപയോഗിക്കാമെന്ന് നാം കണ്ടു. ഇപ്പോൾ മറ്റൊരു മോഡൽ ട്രെയിൻ ചെയ്യാനും, ഡിപ്ലോയ് ചെയ്യാനും, ഉപയോഗിക്കാനും നിങ്ങൾക്ക് ഉപയോഗിക്കാവുന്ന ഡാറ്റ ഏതെങ്കിലും കണ്ടെത്താൻ ചുറ്റിപ്പറ്റി നോക്കുക. [Kaggle](https://kaggle.com) ലും [Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ലും ഡാറ്റാസെറ്റുകൾ അന്വേഷിക്കാം.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
| ഉദാഹരണപരമായത് | മതിയായത് | മെച്ചപ്പെടുത്തേണ്ടത് |
|
||||
|-----------|----------|-------------------|
|
||||
|ഡാറ്റ അപ്ലോഡ് ചെയ്യുമ്പോൾ ഫീച്ചറിന്റെ തരം ആവശ്യമായെങ്കിൽ മാറ്റിയിട്ടുണ്ട്. ആവശ്യമായെങ്കിൽ ഡാറ്റ ശുദ്ധീകരിച്ചും. AutoML വഴി ഒരു ഡാറ്റാസെറ്റിൽ ട്രെയിനിംഗ് നടത്തി, മോഡൽ വിശദീകരണങ്ങൾ പരിശോധിച്ചു. മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. | ഡാറ്റ അപ്ലോഡ് ചെയ്യുമ്പോൾ ഫീച്ചറിന്റെ തരം ആവശ്യമായെങ്കിൽ മാറ്റിയിട്ടുണ്ട്. AutoML വഴി ഒരു ഡാറ്റാസെറ്റിൽ ട്രെയിനിംഗ് നടത്തി, മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. | AutoML വഴി ട്രെയിൻ ചെയ്ത മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,325 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "472d3fab1c5be50f387336e7a686dbe1",
|
||||
"translation_date": "2025-12-19T14:43:18+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/19-Azure/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: "Azure ML SDK" വഴി
|
||||
|
||||
| ](../../sketchnotes/19-DataScience-Cloud.png)|
|
||||
|:---:|
|
||||
| ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: Azure ML SDK - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
അടിസ്ഥാന പട്ടിക:
|
||||
|
||||
- [ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: "Azure ML SDK" വഴി](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [പ്രീ-ലെക്ചർ ക്വിസ്](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [1. പരിചയം](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [1.1 Azure ML SDK എന്താണ്?](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [1.2 ഹാർട്ട് ഫെയില്യർ പ്രവചനം പ്രോജക്ടും ഡാറ്റാസെറ്റും പരിചയം](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [2. Azure ML SDK ഉപയോഗിച്ച് മോഡൽ പരിശീലനം](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [2.1 Azure ML വർക്ക്സ്പേസ് സൃഷ്ടിക്കുക](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [2.2 കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് സൃഷ്ടിക്കുക](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [2.3 ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യൽ](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [2.4 നോട്ട്ബുക്കുകൾ സൃഷ്ടിക്കൽ](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [2.5 മോഡൽ പരിശീലനം](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [2.5.1 വർക്ക്സ്പേസ്, പരീക്ഷണം, കംപ്യൂട്ട് ക്ലസ്റ്റർ, ഡാറ്റാസെറ്റ് സജ്ജീകരിക്കൽ](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [2.5.2 AutoML കോൺഫിഗറേഷൻ, പരിശീലനം](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [3. Azure ML SDK ഉപയോഗിച്ച് മോഡൽ വിന്യാസവും എൻഡ്പോയിന്റ് ഉപയോഗവും](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [3.1 മികച്ച മോഡൽ സേവ് ചെയ്യൽ](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [3.2 മോഡൽ വിന്യാസം](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [3.3 എൻഡ്പോയിന്റ് ഉപയോഗം](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [🚀 ചലഞ്ച്](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [പരിശോധന & സ്വയം പഠനം](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
- [അസൈൻമെന്റ്](../../../../5-Data-Science-In-Cloud/19-Azure)
|
||||
|
||||
## [പ്രീ-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/36)
|
||||
|
||||
## 1. പരിചയം
|
||||
|
||||
### 1.1 Azure ML SDK എന്താണ്?
|
||||
|
||||
ഡാറ്റാ സയന്റിസ്റ്റുകളും AI ഡെവലപ്പർമാരും Azure Machine Learning SDK ഉപയോഗിച്ച് Azure Machine Learning സേവനത്തോടെ മെഷീൻ ലേണിംഗ് പ്രവൃത്തികൾ നിർമ്മിക്കുകയും പ്രവർത്തിപ്പിക്കുകയും ചെയ്യുന്നു. നിങ്ങൾക്ക് Jupyter നോട്ട്ബുക്കുകൾ, Visual Studio Code, അല്ലെങ്കിൽ നിങ്ങളുടെ ഇഷ്ട Python IDE ഉൾപ്പെടെയുള്ള ഏതെങ്കിലും Python പരിസ്ഥിതിയിൽ ഈ സേവനവുമായി ഇടപഴകാം.
|
||||
|
||||
SDKയുടെ പ്രധാന മേഖലകൾ:
|
||||
|
||||
- മെഷീൻ ലേണിംഗ് പരീക്ഷണങ്ങളിൽ ഉപയോഗിക്കുന്ന നിങ്ങളുടെ ഡാറ്റാസെറ്റുകളുടെ ജീവിതചക്രം പരിശോധിക്കുക, തയ്യാറാക്കുക, നിയന്ത്രിക്കുക.
|
||||
- നിങ്ങളുടെ മെഷീൻ ലേണിംഗ് പരീക്ഷണങ്ങൾ നിരീക്ഷിക്കാൻ, ലോഗ് ചെയ്യാൻ, ക്രമീകരിക്കാൻ ക്ലൗഡ് വിഭവങ്ങൾ നിയന്ത്രിക്കുക.
|
||||
- മോഡലുകൾ പ്രാദേശികമായി അല്ലെങ്കിൽ GPU-വേഗതയുള്ള ക്ലൗഡ് വിഭവങ്ങൾ ഉപയോഗിച്ച് പരിശീലിപ്പിക്കുക.
|
||||
- ഓട്ടോമേറ്റഡ് മെഷീൻ ലേണിംഗ് ഉപയോഗിക്കുക, ഇത് കോൺഫിഗറേഷൻ പാരാമീറ്ററുകളും പരിശീലന ഡാറ്റയും സ്വീകരിച്ച്, മികച്ച മോഡൽ കണ്ടെത്താൻ ആൽഗോരിതങ്ങൾക്കും ഹൈപ്പർപാരാമീറ്റർ ക്രമീകരണങ്ങൾക്കും സ്വയം പരീക്ഷണം നടത്തുന്നു.
|
||||
- പരിശീലിപ്പിച്ച മോഡലുകൾ RESTful സേവനങ്ങളായി മാറ്റാൻ വെബ് സേവനങ്ങൾ വിന്യസിക്കുക, ഇത് ഏതെങ്കിലും ആപ്ലിക്കേഷനിൽ ഉപയോഗിക്കാം.
|
||||
|
||||
[Azure Machine Learning SDKയെ കുറിച്ച് കൂടുതൽ അറിയുക](https://docs.microsoft.com/python/api/overview/azure/ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
|
||||
|
||||
[മുൻപത്തെ പാഠത്തിൽ](../18-Low-Code/README.md) നാം ലോ കോഡ്/നോ കോഡ് രീതിയിൽ മോഡൽ പരിശീലിപ്പിക്കുകയും വിന്യസിക്കുകയും ഉപയോഗിക്കുകയും ചെയ്തിരുന്നു. ഹാർട്ട് ഫെയില്യർ ഡാറ്റാസെറ്റ് ഉപയോഗിച്ച് ഹാർട്ട് ഫെയില്യർ പ്രവചന മോഡൽ സൃഷ്ടിച്ചു. ഈ പാഠത്തിൽ, നാം അതേ പ്രവർത്തി Azure Machine Learning SDK ഉപയോഗിച്ച് ചെയ്യാൻ പോകുന്നു.
|
||||
|
||||

|
||||
|
||||
### 1.2 ഹാർട്ട് ഫെയില്യർ പ്രവചനം പ്രോജക്ടും ഡാറ്റാസെറ്റും പരിചയം
|
||||
|
||||
ഹാർട്ട് ഫെയില്യർ പ്രവചനം പ്രോജക്ടും ഡാറ്റാസെറ്റും പരിചയപ്പെടാൻ [ഇവിടെ](../18-Low-Code/README.md) നോക്കുക.
|
||||
|
||||
## 2. Azure ML SDK ഉപയോഗിച്ച് മോഡൽ പരിശീലനം
|
||||
### 2.1 Azure ML വർക്ക്സ്പേസ് സൃഷ്ടിക്കുക
|
||||
|
||||
സൗകര്യത്തിനായി, നാം ഒരു Jupyter നോട്ട്ബുക്കിൽ പ്രവർത്തിക്കാനാണ് പോകുന്നത്. ഇതിന് നിങ്ങൾക്ക് ഇതിനകം ഒരു വർക്ക്സ്പേസ്, കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് ഉണ്ടായിരിക്കണം. നിങ്ങൾക്ക് ഇതിനകം വർക്ക്സ്പേസ് ഉണ്ടെങ്കിൽ, നേരിട്ട് 2.3 നോട്ട്ബുക്ക് സൃഷ്ടിക്കൽ വിഭാഗത്തിലേക്ക് പോകാം.
|
||||
|
||||
ഇല്ലെങ്കിൽ, [മുൻപത്തെ പാഠത്തിലെ](../18-Low-Code/README.md) **2.1 Azure ML വർക്ക്സ്പേസ് സൃഷ്ടിക്കുക** വിഭാഗത്തിലെ നിർദ്ദേശങ്ങൾ പാലിച്ച് വർക്ക്സ്പേസ് സൃഷ്ടിക്കുക.
|
||||
|
||||
### 2.2 കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് സൃഷ്ടിക്കുക
|
||||
|
||||
മുൻപ് സൃഷ്ടിച്ച [Azure ML വർക്ക്സ്പേസിൽ](https://ml.azure.com/) കംപ്യൂട്ട് മെനുവിലേക്ക് പോകുക, അവിടെ ലഭ്യമായ വിവിധ കംപ്യൂട്ട് വിഭവങ്ങൾ കാണാം
|
||||
|
||||

|
||||
|
||||
Jupyter നോട്ട്ബുക്ക് പ്രൊവിഷൻ ചെയ്യാൻ ഒരു കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് സൃഷ്ടിക്കാം.
|
||||
1. + New ബട്ടൺ ക്ലിക്ക് ചെയ്യുക.
|
||||
2. നിങ്ങളുടെ കംപ്യൂട്ട് ഇൻസ്റ്റൻസിന് ഒരു പേര് നൽകുക.
|
||||
3. CPU അല്ലെങ്കിൽ GPU, VM വലുപ്പം, കോർ എണ്ണം തിരഞ്ഞെടുക്കുക.
|
||||
4. Create ബട്ടൺ ക്ലിക്ക് ചെയ്യുക.
|
||||
|
||||
അഭിനന്ദനങ്ങൾ, നിങ്ങൾ ഒരു കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് സൃഷ്ടിച്ചു! നാം ഈ കംപ്യൂട്ട് ഇൻസ്റ്റൻസ് ഉപയോഗിച്ച് [നോട്ട്ബുക്കുകൾ സൃഷ്ടിക്കൽ](../../../../5-Data-Science-In-Cloud/19-Azure) വിഭാഗത്തിൽ നോട്ട്ബുക്ക് സൃഷ്ടിക്കും.
|
||||
|
||||
### 2.3 ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യൽ
|
||||
ഡാറ്റാസെറ്റ് അപ്ലോഡ് ചെയ്തിട്ടില്ലെങ്കിൽ, [മുൻപത്തെ പാഠത്തിലെ](../18-Low-Code/README.md) **2.3 ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യൽ** വിഭാഗം കാണുക.
|
||||
|
||||
### 2.4 നോട്ട്ബുക്കുകൾ സൃഷ്ടിക്കൽ
|
||||
|
||||
> **_കുറിപ്പ്:_** അടുത്ത ഘട്ടത്തിന്, നിങ്ങൾക്ക് പുതിയ നോട്ട്ബുക്ക് സൃഷ്ടിക്കാം, അല്ലെങ്കിൽ [നാം സൃഷ്ടിച്ച നോട്ട്ബുക്ക്](notebook.ipynb) നിങ്ങളുടെ Azure ML സ്റ്റുഡിയോയിലേക്ക് അപ്ലോഡ് ചെയ്യാം. അപ്ലോഡ് ചെയ്യാൻ, "Notebook" മെനുവിൽ ക്ലിക്ക് ചെയ്ത് നോട്ട്ബുക്ക് അപ്ലോഡ് ചെയ്യുക.
|
||||
|
||||
നോട്ട്ബുക്കുകൾ ഡാറ്റാ സയൻസ് പ്രക്രിയയുടെ വളരെ പ്രധാനപ്പെട്ട ഭാഗമാണ്. അവ എക്സ്പ്ലോറട്ടറി ഡാറ്റാ അനാലിസിസ് (EDA) നടത്താൻ, മോഡൽ പരിശീലനത്തിനായി കംപ്യൂട്ട് ക്ലസ്റ്ററിലേക്ക് വിളിക്കാൻ, എൻഡ്പോയിന്റ് വിന്യാസത്തിനായി ഇൻഫറൻസ് ക്ലസ്റ്ററിലേക്ക് വിളിക്കാൻ ഉപയോഗിക്കാം.
|
||||
|
||||
നോട്ട്ബുക്ക് സൃഷ്ടിക്കാൻ, ജുപിറ്റർ നോട്ട്ബുക്ക് ഇൻസ്റ്റൻസ് സർവീസ് ചെയ്യുന്ന കംപ്യൂട്ട് നോഡ് ആവശ്യമാണ്. [Azure ML വർക്ക്സ്പേസിലേക്ക്](https://ml.azure.com/) മടങ്ങി കംപ്യൂട്ട് ഇൻസ്റ്റൻസുകൾ ക്ലിക്ക് ചെയ്യുക. കംപ്യൂട്ട് ഇൻസ്റ്റൻസുകളുടെ പട്ടികയിൽ [മുൻപ് സൃഷ്ടിച്ച കംപ്യൂട്ട് ഇൻസ്റ്റൻസ്](../../../../5-Data-Science-In-Cloud/19-Azure) കാണാം.
|
||||
|
||||
1. Applications വിഭാഗത്തിൽ Jupyter ഓപ്ഷൻ ക്ലിക്ക് ചെയ്യുക.
|
||||
2. "Yes, I understand" ബോക്സ് ടിക്ക് ചെയ്ത് Continue ബട്ടൺ ക്ലിക്ക് ചെയ്യുക.
|
||||

|
||||
3. ഇത് പുതിയ ബ്രൗസർ ടാബിൽ നിങ്ങളുടെ ജുപിറ്റർ നോട്ട്ബുക്ക് ഇൻസ്റ്റൻസ് തുറക്കും. "New" ബട്ടൺ ക്ലിക്ക് ചെയ്ത് നോട്ട്ബുക്ക് സൃഷ്ടിക്കുക.
|
||||
|
||||

|
||||
|
||||
ഇപ്പോൾ നോട്ട്ബുക്ക് ഉണ്ടാകുമ്പോൾ, Azure ML SDK ഉപയോഗിച്ച് മോഡൽ പരിശീലനം ആരംഭിക്കാം.
|
||||
|
||||
### 2.5 മോഡൽ പരിശീലനം
|
||||
|
||||
ആദ്യമേ, സംശയമുണ്ടെങ്കിൽ, [Azure ML SDK ഡോക്യുമെന്റേഷൻ](https://docs.microsoft.com/python/api/overview/azure/ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) കാണുക. ഈ പാഠത്തിൽ കാണുന്ന മോഡ്യൂളുകൾ മനസ്സിലാക്കാൻ ആവശ്യമായ എല്ലാ വിവരങ്ങളും അവിടെ ഉണ്ട്.
|
||||
|
||||
#### 2.5.1 വർക്ക്സ്പേസ്, പരീക്ഷണം, കംപ്യൂട്ട് ക്ലസ്റ്റർ, ഡാറ്റാസെറ്റ് സജ്ജീകരിക്കൽ
|
||||
|
||||
നിങ്ങൾക്ക് കോൺഫിഗറേഷൻ ഫയലിൽ നിന്ന് `workspace` ലോഡ് ചെയ്യേണ്ടതാണ് താഴെ കാണുന്ന കോഡ് ഉപയോഗിച്ച്:
|
||||
|
||||
```python
|
||||
from azureml.core import Workspace
|
||||
ws = Workspace.from_config()
|
||||
```
|
||||
|
||||
ഇത് `Workspace` തരം ഒബ്ജക്റ്റ് നൽകുന്നു, ഇത് വർക്ക്സ്പേസ് പ്രതിനിധീകരിക്കുന്നു. തുടർന്ന്, താഴെ കാണുന്ന കോഡ് ഉപയോഗിച്ച് ഒരു `experiment` സൃഷ്ടിക്കണം:
|
||||
|
||||
```python
|
||||
from azureml.core import Experiment
|
||||
experiment_name = 'aml-experiment'
|
||||
experiment = Experiment(ws, experiment_name)
|
||||
```
|
||||
|
||||
വർക്ക്സ്പേസിൽ നിന്ന് പരീക്ഷണം ലഭിക്കുകയോ സൃഷ്ടിക്കുകയോ ചെയ്യാൻ, പരീക്ഷണത്തിന്റെ പേര് ഉപയോഗിച്ച് അപേക്ഷിക്കാം. പരീക്ഷണത്തിന്റെ പേര് 3-36 അക്ഷരങ്ങൾ ആയിരിക്കണം, അക്ഷരമോ സംഖ്യയോ കൊണ്ട് തുടങ്ങണം, അക്ഷരങ്ങൾ, സംഖ്യകൾ, അണ്ടർസ്കോർ, ഡാഷ് എന്നിവ മാത്രമേ ഉൾക്കൊള്ളൂ. പരീക്ഷണം വർക്ക്സ്പേസിൽ കണ്ടെത്താനാകാതെപോയാൽ പുതിയ പരീക്ഷണം സൃഷ്ടിക്കും.
|
||||
|
||||
ഇപ്പോൾ പരിശീലനത്തിനായി കംപ്യൂട്ട് ക്ലസ്റ്റർ സൃഷ്ടിക്കേണ്ടതാണ്, താഴെ കാണുന്ന കോഡ് ഉപയോഗിച്ച്. ഈ ഘട്ടം കുറച്ച് മിനിറ്റുകൾ എടുക്കാം.
|
||||
|
||||
```python
|
||||
from azureml.core.compute import AmlCompute
|
||||
|
||||
aml_name = "heart-f-cluster"
|
||||
try:
|
||||
aml_compute = AmlCompute(ws, aml_name)
|
||||
print('Found existing AML compute context.')
|
||||
except:
|
||||
print('Creating new AML compute context.')
|
||||
aml_config = AmlCompute.provisioning_configuration(vm_size = "Standard_D2_v2", min_nodes=1, max_nodes=3)
|
||||
aml_compute = AmlCompute.create(ws, name = aml_name, provisioning_configuration = aml_config)
|
||||
aml_compute.wait_for_completion(show_output = True)
|
||||
|
||||
cts = ws.compute_targets
|
||||
compute_target = cts[aml_name]
|
||||
```
|
||||
|
||||
ഡാറ്റാസെറ്റ് വർക്ക്സ്പേസിൽ നിന്ന് ഡാറ്റാസെറ്റ് നാമം ഉപയോഗിച്ച് താഴെ കാണുന്ന രീതിയിൽ ലഭിക്കും:
|
||||
|
||||
```python
|
||||
dataset = ws.datasets['heart-failure-records']
|
||||
df = dataset.to_pandas_dataframe()
|
||||
df.describe()
|
||||
```
|
||||
|
||||
|
||||
#### 2.5.2 AutoML കോൺഫിഗറേഷൻ, പരിശീലനം
|
||||
|
||||
AutoML കോൺഫിഗറേഷൻ സജ്ജമാക്കാൻ [AutoMLConfig ക്ലാസ്](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.automlconfig(class)?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ഉപയോഗിക്കുക.
|
||||
|
||||
ഡോക്യുമെന്റേഷനിൽ വിശദീകരിച്ചിരിക്കുന്നതുപോലെ, നിങ്ങൾക്ക് പല പാരാമീറ്ററുകളുമായി കളിക്കാം. ഈ പ്രോജക്ടിനായി, താഴെ കാണുന്ന പാരാമീറ്ററുകൾ ഉപയോഗിക്കും:
|
||||
|
||||
- `experiment_timeout_minutes`: പരീക്ഷണം ഓടാൻ അനുവദിച്ച പരമാവധി സമയം (മിനിറ്റുകളിൽ), അതിനുശേഷം സ്വയം നിർത്തുകയും ഫലങ്ങൾ ലഭ്യമാക്കുകയും ചെയ്യും
|
||||
- `max_concurrent_iterations`: പരീക്ഷണത്തിന് അനുവദിച്ച പരമാവധി സമകാലിക പരിശീലന ഇറ്ററേഷനുകളുടെ എണ്ണം
|
||||
- `primary_metric`: പരീക്ഷണത്തിന്റെ നില നിർണ്ണയിക്കാൻ ഉപയോഗിക്കുന്ന പ്രധാന മെട്രിക്
|
||||
- `compute_target`: ഓട്ടോമേറ്റഡ് മെഷീൻ ലേണിംഗ് പരീക്ഷണം നടത്താൻ Azure Machine Learning കംപ്യൂട്ട് ടാർഗറ്റ്
|
||||
- `task`: നടത്തേണ്ട ടാസ്കിന്റെ തരം. 'classification', 'regression', അല്ലെങ്കിൽ 'forecasting' എന്നിങ്ങനെ ഓട്ടോമേറ്റഡ് ML പ്രശ്നത്തിന്റെ തരം അനുസരിച്ച്
|
||||
- `training_data`: പരീക്ഷണത്തിൽ ഉപയോഗിക്കുന്ന പരിശീലന ഡാറ്റ. പരിശീലന ഫീച്ചറുകളും ലേബൽ കോളവും (ഓപ്ഷണൽ സാംപിൾ വെയ്റ്റ് കോളവും) ഉൾക്കൊള്ളണം
|
||||
- `label_column_name`: ലേബൽ കോളത്തിന്റെ പേര്
|
||||
- `path`: Azure Machine Learning പ്രോജക്ട് ഫോൾഡറിന്റെ പൂർണ്ണ പാത
|
||||
- `enable_early_stopping`: സ്കോർ കുറയുന്നുണ്ടെങ്കിൽ നേരത്തെ അവസാനിപ്പിക്കാൻ അനുവദിക്കണോ എന്നത്
|
||||
- `featurization`: ഫീച്ചറൈസേഷൻ സ്വയം ചെയ്യണോ, അല്ലെങ്കിൽ കസ്റ്റമൈസ്ഡ് ഫീച്ചറൈസേഷൻ ഉപയോഗിക്കണോ എന്ന സൂചിക
|
||||
- `debug_log`: ഡീബഗ് വിവരങ്ങൾ എഴുതാനുള്ള ലോഗ് ഫയൽ
|
||||
|
||||
```python
|
||||
from azureml.train.automl import AutoMLConfig
|
||||
|
||||
project_folder = './aml-project'
|
||||
|
||||
automl_settings = {
|
||||
"experiment_timeout_minutes": 20,
|
||||
"max_concurrent_iterations": 3,
|
||||
"primary_metric" : 'AUC_weighted'
|
||||
}
|
||||
|
||||
automl_config = AutoMLConfig(compute_target=compute_target,
|
||||
task = "classification",
|
||||
training_data=dataset,
|
||||
label_column_name="DEATH_EVENT",
|
||||
path = project_folder,
|
||||
enable_early_stopping= True,
|
||||
featurization= 'auto',
|
||||
debug_log = "automl_errors.log",
|
||||
**automl_settings
|
||||
)
|
||||
```
|
||||
|
||||
ഇപ്പോൾ കോൺഫിഗറേഷൻ സജ്ജമാക്കിയതിനുശേഷം, താഴെ കാണുന്ന കോഡ് ഉപയോഗിച്ച് മോഡൽ പരിശീലിപ്പിക്കാം. ക്ലസ്റ്റർ വലുപ്പം അനുസരിച്ച് ഈ ഘട്ടം ഒരു മണിക്കൂർ വരെ എടുക്കാം.
|
||||
|
||||
```python
|
||||
remote_run = experiment.submit(automl_config)
|
||||
```
|
||||
|
||||
RunDetails വിഡ്ജറ്റ് ഉപയോഗിച്ച് വ്യത്യസ്ത പരീക്ഷണങ്ങൾ കാണാം.
|
||||
```python
|
||||
from azureml.widgets import RunDetails
|
||||
RunDetails(remote_run).show()
|
||||
```
|
||||
|
||||
|
||||
## 3. Azure ML SDK ഉപയോഗിച്ച് മോഡൽ വിന്യാസവും എൻഡ്പോയിന്റ് ഉപയോഗവും
|
||||
|
||||
### 3.1 മികച്ച മോഡൽ സേവ് ചെയ്യൽ
|
||||
|
||||
`remote_run` എന്നത് [AutoMLRun](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.run.automlrun?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) തരം ഒബ്ജക്റ്റാണ്. ഈ ഒബ്ജക്റ്റിന് `get_output()` എന്ന മെത്തഡ് ഉണ്ട്, ഇത് മികച്ച റൺയും അനുബന്ധിച്ച ഫിറ്റുചെയ്ത മോഡലും നൽകുന്നു.
|
||||
|
||||
```python
|
||||
best_run, fitted_model = remote_run.get_output()
|
||||
```
|
||||
|
||||
മികച്ച മോഡലിന് ഉപയോഗിച്ച പാരാമീറ്ററുകൾ കാണാൻ, ഫിറ്റുചെയ്ത മോഡൽ പ്രിന്റ് ചെയ്യുക. മികച്ച മോഡലിന്റെ പ്രോപ്പർട്ടികൾ കാണാൻ [get_properties()](https://docs.microsoft.com/python/api/azureml-core/azureml.core.run(class)?view=azure-ml-py#azureml_core_Run_get_properties?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) മെത്തഡ് ഉപയോഗിക്കുക.
|
||||
|
||||
```python
|
||||
best_run.get_properties()
|
||||
```
|
||||
|
||||
ഇപ്പോൾ മോഡൽ [register_model](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.run.automlrun?view=azure-ml-py#register-model-model-name-none--description-none--tags-none--iteration-none--metric-none-?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) മെത്തഡ് ഉപയോഗിച്ച് രജിസ്റ്റർ ചെയ്യുക.
|
||||
```python
|
||||
model_name = best_run.properties['model_name']
|
||||
script_file_name = 'inference/score.py'
|
||||
best_run.download_file('outputs/scoring_file_v_1_0_0.py', 'inference/score.py')
|
||||
description = "aml heart failure project sdk"
|
||||
model = best_run.register_model(model_name = model_name,
|
||||
model_path = './outputs/',
|
||||
description = description,
|
||||
tags = None)
|
||||
```
|
||||
|
||||
|
||||
### 3.2 മോഡൽ വിന്യാസം
|
||||
|
||||
മികച്ച മോഡൽ സേവ് ചെയ്ത ശേഷം, [InferenceConfig](https://docs.microsoft.com/python/api/azureml-core/azureml.core.model.inferenceconfig?view=azure-ml-py?ocid=AID3041109) ക്ലാസ് ഉപയോഗിച്ച് വിന്യസിക്കാം. InferenceConfig വിന്യാസത്തിനായി ഉപയോഗിക്കുന്ന കസ്റ്റം പരിസ്ഥിതിയുടെ കോൺഫിഗറേഷൻ സജ്ജീകരണങ്ങൾ പ്രതിനിധീകരിക്കുന്നു. [AciWebservice](https://docs.microsoft.com/python/api/azureml-core/azureml.core.webservice.aciwebservice?view=azure-ml-py) ക്ലാസ് Azure Container Instances-ൽ വെബ് സേവന എൻഡ്പോയിന്റായി വിന്യസിച്ച മെഷീൻ ലേണിംഗ് മോഡൽ പ്രതിനിധീകരിക്കുന്നു. മോഡൽ, സ്ക്രിപ്റ്റ്, അനുബന്ധ ഫയലുകൾ എന്നിവയിൽ നിന്നാണ് വിന്യസിച്ച സേവനം സൃഷ്ടിക്കുന്നത്. ഫലമായി ലഭിക്കുന്ന വെബ് സേവനം ലോഡ് ബാലൻസ്ഡ്, HTTP എൻഡ്പോയിന്റ് ആണ്, REST API ഉണ്ട്. നിങ്ങൾക്ക് ഈ API-യിലേക്ക് ഡാറ്റ അയച്ച് മോഡലിന്റെ പ്രവചനങ്ങൾ സ്വീകരിക്കാം.
|
||||
|
||||
മോഡൽ [deploy](https://docs.microsoft.com/python/api/azureml-core/azureml.core.model(class)?view=azure-ml-py#deploy-workspace--name--models--inference-config-none--deployment-config-none--deployment-target-none--overwrite-false--show-output-false-?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) മെത്തഡ് ഉപയോഗിച്ച് വിന്യസിക്കുന്നു.
|
||||
|
||||
```python
|
||||
from azureml.core.model import InferenceConfig, Model
|
||||
from azureml.core.webservice import AciWebservice
|
||||
|
||||
inference_config = InferenceConfig(entry_script=script_file_name, environment=best_run.get_environment())
|
||||
|
||||
aciconfig = AciWebservice.deploy_configuration(cpu_cores = 1,
|
||||
memory_gb = 1,
|
||||
tags = {'type': "automl-heart-failure-prediction"},
|
||||
description = 'Sample service for AutoML Heart Failure Prediction')
|
||||
|
||||
aci_service_name = 'automl-hf-sdk'
|
||||
aci_service = Model.deploy(ws, aci_service_name, [model], inference_config, aciconfig)
|
||||
aci_service.wait_for_deployment(True)
|
||||
print(aci_service.state)
|
||||
```
|
||||
|
||||
ഈ ഘട്ടം കുറച്ച് മിനിറ്റുകൾ എടുക്കും.
|
||||
|
||||
### 3.3 എൻഡ്പോയിന്റ് ഉപയോഗം
|
||||
|
||||
നിങ്ങളുടെ എൻഡ്പോയിന്റ് ഉപയോഗിക്കാൻ ഒരു സാമ്പിൾ ഇൻപുട്ട് സൃഷ്ടിക്കുക:
|
||||
```python
|
||||
data = {
|
||||
"data":
|
||||
[
|
||||
{
|
||||
'age': "60",
|
||||
'anaemia': "false",
|
||||
'creatinine_phosphokinase': "500",
|
||||
'diabetes': "false",
|
||||
'ejection_fraction': "38",
|
||||
'high_blood_pressure': "false",
|
||||
'platelets': "260000",
|
||||
'serum_creatinine': "1.40",
|
||||
'serum_sodium': "137",
|
||||
'sex': "false",
|
||||
'smoking': "false",
|
||||
'time': "130",
|
||||
},
|
||||
],
|
||||
}
|
||||
|
||||
test_sample = str.encode(json.dumps(data))
|
||||
```
|
||||
അതിനുശേഷം, പ്രവചനത്തിനായി ഈ ഇൻപുട്ട് നിങ്ങളുടെ മോഡലിലേക്ക് അയയ്ക്കാം:
|
||||
|
||||
```python
|
||||
response = aci_service.run(input_data=test_sample)
|
||||
response
|
||||
```
|
||||
ഇത് `'{"result": [false]}'` എന്ന ഔട്ട്പുട്ട് നൽകണം. ഇതിന്റെ അർത്ഥം, ഞങ്ങൾ എൻഡ്പോയിന്റിലേക്ക് അയച്ച രോഗിയുടെ ഇൻപുട്ട് `false` എന്ന പ്രവചനമാണ് സൃഷ്ടിച്ചത്, അതായത് ഈ വ്യക്തിക്ക് ഹൃദയാഘാതം സംഭവിക്കാനുള്ള സാധ്യത കുറവാണ്.
|
||||
|
||||
അഭിനന്ദനങ്ങൾ! നിങ്ങൾ ഇപ്പോൾ Azure ML SDK ഉപയോഗിച്ച് Azure ML-ൽ ഡിപ്ലോയ് ചെയ്ത് പരിശീലിപ്പിച്ച മോഡൽ ഉപയോഗിച്ചു!
|
||||
|
||||
> **_കുറിപ്പ്:_** പ്രോജക്ട് പൂർത്തിയാക്കിയ ശേഷം എല്ലാ റിസോഴ്സുകളും ഇല്ലാതാക്കാൻ മറക്കരുത്.
|
||||
|
||||
## 🚀 ചലഞ്ച്
|
||||
|
||||
SDK വഴി നിങ്ങൾ ചെയ്യാൻ കഴിയുന്ന മറ്റു പല കാര്യങ്ങളും ഉണ്ട്, പക്ഷേ ഈ പാഠത്തിൽ അവ എല്ലാം കാണാൻ സാധിക്കില്ല. എന്നാൽ നല്ല വാർത്ത, SDK ഡോക്യുമെന്റേഷൻ എങ്ങനെ സ്കിം ചെയ്യാമെന്ന് പഠിക്കുന്നത് നിങ്ങൾക്ക് സ്വയം വളരെ സഹായകമായിരിക്കും. Azure ML SDK ഡോക്യുമെന്റേഷൻ പരിശോധിച്ച് പൈപ്പ്ലൈൻ സൃഷ്ടിക്കാൻ അനുവദിക്കുന്ന `Pipeline` ക്ലാസ് കണ്ടെത്തുക. ഒരു Pipeline എന്നത് ഒരു വർക്ക്ഫ്ലോ ആയി പ്രവർത്തിപ്പിക്കാവുന്ന പല ഘട്ടങ്ങളുടെ സമാഹാരമാണ്.
|
||||
|
||||
**സൂചന:** [SDK ഡോക്യുമെന്റേഷൻ](https://docs.microsoft.com/python/api/overview/azure/ml/?view=azure-ml-py?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) സന്ദർശിച്ച് തിരയൽ ബാറിൽ "Pipeline" പോലുള്ള കീവേഡുകൾ ടൈപ്പ് ചെയ്യുക. തിരയൽ ഫലങ്ങളിൽ `azureml.pipeline.core.Pipeline` ക്ലാസ് കാണാം.
|
||||
|
||||
## [പോസ്റ്റ്-ലെക്ചർ ക്വിസ്](https://ff-quizzes.netlify.app/en/ds/quiz/37)
|
||||
|
||||
## അവലോകനം & സ്വയം പഠനം
|
||||
|
||||
ഈ പാഠത്തിൽ, നിങ്ങൾ Azure ML SDK ഉപയോഗിച്ച് ഹൃദയ പരാജയ സാധ്യത പ്രവചിക്കാൻ മോഡൽ പരിശീലിപ്പിക്കുകയും ഡിപ്ലോയ് ചെയ്യുകയും ഉപയോഗിക്കുകയും ചെയ്യുന്നത് പഠിച്ചു. Azure ML SDK-യെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾക്ക് ഈ [ഡോക്യുമെന്റേഷൻ](https://docs.microsoft.com/python/api/overview/azure/ml/?view=azure-ml-py?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) പരിശോധിക്കുക. Azure ML SDK ഉപയോഗിച്ച് നിങ്ങളുടെ സ്വന്തം മോഡൽ സൃഷ്ടിക്കാൻ ശ്രമിക്കുക.
|
||||
|
||||
## അസൈൻമെന്റ്
|
||||
|
||||
[Azure ML SDK ഉപയോഗിച്ച് ഡാറ്റാ സയൻസ് പ്രോജക്ട്](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "386efdbc19786951341f6956247ee990",
|
||||
"translation_date": "2025-12-19T14:47:26+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/19-Azure/assignment.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# Azure ML SDK ഉപയോഗിച്ച് ഡാറ്റാ സയൻസ് പ്രോജക്ട്
|
||||
|
||||
## നിർദ്ദേശങ്ങൾ
|
||||
|
||||
Azure ML SDK ഉപയോഗിച്ച് ഒരു മോഡൽ ട്രെയിൻ ചെയ്യാനും, ഡിപ്ലോയ് ചെയ്യാനും, ഉപയോഗിക്കാനും Azure ML പ്ലാറ്റ്ഫോം എങ്ങനെ ഉപയോഗിക്കാമെന്ന് നാം കണ്ടു. ഇപ്പോൾ മറ്റൊരു മോഡൽ ട്രെയിൻ ചെയ്യാൻ, ഡിപ്ലോയ് ചെയ്യാൻ, ഉപയോഗിക്കാൻ നിങ്ങൾക്ക് ഉപയോഗിക്കാവുന്ന ചില ഡാറ്റ കണ്ടെത്താൻ ചുറ്റിപ്പറ്റി നോക്കുക. [Kaggle](https://kaggle.com) ലും [Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ലും ഡാറ്റാസെറ്റുകൾ അന്വേഷിക്കാം.
|
||||
|
||||
## റൂബ്രിക്
|
||||
|
||||
| ഉദാഹരണമായ | മതിയായ | മെച്ചപ്പെടുത്തേണ്ടത് |
|
||||
|-----------|----------|-------------------|
|
||||
|AutoML കോൺഫിഗറേഷൻ ചെയ്യുമ്പോൾ, നിങ്ങൾ SDK ഡോക്യുമെന്റേഷൻ പരിശോധിച്ച് ഉപയോഗിക്കാവുന്ന പാരാമീറ്ററുകൾ കണ്ടു. Azure ML SDK ഉപയോഗിച്ച് AutoML വഴി ഒരു ഡാറ്റാസെറ്റിൽ ട്രെയിനിംഗ് നടത്തി, മോഡൽ വിശദീകരണങ്ങൾ പരിശോധിച്ചു. മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, Azure ML SDK വഴി അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. | Azure ML SDK ഉപയോഗിച്ച് AutoML വഴി ഒരു ഡാറ്റാസെറ്റിൽ ട്രെയിനിംഗ് നടത്തി, മോഡൽ വിശദീകരണങ്ങൾ പരിശോധിച്ചു. മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, Azure ML SDK വഴി അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. | Azure ML SDK ഉപയോഗിച്ച് AutoML വഴി ഒരു ഡാറ്റാസെറ്റിൽ ട്രെയിനിംഗ് നടത്തി. മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്തു, Azure ML SDK വഴി അത് ഉപയോഗിക്കാൻ കഴിഞ്ഞു. |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,325 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: \"Azure ML SDK\" വഴി\n",
|
||||
"\n",
|
||||
"## പരിചയം\n",
|
||||
"\n",
|
||||
"ഈ നോട്ട്ബുക്കിൽ, Azure ML ഉപയോഗിച്ച് ഒരു മോഡൽ ട്രെയിൻ ചെയ്യാനും, ഡിപ്ലോയ് ചെയ്യാനും, ഉപയോഗിക്കാനും Azure ML SDK എങ്ങനെ ഉപയോഗിക്കാമെന്ന് നാം പഠിക്കും.\n",
|
||||
"\n",
|
||||
"ആവശ്യമായ മുൻപരിചയങ്ങൾ:\n",
|
||||
"1. നിങ്ങൾ ഒരു Azure ML വർക്ക്സ്പേസ് സൃഷ്ടിച്ചിട്ടുണ്ട്.\n",
|
||||
"2. നിങ്ങൾ [ഹാർട്ട് ഫെയില്യർ ഡാറ്റാസെറ്റ്](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) Azure ML-ലേക്ക് ലോഡ് ചെയ്തിട്ടുണ്ട്.\n",
|
||||
"3. നിങ്ങൾ ഈ നോട്ട്ബുക്ക് Azure ML സ്റ്റുഡിയോയിൽ അപ്ലോഡ് ചെയ്തിട്ടുണ്ട്.\n",
|
||||
"\n",
|
||||
"അടുത്ത ഘട്ടങ്ങൾ:\n",
|
||||
"\n",
|
||||
"1. നിലവിലുള്ള വർക്ക്സ്പേസിൽ ഒരു എക്സ്പെരിമെന്റ് സൃഷ്ടിക്കുക.\n",
|
||||
"2. ഒരു കംപ്യൂട്ട് ക്ലസ്റ്റർ സൃഷ്ടിക്കുക.\n",
|
||||
"3. ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യുക.\n",
|
||||
"4. AutoMLConfig ഉപയോഗിച്ച് AutoML കോൺഫിഗർ ചെയ്യുക.\n",
|
||||
"5. AutoML എക്സ്പെരിമെന്റ് റൺ ചെയ്യുക.\n",
|
||||
"6. ഫലങ്ങൾ പരിശോധിച്ച് മികച്ച മോഡൽ കണ്ടെത്തുക.\n",
|
||||
"7. മികച്ച മോഡൽ രജിസ്റ്റർ ചെയ്യുക.\n",
|
||||
"8. മികച്ച മോഡൽ ഡിപ്ലോയ് ചെയ്യുക.\n",
|
||||
"9. എന്റ്പോയിന്റ് ഉപയോഗിക്കുക.\n",
|
||||
"\n",
|
||||
"## Azure മെഷീൻ ലേണിംഗ് SDK-നു പ്രത്യേകമായ ഇമ്പോർട്ടുകൾ\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"from azureml.core import Workspace, Experiment\n",
|
||||
"from azureml.core.compute import AmlCompute\n",
|
||||
"from azureml.train.automl import AutoMLConfig\n",
|
||||
"from azureml.widgets import RunDetails\n",
|
||||
"from azureml.core.model import InferenceConfig, Model\n",
|
||||
"from azureml.core.webservice import AciWebservice"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## Initialize Workspace\n",
|
||||
"സ്ഥിരീകരിച്ച കോൺഫിഗറേഷൻ നിന്ന് ഒരു വർക്ക്സ്പേസ് ഒബ്ജക്റ്റ് ആരംഭിക്കുക. .\\config.json എന്ന സ്ഥലത്ത് കോൺഫിഗ് ഫയൽ ഉണ്ടെന്ന് ഉറപ്പാക്കുക.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"ws = Workspace.from_config()\n",
|
||||
"print(ws.name, ws.resource_group, ws.location, ws.subscription_id, sep = '\\n')"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## Create an Azure ML experiment\n",
|
||||
"\n",
|
||||
"നാം ഇപ്പോൾ ആരംഭിച്ച വർക്ക്സ്പേസിൽ 'aml-experiment' എന്ന പേരിൽ ഒരു പരീക്ഷണം സൃഷ്ടിക്കാം.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"experiment_name = 'aml-experiment'\n",
|
||||
"experiment = Experiment(ws, experiment_name)\n",
|
||||
"experiment"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## കംപ്യൂട്ട് ക്ലസ്റ്റർ സൃഷ്ടിക്കുക\n",
|
||||
"നിങ്ങളുടെ AutoML റൺക്കായി ഒരു [compute target](https://docs.microsoft.com/azure/machine-learning/concept-azure-machine-learning-architecture#compute-target) സൃഷ്ടിക്കേണ്ടതുണ്ട്.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"aml_name = \"heart-f-cluster\"\n",
|
||||
"try:\n",
|
||||
" aml_compute = AmlCompute(ws, aml_name)\n",
|
||||
" print('Found existing AML compute context.')\n",
|
||||
"except:\n",
|
||||
" print('Creating new AML compute context.')\n",
|
||||
" aml_config = AmlCompute.provisioning_configuration(vm_size = \"Standard_D2_v2\", min_nodes=1, max_nodes=3)\n",
|
||||
" aml_compute = AmlCompute.create(ws, name = aml_name, provisioning_configuration = aml_config)\n",
|
||||
" aml_compute.wait_for_completion(show_output = True)\n",
|
||||
"\n",
|
||||
"cts = ws.compute_targets\n",
|
||||
"compute_target = cts[aml_name]"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## Data\n",
|
||||
"നിങ്ങൾ ഡാറ്റാസെറ്റ് Azure ML-ലേക്ക് അപ്ലോഡ് ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക, കൂടാതെ കീ ഡാറ്റാസെറ്റിന്റെ പേരുമായി ഒരേ പേരിലാണ്.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"key = 'heart-failure-records'\n",
|
||||
"dataset = ws.datasets[key]\n",
|
||||
"df = dataset.to_pandas_dataframe()\n",
|
||||
"df.describe()"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## ഓട്ടോഎംഎൽ കോൺഫിഗറേഷൻ\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"automl_settings = {\n",
|
||||
" \"experiment_timeout_minutes\": 20,\n",
|
||||
" \"max_concurrent_iterations\": 3,\n",
|
||||
" \"primary_metric\" : 'AUC_weighted'\n",
|
||||
"}\n",
|
||||
"\n",
|
||||
"automl_config = AutoMLConfig(compute_target=compute_target,\n",
|
||||
" task = \"classification\",\n",
|
||||
" training_data=dataset,\n",
|
||||
" label_column_name=\"DEATH_EVENT\",\n",
|
||||
" enable_early_stopping= True,\n",
|
||||
" featurization= 'auto',\n",
|
||||
" debug_log = \"automl_errors.log\",\n",
|
||||
" **automl_settings\n",
|
||||
" )"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## ഓട്ടോഎംഎൽ റൺ\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"remote_run = experiment.submit(automl_config)"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"RunDetails(remote_run).show()"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## മികച്ച മോഡൽ സംരക്ഷിക്കുക\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"best_run, fitted_model = remote_run.get_output()"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"best_run.get_properties()"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"model_name = best_run.properties['model_name']\n",
|
||||
"script_file_name = 'inference/score.py'\n",
|
||||
"best_run.download_file('outputs/scoring_file_v_1_0_0.py', 'inference/score.py')\n",
|
||||
"description = \"aml heart failure project sdk\"\n",
|
||||
"model = best_run.register_model(model_name = model_name,\n",
|
||||
" description = description,\n",
|
||||
" tags = None)"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## മികച്ച മോഡൽ വിന്യസിക്കുക\n",
|
||||
"\n",
|
||||
"മികച്ച മോഡൽ വിന്യസിക്കാൻ താഴെ കൊടുത്തിരിക്കുന്ന കോഡ് പ്രവർത്തിപ്പിക്കുക. Azure ML പോർട്ടലിൽ വിന്യസനത്തിന്റെ നില നിങ്ങൾക്ക് കാണാം. ഈ ഘട്ടം കുറച്ച് മിനിറ്റുകൾ എടുക്കാം.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"inference_config = InferenceConfig(entry_script=script_file_name, environment=best_run.get_environment())\n",
|
||||
"\n",
|
||||
"aciconfig = AciWebservice.deploy_configuration(cpu_cores = 1,\n",
|
||||
" memory_gb = 1,\n",
|
||||
" tags = {'type': \"automl-heart-failure-prediction\"},\n",
|
||||
" description = 'Sample service for AutoML Heart Failure Prediction')\n",
|
||||
"\n",
|
||||
"aci_service_name = 'automl-hf-sdk'\n",
|
||||
"aci_service = Model.deploy(ws, aci_service_name, [model], inference_config, aciconfig)\n",
|
||||
"aci_service.wait_for_deployment(True)\n",
|
||||
"print(aci_service.state)"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## എന്റ്പോയിന്റ് ഉപയോഗിക്കുക\n",
|
||||
"താഴെ കൊടുത്തിരിക്കുന്ന ഇൻപുട്ട് സാമ്പിളിൽ നിങ്ങൾക്ക് ഇൻപുട്ടുകൾ ചേർക്കാം.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"data = {\n",
|
||||
" \"data\":\n",
|
||||
" [\n",
|
||||
" {\n",
|
||||
" 'age': \"60\",\n",
|
||||
" 'anaemia': \"false\",\n",
|
||||
" 'creatinine_phosphokinase': \"500\",\n",
|
||||
" 'diabetes': \"false\",\n",
|
||||
" 'ejection_fraction': \"38\",\n",
|
||||
" 'high_blood_pressure': \"false\",\n",
|
||||
" 'platelets': \"260000\",\n",
|
||||
" 'serum_creatinine': \"1.40\",\n",
|
||||
" 'serum_sodium': \"137\",\n",
|
||||
" 'sex': \"false\",\n",
|
||||
" 'smoking': \"false\",\n",
|
||||
" 'time': \"130\",\n",
|
||||
" },\n",
|
||||
" ],\n",
|
||||
"}\n",
|
||||
"\n",
|
||||
"test_sample = str.encode(json.dumps(data))"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [
|
||||
"response = aci_service.run(input_data=test_sample)\n",
|
||||
"response"
|
||||
],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**അസൂയാ**: \nഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "af42669556d5dc19fc4cc3866f7d2597",
|
||||
"translation_date": "2025-12-19T17:10:08+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/19-Azure/notebook.ipynb",
|
||||
"language_code": "ml"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
@ -0,0 +1,36 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "8dfe141a0f46f7d253e07f74913c7f44",
|
||||
"translation_date": "2025-12-19T13:23:43+00:00",
|
||||
"source_file": "5-Data-Science-In-Cloud/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്
|
||||
|
||||

|
||||
|
||||
> ഫോട്ടോ [Jelleke Vanooteghem](https://unsplash.com/@ilumire) യുടെ [Unsplash](https://unsplash.com/s/photos/cloud?orientation=landscape) ൽ നിന്നാണ്
|
||||
|
||||
വലിയ ഡാറ്റയുമായി ഡാറ്റാ സയൻസ് ചെയ്യുമ്പോൾ, ക്ലൗഡ് ഒരു ഗെയിം ചേഞ്ചർ ആകാം. അടുത്ത മൂന്ന് പാഠങ്ങളിൽ, ക്ലൗഡ് എന്താണെന്നും അത് എങ്ങനെ സഹായകരമാകാമെന്നും നാം കാണാൻ പോകുന്നു. ഹൃദയ പരാജയ ഡാറ്റാസെറ്റ് പരിശോധിച്ച്, ആരെങ്കിലും ഹൃദയ പരാജയ സാധ്യതയുള്ളതെന്ന് വിലയിരുത്താൻ സഹായിക്കുന്ന ഒരു മോഡൽ നിർമ്മിക്കാനും നാം പോകുന്നു. മോഡൽ പരിശീലിപ്പിക്കാൻ, വിന്യസിക്കാൻ, ഉപയോഗിക്കാൻ ക്ലൗഡിന്റെ ശക്തി ഉപയോഗിക്കും. ഒരു വഴി കുറഞ്ഞ കോഡ്/കോഡ് ഇല്ലാത്ത രീതിയിൽ മാത്രം ഉപയോക്തൃ ഇന്റർഫേസ് ഉപയോഗിച്ച്, മറ്റൊരു വഴി Azure മെഷീൻ ലേണിംഗ് സോഫ്റ്റ്വെയർ ഡെവലപ്പർ കിറ്റ് (Azure ML SDK) ഉപയോഗിച്ച്.
|
||||
|
||||

|
||||
|
||||
### വിഷയങ്ങൾ
|
||||
|
||||
1. [ഡാറ്റാ സയൻസിനായി ക്ലൗഡ് ഉപയോഗിക്കേണ്ടത് എന്തുകൊണ്ട്?](17-Introduction/README.md)
|
||||
2. [ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: "കുറഞ്ഞ കോഡ്/കോഡ് ഇല്ലാത്ത" വഴി](18-Low-Code/README.md)
|
||||
3. [ക്ലൗഡിലെ ഡാറ്റാ സയൻസ്: "Azure ML SDK" വഴി](19-Azure/README.md)
|
||||
|
||||
### ക്രെഡിറ്റുകൾ
|
||||
ഈ പാഠങ്ങൾ ☁️യും 💕യും കൊണ്ട് [Maud Levy](https://twitter.com/maudstweets)യും [Tiffany Souterre](https://twitter.com/TiffanySouterre)യും ചേർന്ന് എഴുതിയതാണ്
|
||||
|
||||
ഹൃദയ പരാജയ പ്രവചന പദ്ധതിക്കുള്ള ഡാറ്റ [Larxel](https://www.kaggle.com/andrewmvd) എന്നവരിൽ നിന്നുള്ളതാണ്, [Kaggle](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) ൽ നിന്നും. ഇത് [Attribution 4.0 International (CC BY 4.0)](https://creativecommons.org/licenses/by/4.0/) അനുമതിയോടെ ലൈസൻസുചെയ്യപ്പെട്ടതാണ്.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "07faf02ff163e609edf0b0308dc5d4e6",
|
||||
"translation_date": "2025-12-19T13:36:40+00:00",
|
||||
"source_file": "6-Data-Science-In-Wild/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# Data Science in the Wild
|
||||
|
||||
വ്യവസായങ്ങളിലുടനീളം ഡാറ്റാ സയൻസിന്റെ യഥാർത്ഥ ലോക പ്രയോഗങ്ങൾ.
|
||||
|
||||
### Topics
|
||||
|
||||
1. [Data Science in the Real World](20-Real-World-Examples/README.md)
|
||||
|
||||
### Credits
|
||||
|
||||
❤️ കൊണ്ട് എഴുതിയത് [Nitya Narasimhan](https://twitter.com/nitya)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,375 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "cc2e18ab65df63e75d3619c4752e9b22",
|
||||
"translation_date": "2025-12-19T13:04:53+00:00",
|
||||
"source_file": "AGENTS.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# AGENTS.md
|
||||
|
||||
## പ്രോജക്ട് അവലോകനം
|
||||
|
||||
ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ് മൈക്രോസോഫ്റ്റ് അസ്യൂർ ക്ലൗഡ് അഡ്വക്കേറ്റ്സ് സൃഷ്ടിച്ച ഒരു സമഗ്രമായ 10 ആഴ്ച, 20 പാഠം കോഴ്സാണ്. ഈ റിപോസിറ്ററി പ്രോജക്ട് അടിസ്ഥാനമാക്കിയ പാഠങ്ങളിലൂടെ അടിസ്ഥാന ഡാറ്റാ സയൻസ് ആശയങ്ങൾ പഠിപ്പിക്കുന്ന ഒരു പഠന വിഭവമാണ്, ഇതിൽ Jupyter നോട്ട്ബുക്കുകൾ, ഇന്ററാക്ടീവ് ക്വിസുകൾ, ഹാൻഡ്സ്-ഓൺ അസൈൻമെന്റുകൾ ഉൾപ്പെടുന്നു.
|
||||
|
||||
**പ്രധാന സാങ്കേതികവിദ്യകൾ:**
|
||||
- **Jupyter Notebooks**: Python 3 ഉപയോഗിച്ച് പ്രധാന പഠന മാധ്യമം
|
||||
- **Python ലൈബ്രറികൾ**: pandas, numpy, matplotlib ഡാറ്റാ വിശകലനത്തിനും ദൃശ്യീകരണത്തിനും
|
||||
- **Vue.js 2**: ക്വിസ് അപ്ലിക്കേഷൻ (quiz-app ഫോൾഡർ)
|
||||
- **Docsify**: ഓഫ്ലൈൻ ആക്സസ്ക്കായി ഡോക്യുമെന്റേഷൻ സൈറ്റ് ജനറേറ്റർ
|
||||
- **Node.js/npm**: ജാവാസ്ക്രിപ്റ്റ് ഘടകങ്ങൾക്ക് പാക്കേജ് മാനേജ്മെന്റ്
|
||||
- **Markdown**: എല്ലാ പാഠം ഉള്ളടക്കവും ഡോക്യുമെന്റേഷനും
|
||||
|
||||
**ആർക്കിടെക്ചർ:**
|
||||
- വ്യാപകമായ ഭാഷാന്തരങ്ങളുള്ള ബഹുഭാഷാ വിദ്യാഭ്യാസ റിപോസിറ്ററി
|
||||
- പാഠം മോഡ്യൂളുകളായി ഘടിപ്പിച്ചിരിക്കുന്നു (1-Introduction മുതൽ 6-Data-Science-In-Wild വരെ)
|
||||
- ഓരോ പാഠത്തിലും README, നോട്ട്ബുക്കുകൾ, അസൈൻമെന്റുകൾ, ക്വിസുകൾ ഉൾപ്പെടുന്നു
|
||||
- പാഠത്തിന് മുൻപും ശേഷവും മൂല്യനിർണയത്തിനായി സ്റ്റാൻഡ്എലോൺ Vue.js ക്വിസ് അപ്ലിക്കേഷൻ
|
||||
- GitHub Codespaces, VS Code ഡെവ് കണ്ടെയ്നറുകൾ പിന്തുണ
|
||||
|
||||
## സെറ്റപ്പ് കമാൻഡുകൾ
|
||||
|
||||
### റിപോസിറ്ററി സെറ്റപ്പ്
|
||||
```bash
|
||||
# റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യുക (ഇതിനുമുമ്പ് ക്ലോൺ ചെയ്തിട്ടില്ലെങ്കിൽ)
|
||||
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
|
||||
cd Data-Science-For-Beginners
|
||||
```
|
||||
|
||||
### Python പരിസ്ഥിതി സെറ്റപ്പ്
|
||||
```bash
|
||||
# ഒരു വെർച്വൽ എൻവയോൺമെന്റ് സൃഷ്ടിക്കുക (ശുപാർശ ചെയ്യുന്നു)
|
||||
python -m venv venv
|
||||
source venv/bin/activate # വിൻഡോസ്-ൽ: venv\Scripts\activate
|
||||
|
||||
# പൊതുവായ ഡാറ്റാ സയൻസ് ലൈബ്രറികൾ ഇൻസ്റ്റാൾ ചെയ്യുക (requirements.txt ഇല്ല)
|
||||
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
|
||||
```
|
||||
|
||||
### ക്വിസ് അപ്ലിക്കേഷൻ സെറ്റപ്പ്
|
||||
```bash
|
||||
# ക്വിസ് ആപ്പിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക
|
||||
cd quiz-app
|
||||
|
||||
# ആശ്രിതങ്ങൾ ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
npm install
|
||||
|
||||
# ഡെവലപ്പ്മെന്റ് സർവർ ആരംഭിക്കുക
|
||||
npm run serve
|
||||
|
||||
# പ്രൊഡക്ഷനായി ബിൽഡ് ചെയ്യുക
|
||||
npm run build
|
||||
|
||||
# ലിന്റ് ചെയ്ത് ഫയലുകൾ ശരിയാക്കുക
|
||||
npm run lint
|
||||
```
|
||||
|
||||
### Docsify ഡോക്യുമെന്റേഷൻ സർവർ
|
||||
```bash
|
||||
# ഡോക്സിഫൈ ഗ്ലോബലായി ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
npm install -g docsify-cli
|
||||
|
||||
# ഡോക്യുമെന്റേഷൻ ലോക്കലായി സർവ് ചെയ്യുക
|
||||
docsify serve
|
||||
|
||||
# ഡോക്യുമെന്റേഷൻ localhost:3000 ൽ ലഭ്യമായിരിക്കും
|
||||
```
|
||||
|
||||
### ദൃശ്യീകരണ പ്രോജക്ടുകൾ സെറ്റപ്പ്
|
||||
meaningful-visualizations പോലുള്ള ദൃശ്യീകരണ പ്രോജക്ടുകൾക്കായി (പാഠം 13):
|
||||
```bash
|
||||
# സ്റ്റാർട്ടർ അല്ലെങ്കിൽ സൊല്യൂഷൻ ഫോൾഡറിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക
|
||||
cd 3-Data-Visualization/13-meaningful-visualizations/starter
|
||||
|
||||
# ആശ്രിതങ്ങൾ ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
npm install
|
||||
|
||||
# ഡെവലപ്പ്മെന്റ് സർവർ ആരംഭിക്കുക
|
||||
npm run serve
|
||||
|
||||
# പ്രൊഡക്ഷനായി ബിൽഡ് ചെയ്യുക
|
||||
npm run build
|
||||
|
||||
# ഫയലുകൾ ലിന്റ് ചെയ്യുക
|
||||
npm run lint
|
||||
```
|
||||
|
||||
## ഡെവലപ്പ്മെന്റ് വർക്ക്ഫ്ലോ
|
||||
|
||||
### Jupyter നോട്ട്ബുക്കുകളുമായി പ്രവർത്തിക്കൽ
|
||||
1. റിപോസിറ്ററി റൂട്ടിൽ Jupyter ആരംഭിക്കുക: `jupyter notebook`
|
||||
2. ആവശ്യമായ പാഠ ഫോൾഡറിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക
|
||||
3. `.ipynb` ഫയലുകൾ തുറന്ന് അഭ്യാസങ്ങൾ ചെയ്യുക
|
||||
4. നോട്ട്ബുക്കുകൾ സ്വയം സമ്പൂർണമാണ്, വിശദീകരണങ്ങളും കോഡ് സെല്ലുകളും ഉൾപ്പെടുന്നു
|
||||
5. മിക്ക നോട്ട്ബുക്കുകളും pandas, numpy, matplotlib ഉപയോഗിക്കുന്നു - ഇവ ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക
|
||||
|
||||
### പാഠ ഘടന
|
||||
ഓരോ പാഠവും സാധാരണയായി ഉൾക്കൊള്ളുന്നു:
|
||||
- `README.md` - സിദ്ധാന്തവും ഉദാഹരണങ്ങളും ഉള്ള പ്രധാന പാഠം ഉള്ളടക്കം
|
||||
- `notebook.ipynb` - ഹാൻഡ്സ്-ഓൺ Jupyter നോട്ട്ബുക്ക് അഭ്യാസങ്ങൾ
|
||||
- `assignment.ipynb` അല്ലെങ്കിൽ `assignment.md` - പ്രാക്ടീസ് അസൈൻമെന്റുകൾ
|
||||
- `solution/` ഫോൾഡർ - പരിഹാര നോട്ട്ബുക്കുകളും കോഡും
|
||||
- `images/` ഫോൾഡർ - പിന്തുണയ്ക്കുന്ന ദൃശ്യ സാമഗ്രികൾ
|
||||
|
||||
### ക്വിസ് അപ്ലിക്കേഷൻ ഡെവലപ്പ്മെന്റ്
|
||||
- ഡെവലപ്പ്മെന്റിനിടെ ഹോട്ട്-റീലോഡ് ഉള്ള Vue.js 2 അപ്ലിക്കേഷൻ
|
||||
- ക്വിസുകൾ `quiz-app/src/assets/translations/` ൽ സൂക്ഷിക്കുന്നു
|
||||
- ഓരോ ഭാഷക്കും സ്വന്തം ഭാഷാന്തര ഫോൾഡർ ഉണ്ട് (en, fr, es, മുതലായവ)
|
||||
- ക്വിസ് നമ്പറിംഗ് 0 മുതൽ 39 വരെ (മൊത്തം 40 ക്വിസുകൾ)
|
||||
|
||||
### ഭാഷാന്തരങ്ങൾ ചേർക്കൽ
|
||||
- ഭാഷാന്തരങ്ങൾ റിപോസിറ്ററി റൂട്ടിലുള്ള `translations/` ഫോൾഡറിൽ പോകും
|
||||
- ഓരോ ഭാഷക്കും ഇംഗ്ലീഷിൽ നിന്നുള്ള പാഠ ഘടന പൂർണ്ണമായി മിറർ ചെയ്യുന്നു
|
||||
- GitHub Actions വഴി സ്വയംഭാഷാന്തരം (co-op-translator.yml)
|
||||
|
||||
## ടെസ്റ്റിംഗ് നിർദ്ദേശങ്ങൾ
|
||||
|
||||
### ക്വിസ് അപ്ലിക്കേഷൻ ടെസ്റ്റിംഗ്
|
||||
```bash
|
||||
cd quiz-app
|
||||
|
||||
# ലിന്റ് പരിശോധനകൾ നടത്തുക
|
||||
npm run lint
|
||||
|
||||
# ബിൽഡ് പ്രക്രിയ പരിശോധിക്കുക
|
||||
npm run build
|
||||
|
||||
# മാനുവൽ ടെസ്റ്റിംഗ്: ഡെവ് സർവർ ആരംഭിച്ച് ക്വിസ് പ്രവർത്തനം സ്ഥിരീകരിക്കുക
|
||||
npm run serve
|
||||
```
|
||||
|
||||
### നോട്ട്ബുക്ക് ടെസ്റ്റിംഗ്
|
||||
- നോട്ട്ബുക്കുകൾക്കായി യാന്ത്രിക ടെസ്റ്റ് ഫ്രെയിംവർക്ക് ഇല്ല
|
||||
- മാനുവൽ പരിശോധന: എല്ലാ സെല്ലുകളും ക്രമത്തിൽ ഓടിക്കുക, പിശകുകൾ ഇല്ലെന്ന് ഉറപ്പാക്കുക
|
||||
- ഡാറ്റാ ഫയലുകൾ ലഭ്യമാണ് എന്ന് പരിശോധിക്കുക, ഔട്ട്പുട്ടുകൾ ശരിയായി ഉണ്ടാകുന്നു എന്ന് ഉറപ്പാക്കുക
|
||||
- ദൃശ്യീകരണങ്ങൾ ശരിയായി പ്രദർശിപ്പിക്കുന്നുണ്ടെന്ന് പരിശോധിക്കുക
|
||||
|
||||
### ഡോക്യുമെന്റേഷൻ ടെസ്റ്റിംഗ്
|
||||
```bash
|
||||
# ഡോക്സിഫൈ ശരിയായി റെൻഡർ ചെയ്യുന്നതായി സ്ഥിരീകരിക്കുക
|
||||
docsify serve
|
||||
|
||||
# ഉള്ളടക്കം വഴി നാവിഗേറ്റ് ചെയ്ത് തകരാറുള്ള ലിങ്കുകൾ മാനുവലായി പരിശോധിക്കുക
|
||||
# റെൻഡർ ചെയ്ത ഡോക്യുമെന്റേഷനിൽ എല്ലാ പാഠ ലിങ്കുകളും പ്രവർത്തിക്കുന്നുണ്ടെന്ന് സ്ഥിരീകരിക്കുക
|
||||
```
|
||||
|
||||
### കോഡ് ഗുണനിലവാര പരിശോധനകൾ
|
||||
```bash
|
||||
# Vue.js പ്രോജക്ടുകൾ (ക്വിസ്-ആപ്പ് மற்றும் ദൃശ്യീകരണ പ്രോജക്ടുകൾ)
|
||||
cd quiz-app # അല്ലെങ്കിൽ ദൃശ്യീകരണ പ്രോജക്ട് ഫോൾഡർ
|
||||
npm run lint
|
||||
|
||||
# പൈത്തൺ നോട്ട്ബുക്കുകൾ - മാനുവൽ പരിശോധന ശുപാർശ ചെയ്യുന്നു
|
||||
# ഇറക്കുമതികൾ പ്രവർത്തിക്കുന്നുവെന്ന് ഉറപ്പാക്കുക, സെല്ലുകൾ പിശകുകൾ കൂടാതെ പ്രവർത്തിക്കണം
|
||||
```
|
||||
|
||||
## കോഡ് സ്റ്റൈൽ മാർഗ്ഗനിർദ്ദേശങ്ങൾ
|
||||
|
||||
### Python (Jupyter നോട്ട്ബുക്കുകൾ)
|
||||
- Python കോഡിനായി PEP 8 സ്റ്റൈൽ മാർഗ്ഗനിർദ്ദേശങ്ങൾ പാലിക്കുക
|
||||
- ഡാറ്റ വിശകലനത്തിന് വ്യക്തമായ വേരിയബിൾ നാമങ്ങൾ ഉപയോഗിക്കുക
|
||||
- കോഡ് സെല്ലുകൾക്ക് മുമ്പ് വിശദീകരണങ്ങളുള്ള മാർക്ക്ഡൗൺ സെല്ലുകൾ ഉൾപ്പെടുത്തുക
|
||||
- കോഡ് സെല്ലുകൾ ഏക ആശയങ്ങളിലോ പ്രവർത്തനങ്ങളിലോ കേന്ദ്രീകരിക്കുക
|
||||
- ഡാറ്റ മാനിപ്പുലേഷനായി pandas, ദൃശ്യീകരണത്തിന് matplotlib ഉപയോഗിക്കുക
|
||||
- സാധാരണ ഇംപോർട്ട് പാറ്റേൺ:
|
||||
```python
|
||||
import pandas as pd
|
||||
import numpy as np
|
||||
import matplotlib.pyplot as plt
|
||||
```
|
||||
|
||||
### ജാവാസ്ക്രിപ്റ്റ്/Vue.js
|
||||
- Vue.js 2 സ്റ്റൈൽ ഗൈഡ്, മികച്ച പ്രാക്ടീസുകൾ പാലിക്കുക
|
||||
- `quiz-app/package.json` ൽ ESLint കോൺഫിഗറേഷൻ
|
||||
- Vue സിംഗിൾ-ഫയൽ കോംപോണന്റുകൾ (.vue ഫയലുകൾ) ഉപയോഗിക്കുക
|
||||
- കോംപോണന്റ് അടിസ്ഥാന ആർക്കിടെക്ചർ നിലനിർത്തുക
|
||||
- മാറ്റങ്ങൾ കമ്മിറ്റ് ചെയ്യുന്നതിന് മുമ്പ് `npm run lint` ഓടിക്കുക
|
||||
|
||||
### മാർക്ക്ഡൗൺ ഡോക്യുമെന്റേഷൻ
|
||||
- വ്യക്തമായ തലക്കെട്ടുകളുടെ ക്രമം (# ## ### മുതലായവ) ഉപയോഗിക്കുക
|
||||
- ഭാഷാ നിർദ്ദേശകങ്ങളോടുകൂടിയ കോഡ് ബ്ലോക്കുകൾ ഉൾപ്പെടുത്തുക
|
||||
- ചിത്രങ്ങൾക്ക് alt ടെക്സ്റ്റ് ചേർക്കുക
|
||||
- ബന്ധപ്പെട്ട പാഠങ്ങൾക്കും വിഭവങ്ങൾക്കും ലിങ്കുകൾ നൽകുക
|
||||
- വായനാസൗകര്യത്തിന് ലൈൻ നീളം യുക്തമായിരിക്കണം
|
||||
|
||||
### ഫയൽ ഓർഗനൈസേഷൻ
|
||||
- പാഠം ഉള്ളടക്കം നമ്പർ ചെയ്ത ഫോൾഡറുകളിൽ (01-defining-data-science മുതലായവ)
|
||||
- പരിഹാരങ്ങൾ പ്രത്യേക `solution/` സബ്ഫോൾഡറുകളിൽ
|
||||
- ഭാഷാന്തരങ്ങൾ ഇംഗ്ലീഷ് ഘടനയുടെ മിറർ `translations/` ഫോൾഡറിൽ
|
||||
- ഡാറ്റാ ഫയലുകൾ `data/` അല്ലെങ്കിൽ പാഠം-നിർദ്ദിഷ്ട ഫോൾഡറുകളിൽ സൂക്ഷിക്കുക
|
||||
|
||||
## ബിൽഡ് ആൻഡ് ഡിപ്ലോയ്മെന്റ്
|
||||
|
||||
### ക്വിസ് അപ്ലിക്കേഷൻ ഡിപ്ലോയ്മെന്റ്
|
||||
```bash
|
||||
cd quiz-app
|
||||
|
||||
# പ്രൊഡക്ഷൻ പതിപ്പ് നിർമ്മിക്കുക
|
||||
npm run build
|
||||
|
||||
# ഔട്ട്പുട്ട് dist/ ഫോൾഡറിൽ ആണ്
|
||||
# dist/ ഫോൾഡർ സ്റ്റാറ്റിക് ഹോസ്റ്റിംഗിലേക്ക് ഡിപ്ലോയ് ചെയ്യുക (Azure Static Web Apps, Netlify, മുതലായവ)
|
||||
```
|
||||
|
||||
### Azure Static Web Apps ഡിപ്ലോയ്മെന്റ്
|
||||
quiz-app Azure Static Web Apps-ലേക്ക് ഡിപ്ലോയ് ചെയ്യാം:
|
||||
1. Azure Static Web App റിസോഴ്സ് സൃഷ്ടിക്കുക
|
||||
2. GitHub റിപോസിറ്ററിയുമായി കണക്ട് ചെയ്യുക
|
||||
3. ബിൽഡ് സെറ്റിംഗുകൾ ക്രമീകരിക്കുക:
|
||||
- ആപ്പ് ലൊക്കേഷൻ: `quiz-app`
|
||||
- ഔട്ട്പുട്ട് ലൊക്കേഷൻ: `dist`
|
||||
4. GitHub Actions workflow പുഷ് ചെയ്യുമ്പോൾ സ്വയം ഡിപ്ലോയ് ചെയ്യും
|
||||
|
||||
### ഡോക്യുമെന്റേഷൻ സൈറ്റ്
|
||||
```bash
|
||||
# ഡോക്സിഫൈയിൽ നിന്ന് PDF നിർമ്മിക്കുക (ഐച്ഛികം)
|
||||
npm run convert
|
||||
|
||||
# ഡോക്സിഫൈ ഡോക്യുമെന്റേഷൻ മാർക്ക്ഡൗൺ ഫയലുകളിൽ നിന്ന് നേരിട്ട് സേവനം ചെയ്യുന്നു
|
||||
# വിന്യസത്തിനായി ബിൽഡ് ഘട്ടം ആവശ്യമില്ല
|
||||
# ഡോക്സിഫൈ ഉപയോഗിച്ച് സ്റ്റാറ്റിക് ഹോസ്റ്റിംഗിലേക്ക് റിപോസിറ്ററി വിന്യസിക്കുക
|
||||
```
|
||||
|
||||
### GitHub Codespaces
|
||||
- റിപോസിറ്ററിയിൽ ഡെവ് കണ്ടെയ്നർ കോൺഫിഗറേഷൻ ഉൾപ്പെടുന്നു
|
||||
- Codespaces സ്വയം Python, Node.js പരിസ്ഥിതി സജ്ജമാക്കുന്നു
|
||||
- GitHub UI വഴി Codespace-ൽ റിപോസിറ്ററി തുറക്കുക
|
||||
- എല്ലാ ആശ്രിതങ്ങളും സ്വയം ഇൻസ്റ്റാൾ ചെയ്യും
|
||||
|
||||
## പുൾ റിക്വസ്റ്റ് മാർഗ്ഗനിർദ്ദേശങ്ങൾ
|
||||
|
||||
### സമർപ്പിക്കുന്നതിന് മുമ്പ്
|
||||
```bash
|
||||
# quiz-app ൽ Vue.js മാറ്റങ്ങൾക്കായി
|
||||
cd quiz-app
|
||||
npm run lint
|
||||
npm run build
|
||||
|
||||
# മാറ്റങ്ങൾ പ്രാദേശികമായി പരീക്ഷിക്കുക
|
||||
npm run serve
|
||||
```
|
||||
|
||||
### PR തലക്കെട്ട് ഫോർമാറ്റ്
|
||||
- വ്യക്തവും വിവരണാത്മകവുമായ തലക്കെട്ടുകൾ ഉപയോഗിക്കുക
|
||||
- ഫോർമാറ്റ്: `[Component] Breif description`
|
||||
- ഉദാഹരണങ്ങൾ:
|
||||
- `[Lesson 7] Python നോട്ട്ബുക്ക് ഇംപോർട്ട് പിശക് പരിഹരിക്കുക`
|
||||
- `[Quiz App] ജർമ്മൻ ഭാഷാന്തരം ചേർക്കുക`
|
||||
- `[Docs] README പുതിയ മുൻഅവശ്യങ്ങൾ ഉൾപ്പെടുത്തി അപ്ഡേറ്റ് ചെയ്യുക`
|
||||
|
||||
### ആവശ്യമായ പരിശോധനകൾ
|
||||
- എല്ലാ കോഡും പിശകുകൾ കൂടാതെ പ്രവർത്തിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക
|
||||
- നോട്ട്ബുക്കുകൾ പൂർണ്ണമായി എക്സിക്യൂട്ട് ചെയ്യുക
|
||||
- Vue.js അപ്ലിക്കേഷനുകൾ വിജയകരമായി ബിൽഡ് ചെയ്യുക
|
||||
- ഡോക്യുമെന്റേഷൻ ലിങ്കുകൾ പ്രവർത്തിക്കുന്നുണ്ടെന്ന് പരിശോധിക്കുക
|
||||
- ക്വിസ് അപ്ലിക്കേഷൻ മാറ്റിയെങ്കിൽ ടെസ്റ്റ് ചെയ്യുക
|
||||
- ഭാഷാന്തരങ്ങൾ ഘടനയിൽ സ്ഥിരത പാലിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക
|
||||
|
||||
### സംഭാവന മാർഗ്ഗനിർദ്ദേശങ്ങൾ
|
||||
- നിലവിലുള്ള കോഡ് സ്റ്റൈൽ, പാറ്റേണുകൾ പാലിക്കുക
|
||||
- സങ്കീർണ്ണമായ ലജിക് വിശദീകരിക്കുന്ന കമന്റുകൾ ചേർക്കുക
|
||||
- ബന്ധപ്പെട്ട ഡോക്യുമെന്റേഷൻ അപ്ഡേറ്റ് ചെയ്യുക
|
||||
- ആവശ്യമായ പക്ഷം വ്യത്യസ്ത പാഠ മോഡ്യൂളുകളിൽ മാറ്റങ്ങൾ പരീക്ഷിക്കുക
|
||||
- CONTRIBUTING.md ഫയൽ പരിശോധിക്കുക
|
||||
|
||||
## അധിക കുറിപ്പുകൾ
|
||||
|
||||
### സാധാരണ ഉപയോഗിക്കുന്ന ലൈബ്രറികൾ
|
||||
- **pandas**: ഡാറ്റ മാനിപ്പുലേഷൻ, വിശകലനം
|
||||
- **numpy**: സംഖ്യാത്മക കംപ്യൂട്ടിംഗ്
|
||||
- **matplotlib**: ഡാറ്റാ ദൃശ്യീകരണം, പ്ലോട്ടിംഗ്
|
||||
- **seaborn**: സ്റ്റാറ്റിസ്റ്റിക്കൽ ഡാറ്റാ ദൃശ്യീകരണം (ചില പാഠങ്ങൾ)
|
||||
- **scikit-learn**: മെഷീൻ ലേണിംഗ് (ഉന്നത പാഠങ്ങൾ)
|
||||
|
||||
### ഡാറ്റാ ഫയലുകളുമായി പ്രവർത്തിക്കൽ
|
||||
- ഡാറ്റാ ഫയലുകൾ `data/` ഫോൾഡറിലോ പാഠം-നിർദ്ദിഷ്ട ഡയറക്ടറികളിലോ
|
||||
- മിക്ക നോട്ട്ബുക്കുകളും സാപേക്ഷ പാതകളിൽ ഡാറ്റാ ഫയലുകൾ പ്രതീക്ഷിക്കുന്നു
|
||||
- CSV ഫയലുകൾ പ്രധാന ഡാറ്റാ ഫോർമാറ്റ്
|
||||
- ചില പാഠങ്ങൾ JSON ഉപയോഗിക്കുന്നു നോൺ-റിലേഷണൽ ഡാറ്റാ ഉദാഹരണങ്ങൾക്ക്
|
||||
|
||||
### ബഹുഭാഷാ പിന്തുണ
|
||||
- 40+ ഭാഷാന്തരങ്ങൾ GitHub Actions വഴി സ്വയംഭാഷാന്തരം
|
||||
- ഭാഷാന്തരം വർക്ക്ഫ്ലോ `.github/workflows/co-op-translator.yml`
|
||||
- ഭാഷാന്തരങ്ങൾ `translations/` ഫോൾഡറിൽ ഭാഷാ കോഡുകളോടെ
|
||||
- ക്വിസ് ഭാഷാന്തരങ്ങൾ `quiz-app/src/assets/translations/` ൽ
|
||||
|
||||
### ഡെവലപ്പ്മെന്റ് പരിസ്ഥിതി ഓപ്ഷനുകൾ
|
||||
1. **ലോകൽ ഡെവലപ്പ്മെന്റ്**: Python, Jupyter, Node.js ലോക്കലായി ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
2. **GitHub Codespaces**: ക്ലൗഡ് അടിസ്ഥാന ഡെവലപ്പ്മെന്റ് പരിസ്ഥിതി
|
||||
3. **VS Code ഡെവ് കണ്ടെയ്നറുകൾ**: ലോക്കൽ കണ്ടെയ്നർ അടിസ്ഥാന ഡെവലപ്പ്മെന്റ്
|
||||
4. **Binder**: ക്ലൗഡിൽ നോട്ട്ബുക്കുകൾ ആരംഭിക്കുക (കൺഫിഗർ ചെയ്താൽ)
|
||||
|
||||
### പാഠം ഉള്ളടക്കം മാർഗ്ഗനിർദ്ദേശങ്ങൾ
|
||||
- ഓരോ പാഠവും സ്വതന്ത്രമാണ്, മുൻ ആശയങ്ങളിൽ അടിസ്ഥാനമാക്കിയുള്ളത്
|
||||
- പാഠത്തിന് മുൻപ് ക്വിസുകൾ മുൻ അറിവ് പരിശോധിക്കുന്നു
|
||||
- പാഠത്തിന് ശേഷം ക്വിസുകൾ പഠനം ശക്തിപ്പെടുത്തുന്നു
|
||||
- അസൈൻമെന്റുകൾ ഹാൻഡ്സ്-ഓൺ അഭ്യാസം നൽകുന്നു
|
||||
- സ്കെച്ച്നോട്ടുകൾ ദൃശ്യ സംഗ്രഹങ്ങൾ നൽകുന്നു
|
||||
|
||||
### സാധാരണ പ്രശ്നങ്ങൾ പരിഹരിക്കൽ
|
||||
|
||||
**Jupyter Kernel പ്രശ്നങ്ങൾ:**
|
||||
```bash
|
||||
# ശരിയായ കർണൽ ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക
|
||||
python -m ipykernel install --user --name=datascience
|
||||
```
|
||||
|
||||
**npm ഇൻസ്റ്റാൾ പരാജയങ്ങൾ:**
|
||||
```bash
|
||||
# npm കാഷെ ക്ലിയർ ചെയ്ത് വീണ്ടും ശ്രമിക്കുക
|
||||
npm cache clean --force
|
||||
rm -rf node_modules package-lock.json
|
||||
npm install
|
||||
```
|
||||
|
||||
**നോട്ട്ബുക്കുകളിൽ ഇംപോർട്ട് പിശകുകൾ:**
|
||||
- ആവശ്യമായ എല്ലാ ലൈബ്രറികളും ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക
|
||||
- Python പതിപ്പ് അനുയോജ്യമാണ് എന്ന് പരിശോധിക്കുക (Python 3.7+ ശുപാർശ)
|
||||
- വെർച്വൽ എൻവയോൺമെന്റ് സജീവമാക്കിയിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക
|
||||
|
||||
**Docsify ലോഡ് ചെയ്യാത്തത്:**
|
||||
- റിപോസിറ്ററി റൂട്ടിൽ നിന്ന് സർവ് ചെയ്യുന്നതാണെന്ന് ഉറപ്പാക്കുക
|
||||
- `index.html` നിലവിലുണ്ടെന്ന് പരിശോധിക്കുക
|
||||
- ശരിയായ നെറ്റ്വർക്ക് ആക്സസ് (പോർട്ട് 3000) ഉറപ്പാക്കുക
|
||||
|
||||
### പ്രകടന പരിഗണനകൾ
|
||||
- വലിയ ഡാറ്റാസെറ്റുകൾ നോട്ട്ബുക്കുകളിൽ ലോഡ് ചെയ്യാൻ സമയം എടുക്കാം
|
||||
- സങ്കീർണ്ണമായ പ്ലോട്ടുകൾക്ക് ദൃശ്യീകരണം മന്ദഗതിയിലാകാം
|
||||
- Vue.js ഡെവ് സർവർ ഹോട്ട്-റീലോഡ് സജ്ജമാക്കുന്നു വേഗത്തിലുള്ള ഇറ്ററേഷനുകൾക്കായി
|
||||
- പ്രൊഡക്ഷൻ ബിൽഡുകൾ ഒപ്റ്റിമൈസ്ഡ്, മിനിഫൈഡ്
|
||||
|
||||
### സുരക്ഷാ കുറിപ്പുകൾ
|
||||
- സენსിറ്റീവ് ഡാറ്റ അല്ലെങ്കിൽ ക്രെഡൻഷ്യലുകൾ കമ്മിറ്റ് ചെയ്യരുത്
|
||||
- ക്ലൗഡ് പാഠങ്ങളിൽ API കീകൾക്ക് എൻവയോൺമെന്റ് വേരിയബിളുകൾ ഉപയോഗിക്കുക
|
||||
- അസ്യൂർ-ബന്ധപ്പെട്ട പാഠങ്ങൾക്ക് അസ്യൂർ അക്കൗണ്ട് ക്രെഡൻഷ്യലുകൾ ആവശ്യമാകാം
|
||||
- സുരക്ഷാ പാച്ചുകൾക്കായി ആശ്രിതങ്ങൾ അപ്ഡേറ്റ് ചെയ്യുക
|
||||
|
||||
## ഭാഷാന്തരങ്ങളിൽ സംഭാവന
|
||||
|
||||
- GitHub Actions വഴി സ്വയംഭാഷാന്തരം നിയന്ത്രിക്കുന്നു
|
||||
- ഭാഷാന്തര കൃത്യതയ്ക്കായി മാനുവൽ തിരുത്തലുകൾ സ്വാഗതം
|
||||
- നിലവിലുള്ള ഭാഷാന്തര ഫോൾഡർ ഘടന പാലിക്കുക
|
||||
- ക്വിസ് ലിങ്കുകളിൽ ഭാഷാ പാരാമീറ്റർ ചേർക്കുക: `?loc=fr`
|
||||
- ഭാഷാന്തര പാഠങ്ങൾ ശരിയായി പ്രദർശിപ്പിക്കുന്നുണ്ടെന്ന് ടെസ്റ്റ് ചെയ്യുക
|
||||
|
||||
## ബന്ധപ്പെട്ട വിഭവങ്ങൾ
|
||||
- പ്രധാന കോഴ്സ്: https://aka.ms/datascience-beginners
|
||||
- Microsoft Learn: https://docs.microsoft.com/learn/
|
||||
- Student Hub: https://docs.microsoft.com/learn/student-hub
|
||||
- ചർച്ച ഫോറം: https://github.com/microsoft/Data-Science-For-Beginners/discussions
|
||||
- മറ്റ് Microsoft കോഴ്സുകൾ: ML for Beginners, AI for Beginners, Web Dev for Beginners
|
||||
|
||||
## പ്രോജക്ട് പരിപാലനം
|
||||
- ഉള്ളടക്കം പുതുക്കാൻ സ്ഥിരം അപ്ഡേറ്റുകൾ
|
||||
- കമ്മ്യൂണിറ്റി സംഭാവനകൾ സ്വാഗതം
|
||||
- പ്രശ്നങ്ങൾ GitHub-ൽ ട്രാക്ക് ചെയ്യുന്നു
|
||||
- PR-കൾ കോഴ്സ് പരിപാലകർ പരിശോധിക്കുന്നു
|
||||
- മാസാന്തം ഉള്ളടക്കം അവലോകനവും അപ്ഡേറ്റും
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,25 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "c06b12caf3c901eb3156e3dd5b0aea56",
|
||||
"translation_date": "2025-12-19T13:09:06+00:00",
|
||||
"source_file": "CODE_OF_CONDUCT.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# Microsoft ഓപ്പൺ സോഴ്സ് കോഡ് ഓഫ് കണ്ടക്റ്റ്
|
||||
|
||||
ഈ പ്രോജക്ട് [Microsoft Open Source Code of Conduct](https://opensource.microsoft.com/codeofconduct/) സ്വീകരിച്ചിട്ടുണ്ട്.
|
||||
|
||||
Resources:
|
||||
|
||||
- [Microsoft Open Source Code of Conduct](https://opensource.microsoft.com/codeofconduct/)
|
||||
- [Microsoft Code of Conduct FAQ](https://opensource.microsoft.com/codeofconduct/faq/)
|
||||
- ചോദ്യങ്ങൾക്കോ ആശങ്കകൾക്കോ [opencode@microsoft.com](mailto:opencode@microsoft.com) എന്ന വിലാസത്തിൽ ബന്ധപ്പെടുക
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,263 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a64d8afa22ffcc2016bb239188d6acb1",
|
||||
"translation_date": "2025-12-19T13:11:42+00:00",
|
||||
"source_file": "INSTALLATION.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഇൻസ്റ്റലേഷൻ ഗൈഡ്
|
||||
|
||||
ഈ ഗൈഡ് ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ് പാഠ്യപദ്ധതിയുമായി പ്രവർത്തിക്കാൻ നിങ്ങളുടെ പരിസ്ഥിതി സജ്ജമാക്കുന്നതിൽ സഹായിക്കും.
|
||||
|
||||
## ഉള്ളടക്ക പട്ടിക
|
||||
|
||||
- [ആവശ്യമായ മുൻകൂട്ടി അറിവുകൾ](../..)
|
||||
- [വേഗത്തിലുള്ള ആരംഭ ഓപ്ഷനുകൾ](../..)
|
||||
- [ലോകൽ ഇൻസ്റ്റലേഷൻ](../..)
|
||||
- [നിങ്ങളുടെ ഇൻസ്റ്റലേഷൻ പരിശോധിക്കുക](../..)
|
||||
|
||||
## ആവശ്യമായ മുൻകൂട്ടി അറിവുകൾ
|
||||
|
||||
തുടങ്ങുന്നതിന് മുമ്പ്, നിങ്ങൾക്കുണ്ടാകേണ്ടത്:
|
||||
|
||||
- കമാൻഡ് ലൈൻ/ടെർമിനലുമായി അടിസ്ഥാന പരിചയം
|
||||
- ഒരു GitHub അക്കൗണ്ട് (ഉചിതം)
|
||||
- പ്രാഥമിക സജ്ജീകരണത്തിനായി സ്ഥിരമായ ഇന്റർനെറ്റ് കണക്ഷൻ
|
||||
|
||||
## വേഗത്തിലുള്ള ആരംഭ ഓപ്ഷനുകൾ
|
||||
|
||||
### ഓപ്ഷൻ 1: GitHub Codespaces (ബിഗിനേഴ്സിന് ശുപാർശ ചെയ്യുന്നു)
|
||||
|
||||
ആരാധ്യമായ രീതിയിൽ തുടങ്ങാനുള്ള ഏറ്റവും എളുപ്പവഴി GitHub Codespaces ആണ്, ഇത് നിങ്ങളുടെ ബ്രൗസറിൽ പൂർണ്ണമായ ഡെവലപ്പ്മെന്റ് പരിസ്ഥിതി നൽകുന്നു.
|
||||
|
||||
1. [റിപ്പോസിറ്ററി](https://github.com/microsoft/Data-Science-For-Beginners) സന്ദർശിക്കുക
|
||||
2. **Code** ഡ്രോപ്പ്ഡൗൺ മെനുവിൽ ക്ലിക്ക് ചെയ്യുക
|
||||
3. **Codespaces** ടാബ് തിരഞ്ഞെടുക്കുക
|
||||
4. **Create codespace on main** ക്ലിക്ക് ചെയ്യുക
|
||||
5. പരിസ്ഥിതി ആരംഭിക്കാൻ കാത്തിരിക്കുക (2-3 മിനിറ്റ്)
|
||||
|
||||
നിങ്ങളുടെ പരിസ്ഥിതി ഇപ്പോൾ എല്ലാ ആശ്രിതങ്ങളും മുൻകൂട്ടി ഇൻസ്റ്റാൾ ചെയ്ത നിലയിലാണ്!
|
||||
|
||||
### ഓപ്ഷൻ 2: ലോകൽ ഡെവലപ്പ്മെന്റ്
|
||||
|
||||
നിങ്ങളുടെ സ്വന്തം കമ്പ്യൂട്ടറിൽ പ്രവർത്തിക്കാൻ, താഴെ നൽകിയ വിശദമായ നിർദ്ദേശങ്ങൾ പിന്തുടരുക.
|
||||
|
||||
## ലോകൽ ഇൻസ്റ്റലേഷൻ
|
||||
|
||||
### ഘട്ടം 1: Git ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
|
||||
Git റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യാനും നിങ്ങളുടെ മാറ്റങ്ങൾ ട്രാക്ക് ചെയ്യാനും ആവശ്യമാണ്.
|
||||
|
||||
**Windows:**
|
||||
- [git-scm.com](https://git-scm.com/download/win) ൽ നിന്ന് ഡൗൺലോഡ് ചെയ്യുക
|
||||
- ഡിഫോൾട്ട് സെറ്റിംഗുകളോടെ ഇൻസ്റ്റാളർ റൺ ചെയ്യുക
|
||||
|
||||
**macOS:**
|
||||
- Homebrew വഴി ഇൻസ്റ്റാൾ ചെയ്യുക: `brew install git`
|
||||
- അല്ലെങ്കിൽ [git-scm.com](https://git-scm.com/download/mac) ൽ നിന്ന് ഡൗൺലോഡ് ചെയ്യുക
|
||||
|
||||
**Linux:**
|
||||
```bash
|
||||
# ഡെബിയൻ/ഉബുണ്ടു
|
||||
sudo apt-get update
|
||||
sudo apt-get install git
|
||||
|
||||
# ഫെഡോറ
|
||||
sudo dnf install git
|
||||
|
||||
# ആർച്ച്
|
||||
sudo pacman -S git
|
||||
```
|
||||
|
||||
### ഘട്ടം 2: റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യുക
|
||||
|
||||
```bash
|
||||
# റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യുക
|
||||
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
|
||||
|
||||
# ഡയറക്ടറിയിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക
|
||||
cd Data-Science-For-Beginners
|
||||
```
|
||||
|
||||
### ഘട്ടം 3: Python, Jupyter ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
|
||||
ഡാറ്റാ സയൻസ് പാഠങ്ങൾക്കായി Python 3.7 അല്ലെങ്കിൽ അതിനുമുകളിൽ വേണം.
|
||||
|
||||
**Windows:**
|
||||
1. [python.org](https://www.python.org/downloads/) ൽ നിന്ന് Python ഡൗൺലോഡ് ചെയ്യുക
|
||||
2. ഇൻസ്റ്റലേഷനിൽ "Add Python to PATH" തിരഞ്ഞെടുക്കുക
|
||||
3. ഇൻസ്റ്റലേഷൻ സ്ഥിരീകരിക്കുക:
|
||||
```bash
|
||||
python --version
|
||||
```
|
||||
|
||||
**macOS:**
|
||||
```bash
|
||||
# ഹോംബ്രൂ ഉപയോഗിക്കുന്നു
|
||||
brew install python3
|
||||
|
||||
# ഇൻസ്റ്റലേഷൻ സ്ഥിരീകരിക്കുക
|
||||
python3 --version
|
||||
```
|
||||
|
||||
**Linux:**
|
||||
```bash
|
||||
# മിക്ക ലിനക്സ് വിതരണങ്ങളിലും പൈതൺ മുൻകൂട്ടി ഇൻസ്റ്റാൾ ചെയ്തിരിക്കുന്നു
|
||||
python3 --version
|
||||
|
||||
# ഇൻസ്റ്റാൾ ചെയ്തിട്ടില്ലെങ്കിൽ:
|
||||
# ഡെബിയൻ/ഉബുണ്ടു
|
||||
sudo apt-get install python3 python3-pip
|
||||
|
||||
# ഫെഡോറാ
|
||||
sudo dnf install python3 python3-pip
|
||||
```
|
||||
|
||||
### ഘട്ടം 4: Python പരിസ്ഥിതി സജ്ജമാക്കുക
|
||||
|
||||
ആശ്രിതങ്ങൾ വേർതിരിച്ച് സൂക്ഷിക്കാൻ വിർച്വൽ എൻവയോൺമെന്റ് ഉപയോഗിക്കുന്നത് ശുപാർശ ചെയ്യുന്നു.
|
||||
|
||||
```bash
|
||||
# ഒരു വെർച്വൽ എൻവയോൺമെന്റ് സൃഷ്ടിക്കുക
|
||||
python -m venv venv
|
||||
|
||||
# വെർച്വൽ എൻവയോൺമെന്റ് സജീവമാക്കുക
|
||||
# വിൻഡോസ്-ൽ:
|
||||
venv\Scripts\activate
|
||||
|
||||
# മാക്ഒഎസ്/ലിനക്സ്-ൽ:
|
||||
source venv/bin/activate
|
||||
```
|
||||
|
||||
### ഘട്ടം 5: Python പാക്കേജുകൾ ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
|
||||
ആവശ്യമായ ഡാറ്റാ സയൻസ് ലൈബ്രറികൾ ഇൻസ്റ്റാൾ ചെയ്യുക:
|
||||
|
||||
```bash
|
||||
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
|
||||
```
|
||||
|
||||
### ഘട്ടം 6: Node.js, npm ഇൻസ്റ്റാൾ ചെയ്യുക (ക്വിസ് ആപ്പിനായി)
|
||||
|
||||
ക്വിസ് ആപ്പിന് Node.js, npm ആവശ്യമാണ്.
|
||||
|
||||
**Windows/macOS:**
|
||||
- [nodejs.org](https://nodejs.org/) (LTS പതിപ്പ് ശുപാർശ ചെയ്യുന്നു) ൽ നിന്ന് ഡൗൺലോഡ് ചെയ്യുക
|
||||
- ഇൻസ്റ്റാളർ റൺ ചെയ്യുക
|
||||
|
||||
**Linux:**
|
||||
```bash
|
||||
# ഡെബിയൻ/ഉബുണ്ടു
|
||||
# മുന്നറിയിപ്പ്: ഇന്റർനെറ്റിൽ നിന്നുള്ള സ്ക്രിപ്റ്റുകൾ നേരിട്ട് ബാഷിലേക്ക് പൈപ്പ് ചെയ്യുന്നത് സുരക്ഷാ അപകടം ഉണ്ടാക്കാം.
|
||||
# സ്ക്രിപ്റ്റ് പ്രവർത്തിപ്പിക്കുന്നതിന് മുമ്പ് അവലോകനം ചെയ്യാൻ ശുപാർശ ചെയ്യുന്നു:
|
||||
# curl -fsSL https://deb.nodesource.com/setup_lts.x -o setup_lts.x
|
||||
# less setup_lts.x
|
||||
# പിന്നീട് പ്രവർത്തിപ്പിക്കുക:
|
||||
# sudo -E bash setup_lts.x
|
||||
#
|
||||
# അല്ലെങ്കിൽ, താഴെ കൊടുത്തിരിക്കുന്ന ഒറ്റ വരി കോഡ് നിങ്ങളുടെ സ്വന്തം അപകടത്തിൽ ഉപയോഗിക്കാം:
|
||||
curl -fsSL https://deb.nodesource.com/setup_lts.x | sudo -E bash -
|
||||
sudo apt-get install -y nodejs
|
||||
|
||||
# ഫെഡോറ
|
||||
sudo dnf install nodejs
|
||||
|
||||
# ഇൻസ്റ്റലേഷൻ സ്ഥിരീകരിക്കുക
|
||||
node --version
|
||||
npm --version
|
||||
```
|
||||
|
||||
### ഘട്ടം 7: ക്വിസ് ആപ്പ് ആശ്രിതങ്ങൾ ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
|
||||
```bash
|
||||
# ക്വിസ് ആപ്പ് ഡയറക്ടറിയിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക
|
||||
cd quiz-app
|
||||
|
||||
# ആശ്രിതങ്ങൾ ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
npm install
|
||||
|
||||
# റൂട്ട് ഡയറക്ടറിയിലേക്ക് മടങ്ങുക
|
||||
cd ..
|
||||
```
|
||||
|
||||
### ഘട്ടം 8: Docsify ഇൻസ്റ്റാൾ ചെയ്യുക (ഐച്ഛികം)
|
||||
|
||||
ഓഫ്ലൈൻ ഡോക്യുമെന്റേഷൻ ആക്സസ് ചെയ്യാൻ:
|
||||
|
||||
```bash
|
||||
npm install -g docsify-cli
|
||||
```
|
||||
|
||||
## നിങ്ങളുടെ ഇൻസ്റ്റലേഷൻ പരിശോധിക്കുക
|
||||
|
||||
### Python, Jupyter ടെസ്റ്റ് ചെയ്യുക
|
||||
|
||||
```bash
|
||||
# നിങ്ങളുടെ വെർച്വൽ എൻവയോൺമെന്റ് ഇതിനകം സജീവമല്ലെങ്കിൽ സജീവമാക്കുക
|
||||
# വിൻഡോസ്-ൽ:
|
||||
venv\Scripts\activate
|
||||
# മാക്ഓഎസ്/ലിനക്സ്-ൽ:
|
||||
source venv/bin/activate
|
||||
|
||||
# ജൂപ്പിറ്റർ നോട്ട്ബുക്ക് ആരംഭിക്കുക
|
||||
jupyter notebook
|
||||
```
|
||||
|
||||
നിങ്ങളുടെ ബ്രൗസർ Jupyter ഇന്റർഫേസ് തുറക്കും. നിങ്ങൾക്ക് ഇപ്പോൾ ഏതെങ്കിലും പാഠത്തിന്റെ `.ipynb` ഫയലിലേക്ക് പോകാം.
|
||||
|
||||
### ക്വിസ് ആപ്പ് ടെസ്റ്റ് ചെയ്യുക
|
||||
|
||||
```bash
|
||||
# ക്വിസ് ആപ്പിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക
|
||||
cd quiz-app
|
||||
|
||||
# ഡെവലപ്പ്മെന്റ് സെർവർ ആരംഭിക്കുക
|
||||
npm run serve
|
||||
```
|
||||
|
||||
ക്വിസ് ആപ്പ് `http://localhost:8080` (അല്ലെങ്കിൽ 8080 തിരക്കുള്ള പക്ഷം മറ്റൊരു പോർട്ട്) ൽ ലഭ്യമായിരിക്കണം.
|
||||
|
||||
### ഡോക്യുമെന്റേഷൻ സർവർ ടെസ്റ്റ് ചെയ്യുക
|
||||
|
||||
```bash
|
||||
# റിപ്പോസിറ്ററിയുടെ റൂട്ട് ഡയറക്ടറിയിൽ നിന്ന്
|
||||
docsify serve
|
||||
```
|
||||
|
||||
ഡോക്യുമെന്റേഷൻ `http://localhost:3000` ൽ ലഭ്യമായിരിക്കണം.
|
||||
|
||||
## VS Code Dev Containers ഉപയോഗിക്കൽ
|
||||
|
||||
Docker ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെങ്കിൽ, VS Code Dev Containers ഉപയോഗിക്കാം:
|
||||
|
||||
1. [Docker Desktop](https://www.docker.com/products/docker-desktop) ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
2. [Visual Studio Code](https://code.visualstudio.com/) ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
3. [Remote - Containers extension](https://marketplace.visualstudio.com/items?itemName=ms-vscode-remote.remote-containers) ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
4. റിപ്പോസിറ്ററി VS Code ൽ തുറക്കുക
|
||||
5. `F1` അമർത്തി "Remote-Containers: Reopen in Container" തിരഞ്ഞെടുക്കുക
|
||||
6. കണ്ടെയ്നർ നിർമ്മിക്കാൻ കാത്തിരിക്കുക (ആദ്യ തവണ മാത്രം)
|
||||
|
||||
## അടുത്ത ഘട്ടങ്ങൾ
|
||||
|
||||
- പാഠ്യപദ്ധതിയുടെ അവലോകനത്തിന് [README.md](README.md) പരിശോധിക്കുക
|
||||
- സാധാരണ പ്രവൃത്തികൾക്കും ഉദാഹരണങ്ങൾക്കും [USAGE.md](USAGE.md) വായിക്കുക
|
||||
- പ്രശ്നങ്ങൾ നേരിടുമ്പോൾ [TROUBLESHOOTING.md](TROUBLESHOOTING.md) പരിശോധിക്കുക
|
||||
- സംഭാവനകൾ നൽകാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ [CONTRIBUTING.md](CONTRIBUTING.md) വായിക്കുക
|
||||
|
||||
## സഹായം നേടുക
|
||||
|
||||
പ്രശ്നങ്ങൾ നേരിടുമ്പോൾ:
|
||||
|
||||
1. [TROUBLESHOOTING.md](TROUBLESHOOTING.md) ഗൈഡ് പരിശോധിക്കുക
|
||||
2. നിലവിലുള്ള [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) തിരയുക
|
||||
3. ഞങ്ങളുടെ [Discord community](https://aka.ms/ds4beginners/discord) ൽ ചേരുക
|
||||
4. നിങ്ങളുടെ പ്രശ്നത്തെക്കുറിച്ച് വിശദമായ വിവരങ്ങളോടെ പുതിയ ഒരു ഇഷ്യൂ സൃഷ്ടിക്കുക
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,53 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "0d575483100c332b2dbaefef915bb3c4",
|
||||
"translation_date": "2025-12-19T13:13:57+00:00",
|
||||
"source_file": "SECURITY.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
## Security
|
||||
|
||||
Microsoft നമ്മുടെ സോഫ്റ്റ്വെയർ ഉൽപ്പന്നങ്ങളും സേവനങ്ങളും സുരക്ഷിതമാക്കുന്നതിൽ ഗൗരവമുണ്ട്, ഇതിൽ നമ്മുടെ GitHub സംഘടനകൾ വഴി നിയന്ത്രിക്കുന്ന എല്ലാ സോഴ്സ് കോഡ് റിപോസിറ്ററികളും ഉൾപ്പെടുന്നു, അവയിൽ [Microsoft](https://github.com/Microsoft), [Azure](https://github.com/Azure), [DotNet](https://github.com/dotnet), [AspNet](https://github.com/aspnet), [Xamarin](https://github.com/xamarin), കൂടാതെ [നമ്മുടെ GitHub സംഘടനകൾ](https://opensource.microsoft.com/) ഉൾപ്പെടുന്നു.
|
||||
|
||||
നിങ്ങൾക്ക് Microsoft-ന്റെ ഉടമസ്ഥതയിലുള്ള ഏതെങ്കിലും റിപോസിറ്ററിയിൽ [Microsoft-ന്റെ സുരക്ഷാ ദുർബലതയുടെ നിർവചനത്തിന്](https://docs.microsoft.com/en-us/previous-versions/tn-archive/cc751383(v=technet.10)) അനുയോജ്യമായ ഒരു സുരക്ഷാ ദുർബലത കണ്ടെത്തിയതായി തോന്നുന്നുവെങ്കിൽ, താഴെ വിവരിച്ചിരിക്കുന്നതുപോലെ അത് ഞങ്ങളോട് റിപ്പോർട്ട് ചെയ്യുക.
|
||||
|
||||
## Reporting Security Issues
|
||||
|
||||
**സുരക്ഷാ ദുർബലതകൾ പൊതു GitHub ഇഷ്യൂസിലൂടെ റിപ്പോർട്ട് ചെയ്യരുത്.**
|
||||
|
||||
പകരം, ദയവായി അവ Microsoft Security Response Center (MSRC) ൽ [https://msrc.microsoft.com/create-report](https://msrc.microsoft.com/create-report) എന്ന വിലാസത്തിൽ റിപ്പോർട്ട് ചെയ്യുക.
|
||||
|
||||
ലോഗിൻ ചെയ്യാതെ സമർപ്പിക്കാൻ നിങ്ങൾക്ക് ഇഷ്ടമെങ്കിൽ, [secure@microsoft.com](mailto:secure@microsoft.com) എന്ന ഇമെയിലിലേക്ക് അയയ്ക്കുക. സാധ്യമായെങ്കിൽ, ഞങ്ങളുടെ PGP കീ ഉപയോഗിച്ച് നിങ്ങളുടെ സന്ദേശം എൻക്രിപ്റ്റ് ചെയ്യുക; അത് [Microsoft Security Response Center PGP Key പേജ്](https://www.microsoft.com/en-us/msrc/pgp-key-msrc) ൽ നിന്ന് ഡൗൺലോഡ് ചെയ്യുക.
|
||||
|
||||
നിങ്ങൾക്ക് 24 മണിക്കൂറിനുള്ളിൽ ഒരു പ്രതികരണം ലഭിക്കണം. എന്തെങ്കിലും കാരണത്താൽ ലഭിക്കാത്ത പക്ഷം, ഞങ്ങൾ നിങ്ങളുടെ പ്രാഥമിക സന്ദേശം സ്വീകരിച്ചിട്ടുണ്ടെന്ന് ഉറപ്പാക്കാൻ ഇമെയിൽ വഴി ഫോളോ അപ്പ് ചെയ്യുക. കൂടുതൽ വിവരങ്ങൾ [microsoft.com/msrc](https://www.microsoft.com/msrc) ൽ ലഭ്യമാണ്.
|
||||
|
||||
ദയവായി താഴെപ്പറയുന്ന ആവശ്യമായ വിവരങ്ങൾ (നിങ്ങൾക്ക് നൽകാൻ കഴിയുന്നത്ര) ഉൾപ്പെടുത്തുക, ഇത് പ്രശ്നത്തിന്റെ സ്വഭാവവും പരിധിയും നമുക്ക് മെച്ചമായി മനസ്സിലാക്കാൻ സഹായിക്കും:
|
||||
|
||||
* പ്രശ്നത്തിന്റെ തരം (ഉദാ: ബഫർ ഓവർഫ്ലോ, SQL ഇൻജക്ഷൻ, ക്രോസ്-സൈറ്റ് സ്ക്രിപ്റ്റിംഗ്, തുടങ്ങിയവ)
|
||||
* പ്രശ്നം പ്രകടമാകുന്ന സോഴ്സ് ഫയലുകളുടെ പൂർണ്ണ പാതകൾ
|
||||
* ബാധിച്ച സോഴ്സ് കോഡിന്റെ സ്ഥാനം (ടാഗ്/ബ്രാഞ്ച്/കമ്മിറ്റ് അല്ലെങ്കിൽ നേരിട്ട് URL)
|
||||
* പ്രശ്നം പുനരാവർത്തിപ്പിക്കാൻ ആവശ്യമായ പ്രത്യേക കോൺഫിഗറേഷൻ
|
||||
* പ്രശ്നം പുനരാവർത്തിപ്പിക്കാൻ ഘട്ടം-ഘട്ടമായ നിർദ്ദേശങ്ങൾ
|
||||
* പ്രൂഫ്-ഓഫ്-കോൺസെപ്റ്റ് അല്ലെങ്കിൽ എക്സ്പ്ലോയിറ്റ് കോഡ് (സാധ്യമായെങ്കിൽ)
|
||||
* പ്രശ്നത്തിന്റെ പ്രഭാവം, അതിൽ ഒരു ആക്രമണകാരൻ എങ്ങനെ പ്രശ്നം ഉപയോഗപ്പെടുത്താമെന്ന് ഉൾപ്പെടെ
|
||||
|
||||
ഈ വിവരങ്ങൾ നിങ്ങളുടെ റിപ്പോർട്ട് വേഗത്തിൽ പരിശോധിക്കാൻ സഹായിക്കും.
|
||||
|
||||
നിങ്ങൾ ബഗ് ബൗണ്ടിക്ക് റിപ്പോർട്ട് ചെയ്യുകയാണെങ്കിൽ, കൂടുതൽ സമഗ്രമായ റിപ്പോർട്ടുകൾ ഉയർന്ന ബൗണ്ടി അവാർഡിന് സഹായകമാകും. ഞങ്ങളുടെ [Microsoft Bug Bounty Program](https://microsoft.com/msrc/bounty) പേജ് സന്ദർശിച്ച് സജീവ പ്രോഗ്രാമുകൾക്കുറിച്ച് കൂടുതൽ വിവരങ്ങൾ അറിയുക.
|
||||
|
||||
## Preferred Languages
|
||||
|
||||
എല്ലാ ആശയവിനിമയവും ഇംഗ്ലീഷിൽ ആയിരിക്കണമെന്ന് ഞങ്ങൾ അഭിലഷിക്കുന്നു.
|
||||
|
||||
## Policy
|
||||
|
||||
Microsoft [Coordinated Vulnerability Disclosure](https://www.microsoft.com/en-us/msrc/cvd) എന്ന സിദ്ധാന്തം പിന്തുടരുന്നു.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,26 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "872be8bc1b93ef1dd9ac3d6e8f99f6ab",
|
||||
"translation_date": "2025-12-19T12:48:32+00:00",
|
||||
"source_file": "SUPPORT.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# പിന്തുണ
|
||||
## പ്രശ്നങ്ങൾ ഫയൽ ചെയ്യാനും സഹായം ലഭിക്കാനും
|
||||
|
||||
ഈ പ്രോജക്ട് ബഗുകളും ഫീച്ചർ അഭ്യർത്ഥനകളും ട്രാക്ക് ചെയ്യാൻ GitHub Issues ഉപയോഗിക്കുന്നു. പുനരാവൃതികൾ ഒഴിവാക്കാൻ പുതിയ പ്രശ്നങ്ങൾ ഫയൽ ചെയ്യുന്നതിന് മുമ്പ് നിലവിലുള്ള പ്രശ്നങ്ങൾ തിരയുക. പുതിയ പ്രശ്നങ്ങൾക്കായി, നിങ്ങളുടെ ബഗ് അല്ലെങ്കിൽ ഫീച്ചർ അഭ്യർത്ഥന പുതിയ ഒരു പ്രശ്നമായി ഫയൽ ചെയ്യുക.
|
||||
|
||||
ഈ പ്രോജക്ട് ഉപയോഗിക്കുന്നതിനെക്കുറിച്ചുള്ള സഹായത്തിനും ചോദ്യങ്ങൾക്കും, ഒരു പ്രശ്നം ഫയൽ ചെയ്യുക.
|
||||
|
||||
## Microsoft പിന്തുണ നയം
|
||||
|
||||
ഈ റിപ്പോസിറ്ററിയുടെ പിന്തുണ മുകളിൽ പട്ടികപ്പെടുത്തിയ വിഭവങ്ങളിലേക്കാണ് പരിമിതമായിരിക്കുന്നത്.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,629 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "93a6a8a8a209128cbfedcbc076ee21b0",
|
||||
"translation_date": "2025-12-19T12:55:49+00:00",
|
||||
"source_file": "TROUBLESHOOTING.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# പ്രശ്നപരിഹാര ഗൈഡ്
|
||||
|
||||
ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ് പാഠ്യപദ്ധതിയുമായി പ്രവർത്തിക്കുമ്പോൾ നിങ്ങൾക്ക് നേരിടാവുന്ന സാധാരണ പ്രശ്നങ്ങൾക്ക് ഈ ഗൈഡ് പരിഹാരങ്ങൾ നൽകുന്നു.
|
||||
|
||||
## ഉള്ളടക്ക പട്ടിക
|
||||
|
||||
- [Python and Jupyter Issues](../..)
|
||||
- [Package and Dependency Issues](../..)
|
||||
- [Jupyter Notebook Issues](../..)
|
||||
- [Quiz Application Issues](../..)
|
||||
- [Git and GitHub Issues](../..)
|
||||
- [Docsify Documentation Issues](../..)
|
||||
- [Data and File Issues](../..)
|
||||
- [Performance Issues](../..)
|
||||
- [Getting Additional Help](../..)
|
||||
|
||||
## Python and Jupyter Issues
|
||||
|
||||
### Python കണ്ടെത്താനാകുന്നില്ല അല്ലെങ്കിൽ തെറ്റായ പതിപ്പ്
|
||||
|
||||
**പ്രശ്നം:** `python: command not found` അല്ലെങ്കിൽ തെറ്റായ Python പതിപ്പ്
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# പൈത്തൺ പതിപ്പ് പരിശോധിക്കുക
|
||||
python --version
|
||||
python3 --version
|
||||
|
||||
# പൈത്തൺ 3 'python3' എന്ന പേരിൽ ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെങ്കിൽ, ഒരു അലിയാസ് സൃഷ്ടിക്കുക
|
||||
# macOS/Linux-ൽ, ~/.bashrc അല്ലെങ്കിൽ ~/.zshrc-ലേക്ക് ചേർക്കുക:
|
||||
alias python=python3
|
||||
alias pip=pip3
|
||||
|
||||
# അല്ലെങ്കിൽ python3 വ്യക്തമായി ഉപയോഗിക്കുക
|
||||
python3 -m pip install jupyter
|
||||
```
|
||||
|
||||
**Windows പരിഹാരം:**
|
||||
1. [python.org](https://www.python.org/) ൽ നിന്ന് Python വീണ്ടും ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
2. ഇൻസ്റ്റലേഷൻ സമയത്ത് "Add Python to PATH" തിരഞ്ഞെടുക്കുക
|
||||
3. നിങ്ങളുടെ ടെർമിനൽ/കമാൻഡ് പ്രോംപ്റ്റ് റീസ്റ്റാർട്ട് ചെയ്യുക
|
||||
|
||||
### Virtual Environment സജീവമാക്കൽ പ്രശ്നങ്ങൾ
|
||||
|
||||
**പ്രശ്നം:** Virtual environment സജീവമാകുന്നില്ല
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
**Windows:**
|
||||
```bash
|
||||
# നിങ്ങൾക്ക് എക്സിക്യൂഷൻ നയം പിശക് ലഭിച്ചാൽ
|
||||
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser
|
||||
|
||||
# പിന്നെ സജീവമാക്കുക
|
||||
venv\Scripts\activate
|
||||
```
|
||||
|
||||
**macOS/Linux:**
|
||||
```bash
|
||||
# സജീവമാക്കുന്ന സ്ക്രിപ്റ്റ് പ്രവർത്തനക്ഷമമാണെന്ന് ഉറപ്പാക്കുക
|
||||
chmod +x venv/bin/activate
|
||||
|
||||
# പിന്നീട് സജീവമാക്കുക
|
||||
source venv/bin/activate
|
||||
```
|
||||
|
||||
**സജീവമാക്കൽ സ്ഥിരീകരിക്കുക:**
|
||||
```bash
|
||||
# നിങ്ങളുടെ പ്രോംപ്റ്റ് (venv) കാണിക്കണം
|
||||
# Python സ്ഥാനം പരിശോധിക്കുക
|
||||
which python # venv കാണിക്കണം
|
||||
```
|
||||
|
||||
### Jupyter Kernel പ്രശ്നങ്ങൾ
|
||||
|
||||
**പ്രശ്നം:** "Kernel not found" അല്ലെങ്കിൽ "Kernel keeps dying"
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# കർണൽ പുനഃസ്ഥാപിക്കുക
|
||||
python -m ipykernel install --user --name=datascience --display-name="Python (Data Science)"
|
||||
|
||||
# അല്ലെങ്കിൽ ഡിഫോൾട്ട് കർണൽ ഉപയോഗിക്കുക
|
||||
python -m ipykernel install --user
|
||||
|
||||
# ജുപിറ്റർ പുനരാരംഭിക്കുക
|
||||
jupyter notebook
|
||||
```
|
||||
|
||||
**പ്രശ്നം:** Jupyter-ൽ തെറ്റായ Python പതിപ്പ്
|
||||
|
||||
**പരിഹാരം:**
|
||||
```bash
|
||||
# നിങ്ങളുടെ വെർച്വൽ എൻവയോൺമെന്റിൽ Jupyter ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
source venv/bin/activate # ആദ്യം സജീവമാക്കുക
|
||||
pip install jupyter ipykernel
|
||||
|
||||
# കർണൽ രജിസ്റ്റർ ചെയ്യുക
|
||||
python -m ipykernel install --user --name=venv --display-name="Python (venv)"
|
||||
|
||||
# Jupyter-ൽ, Kernel -> Change kernel -> Python (venv) തിരഞ്ഞെടുക്കുക
|
||||
```
|
||||
|
||||
## Package and Dependency Issues
|
||||
|
||||
### Import Errors
|
||||
|
||||
**പ്രശ്നം:** `ModuleNotFoundError: No module named 'pandas'` (അല്ലെങ്കിൽ മറ്റ് പാക്കേജുകൾ)
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# വെർച്വൽ എൻവയോൺമെന്റ് സജീവമാക്കിയിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക
|
||||
source venv/bin/activate # മാക്ഒഎസ്/ലിനക്സ്
|
||||
venv\Scripts\activate # വിൻഡോസ്
|
||||
|
||||
# നഷ്ടമായ പാക്കേജ് ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
pip install pandas
|
||||
|
||||
# എല്ലാ പൊതുവായ പാക്കേജുകളും ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
|
||||
|
||||
# ഇൻസ്റ്റലേഷൻ സ്ഥിരീകരിക്കുക
|
||||
python -c "import pandas; print(pandas.__version__)"
|
||||
```
|
||||
|
||||
### Pip ഇൻസ്റ്റലേഷൻ പരാജയങ്ങൾ
|
||||
|
||||
**പ്രശ്നം:** `pip install` അനുമതി പിഴവുകളോടെ പരാജയപ്പെടുന്നു
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# --user ഫ്ലാഗ് ഉപയോഗിക്കുക
|
||||
pip install --user package-name
|
||||
|
||||
# അല്ലെങ്കിൽ വിർച്വൽ എൻവയോൺമെന്റ് ഉപയോഗിക്കുക (ശുപാർശ ചെയ്യുന്നു)
|
||||
python -m venv venv
|
||||
source venv/bin/activate
|
||||
pip install package-name
|
||||
```
|
||||
|
||||
**പ്രശ്നം:** `pip install` SSL സർട്ടിഫിക്കറ്റ് പിഴവുകളോടെ പരാജയപ്പെടുന്നു
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# ആദ്യം പിപ്പ് അപ്ഡേറ്റ് ചെയ്യുക
|
||||
python -m pip install --upgrade pip
|
||||
|
||||
# വിശ്വസനീയമായ ഹോസ്റ്റുമായി ഇൻസ്റ്റാൾ ചെയ്യാൻ ശ്രമിക്കുക (താൽക്കാലിക പരിഹാരം)
|
||||
pip install --trusted-host pypi.org --trusted-host files.pythonhosted.org package-name
|
||||
```
|
||||
|
||||
### പാക്കേജ് പതിപ്പ് പൊരുത്തക്കേട്
|
||||
|
||||
**പ്രശ്നം:** പൊരുത്തക്കേടുള്ള പാക്കേജ് പതിപ്പുകൾ
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# പുതിയ വെർച്വൽ എൻവയോൺമെന്റ് സൃഷ്ടിക്കുക
|
||||
python -m venv venv-new
|
||||
source venv-new/bin/activate # അല്ലെങ്കിൽ Windows-ൽ venv-new\Scripts\activate
|
||||
|
||||
# ആവശ്യമായെങ്കിൽ പ്രത്യേക പതിപ്പുകളുള്ള പാക്കേജുകൾ ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
pip install pandas==1.3.0
|
||||
pip install numpy==1.21.0
|
||||
|
||||
# അല്ലെങ്കിൽ pip ആശ്രിതത്വങ്ങൾ പരിഹരിക്കട്ടെ
|
||||
pip install jupyter pandas numpy matplotlib seaborn scikit-learn
|
||||
```
|
||||
|
||||
## Jupyter Notebook Issues
|
||||
|
||||
### Jupyter ആരംഭിക്കില്ല
|
||||
|
||||
**പ്രശ്നം:** `jupyter notebook` കമാൻഡ് കണ്ടെത്താനാകുന്നില്ല
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# Jupyter ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
pip install jupyter
|
||||
|
||||
# അല്ലെങ്കിൽ python -m ഉപയോഗിക്കുക
|
||||
python -m jupyter notebook
|
||||
|
||||
# ആവശ്യമെങ്കിൽ PATH-ലേക്ക് ചേർക്കുക (macOS/Linux)
|
||||
export PATH="$HOME/.local/bin:$PATH"
|
||||
```
|
||||
|
||||
### Notebook ലോഡ് ചെയ്യാനോ സേവ് ചെയ്യാനോ കഴിയുന്നില്ല
|
||||
|
||||
**പ്രശ്നം:** "Notebook failed to load" അല്ലെങ്കിൽ സേവ് പിഴവുകൾ
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
1. ഫയൽ അനുമതികൾ പരിശോധിക്കുക
|
||||
```bash
|
||||
# നിങ്ങൾക്ക് എഴുതാനുള്ള അനുമതികൾ ഉണ്ടെന്ന് ഉറപ്പാക്കുക
|
||||
ls -l notebook.ipynb
|
||||
chmod 644 notebook.ipynb # ആവശ്യമെങ്കിൽ
|
||||
```
|
||||
|
||||
2. ഫയൽ കേടുപാടുകൾ പരിശോധിക്കുക
|
||||
```bash
|
||||
# JSON ഘടന പരിശോധിക്കാൻ ടെക്സ്റ്റ് എഡിറ്ററിൽ തുറക്കാൻ ശ്രമിക്കുക
|
||||
# കേടുപാടായാൽ ഉള്ളടക്കം പുതിയ നോട്ട്ബുക്കിലേക്ക് പകർത്തുക
|
||||
```
|
||||
|
||||
3. Jupyter കാഷെ ക്ലിയർ ചെയ്യുക
|
||||
```bash
|
||||
jupyter notebook --clear-cache
|
||||
```
|
||||
|
||||
### സെൽ പ്രവർത്തിക്കില്ല
|
||||
|
||||
**പ്രശ്നം:** സെൽ "In [*]" എന്ന നിലയിൽ കുടുങ്ങി അല്ലെങ്കിൽ വളരെ സമയം എടുക്കുന്നു
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
1. **Kernel ഇടപെടുക**: "Interrupt" ബട്ടൺ ക്ലിക്ക് ചെയ്യുക അല്ലെങ്കിൽ `I, I` അമർത്തുക
|
||||
2. **Kernel റീസ്റ്റാർട്ട് ചെയ്യുക**: Kernel മെനു → Restart
|
||||
3. നിങ്ങളുടെ കോഡിൽ അനന്ത ലൂപ്പുകൾ ഉണ്ടോ എന്ന് പരിശോധിക്കുക
|
||||
4. **ഔട്ട്പുട്ട് ക്ലിയർ ചെയ്യുക**: സെൽ → All Output → Clear
|
||||
|
||||
### പ്ലോട്ടുകൾ കാണിക്കുന്നില്ല
|
||||
|
||||
**പ്രശ്നം:** `matplotlib` പ്ലോട്ടുകൾ നോട്ട്ബുക്കിൽ കാണിക്കുന്നില്ല
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```python
|
||||
# നോട്ട്ബുക്കിന്റെ മുകളിൽ മാജിക് കമാൻഡ് ചേർക്കുക
|
||||
%matplotlib inline
|
||||
|
||||
import matplotlib.pyplot as plt
|
||||
|
||||
# പ്ലോട്ട് സൃഷ്ടിക്കുക
|
||||
plt.plot([1, 2, 3, 4])
|
||||
plt.show() # show() വിളിക്കുന്നത് ഉറപ്പാക്കുക
|
||||
```
|
||||
|
||||
**ഇന്ററാക്ടീവ് പ്ലോട്ടുകൾക്കുള്ള ബദൽ:**
|
||||
```python
|
||||
%matplotlib notebook
|
||||
# അല്ലെങ്കിൽ
|
||||
%matplotlib widget
|
||||
```
|
||||
|
||||
## Quiz Application Issues
|
||||
|
||||
### npm install പരാജയപ്പെടുന്നു
|
||||
|
||||
**പ്രശ്നം:** `npm install` സമയത്ത് പിഴവുകൾ
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# npm കാഷെ ക്ലിയർ ചെയ്യുക
|
||||
npm cache clean --force
|
||||
|
||||
# node_modules ഉം package-lock.json ഉം നീക്കം ചെയ്യുക
|
||||
rm -rf node_modules package-lock.json
|
||||
|
||||
# പുനഃസ്ഥാപിക്കുക
|
||||
npm install
|
||||
|
||||
# ഇപ്പോഴും പരാജയപ്പെടുന്നുവെങ്കിൽ, legacy peer deps ഉപയോഗിച്ച് ശ്രമിക്കുക
|
||||
npm install --legacy-peer-deps
|
||||
```
|
||||
|
||||
### Quiz ആപ്പ് ആരംഭിക്കില്ല
|
||||
|
||||
**പ്രശ്നം:** `npm run serve` പരാജയപ്പെടുന്നു
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# Node.js പതിപ്പ് പരിശോധിക്കുക
|
||||
node --version # 12.x അല്ലെങ്കിൽ അതിനുമുകളിൽ ആയിരിക്കണം
|
||||
|
||||
# ആശ്രിതങ്ങൾ വീണ്ടും ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
cd quiz-app
|
||||
rm -rf node_modules package-lock.json
|
||||
npm install
|
||||
|
||||
# വ്യത്യസ്ത പോർട്ട് പരീക്ഷിക്കുക
|
||||
npm run serve -- --port 8081
|
||||
```
|
||||
|
||||
### പോർട്ട് ഇതിനകം ഉപയോഗത്തിലാണ്
|
||||
|
||||
**പ്രശ്നം:** "Port 8080 is already in use"
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# 8080 പോർട്ടിൽ പ്രവർത്തിക്കുന്ന പ്രോസസ്സ് കണ്ടെത്തി നശിപ്പിക്കുക
|
||||
# macOS/Linux:
|
||||
lsof -ti:8080 | xargs kill -9
|
||||
|
||||
# Windows:
|
||||
netstat -ano | findstr :8080
|
||||
taskkill /PID <PID> /F
|
||||
|
||||
# അല്ലെങ്കിൽ വ്യത്യസ്തമായ ഒരു പോർട്ട് ഉപയോഗിക്കുക
|
||||
npm run serve -- --port 8081
|
||||
```
|
||||
|
||||
### Quiz ലോഡ് ചെയ്യാനോ ശൂന്യ പേജ് കാണിക്കാനോ കഴിയുന്നില്ല
|
||||
|
||||
**പ്രശ്നം:** Quiz ആപ്പ് ലോഡ് ആകുന്നു പക്ഷേ ശൂന്യ പേജ് കാണിക്കുന്നു
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
1. ബ്രൗസർ കോൺസോൾ പിഴവുകൾ പരിശോധിക്കുക (F12)
|
||||
2. ബ്രൗസർ കാഷെയും കുക്കികളും ക്ലിയർ ചെയ്യുക
|
||||
3. വേറെ ബ്രൗസർ പരീക്ഷിക്കുക
|
||||
4. ജാവാസ്ക്രിപ്റ്റ് സജീവമാണെന്ന് ഉറപ്പാക്കുക
|
||||
5. അഡ്ബ്ലോക്കറുകൾ തടസ്സം സൃഷ്ടിക്കുന്നുണ്ടോ എന്ന് പരിശോധിക്കുക
|
||||
|
||||
```bash
|
||||
# ആപ്പ് പുനർനിർമ്മിക്കുക
|
||||
npm run build
|
||||
npm run serve
|
||||
```
|
||||
|
||||
## Git and GitHub Issues
|
||||
|
||||
### Git തിരിച്ചറിയുന്നില്ല
|
||||
|
||||
**പ്രശ്നം:** `git: command not found`
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
**Windows:**
|
||||
- [git-scm.com](https://git-scm.com/) ൽ നിന്ന് Git ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
- ഇൻസ്റ്റലേഷൻ കഴിഞ്ഞ് ടെർമിനൽ റീസ്റ്റാർട്ട് ചെയ്യുക
|
||||
|
||||
**macOS:**
|
||||
|
||||
> **കുറിപ്പ്:** നിങ്ങൾക്ക് Homebrew ഇൻസ്റ്റാൾ ചെയ്തിട്ടില്ലെങ്കിൽ, ആദ്യം [https://brew.sh/](https://brew.sh/) ൽ നൽകിയ നിർദ്ദേശങ്ങൾ പാലിച്ച് അത് ഇൻസ്റ്റാൾ ചെയ്യുക.
|
||||
```bash
|
||||
# ഹോംബ്രൂ വഴി ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
brew install git
|
||||
|
||||
# അല്ലെങ്കിൽ Xcode കമാൻഡ് ലൈൻ ടൂളുകൾ ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
xcode-select --install
|
||||
```
|
||||
|
||||
**Linux:**
|
||||
```bash
|
||||
sudo apt-get install git # ഡെബിയൻ/ഉബുണ്ടു
|
||||
sudo dnf install git # ഫെഡോറാ
|
||||
```
|
||||
|
||||
### Clone പരാജയപ്പെടുന്നു
|
||||
|
||||
**പ്രശ്നം:** `git clone` ഓതന്റിക്കേഷൻ പിഴവുകളോടെ പരാജയപ്പെടുന്നു
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# HTTPS URL ഉപയോഗിക്കുക
|
||||
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
|
||||
|
||||
# GitHub-ൽ 2FA സജ്ജമാക്കിയിട്ടുണ്ടെങ്കിൽ, Personal Access Token ഉപയോഗിക്കുക
|
||||
# ടോക്കൺ സൃഷ്ടിക്കുക: https://github.com/settings/tokens
|
||||
# ചോദിക്കുമ്പോൾ പാസ്വേഡായി ടോക്കൺ ഉപയോഗിക്കുക
|
||||
```
|
||||
|
||||
### Permission Denied (publickey)
|
||||
|
||||
**പ്രശ്നം:** SSH കീ ഓതന്റിക്കേഷൻ പരാജയപ്പെടുന്നു
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# SSH കീ ജനറേറ്റ് ചെയ്യുക
|
||||
ssh-keygen -t ed25519 -C "your_email@example.com"
|
||||
|
||||
# കീ ssh-agent-ലേക്ക് ചേർക്കുക
|
||||
eval "$(ssh-agent -s)"
|
||||
ssh-add ~/.ssh/id_ed25519
|
||||
|
||||
# പബ്ലിക് കീ GitHub-ലേക്ക് ചേർക്കുക
|
||||
# കീ കോപ്പി ചെയ്യുക: cat ~/.ssh/id_ed25519.pub
|
||||
# ഇവിടെ ചേർക്കുക: https://github.com/settings/keys
|
||||
```
|
||||
|
||||
## Docsify Documentation Issues
|
||||
|
||||
### Docsify കമാൻഡ് കണ്ടെത്താനാകുന്നില്ല
|
||||
|
||||
**പ്രശ്നം:** `docsify: command not found`
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# ആഗോളമായി ഇൻസ്റ്റാൾ ചെയ്യുക
|
||||
npm install -g docsify-cli
|
||||
|
||||
# macOS/Linux-ൽ അനുമതി പിശക് ഉണ്ടെങ്കിൽ
|
||||
sudo npm install -g docsify-cli
|
||||
|
||||
# ഇൻസ്റ്റലേഷൻ സ്ഥിരീകരിക്കുക
|
||||
docsify --version
|
||||
|
||||
# ഇപ്പോഴും കണ്ടെത്താനാകുന്നില്ലെങ്കിൽ, npm ആഗോള പാത ചേർക്കുക
|
||||
# npm ആഗോള പാത കണ്ടെത്തുക
|
||||
npm config get prefix
|
||||
|
||||
# PATH-ലേക്ക് ചേർക്കുക (~/.bashrc അല്ലെങ്കിൽ ~/.zshrc-ലേക്ക് ചേർക്കുക)
|
||||
export PATH="$PATH:/usr/local/bin"
|
||||
```
|
||||
|
||||
### ഡോക്യുമെന്റേഷൻ ലോഡ് ചെയ്യാനാകുന്നില്ല
|
||||
|
||||
**പ്രശ്നം:** Docsify സർവ് ചെയ്യുന്നു പക്ഷേ ഉള്ളടക്കം ലോഡ് ചെയ്യുന്നില്ല
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```bash
|
||||
# നിങ്ങൾ റിപോസിറ്ററി റൂട്ടിൽ ഉണ്ടെന്ന് ഉറപ്പാക്കുക
|
||||
cd Data-Science-For-Beginners
|
||||
|
||||
# index.html പരിശോധിക്കുക
|
||||
ls index.html
|
||||
|
||||
# പ്രത്യേക പോർട്ടിൽ സർവ് ചെയ്യുക
|
||||
docsify serve --port 3000
|
||||
|
||||
# ബ്രൗസർ കോൺസോളിൽ പിശകുകൾ പരിശോധിക്കുക (F12)
|
||||
```
|
||||
|
||||
### ചിത്രങ്ങൾ കാണിക്കുന്നില്ല
|
||||
|
||||
**പ്രശ്നം:** ചിത്രങ്ങൾ തകരാറുള്ള ലിങ്ക് ഐക്കൺ കാണിക്കുന്നു
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
1. ചിത്രം പാതകൾ സാപേക്ഷമാണെന്ന് പരിശോധിക്കുക
|
||||
2. ചിത്രം ഫയലുകൾ റിപ്പോസിറ്ററിയിൽ ഉണ്ടെന്ന് ഉറപ്പാക്കുക
|
||||
3. ബ്രൗസർ കാഷെ ക്ലിയർ ചെയ്യുക
|
||||
4. ഫയൽ എക്സ്റ്റൻഷനുകൾ പൊരുത്തപ്പെടുന്നുണ്ടോ എന്ന് പരിശോധിക്കുക (ചില സിസ്റ്റങ്ങളിൽ കേസ് സെൻസിറ്റീവ്)
|
||||
|
||||
## Data and File Issues
|
||||
|
||||
### ഫയൽ കണ്ടെത്താനാകുന്നില്ല പിഴവുകൾ
|
||||
|
||||
**പ്രശ്നം:** ഡാറ്റ ലോഡ് ചെയ്യുമ്പോൾ `FileNotFoundError`
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```python
|
||||
import os
|
||||
|
||||
# നിലവിലെ പ്രവർത്തന ഡയറക്ടറി പരിശോധിക്കുക
|
||||
print(os.getcwd())
|
||||
|
||||
# പൂർണ്ണ പാത ഉപയോഗിക്കുക
|
||||
data_path = os.path.join(os.getcwd(), 'data', 'filename.csv')
|
||||
df = pd.read_csv(data_path)
|
||||
|
||||
# അല്ലെങ്കിൽ നോട്ട്ബുക്ക് സ്ഥിതിചെയ്യുന്ന സ്ഥലത്ത് നിന്ന് സാപേക്ഷ പാത ഉപയോഗിക്കുക
|
||||
df = pd.read_csv('../data/filename.csv')
|
||||
|
||||
# ഫയൽ നിലവിലുണ്ടെന്ന് സ്ഥിരീകരിക്കുക
|
||||
print(os.path.exists('data/filename.csv'))
|
||||
```
|
||||
|
||||
### CSV വായന പിഴവുകൾ
|
||||
|
||||
**പ്രശ്നം:** CSV ഫയലുകൾ വായിക്കുമ്പോൾ പിഴവുകൾ
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
|
||||
# വ്യത്യസ്ത എൻകോഡിംഗുകൾ പരീക്ഷിക്കുക
|
||||
df = pd.read_csv('file.csv', encoding='utf-8')
|
||||
# അല്ലെങ്കിൽ
|
||||
df = pd.read_csv('file.csv', encoding='latin-1')
|
||||
# അല്ലെങ്കിൽ
|
||||
df = pd.read_csv('file.csv', encoding='ISO-8859-1')
|
||||
|
||||
# നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ കൈകാര്യം ചെയ്യുക
|
||||
df = pd.read_csv('file.csv', na_values=['NA', 'N/A', ''])
|
||||
|
||||
# കോമ അല്ലെങ്കിൽ ഡെലിമിറ്റർ വ്യക്തമാക്കുക
|
||||
df = pd.read_csv('file.csv', delimiter=';')
|
||||
```
|
||||
|
||||
### വലിയ ഡാറ്റാസെറ്റുകൾ ഉപയോഗിക്കുമ്പോൾ മെമ്മറി പിഴവുകൾ
|
||||
|
||||
**പ്രശ്നം:** വലിയ ഫയലുകൾ ലോഡ് ചെയ്യുമ്പോൾ `MemoryError`
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
```python
|
||||
# ചങ്കുകളായി വായിക്കുക
|
||||
chunk_size = 10000
|
||||
chunks = []
|
||||
for chunk in pd.read_csv('large_file.csv', chunksize=chunk_size):
|
||||
# ചങ്ക് പ്രോസസ്സ് ചെയ്യുക
|
||||
chunks.append(chunk)
|
||||
df = pd.concat(chunks)
|
||||
|
||||
# അല്ലെങ്കിൽ പ്രത്യേക കോളങ്ങൾ മാത്രം വായിക്കുക
|
||||
df = pd.read_csv('file.csv', usecols=['col1', 'col2'])
|
||||
|
||||
# കൂടുതൽ കാര്യക്ഷമമായ ഡാറ്റാ ടൈപ്പുകൾ ഉപയോഗിക്കുക
|
||||
df = pd.read_csv('file.csv', dtype={'column_name': 'int32'})
|
||||
```
|
||||
|
||||
## Performance Issues
|
||||
|
||||
### നോട്ട്ബുക്ക് പ്രകടനം മന്ദഗതിയിലാണ്
|
||||
|
||||
**പ്രശ്നം:** നോട്ട്ബുക്കുകൾ വളരെ മന്ദഗതിയിലാണ് പ്രവർത്തിക്കുന്നത്
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
1. **Kernel റീസ്റ്റാർട്ട് ചെയ്ത് ഔട്ട്പുട്ട് ക്ലിയർ ചെയ്യുക**
|
||||
- Kernel → Restart & Clear Output
|
||||
|
||||
2. **ഉപയോഗിക്കാത്ത നോട്ട്ബുക്കുകൾ അടയ്ക്കുക**
|
||||
|
||||
3. **കോഡ് ഒപ്റ്റിമൈസ് ചെയ്യുക:**
|
||||
```python
|
||||
# ലൂപ്പുകൾക്ക് പകരം വെക്ടറൈസ്ഡ് ഓപ്പറേഷനുകൾ ഉപയോഗിക്കുക
|
||||
# മോശം:
|
||||
result = []
|
||||
for x in data:
|
||||
result.append(x * 2)
|
||||
|
||||
# നല്ലത്:
|
||||
result = data * 2 # NumPy/Pandas വെക്ടറൈസേഷൻ
|
||||
```
|
||||
|
||||
4. **വലിയ ഡാറ്റാസെറ്റുകൾ സാമ്പിൾ ചെയ്യുക:**
|
||||
```python
|
||||
# വികസനത്തിനിടെ സാമ്പിളുമായി പ്രവർത്തിക്കുക
|
||||
df_sample = df.sample(n=1000) # അല്ലെങ്കിൽ df.head(1000)
|
||||
```
|
||||
|
||||
### ബ്രൗസർ ക്രാഷ്
|
||||
|
||||
**പ്രശ്നം:** ബ്രൗസർ ക്രാഷ് ചെയ്യുന്നു അല്ലെങ്കിൽ പ്രതികരിക്കാതെ പോകുന്നു
|
||||
|
||||
**പരിഹാരം:**
|
||||
|
||||
1. ഉപയോഗിക്കാത്ത ടാബുകൾ അടയ്ക്കുക
|
||||
2. ബ്രൗസർ കാഷെ ക്ലിയർ ചെയ്യുക
|
||||
3. ബ്രൗസർ മെമ്മറി വർദ്ധിപ്പിക്കുക (Chrome: `chrome://settings/system`)
|
||||
4. JupyterLab ഉപയോഗിക്കുക:
|
||||
```bash
|
||||
pip install jupyterlab
|
||||
jupyter lab
|
||||
```
|
||||
|
||||
## Getting Additional Help
|
||||
|
||||
### സഹായം ചോദിക്കുന്നതിന് മുമ്പ്
|
||||
|
||||
1. ഈ പ്രശ്നപരിഹാര ഗൈഡ് പരിശോധിക്കുക
|
||||
2. [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) തിരയുക
|
||||
3. [INSTALLATION.md](INSTALLATION.md) ഉം [USAGE.md](USAGE.md) ഉം അവലോകനം ചെയ്യുക
|
||||
4. പിഴവിന്റെ സന്ദേശം ഓൺലൈനിൽ തിരയാൻ ശ്രമിക്കുക
|
||||
|
||||
### സഹായം ചോദിക്കുന്ന വിധം
|
||||
|
||||
പ്രശ്നം സൃഷ്ടിക്കുമ്പോൾ അല്ലെങ്കിൽ സഹായം ചോദിക്കുമ്പോൾ ഉൾപ്പെടുത്തുക:
|
||||
|
||||
1. **ഓപ്പറേറ്റിംഗ് സിസ്റ്റം**: Windows, macOS, അല്ലെങ്കിൽ Linux (ഏത് ഡിസ്ട്രിബ്യൂഷൻ)
|
||||
2. **Python പതിപ്പ്**: `python --version` ഓടിക്കുക
|
||||
3. **പിഴവ് സന്ദേശം**: പൂർണ്ണമായ പിഴവ് സന്ദേശം പകർത്തുക
|
||||
4. **പുനരാവർത്തനത്തിന് വേണ്ട ഘട്ടങ്ങൾ**: പിഴവ് സംഭവിക്കുന്നതിന് മുമ്പ് നിങ്ങൾ ചെയ്തത്
|
||||
5. **നിങ്ങൾ ശ്രമിച്ച കാര്യങ്ങൾ**: നിങ്ങൾ ഇതിനകം പരീക്ഷിച്ച പരിഹാരങ്ങൾ
|
||||
|
||||
**ഉദാഹരണം:**
|
||||
```
|
||||
**Operating System:** macOS 12.0
|
||||
**Python Version:** 3.9.7
|
||||
**Error Message:** ModuleNotFoundError: No module named 'pandas'
|
||||
**Steps to Reproduce:**
|
||||
1. Activated virtual environment
|
||||
2. Started Jupyter notebook
|
||||
3. Tried to import pandas
|
||||
|
||||
**What I've Tried:**
|
||||
- Ran pip install pandas
|
||||
- Restarted Jupyter
|
||||
```
|
||||
|
||||
### കമ്മ്യൂണിറ്റി വിഭവങ്ങൾ
|
||||
|
||||
- **GitHub Issues**: [Create an issue](https://github.com/microsoft/Data-Science-For-Beginners/issues/new)
|
||||
- **Discord**: [Join our community](https://aka.ms/ds4beginners/discord)
|
||||
- **Discussions**: [GitHub Discussions](https://github.com/microsoft/Data-Science-For-Beginners/discussions)
|
||||
- **Microsoft Learn**: [Q&A Forums](https://docs.microsoft.com/answers/)
|
||||
|
||||
### ബന്ധപ്പെട്ട ഡോക്യുമെന്റേഷൻ
|
||||
|
||||
- [INSTALLATION.md](INSTALLATION.md) - സെറ്റപ്പ് നിർദ്ദേശങ്ങൾ
|
||||
- [USAGE.md](USAGE.md) - പാഠ്യപദ്ധതി ഉപയോഗിക്കുന്ന വിധം
|
||||
- [CONTRIBUTING.md](CONTRIBUTING.md) - സംഭാവന ചെയ്യാനുള്ള മാർഗ്ഗങ്ങൾ
|
||||
- [README.md](README.md) - പ്രോജക്ട് അവലോകനം
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,376 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "f546349678757508d69ce9e1d2688446",
|
||||
"translation_date": "2025-12-19T12:45:11+00:00",
|
||||
"source_file": "USAGE.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ഉപയോഗ മാർഗ്ഗനിർദ്ദേശം
|
||||
|
||||
ഡാറ്റാ സയൻസ് ഫോർ ബിഗിനേഴ്സ് പാഠ്യപദ്ധതിയുടെ ഉദാഹരണങ്ങളും സാധാരണ പ്രവൃത്തിപദ്ധതികളും ഈ മാർഗ്ഗനിർദ്ദേശം നൽകുന്നു.
|
||||
|
||||
## ഉള്ളടക്ക പട്ടിക
|
||||
|
||||
- [ഈ പാഠ്യപദ്ധതി എങ്ങനെ ഉപയോഗിക്കാം](../..)
|
||||
- [പാഠങ്ങളുമായി പ്രവർത്തിക്കൽ](../..)
|
||||
- [ജുപിറ്റർ നോട്ട്ബുക്കുകളുമായി പ്രവർത്തിക്കൽ](../..)
|
||||
- [ക്വിസ് അപ്ലിക്കേഷൻ ഉപയോഗിക്കൽ](../..)
|
||||
- [സാധാരണ പ്രവൃത്തിപദ്ധതികൾ](../..)
|
||||
- [സ്വയം പഠിക്കുന്നവർക്കുള്ള ടിപ്പുകൾ](../..)
|
||||
- [അധ്യാപകർക്കുള്ള ടിപ്പുകൾ](../..)
|
||||
|
||||
## ഈ പാഠ്യപദ്ധതി എങ്ങനെ ഉപയോഗിക്കാം
|
||||
|
||||
ഈ പാഠ്യപദ്ധതി ലവചികമായും വിവിധ രീതികളിൽ ഉപയോഗിക്കാവുന്നതുമായ രീതിയിൽ രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു:
|
||||
|
||||
- **സ്വയംനിർദ്ദേശ പഠനം**: നിങ്ങളുടെ സ്വന്തം വേഗതയിൽ സ്വതന്ത്രമായി പാഠങ്ങൾ പഠിക്കുക
|
||||
- **ക്ലാസ്റൂം നിർദ്ദേശം**: മാർഗ്ഗനിർദ്ദേശത്തോടെ ഘടനാപരമായ കോഴ്സ് ആയി ഉപയോഗിക്കുക
|
||||
- **അധ്യയന ഗ്രൂപ്പുകൾ**: കൂട്ടായ്മയിൽ സഹപാഠികളോടൊപ്പം പഠിക്കുക
|
||||
- **വർക്ക്ഷോപ്പ് ഫോർമാറ്റ്**: തീവ്രമായ ചെറുകാല പഠന സെഷനുകൾ
|
||||
|
||||
## പാഠങ്ങളുമായി പ്രവർത്തിക്കൽ
|
||||
|
||||
ഓരോ പാഠവും പഠനം പരമാവധി ആക്കാൻ സ്ഥിരമായ ഘടന പിന്തുടരുന്നു:
|
||||
|
||||
### പാഠ ഘടന
|
||||
|
||||
1. **പ്രീ-പാഠ ക്വിസ്**: നിലവിലുള്ള അറിവ് പരിശോധിക്കുക
|
||||
2. **സ്കെച്ച്നോട്ട്** (ഐച്ഛികം): പ്രധാന ആശയങ്ങളുടെ ദൃശ്യ സംഗ്രഹം
|
||||
3. **വീഡിയോ** (ഐച്ഛികം): അനുബന്ധ വീഡിയോ ഉള്ളടക്കം
|
||||
4. **ലിഖിത പാഠം**: മുഖ്യ ആശയങ്ങളും വിശദീകരണങ്ങളും
|
||||
5. **ജുപിറ്റർ നോട്ട്ബുക്ക്**: പ്രായോഗിക കോഡിംഗ് അഭ്യാസങ്ങൾ
|
||||
6. **അസൈൻമെന്റ്**: പഠിച്ചതു പ്രയോഗിക്കുക
|
||||
7. **പോസ്റ്റ്-പാഠ ക്വിസ്**: നിങ്ങളുടെ മനസ്സിലാക്കൽ ശക്തിപ്പെടുത്തുക
|
||||
|
||||
### ഒരു പാഠത്തിനുള്ള ഉദാഹരണ പ്രവൃത്തിപദ്ധതി
|
||||
|
||||
```bash
|
||||
# 1. പാഠം ഡയറക്ടറിയിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക
|
||||
cd 1-Introduction/01-defining-data-science
|
||||
|
||||
# 2. README.md വായിക്കുക
|
||||
# README.md നിങ്ങളുടെ ബ്രൗസറിലോ എഡിറ്ററിലോ തുറക്കുക
|
||||
|
||||
# 3. പൂർവ്വപാഠം ക്വിസ് എടുക്കുക
|
||||
# README-യിലെ ക്വിസ് ലിങ്കിൽ ക്ലിക്ക് ചെയ്യുക
|
||||
|
||||
# 4. Jupyter നോട്ട്ബുക്ക് തുറക്കുക (ലഭ്യമായാൽ)
|
||||
jupyter notebook
|
||||
|
||||
# 5. നോട്ട്ബുക്കിലെ അഭ്യാസങ്ങൾ പൂർത്തിയാക്കുക
|
||||
|
||||
# 6. അസൈൻമെന്റിൽ പ്രവർത്തിക്കുക
|
||||
|
||||
# 7. പാശ്ചാത്യപാഠം ക്വിസ് എടുക്കുക
|
||||
```
|
||||
|
||||
## ജുപിറ്റർ നോട്ട്ബുക്കുകളുമായി പ്രവർത്തിക്കൽ
|
||||
|
||||
### ജുപിറ്റർ ആരംഭിക്കൽ
|
||||
|
||||
```bash
|
||||
# നിങ്ങളുടെ വെർച്വൽ എൻവയോൺമെന്റ് സജീവമാക്കുക
|
||||
source venv/bin/activate # മാക്ഓഎസ്/ലിനക്സിൽ
|
||||
# അല്ലെങ്കിൽ
|
||||
venv\Scripts\activate # വിൻഡോസിൽ
|
||||
|
||||
# റിപോസിറ്ററി റൂട്ടിൽ നിന്ന് ജുപിറ്റർ ആരംഭിക്കുക
|
||||
jupyter notebook
|
||||
```
|
||||
|
||||
### നോട്ട്ബുക്ക് സെല്ലുകൾ പ്രവർത്തിപ്പിക്കൽ
|
||||
|
||||
1. **ഒരു സെൽ പ്രവർത്തിപ്പിക്കുക**: `Shift + Enter` അമർത്തുക അല്ലെങ്കിൽ "Run" ബട്ടൺ ക്ലിക്ക് ചെയ്യുക
|
||||
2. **എല്ലാ സെല്ലുകളും പ്രവർത്തിപ്പിക്കുക**: മെനുവിൽ നിന്ന് "Cell" → "Run All" തിരഞ്ഞെടുക്കുക
|
||||
3. **കേർണൽ പുനരാരംഭിക്കുക**: പ്രശ്നങ്ങൾ ഉണ്ടെങ്കിൽ "Kernel" → "Restart" തിരഞ്ഞെടുക്കുക
|
||||
|
||||
### ഉദാഹരണം: നോട്ട്ബുക്കിൽ ഡാറ്റയുമായി പ്രവർത്തിക്കൽ
|
||||
|
||||
```python
|
||||
# ആവശ്യമായ ലൈബ്രറികൾ ഇറക്കുമതി ചെയ്യുക
|
||||
import pandas as pd
|
||||
import numpy as np
|
||||
import matplotlib.pyplot as plt
|
||||
|
||||
# ഒരു ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യുക
|
||||
df = pd.read_csv('data/sample.csv')
|
||||
|
||||
# ഡാറ്റ പരിശോധിക്കുക
|
||||
df.head()
|
||||
df.info()
|
||||
df.describe()
|
||||
|
||||
# ഒരു ദൃശ്യവൽക്കരണം സൃഷ്ടിക്കുക
|
||||
plt.figure(figsize=(10, 6))
|
||||
plt.plot(df['column_name'])
|
||||
plt.title('Sample Visualization')
|
||||
plt.xlabel('X-axis Label')
|
||||
plt.ylabel('Y-axis Label')
|
||||
plt.show()
|
||||
```
|
||||
|
||||
### നിങ്ങളുടെ ജോലി സംരക്ഷിക്കൽ
|
||||
|
||||
- ജുപിറ്റർ സ്വയംക്രമമായി ഇടക്കിടെ സേവ് ചെയ്യുന്നു
|
||||
- മാനുവലായി സേവ് ചെയ്യാൻ: `Ctrl + S` (മാക്ഓഎസിൽ `Cmd + S`) അമർത്തുക
|
||||
- നിങ്ങളുടെ പുരോഗതി `.ipynb` ഫയലിൽ സേവ് ചെയ്യപ്പെടുന്നു
|
||||
|
||||
## ക്വിസ് അപ്ലിക്കേഷൻ ഉപയോഗിക്കൽ
|
||||
|
||||
### ക്വിസ് ആപ്പ് ലോക്കലായി പ്രവർത്തിപ്പിക്കൽ
|
||||
|
||||
```bash
|
||||
# ക്വിസ് ആപ്പ് ഡയറക്ടറിയിലേക്ക് നാവിഗേറ്റ് ചെയ്യുക
|
||||
cd quiz-app
|
||||
|
||||
# ഡെവലപ്പ്മെന്റ് സർവർ ആരംഭിക്കുക
|
||||
npm run serve
|
||||
|
||||
# http://localhost:8080 ൽ ആക്സസ് ചെയ്യുക
|
||||
```
|
||||
|
||||
### ക്വിസുകൾ എടുക്കൽ
|
||||
|
||||
1. പ്രീ-പാഠ ക്വിസുകൾ ഓരോ പാഠത്തിന്റെ മുകളിൽ ലിങ്ക് ചെയ്തിരിക്കുന്നു
|
||||
2. പോസ്റ്റ്-പാഠ ക്വിസുകൾ ഓരോ പാഠത്തിന്റെ താഴെ ലിങ്ക് ചെയ്തിരിക്കുന്നു
|
||||
3. ഓരോ ക്വിസിലും 3 ചോദ്യങ്ങളുണ്ട്
|
||||
4. ക്വിസുകൾ പഠനം ശക്തിപ്പെടുത്താൻ രൂപകൽപ്പന ചെയ്തതാണ്, പൂർണ്ണമായ പരീക്ഷണത്തിന് അല്ല
|
||||
|
||||
### ക്വിസ് നമ്പറിംഗ്
|
||||
|
||||
- ക്വിസുകൾ 0-39 വരെ നമ്പർ ചെയ്തിരിക്കുന്നു (മൊത്തം 40 ക്വിസുകൾ)
|
||||
- ഓരോ പാഠത്തിനും സാധാരണയായി പ്രീയും പോസ്റ്റും ക്വിസ് ഉണ്ട്
|
||||
- ക്വിസ് URLs-ൽ ക്വിസ് നമ്പർ ഉൾപ്പെടുന്നു: `https://ff-quizzes.netlify.app/en/ds/quiz/0`
|
||||
|
||||
## സാധാരണ പ്രവൃത്തിപദ്ധതികൾ
|
||||
|
||||
### പ്രവൃത്തിപദ്ധതി 1: പൂർണ്ണ തുടക്കക്കാരൻ പാത
|
||||
|
||||
```bash
|
||||
# 1. നിങ്ങളുടെ പരിസ്ഥിതി സജ്ജമാക്കുക (INSTALLATION.md കാണുക)
|
||||
|
||||
# 2. പാഠം 1 മുതൽ ആരംഭിക്കുക
|
||||
cd 1-Introduction/01-defining-data-science
|
||||
|
||||
# 3. ഓരോ പാഠത്തിനും:
|
||||
# - പാഠത്തിന് മുമ്പുള്ള ക്വിസ് എടുക്കുക
|
||||
# - പാഠത്തിന്റെ ഉള്ളടക്കം വായിക്കുക
|
||||
# - നോട്ട്ബുക്ക് വഴി പ്രവർത്തിക്കുക
|
||||
# - അസൈൻമെന്റ് പൂർത്തിയാക്കുക
|
||||
# - പാഠത്തിന് ശേഷമുള്ള ക്വിസ് എടുക്കുക
|
||||
|
||||
# 4. എല്ലാ 20 പാഠങ്ങളും ക്രമമായി മുന്നോട്ട് പോകുക
|
||||
```
|
||||
|
||||
### പ്രവൃത്തിപദ്ധതി 2: വിഷയം-നിർദ്ദിഷ്ട പഠനം
|
||||
|
||||
നിങ്ങൾക്ക് ഒരു പ്രത്യേക വിഷയത്തിൽ താൽപര്യമുണ്ടെങ്കിൽ:
|
||||
|
||||
```bash
|
||||
# ഉദാഹരണം: ഡാറ്റാ ദൃശ്യീകരണത്തിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുക
|
||||
cd 3-Data-Visualization
|
||||
|
||||
# പാഠങ്ങൾ 9-13 പരിശോധിക്കുക:
|
||||
# - പാഠം 9: അളവുകൾ ദൃശ്യീകരിക്കൽ
|
||||
# - പാഠം 10: വിതരണങ്ങൾ ദൃശ്യീകരിക്കൽ
|
||||
# - പാഠം 11: അനുപാതങ്ങൾ ദൃശ്യീകരിക്കൽ
|
||||
# - പാഠം 12: ബന്ധങ്ങൾ ദൃശ്യീകരിക്കൽ
|
||||
# - പാഠം 13: അർത്ഥവത്തായ ദൃശ്യീകരണങ്ങൾ
|
||||
```
|
||||
|
||||
### പ്രവൃത്തിപദ്ധതി 3: പ്രോജക്ട്-അധിഷ്ഠിത പഠനം
|
||||
|
||||
```bash
|
||||
# 1. ഡാറ്റ സയൻസ് ലൈഫ്സൈക്കിൾ പാഠങ്ങൾ (14-16) അവലോകനം ചെയ്യുക
|
||||
cd 4-Data-Science-Lifecycle
|
||||
|
||||
# 2. യഥാർത്ഥ ലോക ഉദാഹരണം വഴി പ്രവർത്തിക്കുക (പാഠം 20)
|
||||
cd ../6-Data-Science-In-Wild/20-Real-World-Examples
|
||||
|
||||
# 3. നിങ്ങളുടെ സ്വന്തം പ്രോജക്ടിൽ ആശയങ്ങൾ പ്രയോഗിക്കുക
|
||||
```
|
||||
|
||||
### പ്രവൃത്തിപദ്ധതി 4: ക്ലൗഡ്-അധിഷ്ഠിത ഡാറ്റാ സയൻസ്
|
||||
|
||||
```bash
|
||||
# ക്ലൗഡ് ഡാറ്റ സയൻസ് പഠിക്കുക (പാഠങ്ങൾ 17-19)
|
||||
cd 5-Data-Science-In-Cloud
|
||||
|
||||
# 17: ക്ലൗഡ് ഡാറ്റ സയൻസിലേക്ക് പരിചയം
|
||||
# 18: ലോ-കോഡ് എംഎൽ ടൂളുകൾ
|
||||
# 19: അസ്യൂർ മെഷീൻ ലേണിംഗ് സ്റ്റുഡിയോ
|
||||
```
|
||||
|
||||
## സ്വയം പഠിക്കുന്നവർക്കുള്ള ടിപ്പുകൾ
|
||||
|
||||
### ക്രമീകരിച്ചിരിക്കുക
|
||||
|
||||
```bash
|
||||
# ഒരു പഠന ജേർണൽ സൃഷ്ടിക്കുക
|
||||
mkdir my-learning-journal
|
||||
|
||||
# ഓരോ പാഠത്തിനും കുറിപ്പുകൾ സൃഷ്ടിക്കുക
|
||||
echo "# Lesson 1 Notes" > my-learning-journal/lesson-01-notes.md
|
||||
```
|
||||
|
||||
### പതിവായി അഭ്യാസം ചെയ്യുക
|
||||
|
||||
- ഓരോ ദിവസവും അല്ലെങ്കിൽ ആഴ്ചയിൽ ഒരു നിശ്ചിത സമയം മാറ്റിവെക്കുക
|
||||
- ആഴ്ചയിൽ കുറഞ്ഞത് ഒരു പാഠം പൂർത്തിയാക്കുക
|
||||
- മുമ്പത്തെ പാഠങ്ങൾ ഇടക്കിടെ അവലോകനം ചെയ്യുക
|
||||
|
||||
### സമൂഹവുമായി ഇടപഴകുക
|
||||
|
||||
- [ഡിസ്കോർഡ് സമൂഹം](https://aka.ms/ds4beginners/discord)യിൽ ചേരുക
|
||||
- ഡിസ്കോർഡിലെ #Data-Science-for-Beginners ചാനലിൽ പങ്കെടുക്കുക [Discord Discussions](https://aka.ms/ds4beginners/discord)
|
||||
- നിങ്ങളുടെ പുരോഗതി പങ്കുവെക്കുകയും ചോദ്യങ്ങൾ ചോദിക്കുകയും ചെയ്യുക
|
||||
|
||||
### നിങ്ങളുടെ സ്വന്തം പ്രോജക്ടുകൾ നിർമ്മിക്കുക
|
||||
|
||||
പാഠങ്ങൾ പൂർത്തിയാക്കിയ ശേഷം, ആശയങ്ങൾ വ്യക്തിഗത പ്രോജക്ടുകളിൽ പ്രയോഗിക്കുക:
|
||||
|
||||
```python
|
||||
# ഉദാഹരണം: നിങ്ങളുടെ സ്വന്തം ഡാറ്റാസെറ്റ് വിശകലനം ചെയ്യുക
|
||||
import pandas as pd
|
||||
|
||||
# നിങ്ങളുടെ സ്വന്തം ഡാറ്റ ലോഡ് ചെയ്യുക
|
||||
my_data = pd.read_csv('my-project/data.csv')
|
||||
|
||||
# പഠിച്ച സാങ്കേതിക വിദ്യകൾ പ്രയോഗിക്കുക
|
||||
# - ഡാറ്റ ശുചീകരണം (പാഠം 8)
|
||||
# - അന്വേഷണാത്മക ഡാറ്റ വിശകലനം (പാഠം 7)
|
||||
# - ദൃശ്യവൽക്കരണം (പാഠങ്ങൾ 9-13)
|
||||
# - വിശകലനം (പാഠം 15)
|
||||
```
|
||||
|
||||
## അധ്യാപകർക്കുള്ള ടിപ്പുകൾ
|
||||
|
||||
### ക്ലാസ്റൂം ക്രമീകരണം
|
||||
|
||||
1. വിശദമായ മാർഗ്ഗനിർദ്ദേശങ്ങൾക്ക് [for-teachers.md](for-teachers.md) പരിശോധിക്കുക
|
||||
2. പങ്കുവെക്കുന്ന പരിസ്ഥിതി സജ്ജമാക്കുക (GitHub Classroom അല്ലെങ്കിൽ Codespaces)
|
||||
3. ഒരു ആശയവിനിമയ ചാനൽ സ്ഥാപിക്കുക (Discord, Slack, അല്ലെങ്കിൽ Teams)
|
||||
|
||||
### പാഠം പദ്ധതിയിടൽ
|
||||
|
||||
**സൂചിപ്പിച്ച 10-ആഴ്ച ഷെഡ്യൂൾ:**
|
||||
|
||||
- **ആഴ്ച 1-2**: പരിചയം (പാഠങ്ങൾ 1-4)
|
||||
- **ആഴ്ച 3-4**: ഡാറ്റയുമായി പ്രവർത്തിക്കൽ (പാഠങ്ങൾ 5-8)
|
||||
- **ആഴ്ച 5-6**: ഡാറ്റാ ദൃശ്യീകരണം (പാഠങ്ങൾ 9-13)
|
||||
- **ആഴ്ച 7-8**: ഡാറ്റാ സയൻസ് ലൈഫ്സൈക്കിൾ (പാഠങ്ങൾ 14-16)
|
||||
- **ആഴ്ച 9**: ക്ലൗഡ് ഡാറ്റാ സയൻസ് (പാഠങ്ങൾ 17-19)
|
||||
- **ആഴ്ച 10**: യാഥാർത്ഥ്യ പ്രയോഗങ്ങളും അന്തിമ പ്രോജക്ടുകളും (പാഠം 20)
|
||||
|
||||
### ഓഫ്ലൈൻ ആക്സസിനായി ഡോക്സിഫൈ പ്രവർത്തിപ്പിക്കൽ
|
||||
|
||||
```bash
|
||||
# ക്ലാസ് റൂം ഉപയോഗത്തിനായി ഡോക്യുമെന്റേഷൻ ലോക്കലായി സർവ് ചെയ്യുക
|
||||
docsify serve
|
||||
|
||||
# വിദ്യാർത്ഥികൾ localhost:3000 ൽ പ്രവേശിക്കാം
|
||||
# പ്രാഥമിക ക്രമീകരണത്തിന് ശേഷം ഇന്റർനെറ്റ് ആവശ്യമില്ല
|
||||
```
|
||||
|
||||
### അസൈൻമെന്റ് ഗ്രേഡിംഗ്
|
||||
|
||||
- പൂർത്തിയാക്കിയ അഭ്യാസങ്ങൾക്കായി വിദ്യാർത്ഥികളുടെ നോട്ട്ബുക്കുകൾ പരിശോധിക്കുക
|
||||
- ക്വിസ് സ്കോറുകൾ വഴി മനസ്സിലാക്കൽ പരിശോധിക്കുക
|
||||
- ഡാറ്റാ സയൻസ് ലൈഫ്സൈക്കിൾ സിദ്ധാന്തങ്ങൾ ഉപയോഗിച്ച് അന്തിമ പ്രോജക്ടുകൾ വിലയിരുത്തുക
|
||||
|
||||
### അസൈൻമെന്റുകൾ സൃഷ്ടിക്കൽ
|
||||
|
||||
```python
|
||||
# ഉദാഹരണ കസ്റ്റം അസൈൻമെന്റ് ടെംപ്ലേറ്റ്
|
||||
"""
|
||||
Assignment: [Topic]
|
||||
|
||||
Objective: [Learning goal]
|
||||
|
||||
Dataset: [Provide or have students find one]
|
||||
|
||||
Tasks:
|
||||
1. Load and explore the dataset
|
||||
2. Clean and prepare the data
|
||||
3. Create at least 3 visualizations
|
||||
4. Perform analysis
|
||||
5. Communicate findings
|
||||
|
||||
Deliverables:
|
||||
- Jupyter notebook with code and explanations
|
||||
- Written summary of findings
|
||||
"""
|
||||
```
|
||||
|
||||
## ഓഫ്ലൈൻ പ്രവർത്തനം
|
||||
|
||||
### വിഭവങ്ങൾ ഡൗൺലോഡ് ചെയ്യുക
|
||||
|
||||
```bash
|
||||
# മുഴുവൻ റിപ്പോസിറ്ററി ക്ലോൺ ചെയ്യുക
|
||||
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
|
||||
|
||||
# ഡാറ്റാസെറ്റുകൾ മുൻകൂട്ടി ഡൗൺലോഡ് ചെയ്യുക
|
||||
# മിക്ക ഡാറ്റാസെറ്റുകളും റിപ്പോസിറ്ററിയിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്
|
||||
```
|
||||
|
||||
### ഡോക്യുമെന്റേഷൻ ലോക്കലായി പ്രവർത്തിപ്പിക്കുക
|
||||
|
||||
```bash
|
||||
# ഡോക്സിഫൈയുമായി സേവനം ചെയ്യുക
|
||||
docsify serve
|
||||
|
||||
# localhost:3000 ൽ പ്രവേശിക്കുക
|
||||
```
|
||||
|
||||
### ക്വിസ് ആപ്പ് ലോക്കലായി പ്രവർത്തിപ്പിക്കുക
|
||||
|
||||
```bash
|
||||
cd quiz-app
|
||||
npm run serve
|
||||
```
|
||||
|
||||
## വിവർത്തന ഉള്ളടക്കം ആക്സസ് ചെയ്യൽ
|
||||
|
||||
40-ലധികം ഭാഷകളിൽ വിവർത്തനങ്ങൾ ലഭ്യമാണ്:
|
||||
|
||||
```bash
|
||||
# പരിഭാഷപ്പെടുത്തിയ പാഠങ്ങൾ ആക്സസ് ചെയ്യുക
|
||||
cd translations/fr # ഫ്രഞ്ച്
|
||||
cd translations/es # സ്പാനിഷ്
|
||||
cd translations/de # ജർമ്മൻ
|
||||
# ... കൂടാതെ മറ്റും നിരവധി
|
||||
```
|
||||
|
||||
ഓരോ വിവർത്തനവും ഇംഗ്ലീഷ് പതിപ്പിന്റെ സമാന ഘടന നിലനിർത്തുന്നു.
|
||||
|
||||
## അധിക വിഭവങ്ങൾ
|
||||
|
||||
### പഠനം തുടരുക
|
||||
|
||||
- [Microsoft Learn](https://docs.microsoft.com/learn/) - അധിക പഠന പാതകൾ
|
||||
- [Student Hub](https://docs.microsoft.com/learn/student-hub) - വിദ്യാർത്ഥികൾക്കുള്ള വിഭവങ്ങൾ
|
||||
- [Azure AI Foundry](https://aka.ms/foundry/forum) - സമൂഹ ഫോറം
|
||||
|
||||
### ബന്ധപ്പെട്ട പാഠ്യപദ്ധതികൾ
|
||||
|
||||
- [AI for Beginners](https://aka.ms/ai-beginners)
|
||||
- [ML for Beginners](https://aka.ms/ml-beginners)
|
||||
- [Web Dev for Beginners](https://aka.ms/webdev-beginners)
|
||||
- [Generative AI for Beginners](https://aka.ms/genai-beginners)
|
||||
|
||||
## സഹായം നേടുക
|
||||
|
||||
- സാധാരണ പ്രശ്നങ്ങൾക്ക് [TROUBLESHOOTING.md](TROUBLESHOOTING.md) പരിശോധിക്കുക
|
||||
- [GitHub Issues](https://github.com/microsoft/Data-Science-For-Beginners/issues) തിരയുക
|
||||
- ഞങ്ങളുടെ [ഡിസ്കോർഡ്](https://aka.ms/ds4beginners/discord) ചേരുക
|
||||
- പ്രശ്നങ്ങൾ റിപ്പോർട്ട് ചെയ്യാനും സംഭാവന നൽകാനും [CONTRIBUTING.md](CONTRIBUTING.md) അവലോകനം ചെയ്യുക
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാപത്രം**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, യന്ത്രം ചെയ്ത വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് കരുതേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ വ്യാഖ്യാനക്കേടുകൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,42 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "3767555b3cc28a2865c79202f4374204",
|
||||
"translation_date": "2025-12-19T13:30:42+00:00",
|
||||
"source_file": "docs/_sidebar.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
- പരിചയം
|
||||
- [ഡാറ്റാ സയൻസ് നിർവചനം](../1-Introduction/01-defining-data-science/README.md)
|
||||
- [ഡാറ്റാ സയൻസിന്റെ നൈതികത](../1-Introduction/02-ethics/README.md)
|
||||
- [ഡാറ്റ നിർവചനം](../1-Introduction/03-defining-data/README.md)
|
||||
- [സാധ്യതയും സ്ഥിതിവിവരശാസ്ത്രവും](../1-Introduction/04-stats-and-probability/README.md)
|
||||
- ഡാറ്റയുമായി പ്രവർത്തിക്കൽ
|
||||
- [ബന്ധപ്പെട്ട ഡാറ്റാബേസുകൾ](../2-Working-With-Data/05-relational-databases/README.md)
|
||||
- [ബന്ധമില്ലാത്ത ഡാറ്റാബേസുകൾ](../2-Working-With-Data/06-non-relational/README.md)
|
||||
- [പൈത്തൺ](../2-Working-With-Data/07-python/README.md)
|
||||
- [ഡാറ്റ തയ്യാറാക്കൽ](../2-Working-With-Data/08-data-preparation/README.md)
|
||||
- ഡാറ്റാ ദൃശ്യവൽക്കരണം
|
||||
- [അളവുകൾ ദൃശ്യവൽക്കരിക്കൽ](../3-Data-Visualization/09-visualization-quantities/README.md)
|
||||
- [വിതരണങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ](../3-Data-Visualization/10-visualization-distributions/README.md)
|
||||
- [അനുപാതങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ](../3-Data-Visualization/11-visualization-proportions/README.md)
|
||||
- [ബന്ധങ്ങൾ ദൃശ്യവൽക്കരിക്കൽ](../3-Data-Visualization/12-visualization-relationships/README.md)
|
||||
- [അർത്ഥവത്തായ ദൃശ്യവൽക്കരണങ്ങൾ](../3-Data-Visualization/13-meaningful-visualizations/README.md)
|
||||
- ഡാറ്റാ സയൻസ് ജീവിതചക്രം
|
||||
- [പരിചയം](../4-Data-Science-Lifecycle/14-Introduction/README.md)
|
||||
- [വിശകലനം](../4-Data-Science-Lifecycle/15-analyzing/README.md)
|
||||
- [സംവാദം](../4-Data-Science-Lifecycle/16-communication/README.md)
|
||||
- ക്ലൗഡിൽ ഡാറ്റാ സയൻസ്
|
||||
- [പരിചയം](../5-Data-Science-In-Cloud/17-Introduction/README.md)
|
||||
- [ലോ കോഡ്](../5-Data-Science-In-Cloud/18-Low-Code/README.md)
|
||||
- [അസ്യൂർ](../5-Data-Science-In-Cloud/19-Azure/README.md)
|
||||
- വന്യജീവിതത്തിലെ ഡാറ്റാ സയൻസ്
|
||||
- [DS ഇൻ ദി വയൽഡ്](../6-Data-Science-In-Wild/README.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,151 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "9bef7fd96c8f262339933117d9b3e342",
|
||||
"translation_date": "2025-12-19T13:27:55+00:00",
|
||||
"source_file": "examples/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# തുടക്കക്കാർക്ക് അനുയോജ്യമായ ഡാറ്റാ സയൻസ് ഉദാഹരണങ്ങൾ
|
||||
|
||||
ഉദാഹരണങ്ങൾ ഡയറക്ടറിയിലേക്ക് സ്വാഗതം! ഈ ലളിതവും നന്നായി കമന്റ് ചെയ്ത ഉദാഹരണങ്ങളുടെ ശേഖരം, നിങ്ങൾ ഒരു പൂർണ്ണമായ തുടക്കക്കാരനാണെങ്കിലും, ഡാറ്റാ സയൻസിൽ തുടങ്ങാൻ സഹായിക്കുന്നതിനായി രൂപകൽപ്പന ചെയ്തതാണ്.
|
||||
|
||||
## 📚 ഇവിടെ നിങ്ങൾ കണ്ടെത്തുന്നത്
|
||||
|
||||
ഓരോ ഉദാഹരണവും സ്വയം സമ്പൂർണമാണ്, കൂടാതെ ഇതിൽ ഉൾപ്പെടുന്നു:
|
||||
- **പ്രതീകാത്മകമായ കമന്റുകൾ** ഓരോ ഘട്ടവും വിശദീകരിക്കുന്നു
|
||||
- **ലളിതവും വായിക്കാൻ എളുപ്പവുമായ കോഡ്** ഓരോ തത്വവും ഒരേസമയം പ്രദർശിപ്പിക്കുന്നു
|
||||
- **യഥാർത്ഥ ലോക സാഹചര്യങ്ങൾ** ഈ സാങ്കേതിക വിദ്യകൾ എപ്പോൾ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് മനസ്സിലാക്കാൻ സഹായിക്കുന്നു
|
||||
- **പ്രതീക്ഷിച്ച ഔട്ട്പുട്ട്** നിങ്ങൾ എന്ത് നോക്കണമെന്ന് അറിയാൻ
|
||||
|
||||
## 🚀 തുടങ്ങുന്നത്
|
||||
|
||||
### മുൻകൂട്ടി ആവശ്യമായവ
|
||||
ഈ ഉദാഹരണങ്ങൾ പ്രവർത്തിപ്പിക്കുന്നതിന് മുമ്പ്, ഉറപ്പാക്കുക:
|
||||
- Python 3.7 അല്ലെങ്കിൽ അതിനുമുകളിൽ ഇൻസ്റ്റാൾ ചെയ്തിട്ടുള്ളത്
|
||||
- Python സ്ക്രിപ്റ്റുകൾ എങ്ങനെ പ്രവർത്തിപ്പിക്കാമെന്ന് അടിസ്ഥാന അറിവ്
|
||||
|
||||
### ആവശ്യമായ ലൈബ്രറികൾ ഇൻസ്റ്റാൾ ചെയ്യൽ
|
||||
```bash
|
||||
pip install pandas numpy matplotlib
|
||||
```
|
||||
|
||||
## 📖 ഉദാഹരണങ്ങളുടെ അവലോകനം
|
||||
|
||||
### 1. ഹലോ വേൾഡ് - ഡാറ്റാ സയൻസ് ശൈലി
|
||||
**ഫയൽ:** `01_hello_world_data_science.py`
|
||||
|
||||
നിങ്ങളുടെ ആദ്യ ഡാറ്റാ സയൻസ് പ്രോഗ്രാം! പഠിക്കുക:
|
||||
- ലളിതമായ ഒരു ഡാറ്റാസെറ്റ് ലോഡ് ചെയ്യുന്നത്
|
||||
- നിങ്ങളുടെ ഡാറ്റയെക്കുറിച്ചുള്ള അടിസ്ഥാന വിവരങ്ങൾ പ്രദർശിപ്പിക്കുന്നത്
|
||||
- നിങ്ങളുടെ ആദ്യ ഡാറ്റാ സയൻസ് ഔട്ട്പുട്ട് പ്രിന്റ് ചെയ്യുന്നത്
|
||||
|
||||
പൂർണ്ണമായ തുടക്കക്കാർക്ക് അവരുടെ ആദ്യ ഡാറ്റാ സയൻസ് പ്രോഗ്രാം പ്രവർത്തനത്തിൽ കാണാൻ ഇത് അനുയോജ്യമാണ്.
|
||||
|
||||
---
|
||||
|
||||
### 2. ഡാറ്റ ലോഡ് ചെയ്യുകയും പരിശോധിക്കുകയും ചെയ്യൽ
|
||||
**ഫയൽ:** `02_loading_data.py`
|
||||
|
||||
ഡാറ്റയുമായി പ്രവർത്തിക്കുന്ന അടിസ്ഥാനങ്ങൾ പഠിക്കുക:
|
||||
- CSV ഫയലുകളിൽ നിന്ന് ഡാറ്റ വായിക്കുക
|
||||
- നിങ്ങളുടെ ഡാറ്റാസെറ്റിന്റെ ആദ്യ കുറച്ച് വരികൾ കാണുക
|
||||
- നിങ്ങളുടെ ഡാറ്റയെക്കുറിച്ചുള്ള അടിസ്ഥാന സ്ഥിതിവിവരക്കണക്കുകൾ നേടുക
|
||||
- ഡാറ്റാ തരം മനസ്സിലാക്കുക
|
||||
|
||||
ഇത് സാധാരണയായി ഏതൊരു ഡാറ്റാ സയൻസ് പ്രോജക്ടിന്റെയും ആദ്യ ഘട്ടമാണ്!
|
||||
|
||||
---
|
||||
|
||||
### 3. ലളിതമായ ഡാറ്റാ വിശകലനം
|
||||
**ഫയൽ:** `03_simple_analysis.py`
|
||||
|
||||
നിങ്ങളുടെ ആദ്യ ഡാറ്റാ വിശകലനം നടത്തുക:
|
||||
- അടിസ്ഥാന സ്ഥിതിവിവരക്കണക്കുകൾ (സാധാരണ, മധ്യക, മോഡ്) കണക്കാക്കുക
|
||||
- പരമാവധി, കുറഞ്ഞ മൂല്യങ്ങൾ കണ്ടെത്തുക
|
||||
- മൂല്യങ്ങളുടെ സംഭവനകൾ എണ്ണുക
|
||||
- നിബന്ധനകളുടെ അടിസ്ഥാനത്തിൽ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക
|
||||
|
||||
നിങ്ങളുടെ ഡാറ്റയെക്കുറിച്ചുള്ള ലളിതമായ ചോദ്യങ്ങൾക്ക് എങ്ങനെ ഉത്തരം നൽകാമെന്ന് കാണുക.
|
||||
|
||||
---
|
||||
|
||||
### 4. ഡാറ്റാ ദൃശ്യീകരണ അടിസ്ഥാനങ്ങൾ
|
||||
**ഫയൽ:** `04_basic_visualization.py`
|
||||
|
||||
നിങ്ങളുടെ ആദ്യ ദൃശ്യീകരണങ്ങൾ സൃഷ്ടിക്കുക:
|
||||
- ലളിതമായ ബാർ ചാർട്ട് നിർമ്മിക്കുക
|
||||
- ഒരു ലൈൻ പ്ലോട്ട് സൃഷ്ടിക്കുക
|
||||
- പൈ ചാർട്ട് ജനറേറ്റ് ചെയ്യുക
|
||||
- നിങ്ങളുടെ ദൃശ്യീകരണങ്ങൾ ചിത്രങ്ങളായി സേവ് ചെയ്യുക
|
||||
|
||||
നിങ്ങളുടെ കണ്ടെത്തലുകൾ ദൃശ്യമായി പ്രചരിപ്പിക്കാൻ പഠിക്കുക!
|
||||
|
||||
---
|
||||
|
||||
### 5. യഥാർത്ഥ ഡാറ്റയുമായി പ്രവർത്തിക്കൽ
|
||||
**ഫയൽ:** `05_real_world_example.py`
|
||||
|
||||
എല്ലാം ചേർത്ത് ഒരു സമ്പൂർണ ഉദാഹരണം:
|
||||
- റിപോസിറ്ററിയിൽ നിന്നുള്ള യഥാർത്ഥ ഡാറ്റ ലോഡ് ചെയ്യുക
|
||||
- ഡാറ്റ ശുദ്ധീകരിക്കുകയും തയ്യാറാക്കുകയും ചെയ്യുക
|
||||
- വിശകലനം നടത്തുക
|
||||
- അർത്ഥപൂർണമായ ദൃശ്യീകരണങ്ങൾ സൃഷ്ടിക്കുക
|
||||
- നിഗമനങ്ങൾ വരുത്തുക
|
||||
|
||||
ഈ ഉദാഹരണം ആരംഭം മുതൽ അവസാനം വരെ ഒരു സമ്പൂർണ പ്രവൃത്തി പ്രവാഹം കാണിക്കുന്നു.
|
||||
|
||||
---
|
||||
|
||||
## 🎯 ഈ ഉദാഹരണങ്ങൾ എങ്ങനെ ഉപയോഗിക്കാം
|
||||
|
||||
1. **ആരംഭത്തിൽ നിന്ന് തുടങ്ങുക**: ഉദാഹരണങ്ങൾ ബുദ്ധിമുട്ടിന്റെ ക്രമത്തിൽ നമ്പർ ചെയ്തിരിക്കുന്നു. `01_hello_world_data_science.py` മുതൽ ആരംഭിച്ച് മുന്നോട്ട് പോവുക.
|
||||
|
||||
2. **കമന്റുകൾ വായിക്കുക**: ഓരോ ഫയലിലും കോഡ് എന്ത് ചെയ്യുന്നു, എന്തുകൊണ്ട് ചെയ്യുന്നു എന്നതിന്റെ വിശദമായ കമന്റുകൾ ഉണ്ട്. അവ ശ്രദ്ധാപൂർവ്വം വായിക്കുക!
|
||||
|
||||
3. **പരീക്ഷണം നടത്തുക**: കോഡ് മാറ്റി നോക്കുക. ഒരു മൂല്യം മാറ്റിയാൽ എന്ത് സംഭവിക്കും? തെറ്റുകൾ ഉണ്ടാക്കുകയും അവ പരിഹരിക്കുകയും ചെയ്യുക - ഇതാണ് പഠന രീതി!
|
||||
|
||||
4. **കോഡ് പ്രവർത്തിപ്പിക്കുക**: ഓരോ ഉദാഹരണവും പ്രവർത്തിപ്പിച്ച് ഔട്ട്പുട്ട് ശ്രദ്ധിക്കുക. നിങ്ങൾ പ്രതീക്ഷിച്ചതുമായി താരതമ്യം ചെയ്യുക.
|
||||
|
||||
5. **അധികം വികസിപ്പിക്കുക**: ഒരു ഉദാഹരണം മനസ്സിലാക്കിയ ശേഷം, നിങ്ങളുടെ സ്വന്തം ആശയങ്ങൾ ചേർത്ത് വികസിപ്പിക്കാൻ ശ്രമിക്കുക.
|
||||
|
||||
## 💡 തുടക്കക്കാർക്ക് ഉപദേശങ്ങൾ
|
||||
|
||||
- **വേഗം പിടിക്കരുത്**: അടുത്ത ഉദാഹരണത്തിലേക്ക് പോകുന്നതിന് മുമ്പ് ഓരോ ഉദാഹരണവും മനസ്സിലാക്കാൻ സമയം എടുക്കുക
|
||||
- **കോഡ് താങ്കൾ തന്നെ ടൈപ്പ് ചെയ്യുക**: പകർത്തി പേസ്റ്റ് ചെയ്യരുത്. ടൈപ്പിംഗ് നിങ്ങളെ പഠിപ്പിക്കുകയും ഓർക്കാനും സഹായിക്കും
|
||||
- **അപരിചിതമായ ആശയങ്ങൾ അന്വേഷിക്കുക**: നിങ്ങൾക്ക് മനസ്സിലാകാത്ത എന്തെങ്കിലും കണ്ടാൽ, ഓൺലൈനിലും പ്രധാന പാഠങ്ങളിലും തിരയുക
|
||||
- **ചോദ്യങ്ങൾ ചോദിക്കുക**: സഹായം ആവശ്യമെങ്കിൽ [ചർച്ചാ ഫോറം](https://github.com/microsoft/Data-Science-For-Beginners/discussions) ൽ ചേരുക
|
||||
- **നിയമിതമായി അഭ്യാസം ചെയ്യുക**: ഒരാഴ്ചയിൽ ഒരു വലിയ സെഷൻ ചെയ്യുന്നതിന് പകരം, ദിവസവും കുറച്ച് കോഡ് ചെയ്യാൻ ശ്രമിക്കുക
|
||||
|
||||
## 🔗 അടുത്ത ഘട്ടങ്ങൾ
|
||||
|
||||
ഈ ഉദാഹരണങ്ങൾ പൂർത്തിയാക്കിയ ശേഷം, നിങ്ങൾ തയ്യാറാണ്:
|
||||
- പ്രധാന പാഠ്യപദ്ധതി പാഠങ്ങൾ പഠിക്കാൻ
|
||||
- ഓരോ പാഠം ഫോൾഡറിലെയും അസൈൻമെന്റുകൾ പരീക്ഷിക്കാൻ
|
||||
- കൂടുതൽ ആഴത്തിലുള്ള പഠനത്തിനായി Jupyter നോട്ട്ബുക്കുകൾ പരിശോധിക്കാൻ
|
||||
- നിങ്ങളുടെ സ്വന്തം ഡാറ്റാ സയൻസ് പ്രോജക്ടുകൾ സൃഷ്ടിക്കാൻ
|
||||
|
||||
## 📚 അധിക സ്രോതസുകൾ
|
||||
|
||||
- [പ്രധാന പാഠ്യപദ്ധതി](../README.md) - സമ്പൂർണ 20-പാഠ കോഴ്സ്
|
||||
- [അധ്യാപകർക്ക്](../for-teachers.md) - ഈ പാഠ്യപദ്ധതി നിങ്ങളുടെ ക്ലാസ്സിൽ ഉപയോഗിക്കുന്നത്
|
||||
- [Microsoft Learn](https://docs.microsoft.com/learn/) - സൗജന്യ ഓൺലൈൻ പഠന സ്രോതസുകൾ
|
||||
- [Python ഡോക്യുമെന്റേഷൻ](https://docs.python.org/3/) - ഔദ്യോഗിക Python റഫറൻസ്
|
||||
|
||||
## 🤝 സംഭാവനകൾ
|
||||
|
||||
ഒരു പിശക് കണ്ടെത്തിയോ പുതിയ ഒരു ഉദാഹരണത്തിന് ആശയമുണ്ടോ? ഞങ്ങൾ സംഭാവനകൾ സ്വാഗതം ചെയ്യുന്നു! ദയവായി ഞങ്ങളുടെ [സംഭാവന മാർഗ്ഗനിർദ്ദേശം](../CONTRIBUTING.md) കാണുക.
|
||||
|
||||
---
|
||||
|
||||
**സന്തോഷകരമായ പഠനം! 🎉**
|
||||
|
||||
ഓരോ വിദഗ്ധനും ഒരിക്കൽ തുടക്കക്കാരനായിരുന്നു. ഓരോ ഘട്ടവും ക്രമമായി മുന്നോട്ട് പോവുക, പിഴച്ചാലും ഭയപ്പെടേണ്ട - അവ പഠനത്തിന്റെ ഭാഗമാണ്!
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,78 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "f7440be10c17a8a9262713af3d2818a9",
|
||||
"translation_date": "2025-12-19T12:40:49+00:00",
|
||||
"source_file": "for-teachers.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
## അധ്യാപകര്ക്കായി
|
||||
|
||||
ഈ പാഠ്യപദ്ധതി നിങ്ങളുടെ ക്ലാസ്സില് ഉപയോഗിക്കണോ? ദയവായി സ്വതന്ത്രമായി ഉപയോഗിക്കൂ!
|
||||
|
||||
വാസ്തവത്തില്, GitHub Classroom ഉപയോഗിച്ച് GitHub-ലും ഇത് ഉപയോഗിക്കാം.
|
||||
|
||||
അതിനായി, ഈ റിപോ ഫോര്ക്ക് ചെയ്യുക. ഓരോ പാഠത്തിനും ഒരു റിപോ സൃഷ്ടിക്കേണ്ടതുണ്ട്, അതിനാല് ഓരോ ഫോള്ഡറും വേര്തിരിച്ച് ഒരു റിപോ ആയി മാറ്റേണ്ടതുണ്ട്. അങ്ങനെ, [GitHub Classroom](https://classroom.github.com/classrooms) ഓരോ പാഠവും വേര്തിരിച്ച് സ്വീകരിക്കാം.
|
||||
|
||||
ഈ [പൂര്ണ നിര്ദ്ദേശങ്ങള്](https://github.blog/2020-03-18-set-up-your-digital-classroom-with-github-classroom/) നിങ്ങളുടെ ക്ലാസ്സ്റൂം എങ്ങനെ സജ്ജമാക്കാമെന്ന് ഒരു ആശയം നല്കും.
|
||||
|
||||
## നിലവിലുള്ള റിപോ ഉപയോഗിക്കുന്നത്
|
||||
|
||||
GitHub Classroom ഉപയോഗിക്കാതെ ഈ റിപോ നിലവിലുള്ള രൂപത്തില് ഉപയോഗിക്കണമെങ്കില്, അത് സാധ്യമാണ്. ഏത് പാഠം ഒന്നിച്ച് പഠിക്കണമെന്ന് നിങ്ങളുടെ വിദ്യാര്ത്ഥികളുമായി സംവദിക്കേണ്ടതുണ്ട്.
|
||||
|
||||
ഓണ്ലൈന് ഫോര്മാറ്റില് (Zoom, Teams, അല്ലെങ്കില് മറ്റേതെങ്കിലും) ക്വിസുകള്ക്കായി ബ്രേക്ക്ഔട്ട് റൂമുകള് രൂപീകരിച്ച്, വിദ്യാര്ത്ഥികളെ പഠനത്തിന് തയ്യാറാക്കാന് മെന്റര് ചെയ്യാം. പിന്നീട് ക്വിസുകള്ക്കായി വിദ്യാര്ത്ഥികളെ ക്ഷണിച്ച്, ഒരു നിശ്ചിത സമയത്ത് അവരുടെ ഉത്തരം 'issues' ആയി സമര്പ്പിക്കാം. സമാനമായി അസൈന്മെന്റുകള് കൂടി, വിദ്യാര്ത്ഥികള് തുറന്നിടത്ത് സഹകരിച്ച് പ്രവര്ത്തിക്കാന് ആഗ്രഹിക്കുന്നുവെങ്കില് ചെയ്യാം.
|
||||
|
||||
കൂടുതല് സ്വകാര്യമായ ഫോര്മാറ്റ് ഇഷ്ടപ്പെടുന്നുവെങ്കില്, നിങ്ങളുടെ വിദ്യാര്ത്ഥികളെ പാഠം പാഠം ഫോര്ക്ക് ചെയ്ത് അവരുടെ സ്വന്തം GitHub റിപോകളില് സ്വകാര്യ റിപോകളായി സൃഷ്ടിച്ച് നിങ്ങള്ക്ക് ആക്സസ് നല്കാന് പറയുക. പിന്നീട് അവർ ക്വിസുകളും അസൈന്മെന്റുകളും സ്വകാര്യമായി പൂര്ത്തിയാക്കി നിങ്ങളുടെ ക്ലാസ്സ്റൂം റിപോയിലെ issues വഴി സമര്പ്പിക്കാം.
|
||||
|
||||
ഓണ്ലൈന് ക്ലാസ്സ്റൂം ഫോര്മാറ്റില് ഇത് പ്രവര്ത്തിപ്പിക്കാന് നിരവധി മാര്ഗ്ഗങ്ങളുണ്ട്. നിങ്ങള്ക്ക് ഏറ്റവും അനുയോജ്യമായത് എന്താണെന്ന് ഞങ്ങളെ അറിയിക്കുക!
|
||||
|
||||
## ഈ പാഠ്യപദ്ധതിയില് ഉള്പ്പെടുത്തിയിരിക്കുന്നത്:
|
||||
|
||||
20 പാഠങ്ങള്, 40 ക്വിസുകള്, 20 അസൈന്മെന്റുകള്. ദൃശ്യ പഠനാര്ത്ഥികള്ക്കായി പാഠങ്ങളോടൊപ്പം സ്കെച്ച്നോട്ടുകള് ഉണ്ട്. പല പാഠങ്ങളും Python-ലും R-ലും ലഭ്യമാണ്, VS Code-ല് Jupyter നോട്ട്ബുക്കുകള് ഉപയോഗിച്ച് പൂര്ത്തിയാക്കാം. ഈ ടെക് സ്റ്റാക്ക് ഉപയോഗിച്ച് ക്ലാസ്സ്റൂം എങ്ങനെ സജ്ജമാക്കാമെന്ന് കൂടുതല് അറിയാന്: https://code.visualstudio.com/docs/datascience/jupyter-notebooks.
|
||||
|
||||
എല്ലാ സ്കെച്ച്നോട്ടുകളും, വലിയ ഫോര്മാറ്റിലുള്ള പോസ്റ്ററടക്കം, [ഈ ഫോള്ഡറില്](../../sketchnotes) ഉണ്ട്.
|
||||
|
||||
[Docsify](https://docsify.js.org/#/) ഉപയോഗിച്ച് ഈ പാഠ്യപദ്ധതി സ്റ്റാന്ഡ്എലോണ്, ഓഫ്ലൈന്-ഫ്രണ്ട്ലി വെബ്സൈറ്റ് ആയി ഓടിക്കാം. നിങ്ങളുടെ ലൊക്കല് മെഷീനില് [Docsify ഇന്സ്റ്റാള്](https://docsify.js.org/#/quickstart) ചെയ്ത്, ഈ റിപോയുടെ റൂട്ട് ഫോള്ഡറില് `docsify serve` ടൈപ്പ് ചെയ്യുക. വെബ്സൈറ്റ് നിങ്ങളുടെ ലോക്കല്ഹോസ്റ്റില് പോര്ട്ട് 3000-ല് ലഭിക്കും: `localhost:3000`.
|
||||
|
||||
ഓഫ്ലൈന്-ഫ്രണ്ട്ലി പാഠ്യപദ്ധതി സ്റ്റാന്ഡ്എലോണ് വെബ് പേജായി തുറക്കും: https://localhost:3000
|
||||
|
||||
പാഠങ്ങള് 6 ഭാഗങ്ങളായി ഗ്രൂപ്പ് ചെയ്തിരിക്കുന്നു:
|
||||
|
||||
- 1: പരിചയം
|
||||
- 1: ഡാറ്റാ സയന്സ് നിർവചനം
|
||||
- 2: നൈതികത
|
||||
- 3: ഡാറ്റ നിർവചനം
|
||||
- 4: പ്രൊബബിലിറ്റി ആൻഡ് സ്റ്റാറ്റിസ്റ്റിക്സ് അവലോകനം
|
||||
- 2: ഡാറ്റയുമായി ജോലി ചെയ്യല്
|
||||
- 5: റിലേഷണല് ഡാറ്റാബേസുകള്
|
||||
- 6: നോണ്-റിലേഷണല് ഡാറ്റാബേസുകള്
|
||||
- 7: Python
|
||||
- 8: ഡാറ്റ തയ്യാറാക്കല്
|
||||
- 3: ഡാറ്റാ ദൃശ്യീകരണം
|
||||
- 9: അളവുകളുടെ ദൃശ്യീകരണം
|
||||
- 10: വിതരണങ്ങളുടെ ദൃശ്യീകരണം
|
||||
- 11: അനുപാതങ്ങളുടെ ദൃശ്യീകരണം
|
||||
- 12: ബന്ധങ്ങളുടെ ദൃശ്യീകരണം
|
||||
- 13: അര്ത്ഥവത്തായ ദൃശ്യീകരണങ്ങള്
|
||||
- 4: ഡാറ്റാ സയന്സ് ലൈഫ്സൈക്കിൾ
|
||||
- 14: പരിചയം
|
||||
- 15: വിശകലനം
|
||||
- 16: ആശയവിനിമയം
|
||||
- 5: ക്ലൗഡിലെ ഡാറ്റാ സയന്സ്
|
||||
- 17: പരിചയം
|
||||
- 18: ലോ-കോഡ് ഓപ്ഷനുകള്
|
||||
- 19: Azure
|
||||
- 6: വന്യപ്രകൃതിയിലെ ഡാറ്റാ സയന്സ്
|
||||
- 20: അവലോകനം
|
||||
|
||||
## ദയവായി നിങ്ങളുടെ അഭിപ്രായങ്ങള് നല്കുക!
|
||||
|
||||
ഈ പാഠ്യപദ്ധതി നിങ്ങളുടെയും നിങ്ങളുടെ വിദ്യാര്ത്ഥികളുടെയും ആവശ്യങ്ങള്ക്ക് അനുയോജ്യമായി പ്രവര്ത്തിക്കണമെന്ന് ഞങ്ങള് ആഗ്രഹിക്കുന്നു. ചര്ച്ചാ ബോര്ഡുകളില് നിങ്ങളുടെ അഭിപ്രായങ്ങള് നല്കുക! നിങ്ങളുടെ വിദ്യാര്ത്ഥികള്ക്കായി ചര്ച്ചാ ബോര്ഡുകളില് ക്ലാസ്സ്റൂം ഏരിയ സൃഷ്ടിക്കാന് സ്വതന്ത്രമായി ശ്രമിക്കൂ.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,141 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "e92c33ea498915a13c9aec162616db18",
|
||||
"translation_date": "2025-12-19T13:25:40+00:00",
|
||||
"source_file": "quiz-app/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
# ക്വിസുകൾ
|
||||
|
||||
ഈ ക്വിസുകൾ https://aka.ms/datascience-beginners എന്ന ഡാറ്റാ സയൻസ് പാഠ്യപദ്ധതിക്കുള്ള പ്രീ-ലക്ചർ, പോസ്റ്റ്-ലക്ചർ ക്വിസുകളാണ്
|
||||
## വിവർത്തനം ചെയ്ത ക്വിസ് സെറ്റ് ചേർക്കൽ
|
||||
|
||||
`assets/translations` ഫോൾഡറുകളിൽ പൊരുത്തപ്പെടുന്ന ക്വിസ് ഘടനകൾ സൃഷ്ടിച്ച് ക്വിസ് വിവർത്തനം ചേർക്കുക. കാനോണിക്കൽ ക്വിസുകൾ `assets/translations/en` ൽ ഉണ്ട്. ക്വിസുകൾ പല ഗ്രൂപ്പുകളായി വിഭജിച്ചിരിക്കുന്നു. ശരിയായ ക്വിസ് വിഭാഗവുമായി നമ്പറിംഗ് പൊരുത്തപ്പെടുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക. ഈ പാഠ്യപദ്ധതിയിൽ മൊത്തം 40 ക്വിസുകൾ ഉണ്ട്, എണ്ണൽ 0 മുതൽ ആരംഭിക്കുന്നു.
|
||||
|
||||
വിവർത്തനങ്ങൾ എഡിറ്റ് ചെയ്ത ശേഷം, `en` ൽ ഉള്ള കൺവെൻഷനുകൾ അനുസരിച്ച് എല്ലാ ഫയലുകളും ഇറക്കുമതി ചെയ്യാൻ വിവർത്തന ഫോൾഡറിലെ index.js ഫയൽ എഡിറ്റ് ചെയ്യുക.
|
||||
|
||||
`assets/translations` ൽ ഉള്ള `index.js` ഫയൽ പുതിയ വിവർത്തന ഫയലുകൾ ഇറക്കുമതി ചെയ്യാൻ എഡിറ്റ് ചെയ്യുക.
|
||||
|
||||
അതിനുശേഷം, ഈ ആപ്പിലെ `App.vue` ൽ ഉള്ള ഡ്രോപ്പ്ഡൗണിൽ നിങ്ങളുടെ ഭാഷ ചേർക്കുക. ലൊക്കലൈസ്ഡ് ചുരുക്കനാമം നിങ്ങളുടെ ഭാഷയുടെ ഫോൾഡർ നാമവുമായി പൊരുത്തപ്പെടണം.
|
||||
|
||||
അവസാനമായി, വിവർത്തനം ചെയ്ത പാഠങ്ങളിൽ ഉള്ള എല്ലാ ക്വിസ് ലിങ്കുകളും, അവ ഉണ്ടെങ്കിൽ, ഈ ലൊക്കലൈസേഷൻ ഒരു ക്വറി പാരാമീറ്ററായി ഉൾപ്പെടുത്താൻ എഡിറ്റ് ചെയ്യുക: ഉദാഹരണത്തിന് `?loc=fr`.
|
||||
|
||||
|
||||
|
||||
## പ്രോജക്ട് സജ്ജീകരണം
|
||||
|
||||
```
|
||||
npm install
|
||||
```
|
||||
|
||||
### വികസനത്തിനായി കോമ്പൈൽ ചെയ്ത് ഹോട്ട്-റീലോഡ് ചെയ്യുന്നു
|
||||
|
||||
```
|
||||
npm run serve
|
||||
```
|
||||
|
||||
### ഉത്പാദനത്തിനായി കോമ്പൈൽ ചെയ്ത് മിനിഫൈ ചെയ്യുന്നു
|
||||
|
||||
```
|
||||
npm run build
|
||||
```
|
||||
|
||||
### ഫയലുകൾ ലിന്റ് ചെയ്ത് ശരിയാക്കുന്നു
|
||||
|
||||
```
|
||||
npm run lint
|
||||
```
|
||||
|
||||
### കോൺഫിഗറേഷൻ ഇഷ്ടാനുസൃതമാക്കുക
|
||||
|
||||
കാണുക [Configuration Reference](https://cli.vuejs.org/config/) .
|
||||
|
||||
ക്രെഡിറ്റുകൾ: ഈ ക്വിസ് ആപ്പിന്റെ ഒറിജിനൽ വേർഷനിന് നന്ദി: https://github.com/arpan45/simple-quiz-vue
|
||||
|
||||
## Azure-ലേക്ക് ഡിപ്ലോയ് ചെയ്യൽ
|
||||
|
||||
തുടങ്ങാൻ സഹായിക്കുന്ന ഘട്ടം-ഘട്ടം ഗൈഡ് ഇവിടെ:
|
||||
|
||||
1. GitHub റിപോസിറ്ററി ഫോർക്ക് ചെയ്യുക
|
||||
നിങ്ങളുടെ സ്റ്റാറ്റിക് വെബ് ആപ്പ് കോഡ് നിങ്ങളുടെ GitHub റിപോസിറ്ററിയിൽ ഉണ്ടെന്ന് ഉറപ്പാക്കുക. ഈ റിപോസിറ്ററി ഫോർക്ക് ചെയ്യുക.
|
||||
|
||||
2. Azure സ്റ്റാറ്റിക് വെബ് ആപ്പ് സൃഷ്ടിക്കുക
|
||||
- [Azure അക്കൗണ്ട്](http://azure.microsoft.com) സൃഷ്ടിക്കുക
|
||||
- [Azure പോർട്ടൽ](https://portal.azure.com) ൽ പോകുക
|
||||
- “Create a resource” ക്ലിക്ക് ചെയ്ത് “Static Web App” തിരയുക.
|
||||
- “Create” ക്ലിക്ക് ചെയ്യുക.
|
||||
|
||||
3. സ്റ്റാറ്റിക് വെബ് ആപ്പ് കോൺഫിഗർ ചെയ്യുക
|
||||
- അടിസ്ഥാനങ്ങൾ: സബ്സ്ക്രിപ്ഷൻ: നിങ്ങളുടെ Azure സബ്സ്ക്രിപ്ഷൻ തിരഞ്ഞെടുക്കുക.
|
||||
- റിസോഴ്സ് ഗ്രൂപ്പ്: പുതിയ റിസോഴ്സ് ഗ്രൂപ്പ് സൃഷ്ടിക്കുക അല്ലെങ്കിൽ നിലവിലുള്ളത് ഉപയോഗിക്കുക.
|
||||
- പേര്: നിങ്ങളുടെ സ്റ്റാറ്റിക് വെബ് ആപ്പിന് ഒരു പേര് നൽകുക.
|
||||
- പ്രദേശം: നിങ്ങളുടെ ഉപയോക്താക്കൾക്ക് ഏറ്റവും അടുത്ത പ്രദേശം തിരഞ്ഞെടുക്കുക.
|
||||
|
||||
- #### ഡിപ്ലോയ്മെന്റ് വിശദാംശങ്ങൾ:
|
||||
- ഉറവിടം: “GitHub” തിരഞ്ഞെടുക്കുക.
|
||||
- GitHub അക്കൗണ്ട്: Azure-ന് നിങ്ങളുടെ GitHub അക്കൗണ്ടിൽ പ്രവേശനം അനുവദിക്കുക.
|
||||
- ഓർഗനൈസേഷൻ: നിങ്ങളുടെ GitHub ഓർഗനൈസേഷൻ തിരഞ്ഞെടുക്കുക.
|
||||
- റിപോസിറ്ററി: നിങ്ങളുടെ സ്റ്റാറ്റിക് വെബ് ആപ്പ് ഉള്ള റിപോസിറ്ററി തിരഞ്ഞെടുക്കുക.
|
||||
- ബ്രാഞ്ച്: ഡിപ്ലോയ് ചെയ്യാൻ ആഗ്രഹിക്കുന്ന ബ്രാഞ്ച് തിരഞ്ഞെടുക്കുക.
|
||||
|
||||
- #### ബിൽഡ് വിശദാംശങ്ങൾ:
|
||||
- ബിൽഡ് പ്രീസെറ്റുകൾ: നിങ്ങളുടെ ആപ്പ് നിർമ്മിച്ച ഫ്രെയിംവർക്ക് തിരഞ്ഞെടുക്കുക (ഉദാ: React, Angular, Vue, മുതലായവ).
|
||||
- ആപ്പ് സ്ഥലം: നിങ്ങളുടെ ആപ്പ് കോഡ് ഉള്ള ഫോൾഡർ വ്യക്തമാക്കുക (ഉദാ: റൂട്ട് ആണെങ്കിൽ /).
|
||||
- API സ്ഥലം: API ഉണ്ടെങ്കിൽ, അതിന്റെ സ്ഥലം വ്യക്തമാക്കുക (ഐച്ഛികം).
|
||||
- ഔട്ട്പുട്ട് സ്ഥലം: ബിൽഡ് ഔട്ട്പുട്ട് സൃഷ്ടിക്കുന്ന ഫോൾഡർ വ്യക്തമാക്കുക (ഉദാ: build അല്ലെങ്കിൽ dist).
|
||||
|
||||
4. അവലോകനം ചെയ്ത് സൃഷ്ടിക്കുക
|
||||
നിങ്ങളുടെ ക്രമീകരണങ്ങൾ അവലോകനം ചെയ്ത് “Create” ക്ലിക്ക് ചെയ്യുക. Azure ആവശ്യമായ റിസോഴ്സുകൾ സജ്ജമാക്കി നിങ്ങളുടെ റിപോസിറ്ററിയിൽ GitHub Actions വർക്ക്ഫ്ലോ സൃഷ്ടിക്കും.
|
||||
|
||||
5. GitHub Actions വർക്ക്ഫ്ലോ
|
||||
Azure നിങ്ങളുടെ റിപോസിറ്ററിയിൽ (.github/workflows/azure-static-web-apps-<name>.yml) GitHub Actions വർക്ക്ഫ്ലോ ഫയൽ സ്വയം സൃഷ്ടിക്കും. ഈ വർക്ക്ഫ്ലോ ബിൽഡ്, ഡിപ്ലോയ്മെന്റ് പ്രക്രിയ കൈകാര്യം ചെയ്യും.
|
||||
|
||||
6. ഡിപ്ലോയ്മെന്റ് നിരീക്ഷിക്കുക
|
||||
നിങ്ങളുടെ GitHub റിപോസിറ്ററിയിലെ “Actions” ടാബിലേക്ക് പോകുക.
|
||||
ഒരു വർക്ക്ഫ്ലോ പ്രവർത്തിക്കുന്നതായി കാണണം. ഈ വർക്ക്ഫ്ലോ നിങ്ങളുടെ സ്റ്റാറ്റിക് വെബ് ആപ്പ് Azure-ലേക്ക് ബിൽഡ് ചെയ്ത് ഡിപ്ലോയ് ചെയ്യും.
|
||||
വർക്ക്ഫ്ലോ പൂർത്തിയായാൽ, നിങ്ങളുടെ ആപ്പ് നൽകിയ Azure URL-ൽ ലൈവ് ആയിരിക്കും.
|
||||
|
||||
### ഉദാഹരണ വർക്ക്ഫ്ലോ ഫയൽ
|
||||
|
||||
GitHub Actions വർക്ക്ഫ്ലോ ഫയൽ എങ്ങനെ കാണാമെന്ന് ഉദാഹരണം:
|
||||
name: Azure Static Web Apps CI/CD
|
||||
```
|
||||
on:
|
||||
push:
|
||||
branches:
|
||||
- main
|
||||
pull_request:
|
||||
types: [opened, synchronize, reopened, closed]
|
||||
branches:
|
||||
- main
|
||||
|
||||
jobs:
|
||||
build_and_deploy_job:
|
||||
runs-on: ubuntu-latest
|
||||
name: Build and Deploy Job
|
||||
steps:
|
||||
- uses: actions/checkout@v2
|
||||
- name: Build And Deploy
|
||||
id: builddeploy
|
||||
uses: Azure/static-web-apps-deploy@v1
|
||||
with:
|
||||
azure_static_web_apps_api_token: ${{ secrets.AZURE_STATIC_WEB_APPS_API_TOKEN }}
|
||||
repo_token: ${{ secrets.GITHUB_TOKEN }}
|
||||
action: "upload"
|
||||
app_location: "quiz-app" # App source code path
|
||||
api_location: ""API source code path optional
|
||||
output_location: "dist" #Built app content directory - optional
|
||||
```
|
||||
|
||||
### അധിക സ്രോതസുകൾ
|
||||
- [Azure Static Web Apps ഡോക്യുമെന്റേഷൻ](https://learn.microsoft.com/azure/static-web-apps/getting-started)
|
||||
- [GitHub Actions ഡോക്യുമെന്റേഷൻ](https://docs.github.com/actions/use-cases-and-examples/deploying/deploying-to-azure-static-web-app)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനത്തിന്റെ ഉപയോഗത്തിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,23 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "3a848466cb63aff1a93411affb152c2a",
|
||||
"translation_date": "2025-12-19T13:31:46+00:00",
|
||||
"source_file": "sketchnotes/README.md",
|
||||
"language_code": "ml"
|
||||
}
|
||||
-->
|
||||
എല്ലാ സ്കെച്ച്നോട്ടുകളും ഇവിടെ കണ്ടെത്തുക!
|
||||
|
||||
## ക്രെഡിറ്റുകൾ
|
||||
|
||||
നിത്യ നരസിംഹൻ, കലാകാരൻ
|
||||
|
||||

|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**അസൂയാ**:
|
||||
ഈ രേഖ AI വിവർത്തന സേവനം [Co-op Translator](https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖയാണ് പ്രാമാണികമായ ഉറവിടം എന്ന് പരിഗണിക്കേണ്ടതാണ്. നിർണായകമായ വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,178 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "43212cc1ac137b7bb1dcfb37ca06b0f4",
|
||||
"translation_date": "2025-12-19T13:36:58+00:00",
|
||||
"source_file": "1-Introduction/01-defining-data-science/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# డేటా సైన్స్ నిర్వచనం
|
||||
|
||||
|  ](../../sketchnotes/01-Definitions.png) |
|
||||
| :----------------------------------------------------------------------------------------------------: |
|
||||
| డేటా సైన్స్ నిర్వచనం - _స్కెచ్ నోట్ [@nitya](https://twitter.com/nitya) ద్వారా_ |
|
||||
|
||||
---
|
||||
|
||||
[](https://youtu.be/beZ7Mb_oz9I)
|
||||
|
||||
## [పూర్వ-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/0)
|
||||
|
||||
## డేటా అంటే ఏమిటి?
|
||||
మన రోజువారీ జీవితంలో, మనం ఎప్పుడూ డేటాతో చుట్టబడి ఉంటాము. మీరు ఇప్పుడు చదువుతున్న వచనం డేటానే. మీ స్మార్ట్ఫోన్లో మీ స్నేహితుల ఫోన్ నంబర్ల జాబితా డేటా, అలాగే మీ గడియారంలో ప్రదర్శించబడుతున్న ప్రస్తుత సమయం కూడా డేటానే. మనుషులుగా, మనం సహజంగానే డేటాతో పనిచేస్తాము, మన దగ్గర ఉన్న డబ్బును లెక్కించడం లేదా స్నేహితులకు లేఖలు రాయడం ద్వారా.
|
||||
|
||||
కానీ, కంప్యూటర్లు సృష్టించబడిన తర్వాత డేటా చాలా ముఖ్యమైంది అయింది. కంప్యూటర్ల ప్రాథమిక పాత్ర గణనలను నిర్వహించడం, కానీ అవి ఆపరేట్ చేయడానికి డేటా అవసరం. కాబట్టి, మనం కంప్యూటర్లు డేటాను ఎలా నిల్వ చేస్తాయో, ప్రాసెస్ చేస్తాయో అర్థం చేసుకోవాలి.
|
||||
|
||||
ఇంటర్నెట్ ఉద్భవంతో, కంప్యూటర్ల పాత్ర డేటా నిర్వహణ పరికరాలుగా పెరిగింది. మీరు ఆలోచిస్తే, ఇప్పుడు మనం కంప్యూటర్లను గణనలకు కాకుండా డేటా ప్రాసెసింగ్ మరియు కమ్యూనికేషన్ కోసం ఎక్కువగా ఉపయోగిస్తున్నాము. మనం స్నేహితునికి ఇమెయిల్ రాస్తున్నప్పుడు లేదా ఇంటర్నెట్లో సమాచారాన్ని శోధిస్తున్నప్పుడు - మనం అసలు డేటాను సృష్టించడం, నిల్వ చేయడం, ప్రసారం చేయడం మరియు మార్చడం చేస్తున్నాము.
|
||||
> మీరు చివరిసారిగా కంప్యూటర్లను వాస్తవంగా ఏదైనా గణన చేయడానికి ఉపయోగించినప్పుడు గుర్తు చేసుకోగలరా?
|
||||
|
||||
## డేటా సైన్స్ అంటే ఏమిటి?
|
||||
|
||||
[వికీపీడియా](https://en.wikipedia.org/wiki/Data_science) ప్రకారం, **డేటా సైన్స్** అనేది *సంఘటిత మరియు అసంఘటిత డేటా నుండి జ్ఞానం మరియు అవగాహనలను పొందడానికి శాస్త్రీయ పద్ధతులను ఉపయోగించే శాస్త్రీయ రంగం, మరియు విస్తృత అనువర్తన రంగాలలో డేటా నుండి జ్ఞానం మరియు అమలు చేయదగిన అవగాహనలను వర్తింపజేసే రంగం*గా నిర్వచించబడింది.
|
||||
|
||||
ఈ నిర్వచనం డేటా సైన్స్ యొక్క క్రింది ముఖ్యాంశాలను హైలైట్ చేస్తుంది:
|
||||
|
||||
* డేటా సైన్స్ యొక్క ప్రధాన లక్ష్యం డేటా నుండి **జ్ఞానం పొందడం**, అంటే - డేటాను **అర్థం చేసుకోవడం**, కొన్ని దాగి ఉన్న సంబంధాలను కనుగొనడం మరియు ఒక **మోడల్** నిర్మించడం.
|
||||
* డేటా సైన్స్ **శాస్త్రీయ పద్ధతులను** ఉపయోగిస్తుంది, ఉదాహరణకు సంభావ్యత మరియు గణాంకాలు. వాస్తవానికి, *డేటా సైన్స్* అనే పదం మొదట ప్రవేశపెట్టినప్పుడు, కొంతమంది డేటా సైన్స్ గణాంకాలకి కొత్త ఫ్యాన్సీ పేరు మాత్రమే అని వాదించారు. ఇప్పుడు ఈ రంగం చాలా విస్తృతమైందని స్పష్టమైంది.
|
||||
* పొందిన జ్ఞానం కొన్ని **అమలు చేయదగిన అవగాహనలను** ఉత్పత్తి చేయడానికి ఉపయోగించాలి, అంటే మీరు వాస్తవ వ్యాపార పరిస్థితులకు వర్తింపజేయగల ప్రాక్టికల్ అవగాహన.
|
||||
* మనం **సంఘటిత** మరియు **అసంఘటిత** డేటా రెండింటిపై కూడా ఆపరేట్ చేయగలగాలి. కోర్సులో తరువాత డేటా రకాల గురించి మళ్ళీ చర్చిస్తాము.
|
||||
* **అనువర్తన రంగం** ఒక ముఖ్యమైన భావన, మరియు డేటా శాస్త్రవేత్తలు తరచుగా సమస్య రంగంలో కనీసం కొంత నైపుణ్యం కలిగి ఉండాలి, ఉదాహరణకు: ఫైనాన్స్, వైద్యం, మార్కెటింగ్ మొదలైనవి.
|
||||
|
||||
> డేటా సైన్స్ యొక్క మరో ముఖ్యాంశం ఏమిటంటే, ఇది డేటాను కంప్యూటర్ల ద్వారా ఎలా సేకరించవచ్చో, నిల్వ చేయవచ్చో, ఆపరేట్ చేయవచ్చో అధ్యయనం చేస్తుంది. గణాంకాలు మనకు గణిత శాస్త్రపు ఆధారాలను ఇస్తే, డేటా సైన్స్ గణిత సూత్రాలను వాస్తవంగా డేటా నుండి అవగాహనలను పొందడానికి వర్తింపజేస్తుంది.
|
||||
|
||||
డేటా సైన్స్ను చూడటానికి ఒక మార్గం ([జిమ్ గ్రే](https://en.wikipedia.org/wiki/Jim_Gray_(computer_scientist))కి అప్పగించబడింది) ఇది శాస్త్రం యొక్క వేరే ఒక పారడైమ్గా పరిగణించవచ్చు:
|
||||
* **ప్రయోగాత్మక** (Empirical), ఇందులో మనం ఎక్కువగా పరిశీలనలు మరియు ప్రయోగాల ఫలితాలపై ఆధారపడతాము
|
||||
* **సిద్ధాంతాత్మక** (Theoretical), ఇక్కడ కొత్త భావనలు ఉన్న శాస్త్రీయ జ్ఞానంలో నుండి ఉద్భవిస్తాయి
|
||||
* **గణనాత్మక** (Computational), ఇక్కడ మనం కొన్ని గణనాత్మక ప్రయోగాల ఆధారంగా కొత్త సూత్రాలను కనుగొంటాము
|
||||
* **డేటా-ఆధారిత** (Data-Driven), డేటాలో సంబంధాలు మరియు నమూనాలను కనుగొనడంపై ఆధారపడి ఉంటుంది
|
||||
|
||||
## ఇతర సంబంధిత రంగాలు
|
||||
|
||||
డేటా విస్తృతంగా ఉండటంతో, డేటా సైన్స్ కూడా విస్తృత రంగం, అనేక ఇతర శాస్త్రాలను స్పర్శిస్తుంది.
|
||||
|
||||
<dl>
|
||||
<dt>డేటాబేసులు</dt>
|
||||
<dd>
|
||||
ముఖ్యమైన పరిగణన ఏమిటంటే డేటాను <b>ఎలా నిల్వ చేయాలి</b>, అంటే వేగంగా ప్రాసెస్ చేయడానికి ఎలా నిర్మించాలి. వివిధ రకాల డేటాబేసులు ఉన్నాయి, అవి సంఘటిత మరియు అసంఘటిత డేటాను నిల్వ చేస్తాయి, వాటిని <a href="../../2-Working-With-Data/README.md">మన కోర్సులో పరిశీలిస్తాము</a>.
|
||||
</dd>
|
||||
<dt>బిగ్ డేటా</dt>
|
||||
<dd>
|
||||
చాలా పెద్ద పరిమాణంలో సాదారణ నిర్మాణంతో ఉన్న డేటాను నిల్వ చేసి ప్రాసెస్ చేయాల్సి వస్తుంది. కంప్యూటర్ క్లస్టర్లో పంపిణీ చేయబడిన విధంగా ఆ డేటాను నిల్వ చేయడానికి మరియు సమర్థవంతంగా ప్రాసెస్ చేయడానికి ప్రత్యేక పద్ధతులు మరియు సాధనాలు ఉన్నాయి.
|
||||
</dd>
|
||||
<dt>మిషన్ లెర్నింగ్</dt>
|
||||
<dd>
|
||||
డేటాను అర్థం చేసుకోవడానికి ఒక మార్గం అనేది కావలసిన ఫలితాన్ని అంచనా వేయగలిగే <b>మోడల్ నిర్మించడం</b>. డేటా నుండి మోడల్స్ అభివృద్ధి చేయడం <b>మిషన్ లెర్నింగ్</b> అని పిలవబడుతుంది. దీని గురించి మరింత తెలుసుకోవడానికి మన <a href="https://aka.ms/ml-beginners">Machine Learning for Beginners</a> పాఠ్యాంశాన్ని చూడవచ్చు.
|
||||
</dd>
|
||||
<dt>కృత్రిమ మేధస్సు</dt>
|
||||
<dd>
|
||||
మిషన్ లెర్నింగ్ యొక్క ఒక విభాగం అయిన కృత్రిమ మేధస్సు (AI) కూడా డేటాపై ఆధారపడి ఉంటుంది, మరియు ఇది మానవ ఆలోచనా ప్రక్రియలను అనుకరించే అధిక సంక్లిష్టత మోడల్స్ నిర్మించడంలో నిమగ్నమవుతుంది. AI పద్ధతులు తరచుగా అసంఘటిత డేటాను (ఉదా: సహజ భాష) సంఘటిత అవగాహనలుగా మార్చడానికి సహాయపడతాయి.
|
||||
</dd>
|
||||
<dt>విజువలైజేషన్</dt>
|
||||
<dd>
|
||||
చాలా పెద్ద పరిమాణంలో ఉన్న డేటా మనుషులకు అర్థం కాకపోవచ్చు, కానీ ఆ డేటాను ఉపయోగించి ఉపయోగకరమైన విజువలైజేషన్లు సృష్టించినప్పుడు, మనం డేటాను బాగా అర్థం చేసుకుని కొన్ని తర్కాలను తీసుకోవచ్చు. కాబట్టి, సమాచారాన్ని విజువలైజ్ చేయడానికి అనేక మార్గాలను తెలుసుకోవడం ముఖ్యం - ఇది మన కోర్సు <a href="../../3-Data-Visualization/README.md">మూడు సెక్షన్</a>లో కవర్ చేస్తాము. సంబంధిత రంగాలు <b>ఇన్ఫోగ్రాఫిక్స్</b> మరియు సాధారణంగా <b>హ్యూమన్-కంప్యూటర్ ఇంటరాక్షన్</b> కూడా ఉన్నాయి.
|
||||
</dd>
|
||||
</dl>
|
||||
|
||||
## డేటా రకాలు
|
||||
|
||||
మనం ఇప్పటికే చెప్పినట్లుగా, డేటా ఎక్కడా ఉంటుంది. మనం దాన్ని సరైన విధంగా సేకరించాలి! **సంఘటిత** మరియు **అసంఘటిత** డేటాను వేరుచేయడం ఉపయోగకరం. మొదటిది సాధారణంగా బాగా నిర్మించబడిన రూపంలో ఉంటుంది, తరచుగా ఒక పట్టిక లేదా పలు పట్టికల రూపంలో, మరొకటి కేవలం ఫైళ్ల సేకరణ మాత్రమే. కొన్నిసార్లు మనం **అర్ధ-సంఘటిత** డేటా గురించి కూడా మాట్లాడవచ్చు, దీనికి కొంత నిర్మాణం ఉంటుంది కానీ అది చాలా మారవచ్చు.
|
||||
|
||||
| సంఘటిత | అర్ధ-సంఘటిత | అసంఘటిత |
|
||||
| ---------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------- | --------------------------------------- |
|
||||
| వ్యక్తుల ఫోన్ నంబర్ల జాబితా | లింకులతో ఉన్న వికీపీడియా పేజీలు | ఎన్సైక్లోపిడియా బ్రిటానికా వచనం |
|
||||
| గత 20 సంవత్సరాల పాటు ప్రతి నిమిషం భవనం లోని అన్ని గదుల ఉష్ణోగ్రత | రచయితలు, ప్రచురణ తేదీ, సారాంశంతో JSON ఫార్మాట్లో శాస్త్రీయ పత్రాల సేకరణ | కార్పొరేట్ డాక్యుమెంట్లతో ఫైల్ షేర్ |
|
||||
| భవనంలో ప్రవేశించే అన్ని వ్యక్తుల వయస్సు మరియు లింగం డేటా | ఇంటర్నెట్ పేజీలు | పర్యవేక్షణ కెమెరా నుండి రా వీడియో ఫీడ్ |
|
||||
|
||||
## డేటా ఎక్కడ నుండి పొందాలి
|
||||
|
||||
డేటా పొందడానికి అనేక సాధ్యమైన మూలాలు ఉన్నాయి, వాటన్నింటినీ జాబితా చేయడం అసాధ్యం! అయినప్పటికీ, మీరు డేటా పొందగల సాధారణ ప్రదేశాలను కొన్ని చెప్పుకుందాం:
|
||||
|
||||
* **సంఘటిత**
|
||||
- **ఇంటర్నెట్ ఆఫ్ థింగ్స్** (IoT), ఉష్ణోగ్రత లేదా ఒత్తిడి సెన్సార్ల వంటి వివిధ సెన్సార్ల నుండి డేటా సహా, చాలా ఉపయోగకరమైన డేటాను అందిస్తుంది. ఉదాహరణకు, ఒక కార్యాలయ భవనం IoT సెన్సార్లతో సజ్జమైతే, మనం ఆటోమేటిక్గా వేడి మరియు లైటింగ్ను నియంత్రించి ఖర్చులను తగ్గించవచ్చు.
|
||||
- **సర్వేలు** వినియోగదారులు కొనుగోలు తర్వాత లేదా వెబ్ సైట్ సందర్శించిన తర్వాత పూర్తి చేయమని అడిగే ప్రశ్నావళి.
|
||||
- **ప్రవర్తన విశ్లేషణ** ఉదాహరణకు, వినియోగదారు ఒక సైట్ లో ఎంత లోతుగా వెళ్తున్నాడో, మరియు సైట్ నుండి బయటకు వెళ్లడానికి సాధారణ కారణం ఏమిటో అర్థం చేసుకోవడంలో సహాయపడుతుంది.
|
||||
* **అసంఘటిత**
|
||||
- **వచనాలు** ఒక సంపూర్ణ **భావోద్వేగ స్కోరు** లేదా కీలకపదాలు మరియు సారాంశాన్ని తీసివేయడం వంటి అవగాహనల సమృద్ధి మూలం కావచ్చు.
|
||||
- **చిత్రాలు** లేదా **వీడియో**. పర్యవేక్షణ కెమెరా నుండి వీడియో రోడ్డుపై ట్రాఫిక్ అంచనా వేయడానికి మరియు ట్రాఫిక్ జామ్ల గురించి ప్రజలకు సమాచారం ఇవ్వడానికి ఉపయోగించవచ్చు.
|
||||
- వెబ్ సర్వర్ **లాగ్స్** మన సైట్ లో ఏ పేజీలు ఎక్కువగా సందర్శించబడుతున్నాయో, మరియు ఎంతసేపు ఉంటున్నారో అర్థం చేసుకోవడానికి ఉపయోగించవచ్చు.
|
||||
* అర్ధ-సంఘటిత
|
||||
- **సోషల్ నెట్వర్క్** గ్రాఫ్లు వినియోగదారుల వ్యక్తిత్వాలు మరియు సమాచారాన్ని వ్యాప్తి చేయడంలో సామర్థ్యం గురించి మంచి డేటా మూలాలు కావచ్చు.
|
||||
- పార్టీ నుండి ఫోటోలు ఉన్నప్పుడు, మనం ఒకరితో ఒకరు ఫోటోలు తీసుకునే వ్యక్తుల గ్రాఫ్ నిర్మించి **గ్రూప్ డైనమిక్స్** డేటాను తీసివేయవచ్చు.
|
||||
|
||||
వివిధ డేటా మూలాలను తెలుసుకోవడం ద్వారా, మీరు వివిధ పరిస్థితుల గురించి ఆలోచించి, డేటా సైన్స్ సాంకేతికతలను వర్తింపజేసి పరిస్థితిని మెరుగుపరచడానికి ప్రయత్నించవచ్చు.
|
||||
|
||||
## డేటాతో మీరు ఏమి చేయగలరు
|
||||
|
||||
డేటా సైన్స్లో, మనం డేటా ప్రయాణం క్రింది దశలపై దృష్టి పెడతాము:
|
||||
|
||||
<dl>
|
||||
<dt>1) డేటా సేకరణ</dt>
|
||||
<dd>
|
||||
మొదటి దశ డేటాను సేకరించడం. చాలా సందర్భాల్లో ఇది సులభమైన ప్రక్రియ కావచ్చు, ఉదాహరణకు వెబ్ అప్లికేషన్ నుండి డేటా డేటాబేస్కు వస్తుంది, కానీ కొన్నిసార్లు ప్రత్యేక సాంకేతికతలు ఉపయోగించాల్సి ఉంటుంది. ఉదాహరణకు, IoT సెన్సార్ల నుండి డేటా అధికంగా ఉండవచ్చు, అందువల్ల IoT హబ్ వంటి బఫరింగ్ ఎండ్పాయింట్లను ఉపయోగించి అన్ని డేటాను సేకరించి తర్వాత ప్రాసెస్ చేయడం మంచి పద్ధతి.
|
||||
</dd>
|
||||
<dt>2) డేటా నిల్వ</dt>
|
||||
<dd>
|
||||
డేటాను నిల్వ చేయడం సవాలు కావచ్చు, ముఖ్యంగా బిగ్ డేటా గురించి మాట్లాడుతున్నప్పుడు. డేటాను ఎలా నిల్వ చేయాలో నిర్ణయించేటప్పుడు, భవిష్యత్తులో మీరు డేటాను ఎలా క్వెరీ చేయాలనుకుంటున్నారో ముందుగా ఊహించడం మంచిది. డేటాను నిల్వ చేసే కొన్ని మార్గాలు ఉన్నాయి:
|
||||
<ul>
|
||||
<li>ఒక రిలేషనల్ డేటాబేస్ పట్టికల సేకరణను నిల్వ చేస్తుంది, మరియు వాటిని క్వెరీ చేయడానికి SQL అనే ప్రత్యేక భాషను ఉపయోగిస్తుంది. సాధారణంగా, పట్టికలు వివిధ గ్రూపులుగా, స్కీమాలుగా పిలవబడతాయి. చాలా సందర్భాల్లో డేటాను అసలు రూపం నుండి స్కీమాకు సరిపడేలా మార్చాల్సి ఉంటుంది.</li>
|
||||
<li><a href="https://en.wikipedia.org/wiki/NoSQL">NoSQL</a> డేటాబేస్, ఉదాహరణకు <a href="https://azure.microsoft.com/services/cosmos-db/?WT.mc_id=academic-77958-bethanycheum">CosmosDB</a>, డేటాపై స్కీమాలను అమలు చేయదు, మరియు మరింత సంక్లిష్టమైన డేటాను నిల్వ చేయడానికి అనుమతిస్తుంది, ఉదాహరణకు, హైరార్కికల్ JSON డాక్యుమెంట్లు లేదా గ్రాఫ్లు. అయితే, NoSQL డేటాబేసులకు SQL లాంటి సమృద్ధి క్వెరీ సామర్థ్యాలు లేవు, మరియు రిఫరెన్షియల్ ఇంటిగ్రిటీని అమలు చేయలేవు, అంటే పట్టికల నిర్మాణం మరియు పట్టికల మధ్య సంబంధాలను నియంత్రించే నియమాలు.</li>
|
||||
<li><a href="https://en.wikipedia.org/wiki/Data_lake">డేటా లేక్</a> నిల్వ అనేది పెద్ద పరిమాణంలో ఉన్న రా, అసంఘటిత డేటా సేకరణ కోసం ఉపయోగిస్తారు. డేటా లేక్స్ తరచుగా బిగ్ డేటాతో ఉపయోగిస్తారు, అందులో అన్ని డేటా ఒకే యంత్రంలో సరిపోదు, కాబట్టి క్లస్టర్ సర్వర్ల ద్వారా నిల్వ చేసి ప్రాసెస్ చేయాలి. <a href="https://en.wikipedia.org/wiki/Apache_Parquet">పార్కెట్</a> అనేది బిగ్ డేటాతో తరచుగా ఉపయోగించే డేటా ఫార్మాట్.</li>
|
||||
</ul>
|
||||
</dd>
|
||||
<dt>3) డేటా ప్రాసెసింగ్</dt>
|
||||
<dd>
|
||||
ఇది డేటా ప్రయాణంలో అత్యంత ఆసక్తికరమైన భాగం, ఇది డేటాను అసలు రూపం నుండి విజువలైజేషన్/మోడల్ శిక్షణకు ఉపయోగించే రూపంలోకి మార్చడం. వచనం లేదా చిత్రాల వంటి అసంఘటిత డేటాతో వ్యవహరించేటప్పుడు, మనం కొంత AI సాంకేతికతలను ఉపయోగించి డేటా నుండి <b>ఫీచర్లు</b> తీసివేయవచ్చు, తద్వారా దాన్ని సంఘటిత రూపంలోకి మార్చవచ్చు.
|
||||
</dd>
|
||||
<dt>4) విజువలైజేషన్ / మానవ అవగాహన</dt>
|
||||
<dd>
|
||||
చాలాసార్లు, డేటాను అర్థం చేసుకోవడానికి, మనం దాన్ని విజువలైజ్ చేయాలి. మన టూల్బాక్స్లో అనేక విజువలైజేషన్ పద్ధతులు ఉండటం వల్ల, సరైన దృశ్యాన్ని కనుగొని అవగాహన పొందవచ్చు. తరచుగా, డేటా శాస్త్రవేత్త డేటాతో "ఆడుకుంటూ", దాన్ని ఎన్నో సార్లు విజువలైజ్ చేసి సంబంధాలను వెతుకుతాడు. అలాగే, మనం గణాంక పద్ధతులను ఉపయోగించి ఒక హైపోథసిస్ను పరీక్షించవచ్చు లేదా డేటా భాగాల మధ్య సంబంధాన్ని నిరూపించవచ్చు.
|
||||
</dd>
|
||||
<dt>5) అంచనా మోడల్ శిక్షణ</dt>
|
||||
<dd>
|
||||
డేటా సైన్స్ యొక్క తుది లక్ష్యం డేటా ఆధారంగా నిర్ణయాలు తీసుకోవడం కావడంతో, మనం <a href="http://github.com/microsoft/ml-for-beginners">మిషన్ లెర్నింగ్</a> సాంకేతికతలను ఉపయోగించి అంచనా మోడల్ నిర్మించవచ్చు. తరువాత, ఈ మోడల్ను ఉపయోగించి సమాన నిర్మాణాలున్న కొత్త డేటా సెట్లపై అంచనాలు చేయవచ్చు.
|
||||
</dd>
|
||||
</dl>
|
||||
|
||||
తప్పకుండా, వాస్తవ డేటాపై ఆధారపడి, కొన్ని దశలు లేకపోవచ్చు (ఉదా: మనకు ఇప్పటికే డేటా డేటాబేస్లో ఉన్నప్పుడు, లేదా మోడల్ శిక్షణ అవసరం లేకపోతే), లేదా కొన్ని దశలు పలు సార్లు పునరావృతమవ్వచ్చు (ఉదా: డేటా ప్రాసెసింగ్).
|
||||
|
||||
## డిజిటలైజేషన్ మరియు డిజిటల్ ట్రాన్స్ఫర్మేషన్
|
||||
|
||||
గత దశాబ్దంలో, అనేక వ్యాపారాలు వ్యాపార నిర్ణయాలు తీసుకునేటప్పుడు డేటా ప్రాముఖ్యతను అర్థం చేసుకున్నాయి. వ్యాపారాన్ని నడిపించడానికి డేటా సైన్స్ సూత్రాలను వర్తింపజేయడానికి, మొదట కొంత డేటాను సేకరించాలి, అంటే వ్యాపార ప్రక్రియలను డిజిటల్ రూపంలోకి మార్చాలి. దీనిని **డిజిటలైజేషన్** అంటారు. ఈ డేటాపై డేటా సైన్స్ సాంకేతికతలను వర్తింపజేసి నిర్ణయాలను మార్గనిర్దేశం చేయడం ద్వారా ఉత్పాదకతలో గణనీయమైన పెరుగుదల (లేదా వ్యాపార మార్పు) సాధించవచ్చు, దీనిని **డిజిటల్ ట్రాన్స్ఫర్మేషన్** అంటారు.
|
||||
|
||||
ఒక ఉదాహరణను పరిశీలిద్దాం. మనకు ఒక డేటా సైన్స్ కోర్సు (ఇలాంటి ఒకటి) ఉంది, దీన్ని మనం ఆన్లైన్లో విద్యార్థులకు అందిస్తున్నాము, మరియు దీన్ని మెరుగుపరచడానికి డేటా సైన్స్ ఉపయోగించాలనుకుంటున్నాము. మనం ఎలా చేయగలం?
|
||||
|
||||
మనం మొదట అడగవచ్చు "ఏం డిజిటలైజ్ చేయవచ్చు?" సులభమైన మార్గం ప్రతి విద్యార్థి ప్రతి మాడ్యూల్ పూర్తి చేయడానికి తీసుకునే సమయాన్ని కొలవడం, మరియు ప్రతి మాడ్యూల్ చివరలో బహుళ ఎంపిక పరీక్ష ద్వారా పొందిన జ్ఞానాన్ని కొలవడం. అన్ని విద్యార్థుల సమయాన్ని సగటు తీసుకుంటే, ఏ మాడ్యూల్స్ విద్యార్థులకు ఎక్కువ కష్టాలు కలిగిస్తున్నాయో తెలుసుకుని వాటిని సులభతరం చేయడానికి పని చేయవచ్చు.
|
||||
> మీరు ఈ విధానం సరైనది కాదని వాదించవచ్చు, ఎందుకంటే మాడ్యూల్స్ వివిధ పొడవులలో ఉండవచ్చు. మాడ్యూల్ పొడవు (అక్షరాల సంఖ్యలో) ద్వారా సమయాన్ని భాగించటం మరింత న్యాయమైనది, మరియు ఆ విలువలను పోల్చటం మంచిది.
|
||||
|
||||
మేము బహుళ-ఎంపిక పరీక్షల ఫలితాలను విశ్లేషించడం ప్రారంభించినప్పుడు, విద్యార్థులు అర్థం చేసుకోవడంలో కష్టపడుతున్న భావనలను గుర్తించడానికి ప్రయత్నించవచ్చు, మరియు ఆ సమాచారాన్ని ఉపయోగించి కంటెంట్ను మెరుగుపరచవచ్చు. దానికి, ప్రతి ప్రశ్న ఒక నిర్దిష్ట భావన లేదా జ్ఞాన భాగానికి మ్యాప్ అయ్యే విధంగా పరీక్షలను రూపకల్పన చేయాలి.
|
||||
|
||||
మరింత క్లిష్టంగా చేయాలనుకుంటే, మేము ప్రతి మాడ్యూల్ కోసం తీసుకున్న సమయాన్ని విద్యార్థుల వయస్సు వర్గంతో పోల్చి గ్రాఫ్ చేయవచ్చు. కొన్ని వయస్సు వర్గాల కోసం మాడ్యూల్ పూర్తి చేయడానికి అనవసరంగా ఎక్కువ సమయం పడుతుందని లేదా విద్యార్థులు పూర్తి చేయకముందే వదిలివేస్తారని కనుగొనవచ్చు. ఇది మాడ్యూల్ కోసం వయస్సు సిఫార్సులను అందించడంలో సహాయపడుతుంది, మరియు తప్పు అంచనాల వల్ల ప్రజల అసంతృప్తిని తగ్గిస్తుంది.
|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
ఈ సవాలలో, మేము డేటా సైన్స్ రంగానికి సంబంధించిన భావనలను పాఠ్యాలను పరిశీలించడం ద్వారా కనుగొనడానికి ప్రయత్నిస్తాము. మేము డేటా సైన్స్ పై వికీపీడియా వ్యాసాన్ని తీసుకుని, టెక్స్ట్ను డౌన్లోడ్ చేసి ప్రాసెస్ చేసి, ఈ విధమైన పద మేఘాన్ని నిర్మిస్తాము:
|
||||
|
||||

|
||||
|
||||
కోడ్ను చదవడానికి [`notebook.ipynb`](../../../../1-Introduction/01-defining-data-science/notebook.ipynb ':ignore') ను సందర్శించండి. మీరు కోడ్ను కూడా నడిపించి, అన్ని డేటా మార్పిడి ప్రక్రియలను ప్రత్యక్షంగా చూడవచ్చు.
|
||||
|
||||
> మీరు జూపిటర్ నోట్బుక్లో కోడ్ ఎలా నడిపించాలో తెలియకపోతే, [ఈ వ్యాసం](https://soshnikov.com/education/how-to-execute-notebooks-from-github/) చూడండి.
|
||||
|
||||
## [పోస్ట్-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/1)
|
||||
|
||||
## అసైన్మెంట్లు
|
||||
|
||||
* **టాస్క్ 1**: పై కోడ్ను మార్చి **బిగ్ డేటా** మరియు **మిషన్ లెర్నింగ్** రంగాలకు సంబంధించిన భావనలను కనుగొనండి
|
||||
* **టాస్క్ 2**: [డేటా సైన్స్ సన్నివేశాల గురించి ఆలోచించండి](assignment.md)
|
||||
|
||||
## క్రెడిట్స్
|
||||
|
||||
ఈ పాఠం ♥️ తో [Dmitry Soshnikov](http://soshnikov.com) రచించారు
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,48 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "4e0f1773b9bee1be3b28f9fe2c71b3de",
|
||||
"translation_date": "2025-12-19T13:40:49+00:00",
|
||||
"source_file": "1-Introduction/01-defining-data-science/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# అసైన్మెంట్: డేటా సైన్స్ సన్నివేశాలు
|
||||
|
||||
ఈ మొదటి అసైన్మెంట్లో, మీరు వివిధ సమస్యా డొమైన్లలోని కొన్ని వాస్తవ జీవిత ప్రక్రియ లేదా సమస్య గురించి ఆలోచించి, డేటా సైన్స్ ప్రక్రియను ఉపయోగించి దాన్ని ఎలా మెరుగుపరచవచ్చో ఆలోచించమని కోరుతున్నాము. క్రింది విషయాల గురించి ఆలోచించండి:
|
||||
|
||||
1. మీరు ఏ డేటాను సేకరించగలరు?
|
||||
1. దాన్ని మీరు ఎలా సేకరిస్తారు?
|
||||
1. డేటాను మీరు ఎలా నిల్వ చేస్తారు? డేటా ఎంత పెద్దదిగా ఉండవచ్చు?
|
||||
1. ఈ డేటా నుండి మీరు ఏ అవగాహనలను పొందగలరు? డేటా ఆధారంగా ఏ నిర్ణయాలను తీసుకోవచ్చు?
|
||||
|
||||
3 విభిన్న సమస్యలు/ప్రక్రియల గురించి ఆలోచించి, ప్రతి సమస్యా డొమైన్ కోసం పై పాయింట్లను వివరించండి.
|
||||
|
||||
ఇక్కడ కొన్ని సమస్యా డొమైన్లు మరియు సమస్యలు ఉన్నాయి, ఇవి మీ ఆలోచన ప్రారంభానికి సహాయపడతాయి:
|
||||
|
||||
1. పిల్లల విద్యా ప్రక్రియను మెరుగుపరచడానికి మీరు డేటాను ఎలా ఉపయోగించగలరు?
|
||||
1. మహమ్మారి సమయంలో టీకా నియంత్రణ కోసం మీరు డేటాను ఎలా ఉపయోగించగలరు?
|
||||
1. మీరు పని సమయంలో ఉత్పాదకత ఉన్నారని నిర్ధారించుకోవడానికి డేటాను ఎలా ఉపయోగించగలరు?
|
||||
|
||||
## సూచనలు
|
||||
|
||||
క్రింది పట్టికను పూరించండి (అవసరమైతే సూచించిన సమస్యా డొమైన్ల స్థానంలో మీ స్వంత వాటిని ఉపయోగించండి):
|
||||
|
||||
| సమస్యా డొమైన్ | సమస్య | ఏ డేటాను సేకరించాలి | డేటాను ఎలా నిల్వ చేయాలి | ఏ అవగాహనలు/నిర్ణయాలు తీసుకోవచ్చు |
|
||||
|----------------|---------|-----------------------|-----------------------|--------------------------------------|
|
||||
| విద్య | | | | |
|
||||
| టీకా | | | | |
|
||||
| ఉత్పాదకత | | | | |
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణాత్మక | సరిపడిన | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
అన్ని సమస్యా డొమైన్ల కోసం తగిన డేటా మూలాలు, డేటా నిల్వ విధానాలు మరియు సాధ్యమైన నిర్ణయాలు/అవగాహనలను గుర్తించగలిగినవారు | పరిష్కారంలోని కొన్ని అంశాలు వివరించబడలేదు, డేటా నిల్వ చర్చించబడలేదు, కనీసం 2 సమస్యా డొమైన్లు మాత్రమే వివరించబడ్డాయి | డేటా పరిష్కారంలోని భాగాలు మాత్రమే వివరించబడ్డాయి, ఒకే ఒక సమస్యా డొమైన్ మాత్రమే పరిగణించబడింది.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,50 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a8f79b9c0484c35b4f26e8aec7fc4d56",
|
||||
"translation_date": "2025-12-19T14:29:26+00:00",
|
||||
"source_file": "1-Introduction/01-defining-data-science/solution/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# అసైన్మెంట్: డేటా సైన్స్ సన్నివేశాలు
|
||||
|
||||
ఈ మొదటి అసైన్మెంట్లో, మేము మీరు వివిధ సమస్యా డొమైన్లలోని కొన్ని వాస్తవ జీవిత ప్రక్రియ లేదా సమస్య గురించి ఆలోచించాలని కోరుతున్నాము, మరియు మీరు డేటా సైన్స్ ప్రక్రియను ఉపయోగించి దాన్ని ఎలా మెరుగుపరచగలరో. క్రింది విషయాల గురించి ఆలోచించండి:
|
||||
|
||||
1. మీరు ఏ డేటాను సేకరించగలరు?
|
||||
1. దాన్ని మీరు ఎలా సేకరిస్తారు?
|
||||
1. డేటాను మీరు ఎలా నిల్వ చేస్తారు? డేటా ఎంత పెద్దదిగా ఉండవచ్చు?
|
||||
1. ఈ డేటా నుండి మీరు ఏ అవగాహనలను పొందగలరు? డేటా ఆధారంగా ఏ నిర్ణయాలు తీసుకోవచ్చు?
|
||||
|
||||
3 విభిన్న సమస్యలు/ప్రక్రియల గురించి ఆలోచించి, ప్రతి సమస్యా డొమైన్ కోసం పై పాయింట్లను వివరించండి.
|
||||
|
||||
ఇక్కడ కొన్ని సమస్యా డొమైన్లు మరియు సమస్యలు ఉన్నాయి, ఇవి మీ ఆలోచన ప్రారంభానికి సహాయపడతాయి:
|
||||
|
||||
1. పిల్లల విద్యా ప్రక్రియను మెరుగుపరచడానికి మీరు డేటాను ఎలా ఉపయోగించగలరు?
|
||||
1. మహమ్మారి సమయంలో టీకా నియంత్రణ కోసం మీరు డేటాను ఎలా ఉపయోగించగలరు?
|
||||
1. మీరు పని సమయంలో ఉత్పాదకత ఉన్నారని నిర్ధారించుకోవడానికి డేటాను ఎలా ఉపయోగించగలరు?
|
||||
|
||||
## సూచనలు
|
||||
|
||||
క్రింది పట్టికను పూరించండి (మీ అవసరానికి అనుగుణంగా సూచించిన సమస్యా డొమైన్లను మీ స్వంత వాటితో మార్చుకోవచ్చు):
|
||||
|
||||
| సమస్యా డొమైన్ | సమస్య | ఏ డేటాను సేకరించాలి | డేటాను ఎలా నిల్వ చేయాలి | ఏ అవగాహన/నిర్ణయాలు తీసుకోవచ్చు |
|
||||
|----------------|---------|-----------------------|-----------------------|--------------------------------------|
|
||||
| విద్య | విశ్వవిద్యాలయంలో, సాధారణంగా లెక్చర్లకు హాజరు తక్కువగా ఉంటుంది, మరియు లెక్చర్లకు హాజరు ఇచ్చే విద్యార్థులు పరీక్షల్లో సగటున మెరుగ్గా ఉంటారని మన hypothesis ఉంది. హాజరును ప్రేరేపించి hypothesis ని పరీక్షించాలనుకుంటున్నాము. | తరగతిలో సెక్యూరిటీ కెమెరా తీసిన చిత్రాల ద్వారా లేదా తరగతిలో విద్యార్థుల మొబైల్ ఫోన్ల బ్లూటూత్/వైఫై అడ్రెస్లను ట్రాక్ చేయడం ద్వారా హాజరును ట్రాక్ చేయవచ్చు. పరీక్షా డేటా ఇప్పటికే విశ్వవిద్యాలయ డేటాబేస్లో అందుబాటులో ఉంది. | సెక్యూరిటీ కెమెరా చిత్రాలను ట్రాక్ చేస్తే - తరగతి సమయంలో కొన్ని (5-10) ఫోటోలు (అనుసంఘటిత డేటా) నిల్వ చేయాలి, తరువాత AI ఉపయోగించి విద్యార్థుల ముఖాలను గుర్తించి (డేటాను నిర్మిత రూపంలోకి మార్చాలి). | ప్రతి విద్యార్థి సగటు హాజరు డేటాను లెక్కించి, పరీక్షా గ్రేడ్లతో ఏ సంబంధం ఉందో చూడవచ్చు. సంబంధం గురించి [probability and statistics](../../04-stats-and-probability/README.md) విభాగంలో మరింత చర్చిస్తాము. విద్యార్థుల హాజరును ప్రేరేపించడానికి వారానికి ఒకసారి హాజరు రేటింగ్ను స్కూల్ పోర్టల్లో ప్రచురించి, అత్యధిక హాజరు ఉన్నవారిలో బహుమతులు ఇవ్వవచ్చు. |
|
||||
| టీకా | | | | |
|
||||
| ఉత్పాదకత | | | | |
|
||||
|
||||
> *ఈ అసైన్మెంట్లో మీరు ఏం చేయాలో అర్థం చేసుకోవడానికి ఒక ఉదాహరణగా ఒకే ఒక సమాధానాన్ని మాత్రమే అందిస్తున్నాము.*
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణాత్మకంగా | సరిపడా | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
అన్ని సమస్యా డొమైన్ల కోసం తగిన డేటా మూలాలు, డేటా నిల్వ విధానాలు మరియు సాధ్యమైన నిర్ణయాలు/అవగాహనలను గుర్తించగలిగారు | పరిష్కారంలోని కొన్ని అంశాలు వివరించబడలేదు, డేటా నిల్వ గురించి చర్చించబడలేదు, కనీసం 2 సమస్యా డొమైన్లు మాత్రమే వివరించబడ్డాయి | డేటా పరిష్కారంలోని భాగాలు మాత్రమే వివరించబడ్డాయి, ఒకే ఒక సమస్యా డొమైన్ మాత్రమే పరిగణించబడింది.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,35 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "b588c0fc73014f52520c666efc3e0cc3",
|
||||
"translation_date": "2025-12-19T14:28:09+00:00",
|
||||
"source_file": "1-Introduction/02-ethics/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
## డేటా నైతికత కేసు అధ్యయనం రాయండి
|
||||
|
||||
## సూచనలు
|
||||
|
||||
మీరు వివిధ [డేటా నైతికత సవాళ్ళు](README.md#2-ethics-challenges) గురించి నేర్చుకున్నారు మరియు నిజజీవిత సందర్భాలలో డేటా నైతికత సవాళ్లను ప్రతిబింబించే కొన్ని [కేసు అధ్యయనాలు](README.md#3-case-studies) చూశారు.
|
||||
|
||||
ఈ అసైన్మెంట్లో, మీరు మీ స్వంత అనుభవం నుండి లేదా మీరు పరిచయమైన సంబంధిత నిజజీవిత సందర్భం నుండి డేటా నైతికత సవాల్ను ప్రతిబింబించే మీ స్వంత కేసు అధ్యయనాన్ని రాయాలి. ఈ దశలను అనుసరించండి:
|
||||
|
||||
1. `డేటా నైతికత సవాల్ను ఎంచుకోండి`. ప్రేరణ కోసం [పాఠం ఉదాహరణలు](README.md#2-ethics-challenges) చూడండి లేదా [Deon చెక్లిస్ట్](https://deon.drivendata.org/examples/) వంటి ఆన్లైన్ ఉదాహరణలను అన్వేషించండి.
|
||||
|
||||
2. `నిజజీవిత ఉదాహరణను వివరించండి`. మీరు విన్న (శీర్షికలు, పరిశోధన అధ్యయనం మొదలైనవి) లేదా అనుభవించిన (స్థానిక సమాజం) పరిస్థితిని ఆలోచించండి, అక్కడ ఈ నిర్దిష్ట సవాల్ సంభవించింది. సవాల్కు సంబంధించిన డేటా నైతికత ప్రశ్నలను ఆలోచించండి - మరియు ఈ సమస్య కారణంగా ఏర్పడే సంభావ్య హానులు లేదా అనుకోని పరిణామాలను చర్చించండి. బోనస్ పాయింట్లు: ఈ సవాల్ యొక్క ప్రతికూల ప్రభావాన్ని తొలగించడానికి లేదా తగ్గించడానికి సహాయపడే సంభావ్య పరిష్కారాలు లేదా ప్రక్రియలను ఆలోచించండి.
|
||||
|
||||
3. `సంబంధిత వనరుల జాబితాను అందించండి`. ఇది నిజజీవిత సంఘటన అని నిరూపించడానికి ఒకటి లేదా ఎక్కువ వనరులను (ఆర్టికల్ లింకులు, వ్యక్తిగత బ్లాగ్ పోస్ట్ లేదా చిత్రం, ఆన్లైన్ పరిశోధన పేపర్ మొదలైనవి) పంచుకోండి. బోనస్ పాయింట్లు: సంఘటన నుండి సంభావ్య హానులు & పరిణామాలను కూడా చూపించే వనరులను పంచుకోండి, లేదా దాని పునరావృతం నివారించడానికి తీసుకున్న సానుకూల చర్యలను హైలైట్ చేయండి.
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణాత్మక | తగినంత | మెరుగుదల అవసరం
|
||||
--- | --- | --- |
|
||||
ఒకటి లేదా ఎక్కువ డేటా నైతికత సవాళ్లు గుర్తించబడ్డాయి. <br/> <br/> కేసు అధ్యయనం ఆ సవాల్ను ప్రతిబింబించే నిజజీవిత సంఘటనను స్పష్టంగా వివరించి, దాని వల్ల కలిగిన అనుచిత పరిణామాలు లేదా హానులను హైలైట్ చేస్తుంది. <br/><br/> ఇది సంభవించిందని నిరూపించడానికి కనీసం ఒక లింక్ వనరు ఉంది. | ఒక డేటా నైతికత సవాల్ గుర్తించబడింది. <br/><br/> కనీసం ఒక సంబంధిత హాని లేదా పరిణామం సంక్షిప్తంగా చర్చించబడింది. <br/><br/> అయితే చర్చ పరిమితంగా ఉంది లేదా నిజజీవిత సంభవం యొక్క సాక్ష్యం లేదు. | ఒక డేటా సవాల్ గుర్తించబడింది. <br/><br/> అయితే వివరణ లేదా వనరులు సవాల్ను సరైన రీతిలో ప్రతిబింబించవు లేదా నిజజీవిత సంభవాన్ని నిరూపించవు. |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,88 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "12339119c0165da569a93ddba05f9339",
|
||||
"translation_date": "2025-12-19T13:58:23+00:00",
|
||||
"source_file": "1-Introduction/03-defining-data/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# డేటా నిర్వచనం
|
||||
|
||||
| ](../../sketchnotes/03-DefiningData.png)|
|
||||
|:---:|
|
||||
|డేటా నిర్వచనం - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
డేటా అనేది నిజాలు, సమాచారం, పరిశీలనలు మరియు కొలతలు, ఇవి ఆవిష్కరణలు చేయడానికి మరియు సమాచారంతో కూడిన నిర్ణయాలను మద్దతు ఇవ్వడానికి ఉపయోగిస్తారు. ఒక డేటా పాయింట్ అనేది ఒక డేటాసెట్లోని ఒకే ఒక డేటా యూనిట్, ఇది డేటా పాయింట్ల సేకరణ. డేటాసెట్లు వివిధ ఫార్మాట్లు మరియు నిర్మాణాలలో ఉండవచ్చు, మరియు సాధారణంగా దాని మూలం లేదా డేటా ఎక్కడినుంచి వచ్చింది అనే ఆధారంగా ఉంటాయి. ఉదాహరణకు, ఒక కంపెనీ యొక్క నెలవారీ ఆదాయం స్ప్రెడ్షీట్లో ఉండవచ్చు కానీ స్మార్ట్వాచ్ నుండి గంటల వారీ గుండె రేటు డేటా [JSON](https://stackoverflow.com/a/383699) ఫార్మాట్లో ఉండవచ్చు. డేటా శాస్త్రవేత్తలు సాధారణంగా ఒక డేటాసెట్లోని వివిధ రకాల డేటాతో పని చేస్తారు.
|
||||
|
||||
ఈ పాఠం డేటాను దాని లక్షణాలు మరియు మూలాల ద్వారా గుర్తించడం మరియు వర్గీకరించడంపై కేంద్రీకృతమైంది.
|
||||
|
||||
## [పూర్వ-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/4)
|
||||
## డేటా ఎలా వివరించబడుతుంది
|
||||
|
||||
### రా డేటా
|
||||
రా డేటా అనేది దాని మూలం నుండి ప్రారంభ స్థితిలో వచ్చిన డేటా, ఇది విశ్లేషించబడలేదు లేదా సక్రమంగా ఏర్పాటు చేయబడలేదు. ఒక డేటాసెట్లో ఏమి జరుగుతుందో అర్థం చేసుకోవడానికి, అది మానవులు మరియు వారు ఉపయోగించే సాంకేతికతకు అర్థమయ్యే ఫార్మాట్లో సక్రమంగా ఏర్పాటు చేయబడాలి. ఒక డేటాసెట్ నిర్మాణం దాని ఏర్పాటు ఎలా ఉందో వివరిస్తుంది మరియు ఇది నిర్మిత, నిర్మిత కాని మరియు అర్ధ-నిర్మితంగా వర్గీకరించబడవచ్చు. ఈ నిర్మాణ రకాలు మూలం ఆధారంగా మారవచ్చు కానీ చివరికి ఈ మూడు వర్గాలలో సరిపోతాయి.
|
||||
|
||||
### పరిమాణాత్మక డేటా
|
||||
పరిమాణాత్మక డేటా అనేది డేటాసెట్లోని సంఖ్యాత్మక పరిశీలనలు మరియు సాధారణంగా విశ్లేషించబడవచ్చు, కొలవబడవచ్చు మరియు గణితంగా ఉపయోగించబడవచ్చు. పరిమాణాత్మక డేటా కొన్ని ఉదాహరణలు: ఒక దేశ జనాభా, ఒక వ్యక్తి ఎత్తు లేదా ఒక కంపెనీ త్రైమాసిక ఆదాయం. కొంత అదనపు విశ్లేషణతో, పరిమాణాత్మక డేటా వాయు నాణ్యత సూచిక (AQI) యొక్క సీజనల్ ట్రెండ్లను కనుగొనడానికి లేదా సాధారణ పని దినంలో రష్ అవర్ ట్రాఫిక్ సంభావ్యతను అంచనా వేయడానికి ఉపయోగించవచ్చు.
|
||||
|
||||
### గుణాత్మక డేటా
|
||||
గుణాత్మక డేటా, లేదా వర్గీకృత డేటా, అనేది పరిమాణాత్మక డేటా పరిశీలనల లాగా ఆబ్జెక్టివ్గా కొలవలేని డేటా. ఇది సాధారణంగా వివిధ రకాల సబ్జెక్టివ్ డేటా, ఇది ఏదైనా వస్తువు లేదా ప్రక్రియ యొక్క నాణ్యతను పట్టుకుంటుంది. కొన్నిసార్లు, గుణాత్మక డేటా సంఖ్యాత్మకంగా ఉండవచ్చు కానీ సాధారణంగా గణితంగా ఉపయోగించబడదు, ఉదాహరణకు ఫోన్ నంబర్లు లేదా టైమ్స్టాంప్లు. గుణాత్మక డేటా కొన్ని ఉదాహరణలు: వీడియో వ్యాఖ్యలు, కారు తయారీ మరియు మోడల్ లేదా మీ అత్యంత సన్నిహిత మిత్రుల ఇష్టమైన రంగు. గుణాత్మక డేటా వినియోగదారులు ఏ ఉత్పత్తులను ఎక్కువగా ఇష్టపడతారో అర్థం చేసుకోవడానికి లేదా ఉద్యోగ దరఖాస్తు రిజ్యూమ్లలో ప్రాచుర్యం పొందిన కీవర్డ్లను గుర్తించడానికి ఉపయోగించవచ్చు.
|
||||
|
||||
### నిర్మిత డేటా
|
||||
నిర్మిత డేటా అనేది వరుసలు మరియు కాలమ్స్లో ఏర్పాటు చేయబడిన డేటా, ప్రతి వరుసకు అదే కాలమ్ల సెట్ ఉంటుంది. కాలమ్స్ ఒక నిర్దిష్ట రకం విలువను సూచిస్తాయి మరియు ఆ విలువ ఏమిటో వివరిస్తూ ఒక పేరుతో గుర్తించబడతాయి, వరుసలు వాస్తవ విలువలను కలిగి ఉంటాయి. కాలమ్లకు విలువలపై నిర్దిష్ట నియమాలు లేదా పరిమితులు ఉండవచ్చు, విలువలు కాలమ్ను సరిగ్గా ప్రతిబింబించడానికి. ఉదాహరణకు, ఒక కస్టమర్ల స్ప్రెడ్షీట్లో ప్రతి వరుసకు ఫోన్ నంబర్ ఉండాలి మరియు ఫోన్ నంబర్లు ఎప్పుడూ అక్షరాలు కలిగి ఉండకూడదు. ఫోన్ నంబర్ కాలమ్పై నియమాలు ఉండవచ్చు, అది ఎప్పుడూ ఖాళీగా ఉండకూడదని మరియు కేవలం సంఖ్యలు మాత్రమే ఉండాలని.
|
||||
|
||||
నిర్మిత డేటా లాభం ఏమిటంటే, ఇది ఇతర నిర్మిత డేటాతో సంబంధం కలిగి ఉండే విధంగా ఏర్పాటు చేయబడవచ్చు. అయితే, డేటా ఒక నిర్దిష్ట విధంగా ఏర్పాటు చేయబడినందున, దాని మొత్తం నిర్మాణంలో మార్పులు చేయడం చాలా కష్టంగా ఉంటుంది. ఉదాహరణకు, ఖాళీగా ఉండకూడని ఇమెయిల్ కాలమ్ను కస్టమర్ స్ప్రెడ్షీట్లో జోడించడం అంటే, ఈ విలువలను ఇప్పటికే ఉన్న కస్టమర్ వరుసలకు ఎలా జోడించాలో మీరు ఆలోచించాలి.
|
||||
|
||||
నిర్మిత డేటా ఉదాహరణలు: స్ప్రెడ్షీట్లు, రిలేషనల్ డేటాబేసులు, ఫోన్ నంబర్లు, బ్యాంక్ స్టేట్మెంట్లు
|
||||
|
||||
### నిర్మిత కాని డేటా
|
||||
నిర్మిత కాని డేటా సాధారణంగా వరుసలు లేదా కాలమ్లుగా వర్గీకరించలేం మరియు దానికి అనుసరించాల్సిన ఫార్మాట్ లేదా నియమాలు ఉండవు. నిర్మిత కాని డేటాకు నిర్మిత డేటాతో పోలిస్తే తక్కువ పరిమితులు ఉండటంతో కొత్త సమాచారాన్ని జోడించడం సులభం. ఉదాహరణకు, ప్రతి 2 నిమిషాలకు బారోమెట్రిక్ ప్రెషర్ను కొలిచే సెన్సార్ ఇప్పుడు ఉష్ణోగ్రతను కొలవడానికి మరియు రికార్డ్ చేయడానికి అప్డేట్ పొందినట్లయితే, అది నిర్మిత కాని డేటా అయితే ఇప్పటికే ఉన్న డేటాను మార్చాల్సిన అవసరం లేదు. అయితే, ఈ రకమైన డేటాను విశ్లేషించడం లేదా పరిశీలించడం ఎక్కువ సమయం తీసుకోవచ్చు. ఉదాహరణకు, ఒక శాస్త్రవేత్త గత నెల సగటు ఉష్ణోగ్రతను కనుగొనాలనుకుంటే, సెన్సార్ కొన్ని రికార్డ్ చేసిన డేటాలో "e" అనే అక్షరాన్ని నమోదు చేసి అది సెన్సార్ బిగ్గరగా పనిచేయలేదని సూచిస్తే, డేటా అసంపూర్ణంగా ఉంటుంది.
|
||||
|
||||
నిర్మిత కాని డేటా ఉదాహరణలు: టెక్స్ట్ ఫైళ్లు, టెక్స్ట్ సందేశాలు, వీడియో ఫైళ్లు
|
||||
|
||||
### అర్ధ-నిర్మిత డేటా
|
||||
అర్ధ-నిర్మిత డేటాకు నిర్మిత మరియు నిర్మిత కాని డేటా లక్షణాలు కలవు. ఇది సాధారణంగా వరుసలు మరియు కాలమ్ల ఫార్మాట్కు అనుగుణంగా ఉండదు కానీ నిర్మితంగా పరిగణించదగిన విధంగా ఏర్పాటు చేయబడుతుంది మరియు ఒక స్థిరమైన ఫార్మాట్ లేదా నియమాలను అనుసరించవచ్చు. నిర్మాణం మూలాల మధ్య మారవచ్చు, ఉదాహరణకు బాగా నిర్వచించబడిన హైరార్కీ నుండి కొత్త సమాచారాన్ని సులభంగా సమ్మిళితం చేయడానికి అనువైన మరింత సౌకర్యవంతమైనది వరకు. మెటాడేటా అనేది డేటా ఎలా ఏర్పాటు చేయబడిందో మరియు నిల్వ చేయబడిందో నిర్ణయించడంలో సహాయపడే సూచికలు మరియు డేటా రకంపై ఆధారపడి వివిధ పేర్లతో ఉంటాయి. సాధారణ మెటాడేటా పేర్లు: ట్యాగ్లు, ఎలిమెంట్లు, ఎంటిటీలను మరియు లక్షణాలు. ఉదాహరణకు, ఒక సాధారణ ఇమెయిల్ సందేశానికి ఒక విషయం, శరీరం మరియు రిసిపియెంట్ల సెట్ ఉంటుంది మరియు ఎవరు లేదా ఎప్పుడు పంపారో ఆధారంగా ఏర్పాటు చేయబడవచ్చు.
|
||||
|
||||
అర్ధ-నిర్మిత డేటా ఉదాహరణలు: HTML, CSV ఫైళ్లు, జావాస్క్రిప్ట్ ఆబ్జెక్ట్ నోటేషన్ (JSON)
|
||||
|
||||
## డేటా మూలాలు
|
||||
|
||||
డేటా మూలం అనేది డేటా ఉత్పత్తి అయిన ప్రాథమిక స్థలం లేదా అది "ఉండే" ప్రదేశం, మరియు అది ఎప్పుడు మరియు ఎలా సేకరించబడిందో ఆధారంగా మారుతుంది. దాని వినియోగదారులచే ఉత్పత్తి చేయబడిన డేటాను ప్రాథమిక డేటా అంటారు, మరియు సాధారణ ఉపయోగం కోసం సేకరించిన మూలం నుండి వచ్చిన డేటాను ద్వితీయ డేటా అంటారు. ఉదాహరణకు, ఒక వనవిల్లు లో పరిశీలనలు సేకరించే శాస్త్రవేత్తల సమూహం ప్రాథమికంగా పరిగణించబడుతుంది, మరియు వారు ఇతర శాస్త్రవేత్తలతో పంచుకుంటే, అది ఆ వినియోగదారులకు ద్వితీయంగా పరిగణించబడుతుంది.
|
||||
|
||||
డేటాబేసులు సాధారణ మూలాలు మరియు డేటాను హోస్ట్ చేయడానికి మరియు నిర్వహించడానికి డేటాబేస్ మేనేజ్మెంట్ సిస్టమ్పై ఆధారపడి ఉంటాయి, వినియోగదారులు క్వెరీలు అనే ఆదేశాలను ఉపయోగించి డేటాను అన్వేషిస్తారు. ఫైళ్లు డేటా మూలాలుగా ఆడియో, చిత్రం, వీడియో ఫైళ్లు మరియు ఎక్సెల్ వంటి స్ప్రెడ్షీట్లు ఉండవచ్చు. ఇంటర్నెట్ మూలాలు డేటాను హోస్ట్ చేయడానికి సాధారణ ప్రదేశం, ఇక్కడ డేటాబేసులు మరియు ఫైళ్లు రెండూ ఉండవచ్చు. అప్లికేషన్ ప్రోగ్రామింగ్ ఇంటర్ఫేసులు (APIs) ప్రోగ్రామర్లకు ఇంటర్నెట్ ద్వారా బాహ్య వినియోగదారులతో డేటాను పంచుకునే మార్గాలను సృష్టించడానికి అనుమతిస్తాయి, మరియు వెబ్ స్క్రాపింగ్ ప్రక్రియ వెబ్ పేజీ నుండి డేటాను తీసుకుంటుంది. [డేటాతో పని చేయడం](../../../../../../../../../2-Working-With-Data) పాఠాలు వివిధ డేటా మూలాలను ఎలా ఉపయోగించాలో కేంద్రీకృతమై ఉన్నాయి.
|
||||
|
||||
## ముగింపు
|
||||
|
||||
ఈ పాఠంలో మనం నేర్చుకున్నాం:
|
||||
|
||||
- డేటా అంటే ఏమిటి
|
||||
- డేటా ఎలా వివరించబడుతుంది
|
||||
- డేటా ఎలా వర్గీకరించబడుతుంది మరియు వర్గాలుగా విభజించబడుతుంది
|
||||
- డేటా ఎక్కడ కనుగొనవచ్చు
|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
Kaggle అనేది ఓపెన్ డేటాసెట్లకు అద్భుతమైన మూలం. [డేటాసెట్ శోధన సాధనం](https://www.kaggle.com/datasets) ఉపయోగించి కొన్ని ఆసక్తికరమైన డేటాసెట్లను కనుగొని ఈ ప్రమాణాలతో 3-5 డేటాసెట్లను వర్గీకరించండి:
|
||||
|
||||
- డేటా పరిమాణాత్మకమా లేదా గుణాత్మకమా?
|
||||
- డేటా నిర్మితమా, నిర్మిత కాని, లేదా అర్ధ-నిర్మితమా?
|
||||
|
||||
## [పోస్ట్-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/5)
|
||||
|
||||
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
- ఈ Microsoft Learn యూనిట్, [మీ డేటాను వర్గీకరించండి](https://docs.microsoft.com/en-us/learn/modules/choose-storage-approach-in-azure/2-classify-data) అనే శీర్షికతో, నిర్మిత, అర్ధ-నిర్మిత మరియు నిర్మిత కాని డేటా యొక్క వివరమైన విభజనను కలిగి ఉంది.
|
||||
|
||||
## అసైన్మెంట్
|
||||
|
||||
[డేటాసెట్ల వర్గీకరణ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,81 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "2e5cacb967c1e9dfd07809bfc441a0b4",
|
||||
"translation_date": "2025-12-19T14:01:10+00:00",
|
||||
"source_file": "1-Introduction/03-defining-data/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# డేటాసెట్ల వర్గీకరణ
|
||||
|
||||
## సూచనలు
|
||||
|
||||
ఈ అసైన్మెంట్లోని ప్రాంప్ట్లను అనుసరించి, డేటాను క్రింది డేటా రకాలలో ఒకదానితో గుర్తించి వర్గీకరించండి:
|
||||
|
||||
**సంరచనా రకాలు**: నిర్మిత, అర్ధ-నిర్మిత, లేదా నిర్మితం కాని
|
||||
|
||||
**విలువ రకాలు**: గుణాత్మక లేదా పరిమాణాత్మక
|
||||
|
||||
**మూల రకాలు**: ప్రాథమిక లేదా ద్వితీయ
|
||||
|
||||
1. ఒక కంపెనీని కొనుగోలు చేసి ఇప్పుడు ఒక పేరెంట్ కంపెనీ ఉంది. డేటా శాస్త్రవేత్తలు పేరెంట్ కంపెనీ నుండి కస్టమర్ ఫోన్ నంబర్ల స్ప్రెడ్షీట్ను అందుకున్నారు.
|
||||
|
||||
సంరచనా రకం:
|
||||
|
||||
విలువ రకం:
|
||||
|
||||
మూల రకం:
|
||||
|
||||
---
|
||||
|
||||
2. ఒక స్మార్ట్ వాచ్ దాని ధరించే వ్యక్తి నుండి హార్ట్ రేట్ డేటాను సేకరిస్తోంది, మరియు రా డేటా JSON ఫార్మాట్లో ఉంది.
|
||||
|
||||
సంరచనా రకం:
|
||||
|
||||
విలువ రకం:
|
||||
|
||||
మూల రకం:
|
||||
|
||||
---
|
||||
|
||||
3. ఉద్యోగుల మానసిక స్థితిపై వర్క్ప్లేస్ సర్వే CSV ఫైల్లో నిల్వ చేయబడింది.
|
||||
|
||||
సంరచనా రకం:
|
||||
|
||||
విలువ రకం:
|
||||
|
||||
మూల రకం:
|
||||
|
||||
---
|
||||
|
||||
4. ఖగోళ శాస్త్రవేత్తలు స్పేస్ ప్రోబ్ సేకరించిన గెలాక్సీల డేటాబేస్ను యాక్సెస్ చేస్తున్నారు. డేటాలో ప్రతి గెలాక్సీలోని గ్రహాల సంఖ్య ఉంది.
|
||||
|
||||
సంరచనా రకం:
|
||||
|
||||
విలువ రకం:
|
||||
|
||||
మూల రకం:
|
||||
|
||||
---
|
||||
|
||||
5. ఒక వ్యక్తిగత ఆర్థిక యాప్ యూజర్ యొక్క ఆర్థిక ఖాతాలకు APIల ద్వారా కనెక్ట్ అవుతుంది, వారి నికర విలువను లెక్కించడానికి. వారు అన్ని లావాదేవీలను వరుసలు మరియు కాలమ్స్ రూపంలో చూస్తారు, ఇది స్ప్రెడ్షీట్కు సమానంగా ఉంటుంది.
|
||||
|
||||
సంరచనా రకం:
|
||||
|
||||
విలువ రకం:
|
||||
|
||||
మూల రకం:
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాత్తమైనది | సరిపడినది | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
సంరచనా, విలువ, మరియు మూలాలను సరిగ్గా గుర్తించడం | 3 లో సరైన గుర్తింపు | 2 లేదా తక్కువ సరైన గుర్తింపు |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,264 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"## Introduction to Probability and Statistics\n",
|
||||
"## Assignment\n",
|
||||
"\n",
|
||||
"ఈ అసైన్మెంట్లో, మేము [ఇక్కడి నుండి](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html) తీసుకున్న మధుమేహ రోగుల డేటాసెట్ను ఉపయోగించబోతున్నాము.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 13,
|
||||
"source": [
|
||||
"import pandas as pd\n",
|
||||
"import numpy as np\n",
|
||||
"\n",
|
||||
"df = pd.read_csv(\"../../data/diabetes.tsv\",sep='\\t')\n",
|
||||
"df.head()"
|
||||
],
|
||||
"outputs": [
|
||||
{
|
||||
"output_type": "execute_result",
|
||||
"data": {
|
||||
"text/plain": [
|
||||
" AGE SEX BMI BP S1 S2 S3 S4 S5 S6 Y\n",
|
||||
"0 59 2 32.1 101.0 157 93.2 38.0 4.0 4.8598 87 151\n",
|
||||
"1 48 1 21.6 87.0 183 103.2 70.0 3.0 3.8918 69 75\n",
|
||||
"2 72 2 30.5 93.0 156 93.6 41.0 4.0 4.6728 85 141\n",
|
||||
"3 24 1 25.3 84.0 198 131.4 40.0 5.0 4.8903 89 206\n",
|
||||
"4 50 1 23.0 101.0 192 125.4 52.0 4.0 4.2905 80 135"
|
||||
],
|
||||
"text/html": [
|
||||
"<div>\n",
|
||||
"<style scoped>\n",
|
||||
" .dataframe tbody tr th:only-of-type {\n",
|
||||
" vertical-align: middle;\n",
|
||||
" }\n",
|
||||
"\n",
|
||||
" .dataframe tbody tr th {\n",
|
||||
" vertical-align: top;\n",
|
||||
" }\n",
|
||||
"\n",
|
||||
" .dataframe thead th {\n",
|
||||
" text-align: right;\n",
|
||||
" }\n",
|
||||
"</style>\n",
|
||||
"<table border=\"1\" class=\"dataframe\">\n",
|
||||
" <thead>\n",
|
||||
" <tr style=\"text-align: right;\">\n",
|
||||
" <th></th>\n",
|
||||
" <th>AGE</th>\n",
|
||||
" <th>SEX</th>\n",
|
||||
" <th>BMI</th>\n",
|
||||
" <th>BP</th>\n",
|
||||
" <th>S1</th>\n",
|
||||
" <th>S2</th>\n",
|
||||
" <th>S3</th>\n",
|
||||
" <th>S4</th>\n",
|
||||
" <th>S5</th>\n",
|
||||
" <th>S6</th>\n",
|
||||
" <th>Y</th>\n",
|
||||
" </tr>\n",
|
||||
" </thead>\n",
|
||||
" <tbody>\n",
|
||||
" <tr>\n",
|
||||
" <th>0</th>\n",
|
||||
" <td>59</td>\n",
|
||||
" <td>2</td>\n",
|
||||
" <td>32.1</td>\n",
|
||||
" <td>101.0</td>\n",
|
||||
" <td>157</td>\n",
|
||||
" <td>93.2</td>\n",
|
||||
" <td>38.0</td>\n",
|
||||
" <td>4.0</td>\n",
|
||||
" <td>4.8598</td>\n",
|
||||
" <td>87</td>\n",
|
||||
" <td>151</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>1</th>\n",
|
||||
" <td>48</td>\n",
|
||||
" <td>1</td>\n",
|
||||
" <td>21.6</td>\n",
|
||||
" <td>87.0</td>\n",
|
||||
" <td>183</td>\n",
|
||||
" <td>103.2</td>\n",
|
||||
" <td>70.0</td>\n",
|
||||
" <td>3.0</td>\n",
|
||||
" <td>3.8918</td>\n",
|
||||
" <td>69</td>\n",
|
||||
" <td>75</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>2</th>\n",
|
||||
" <td>72</td>\n",
|
||||
" <td>2</td>\n",
|
||||
" <td>30.5</td>\n",
|
||||
" <td>93.0</td>\n",
|
||||
" <td>156</td>\n",
|
||||
" <td>93.6</td>\n",
|
||||
" <td>41.0</td>\n",
|
||||
" <td>4.0</td>\n",
|
||||
" <td>4.6728</td>\n",
|
||||
" <td>85</td>\n",
|
||||
" <td>141</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>3</th>\n",
|
||||
" <td>24</td>\n",
|
||||
" <td>1</td>\n",
|
||||
" <td>25.3</td>\n",
|
||||
" <td>84.0</td>\n",
|
||||
" <td>198</td>\n",
|
||||
" <td>131.4</td>\n",
|
||||
" <td>40.0</td>\n",
|
||||
" <td>5.0</td>\n",
|
||||
" <td>4.8903</td>\n",
|
||||
" <td>89</td>\n",
|
||||
" <td>206</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>4</th>\n",
|
||||
" <td>50</td>\n",
|
||||
" <td>1</td>\n",
|
||||
" <td>23.0</td>\n",
|
||||
" <td>101.0</td>\n",
|
||||
" <td>192</td>\n",
|
||||
" <td>125.4</td>\n",
|
||||
" <td>52.0</td>\n",
|
||||
" <td>4.0</td>\n",
|
||||
" <td>4.2905</td>\n",
|
||||
" <td>80</td>\n",
|
||||
" <td>135</td>\n",
|
||||
" </tr>\n",
|
||||
" </tbody>\n",
|
||||
"</table>\n",
|
||||
"</div>"
|
||||
]
|
||||
},
|
||||
"metadata": {},
|
||||
"execution_count": 13
|
||||
}
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"ఈ డేటాసెట్లో, కాలమ్స్ క్రింది విధంగా ఉన్నాయి:\n",
|
||||
"* వయస్సు మరియు లింగం స్వయంగా అర్థమయ్యే విషయాలు\n",
|
||||
"* BMI అనగా శరీర ద్రవ్య సూచిక\n",
|
||||
"* BP అనగా సగటు రక్తపోటు\n",
|
||||
"* S1 నుండి S6 వరకు వివిధ రక్త కొలతలు\n",
|
||||
"* Y అనగా ఒక సంవత్సర కాలంలో వ్యాధి పురోగతి యొక్క గుణాత్మక కొలత\n",
|
||||
"\n",
|
||||
"Probability మరియు statistics పద్ధతులను ఉపయోగించి ఈ డేటాసెట్ను అధ్యయనం చేద్దాం.\n",
|
||||
"\n",
|
||||
"### Task 1: అన్ని విలువల కోసం సగటు విలువలు మరియు వ్యత్యాసం లెక్కించండి\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"### టాస్క్ 2: లింగం ఆధారంగా BMI, BP మరియు Y కోసం బాక్స్ప్లాట్లు చిత్రించండి\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"### టాస్క్ 3: వయస్సు, లింగం, బిఎంఐ మరియు Y వేరియబుల్స్ యొక్క పంపిణీ ఏమిటి?\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"source": [],
|
||||
"outputs": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"### Task 4: వివిధ వేరియబుల్స్ మరియు వ్యాధి పురోగతికి (Y) మధ్య సంబంధాన్ని పరీక్షించండి\n",
|
||||
"\n",
|
||||
"> **సూచన** సంబంధ మ్యాట్రిక్స్ మీకు ఏ విలువలు ఆధారపడి ఉన్నాయో అత్యంత ఉపయోగకరమైన సమాచారం ఇస్తుంది.\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"### టాస్క్ 5: మగ మరియు ఆడల మధ్య మధుమేహ పురోగతి స్థాయి భిన్నమని హైపోథిసిస్ను పరీక్షించండి\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**అస్పష్టత**: \nఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వలన కలిగే ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python",
|
||||
"version": "3.8.8",
|
||||
"mimetype": "text/x-python",
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"pygments_lexer": "ipython3",
|
||||
"nbconvert_exporter": "python",
|
||||
"file_extension": ".py"
|
||||
},
|
||||
"kernelspec": {
|
||||
"name": "python3",
|
||||
"display_name": "Python 3.8.8 64-bit (conda)"
|
||||
},
|
||||
"interpreter": {
|
||||
"hash": "86193a1ab0ba47eac1c69c1756090baa3b420b3eea7d4aafab8b85f8b312f0c5"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "6d945fd15163f60cb473dbfe04b2d100",
|
||||
"translation_date": "2025-12-19T17:05:41+00:00",
|
||||
"source_file": "1-Introduction/04-stats-and-probability/assignment.ipynb",
|
||||
"language_code": "te"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
@ -0,0 +1,42 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "01d1b493e8b51a6ebb42524f6b1bcfff",
|
||||
"translation_date": "2025-12-19T13:56:42+00:00",
|
||||
"source_file": "1-Introduction/04-stats-and-probability/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# చిన్న మధుమేహ అధ్యయనం
|
||||
|
||||
ఈ అసైన్మెంట్లో, మేము [ఇక్కడ](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html) నుండి తీసుకున్న చిన్న మధుమేహ రోగుల డేటాసెట్తో పని చేస్తాము.
|
||||
|
||||
| | వయస్సు | లింగం | బిఎంఐ | బీపీ | S1 | S2 | S3 | S4 | S5 | S6 | Y |
|
||||
|---|-----|-----|-----|----|----|----|----|----|----|----|----|
|
||||
| 0 | 59 | 2 | 32.1 | 101. | 157 | 93.2 | 38.0 | 4. | 4.8598 | 87 | 151 |
|
||||
| 1 | 48 | 1 | 21.6 | 87.0 | 183 | 103.2 | 70. | 3. | 3.8918 | 69 | 75 |
|
||||
| 2 | 72 | 2 | 30.5 | 93.0 | 156 | 93.6 | 41.0 | 4.0 | 4. | 85 | 141 |
|
||||
| ... | ... | ... | ... | ...| ...| ...| ...| ...| ...| ...| ... |
|
||||
|
||||
## సూచనలు
|
||||
|
||||
* [అసైన్మెంట్ నోట్బుక్](assignment.ipynb) ను జూపిటర్ నోట్బుక్ వాతావరణంలో తెరవండి
|
||||
* నోట్బుక్లో పేర్కొన్న అన్ని పనులను పూర్తి చేయండి, అవి:
|
||||
* [ ] అన్ని విలువల కోసం సగటు విలువలు మరియు వ్యత్యాసం లెక్కించండి
|
||||
* [ ] లింగం ఆధారంగా BMI, BP మరియు Y కోసం బాక్స్ప్లాట్లు చిత్రించండి
|
||||
* [ ] వయస్సు, లింగం, BMI మరియు Y వేరియబుల్స్ పంపిణీ ఏమిటి?
|
||||
* [ ] వివిధ వేరియబుల్స్ మరియు వ్యాధి పురోగతికి (Y) మధ్య సంబంధాన్ని పరీక్షించండి
|
||||
* [ ] మగ మరియు ఆడల మధ్య మధుమేహ పురోగతి డిగ్రీ వేరుగా ఉందని హైపోథిసిస్ను పరీక్షించండి
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణాత్మక | సరిపడిన | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
అన్ని అవసరమైన పనులు పూర్తి, గ్రాఫికల్గా వివరించబడ్డాయి మరియు వివరణ ఇచ్చబడ్డాయి | ఎక్కువ భాగం పనులు పూర్తి, గ్రాఫ్లు మరియు/లేదా పొందిన విలువల నుండి వివరణలు లేదా ముఖ్యాంశాలు లేవు | సగటు/వ్యత్యాస లెక్కింపు మరియు ప్రాథమిక ప్లాట్లు మాత్రమే పూర్తి, డేటా నుండి ఎలాంటి తేలికపాటి నిర్ణయాలు తీసుకోలేదు
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
@ -0,0 +1,33 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "696a8474a01054281704cbfb09148949",
|
||||
"translation_date": "2025-12-19T13:22:49+00:00",
|
||||
"source_file": "1-Introduction/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# డేటా సైన్స్ పరిచయం
|
||||
|
||||

|
||||
> ఫోటో <a href="https://unsplash.com/@dawson2406?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">స్టీఫెన్ డాసన్</a> ద్వారా <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">అన్స్ప్లాష్</a>లో
|
||||
|
||||
ఈ పాఠాలలో, మీరు డేటా సైన్స్ ఎలా నిర్వచించబడిందో తెలుసుకుంటారు మరియు డేటా శాస్త్రవేత్తలు పరిగణించవలసిన నైతిక అంశాలను తెలుసుకుంటారు. మీరు డేటా ఎలా నిర్వచించబడిందో తెలుసుకుంటారు మరియు డేటా సైన్స్ యొక్క ప్రాథమిక అకాడమిక్ విభాగాలు అయిన గణాంకాలు మరియు సంభావ్యత గురించి కొంత తెలుసుకుంటారు.
|
||||
|
||||
### విషయాలు
|
||||
|
||||
1. [డేటా సైన్స్ నిర్వచనం](01-defining-data-science/README.md)
|
||||
2. [డేటా సైన్స్ నైతికత](02-ethics/README.md)
|
||||
3. [డేటా నిర్వచనం](03-defining-data/README.md)
|
||||
4. [గణాంకాలు మరియు సంభావ్యత పరిచయం](04-stats-and-probability/README.md)
|
||||
|
||||
### క్రెడిట్స్
|
||||
|
||||
ఈ పాఠాలు ❤️ తో [నిత్య నరసింహన్](https://twitter.com/nitya) మరియు [డ్మిత్రి సోష్నికోవ్](https://twitter.com/shwars) రాసారు.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,199 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "11739c7b40e7c6b16ad29e3df4e65862",
|
||||
"translation_date": "2025-12-19T15:46:41+00:00",
|
||||
"source_file": "2-Working-With-Data/05-relational-databases/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# Working with Data: Relational Databases
|
||||
|
||||
| ](../../sketchnotes/05-RelationalData.png)|
|
||||
|:---:|
|
||||
| Working With Data: Relational Databases - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
మీరు గతంలో సమాచారాన్ని నిల్వ చేయడానికి స్ప్రెడ్షీట్ ఉపయోగించిన అవకాశం ఉంది. మీకు వరుసలు మరియు కాలమ్స్ సెట్ ఉండేవి, అక్కడ వరుసలు సమాచారాన్ని (లేదా డేటాను) కలిగి ఉండేవి, మరియు కాలమ్స్ ఆ సమాచారాన్ని వివరించేవి (కొన్నిసార్లు మెటాడేటా అని పిలవబడుతుంది). ఒక రిలేషనల్ డేటాబేస్ ఈ కాలమ్స్ మరియు వరుసల ప్రాథమిక సూత్రంపై నిర్మించబడింది, ఇది మీకు సమాచారాన్ని అనేక పట్టికలలో విస్తరించడానికి అనుమతిస్తుంది. ఇది మీరు మరింత సంక్లిష్టమైన డేటాతో పని చేయడానికి, ప్రతిరూపణను నివారించడానికి, మరియు డేటాను అన్వేషించడంలో సౌలభ్యాన్ని కలిగిస్తుంది. relational database యొక్క సూత్రాలను పరిశీలిద్దాం.
|
||||
|
||||
## [Pre-lecture quiz](https://ff-quizzes.netlify.app/en/ds/quiz/8)
|
||||
|
||||
## It all starts with tables
|
||||
|
||||
ఒక relational database యొక్క ప్రాథమికంగా పట్టికలు ఉంటాయి. స్ప్రెడ్షీట్ లాగా, ఒక పట్టిక కాలమ్స్ మరియు వరుసల సమాహారం. వరుసలో మనం పని చేయదలచిన డేటా లేదా సమాచారం ఉంటుంది, ఉదాహరణకు ఒక నగర పేరు లేదా వర్షపాతం పరిమాణం. కాలమ్స్ వారు నిల్వ చేసే డేటాను వివరించును.
|
||||
|
||||
నగరాల గురించి సమాచారాన్ని నిల్వ చేయడానికి ఒక పట్టిక ప్రారంభిద్దాం. మనం వారి పేరు మరియు దేశం తో ప్రారంభించవచ్చు. మీరు దీన్ని క్రింది విధంగా పట్టికలో నిల్వ చేయవచ్చు:
|
||||
|
||||
| City | Country |
|
||||
| -------- | ------------- |
|
||||
| Tokyo | Japan |
|
||||
| Atlanta | United States |
|
||||
| Auckland | New Zealand |
|
||||
|
||||
**city**, **country** మరియు **population** అనే కాలమ్ పేర్లు నిల్వ చేస్తున్న డేటాను వివరించాయి, మరియు ప్రతి వరుస ఒక నగరానికి సంబంధించిన సమాచారాన్ని కలిగి ఉంది.
|
||||
|
||||
## The shortcomings of a single table approach
|
||||
|
||||
పైన ఉన్న పట్టిక మీకు సాపేక్షంగా పరిచితంగా అనిపించవచ్చు. మనం మన పెరుగుతున్న డేటాబేస్కు కొన్ని అదనపు డేటాను జోడిద్దాం - వార్షిక వర్షపాతం (మిల్లీమీటర్లలో). మనం 2018, 2019 మరియు 2020 సంవత్సరాలపై దృష్టి సారిద్దాం. టోక్యోకు జోడిస్తే, ఇది ఇలా ఉండవచ్చు:
|
||||
|
||||
| City | Country | Year | Amount |
|
||||
| ----- | ------- | ---- | ------ |
|
||||
| Tokyo | Japan | 2020 | 1690 |
|
||||
| Tokyo | Japan | 2019 | 1874 |
|
||||
| Tokyo | Japan | 2018 | 1445 |
|
||||
|
||||
మన పట్టిక గురించి మీరు ఏమి గమనిస్తారు? మీరు నగర పేరు మరియు దేశం పునరావృతం అవుతున్నట్లు గమనించవచ్చు. ఇది చాలా నిల్వను తీసుకోవచ్చు, మరియు అనవసరం గా అనేక కాపీలు ఉండటం అవసరం లేదు. చివరికి, టోక్యోకు మనం ఆసక్తి ఉన్న ఒకే పేరు ఉంది.
|
||||
|
||||
సరే, మరొకటి ప్రయత్నిద్దాం. ప్రతి సంవత్సరానికి కొత్త కాలమ్స్ జోడిద్దాం:
|
||||
|
||||
| City | Country | 2018 | 2019 | 2020 |
|
||||
| -------- | ------------- | ---- | ---- | ---- |
|
||||
| Tokyo | Japan | 1445 | 1874 | 1690 |
|
||||
| Atlanta | United States | 1779 | 1111 | 1683 |
|
||||
| Auckland | New Zealand | 1386 | 942 | 1176 |
|
||||
|
||||
ఇది వరుస పునరావృతాన్ని నివారిస్తుంది, కానీ కొన్ని ఇతర సవాళ్లను కలిగిస్తుంది. ప్రతి కొత్త సంవత్సరం వచ్చినప్పుడు మనం పట్టిక నిర్మాణాన్ని మార్చాలి. అదనంగా, మన డేటా పెరిగే కొద్దీ సంవత్సరాలను కాలమ్స్ గా ఉంచడం విలువలను పొందడం మరియు లెక్కించడం కష్టతరం చేస్తుంది.
|
||||
|
||||
కాబట్టి మనకు అనేక పట్టికలు మరియు సంబంధాలు అవసరం. మన డేటాను విడగొట్టి, పునరావృతాన్ని నివారించి, డేటాతో పని చేయడంలో మరింత సౌలభ్యం కలిగి ఉండవచ్చు.
|
||||
|
||||
## The concepts of relationships
|
||||
|
||||
మన డేటాకు తిరిగి వెళ్ళి, మనం దానిని ఎలా విభజించాలో నిర్ణయిద్దాం. మనం నగరాల పేరు మరియు దేశాన్ని నిల్వ చేయాలనుకుంటున్నాము, కాబట్టి ఇది ఒక పట్టికలో ఉత్తమంగా పనిచేస్తుంది.
|
||||
|
||||
| City | Country |
|
||||
| -------- | ------------- |
|
||||
| Tokyo | Japan |
|
||||
| Atlanta | United States |
|
||||
| Auckland | New Zealand |
|
||||
|
||||
కానీ తదుపరి పట్టికను సృష్టించే ముందు, ప్రతి నగరాన్ని ఎలా సూచించాలో తెలుసుకోవాలి. మనకు ఒక గుర్తింపు, ID లేదా (సాంకేతిక డేటాబేస్ పదజాలంలో) ప్రాథమిక కీ అవసరం. ప్రాథమిక కీ అనేది పట్టికలో ఒక నిర్దిష్ట వరుసను గుర్తించడానికి ఉపయోగించే విలువ. ఇది విలువ ఆధారంగా ఉండవచ్చు (ఉదాహరణకు నగర పేరు ఉపయోగించవచ్చు), కానీ ఇది సాధారణంగా సంఖ్య లేదా ఇతర గుర్తింపు ఉండాలి. ID ఎప్పుడూ మారకూడదు, ఎందుకంటే అది సంబంధాన్ని విరగడ చేస్తుంది. చాలా సందర్భాల్లో ప్రాథమిక కీ లేదా ID ఆటో-జనరేట్ అయిన సంఖ్యగా ఉంటుంది.
|
||||
|
||||
> ✅ Primary key is frequently abbreviated as PK
|
||||
|
||||
### cities
|
||||
|
||||
| city_id | City | Country |
|
||||
| ------- | -------- | ------------- |
|
||||
| 1 | Tokyo | Japan |
|
||||
| 2 | Atlanta | United States |
|
||||
| 3 | Auckland | New Zealand |
|
||||
|
||||
> ✅ మీరు ఈ పాఠంలో "id" మరియు "primary key" పదాలను మార్పిడి గా ఉపయోగిస్తున్నాము. ఇక్కడ ఉన్న సూత్రాలు DataFrames కు వర్తిస్తాయి, మీరు తరువాత అన్వేషిస్తారు. DataFrames "primary key" పదజాలం ఉపయోగించవు, కానీ అవి చాలా సమానంగా ప్రవర్తిస్తాయి.
|
||||
|
||||
మన cities పట్టిక సృష్టించిన తర్వాత, వర్షపాతం నిల్వ చేద్దాం. నగరంపై పూర్తి సమాచారాన్ని పునరావృతం చేయడం కాకుండా, మనం id ఉపయోగించవచ్చు. కొత్తగా సృష్టించిన పట్టికలో కూడా *id* కాలమ్ ఉండాలి, ఎందుకంటే అన్ని పట్టికలకు id లేదా ప్రాథమిక కీ ఉండాలి.
|
||||
|
||||
### rainfall
|
||||
|
||||
| rainfall_id | city_id | Year | Amount |
|
||||
| ----------- | ------- | ---- | ------ |
|
||||
| 1 | 1 | 2018 | 1445 |
|
||||
| 2 | 1 | 2019 | 1874 |
|
||||
| 3 | 1 | 2020 | 1690 |
|
||||
| 4 | 2 | 2018 | 1779 |
|
||||
| 5 | 2 | 2019 | 1111 |
|
||||
| 6 | 2 | 2020 | 1683 |
|
||||
| 7 | 3 | 2018 | 1386 |
|
||||
| 8 | 3 | 2019 | 942 |
|
||||
| 9 | 3 | 2020 | 1176 |
|
||||
|
||||
కొత్తగా సృష్టించిన **rainfall** పట్టికలో ఉన్న **city_id** కాలమ్ గమనించండి. ఈ కాలమ్ విలువలు **cities** పట్టికలోని IDs ను సూచిస్తాయి. సాంకేతిక relational data పదజాలంలో, దీనిని **foreign key** అంటారు; ఇది మరొక పట్టిక నుండి ప్రాథమిక కీ. మీరు దీన్ని ఒక సూచన లేదా పాయింటర్ గా భావించవచ్చు. **city_id** 1 టోక్యోను సూచిస్తుంది.
|
||||
|
||||
> [!NOTE]
|
||||
> Foreign key is frequently abbreviated as FK
|
||||
|
||||
## Retrieving the data
|
||||
|
||||
మన డేటాను రెండు పట్టికలుగా విడగొట్టిన తర్వాత, దాన్ని ఎలా పొందాలో మీరు ఆశ్చర్యపోతున్నారా? మనం MySQL, SQL Server లేదా Oracle వంటి relational database ఉపయోగిస్తే, మనం Structured Query Language లేదా SQL అనే భాషను ఉపయోగించవచ్చు. SQL (కొన్నిసార్లు sequel అని ఉచ్చరించబడుతుంది) relational database లో డేటాను పొందడానికి మరియు మార్చడానికి ఉపయోగించే ప్రామాణిక భాష.
|
||||
|
||||
డేటాను పొందడానికి మీరు `SELECT` ఆజ్ఞను ఉపయోగిస్తారు. ప్రాథమికంగా, మీరు చూడదలచిన కాలమ్స్ ను **select** చేస్తారు మరియు అవి ఉన్న పట్టిక నుండి **from** చేస్తారు. మీరు నగరాల పేర్లను మాత్రమే ప్రదర్శించాలనుకుంటే, మీరు క్రింది విధంగా ఉపయోగించవచ్చు:
|
||||
|
||||
```sql
|
||||
SELECT city
|
||||
FROM cities;
|
||||
|
||||
-- Output:
|
||||
-- Tokyo
|
||||
-- Atlanta
|
||||
-- Auckland
|
||||
```
|
||||
|
||||
`SELECT` అనేది మీరు కాలమ్స్ జాబితా చేసే చోట, మరియు `FROM` అనేది మీరు పట్టికలను జాబితా చేసే చోట.
|
||||
|
||||
> [!NOTE]
|
||||
> SQL సింటాక్స్ కేస్-ఇన్సెన్సిటివ్, అంటే `select` మరియు `SELECT` ఒకే అర్థం. అయితే, మీరు ఉపయోగిస్తున్న డేటాబేస్ రకం ఆధారంగా కాలమ్స్ మరియు పట్టికలు కేస్ సెన్సిటివ్ కావచ్చు. అందువల్ల, ప్రోగ్రామింగ్ లో ప్రతిదీ కేస్ సెన్సిటివ్ గా పరిగణించడం ఉత్తమ ఆచారం. SQL ప్రశ్నలు రాయేటప్పుడు సాధారణంగా కీవర్డ్స్ ను పెద్ద అక్షరాల్లో వ్రాయడం సాంప్రదాయం.
|
||||
|
||||
పై ప్రశ్న అన్ని నగరాలను ప్రదర్శిస్తుంది. మనం కేవలం న్యూజీలాండ్ లోని నగరాలను ప్రదర్శించాలనుకుంటే, మనకు ఒక ఫిల్టర్ అవసరం. దీనికి SQL కీవర్డ్ `WHERE`, లేదా "ఎక్కడ ఏదైనా నిజం" ఉపయోగిస్తారు.
|
||||
|
||||
```sql
|
||||
SELECT city
|
||||
FROM cities
|
||||
WHERE country = 'New Zealand';
|
||||
|
||||
-- Output:
|
||||
-- Auckland
|
||||
```
|
||||
|
||||
## Joining data
|
||||
|
||||
ఇప్పటి వరకు మనం ఒకే పట్టిక నుండి డేటాను పొందాము. ఇప్పుడు మనం **cities** మరియు **rainfall** నుండి డేటాను కలపాలనుకుంటున్నాము. ఇది *joining* ద్వారా చేయబడుతుంది. మీరు రెండు పట్టికల మధ్య ఒక సీమ్ సృష్టించి, ప్రతి పట్టికలోని ఒక కాలమ్ విలువలను సరిపోల్చుతారు.
|
||||
|
||||
మన ఉదాహరణలో, మనం **rainfall** లోని **city_id** కాలమ్ ను **cities** లోని **city_id** కాలమ్ తో సరిపోల్చుతాము. ఇది వర్షపాతం విలువను దాని సంబంధిత నగరంతో సరిపోల్చుతుంది. మనం చేసే జాయిన్ రకం *inner* జాయిన్ అని పిలవబడుతుంది, అంటే ఎలాంటి వరుసలు ఇతర పట్టికలో ఏదైనా సరిపోలకపోతే అవి ప్రదర్శించబడవు. మన సందర్భంలో ప్రతి నగరానికి వర్షపాతం ఉంది, కాబట్టి అన్ని ప్రదర్శించబడతాయి.
|
||||
|
||||
2019 సంవత్సరానికి మన నగరాల వర్షపాతం పొందుదాం.
|
||||
|
||||
మనం దీన్ని దశలవారీగా చేస్తాము. మొదటి దశ డేటాను కలపడం, సీమ్ కోసం కాలమ్స్ సూచించడం - **city_id** మునుపటి విధంగా.
|
||||
|
||||
```sql
|
||||
SELECT cities.city
|
||||
rainfall.amount
|
||||
FROM cities
|
||||
INNER JOIN rainfall ON cities.city_id = rainfall.city_id
|
||||
```
|
||||
|
||||
మనం కావలసిన రెండు కాలమ్స్ మరియు పట్టికలను **city_id** ద్వారా కలపాలని హైలైట్ చేశాము. ఇప్పుడు మనం `WHERE` స్టేట్మెంట్ జోడించి కేవలం 2019 సంవత్సరాన్ని ఫిల్టర్ చేయవచ్చు.
|
||||
|
||||
```sql
|
||||
SELECT cities.city
|
||||
rainfall.amount
|
||||
FROM cities
|
||||
INNER JOIN rainfall ON cities.city_id = rainfall.city_id
|
||||
WHERE rainfall.year = 2019
|
||||
|
||||
-- Output
|
||||
|
||||
-- city | amount
|
||||
-- -------- | ------
|
||||
-- Tokyo | 1874
|
||||
-- Atlanta | 1111
|
||||
-- Auckland | 942
|
||||
```
|
||||
|
||||
## Summary
|
||||
|
||||
Relational databases అనేవి సమాచారాన్ని అనేక పట్టికల మధ్య విభజించి, ప్రదర్శన మరియు విశ్లేషణ కోసం తిరిగి కలిపే విధానంపై ఆధారపడి ఉంటాయి. ఇది లెక్కింపులు చేయడానికి మరియు డేటాను మానిప్యులేట్ చేయడానికి అధిక స్థాయి సౌలభ్యాన్ని అందిస్తుంది. మీరు relational database యొక్క ప్రాథమిక సూత్రాలను మరియు రెండు పట్టికల మధ్య జాయిన్ ఎలా చేయాలో చూశారు.
|
||||
|
||||
## 🚀 Challenge
|
||||
|
||||
ఇంటర్నెట్ లో అనేక relational databases అందుబాటులో ఉన్నాయి. మీరు పై నేర్చుకున్న నైపుణ్యాలను ఉపయోగించి డేటాను అన్వేషించవచ్చు.
|
||||
|
||||
## Post-Lecture Quiz
|
||||
|
||||
## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/quiz/9)
|
||||
|
||||
## Review & Self Study
|
||||
|
||||
SQL మరియు relational database సూత్రాలపై మీ అన్వేషణ కొనసాగించడానికి [Microsoft Learn](https://docs.microsoft.com/learn?WT.mc_id=academic-77958-bethanycheum) లో అనేక వనరులు అందుబాటులో ఉన్నాయి
|
||||
|
||||
- [Describe concepts of relational data](https://docs.microsoft.com//learn/modules/describe-concepts-of-relational-data?WT.mc_id=academic-77958-bethanycheum)
|
||||
- [Get Started Querying with Transact-SQL](https://docs.microsoft.com//learn/paths/get-started-querying-with-transact-sql?WT.mc_id=academic-77958-bethanycheum) (Transact-SQL అనేది SQL యొక్క ఒక వెర్షన్)
|
||||
- [SQL content on Microsoft Learn](https://docs.microsoft.com/learn/browse/?products=azure-sql-database%2Csql-server&expanded=azure&WT.mc_id=academic-77958-bethanycheum)
|
||||
|
||||
## Assignment
|
||||
|
||||
[Displaying airport data](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకం వల్ల కలిగే ఏవైనా అపార్థాలు లేదా తప్పుదారుల బాధ్యత మేము తీసుకోము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,76 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "25b37acdfb2452917c1aa2e2ca44317a",
|
||||
"translation_date": "2025-12-19T15:50:41+00:00",
|
||||
"source_file": "2-Working-With-Data/05-relational-databases/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# విమానాశ్రయ డేటా ప్రదర్శన
|
||||
|
||||
మీకు విమానాశ్రయాల గురించి సమాచారం కలిగిన [డేటాబేస్](https://raw.githubusercontent.com/Microsoft/Data-Science-For-Beginners/main/2-Working-With-Data/05-relational-databases/airports.db) అందించబడింది, ఇది [SQLite](https://sqlite.org/index.html) పై నిర్మించబడింది. స్కీమా క్రింద చూపబడింది. మీరు [Visual Studio Code](https://code.visualstudio.com?WT.mc_id=academic-77958-bethanycheum)లో [SQLite విస్తరణ](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) ఉపయోగించి వివిధ నగరాల విమానాశ్రయాల గురించి సమాచారం ప్రదర్శించవచ్చు.
|
||||
|
||||
## సూచనలు
|
||||
|
||||
అసైన్మెంట్ ప్రారంభించడానికి, మీరు కొన్ని దశలను అనుసరించాలి. మీరు కొంత టూలింగ్ ఇన్స్టాల్ చేసి నమూనా డేటాబేస్ను డౌన్లోడ్ చేసుకోవాలి.
|
||||
|
||||
### మీ సిస్టమ్ సెటప్ చేయండి
|
||||
|
||||
మీరు Visual Studio Code మరియు SQLite విస్తరణను ఉపయోగించి డేటాబేస్తో ఇంటరాక్ట్ చేయవచ్చు.
|
||||
|
||||
1. [code.visualstudio.com](https://code.visualstudio.com?WT.mc_id=academic-77958-bethanycheum) కు వెళ్లి Visual Studio Code ఇన్స్టాల్ చేయడానికి సూచనలను అనుసరించండి
|
||||
1. మార్కెట్ప్లేస్ పేజీలో సూచించినట్లుగా [SQLite విస్తరణ](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) ఇన్స్టాల్ చేయండి
|
||||
|
||||
### డేటాబేస్ డౌన్లోడ్ చేసి తెరవండి
|
||||
|
||||
తర్వాత మీరు డేటాబేస్ను డౌన్లోడ్ చేసి తెరవాలి.
|
||||
|
||||
1. [GitHub నుండి డేటాబేస్ ఫైల్ డౌన్లోడ్ చేయండి](https://raw.githubusercontent.com/Microsoft/Data-Science-For-Beginners/main/2-Working-With-Data/05-relational-databases/airports.db) మరియు దాన్ని ఒక డైరెక్టరీలో సేవ్ చేయండి
|
||||
1. Visual Studio Code తెరవండి
|
||||
1. **Ctl-Shift-P** (లేదా Mac లో **Cmd-Shift-P**) నొక్కి `SQLite: Open database` టైప్ చేసి SQLite విస్తరణలో డేటాబేస్ తెరవండి
|
||||
1. **Choose database from file** ఎంచుకుని మీరు ముందుగా డౌన్లోడ్ చేసిన **airports.db** ఫైల్ను తెరవండి
|
||||
1. డేటాబేస్ తెరవబడిన తర్వాత (స్క్రీన్లో అప్డేట్ కనిపించదు), కొత్త క్వెరీ విండో సృష్టించడానికి **Ctl-Shift-P** (లేదా Mac లో **Cmd-Shift-P**) నొక్కి `SQLite: New query` టైప్ చేయండి
|
||||
|
||||
ఒకసారి తెరవబడిన తర్వాత, కొత్త క్వెరీ విండోను డేటాబేస్పై SQL స్టేట్మెంట్లు నడపడానికి ఉపయోగించవచ్చు. డేటాబేస్పై క్వెరీలు నడపడానికి **Ctl-Shift-Q** (లేదా Mac లో **Cmd-Shift-Q**) ఆదేశాన్ని ఉపయోగించవచ్చు.
|
||||
|
||||
> [!NOTE]
|
||||
> SQLite విస్తరణ గురించి మరింత సమాచారం కోసం, మీరు [డాక్యుమెంటేషన్](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) ను చూడవచ్చు
|
||||
|
||||
## డేటాబేస్ స్కీమా
|
||||
|
||||
డేటాబేస్ స్కీమా అనేది దాని పట్టిక రూపకల్పన మరియు నిర్మాణం. **airports** డేటాబేస్లో రెండు పట్టికలు ఉన్నాయి, `cities`, ఇది యునైటెడ్ కింగ్డమ్ మరియు ఐర్లాండ్లోని నగరాల జాబితాను కలిగి ఉంది, మరియు `airports`, ఇది అన్ని విమానాశ్రయాల జాబితాను కలిగి ఉంది. కొన్ని నగరాలకు బహుళ విమానాశ్రయాలు ఉండవచ్చు కాబట్టి, సమాచారం నిల్వ చేయడానికి రెండు పట్టికలు సృష్టించబడ్డాయి. ఈ వ్యాయామంలో మీరు వివిధ నగరాల సమాచారం ప్రదర్శించడానికి జాయిన్లను ఉపయోగిస్తారు.
|
||||
|
||||
| Cities |
|
||||
| ---------------- |
|
||||
| id (PK, integer) |
|
||||
| city (text) |
|
||||
| country (text) |
|
||||
|
||||
| Airports |
|
||||
| -------------------------------- |
|
||||
| id (PK, integer) |
|
||||
| name (text) |
|
||||
| code (text) |
|
||||
| city_id (FK to id in **Cities**) |
|
||||
|
||||
## అసైన్మెంట్
|
||||
|
||||
క్రింది సమాచారాన్ని తిరిగి ఇవ్వడానికి క్వెరీలు సృష్టించండి:
|
||||
|
||||
1. `Cities` పట్టికలోని అన్ని నగరాల పేర్లు
|
||||
1. `Cities` పట్టికలోని ఐర్లాండ్లోని అన్ని నగరాలు
|
||||
1. వారి నగరం మరియు దేశంతో కూడిన అన్ని విమానాశ్రయాల పేర్లు
|
||||
1. లండన్, యునైటెడ్ కింగ్డమ్లోని అన్ని విమానాశ్రయాలు
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
| అద్భుతమైన | సరిపడిన | మెరుగుదల అవసరం |
|
||||
| --------- | -------- | ----------------- |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,35 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "f824bfdb8b12d33293913f76f5c787c5",
|
||||
"translation_date": "2025-12-19T15:40:41+00:00",
|
||||
"source_file": "2-Working-With-Data/06-non-relational/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# సోడా లాభాలు
|
||||
|
||||
## సూచనలు
|
||||
|
||||
[Coca Cola Co స్ప్రెడ్షీట్](../../../../2-Working-With-Data/06-non-relational/CocaColaCo.xlsx) లో కొన్ని లెక్కింపులు లేవు. మీ పని:
|
||||
|
||||
1. FY '15, '16, '17, మరియు '18 యొక్క స్థూల లాభాలను లెక్కించండి
|
||||
- స్థూల లాభం = నికర ఆపరేటింగ్ ఆదాయాలు - సరుకుల వ్యయం
|
||||
1. అన్ని స్థూల లాభాల సగటును లెక్కించండి. దీన్ని ఒక ఫంక్షన్ తో చేయడానికి ప్రయత్నించండి.
|
||||
- సగటు = స్థూల లాభాల మొత్తం భాగించబడిన ఆర్థిక సంవత్సరాల సంఖ్య (10)
|
||||
- [AVERAGE ఫంక్షన్](https://support.microsoft.com/en-us/office/average-function-047bac88-d466-426c-a32b-8f33eb960cf6) పై డాక్యుమెంటేషన్
|
||||
1. ఇది ఒక ఎక్సెల్ ఫైల్, కానీ ఏ స్ప్రెడ్షీట్ ప్లాట్ఫారమ్లోనైనా సవరించదగినది కావాలి
|
||||
|
||||
[డేటా మూలం క్రెడిట్ Yiyi Wang కు](https://www.kaggle.com/yiyiwang0826/cocacola-excel)
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణాత్మక | తగినంత | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,39 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "dc8f035ce92e4eaa078ab19caa68267a",
|
||||
"translation_date": "2025-12-19T15:36:44+00:00",
|
||||
"source_file": "2-Working-With-Data/07-python/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# Pythonలో డేటా ప్రాసెసింగ్ కోసం అసైన్మెంట్
|
||||
|
||||
ఈ అసైన్మెంట్లో, మేము మా ఛాలెంజ్లలో అభివృద్ధి చేయడం ప్రారంభించిన కోడ్పై మీరు వివరించమని అడుగుతాము. అసైన్మెంట్ రెండు భాగాలుగా ఉంటుంది:
|
||||
|
||||
## COVID-19 వ్యాప్తి మోడలింగ్
|
||||
|
||||
- [ ] 5-6 వేర్వేరు దేశాల *R<sub>t</sub>* గ్రాఫ్లను ఒక గ్రాఫ్లో సరిపోల్చడానికి లేదా పక్కపక్కనే ఉన్న అనేక గ్రాఫ్లను ఉపయోగించి ప్లాట్ చేయండి
|
||||
- [ ] మరణాలు మరియు కోలుకున్న సంఖ్యలు సంక్రమిత కేసుల సంఖ్యతో ఎలా సంబంధం ఉన్నాయో చూడండి.
|
||||
- [ ] ఒక సాధారణ వ్యాధి ఎంతకాలం ఉంటుంది అనేది సంక్రమణ రేటు మరియు మరణాల రేటును దృశ్యంగా సంబంధం పెట్టుకొని, కొన్ని అసాధారణతలను చూసి కనుగొనండి. మీరు ఆ విషయం తెలుసుకోవడానికి వేర్వేరు దేశాలను చూడవలసి ఉండవచ్చు.
|
||||
- [ ] మరణాల రేటును లెక్కించండి మరియు అది కాలక్రమేణా ఎలా మారుతుందో చూడండి. *లెక్కింపులు చేయడానికి ముందు వ్యాధి కాలం రోజుల్లో తీసుకుని ఒక టైమ్ సిరీస్ను షిఫ్ట్ చేయవలసి ఉండవచ్చు*
|
||||
|
||||
## COVID-19 పేపర్లు విశ్లేషణ
|
||||
|
||||
- [ ] వేర్వేరు మందుల సహ-సంఘటన మ్యాట్రిక్స్ను నిర్మించండి, మరియు ఏ మందులు తరచుగా కలిసి ఉంటాయో చూడండి (అంటే ఒక సారాంశంలో పేర్కొనబడినవి). మందులు మరియు నిర్ధారణల కోసం సహ-సంఘటన మ్యాట్రిక్స్ నిర్మించడానికి కోడ్ను మీరు సవరించవచ్చు.
|
||||
- [ ] ఈ మ్యాట్రిక్స్ను హీట్మ్యాప్ ఉపయోగించి దృశ్యీకరించండి.
|
||||
- [ ] ఒక విస్తృత లక్ష్యంగా, మందుల సహ-సంఘటనను [చోర్డ్ డయాగ్రామ్](https://en.wikipedia.org/wiki/Chord_diagram) ఉపయోగించి దృశ్యీకరించండి. [ఈ లైబ్రరీ](https://pypi.org/project/chord/) చోర్డ్ డయాగ్రామ్ గీయడంలో మీకు సహాయపడవచ్చు.
|
||||
- [ ] మరో విస్తృత లక్ష్యంగా, వేర్వేరు మందుల మోతాదులను (ఉదాహరణకు *take 400mg of chloroquine daily* లో **400mg**) రెగ్యులర్ ఎక్స్ప్రెషన్స్ ఉపయోగించి తీసుకోండి, మరియు వేర్వేరు మందుల కోసం వేర్వేరు మోతాదులను చూపించే డేటాఫ్రేమ్ను నిర్మించండి. **గమనిక**: మందు పేరుకు సమీపంలో ఉన్న సంఖ్యా విలువలను పరిగణించండి.
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణగా | సరిపడా | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
అన్ని పనులు పూర్తయి, గ్రాఫికల్గా వివరించబడి, రెండు విస్తృత లక్ష్యాలలో కనీసం ఒకటి చేర్చబడింది | 5 కంటే ఎక్కువ పనులు పూర్తయి, విస్తృత లక్ష్యాలు ప్రయత్నించబడలేదు లేదా ఫలితాలు స్పష్టంగా లేవు | 5 కంటే తక్కువ (కానీ 3 కంటే ఎక్కువ) పనులు పూర్తయి, దృశ్యీకరణలు అంశాన్ని వివరించడంలో సహాయపడవు
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
@ -0,0 +1,350 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "1b560955ff39a2bcf2a049fce474a951",
|
||||
"translation_date": "2025-12-19T15:41:26+00:00",
|
||||
"source_file": "2-Working-With-Data/08-data-preparation/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# Working with Data: Data Preparation
|
||||
|
||||
| ](../../sketchnotes/08-DataPreparation.png)|
|
||||
|:---:|
|
||||
|డేటా ప్రిపరేషన్ - _స్కెచ్ నోట్ [@nitya](https://twitter.com/nitya) ద్వారా_ |
|
||||
|
||||
## [పూర్వ-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/14)
|
||||
|
||||
|
||||
|
||||
దాని మూలం ఆధారంగా, రా డేటా కొన్ని అసంగతులను కలిగి ఉండవచ్చు, ఇవి విశ్లేషణ మరియు మోడలింగ్లో సవాళ్లను సృష్టిస్తాయి. మరొక మాటలో చెప్పాలంటే, ఈ డేటాను "గందరగోళంగా" వర్గీకరించవచ్చు మరియు దీన్ని శుభ్రం చేయాల్సి ఉంటుంది. ఈ పాఠం లోపాలు, తప్పు లేదా అసంపూర్ణ డేటా సవాళ్లను నిర్వహించడానికి డేటాను శుభ్రం చేయడం మరియు మార్చడం కోసం సాంకేతికతలపై దృష్టి సారిస్తుంది. ఈ పాఠంలో కవర్ చేయబడిన విషయాలు Python మరియు Pandas లైబ్రరీని ఉపయోగించి ఉంటాయి మరియు ఈ డైరెక్టరీలోని [నోట్బుక్లో ప్రదర్శించబడతాయి](notebook.ipynb).
|
||||
|
||||
## డేటాను శుభ్రం చేయడం యొక్క ప్రాముఖ్యత
|
||||
|
||||
- **వినియోగం మరియు పునర్వినియోగం సౌలభ్యం**: డేటా సక్రమంగా క్రమబద్ధీకరించబడినప్పుడు మరియు సాధారణీకరించబడినప్పుడు, దాన్ని శోధించడం, ఉపయోగించడం మరియు ఇతరులతో పంచుకోవడం సులభం అవుతుంది.
|
||||
|
||||
- **సమరూపత**: డేటా సైన్స్ తరచుగా ఒక కంటే ఎక్కువ డేటాసెట్లతో పని చేయాల్సి ఉంటుంది, వివిధ మూలాల నుండి డేటాసెట్లను కలపాల్సి ఉంటుంది. ప్రతి వ్యక్తిగత డేటా సెట్ సాధారణ ప్రమాణీకరణ కలిగి ఉండటం ద్వారా, అవి ఒకే డేటాసెట్గా విలీనం చేసినప్పుడు కూడా డేటా ఉపయోగకరంగా ఉంటుంది.
|
||||
|
||||
- **మోడల్ ఖచ్చితత్వం**: శుభ్రం చేయబడిన డేటా దానిపై ఆధారపడి ఉన్న మోడల్స్ యొక్క ఖచ్చితత్వాన్ని మెరుగుపరుస్తుంది.
|
||||
|
||||
## సాధారణ శుభ్రపరిచే లక్ష్యాలు మరియు వ్యూహాలు
|
||||
|
||||
- **డేటాసెట్ను అన్వేషించడం**: డేటా అన్వేషణ, ఇది [తరువాతి పాఠంలో](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/4-Data-Science-Lifecycle/15-analyzing) కవర్ చేయబడింది, మీరు శుభ్రం చేయాల్సిన డేటాను కనుగొనడంలో సహాయపడుతుంది. డేటాసెట్లో విలువలను దృశ్యంగా పరిశీలించడం మిగిలిన భాగం ఎలా ఉంటుందో అంచనా వేయడానికి లేదా పరిష్కరించవలసిన సమస్యల గురించి ఆలోచన ఇవ్వవచ్చు. అన్వేషణలో ప్రాథమిక క్వెరీలు, దృశ్యీకరణలు మరియు నమూనాలు ఉండవచ్చు.
|
||||
|
||||
- **ఫార్మాటింగ్**: మూలం ఆధారంగా, డేటా ప్రదర్శనలో అసంగతులు ఉండవచ్చు. ఇది విలువను శోధించడంలో మరియు ప్రాతినిధ్యం వహించడంలో సమస్యలు సృష్టించవచ్చు, ఇది డేటాసెట్లో కనిపిస్తే కూడా దృశ్యీకరణలలో లేదా క్వెరీ ఫలితాలలో సరిగ్గా ప్రాతినిధ్యం ఇవ్వబడదు. సాధారణ ఫార్మాటింగ్ సమస్యలు స్పేస్, తేదీలు మరియు డేటా రకాల పరిష్కారాలను కలిగి ఉంటాయి. ఫార్మాటింగ్ సమస్యలను పరిష్కరించడం సాధారణంగా డేటాను ఉపయోగిస్తున్న వ్యక్తుల బాధ్యత. ఉదాహరణకు, తేదీలు మరియు సంఖ్యలు ఎలా ప్రదర్శించబడతాయో దేశం ప్రకారం భిన్నంగా ఉండవచ్చు.
|
||||
|
||||
- **నకిలీలు**: ఒక విలువకు ఒక కంటే ఎక్కువ సంభవాలు ఉంటే, అది తప్పు ఫలితాలను ఉత్పత్తి చేయవచ్చు మరియు సాధారణంగా తొలగించాలి. ఇది రెండు లేదా అంతకంటే ఎక్కువ డేటాసెట్లను కలపడం సమయంలో సాధారణం. అయితే, కలిపిన డేటాసెట్లలో నకిలీ భాగాలు అదనపు సమాచారాన్ని అందించవచ్చు మరియు వాటిని నిలుపుకోవాల్సి ఉండవచ్చు.
|
||||
|
||||
- **లేకపోయిన డేటా**: లేకపోయిన డేటా తప్పు మరియు బలహీన లేదా పక్షపాత ఫలితాలను కలిగించవచ్చు. కొన్ని సార్లు ఈ సమస్యలను డేటాను "రిలోడ్" చేయడం, లెక్కింపు మరియు కోడ్ (Python వంటి) తో లేకపోయిన విలువలను నింపడం లేదా విలువను మరియు సంబంధిత డేటాను తొలగించడం ద్వారా పరిష్కరించవచ్చు. డేటా ఎందుకు లేకపోయిందో మరియు ఎలా లేకపోయిందో ఆధారంగా ఈ విలువలను పరిష్కరించడానికి తీసుకునే చర్యలు మారవచ్చు.
|
||||
|
||||
## DataFrame సమాచారం అన్వేషణ
|
||||
> **అభ్యాస లక్ష్యం:** ఈ ఉపవిభాగం చివరికి, pandas DataFrames లో నిల్వ ఉన్న డేటా గురించి సాధారణ సమాచారాన్ని కనుగొనడంలో మీరు సౌకర్యంగా ఉండాలి.
|
||||
|
||||
మీరు మీ డేటాను pandas లో లోడ్ చేసిన తర్వాత, అది ఎక్కువగా DataFrame లో ఉంటుంది (వివరణ కోసం గత [పాఠం](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/07-python#dataframe) చూడండి). అయితే, మీ DataFrame లో 60,000 వరుసలు మరియు 400 కాలమ్స్ ఉంటే, మీరు ఏం పని చేస్తున్నారో ఎలా అర్థం చేసుకోవాలి? అదృష్టవశాత్తు, [pandas](https://pandas.pydata.org/) DataFrame గురించి మొత్తం సమాచారం మరియు మొదటి మరియు చివరి కొన్ని వరుసలను త్వరగా చూడటానికి సౌకర్యవంతమైన సాధనాలను అందిస్తుంది.
|
||||
|
||||
ఈ ఫంక్షనాలిటీని అన్వేషించడానికి, Python scikit-learn లైబ్రరీని దిగుమతి చేసుకుని ఒక ప్రసిద్ధ డేటాసెట్: **Iris డేటా సెట్** ఉపయోగిస్తాము.
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
from sklearn.datasets import load_iris
|
||||
|
||||
iris = load_iris()
|
||||
iris_df = pd.DataFrame(data=iris['data'], columns=iris['feature_names'])
|
||||
```
|
||||
| |sepal length (cm)|sepal width (cm)|petal length (cm)|petal width (cm)|
|
||||
|----------------------------------------|-----------------|----------------|-----------------|----------------|
|
||||
|0 |5.1 |3.5 |1.4 |0.2 |
|
||||
|1 |4.9 |3.0 |1.4 |0.2 |
|
||||
|2 |4.7 |3.2 |1.3 |0.2 |
|
||||
|3 |4.6 |3.1 |1.5 |0.2 |
|
||||
|4 |5.0 |3.6 |1.4 |0.2 |
|
||||
|
||||
- **DataFrame.info**: మొదలు పెట్టడానికి, `info()` పద్ధతి DataFrame లో ఉన్న కంటెంట్ యొక్క సారాంశాన్ని ప్రింట్ చేయడానికి ఉపయోగిస్తారు. ఈ డేటాసెట్ను చూద్దాం:
|
||||
```python
|
||||
iris_df.info()
|
||||
```
|
||||
```
|
||||
RangeIndex: 150 entries, 0 to 149
|
||||
Data columns (total 4 columns):
|
||||
# Column Non-Null Count Dtype
|
||||
--- ------ -------------- -----
|
||||
0 sepal length (cm) 150 non-null float64
|
||||
1 sepal width (cm) 150 non-null float64
|
||||
2 petal length (cm) 150 non-null float64
|
||||
3 petal width (cm) 150 non-null float64
|
||||
dtypes: float64(4)
|
||||
memory usage: 4.8 KB
|
||||
```
|
||||
ఇందులో, *Iris* డేటాసెట్ 150 ఎంట్రీలు నాలుగు కాలమ్స్ లో కలిగి ఉంది మరియు ఎటువంటి నల్ ఎంట్రీలు లేవు. అన్ని డేటా 64-బిట్ ఫ్లోటింగ్-పాయింట్ సంఖ్యలుగా నిల్వ చేయబడింది.
|
||||
|
||||
- **DataFrame.head()**: తరువాత, DataFrame యొక్క వాస్తవ కంటెంట్ను తనిఖీ చేయడానికి, `head()` పద్ధతిని ఉపయోగిస్తాము. మన `iris_df` మొదటి కొన్ని వరుసలు ఎలా ఉంటాయో చూద్దాం:
|
||||
```python
|
||||
iris_df.head()
|
||||
```
|
||||
```
|
||||
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
|
||||
0 5.1 3.5 1.4 0.2
|
||||
1 4.9 3.0 1.4 0.2
|
||||
2 4.7 3.2 1.3 0.2
|
||||
3 4.6 3.1 1.5 0.2
|
||||
4 5.0 3.6 1.4 0.2
|
||||
```
|
||||
- **DataFrame.tail()**: విరుద్ధంగా, DataFrame చివరి కొన్ని వరుసలను తనిఖీ చేయడానికి, `tail()` పద్ధతిని ఉపయోగిస్తాము:
|
||||
```python
|
||||
iris_df.tail()
|
||||
```
|
||||
```
|
||||
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
|
||||
145 6.7 3.0 5.2 2.3
|
||||
146 6.3 2.5 5.0 1.9
|
||||
147 6.5 3.0 5.2 2.0
|
||||
148 6.2 3.4 5.4 2.3
|
||||
149 5.9 3.0 5.1 1.8
|
||||
```
|
||||
> **సారాంశం:** DataFrame లో సమాచారం గురించి మెటాడేటాను లేదా మొదటి మరియు చివరి కొన్ని విలువలను చూసి కూడా, మీరు పని చేస్తున్న డేటా యొక్క పరిమాణం, ఆకారం మరియు కంటెంట్ గురించి తక్షణ ఆలోచన పొందవచ్చు.
|
||||
|
||||
## లేకపోయిన డేటాతో వ్యవహరించడం
|
||||
> **అభ్యాస లక్ష్యం:** ఈ ఉపవిభాగం చివరికి, మీరు DataFrames నుండి నల్ విలువలను ఎలా మార్చాలి లేదా తొలగించాలో తెలుసుకోవాలి.
|
||||
|
||||
మీరు ఉపయోగించాలనుకునే (లేదా ఉపయోగించాల్సి ఉన్న) డేటాసెట్లలో ఎక్కువసార్లు లేకపోయిన విలువలు ఉంటాయి. లేకపోయిన డేటాను ఎలా నిర్వహించాలో నిర్ణయించడం మీ తుది విశ్లేషణ మరియు వాస్తవ ప్రపంచ ఫలితాలపై సున్నితమైన వ్యత్యాసాలను కలిగించవచ్చు.
|
||||
|
||||
Pandas రెండు విధాలుగా లేకపోయిన విలువలను నిర్వహిస్తుంది. మీరు గత సెక్షన్లలో చూసిన మొదటి: `NaN`, లేదా Not a Number. ఇది వాస్తవానికి IEEE ఫ్లోటింగ్-పాయింట్ స్పెసిఫికేషన్లో భాగమైన ప్రత్యేక విలువ మరియు ఇది కేవలం లేకపోయిన ఫ్లోటింగ్-పాయింట్ విలువలను సూచించడానికి ఉపయోగించబడుతుంది.
|
||||
|
||||
ఫ్లోట్స్ తప్ప మరొక విలువలకు pandas Python `None` ఆబ్జెక్ట్ను ఉపయోగిస్తుంది. మీరు రెండు వేర్వేరు రకాల విలువలను ఎదుర్కొంటారని ఆశ్చర్యపోవచ్చు, కానీ ఈ డిజైన్ ఎంపికకు ప్రోగ్రామాటిక్ కారణాలు ఉన్నాయి మరియు ప్రాక్టికల్గా, ఈ మార్గం pandas కు చాలా సందర్భాల్లో మంచి సమతుల్యతను అందిస్తుంది. అయినప్పటికీ, `None` మరియు `NaN` రెండూ ఉపయోగించడంలో పరిమితులు కలిగి ఉంటాయి, వాటిని ఎలా ఉపయోగించాలో జాగ్రత్తగా ఉండాలి.
|
||||
|
||||
`NaN` మరియు `None` గురించి మరింత తెలుసుకోండి [నోట్బుక్](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb) నుండి!
|
||||
|
||||
- **నల్ విలువలను గుర్తించడం**: `pandas` లో, `isnull()` మరియు `notnull()` పద్ధతులు నల్ డేటాను గుర్తించడానికి ప్రధాన పద్ధతులు. ఇవి రెండూ మీ డేటాపై బూలియన్ మాస్క్లను ఇస్తాయి. `NaN` విలువల కోసం `numpy` ఉపయోగిస్తాము:
|
||||
```python
|
||||
import numpy as np
|
||||
|
||||
example1 = pd.Series([0, np.nan, '', None])
|
||||
example1.isnull()
|
||||
```
|
||||
```
|
||||
0 False
|
||||
1 True
|
||||
2 False
|
||||
3 True
|
||||
dtype: bool
|
||||
```
|
||||
ఫలితాన్ని జాగ్రత్తగా చూడండి. ఏదైనా ఆశ్చర్యంగా ఉందా? `0` గణిత నల్ అయినప్పటికీ, అది పూర్తిగా సరైన ఇంటిజర్ మరియు pandas దాన్ని అలానే పరిగణిస్తుంది. `''` కొంచెం సున్నితమైనది. సెక్షన్ 1 లో ఖాళీ స్ట్రింగ్ విలువను సూచించడానికి దీన్ని ఉపయోగించాము, కానీ pandas దృష్టిలో ఇది స్ట్రింగ్ ఆబ్జెక్ట్ మాత్రమే, నల్ ప్రాతినిధ్యం కాదు.
|
||||
|
||||
ఇప్పుడు, దీన్ని తిరగబెట్టుకుని, మీరు ప్రాక్టీస్లో ఉపయోగించే విధంగా ఈ పద్ధతులను ఉపయోగిద్దాం. మీరు బూలియన్ మాస్క్లను నేరుగా ``Series`` లేదా ``DataFrame`` సూచికగా ఉపయోగించవచ్చు, ఇది ప్రత్యేకంగా లేకపోయిన (లేదా ఉన్న) విలువలతో పని చేయడానికి ఉపయోగకరం.
|
||||
|
||||
> **సారాంశం**: `isnull()` మరియు `notnull()` పద్ధతులు DataFrame లలో ఉపయోగించినప్పుడు సమాన ఫలితాలను ఇస్తాయి: అవి ఫలితాలు మరియు వాటి సూచికలను చూపిస్తాయి, ఇది మీ డేటాతో పని చేసే సమయంలో చాలా సహాయపడుతుంది.
|
||||
|
||||
- **నల్ విలువలను తొలగించడం**: లేకపోయిన విలువలను గుర్తించడం మించి, pandas `Series` మరియు `DataFrame` నుండి నల్ విలువలను తొలగించడానికి సౌకర్యవంతమైన మార్గాన్ని అందిస్తుంది. (పెద్ద డేటాసెట్లలో, లేకపోయిన [NA] విలువలను విశ్లేషణ నుండి తొలగించడం మరింత సలహాదాయకం.) దీన్ని ప్రదర్శించడానికి, `example1` కు తిరిగి వెళ్దాం:
|
||||
```python
|
||||
example1 = example1.dropna()
|
||||
example1
|
||||
```
|
||||
```
|
||||
0 0
|
||||
2
|
||||
dtype: object
|
||||
```
|
||||
ఇది `example3[example3.notnull()]` నుండి మీ అవుట్పుట్లాగా కనిపించాలి. ఇక్కడ తేడా ఏమిటంటే, మాస్క్ చేసిన విలువలపై సూచిక వేయడం కాకుండా, `dropna` ఆ లేకపోయిన విలువలను `Series` `example1` నుండి తొలగించింది.
|
||||
|
||||
DataFrame లకు రెండు డైమెన్షన్లు ఉండటంతో, డేటాను తొలగించడానికి మరిన్ని ఎంపికలు ఉంటాయి.
|
||||
|
||||
```python
|
||||
example2 = pd.DataFrame([[1, np.nan, 7],
|
||||
[2, 5, 8],
|
||||
[np.nan, 6, 9]])
|
||||
example2
|
||||
```
|
||||
| | 0 | 1 | 2 |
|
||||
|------|---|---|---|
|
||||
|0 |1.0|NaN|7 |
|
||||
|1 |2.0|5.0|8 |
|
||||
|2 |NaN|6.0|9 |
|
||||
|
||||
(పాండాస్ `NaN`s ను అనుకూలించడానికి రెండు కాలమ్స్ను ఫ్లోట్స్గా అప్కాస్ట్ చేసినట్లు గమనించారా?)
|
||||
|
||||
DataFrame నుండి ఒకే విలువను తొలగించలేరు, కాబట్టి మీరు పూర్తి వరుసలు లేదా కాలమ్స్ను తొలగించాలి. మీరు ఏది చేయాలనుకుంటున్నారో ఆధారంగా, ఒకటి లేదా మరొకటి చేయవచ్చు, అందుకే pandas రెండు ఎంపికలను ఇస్తుంది. డేటా సైన్స్లో కాలమ్స్ సాధారణంగా వేరియబుల్స్ను సూచిస్తాయి మరియు వరుసలు పరిశీలనలను సూచిస్తాయి, కాబట్టి మీరు ఎక్కువగా డేటా వరుసలను తొలగిస్తారు; `dropna()` యొక్క డిఫాల్ట్ సెట్టింగ్ ఏదైనా నల్ విలువ ఉన్న అన్ని వరుసలను తొలగించడం:
|
||||
|
||||
```python
|
||||
example2.dropna()
|
||||
```
|
||||
```
|
||||
0 1 2
|
||||
1 2.0 5.0 8
|
||||
```
|
||||
అవసరమైతే, కాలమ్స్ నుండి NA విలువలను తొలగించవచ్చు. దీని కోసం `axis=1` ఉపయోగించండి:
|
||||
```python
|
||||
example2.dropna(axis='columns')
|
||||
```
|
||||
```
|
||||
2
|
||||
0 7
|
||||
1 8
|
||||
2 9
|
||||
```
|
||||
ఇది మీరు నిలుపుకోవాలనుకునే చాలా డేటాను తొలగించవచ్చు, ముఖ్యంగా చిన్న డేటాసెట్లలో. మీరు కొన్ని లేదా అన్ని నల్ విలువలు ఉన్న వరుసలు లేదా కాలమ్స్ మాత్రమే తొలగించాలనుకుంటే? మీరు `dropna` లో `how` మరియు `thresh` పారామీటర్లతో ఆ సెట్టింగులను నిర్దేశించవచ్చు.
|
||||
|
||||
డిఫాల్ట్గా, `how='any'` (మీరు స్వయంగా తనిఖీ చేయాలనుకుంటే లేదా పద్ధతికి మరెన్ని పారామీటర్లు ఉన్నాయో చూడాలనుకుంటే, కోడ్ సెల్లో `example4.dropna?` నడపండి). మీరు ప్రత్యామ్నాయంగా `how='all'` ను నిర్దేశించవచ్చు, ఇది కేవలం అన్ని నల్ విలువలు ఉన్న వరుసలు లేదా కాలమ్స్ మాత్రమే తొలగిస్తుంది. దీన్ని ప్రదర్శించడానికి మన ఉదాహరణ DataFrame ను విస్తరిద్దాం.
|
||||
|
||||
```python
|
||||
example2[3] = np.nan
|
||||
example2
|
||||
```
|
||||
| |0 |1 |2 |3 |
|
||||
|------|---|---|---|---|
|
||||
|0 |1.0|NaN|7 |NaN|
|
||||
|1 |2.0|5.0|8 |NaN|
|
||||
|2 |NaN|6.0|9 |NaN|
|
||||
|
||||
`thresh` పారామీటర్ మీకు మరింత సూక్ష్మ నియంత్రణ ఇస్తుంది: ఒక వరుస లేదా కాలమ్ నిలుపుకోవడానికి అవసరమైన *నాన్-నల్* విలువల సంఖ్యను మీరు సెట్ చేస్తారు:
|
||||
```python
|
||||
example2.dropna(axis='rows', thresh=3)
|
||||
```
|
||||
```
|
||||
0 1 2 3
|
||||
1 2.0 5.0 8 NaN
|
||||
```
|
||||
ఇక్కడ, మొదటి మరియు చివరి వరుసలు తొలగించబడ్డాయి, ఎందుకంటే అవి కేవలం రెండు నాన్-నల్ విలువలు మాత్రమే కలిగి ఉన్నాయి.
|
||||
|
||||
- **నల్ విలువలను నింపడం**: మీ డేటాసెట్ ఆధారంగా, నల్ విలువలను తొలగించడంలోకి కాకుండా సరైన విలువలతో నింపడం మరింత అర్థవంతంగా ఉండవచ్చు. మీరు `isnull` ఉపయోగించి దీన్ని చేయవచ్చు, కానీ ఇది శ్రమగా ఉండవచ్చు, ముఖ్యంగా మీరు నింపాల్సిన విలువలు ఎక్కువగా ఉన్నప్పుడు. డేటా సైన్స్లో ఇది సాధారణ పని కావడంతో, pandas `fillna` ను అందిస్తుంది, ఇది మిస్సింగ్ విలువలను మీరు ఎంచుకున్న విలువతో మార్చిన `Series` లేదా `DataFrame` కాపీని ఇస్తుంది. ఇది ఎలా పనిచేస్తుందో చూడటానికి మరో ఉదాహరణ `Series` సృష్టిద్దాం.
|
||||
```python
|
||||
example3 = pd.Series([1, np.nan, 2, None, 3], index=list('abcde'))
|
||||
example3
|
||||
```
|
||||
```
|
||||
a 1.0
|
||||
b NaN
|
||||
c 2.0
|
||||
d NaN
|
||||
e 3.0
|
||||
dtype: float64
|
||||
```
|
||||
మీరు అన్ని నల్ ఎంట్రీలను ఒకే విలువతో నింపవచ్చు, ఉదాహరణకు `0`:
|
||||
```python
|
||||
example3.fillna(0)
|
||||
```
|
||||
```
|
||||
a 1.0
|
||||
b 0.0
|
||||
c 2.0
|
||||
d 0.0
|
||||
e 3.0
|
||||
dtype: float64
|
||||
```
|
||||
మీరు **ఫార్వర్డ్-ఫిల్** చేయవచ్చు, అంటే చివరి సరైన విలువను ఉపయోగించి నల్ విలువను నింపడం:
|
||||
```python
|
||||
example3.fillna(method='ffill')
|
||||
```
|
||||
```
|
||||
a 1.0
|
||||
b 1.0
|
||||
c 2.0
|
||||
d 2.0
|
||||
e 3.0
|
||||
dtype: float64
|
||||
```
|
||||
మీరు **బ్యాక్-ఫిల్** కూడా చేయవచ్చు, అంటే తదుపరి సరైన విలువను వెనుకకు పంపించి నల్ విలువను నింపడం:
|
||||
```python
|
||||
example3.fillna(method='bfill')
|
||||
```
|
||||
```
|
||||
a 1.0
|
||||
b 2.0
|
||||
c 2.0
|
||||
d 3.0
|
||||
e 3.0
|
||||
dtype: float64
|
||||
```
|
||||
మీరు ఊహించగలిగినట్లుగా, ఇది DataFrame లతో కూడా అదే విధంగా పనిచేస్తుంది, కానీ మీరు నల్ విలువలను నింపడానికి ఒక `axis` ను కూడా నిర్దేశించవచ్చు. మునుపటి `example2` ను మళ్లీ తీసుకుందాం:
|
||||
```python
|
||||
example2.fillna(method='ffill', axis=1)
|
||||
```
|
||||
```
|
||||
0 1 2 3
|
||||
0 1.0 1.0 7.0 7.0
|
||||
1 2.0 5.0 8.0 8.0
|
||||
2 NaN 6.0 9.0 9.0
|
||||
```
|
||||
ఫార్వర్డ్-ఫిల్లింగ్ కోసం గత విలువ అందుబాటులో లేకపోతే, నల్ విలువ అలాగే ఉంటుంది అని గమనించండి.
|
||||
> **Takeaway:** మీ డేటాసెట్లలో లేని విలువలతో వ్యవహరించడానికి అనేక మార్గాలు ఉన్నాయి. మీరు ఉపయోగించే నిర్దిష్ట వ్యూహం (వాటిని తొలగించడం, మార్చడం లేదా మీరు వాటిని ఎలా మార్చుతారో) ఆ డేటా యొక్క ప్రత్యేకతల ద్వారా నిర్ణయించబడాలి. మీరు డేటాసెట్లను ఎక్కువగా నిర్వహించగలిగే మరియు వాటితో పరస్పరం చేయగలిగే కొద్దీ లేని విలువలతో ఎలా వ్యవహరించాలో మీరు మెరుగైన అవగాహనను అభివృద్ధి చేస్తారు.
|
||||
|
||||
## డూప్లికేట్ డేటాను తొలగించడం
|
||||
|
||||
> **Learning goal:** ఈ ఉపవిభాగం చివరికి, మీరు డేటాఫ్రేమ్ల నుండి డూప్లికేట్ విలువలను గుర్తించి తొలగించడంలో సౌకర్యంగా ఉండాలి.
|
||||
|
||||
లేని డేటా తో పాటు, మీరు నిజమైన ప్రపంచ డేటాసెట్లలో తరచుగా డూప్లికేట్ డేటాను కూడా ఎదుర్కొంటారు. అదృష్టవశాత్తు, `pandas` డూప్లికేట్ ఎంట్రీలను గుర్తించడం మరియు తొలగించడం కోసం సులభమైన మార్గాన్ని అందిస్తుంది.
|
||||
|
||||
- **డూప్లికేట్లను గుర్తించడం: `duplicated`**: మీరు pandasలోని `duplicated` పద్ధతిని ఉపయోగించి డూప్లికేట్ విలువలను సులభంగా గుర్తించవచ్చు, ఇది ఒక `DataFrame`లోని ఎంట్రీ ఒక ముందటి ఎంట్రీకు డూప్లికేట్ అయిందా అనే విషయాన్ని సూచించే బూలియన్ మాస్క్ను ఇస్తుంది. దీన్ని ప్రదర్శించడానికి మరొక ఉదాహరణ `DataFrame`ను సృష్టిద్దాం.
|
||||
```python
|
||||
example4 = pd.DataFrame({'letters': ['A','B'] * 2 + ['B'],
|
||||
'numbers': [1, 2, 1, 3, 3]})
|
||||
example4
|
||||
```
|
||||
| |letters|numbers|
|
||||
|------|-------|-------|
|
||||
|0 |A |1 |
|
||||
|1 |B |2 |
|
||||
|2 |A |1 |
|
||||
|3 |B |3 |
|
||||
|4 |B |3 |
|
||||
|
||||
```python
|
||||
example4.duplicated()
|
||||
```
|
||||
```
|
||||
0 False
|
||||
1 False
|
||||
2 True
|
||||
3 False
|
||||
4 True
|
||||
dtype: bool
|
||||
```
|
||||
- **డూప్లికేట్లను తొలగించడం: `drop_duplicates`:** ఇది సాదారణంగా `duplicated` విలువలు `False` అయిన డేటా యొక్క కాపీని తిరిగి ఇస్తుంది:
|
||||
```python
|
||||
example4.drop_duplicates()
|
||||
```
|
||||
```
|
||||
letters numbers
|
||||
0 A 1
|
||||
1 B 2
|
||||
3 B 3
|
||||
```
|
||||
`duplicated` మరియు `drop_duplicates` రెండూ డిఫాల్ట్గా అన్ని కాలమ్స్ను పరిగణలోకి తీసుకుంటాయి కానీ మీరు మీ `DataFrame`లోని కాలమ్స్ ఉపసమితి మాత్రమే పరిశీలించమని పేర్కొనవచ్చు:
|
||||
```python
|
||||
example4.drop_duplicates(['letters'])
|
||||
```
|
||||
```
|
||||
letters numbers
|
||||
0 A 1
|
||||
1 B 2
|
||||
```
|
||||
|
||||
> **Takeaway:** డూప్లికేట్ డేటాను తొలగించడం ప్రతి డేటా-సైన్స్ ప్రాజెక్ట్లో ఒక ముఖ్యమైన భాగం. డూప్లికేట్ డేటా మీ విశ్లేషణల ఫలితాలను మార్చవచ్చు మరియు మీకు తప్పు ఫలితాలను ఇస్తుంది!
|
||||
|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
చర్చించిన అన్ని విషయాలు [Jupyter Notebook](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/2-Working-With-Data/08-data-preparation/notebook.ipynb)గా అందుబాటులో ఉన్నాయి. అదనంగా, ప్రతి విభాగం తర్వాత వ్యాయామాలు ఉన్నాయి, వాటిని ప్రయత్నించండి!
|
||||
|
||||
## [పోస్ట్-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/15)
|
||||
|
||||
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
మీ డేటాను విశ్లేషణ మరియు మోడలింగ్ కోసం సిద్ధం చేయడాన్ని కనుగొనడానికి మరియు దానికి చేరుకోవడానికి అనేక మార్గాలు ఉన్నాయి మరియు డేటాను శుభ్రపరచడం ఒక ముఖ్యమైన దశ, ఇది "ప్రాక్టికల్" అనుభవం. ఈ పాఠం కవర్ చేయని సాంకేతికతలను అన్వేషించడానికి Kaggle నుండి ఈ సవాళ్లను ప్రయత్నించండి.
|
||||
|
||||
- [డేటా శుభ్రపరిచే సవాలు: తేదీలను పార్స్ చేయడం](https://www.kaggle.com/rtatman/data-cleaning-challenge-parsing-dates/)
|
||||
|
||||
- [డేటా శుభ్రపరిచే సవాలు: డేటాను స్కేల్ చేయడం మరియు సాధారణీకరించడం](https://www.kaggle.com/rtatman/data-cleaning-challenge-scale-and-normalize-data)
|
||||
|
||||
|
||||
## అసైన్మెంట్
|
||||
|
||||
[ఫారమ్ నుండి డేటాను మూల్యాంకనం](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,30 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "f9d5a7275e046223fa6474477674b810",
|
||||
"translation_date": "2025-12-19T15:45:14+00:00",
|
||||
"source_file": "2-Working-With-Data/08-data-preparation/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# ఫారమ్ నుండి డేటాను మూల్యాంకనం చేయడం
|
||||
|
||||
ఒక క్లయింట్ తమ క్లయింట్-బేస్ గురించి కొన్ని ప్రాథమిక డేటాను సేకరించడానికి [చిన్న ఫారమ్](../../../../2-Working-With-Data/08-data-preparation/index.html) ను పరీక్షిస్తున్నారు. వారు సేకరించిన డేటాను మీరు ధృవీకరించడానికి వారి కనుగొనుటలను మీకు తీసుకువచ్చారు. మీరు ఫారమ్ను చూడటానికి బ్రౌజర్లో `index.html` పేజీని తెరవవచ్చు.
|
||||
|
||||
మీకు ఫారమ్ నుండి వచ్చిన ఎంట్రీలను మరియు కొన్ని ప్రాథమిక విజువలైజేషన్లను కలిగిన [csv రికార్డుల డేటాసెట్](../../../../data/form.csv) అందించబడింది. క్లయింట్ కొన్ని విజువలైజేషన్లు తప్పుగా కనిపిస్తున్నాయని సూచించారు కానీ వాటిని ఎలా పరిష్కరించాలో తెలియదు. మీరు దీన్ని [అసైన్మెంట్ నోట్బుక్](assignment.ipynb) లో అన్వేషించవచ్చు.
|
||||
|
||||
## సూచనలు
|
||||
|
||||
ఫారమ్ సరిగ్గా మరియు సुसంగతమైన సమాచారాన్ని సేకరించేందుకు ఈ పాఠంలో ఉన్న సాంకేతికతలను ఉపయోగించి సిఫార్సులు చేయండి.
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణాత్మక | తగినంత | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because it is too large
Load Diff
@ -0,0 +1,32 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "abc3309ab41bc5a7846f70ee1a055838",
|
||||
"translation_date": "2025-12-19T13:29:19+00:00",
|
||||
"source_file": "2-Working-With-Data/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# డేటాతో పని చేయడం
|
||||
|
||||

|
||||
> ఫోటో <a href="https://unsplash.com/@swimstaralex?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Alexander Sinn</a> ద్వారా <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a>లో
|
||||
|
||||
ఈ పాఠాలలో, డేటాను ఎలా నిర్వహించవచ్చు, మార్చవచ్చు మరియు అనువర్తనాలలో ఉపయోగించవచ్చు అనే కొన్ని మార్గాలను మీరు నేర్చుకుంటారు. మీరు సంబంధిత మరియు అసంబంధిత డేటాబేస్ల గురించి మరియు వాటిలో డేటాను ఎలా నిల్వ చేయవచ్చో తెలుసుకుంటారు. డేటాను నిర్వహించడానికి Pythonతో పని చేసే ప్రాథమిక అంశాలను మీరు నేర్చుకుంటారు, మరియు Pythonతో డేటాను నిర్వహించడానికి మరియు తవ్వడానికి మీరు ఉపయోగించగల అనేక మార్గాలను మీరు కనుగొంటారు.
|
||||
### విషయాలు
|
||||
|
||||
1. [సంబంధిత డేటాబేస్లు](05-relational-databases/README.md)
|
||||
2. [అసంబంధిత డేటాబేస్లు](06-non-relational/README.md)
|
||||
3. [Pythonతో పని చేయడం](07-python/README.md)
|
||||
4. [డేటా సిద్ధం చేయడం](08-data-preparation/README.md)
|
||||
|
||||
### క్రెడిట్స్
|
||||
|
||||
ఈ పాఠాలు ❤️తో రాసినవి [Christopher Harrison](https://twitter.com/geektrainer), [Dmitry Soshnikov](https://twitter.com/shwars) మరియు [Jasmine Greenaway](https://twitter.com/paladique)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,221 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a49d78e32e280c410f04e5f2a2068e77",
|
||||
"translation_date": "2025-12-19T16:12:50+00:00",
|
||||
"source_file": "3-Data-Visualization/09-visualization-quantities/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# పరిమాణాలను దృశ్యీకరించడం
|
||||
|
||||
| ద్వారా ](../../sketchnotes/09-Visualizing-Quantities.png)|
|
||||
|:---:|
|
||||
| పరిమాణాలను దృశ్యీకరించడం - _స్కెచ్ నోట్ [@nitya](https://twitter.com/nitya) ద్వారా_ |
|
||||
|
||||
ఈ పాఠంలో మీరు పరిమాణం అనే భావన చుట్టూ ఆసక్తికరమైన దృశ్యీకరణలను సృష్టించడం ఎలా అనేది నేర్చుకోవడానికి అందుబాటులో ఉన్న అనేక Python లైబ్రరీలలో ఒకదాన్ని ఉపయోగించడం ఎలా అనేది అన్వేషించబోతున్నారు. మినెసోటా పక్షుల గురించి శుభ్రపరిచిన డేటాసెట్ ఉపయోగించి, మీరు స్థానిక వన్యజీవుల గురించి అనేక ఆసక్తికరమైన విషయాలను తెలుసుకోవచ్చు.
|
||||
## [పాఠం ముందు క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/16)
|
||||
|
||||
## Matplotlib తో రెక్కల వ్యాప్తిని పరిశీలించండి
|
||||
|
||||
వివిధ రకాల సులభమైన మరియు సున్నితమైన ప్లాట్లు మరియు చార్ట్లను సృష్టించడానికి అద్భుతమైన లైబ్రరీ [Matplotlib](https://matplotlib.org/stable/index.html). సాధారణంగా, ఈ లైబ్రరీలను ఉపయోగించి డేటాను ప్లాట్ చేయడం అనేది మీ డేటాఫ్రేమ్లో మీరు లక్ష్యంగా పెట్టుకోవాలనుకునే భాగాలను గుర్తించడం, ఆ డేటాపై అవసరమైన మార్పులు చేయడం, దాని x మరియు y అక్ష విలువలను కేటాయించడం, ఏ రకమైన ప్లాట్ చూపించాలో నిర్ణయించడం, మరియు ఆ ప్లాట్ను చూపించడం అనే ప్రక్రియ. Matplotlib అనేక రకాల దృశ్యీకరణలను అందిస్తుంది, కానీ ఈ పాఠం కోసం, పరిమాణాన్ని దృశ్యీకరించడానికి అత్యంత అనుకూలమైన వాటిపై దృష్టి పెట్టుదాం: లైన్ చార్ట్లు, స్కాటర్ప్లాట్లు, మరియు బార్ ప్లాట్లు.
|
||||
|
||||
> ✅ మీ డేటా నిర్మాణానికి మరియు మీరు చెప్పదలచుకున్న కథకు సరిపోయే ఉత్తమ చార్ట్ను ఉపయోగించండి.
|
||||
> - కాలానుగుణ ధోరణులను విశ్లేషించడానికి: లైన్
|
||||
> - విలువలను పోల్చడానికి: బార్, కాలమ్, పై, స్కాటర్ప్లాట్
|
||||
> - భాగాలు మొత్తం తో ఎలా సంబంధించాయో చూపించడానికి: పై
|
||||
> - డేటా పంపిణీని చూపించడానికి: స్కాటర్ప్లాట్, బార్
|
||||
> - ధోరణులను చూపించడానికి: లైన్, కాలమ్
|
||||
> - విలువల మధ్య సంబంధాలను చూపించడానికి: లైన్, స్కాటర్ప్లాట్, బబుల్
|
||||
|
||||
మీ వద్ద ఒక డేటాసెట్ ఉంటే మరియు ఒక నిర్దిష్ట అంశం ఎంతగా ఉన్నదో కనుగొనాల్సిన అవసరం ఉంటే, మొదటి పనుల్లో ఒకటి దాని విలువలను పరిశీలించడం అవుతుంది.
|
||||
|
||||
✅ Matplotlib కోసం చాలా మంచి 'చీట్ షీట్లు' [ఇక్కడ](https://matplotlib.org/cheatsheets/cheatsheets.pdf) అందుబాటులో ఉన్నాయి.
|
||||
|
||||
## పక్షుల రెక్కల వ్యాప్తి విలువల గురించి లైన్ ప్లాట్ నిర్మించండి
|
||||
|
||||
ఈ పాఠం ఫోల్డర్ రూట్లో ఉన్న `notebook.ipynb` ఫైల్ను తెరవండి మరియు ఒక సెల్ జోడించండి.
|
||||
|
||||
> గమనిక: డేటా ఈ రిపో యొక్క రూట్లోని `/data` ఫోల్డర్లో నిల్వ చేయబడింది.
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
import matplotlib.pyplot as plt
|
||||
birds = pd.read_csv('../../data/birds.csv')
|
||||
birds.head()
|
||||
```
|
||||
ఈ డేటా టెక్స్ట్ మరియు సంఖ్యల మిశ్రమం:
|
||||
|
||||
|
||||
| | పేరు | శాస్త్రీయపేరు | వర్గం | ఆర్డర్ | కుటుంబం | జెనస్ | సంరక్షణ స్థితి | కనిష్ఠ పొడవు | గరిష్ఠ పొడవు | కనిష్ఠ శరీర బరువు | గరిష్ఠ శరీర బరువు | కనిష్ఠ రెక్కల వ్యాప్తి | గరిష్ఠ రెక్కల వ్యాప్తి |
|
||||
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
|
||||
| 0 | బ్లాక్-బెల్లీడ్ విసిలింగ్-డక్ | Dendrocygna autumnalis | డక్స్/గీస్స్/వాటర్ఫౌల్ | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
|
||||
| 1 | ఫుల్వస్ విసిలింగ్-డక్ | Dendrocygna bicolor | డక్స్/గీస్స్/వాటర్ఫౌల్ | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
|
||||
| 2 | స్నో గూస్ | Anser caerulescens | డక్స్/గీస్స్/వాటర్ఫౌల్ | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
|
||||
| 3 | రాస్ గూస్ | Anser rossii | డక్స్/గీస్స్/వాటర్ఫౌల్ | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
|
||||
| 4 | గ్రేటర్ వైట్-ఫ్రంట్ గూస్ | Anser albifrons | డక్స్/గీస్స్/వాటర్ఫౌల్ | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
|
||||
|
||||
కొన్ని సంఖ్యా డేటాను ప్రాథమిక లైన్ ప్లాట్ ఉపయోగించి ప్లాట్ చేయడం ప్రారంభిద్దాం. మీరు ఈ ఆసక్తికరమైన పక్షుల గరిష్ఠ రెక్కల వ్యాప్తి యొక్క దృశ్యాన్ని కావాలనుకుంటే.
|
||||
|
||||
```python
|
||||
wingspan = birds['MaxWingspan']
|
||||
wingspan.plot()
|
||||
```
|
||||

|
||||
|
||||
మీకు వెంటనే ఏమి కనిపిస్తుంది? కనీసం ఒక అవుట్లయర్ ఉన్నట్లు కనిపిస్తోంది - అది చాలా పెద్ద రెక్కల వ్యాప్తి! 2300 సెంటీమీటర్ల రెక్కల వ్యాప్తి అంటే 23 మీటర్లు - మినెసోటాలో ప్టెరోడాక్టిల్స్ తిరుగుతున్నారా? పరిశీలిద్దాం.
|
||||
|
||||
మీరు అవుట్లయర్లను కనుగొనడానికి Excel లో త్వరితంగా సార్ట్ చేయవచ్చు, అవి తప్పులే కావచ్చు, కానీ ప్లాట్లోనే పని కొనసాగించి దృశ్యీకరణ ప్రక్రియను కొనసాగించండి.
|
||||
|
||||
x-అక్షకు లేబుల్స్ జోడించి ఏ రకమైన పక్షులు ఉన్నాయో చూపించండి:
|
||||
|
||||
```
|
||||
plt.title('Max Wingspan in Centimeters')
|
||||
plt.ylabel('Wingspan (CM)')
|
||||
plt.xlabel('Birds')
|
||||
plt.xticks(rotation=45)
|
||||
x = birds['Name']
|
||||
y = birds['MaxWingspan']
|
||||
|
||||
plt.plot(x, y)
|
||||
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
లేబుల్స్ 45 డిగ్రీల కోణంలో తిప్పినా కూడా చదవడానికి చాలా ఉన్నాయి. వేరే వ్యూహం ప్రయత్నిద్దాం: అవుట్లయర్లకు మాత్రమే లేబుల్స్ ఇవ్వండి మరియు లేబుల్స్ను చార్ట్ లోపల ఉంచండి. లేబలింగ్ కోసం మరింత స్థలం కోసం స్కాటర్ చార్ట్ ఉపయోగించవచ్చు:
|
||||
|
||||
```python
|
||||
plt.title('Max Wingspan in Centimeters')
|
||||
plt.ylabel('Wingspan (CM)')
|
||||
plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
|
||||
|
||||
for i in range(len(birds)):
|
||||
x = birds['Name'][i]
|
||||
y = birds['MaxWingspan'][i]
|
||||
plt.plot(x, y, 'bo')
|
||||
if birds['MaxWingspan'][i] > 500:
|
||||
plt.text(x, y * (1 - 0.05), birds['Name'][i], fontsize=12)
|
||||
|
||||
plt.show()
|
||||
```
|
||||
ఇక్కడ ఏమి జరుగుతోంది? మీరు `tick_params` ఉపయోగించి దిగువ లేబుల్స్ను దాచారు మరియు మీ పక్షుల డేటాసెట్ పై లూప్ సృష్టించారు. `bo` ఉపయోగించి చిన్న నీలి బిందువులతో చార్ట్ ప్లాట్ చేసి, గరిష్ఠ రెక్కల వ్యాప్తి 500 కంటే ఎక్కువ ఉన్న పక్షుల కోసం వారి పేరు బిందువు పక్కన ప్రదర్శించారు. మీరు y అక్షం పై లేబుల్స్ కొంచెం ఆఫ్సెట్ చేశారు (`y * (1 - 0.05)`) మరియు పక్షి పేరును లేబుల్ గా ఉపయోగించారు.
|
||||
|
||||
మీరు ఏమి కనుగొన్నారు?
|
||||
|
||||

|
||||
## మీ డేటాను ఫిల్టర్ చేయండి
|
||||
|
||||
బాల్డ్ ఈగిల్ మరియు ప్రేరి ఫాల్కన్, చాలా పెద్ద పక్షులు కావచ్చు, గరిష్ఠ రెక్కల వ్యాప్తికి అదనపు `0` తప్పుగా జోడించబడినట్లు కనిపిస్తున్నాయి. 25 మీటర్ల రెక్కల వ్యాప్తి ఉన్న బాల్డ్ ఈగిల్ను మీరు కలుసుకోవడం అసాధ్యమే, అయితే ఉంటే, దయచేసి మాకు తెలియజేయండి! ఆ రెండు అవుట్లయర్లను తీసేసి కొత్త డేటాఫ్రేమ్ సృష్టిద్దాం:
|
||||
|
||||
```python
|
||||
plt.title('Max Wingspan in Centimeters')
|
||||
plt.ylabel('Wingspan (CM)')
|
||||
plt.xlabel('Birds')
|
||||
plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
|
||||
for i in range(len(birds)):
|
||||
x = birds['Name'][i]
|
||||
y = birds['MaxWingspan'][i]
|
||||
if birds['Name'][i] not in ['Bald eagle', 'Prairie falcon']:
|
||||
plt.plot(x, y, 'bo')
|
||||
plt.show()
|
||||
```
|
||||
|
||||
అవుట్లయర్లను ఫిల్టర్ చేయడం ద్వారా, మీ డేటా ఇప్పుడు మరింత సమగ్రంగా మరియు అర్థమయ్యేలా మారింది.
|
||||
|
||||

|
||||
|
||||
ఇప్పుడు రెక్కల వ్యాప్తి పరంగా కనీసం శుభ్రమైన డేటాసెట్ ఉన్నందున, ఈ పక్షుల గురించి మరింత తెలుసుకుందాం.
|
||||
|
||||
లైన్ మరియు స్కాటర్ ప్లాట్లు డేటా విలువలు మరియు వాటి పంపిణీ గురించి సమాచారం చూపించగలవు, కానీ ఈ డేటాసెట్లో ఉన్న విలువల గురించి ఆలోచించాలి. మీరు ఈ పరిమాణం గురించి క్రింది ప్రశ్నలకు జవాబుల కోసం దృశ్యీకరణలు సృష్టించవచ్చు:
|
||||
|
||||
> పక్షుల ఎన్ని వర్గాలు ఉన్నాయి, వాటి సంఖ్యలు ఎంత?
|
||||
> ఎన్ని పక్షులు అంతరించిపోయాయి, ప్రమాదంలో ఉన్నవి, అరుదైనవి లేదా సాధారణమైనవి?
|
||||
> లినియస్ యొక్క పదజాలంలో వివిధ జెనస్ మరియు ఆర్డర్లలో ఎన్ని ఉన్నాయి?
|
||||
## బార్ చార్ట్లను అన్వేషించండి
|
||||
|
||||
డేటా గుంపులను చూపించాల్సినప్పుడు బార్ చార్ట్లు ఉపయోగకరంగా ఉంటాయి. ఈ డేటాసెట్లో ఉన్న పక్షుల వర్గాలను అన్వేషించి ఏది సంఖ్యలో అత్యధికమో చూడండి.
|
||||
|
||||
నోట్బుక్ ఫైల్లో ప్రాథమిక బార్ చార్ట్ సృష్టించండి
|
||||
|
||||
✅ గమనిక, మీరు గత సెక్షన్లో గుర్తించిన రెండు అవుట్లయర్ పక్షులను ఫిల్టర్ చేయవచ్చు, వారి రెక్కల వ్యాప్తిలో తప్పును సరిచేయవచ్చు, లేదా రెక్కల వ్యాప్తి విలువలపై ఆధారపడని ఈ వ్యాయామాల కోసం వాటిని ఉంచవచ్చు.
|
||||
|
||||
మీరు బార్ చార్ట్ సృష్టించాలనుకుంటే, మీరు దృష్టి పెట్టదలచుకున్న డేటాను ఎంచుకోవచ్చు. బార్ చార్ట్లు రా డేటా నుండి సృష్టించవచ్చు:
|
||||
|
||||
```python
|
||||
birds.plot(x='Category',
|
||||
kind='bar',
|
||||
stacked=True,
|
||||
title='Birds of Minnesota')
|
||||
|
||||
```
|
||||

|
||||
|
||||
ఈ బార్ చార్ట్ చదవలేనిది ఎందుకంటే చాలా ఎక్కువ గుంపు కాని డేటా ఉంది. మీరు ప్లాట్ చేయదలచుకున్న డేటాను మాత్రమే ఎంచుకోవాలి, కాబట్టి పక్షుల పొడవును వారి వర్గం ఆధారంగా చూద్దాం.
|
||||
|
||||
మీ డేటాను పక్షుల వర్గం మాత్రమే కలిగి ఉండేలా ఫిల్టర్ చేయండి.
|
||||
|
||||
✅ మీరు డేటాను నిర్వహించడానికి Pandas ఉపయోగిస్తారని గమనించండి, తరువాత Matplotlib చార్టింగ్ చేస్తుంది.
|
||||
|
||||
చాలా వర్గాలు ఉన్నందున, మీరు ఈ చార్ట్ను నిలువుగా ప్రదర్శించి అందరి డేటా కోసం ఎత్తును సర్దుబాటు చేయవచ్చు:
|
||||
|
||||
```python
|
||||
category_count = birds.value_counts(birds['Category'].values, sort=True)
|
||||
plt.rcParams['figure.figsize'] = [6, 12]
|
||||
category_count.plot.barh()
|
||||
```
|
||||

|
||||
|
||||
ఈ బార్ చార్ట్ ప్రతి వర్గంలో పక్షుల సంఖ్యను బాగా చూపిస్తుంది. ఒక చూపులోనే, ఈ ప్రాంతంలో అత్యధిక సంఖ్యలో పక్షులు డక్స్/గీస్స్/వాటర్ఫౌల్ వర్గంలో ఉన్నాయని మీరు చూడవచ్చు. మినెసోటా '10,000 సరస్సుల భూమి' కాబట్టి ఇది ఆశ్చర్యకరం కాదు!
|
||||
|
||||
✅ ఈ డేటాసెట్పై మరిన్ని లెక్కింపులు ప్రయత్నించండి. ఏదైనా ఆశ్చర్యంగా ఉందా?
|
||||
|
||||
## డేటాను పోల్చడం
|
||||
|
||||
మీరు కొత్త అక్షాలను సృష్టించి గుంపు డేటా యొక్క వివిధ పోలికలను ప్రయత్నించవచ్చు. పక్షి యొక్క వర్గం ఆధారంగా గరిష్ఠ పొడవు (MaxLength) పోలికను ప్రయత్నించండి:
|
||||
|
||||
```python
|
||||
maxlength = birds['MaxLength']
|
||||
plt.barh(y=birds['Category'], width=maxlength)
|
||||
plt.rcParams['figure.figsize'] = [6, 12]
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
ఇక్కడ ఏ ఆశ్చర్యం లేదు: హమ్మింగ్బర్డ్స్ పెలికాన్స్ లేదా గీస్స్ కంటే తక్కువ MaxLength కలిగి ఉంటాయి. డేటా తార్కికంగా అర్థం కావడం మంచిది!
|
||||
|
||||
మీరు బార్ చార్ట్ల మరింత ఆసక్తికరమైన దృశ్యీకరణలను సృష్టించవచ్చు డేటాను సూపర్ ఇంపోజ్ చేయడం ద్వారా. ఒక నిర్దిష్ట పక్షి వర్గంపై కనిష్ఠ మరియు గరిష్ఠ పొడవును సూపర్ ఇంపోజ్ చేద్దాం:
|
||||
|
||||
```python
|
||||
minLength = birds['MinLength']
|
||||
maxLength = birds['MaxLength']
|
||||
category = birds['Category']
|
||||
|
||||
plt.barh(category, maxLength)
|
||||
plt.barh(category, minLength)
|
||||
|
||||
plt.show()
|
||||
```
|
||||
ఈ ప్లాట్లో, మీరు పక్షి వర్గం ప్రకారం కనిష్ఠ పొడవు మరియు గరిష్ఠ పొడవు పరిధిని చూడవచ్చు. ఈ డేటా ప్రకారం, పక్షి పెద్దదైతే, దాని పొడవు పరిధి కూడా పెద్దదని మీరు సురక్షితంగా చెప్పవచ్చు. ఆసక్తికరం!
|
||||
|
||||

|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
ఈ పక్షుల డేటాసెట్ ఒక నిర్దిష్ట పర్యావరణ వ్యవస్థలోని వివిధ రకాల పక్షుల గురించి సమృద్ధి సమాచారం అందిస్తుంది. ఇంటర్నెట్లో వెతకండి మరియు ఇతర పక్షుల డేటాసెట్లను కనుగొనగలరా చూడండి. ఈ పక్షుల చుట్టూ చార్ట్లు మరియు గ్రాఫ్లను నిర్మించడం సాధన చేయండి, మీరు తెలియని విషయాలను కనుగొనండి.
|
||||
|
||||
## [పాఠం తర్వాత క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/17)
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
ఈ మొదటి పాఠం Matplotlib ఉపయోగించి పరిమాణాలను దృశ్యీకరించడం గురించి కొంత సమాచారం ఇచ్చింది. దృశ్యీకరణ కోసం డేటాసెట్లతో పని చేసే ఇతర మార్గాల గురించి పరిశోధన చేయండి. [Plotly](https://github.com/plotly/plotly.py) ఒకటి, ఇది ఈ పాఠాల్లో కవర్ చేయబడదు, కాబట్టి అది ఏమి అందించగలదో చూడండి.
|
||||
## అసైన్మెంట్
|
||||
|
||||
[లైన్లు, స్కాటర్స్, మరియు బార్లు](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "ad163c4fda72c8278280b61cad317ff4",
|
||||
"translation_date": "2025-12-19T16:17:01+00:00",
|
||||
"source_file": "3-Data-Visualization/09-visualization-quantities/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# లైన్లు, స్కాటర్స్ మరియు బార్లు
|
||||
|
||||
## సూచనలు
|
||||
|
||||
ఈ పాఠంలో, మీరు లైన్ చార్ట్లు, స్కాటర్ప్లాట్లు, మరియు బార్ చార్ట్లతో ఈ డేటాసెట్ గురించి ఆసక్తికరమైన వాస్తవాలను చూపించారు. ఈ అసైన్మెంట్లో, ఒక నిర్దిష్ట పక్షి రకం గురించి ఒక వాస్తవాన్ని కనుగొనడానికి డేటాసెట్ను మరింత లోతుగా పరిశీలించండి. ఉదాహరణకు, స్నో గీస్ల గురించి మీరు కనుగొనగల అన్ని ఆసక్తికరమైన డేటాను విజువలైజ్ చేసే ఒక నోట్బుక్ సృష్టించండి. మీ నోట్బుక్లో కథ చెప్పడానికి పై మూడు ప్లాట్లను ఉపయోగించండి.
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణగా | సరిపోతుంది | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
మంచి వ్యాఖ్యానాలు, బలమైన కథనం, ఆకర్షణీయమైన గ్రాఫ్లతో కూడిన నోట్బుక్ అందించబడింది | ఈ అంశాలలో ఒకటి లేకపోవడం | ఈ అంశాలలో రెండు లేకపోవడం
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకం వల్ల కలిగే ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,48 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# పక్షుల గురించి తెలుసుకుందాం\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**అస్పష్టత**: \nఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python",
|
||||
"version": "3.7.0",
|
||||
"mimetype": "text/x-python",
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"pygments_lexer": "ipython3",
|
||||
"nbconvert_exporter": "python",
|
||||
"file_extension": ".py"
|
||||
},
|
||||
"kernelspec": {
|
||||
"name": "python3",
|
||||
"display_name": "Python 3.7.0 64-bit"
|
||||
},
|
||||
"interpreter": {
|
||||
"hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "33e5c5d3f0630388e20f2e161bd4cdf3",
|
||||
"translation_date": "2025-12-19T17:36:37+00:00",
|
||||
"source_file": "3-Data-Visualization/09-visualization-quantities/notebook.ipynb",
|
||||
"language_code": "te"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,219 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "80a20467e046d312809d008395051fc7",
|
||||
"translation_date": "2025-12-19T15:52:59+00:00",
|
||||
"source_file": "3-Data-Visualization/10-visualization-distributions/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# పంపిణీలను దృశ్యీకరించడం
|
||||
|
||||
| ](../../sketchnotes/10-Visualizing-Distributions.png)|
|
||||
|:---:|
|
||||
| పంపిణీలను దృశ్యీకరించడం - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
మునుపటి పాఠంలో, మీరు మినెసోటా పక్షుల గురించి ఒక డేటాసెట్ గురించి కొన్ని ఆసక్తికరమైన విషయాలను నేర్చుకున్నారు. మీరు అవుట్లయర్లను దృశ్యీకరించడం ద్వారా కొన్ని తప్పు డేటాను కనుగొన్నారు మరియు పక్షుల వర్గాల మధ్య గరిష్ట పొడవు ద్వారా తేడాలను పరిశీలించారు.
|
||||
|
||||
## [పాఠం ముందు క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/18)
|
||||
## పక్షుల డేటాసెట్ను అన్వేషించండి
|
||||
|
||||
డేటాను లోతుగా పరిశీలించే మరో మార్గం దాని పంపిణీని చూడటం, లేదా డేటా ఒక అక్షం మీద ఎలా ఏర్పాటు చేయబడిందో చూడటం. ఉదాహరణకు, మీరు ఈ డేటాసెట్ కోసం మినెసోటా పక్షుల గరిష్ట రెక్కపట్టు లేదా గరిష్ట శరీర ద్రవ్యరాశి యొక్క సాధారణ పంపిణీ గురించి తెలుసుకోవాలనుకోవచ్చు.
|
||||
|
||||
ఈ డేటాసెట్లో డేటా పంపిణీల గురించి కొన్ని విషయాలను కనుగొనండి. ఈ పాఠం ఫోల్డర్ రూట్లో ఉన్న _notebook.ipynb_ ఫైల్లో, Pandas, Matplotlib మరియు మీ డేటాను దిగుమతి చేసుకోండి:
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
import matplotlib.pyplot as plt
|
||||
birds = pd.read_csv('../../data/birds.csv')
|
||||
birds.head()
|
||||
```
|
||||
|
||||
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
|
||||
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
|
||||
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
|
||||
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
|
||||
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
|
||||
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
|
||||
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
|
||||
|
||||
|
||||
సాధారణంగా, మీరు డేటా ఎలా పంపిణీ చేయబడిందో త్వరగా చూడటానికి మునుపటి పాఠంలో చేసినట్లుగా స్కాటర్ ప్లాట్ ఉపయోగించవచ్చు:
|
||||
|
||||
```python
|
||||
birds.plot(kind='scatter',x='MaxLength',y='Order',figsize=(12,8))
|
||||
|
||||
plt.title('Max Length per Order')
|
||||
plt.ylabel('Order')
|
||||
plt.xlabel('Max Length')
|
||||
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
ఇది పక్షుల ఆర్డర్ ప్రకారం శరీర పొడవు యొక్క సాధారణ పంపిణీకి అవలోకనం ఇస్తుంది, కానీ ఇది నిజమైన పంపిణీలను ప్రదర్శించడానికి ఉత్తమ మార్గం కాదు. ఆ పని సాధారణంగా హిస్టోగ్రామ్ సృష్టించడం ద్వారా నిర్వహించబడుతుంది.
|
||||
## హిస్టోగ్రామ్లతో పని చేయడం
|
||||
|
||||
Matplotlib డేటా పంపిణీని హిస్టోగ్రామ్లను ఉపయోగించి దృశ్యీకరించడానికి చాలా మంచి మార్గాలను అందిస్తుంది. ఈ రకమైన చార్ట్ ఒక బార్ చార్ట్ లాంటిది, ఇక్కడ పంపిణీని బార్ల పెరుగుదల మరియు తగ్గుదల ద్వారా చూడవచ్చు. హిస్టోగ్రామ్ నిర్మించడానికి, మీరు సంఖ్యాత్మక డేటా అవసరం. హిస్టోగ్రామ్ నిర్మించడానికి, మీరు 'hist' అనే కింద చార్ట్ను ప్లాట్ చేయవచ్చు. ఈ చార్ట్ మొత్తం డేటాసెట్ యొక్క సంఖ్యాత్మక డేటా పరిధి కోసం MaxBodyMass పంపిణీని చూపిస్తుంది. డేటా శ్రేణిని చిన్న బిన్లుగా విభజించడం ద్వారా, ఇది డేటా విలువల పంపిణీని ప్రదర్శించగలదు:
|
||||
|
||||
```python
|
||||
birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
మీరు చూడగలిగినట్లుగా, ఈ డేటాసెట్లో 400+ పక్షులలో ఎక్కువ భాగం వారి గరిష్ట శరీర ద్రవ్యరాశి 2000 కంటే తక్కువ పరిధిలో ఉంటాయి. `bins` పారామీటర్ను 30 లాంటి ఎక్కువ సంఖ్యకు మార్చి డేటా గురించి మరింత అవగాహన పొందండి:
|
||||
|
||||
```python
|
||||
birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
ఈ చార్ట్ మరింత సూక్ష్మంగా పంపిణీని చూపిస్తుంది. ఎడమవైపు తక్కువ వంకరగా ఉన్న చార్ట్ను మీరు ఒక నిర్దిష్ట పరిధిలో మాత్రమే డేటాను ఎంచుకోవడం ద్వారా సృష్టించవచ్చు:
|
||||
|
||||
మీ డేటాను ఫిల్టర్ చేసి శరీర ద్రవ్యరాశి 60 కంటే తక్కువ ఉన్న పక్షులను మాత్రమే తీసుకోండి, మరియు 40 `bins` చూపించండి:
|
||||
|
||||
```python
|
||||
filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]
|
||||
filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
✅ మరిన్ని ఫిల్టర్లు మరియు డేటా పాయింట్లను ప్రయత్నించండి. డేటా యొక్క పూర్తి పంపిణీని చూడటానికి, `['MaxBodyMass']` ఫిల్టర్ను తీసివేయండి మరియు లేబుల్ చేసిన పంపిణీలను చూపించండి.
|
||||
|
||||
హిస్టోగ్రామ్ కొన్ని మంచి రంగు మరియు లేబులింగ్ మెరుగుదలలను కూడా అందిస్తుంది:
|
||||
|
||||
రెండు పంపిణీల మధ్య సంబంధాన్ని పోల్చడానికి 2D హిస్టోగ్రామ్ సృష్టించండి. `MaxBodyMass` మరియు `MaxLength` ను పోల్చుకుందాం. Matplotlib ప్రకాశవంతమైన రంగులను ఉపయోగించి సమీకరణాన్ని చూపడానికి ఒక బిల్ట్-ఇన్ మార్గాన్ని అందిస్తుంది:
|
||||
|
||||
```python
|
||||
x = filteredBirds['MaxBodyMass']
|
||||
y = filteredBirds['MaxLength']
|
||||
|
||||
fig, ax = plt.subplots(tight_layout=True)
|
||||
hist = ax.hist2d(x, y)
|
||||
```
|
||||
ఈ రెండు అంశాల మధ్య ఒక అంచనా సంబంధం కనిపిస్తుంది, ఒక ప్రత్యేకంగా బలమైన సమీకరణ బిందువు తో:
|
||||
|
||||

|
||||
|
||||
హిస్టోగ్రామ్లు సంఖ్యాత్మక డేటాకు డిఫాల్ట్గా బాగా పనిచేస్తాయి. మీరు టెక్స్ట్ డేటా ప్రకారం పంపిణీలను చూడాలనుకుంటే ఏమవుతుంది?
|
||||
## టెక్స్ట్ డేటా ఉపయోగించి పంపిణీల కోసం డేటాసెట్ను అన్వేషించండి
|
||||
|
||||
ఈ డేటాసెట్లో పక్షుల వర్గం, జనస్, జాతి, కుటుంబం మరియు సంరక్షణ స్థితి గురించి మంచి సమాచారం కూడా ఉంది. ఈ సంరక్షణ సమాచారాన్ని లోతుగా పరిశీలిద్దాం. పక్షులు వారి సంరక్షణ స్థితి ప్రకారం ఎలా పంపిణీ అవుతాయి?
|
||||
|
||||
> ✅ డేటాసెట్లో, సంరక్షణ స్థితిని వివరించడానికి కొన్ని సంక్షిప్త రూపాలు ఉపయోగించబడ్డాయి. ఈ సంక్షిప్త రూపాలు [IUCN రెడ్ లిస్ట్ కేటగిరీలు](https://www.iucnredlist.org/) నుండి వచ్చాయి, ఇది జాతుల స్థితిని నమోదు చేసే సంస్థ.
|
||||
>
|
||||
> - CR: తీవ్రంగా ప్రమాదంలో ఉన్నది
|
||||
> - EN: ప్రమాదంలో ఉన్నది
|
||||
> - EX: అంతరించిపోయింది
|
||||
> - LC: తక్కువ ఆందోళన
|
||||
> - NT: సమీప ప్రమాదంలో ఉన్నది
|
||||
> - VU: సున్నితమైనది
|
||||
|
||||
ఇవి టెక్స్ట్ ఆధారిత విలువలు కాబట్టి మీరు హిస్టోగ్రామ్ సృష్టించడానికి ట్రాన్స్ఫార్మ్ చేయాలి. filteredBirds డేటాఫ్రేమ్ ఉపయోగించి, దాని సంరక్షణ స్థితిని మరియు కనిష్ట రెక్కపట్టును ప్రదర్శించండి. మీరు ఏమి చూస్తారు?
|
||||
|
||||
```python
|
||||
x1 = filteredBirds.loc[filteredBirds.ConservationStatus=='EX', 'MinWingspan']
|
||||
x2 = filteredBirds.loc[filteredBirds.ConservationStatus=='CR', 'MinWingspan']
|
||||
x3 = filteredBirds.loc[filteredBirds.ConservationStatus=='EN', 'MinWingspan']
|
||||
x4 = filteredBirds.loc[filteredBirds.ConservationStatus=='NT', 'MinWingspan']
|
||||
x5 = filteredBirds.loc[filteredBirds.ConservationStatus=='VU', 'MinWingspan']
|
||||
x6 = filteredBirds.loc[filteredBirds.ConservationStatus=='LC', 'MinWingspan']
|
||||
|
||||
kwargs = dict(alpha=0.5, bins=20)
|
||||
|
||||
plt.hist(x1, **kwargs, color='red', label='Extinct')
|
||||
plt.hist(x2, **kwargs, color='orange', label='Critically Endangered')
|
||||
plt.hist(x3, **kwargs, color='yellow', label='Endangered')
|
||||
plt.hist(x4, **kwargs, color='green', label='Near Threatened')
|
||||
plt.hist(x5, **kwargs, color='blue', label='Vulnerable')
|
||||
plt.hist(x6, **kwargs, color='gray', label='Least Concern')
|
||||
|
||||
plt.gca().set(title='Conservation Status', ylabel='Min Wingspan')
|
||||
plt.legend();
|
||||
```
|
||||
|
||||

|
||||
|
||||
కనిష్ట రెక్కపట్టు మరియు సంరక్షణ స్థితి మధ్య మంచి సంబంధం కనిపించడం లేదు. ఈ పద్ధతిని ఉపయోగించి డేటాసెట్ యొక్క ఇతర అంశాలను పరీక్షించండి. మీరు ఏదైనా సంబంధం కనుగొంటారా?
|
||||
|
||||
## డెన్సిటీ ప్లాట్లు
|
||||
|
||||
ముందు చూసిన హిస్టోగ్రామ్లు 'స్టెప్ప్డ్' లాగా ఉంటాయి మరియు మృదువుగా వంకరగా ప్రవహించవు. మరింత మృదువైన డెన్సిటీ చార్ట్ చూపించడానికి, మీరు డెన్సిటీ ప్లాట్ ప్రయత్నించవచ్చు.
|
||||
|
||||
డెన్సిటీ ప్లాట్లతో పని చేయడానికి, మీరు కొత్త ప్లాటింగ్ లైబ్రరీ అయిన [Seaborn](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) ను పరిచయం చేసుకోండి.
|
||||
|
||||
Seaborn లోడ్ చేసి, ఒక ప్రాథమిక డెన్సిటీ ప్లాట్ ప్రయత్నించండి:
|
||||
|
||||
```python
|
||||
import seaborn as sns
|
||||
import matplotlib.pyplot as plt
|
||||
sns.kdeplot(filteredBirds['MinWingspan'])
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
మీరు చూడవచ్చు, ఈ ప్లాట్ కనిష్ట రెక్కపట్టు డేటాకు ముందు ప్లాట్ను ప్రతిధ్వనిస్తుంది; ఇది కేవలం కొంచెం మృదువుగా ఉంటుంది. Seaborn డాక్యుమెంటేషన్ ప్రకారం, "హిస్టోగ్రామ్తో పోలిస్తే, KDE ఒక ప్లాట్ను తక్కువ గందరగోళంగా మరియు మరింత అర్థం చేసుకునేలా ఉత్పత్తి చేయగలదు, ముఖ్యంగా బహుళ పంపిణీలను డ్రా చేస్తున్నప్పుడు. కానీ ఇది ప్రాథమిక పంపిణీ పరిమితమైన లేదా మృదువుగా లేనప్పుడు వక్రీకరణలను పరిచయం చేసే అవకాశం ఉంది. హిస్టోగ్రామ్ లాగా, ప్రాతినిధ్యం నాణ్యత కూడా మంచి స్మూతింగ్ పారామీటర్ల ఎంపికపై ఆధారపడి ఉంటుంది." [మూలం](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) అంటే, అవుట్లయర్లు ఎప్పుడూ మీ చార్ట్లను చెడగొడతాయి.
|
||||
|
||||
మీరు రెండవ చార్ట్లో ఉన్న ఆ జాగెడ్ MaxBodyMass లైన్ను తిరిగి చూడాలనుకుంటే, ఈ పద్ధతిని ఉపయోగించి దాన్ని బాగా మృదువుగా చేయవచ్చు:
|
||||
|
||||
```python
|
||||
sns.kdeplot(filteredBirds['MaxBodyMass'])
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
మీకు మృదువైనది కావాలి కానీ చాలా మృదువైనది కాదు అనుకుంటే, `bw_adjust` పారామీటర్ను సవరించండి:
|
||||
|
||||
```python
|
||||
sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
|
||||
plt.show()
|
||||
```
|
||||

|
||||
|
||||
✅ ఈ రకమైన ప్లాట్ కోసం అందుబాటులో ఉన్న పారామీటర్ల గురించి చదవండి మరియు ప్రయోగాలు చేయండి!
|
||||
|
||||
ఈ రకమైన చార్ట్ అందమైన వివరణాత్మక దృశ్యీకరణలను అందిస్తుంది. కొన్ని కోడ్ లైన్లతో, ఉదాహరణకు, మీరు పక్షుల ఆర్డర్ ప్రకారం గరిష్ట శరీర ద్రవ్యరాశి డెన్సిటీని చూపించవచ్చు:
|
||||
|
||||
```python
|
||||
sns.kdeplot(
|
||||
data=filteredBirds, x="MaxBodyMass", hue="Order",
|
||||
fill=True, common_norm=False, palette="crest",
|
||||
alpha=.5, linewidth=0,
|
||||
)
|
||||
```
|
||||
|
||||

|
||||
|
||||
మీరు ఒకే చార్ట్లో అనేక వేరియబుల్స్ డెన్సిటీని కూడా మ్యాప్ చేయవచ్చు. పక్షుల గరిష్ట పొడవు మరియు కనిష్ట పొడవును వారి సంరక్షణ స్థితితో పోల్చండి:
|
||||
|
||||
```python
|
||||
sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")
|
||||
```
|
||||
|
||||

|
||||
|
||||
వозможно, 'Vulnerable' పక్షుల పొడవుల ప్రకారం క్లస్టర్ అర్థవంతమో లేదో పరిశోధించడం విలువైనది.
|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
హిస్టోగ్రామ్లు ప్రాథమిక స్కాటర్ప్లాట్లు, బార్ చార్ట్లు లేదా లైన్ చార్ట్ల కంటే మరింత సాంకేతిక రకమైన చార్ట్లు. ఇంటర్నెట్లో హిస్టోగ్రామ్ల ఉపయోగానికి మంచి ఉదాహరణలను వెతకండి. అవి ఎలా ఉపయోగిస్తారు, ఏమి చూపిస్తాయి, మరియు ఏ రంగాలలో లేదా పరిశోధనా ప్రాంతాలలో ఎక్కువగా ఉపయోగిస్తారు?
|
||||
|
||||
## [పాఠం తర్వాత క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/19)
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
ఈ పాఠంలో, మీరు Matplotlib ఉపయోగించి Seaborn తో మరింత సాంకేతిక చార్ట్లను చూపడం ప్రారంభించారు. Seaborn లో `kdeplot` గురించి కొంత పరిశోధన చేయండి, ఇది "ఒక లేదా ఎక్కువ కొలతలలో నిరంతర సంభావ్యత డెన్సిటీ వక్రరేఖ". ఇది ఎలా పనిచేస్తుందో అర్థం చేసుకోవడానికి [డాక్యుమెంటేషన్](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) చదవండి.
|
||||
|
||||
## అసైన్మెంట్
|
||||
|
||||
[మీ నైపుణ్యాలను వర్తించండి](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "40eeb9b9f94009c537c7811f9f27f037",
|
||||
"translation_date": "2025-12-19T15:56:44+00:00",
|
||||
"source_file": "3-Data-Visualization/10-visualization-distributions/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# మీ నైపుణ్యాలను వర్తింపజేయండి
|
||||
|
||||
## సూచనలు
|
||||
|
||||
ఇప్పటివరకు, మీరు మిన్నెసోటా పక్షుల డేటాసెట్తో పని చేసి పక్షుల సంఖ్య మరియు జనాభా సాంద్రత గురించి సమాచారం కనుగొన్నారు. ఈ సాంకేతికతలను వేరే డేటాసెట్తో ప్రయోగించండి, ఉదాహరణకు [Kaggle](https://www.kaggle.com/) నుండి పొందినది కావచ్చు. ఈ డేటాసెట్ గురించి కథ చెప్పడానికి ఒక నోట్బుక్ తయారు చేయండి, మరియు దానిని చర్చించే సమయంలో హిస్టోగ్రామ్లను ఉపయోగించండి.
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణాత్మకంగా | సరిపడా | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
ఈ డేటాసెట్ యొక్క మూలం సహా వ్యాఖ్యానాలతో కూడిన నోట్బుక్ అందించబడింది, మరియు డేటా గురించి నిజాలు కనుగొనడానికి కనీసం 5 హిస్టోగ్రామ్లను ఉపయోగిస్తుంది. | అసంపూర్ణ వ్యాఖ్యానాలు లేదా బగ్స్ ఉన్న నోట్బుక్ అందించబడింది. | వ్యాఖ్యానాలు లేకుండా మరియు బగ్స్ ఉన్న నోట్బుక్ అందించబడింది.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,32 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# పక్షుల పంపిణీలు\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**అస్పష్టత**: \nఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "e5272cbcbffd1ddcc09e44d3d8e7e8cd",
|
||||
"translation_date": "2025-12-19T17:35:11+00:00",
|
||||
"source_file": "3-Data-Visualization/10-visualization-distributions/notebook.ipynb",
|
||||
"language_code": "te"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,207 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "42119bcc97bee88254e381156d770f3c",
|
||||
"translation_date": "2025-12-19T16:01:05+00:00",
|
||||
"source_file": "3-Data-Visualization/11-visualization-proportions/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# భాగాలను దృశ్యీకరించడం
|
||||
|
||||
| ](../../sketchnotes/11-Visualizing-Proportions.png)|
|
||||
|:---:|
|
||||
|భాగాలను దృశ్యీకరించడం - _స్కెచ్ నోట్ [@nitya](https://twitter.com/nitya) ద్వారా_ |
|
||||
|
||||
ఈ పాఠంలో, మీరు మష్రూమ్ల గురించి ఒక dataset లోని విభిన్న రకాల ఫంగస్ ఎంతమేరకు ఉన్నాయో భాగాలను దృశ్యీకరించడానికి వేరే ప్రకృతి-కేంద్రీకృత dataset ఉపయోగిస్తారు. Audubon నుండి పొందిన 23 రకాల గిల్లెడ్ మష్రూమ్ల వివరాలు ఉన్న Agaricus మరియు Lepiota కుటుంబాల dataset ఉపయోగించి ఈ ఆసక్తికరమైన ఫంగస్లను పరిశీలిద్దాం. మీరు ఈ రుచికరమైన దృశ్యీకరణలతో ప్రయోగం చేయబోతున్నారు:
|
||||
|
||||
- పై చార్ట్లు 🥧
|
||||
- డోనట్ చార్ట్లు 🍩
|
||||
- వాఫిల్ చార్ట్లు 🧇
|
||||
|
||||
> 💡 Microsoft Research నుండి [Charticulator](https://charticulator.com) అనే చాలా ఆసక్తికరమైన ప్రాజెక్ట్ ఉచిత డ్రాగ్ అండ్ డ్రాప్ ఇంటర్ఫేస్ను డేటా దృశ్యీకరణల కోసం అందిస్తుంది. వారి ట్యుటోరియల్స్లో ఒకటిలో కూడా ఈ మష్రూమ్ dataset ఉపయోగిస్తారు! కాబట్టి మీరు డేటాను అన్వేషించి లైబ్రరీని ఒకేసారి నేర్చుకోవచ్చు: [Charticulator ట్యుటోరియల్](https://charticulator.com/tutorials/tutorial4.html).
|
||||
|
||||
## [పాఠం ముందు క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/20)
|
||||
|
||||
## మీ మష్రూమ్లను తెలుసుకోండి 🍄
|
||||
|
||||
మష్రూమ్లు చాలా ఆసక్తికరమైనవి. వాటిని అధ్యయనం చేయడానికి ఒక dataset ను దిగుమతి చేద్దాం:
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
import matplotlib.pyplot as plt
|
||||
mushrooms = pd.read_csv('../../data/mushrooms.csv')
|
||||
mushrooms.head()
|
||||
```
|
||||
ఒక పట్టిక విశ్లేషణకు మంచి డేటాతో ముద్రించబడింది:
|
||||
|
||||
|
||||
| class | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | stalk-root | stalk-surface-above-ring | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
|
||||
| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
|
||||
| Poisonous | Convex | Smooth | Brown | Bruises | Pungent | Free | Close | Narrow | Black | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
|
||||
| Edible | Convex | Smooth | Yellow | Bruises | Almond | Free | Close | Broad | Black | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Grasses |
|
||||
| Edible | Bell | Smooth | White | Bruises | Anise | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Meadows |
|
||||
| Poisonous | Convex | Scaly | White | Bruises | Pungent | Free | Close | Narrow | Brown | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
|
||||
|
||||
తక్షణమే, మీరు గమనిస్తారు అన్ని డేటా వచనాత్మకంగా ఉంది. మీరు ఈ డేటాను చార్ట్లో ఉపయోగించడానికి మార్చుకోవాలి. నిజానికి, ఎక్కువ భాగం డేటా ఒక ఆబ్జెక్ట్గా ప్రదర్శించబడింది:
|
||||
|
||||
```python
|
||||
print(mushrooms.select_dtypes(["object"]).columns)
|
||||
```
|
||||
|
||||
ఫలితం:
|
||||
|
||||
```output
|
||||
Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
|
||||
'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
|
||||
'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
|
||||
'stalk-surface-below-ring', 'stalk-color-above-ring',
|
||||
'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
|
||||
'ring-type', 'spore-print-color', 'population', 'habitat'],
|
||||
dtype='object')
|
||||
```
|
||||
ఈ డేటాను తీసుకుని 'class' కాలమ్ను category గా మార్చండి:
|
||||
|
||||
```python
|
||||
cols = mushrooms.select_dtypes(["object"]).columns
|
||||
mushrooms[cols] = mushrooms[cols].astype('category')
|
||||
```
|
||||
|
||||
```python
|
||||
edibleclass=mushrooms.groupby(['class']).count()
|
||||
edibleclass
|
||||
```
|
||||
|
||||
ఇప్పుడు, మీరు మష్రూమ్ డేటాను ముద్రిస్తే, అది poisonous/edible క్లాస్ ప్రకారం వర్గీకరించబడిందని చూడవచ్చు:
|
||||
|
||||
|
||||
| | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | ... | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
|
||||
| --------- | --------- | ----------- | --------- | ------- | ---- | --------------- | ------------ | --------- | ---------- | ----------- | --- | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
|
||||
| class | | | | | | | | | | | | | | | | | | | | | |
|
||||
| Edible | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
|
||||
| Poisonous | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
|
||||
|
||||
ఈ పట్టికలో చూపించిన క్రమాన్ని అనుసరించి మీ class category లేబుల్స్ సృష్టిస్తే, మీరు పై చార్ట్ తయారు చేయవచ్చు:
|
||||
|
||||
## పై!
|
||||
|
||||
```python
|
||||
labels=['Edible','Poisonous']
|
||||
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
|
||||
plt.title('Edible?')
|
||||
plt.show()
|
||||
```
|
||||
ఇది, ఈ రెండు మష్రూమ్ తరగతుల ప్రకారం ఈ డేటా భాగాలను చూపించే పై చార్ట్. లేబుల్స్ క్రమం సరిగ్గా ఉండటం చాలా ముఖ్యం, కాబట్టి లేబుల్ అర్రే ఎలా నిర్మించబడిందో నిర్ధారించుకోండి!
|
||||
|
||||

|
||||
|
||||
## డోనట్స్!
|
||||
|
||||
కొంతమేర దృశ్యంగా ఆసక్తికరమైన పై చార్ట్ డోనట్ చార్ట్, ఇది మధ్యలో రంధ్రం ఉన్న పై చార్ట్. ఈ పద్ధతిని ఉపయోగించి మన డేటాను చూద్దాం.
|
||||
|
||||
మష్రూమ్లు పెరుగుతున్న వివిధ వాతావరణాలను పరిశీలించండి:
|
||||
|
||||
```python
|
||||
habitat=mushrooms.groupby(['habitat']).count()
|
||||
habitat
|
||||
```
|
||||
ఇక్కడ, మీరు మీ డేటాను వాతావరణం ప్రకారం వర్గీకరిస్తున్నారు. 7 వాతావరణాలు ఉన్నాయి, కాబట్టి వాటిని మీ డోనట్ చార్ట్ లేబుల్స్గా ఉపయోగించండి:
|
||||
|
||||
```python
|
||||
labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
|
||||
|
||||
plt.pie(habitat['class'], labels=labels,
|
||||
autopct='%1.1f%%', pctdistance=0.85)
|
||||
|
||||
center_circle = plt.Circle((0, 0), 0.40, fc='white')
|
||||
fig = plt.gcf()
|
||||
|
||||
fig.gca().add_artist(center_circle)
|
||||
|
||||
plt.title('Mushroom Habitats')
|
||||
|
||||
plt.show()
|
||||
```
|
||||
|
||||

|
||||
|
||||
ఈ కోడ్ ఒక చార్ట్ మరియు మధ్యలో ఒక వృత్తాన్ని గీయడం, ఆ మధ్య వృత్తాన్ని చార్ట్లో చేర్చడం చేస్తుంది. మధ్య వృత్తం వెడల్పును మార్చడానికి `0.40` ను మరొక విలువగా మార్చండి.
|
||||
|
||||
డోనట్ చార్ట్లను లేబుల్స్ మార్చడానికి అనేక విధాలుగా సవరించవచ్చు. ముఖ్యంగా లేబుల్స్ పఠనీయత కోసం హైలైట్ చేయవచ్చు. మరింత తెలుసుకోండి [డాక్స్](https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut).
|
||||
|
||||
ఇప్పుడు మీరు మీ డేటాను వర్గీకరించి దాన్ని పై లేదా డోనట్గా ప్రదర్శించడం ఎలా చేయాలో తెలుసుకున్నారంటే, మీరు ఇతర రకాల చార్ట్లను అన్వేషించవచ్చు. వాఫిల్ చార్ట్ ప్రయత్నించండి, ఇది కేవలం పరిమాణాన్ని అన్వేషించే వేరే విధానం.
|
||||
|
||||
## వాఫిల్స్!
|
||||
|
||||
'వాఫిల్' రకం చార్ట్ అనేది పరిమాణాలను 2D చతురస్రాల అర్రేగా దృశ్యీకరించే వేరే విధానం. ఈ dataset లోని మష్రూమ్ క్యాప్ రంగుల విభిన్న పరిమాణాలను దృశ్యీకరించడానికి ప్రయత్నించండి. దీని కోసం, మీరు [PyWaffle](https://pypi.org/project/pywaffle/) అనే సహాయక లైబ్రరీని ఇన్స్టాల్ చేసి Matplotlib ఉపయోగించాలి:
|
||||
|
||||
```python
|
||||
pip install pywaffle
|
||||
```
|
||||
|
||||
మీ డేటా ఒక భాగాన్ని ఎంచుకోండి:
|
||||
|
||||
```python
|
||||
capcolor=mushrooms.groupby(['cap-color']).count()
|
||||
capcolor
|
||||
```
|
||||
|
||||
లేబుల్స్ సృష్టించి డేటాను వర్గీకరించి వాఫిల్ చార్ట్ సృష్టించండి:
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
import matplotlib.pyplot as plt
|
||||
from pywaffle import Waffle
|
||||
|
||||
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
|
||||
'amount': capcolor['class']
|
||||
}
|
||||
|
||||
df = pd.DataFrame(data)
|
||||
|
||||
fig = plt.figure(
|
||||
FigureClass = Waffle,
|
||||
rows = 100,
|
||||
values = df.amount,
|
||||
labels = list(df.color),
|
||||
figsize = (30,30),
|
||||
colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
|
||||
)
|
||||
```
|
||||
|
||||
వాఫిల్ చార్ట్ ఉపయోగించి, మీరు ఈ మష్రూమ్ dataset క్యాప్ రంగుల భాగాలను స్పష్టంగా చూడవచ్చు. ఆసక్తికరంగా, చాలా గ్రీన్-క్యాప్ మష్రూమ్లు ఉన్నాయి!
|
||||
|
||||

|
||||
|
||||
✅ Pywaffle చార్ట్లలో [Font Awesome](https://fontawesome.com/)లో అందుబాటులో ఉన్న ఏ ఐకాన్ అయినా ఉపయోగించగలదు. చతురస్రాల స్థానంలో ఐకాన్లను ఉపయోగించి మరింత ఆసక్తికరమైన వాఫిల్ చార్ట్ సృష్టించడానికి ప్రయోగాలు చేయండి.
|
||||
|
||||
ఈ పాఠంలో, మీరు భాగాలను దృశ్యీకరించే మూడు మార్గాలను నేర్చుకున్నారు. మొదట, మీ డేటాను వర్గాలుగా వర్గీకరించాలి, ఆపై డేటాను ప్రదర్శించడానికి ఉత్తమ మార్గం - పై, డోనట్ లేదా వాఫిల్ ఎంచుకోవాలి. ఇవన్నీ రుచికరమైనవి మరియు dataset యొక్క తక్షణ స్నాప్షాట్ను వినియోగదారునికి అందిస్తాయి.
|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
ఈ రుచికరమైన చార్ట్లను [Charticulator](https://charticulator.com) లో పునఃసృష్టించడానికి ప్రయత్నించండి.
|
||||
## [పాఠం తర్వాత క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/21)
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
ఎప్పుడైతే పై, డోనట్ లేదా వాఫిల్ చార్ట్ ఉపయోగించాలో స్పష్టంగా తెలియదు. ఈ విషయంపై చదవడానికి కొన్ని వ్యాసాలు:
|
||||
|
||||
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
|
||||
|
||||
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
|
||||
|
||||
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
|
||||
|
||||
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
|
||||
|
||||
ఈ క్లిష్ట నిర్ణయం గురించి మరింత సమాచారం కోసం పరిశోధన చేయండి.
|
||||
## అసైన్మెంట్
|
||||
|
||||
[Excel లో ప్రయత్నించండి](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం చేయించుకోవడం మంచిది. ఈ అనువాదం వలన కలిగే ఏవైనా అపార్థాలు లేదా తప్పుదారుల బాధ్యత మేము తీసుకోము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "1e00fe6a244c2f8f9a794c862661dd4f",
|
||||
"translation_date": "2025-12-19T16:04:55+00:00",
|
||||
"source_file": "3-Data-Visualization/11-visualization-proportions/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# Excelలో ప్రయత్నించండి
|
||||
|
||||
## సూచనలు
|
||||
|
||||
మీరు Excelలో డోనట్, పై, మరియు వాఫిల్ చార్ట్లు సృష్టించగలరని తెలుసా? మీ ఇష్టమైన డేటాసెట్ ఉపయోగించి, ఈ మూడు చార్ట్లను Excel స్ప్రెడ్షీట్లోనే సృష్టించండి.
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
| అద్భుతమైనది | సరిపడినది | మెరుగుదల అవసరం |
|
||||
| ------------------------------------------------------- | ------------------------------------------------- | ------------------------------------------------------ |
|
||||
| అన్ని మూడు చార్ట్లతో కూడిన Excel స్ప్రెడ్షీట్ అందించబడింది | రెండు చార్ట్లతో కూడిన Excel స్ప్రెడ్షీట్ అందించబడింది | ఒకే ఒక చార్ట్తో కూడిన Excel స్ప్రెడ్షీట్ అందించబడింది |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,32 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# 🍄 మష్రూమ్ నిష్పత్తులు\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**అస్పష్టత**: \nఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకం వల్ల కలిగే ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "397e9bbc0743761dbf72e5f16b7043e6",
|
||||
"translation_date": "2025-12-19T17:35:45+00:00",
|
||||
"source_file": "3-Data-Visualization/11-visualization-proportions/notebook.ipynb",
|
||||
"language_code": "te"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,190 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "0764fd4077f3f04a1d968ec371227744",
|
||||
"translation_date": "2025-12-19T15:57:25+00:00",
|
||||
"source_file": "3-Data-Visualization/12-visualization-relationships/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# సంబంధాలను దృశ్యీకరించడం: తేనె గురించి అన్ని 🍯
|
||||
|
||||
| ద్వారా ](../../sketchnotes/12-Visualizing-Relationships.png)|
|
||||
|:---:|
|
||||
|సంబంధాలను దృశ్యీకరించడం - _స్కెచ్ నోట్ [@nitya](https://twitter.com/nitya) ద్వారా_ |
|
||||
|
||||
మా పరిశోధనలో ప్రకృతి దృష్టిని కొనసాగిస్తూ, [యునైటెడ్ స్టేట్స్ డిపార్ట్మెంట్ ఆఫ్ అగ్రికల్చర్](https://www.nass.usda.gov/About_NASS/index.php) నుండి పొందిన డేటాసెట్ ఆధారంగా వివిధ రకాల తేనె మధ్య సంబంధాలను చూపించే ఆసక్తికరమైన దృశ్యీకరణలను కనుగొనుకుందాం.
|
||||
|
||||
ఈ సుమారు 600 అంశాల డేటాసెట్ అనేక యుఎస్ రాష్ట్రాలలో తేనె ఉత్పత్తిని ప్రదర్శిస్తుంది. ఉదాహరణకు, మీరు కాలనీల సంఖ్య, కాలనీకి ఉత్పత్తి, మొత్తం ఉత్పత్తి, నిల్వలు, పౌండ్కు ధర, మరియు 1998-2012 మధ్య ప్రతి రాష్ట్రంలో ఉత్పత్తి విలువను సంవత్సరానికి ఒక వరుసగా చూడవచ్చు.
|
||||
|
||||
ఒక రాష్ట్రం యొక్క సంవత్సరానికి ఉత్పత్తి మరియు ఆ రాష్ట్రంలో తేనె ధర మధ్య సంబంధాన్ని దృశ్యీకరించడం ఆసక్తికరం. లేదా, రాష్ట్రాల తేనె ఉత్పత్తి కాలనీకి మధ్య సంబంధాన్ని చూపవచ్చు. ఈ సంవత్సరాల వ్యవధి 2006లో మొదటగా కనిపించిన 'CCD' లేదా 'కాలనీ కాలాప్స్ డిసార్డర్' (http://npic.orst.edu/envir/ccd.html) ను కవర్ చేస్తుంది, కాబట్టి ఇది అధ్యయనం చేయడానికి భావోద్వేగమైన డేటాసెట్.
|
||||
|
||||
## [పూర్వ-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/22)
|
||||
|
||||
ఈ పాఠంలో, మీరు ముందుగా ఉపయోగించిన Seaborn ను వేరియబుల్స్ మధ్య సంబంధాలను దృశ్యీకరించడానికి మంచి లైబ్రరీగా ఉపయోగించవచ్చు. ప్రత్యేకంగా, Seaborn యొక్క `relplot` ఫంక్షన్ ఉపయోగించడం ఆసక్తికరం, ఇది స్కాటర్ ప్లాట్లు మరియు లైన్ ప్లాట్లను త్వరగా '[సాంఖ్యిక సంబంధాలు](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' చూపించడానికి అనుమతిస్తుంది, ఇది డేటా శాస్త్రవేత్తకు వేరియబుల్స్ ఎలా సంబంధించాయో మెరుగ్గా అర్థం చేసుకోవడానికి సహాయపడుతుంది.
|
||||
|
||||
## స్కాటర్ ప్లాట్లు
|
||||
|
||||
ప్రతి రాష్ట్రానికి సంవత్సరానికి తేనె ధర ఎలా మారిందో చూపించడానికి స్కాటర్ ప్లాట్ ఉపయోగించండి. Seaborn, `relplot` ఉపయోగించి, రాష్ట్ర డేటాను సమూహీకరించి, వర్గీకృత మరియు సంఖ్యాత్మక డేటా కోసం డేటా పాయింట్లను ప్రదర్శిస్తుంది.
|
||||
|
||||
ముందుగా డేటా మరియు Seaborn ను దిగుమతి చేసుకుందాం:
|
||||
|
||||
```python
|
||||
import pandas as pd
|
||||
import matplotlib.pyplot as plt
|
||||
import seaborn as sns
|
||||
honey = pd.read_csv('../../data/honey.csv')
|
||||
honey.head()
|
||||
```
|
||||
మీరు గమనిస్తారు తేనె డేటాలో సంవత్సరము మరియు పౌండ్కు ధర వంటి కొన్ని ఆసక్తికరమైన కాలమ్స్ ఉన్నాయి. ఈ డేటాను యుఎస్ రాష్ట్రాల వారీగా సమూహీకరించి పరిశీలిద్దాం:
|
||||
|
||||
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|
||||
| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
|
||||
| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
|
||||
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
|
||||
| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
|
||||
| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
|
||||
| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
|
||||
|
||||
తేనె ధర మరియు దాని ఉత్పత్తి రాష్ట్రం మధ్య సంబంధాన్ని చూపించడానికి ఒక ప్రాథమిక స్కాటర్ ప్లాట్ సృష్టించండి. అన్ని రాష్ట్రాలు ప్రదర్శించడానికి `y` అక్షాన్ని పొడవుగా చేయండి:
|
||||
|
||||
```python
|
||||
sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
|
||||
```
|
||||

|
||||
|
||||
ఇప్పుడు, తేనె రంగు ప్యాలెట్ ఉపయోగించి అదే డేటాను చూపించండి, సంవత్సరాల వారీగా ధర ఎలా మారిందో చూపించడానికి. మీరు 'hue' పారామీటర్ జోడించడం ద్వారా సంవత్సరాల మార్పును చూపవచ్చు:
|
||||
|
||||
> ✅ Seaborn లో మీరు ఉపయోగించగల [రంగు ప్యాలెట్ల గురించి మరింత తెలుసుకోండి](https://seaborn.pydata.org/tutorial/color_palettes.html) - అందమైన రైన్బో రంగు ప్యాలెట్ ప్రయత్నించండి!
|
||||
|
||||
```python
|
||||
sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5);
|
||||
```
|
||||

|
||||
|
||||
ఈ రంగు ప్యాలెట్ మార్పుతో, తేనె ధరలో సంవత్సరాల వారీగా స్పష్టమైన పెరుగుదల ఉందని మీరు చూడవచ్చు. నిజంగా, డేటాలో ఒక ఉదాహరణ రాష్ట్రం (ఉదాహరణకు అరిజోనా) తీసుకుని పరిశీలిస్తే, సంవత్సరాల వారీగా ధర పెరుగుదల ఒక నమూనా కనిపిస్తుంది, కొన్ని తప్పులతో:
|
||||
|
||||
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|
||||
| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
|
||||
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
|
||||
| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
|
||||
| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
|
||||
| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
|
||||
| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
|
||||
| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
|
||||
| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
|
||||
| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
|
||||
| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
|
||||
| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
|
||||
| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
|
||||
| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
|
||||
| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
|
||||
| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
|
||||
| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
|
||||
|
||||
రంగు బదులుగా పరిమాణం ఉపయోగించి ఈ పెరుగుదలని చూపించవచ్చు. రంగు దృష్టి లోపం ఉన్న వినియోగదారులకు ఇది మంచి ఎంపిక కావచ్చు. డాట్ వ్యాసార్థం పెరుగుదలతో ధర పెరుగుదలని చూపించడానికి మీ దృశ్యీకరణను సవరించండి:
|
||||
|
||||
```python
|
||||
sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5);
|
||||
```
|
||||
డాట్ల పరిమాణం క్రమంగా పెరుగుతున్నట్లు మీరు చూడవచ్చు.
|
||||
|
||||

|
||||
|
||||
ఇది సరళమైన సరఫరా మరియు డిమాండ్ కేసా కాదా? వాతావరణ మార్పు మరియు కాలనీ కాలాప్స్ వంటి కారణాల వల్ల, సంవత్సరాల వారీగా తేనె కొరకు అందుబాటు తగ్గుతుందా, అందువల్ల ధర పెరుగుతుందా?
|
||||
|
||||
ఈ డేటాసెట్ లోని కొన్ని వేరియబుల్స్ మధ్య సంబంధాన్ని కనుగొనడానికి, కొన్ని లైన్ చార్ట్లను పరిశీలిద్దాం.
|
||||
|
||||
## లైన్ చార్ట్లు
|
||||
|
||||
ప్రశ్న: తేనె ధర సంవత్సరాల వారీగా స్పష్టంగా పెరుగుతుందా? మీరు ఒకే లైన్ చార్ట్ సృష్టించడం ద్వారా ఇది సులభంగా కనుగొనవచ్చు:
|
||||
|
||||
```python
|
||||
sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
|
||||
```
|
||||
జవాబు: అవును, 2003 సంవత్సరానికి చుట్టూ కొన్ని తప్పులతో:
|
||||
|
||||

|
||||
|
||||
✅ Seaborn ఒకే లైన్ చుట్టూ డేటాను సమీకరించడంతో, "ప్రతి x విలువ వద్ద బహుళ కొలతలను సగటు మరియు సగటు చుట్టూ 95% విశ్వాస అంతరాన్ని ప్లాట్ చేస్తుంది". [మూలం](https://seaborn.pydata.org/tutorial/relational.html). ఈ సమయం తీసుకునే ప్రవర్తనను `ci=None` జోడించడం ద్వారా నిలిపివేయవచ్చు.
|
||||
|
||||
ప్రశ్న: 2003లో తేనె సరఫరాలో కూడా పెరుగుదల కనిపిస్తుందా? సంవత్సరాల వారీగా మొత్తం ఉత్పత్తిని చూస్తే?
|
||||
|
||||
```python
|
||||
sns.relplot(x="year", y="totalprod", kind="line", data=honey);
|
||||
```
|
||||
|
||||

|
||||
|
||||
జవాబు: అంతగా కాదు. మొత్తం ఉత్పత్తిని చూస్తే, ఆ ప్రత్యేక సంవత్సరంలో పెరిగినట్లు కనిపిస్తుంది, అయితే సాధారణంగా ఈ సంవత్సరాలలో తేనె ఉత్పత్తి తగ్గుతోంది.
|
||||
|
||||
ప్రశ్న: ఆ సందర్భంలో, 2003లో తేనె ధర పెరుగుదలకు కారణం ఏమిటి?
|
||||
|
||||
దీన్ని కనుగొనడానికి, మీరు ఫేసెట్ గ్రిడ్ ను పరిశీలించవచ్చు.
|
||||
|
||||
## ఫేసెట్ గ్రిడ్లు
|
||||
|
||||
ఫేసెట్ గ్రిడ్లు మీ డేటాసెట్ యొక్క ఒక ఫేసెట్ తీసుకుంటాయి (మా సందర్భంలో, మీరు 'సంవత్సరం' ఎంచుకుని చాలా ఫేసెట్లు ఉత్పత్తి కాకుండా చేయవచ్చు). Seaborn ఆ ఫేసెట్ల కోసం మీ ఎంచుకున్న x మరియు y కోఆర్డినేట్లతో ప్రతి ఫేసెట్ కోసం ప్లాట్ తయారు చేస్తుంది, ఇది సులభమైన దృశ్య తులన కోసం. 2003 ఈ రకమైన తులనలో ప్రత్యేకంగా కనిపిస్తుందా?
|
||||
|
||||
[Seaborn డాక్యుమెంటేషన్](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) సూచించినట్లుగా `relplot` ఉపయోగించి ఫేసెట్ గ్రిడ్ సృష్టించండి.
|
||||
|
||||
```python
|
||||
sns.relplot(
|
||||
data=honey,
|
||||
x="yieldpercol", y="numcol",
|
||||
col="year",
|
||||
col_wrap=3,
|
||||
kind="line"
|
||||
)
|
||||
```
|
||||
ఈ దృశ్యీకరణలో, మీరు సంవత్సరాల వారీగా కాలనీకి ఉత్పత్తి మరియు కాలనీల సంఖ్యను పక్కపక్కనే 3 కాలమ్స్ లో ర్యాప్ సెట్ తో పోల్చవచ్చు:
|
||||
|
||||

|
||||
|
||||
ఈ డేటాసెట్ కోసం, కాలనీల సంఖ్య మరియు వారి ఉత్పత్తి విషయంలో సంవత్సరాల వారీగా మరియు రాష్ట్రాల వారీగా ప్రత్యేకంగా ఏమీ కనిపించదు. ఈ రెండు వేరియబుల్స్ మధ్య సంబంధం కనుగొనడానికి వేరే దృశ్య పద్ధతి ఉందా?
|
||||
|
||||
## డ్యూయల్-లైన్ ప్లాట్లు
|
||||
|
||||
రెండు లైన్ ప్లాట్లను ఒకదానిపై మరొకటి ఉంచి, Seaborn యొక్క 'despine' ఉపయోగించి పై మరియు కుడి స్పైన్లను తీసివేసి, `ax.twinx` [Matplotlib నుండి](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) తీసుకుని మల్టిలైన్ ప్లాట్ ప్రయత్నించండి. Twinx ఒక చార్ట్ x అక్షాన్ని పంచుకుని రెండు y అక్షాలను ప్రదర్శించడానికి అనుమతిస్తుంది. కాబట్టి, కాలనీకి ఉత్పత్తి మరియు కాలనీల సంఖ్యను సూపరింపోజ్ చేయండి:
|
||||
|
||||
```python
|
||||
fig, ax = plt.subplots(figsize=(12,6))
|
||||
lineplot = sns.lineplot(x=honey['year'], y=honey['numcol'], data=honey,
|
||||
label = 'Number of bee colonies', legend=False)
|
||||
sns.despine()
|
||||
plt.ylabel('# colonies')
|
||||
plt.title('Honey Production Year over Year');
|
||||
|
||||
ax2 = ax.twinx()
|
||||
lineplot2 = sns.lineplot(x=honey['year'], y=honey['yieldpercol'], ax=ax2, color="r",
|
||||
label ='Yield per colony', legend=False)
|
||||
sns.despine(right=False)
|
||||
plt.ylabel('colony yield')
|
||||
ax.figure.legend();
|
||||
```
|
||||

|
||||
|
||||
2003 సంవత్సరానికి చుట్టూ ఏదీ ప్రత్యేకంగా కనిపించకపోయినా, ఈ పాఠాన్ని కొంత సంతోషకరమైన నోటుతో ముగించడానికి ఇది సహాయపడుతుంది: మొత్తం కాలనీల సంఖ్య తగ్గుతున్నప్పటికీ, వారి ఉత్పత్తి తగ్గుతున్నా కాలనీల సంఖ్య స్థిరపడుతోంది.
|
||||
|
||||
పోరు, తేనెలు, పోరు!
|
||||
|
||||
🐝❤️
|
||||
## 🚀 సవాలు
|
||||
|
||||
ఈ పాఠంలో, మీరు స్కాటర్ ప్లాట్లు మరియు లైన్ గ్రిడ్లు, ఫేసెట్ గ్రిడ్లు వంటి ఇతర ఉపయోగాల గురించి కొంత తెలుసుకున్నారు. మీరు ఈ పాఠాల ముందు ఉపయోగించిన వేరే డేటాసెట్ ఉపయోగించి ఫేసెట్ గ్రిడ్ సృష్టించడానికి సవాలు చేయండి. అవి సృష్టించడానికి ఎంత సమయం పడుతుందో గమనించండి మరియు ఈ సాంకేతికతలతో మీరు ఎంత గ్రిడ్లు డ్రా చేయాలో జాగ్రత్తగా ఉండాల్సిన అవసరం గురించి గమనించండి.
|
||||
|
||||
## [పోస్ట్-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/23)
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
లైన్ ప్లాట్లు సులభంగా లేదా చాలా సంక్లిష్టంగా ఉండవచ్చు. మీరు వాటిని ఎలా నిర్మించవచ్చో [Seaborn డాక్యుమెంటేషన్](https://seaborn.pydata.org/generated/seaborn.lineplot.html) లో కొంత చదవండి. ఈ పాఠంలో మీరు నిర్మించిన లైన్ చార్ట్లను డాక్స్ లో సూచించిన ఇతర పద్ధతులతో మెరుగుపరచడానికి ప్రయత్నించండి.
|
||||
## అసైన్మెంట్
|
||||
|
||||
[తేనెగుళ్లలోకి డైవ్ చేయండి](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "680419753c086eef51be86607c623945",
|
||||
"translation_date": "2025-12-19T15:59:48+00:00",
|
||||
"source_file": "3-Data-Visualization/12-visualization-relationships/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# తేనెతోటలోకి డైవ్ చేయండి
|
||||
|
||||
## సూచనలు
|
||||
|
||||
ఈ పాఠంలో మీరు తేనెలు మరియు వాటి తేనె ఉత్పత్తి గురించి ఒక డేటాసెట్ను పరిశీలించడం ప్రారంభించారు, ఇది మొత్తం తేనెతోట జనాభాలో నష్టాలను చూసింది. ఈ డేటాసెట్ను మరింత లోతుగా పరిశీలించి, రాష్ట్రం వారీగా మరియు సంవత్సరం వారీగా తేనెతోట జనాభా ఆరోగ్య కథను చెప్పగల నోట్బుక్ను నిర్మించండి. ఈ డేటాసెట్ గురించి మీరు ఏదైనా ఆసక్తికరమైనది కనుగొన్నారా?
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
| అద్భుతమైనది | సరిపోతుంది | మెరుగుదల అవసరం |
|
||||
| ------------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------- | ---------------------------------------- |
|
||||
| డేటాసెట్ యొక్క అంశాలను చూపించే కనీసం మూడు వేర్వేరు చార్ట్లతో కథతో కూడిన నోట్బుక్ ఒకటి సమర్పించబడింది, రాష్ట్రం వారీగా మరియు సంవత్సరం వారీగా | నోట్బుక్ ఈ అంశాలలో ఒకదాన్ని欠缺ం | నోట్బుక్ ఈ అంశాలలో రెండు欠缺ం |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,32 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"source": [
|
||||
"# తేనె ఉత్పత్తి దృశ్యీకరణ 🍯 🐝\n"
|
||||
],
|
||||
"metadata": {}
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"---\n\n<!-- CO-OP TRANSLATOR DISCLAIMER START -->\n**అస్పష్టత**: \nఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం చేయించుకోవడం మంచిది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారులు కోసం మేము బాధ్యత వహించము.\n<!-- CO-OP TRANSLATOR DISCLAIMER END -->\n"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"orig_nbformat": 4,
|
||||
"language_info": {
|
||||
"name": "python"
|
||||
},
|
||||
"coopTranslator": {
|
||||
"original_hash": "0f988634b7192626d91cc33b4b6388c5",
|
||||
"translation_date": "2025-12-19T17:35:28+00:00",
|
||||
"source_file": "3-Data-Visualization/12-visualization-relationships/notebook.ipynb",
|
||||
"language_code": "te"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,184 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "cfb068050337a36e348debaa502a24fa",
|
||||
"translation_date": "2025-12-19T16:06:38+00:00",
|
||||
"source_file": "3-Data-Visualization/13-meaningful-visualizations/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# అర్థవంతమైన విజువలైజేషన్లు చేయడం
|
||||
|
||||
| ద్వారా ](../../sketchnotes/13-MeaningfulViz.png)|
|
||||
|:---:|
|
||||
| అర్థవంతమైన విజువలైజేషన్లు - _స్కెచ్ నోట్ [@nitya](https://twitter.com/nitya) ద్వారా_ |
|
||||
|
||||
> "మీరు డేటాను ఎంతకాలం పీడిస్తే, అది ఏదైనా ఒప్పుకుంటుంది" -- [Ronald Coase](https://en.wikiquote.org/wiki/Ronald_Coase)
|
||||
|
||||
డేటా సైంటిస్ట్ యొక్క ప్రాథమిక నైపుణ్యాలలో ఒకటి, మీరు కలిగి ఉండవచ్చునని అనుకునే ప్రశ్నలకు సహాయం చేసే అర్థవంతమైన డేటా విజువలైజేషన్ సృష్టించే సామర్థ్యం. మీ డేటాను విజువలైజ్ చేయడానికి ముందు, మీరు గత పాఠాలలో చేసినట్లుగా అది శుభ్రపరచబడినదిగా మరియు సిద్ధంగా ఉందని నిర్ధారించుకోవాలి. ఆ తర్వాత, మీరు డేటాను ఎలా ఉత్తమంగా ప్రదర్శించాలో నిర్ణయించుకోవచ్చు.
|
||||
|
||||
ఈ పాఠంలో, మీరు సమీక్షించబోతున్నారు:
|
||||
|
||||
1. సరైన చార్ట్ రకాన్ని ఎలా ఎంచుకోవాలి
|
||||
2. మోసపూరిత చార్టింగ్ను ఎలా నివారించాలి
|
||||
3. రంగులతో ఎలా పని చేయాలి
|
||||
4. చదవడానికి సులభంగా మీ చార్టులను ఎలా స్టైల్ చేయాలి
|
||||
5. యానిమేటెడ్ లేదా 3D చార్టింగ్ పరిష్కారాలను ఎలా నిర్మించాలి
|
||||
6. సృజనాత్మక విజువలైజేషన్ను ఎలా నిర్మించాలి
|
||||
|
||||
## [ప్రీ-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/24)
|
||||
|
||||
## సరైన చార్ట్ రకాన్ని ఎంచుకోండి
|
||||
|
||||
మునుపటి పాఠాలలో, మీరు Matplotlib మరియు Seaborn ఉపయోగించి అన్ని రకాల ఆసక్తికరమైన డేటా విజువలైజేషన్లను నిర్మించడంలో ప్రయోగించారు. సాధారణంగా, మీరు అడుగుతున్న ప్రశ్నకు సరిపోయే [సరైన రకమైన చార్ట్](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) ను ఈ పట్టిక ఉపయోగించి ఎంచుకోవచ్చు:
|
||||
|
||||
| మీరు చేయాలి: | మీరు ఉపయోగించాలి: |
|
||||
| -------------------------- | ------------------------------- |
|
||||
| సమయానుగుణంగా డేటా ధోరణులను చూపించండి | లైన్ |
|
||||
| వర్గాలను పోల్చండి | బార్, పై |
|
||||
| మొత్తం మొత్తాలను పోల్చండి | పై, స్టాక్డ్ బార్ |
|
||||
| సంబంధాలను చూపించండి | స్కాటర్, లైన్, ఫేసెట్, డ్యూయల్ లైన్ |
|
||||
| పంపిణీలను చూపించండి | స్కాటర్, హిస్టోగ్రామ్, బాక్స్ |
|
||||
| భాగాలను చూపించండి | పై, డోనట్, వాఫుల్ |
|
||||
|
||||
> ✅ మీ డేటా నిర్మాణం ఆధారంగా, మీరు ఒక నిర్దిష్ట చార్ట్కు మద్దతు ఇవ్వడానికి దాన్ని టెక్స్ట్ నుండి సంఖ్యాత్మకంగా మార్చుకోవాల్సి ఉండవచ్చు.
|
||||
|
||||
## మోసాన్ని నివారించండి
|
||||
|
||||
డేటా సైంటిస్ట్ సరైన డేటాకు సరైన చార్ట్ ఎంచుకోవడంలో జాగ్రత్తగా ఉన్నా కూడా, డేటాను ఒక పాయింట్ నిరూపించడానికి ప్రదర్శించే అనేక మార్గాలు ఉన్నాయి, తరచుగా డేటాను తక్కువగా చూపించే ఖర్చుతో. మోసపూరిత చార్టులు మరియు ఇన్ఫోగ్రాఫిక్స్ అనేక ఉదాహరణలు ఉన్నాయి!
|
||||
|
||||
[](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
|
||||
|
||||
> 🎥 మోసపూరిత చార్టుల గురించి కాన్ఫరెన్స్ టాక్ కోసం పై చిత్రం క్లిక్ చేయండి
|
||||
|
||||
ఈ చార్ట్ X అక్షాన్ని తిరగబెడుతుంది, తేదీ ఆధారంగా నిజానికి వ్యతిరేకంగా చూపించడానికి:
|
||||
|
||||

|
||||
|
||||
[ఈ చార్ట్](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) మరింత మోసపూరితంగా ఉంది, కళ్ళు కుడి వైపు ఆకర్షించబడి, కాలక్రమేణా COVID కేసులు వివిధ కౌంటీలలో తగ్గాయని తేల్చుకుంటుంది. నిజానికి, తేదీలను జాగ్రత్తగా పరిశీలిస్తే, అవి మోసపూరిత దిగువ ధోరణిని ఇవ్వడానికి తిరగబడినట్లు కనుగొంటారు.
|
||||
|
||||

|
||||
|
||||
ఈ ప్రసిద్ధ ఉదాహరణ రంగు మరియు తిరగబడిన Y అక్షాన్ని ఉపయోగించి మోసం చేస్తుంది: తుపాకీ మిత్ర చట్టం ఆమోదం తర్వాత తుపాకీ మరణాలు పెరిగాయని తేల్చుకోవడం కాకుండా, కళ్ళు వ్యతిరేకం నిజమని భావించడానికి మోసం చేస్తాయి:
|
||||
|
||||

|
||||
|
||||
ఈ విచిత్ర చార్ట్ భాగస్వామ్యాన్ని ఎలా మోసం చేయవచ్చో హాస్యాస్పదంగా చూపిస్తుంది:
|
||||
|
||||

|
||||
|
||||
అసమానమైన వాటిని పోల్చడం మరొక మోసపూరిత ట్రిక్. 'స్పూరియస్ కారెలేషన్స్' గురించి ఒక [అద్భుతమైన వెబ్ సైట్](https://tylervigen.com/spurious-correlations) ఉంది, ఇది మైన్లో విడాకుల రేటు మరియు మార్జరిన్ వినియోగం వంటి విషయాలను కలిపి 'వాస్తవాలు' చూపిస్తుంది. Reddit గ్రూప్ కూడా డేటా యొక్క [అందం లేని ఉపయోగాలను](https://www.reddit.com/r/dataisugly/top/?t=all) సేకరిస్తుంది.
|
||||
|
||||
మోసపూరిత చార్టుల ద్వారా కళ్ళు ఎంత సులభంగా మోసపోయే అవకాశం ఉందో అర్థం చేసుకోవడం ముఖ్యం. డేటా సైంటిస్ట్ ఉద్దేశ్యం మంచిదైనా, చాలా వర్గాలను చూపించే పై చార్ట్ వంటి చెడు రకమైన చార్ట్ ఎంపిక మోసపూరితంగా ఉండవచ్చు.
|
||||
|
||||
## రంగు
|
||||
|
||||
పై 'ఫ్లోరిడా తుపాకీ హింస' చార్ట్లో మీరు చూసినట్లుగా, రంగు చార్టులకు అదనపు అర్థాన్ని అందిస్తుంది, ముఖ్యంగా Matplotlib మరియు Seaborn వంటి లైబ్రరీలు ఉపయోగించని చార్టులకు, ఇవి వివిధ ధృవీకరించబడిన రంగు లైబ్రరీలు మరియు ప్యాలెట్లతో వస్తాయి. మీరు చేతితో చార్ట్ తయారు చేస్తుంటే, [రంగు సిద్ధాంతం](https://colormatters.com/color-and-design/basic-color-theory) గురించి కొంత అధ్యయనం చేయండి
|
||||
|
||||
> ✅ చార్టులను డిజైన్ చేసే సమయంలో, విజువలైజేషన్లో ప్రాప్యత ఒక ముఖ్యమైన అంశం అని గుర్తుంచుకోండి. మీ వినియోగదారుల్లో కొంతమంది రంగు దృష్టి లోపం కలిగి ఉండవచ్చు - మీ చార్ట్ దృష్టి లోపం ఉన్న వినియోగదారులకు బాగా ప్రదర్శించబడుతుందా?
|
||||
|
||||
మీ చార్ట్ కోసం రంగులను ఎంచుకునేటప్పుడు జాగ్రత్త వహించండి, ఎందుకంటే రంగు మీరు ఉద్దేశించని అర్థాన్ని కూడా వ్యక్తం చేయవచ్చు. పై 'ఎత్తు' చార్ట్లో 'పింక్ లేడీస్' స్పష్టంగా 'స్త్రీలింగ' అర్థాన్ని వ్యక్తం చేస్తాయి, ఇది చార్ట్ యొక్క విచిత్రతకు మరింత జోడిస్తుంది.
|
||||
|
||||
[రంగు అర్థం](https://colormatters.com/color-symbolism/the-meanings-of-colors) ప్రపంచంలోని వివిధ భాగాల్లో భిన్నంగా ఉండవచ్చు, మరియు వాటి షేడ్ల ప్రకారం అర్థం మారవచ్చు. సాధారణంగా, రంగుల అర్థాలు:
|
||||
|
||||
| రంగు | అర్థం |
|
||||
| ------ | ------------------- |
|
||||
| ఎరుపు | శక్తి |
|
||||
| నీలం | నమ్మకం, విశ్వాసం |
|
||||
| పసుపు | సంతోషం, జాగ్రత్త |
|
||||
| ఆకుపచ్చ | పర్యావరణం, అదృష్టం, ఈర్ష్య |
|
||||
| గులాబీ | సంతోషం |
|
||||
| కమలం | ఉత్సాహం |
|
||||
|
||||
మీకు కస్టమ్ రంగులతో చార్ట్ నిర్మించమని బాధ్యత ఉంటే, మీ చార్టులు ప్రాప్యత కలిగి ఉండాలని మరియు మీరు వ్యక్తం చేయదలచిన అర్థంతో రంగు సరిపోవాలని నిర్ధారించుకోండి.
|
||||
|
||||
## చదవడానికి సులభంగా మీ చార్టులను స్టైల్ చేయడం
|
||||
|
||||
చార్టులు చదవడానికి సులభంగా లేకపోతే అర్థవంతంగా ఉండవు! మీ డేటాతో బాగా సరిపడేలా మీ చార్ట్ యొక్క వెడల్పు మరియు ఎత్తును స్టైల్ చేయడానికి కొంత సమయం తీసుకోండి. ఒక వేరియబుల్ (ఉదాహరణకు అన్ని 50 రాష్ట్రాలు) ప్రదర్శించాల్సిన అవసరం ఉంటే, అవి Y అక్షంపై నిలువుగా చూపించండి, తద్వారా ఆడంబరంగా స్క్రోల్ అయ్యే చార్ట్ తప్పించవచ్చు.
|
||||
|
||||
మీ అక్షాలను లేబుల్ చేయండి, అవసరమైతే లెజెండ్ ఇవ్వండి, మరియు డేటా మెరుగైన అవగాహన కోసం టూల్టిప్స్ అందించండి.
|
||||
|
||||
మీ డేటా X అక్షంపై వర్ణనాత్మకంగా ఉంటే, చదవడానికి మెరుగ్గా ఉండేందుకు టెక్స్ట్ను కోణంలో చూపించవచ్చు. [Matplotlib](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) 3D ప్లాటింగ్ అందిస్తుంది, మీ డేటా మద్దతు ఇస్తే. సున్నితమైన డేటా విజువలైజేషన్లు `mpl_toolkits.mplot3d` ఉపయోగించి తయారు చేయవచ్చు.
|
||||
|
||||

|
||||
|
||||
## యానిమేషన్ మరియు 3D చార్ట్ ప్రదర్శన
|
||||
|
||||
ఈ రోజుల్లో కొన్ని ఉత్తమ డేటా విజువలైజేషన్లు యానిమేటెడ్ ఉంటాయి. షిర్లీ వూ D3 తో అద్భుతమైనవి చేసింది, ఉదాహరణకు '[ఫిల్మ్ ఫ్లవర్స్](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', ఇందులో ప్రతి పువ్వు ఒక సినిమా విజువలైజేషన్. గార్డియన్ కోసం మరో ఉదాహరణ 'బస్స్డ్ అవుట్', ఇది గ్రీన్సాక్ మరియు D3 తో విజువలైజేషన్లను కలిపి స్క్రోలిటెల్లింగ్ ఆర్టికల్ ఫార్మాట్లో ఇంటరాక్టివ్ అనుభవం, NYC తన హోంలెస్ సమస్యను నగరానికి బయటికి బస్సు ద్వారా ఎలా నిర్వహిస్తుందో చూపిస్తుంది.
|
||||
|
||||

|
||||
|
||||
> "బస్స్డ్ అవుట్: హౌ అమెరికా మూవ్స్ ఇట్ హోంలెస్" [గార్డియన్](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study) నుండి. విజువలైజేషన్లు: నాడీహ్ బ్రెమర్ & షిర్లీ వూ
|
||||
|
||||
ఈ పాఠం ఈ శక్తివంతమైన విజువలైజేషన్ లైబ్రరీలను లోతుగా నేర్పడానికి తగినంత కాదు, Vue.js యాప్లో D3 తో ప్రయత్నించండి, "Dangerous Liaisons" పుస్తకాన్ని యానిమేటెడ్ సోషల్ నెట్వర్క్గా ప్రదర్శించడానికి లైబ్రరీ ఉపయోగించి.
|
||||
|
||||
> "Les Liaisons Dangereuses" అనేది ఎపిస్టోలరీ నవల, లేదా లేఖల సిరీస్గా ప్రదర్శించబడిన నవల. 1782లో చోడర్లోస్ డి లాక్లోస్ రాసినది, ఇది 18వ శతాబ్దం చివరలో ఫ్రెంచ్ అరిస్టోక్రసీ యొక్క రెండు ప్రత్యర్థుల, వికోంట్ డి వాల్మోంట్ మరియు మార్క్విస్ డి మెర్టోయిల్ యొక్క దుర్మార్గ, నైతికంగా పాడైన సామాజిక వ్యూహాల కథను చెపుతుంది. ఇద్దరూ చివరికి మరణిస్తారు కానీ చాలా సామాజిక నష్టం కలిగిస్తారు. నవల వివిధ వ్యక్తులకు రాసిన లేఖల సిరీస్గా విస్తరించబడుతుంది, ప్రతీకారం కోసం లేదా కేవలం సమస్య సృష్టించడానికి. ఈ లేఖల విజువలైజేషన్ సృష్టించి కథలో ప్రధాన పాత్రధారులను దృశ్యమానంగా కనుగొనండి.
|
||||
|
||||
మీరు ఈ సోషల్ నెట్వర్క్ యొక్క యానిమేటెడ్ వీక్షణను ప్రదర్శించే వెబ్ యాప్ను పూర్తి చేస్తారు. ఇది Vue.js మరియు D3 ఉపయోగించి [నెట్వర్క్ విజువల్](https://github.com/emiliorizzo/vue-d3-network) సృష్టించడానికి రూపొందించిన లైబ్రరీని ఉపయోగిస్తుంది. యాప్ నడుస్తున్నప్పుడు, మీరు స్క్రీన్పై నోడ్లను తీయవచ్చు, డేటాను తిరగరాయడానికి.
|
||||
|
||||

|
||||
|
||||
## ప్రాజెక్ట్: D3.js ఉపయోగించి నెట్వర్క్ చూపించే చార్ట్ నిర్మించండి
|
||||
|
||||
> ఈ పాఠం ఫోల్డర్లో `solution` ఫోల్డర్ ఉంది, మీరు పూర్తి చేసిన ప్రాజెక్ట్ను మీ సూచన కోసం చూడవచ్చు.
|
||||
|
||||
1. స్టార్టర్ ఫోల్డర్ రూట్లో ఉన్న README.md ఫైల్లో సూచనలను అనుసరించండి. మీ మెషీన్లో NPM మరియు Node.js నడుస్తున్నాయని నిర్ధారించుకోండి, ఆపై ప్రాజెక్ట్ డిపెండెన్సీలను ఇన్స్టాల్ చేయండి.
|
||||
|
||||
2. `starter/src` ఫోల్డర్ను తెరవండి. అక్కడ మీరు నవల నుండి అన్ని లేఖలతో కూడిన .json ఫైల్ ఉన్న `assets` ఫోల్డర్ను కనుగొంటారు, సంఖ్యలతో, 'to' మరియు 'from' అనోటేషన్తో.
|
||||
|
||||
3. `components/Nodes.vue` లో కోడ్ను పూర్తి చేయండి, విజువలైజేషన్ను సక్రియం చేయడానికి. `createLinks()` అనే మెథడ్ను వెతకండి మరియు క్రింది నెస్టెడ్ లూప్ను జోడించండి.
|
||||
|
||||
.json ఆబ్జెక్ట్ ద్వారా లూప్ చేసి లేఖల 'to' మరియు 'from' డేటాను పట్టుకోండి మరియు `links` ఆబ్జెక్టును నిర్మించండి, తద్వారా విజువలైజేషన్ లైబ్రరీ దాన్ని వినియోగించగలదు:
|
||||
|
||||
```javascript
|
||||
//అక్షరాల ద్వారా లూప్ చేయండి
|
||||
let f = 0;
|
||||
let t = 0;
|
||||
for (var i = 0; i < letters.length; i++) {
|
||||
for (var j = 0; j < characters.length; j++) {
|
||||
|
||||
if (characters[j] == letters[i].from) {
|
||||
f = j;
|
||||
}
|
||||
if (characters[j] == letters[i].to) {
|
||||
t = j;
|
||||
}
|
||||
}
|
||||
this.links.push({ sid: f, tid: t });
|
||||
}
|
||||
```
|
||||
|
||||
టెర్మినల్ నుండి మీ యాప్ను నడపండి (npm run serve) మరియు విజువలైజేషన్ను ఆస్వాదించండి!
|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
ఇంటర్నెట్లో మోసపూరిత విజువలైజేషన్లను కనుగొనండి. రచయిత ఎలా వినియోగదారుని మోసం చేస్తాడు, అది ఉద్దేశపూర్వకమా? విజువలైజేషన్లను సరిచేసి అవి ఎలా ఉండాలో చూపించండి.
|
||||
|
||||
## [పోస్ట్-లెక్చర్ క్విజ్](https://ff-quizzes.netlify.app/en/ds/quiz/25)
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
ఇక్కడ మోసపూరిత డేటా విజువలైజేషన్ గురించి చదవడానికి కొన్ని వ్యాసాలు ఉన్నాయి:
|
||||
|
||||
https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
|
||||
|
||||
http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
|
||||
|
||||
చరిత్రాత్మక ఆస్తులు మరియు కళాఖండాల కోసం ఈ ఆసక్తికరమైన విజువలైజేషన్లను చూడండి:
|
||||
|
||||
https://handbook.pubpub.org/
|
||||
|
||||
యానిమేషన్ మీ విజువలైజేషన్లను ఎలా మెరుగుపరుస్తుందో ఈ వ్యాసం ద్వారా తెలుసుకోండి:
|
||||
|
||||
https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
|
||||
|
||||
## అసైన్మెంట్
|
||||
|
||||
[మీ స్వంత కస్టమ్ విజువలైజేషన్ను నిర్మించండి](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ డాక్యుమెంట్ను AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు డాక్యుమెంట్ దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,26 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "e56df4c0f49357e30ac8fc77aa439dd4",
|
||||
"translation_date": "2025-12-19T16:11:11+00:00",
|
||||
"source_file": "3-Data-Visualization/13-meaningful-visualizations/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# మీ స్వంత కస్టమ్ విజ్ నిర్మించండి
|
||||
|
||||
## సూచనలు
|
||||
|
||||
ఈ ప్రాజెక్టులోని కోడ్ నమూనాను ఉపయోగించి ఒక సోషల్ నెట్వర్క్ సృష్టించండి, మీ స్వంత సామాజిక పరస్పర చర్యల డేటాను మాక్ చేయండి. మీరు సోషల్ మీడియా వినియోగాన్ని మ్యాప్ చేయవచ్చు లేదా మీ కుటుంబ సభ్యుల డయాగ్రామ్ తయారు చేయవచ్చు. ఒక ప్రత్యేకమైన సోషల్ నెట్వర్క్ విజువలైజేషన్ చూపించే ఆసక్తికరమైన వెబ్ యాప్ సృష్టించండి.
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణాత్మక | తగినంత | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
కోడ్ సరిగ్గా నడిచే GitHub రిపో ప్రదర్శించబడింది (దాన్ని స్థిర వెబ్ యాప్గా డిప్లాయ్ చేయడానికి ప్రయత్నించండి) మరియు ప్రాజెక్టును వివరించే READMEతో ఉంది | రిపో సరిగ్గా నడవదు లేదా బాగా డాక్యుమెంట్ చేయబడలేదు | రిపో సరిగ్గా నడవదు మరియు బాగా డాక్యుమెంట్ చేయబడలేదు
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
File diff suppressed because one or more lines are too long
@ -0,0 +1,42 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "5c51a54dd89075a7a362890117b7ed9e",
|
||||
"translation_date": "2025-12-19T16:18:38+00:00",
|
||||
"source_file": "3-Data-Visualization/13-meaningful-visualizations/solution/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# Dangerous Liaisons డేటా విజువలైజేషన్ ప్రాజెక్ట్
|
||||
|
||||
ప్రారంభించడానికి, మీ మెషీన్లో NPM మరియు Node నడుస్తున్నాయని నిర్ధారించుకోవాలి. డిపెండెన్సీలను ఇన్స్టాల్ చేయండి (npm install) మరియు ఆపై ప్రాజెక్ట్ను లోకల్గా నడపండి (npm run serve):
|
||||
|
||||
## ప్రాజెక్ట్ సెటప్
|
||||
```
|
||||
npm install
|
||||
```
|
||||
|
||||
### అభివృద్ధికి కంపైల్ చేసి హాట్-రిలోడ్ చేస్తుంది
|
||||
```
|
||||
npm run serve
|
||||
```
|
||||
|
||||
### ఉత్పత్తికి కంపైల్ చేసి మినిఫై చేస్తుంది
|
||||
```
|
||||
npm run build
|
||||
```
|
||||
|
||||
### ఫైళ్లను లింట్ చేసి సరిచేస్తుంది
|
||||
```
|
||||
npm run lint
|
||||
```
|
||||
|
||||
### కాన్ఫిగరేషన్ను అనుకూలీకరించండి
|
||||
[Configuration Reference](https://cli.vuejs.org/config/) ను చూడండి.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం చేయించుకోవడం మంచిది. ఈ అనువాదం వలన కలిగే ఏవైనా అపార్థాలు లేదా తప్పుదారుల బాధ్యత మేము తీసుకోము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,42 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "5c51a54dd89075a7a362890117b7ed9e",
|
||||
"translation_date": "2025-12-19T16:17:51+00:00",
|
||||
"source_file": "3-Data-Visualization/13-meaningful-visualizations/starter/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# Dangerous Liaisons డేటా విజువలైజేషన్ ప్రాజెక్ట్
|
||||
|
||||
ప్రారంభించడానికి, మీ మెషీన్లో NPM మరియు Node నడుస్తున్నాయని నిర్ధారించుకోవాలి. డిపెండెన్సీలను ఇన్స్టాల్ చేయండి (npm install) మరియు ఆపై ప్రాజెక్ట్ను లోకల్గా నడపండి (npm run serve):
|
||||
|
||||
## ప్రాజెక్ట్ సెటప్
|
||||
```
|
||||
npm install
|
||||
```
|
||||
|
||||
### అభివృద్ధికి కంపైల్ చేసి హాట్-రిలోడ్ చేస్తుంది
|
||||
```
|
||||
npm run serve
|
||||
```
|
||||
|
||||
### ఉత్పత్తికి కంపైల్ చేసి మినిఫై చేస్తుంది
|
||||
```
|
||||
npm run build
|
||||
```
|
||||
|
||||
### ఫైళ్లను లింట్ చేసి సరిచేస్తుంది
|
||||
```
|
||||
npm run lint
|
||||
```
|
||||
|
||||
### కాన్ఫిగరేషన్ను అనుకూలీకరించండి
|
||||
[Configuration Reference](https://cli.vuejs.org/config/) చూడండి.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలో ఉన్నది అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారులు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,233 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "22acf28f518a4769ea14fa42f4734b9f",
|
||||
"translation_date": "2025-12-19T16:30:58+00:00",
|
||||
"source_file": "3-Data-Visualization/R/09-visualization-quantities/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# పరిమాణాలను దృశ్యీకరించడం
|
||||
| ద్వారా ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/09-Visualizing-Quantities.png)|
|
||||
|:---:|
|
||||
| పరిమాణాలను దృశ్యీకరించడం - _స్కెచ్ నోట్ [@nitya](https://twitter.com/nitya) ద్వారా_ |
|
||||
|
||||
ఈ పాఠంలో మీరు పరిమాణం అనే భావన చుట్టూ ఆసక్తికరమైన దృశ్యీకరణలను సృష్టించడానికి అందుబాటులో ఉన్న అనేక R ప్యాకేజీలు మరియు లైబ్రరీలను ఎలా ఉపయోగించాలో తెలుసుకుంటారు. మినెసోటా పక్షుల గురించి శుభ్రపరిచిన డేటాసెట్ ఉపయోగించి, మీరు స్థానిక వన్యజీవుల గురించి అనేక ఆసక్తికరమైన విషయాలను తెలుసుకోవచ్చు.
|
||||
## [పాఠం ముందు క్విజ్](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/16)
|
||||
|
||||
## ggplot2 తో రెక్కల వ్యాప్తిని పరిశీలించండి
|
||||
వివిధ రకాల సాదా మరియు సున్నితమైన ప్లాట్లు మరియు చార్ట్లను సృష్టించడానికి అద్భుతమైన లైబ్రరీ [ggplot2](https://cran.r-project.org/web/packages/ggplot2/index.html). సాధారణంగా, ఈ లైబ్రరీలను ఉపయోగించి డేటాను ప్లాట్ చేయడం అనేది మీ డేటాఫ్రేమ్లో మీరు లక్ష్యంగా పెట్టుకున్న భాగాలను గుర్తించడం, ఆ డేటాపై అవసరమైన మార్పులు చేయడం, దాని x మరియు y అక్ష విలువలను కేటాయించడం, ఏ రకమైన ప్లాట్ చూపించాలో నిర్ణయించడం, మరియు ఆ తర్వాత ప్లాట్ చూపించడం అనే ప్రక్రియ.
|
||||
|
||||
`ggplot2` అనేది The Grammar of Graphics ఆధారంగా గ్రాఫిక్స్ను ప్రకటనాత్మకంగా సృష్టించడానికి ఒక వ్యవస్థ. [The Grammar of Graphics](https://en.wikipedia.org/wiki/Ggplot2) అనేది డేటా దృశ్యీకరణకు సాధారణ పద్ధతి, ఇది గ్రాఫ్లను స్కేల్స్ మరియు లేయర్స్ వంటి సారాంశ భాగాలుగా విభజిస్తుంది. అంటే, తక్కువ కోడ్తో ఒకవైపు లేదా బహువైపు డేటా కోసం ప్లాట్లు మరియు గ్రాఫ్లను సృష్టించడం సులభం కావడం వలన `ggplot2` R లో దృశ్యీకరణలకు అత్యంత ప్రాచుర్యం పొందిన ప్యాకేజీ. వినియోగదారు `ggplot2`కి వేరియబుల్స్ను ఎస్టెటిక్స్కు ఎలా మ్యాప్ చేయాలో, గ్రాఫికల్ ప్రిమిటివ్స్ను ఎలా ఉపయోగించాలో చెబుతారు, మిగతా పనిని `ggplot2` చూసుకుంటుంది.
|
||||
|
||||
> ✅ ప్లాట్ = డేటా + ఎస్టెటిక్స్ + జ్యామితి
|
||||
> - డేటా అంటే డేటాసెట్
|
||||
> - ఎస్టెటిక్స్ అంటే అధ్యయనం చేయవలసిన వేరియబుల్స్ (x మరియు y వేరియబుల్స్)
|
||||
> - జ్యామితి అంటే ప్లాట్ రకం (లైన్ ప్లాట్, బార్ ప్లాట్, మొదలైనవి)
|
||||
|
||||
మీ డేటా మరియు మీరు చెప్పదలచుకున్న కథ ప్రకారం ఉత్తమ జ్యామితిని (ప్లాట్ రకం) ఎంచుకోండి.
|
||||
|
||||
> - ధోరణులను విశ్లేషించడానికి: లైన్, కాలమ్
|
||||
> - విలువలను పోల్చడానికి: బార్, కాలమ్, పై, స్కాటర్ప్లాట్
|
||||
> - భాగాలు మొత్తం తో ఎలా సంబంధించాయో చూపించడానికి: పై
|
||||
> - డేటా పంపిణీని చూపించడానికి: స్కాటర్ప్లాట్, బార్
|
||||
> - విలువల మధ్య సంబంధాలను చూపించడానికి: లైన్, స్కాటర్ప్లాట్, బబుల్
|
||||
|
||||
✅ మీరు ggplot2 కోసం ఈ వివరణాత్మక [చీట్షీట్](https://nyu-cdsc.github.io/learningr/assets/data-visualization-2.1.pdf) కూడా చూడవచ్చు.
|
||||
|
||||
## పక్షుల రెక్కల వ్యాప్తి విలువలపై లైన్ ప్లాట్ నిర్మించండి
|
||||
|
||||
R కన్సోల్ తెరవండి మరియు డేటాసెట్ను దిగుమతి చేసుకోండి.
|
||||
> గమనిక: డేటాసెట్ ఈ రిపో యొక్క రూట్లోని `/data` ఫోల్డర్లో నిల్వ చేయబడింది.
|
||||
|
||||
డేటాసెట్ను దిగుమతి చేసుకుని డేటా యొక్క హెడ్ను (పై 5 వరుసలు) పరిశీలిద్దాం.
|
||||
|
||||
```r
|
||||
birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
|
||||
head(birds)
|
||||
```
|
||||
డేటా యొక్క హెడ్లో టెక్స్ట్ మరియు సంఖ్యల మిశ్రమం ఉంది:
|
||||
|
||||
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
|
||||
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
|
||||
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
|
||||
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
|
||||
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
|
||||
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
|
||||
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
|
||||
|
||||
కొన్ని సంఖ్యా డేటాను ప్రాథమిక లైన్ ప్లాట్ ఉపయోగించి ప్లాట్ చేయడం ప్రారంభిద్దాం. ఈ ఆసక్తికరమైన పక్షుల గరిష్ట రెక్కల వ్యాప్తి యొక్క దృశ్యాన్ని మీరు కావాలనుకుంటే.
|
||||
|
||||
```r
|
||||
install.packages("ggplot2")
|
||||
library("ggplot2")
|
||||
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_line()
|
||||
```
|
||||
ఇక్కడ, మీరు `ggplot2` ప్యాకేజీని ఇన్స్టాల్ చేసి, తరువాత `library("ggplot2")` కమాండ్ ఉపయోగించి వర్క్స్పేస్లో దిగుమతి చేసుకుంటారు. ggplot లో ఏదైనా ప్లాట్ చేయడానికి `ggplot()` ఫంక్షన్ ఉపయోగిస్తారు మరియు డేటాసెట్, x మరియు y వేరియబుల్స్ను లక్షణాలుగా పేర్కొంటారు. ఈ సందర్భంలో, లైన్ ప్లాట్ చేయాలనుకున్నందున `geom_line()` ఫంక్షన్ ఉపయోగిస్తారు.
|
||||
|
||||

|
||||
|
||||
మీకు వెంటనే ఏమి కనిపిస్తుంది? కనీసం ఒక అవుట్లయర్ ఉన్నట్లు కనిపిస్తోంది - అది చాలా పెద్ద రెక్కల వ్యాప్తి! 2000+ సెంటీమీటర్ల రెక్కల వ్యాప్తి అంటే 20 మీటర్లకు పైగా - మినెసోటాలో ప్టెరోడాక్టిల్స్ తిరుగుతున్నారా? పరిశీలిద్దాం.
|
||||
|
||||
మీరు అవుట్లయర్లను కనుగొనడానికి ఎక్సెల్లో త్వరితంగా సార్ట్ చేయవచ్చు, అవి తప్పులే కావచ్చు, కానీ ప్లాట్ నుండి పని కొనసాగించి దృశ్యీకరణ ప్రక్రియ కొనసాగించండి.
|
||||
|
||||
x-అక్షకు లేబుల్స్ జోడించి ఏ రకమైన పక్షులు ఉన్నాయో చూపించండి:
|
||||
|
||||
```r
|
||||
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_line() +
|
||||
theme(axis.text.x = element_text(angle = 45, hjust=1))+
|
||||
xlab("Birds") +
|
||||
ylab("Wingspan (CM)") +
|
||||
ggtitle("Max Wingspan in Centimeters")
|
||||
```
|
||||
`theme` లో కోణాన్ని పేర్కొంటాము మరియు `xlab()` మరియు `ylab()` లో వరుసగా x మరియు y అక్ష లేబుల్స్ను పేర్కొంటాము. `ggtitle()` గ్రాఫ్/ప్లాట్కు పేరు ఇస్తుంది.
|
||||
|
||||

|
||||
|
||||
లేబుల్స్ 45 డిగ్రీల కోణంలో తిరిగినా, చదవడానికి చాలా ఉన్నాయి. వేరే వ్యూహం ప్రయత్నిద్దాం: అవుట్లయర్లకు మాత్రమే లేబుల్స్ ఇవ్వండి మరియు లేబుల్స్ను చార్ట్ లోపల సెట్ చేయండి. లేబులింగ్కు మరింత స్థలం కోసం స్కాటర్ చార్ట్ ఉపయోగించవచ్చు:
|
||||
|
||||
```r
|
||||
ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_point() +
|
||||
geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
|
||||
theme(axis.title.x=element_blank(), axis.text.x=element_blank(), axis.ticks.x=element_blank())
|
||||
ylab("Wingspan (CM)") +
|
||||
ggtitle("Max Wingspan in Centimeters") +
|
||||
```
|
||||
ఇక్కడ ఏమి జరుగుతోంది? మీరు `geom_point()` ఫంక్షన్ ఉపయోగించి స్కాటర్ పాయింట్లను ప్లాట్ చేశారు. దీని ద్వారా, `MaxWingspan > 500` ఉన్న పక్షులకు లేబుల్స్ జోడించారు మరియు ప్లాట్ను క్లట్టర్ చేయకుండా x అక్ష上的 లేబుల్స్ను దాచారు.
|
||||
|
||||
మీరు ఏమి కనుగొంటారు?
|
||||
|
||||

|
||||
|
||||
## మీ డేటాను ఫిల్టర్ చేయండి
|
||||
|
||||
బాల్డ్ ఈగిల్ మరియు ప్రేరి ఫాల్కన్, చాలా పెద్ద పక్షులు కావచ్చు, గరిష్ట రెక్కల వ్యాప్తికి అదనంగా 0 తప్పుగా జోడించబడినట్లు కనిపిస్తున్నాయి. 25 మీటర్ల రెక్కల వ్యాప్తి ఉన్న బాల్డ్ ఈగిల్ను మీరు కలుసుకోవడం అసాధ్యమే, అయితే ఉంటే దయచేసి మాకు తెలియజేయండి! ఆ రెండు అవుట్లయర్లను తీసేసి కొత్త డేటాఫ్రేమ్ సృష్టిద్దాం:
|
||||
|
||||
```r
|
||||
birds_filtered <- subset(birds, MaxWingspan < 500)
|
||||
|
||||
ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
|
||||
geom_point() +
|
||||
ylab("Wingspan (CM)") +
|
||||
xlab("Birds") +
|
||||
ggtitle("Max Wingspan in Centimeters") +
|
||||
geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
|
||||
theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())
|
||||
```
|
||||
మేము కొత్త డేటాఫ్రేమ్ `birds_filtered` సృష్టించి స్కాటర్ ప్లాట్ చేశాము. అవుట్లయర్లను తీసివేసిన తర్వాత, మీ డేటా మరింత సమగ్రమైనది మరియు అర్థమయ్యేలా మారింది.
|
||||
|
||||

|
||||
|
||||
ఇప్పుడు రెక్కల వ్యాప్తి పరంగా కనీసం శుభ్రమైన డేటాసెట్ ఉన్నందున, ఈ పక్షుల గురించి మరింత తెలుసుకుందాం.
|
||||
|
||||
లైన్ మరియు స్కాటర్ ప్లాట్లు డేటా విలువలు మరియు వాటి పంపిణీ గురించి సమాచారం చూపించగలవు, కానీ ఈ డేటాసెట్లోని విలువలను మనం ఆలోచించాలి. మీరు ఈ ప్రశ్నలకు సమాధానాలు కనుగొనడానికి దృశ్యీకరణలు సృష్టించవచ్చు:
|
||||
|
||||
> పక్షుల ఎన్ని వర్గాలు ఉన్నాయి, వాటి సంఖ్య ఎంత?
|
||||
> ఎన్ని పక్షులు అంతరించిపోయినవి, ప్రమాదంలో ఉన్నవి, అరుదైనవి లేదా సాధారణమైనవి?
|
||||
> లినియస్ యొక్క పదజాలంలో వివిధ జెనస్ మరియు ఆర్డర్స్ ఎన్ని?
|
||||
|
||||
## బార్ చార్ట్లను అన్వేషించండి
|
||||
|
||||
డేటా సమూహాలను చూపించడానికి బార్ చార్ట్లు ఉపయోగకరంగా ఉంటాయి. ఈ డేటాసెట్లో ఉన్న పక్షుల వర్గాలను పరిశీలించి ఏది సంఖ్యలో ఎక్కువగా ఉందో చూద్దాం. ఫిల్టర్ చేసిన డేటాపై బార్ చార్ట్ సృష్టిద్దాం.
|
||||
|
||||
```r
|
||||
install.packages("dplyr")
|
||||
install.packages("tidyverse")
|
||||
|
||||
library(lubridate)
|
||||
library(scales)
|
||||
library(dplyr)
|
||||
library(ggplot2)
|
||||
library(tidyverse)
|
||||
|
||||
birds_filtered %>% group_by(Category) %>%
|
||||
summarise(n=n(),
|
||||
MinLength = mean(MinLength),
|
||||
MaxLength = mean(MaxLength),
|
||||
MinBodyMass = mean(MinBodyMass),
|
||||
MaxBodyMass = mean(MaxBodyMass),
|
||||
MinWingspan=mean(MinWingspan),
|
||||
MaxWingspan=mean(MaxWingspan)) %>%
|
||||
gather("key", "value", - c(Category, n)) %>%
|
||||
ggplot(aes(x = Category, y = value, group = key, fill = key)) +
|
||||
geom_bar(stat = "identity") +
|
||||
scale_fill_manual(values = c("#D62728", "#FF7F0E", "#8C564B","#2CA02C", "#1F77B4", "#9467BD")) +
|
||||
xlab("Category")+ggtitle("Birds of Minnesota")
|
||||
|
||||
```
|
||||
తదుపరి కోడ్లో, డేటాను మానిప్యులేట్ చేసి గ్రూప్ చేయడానికి సహాయపడే [dplyr](https://www.rdocumentation.org/packages/dplyr/versions/0.7.8) మరియు [lubridate](https://www.rdocumentation.org/packages/lubridate/versions/1.8.0) ప్యాకేజీలను ఇన్స్టాల్ చేస్తారు. మొదట, పక్షుల `Category` ప్రకారం డేటాను గ్రూప్ చేసి, `MinLength`, `MaxLength`, `MinBodyMass`, `MaxBodyMass`, `MinWingspan`, `MaxWingspan` కాలమ్స్ను సమ్మరీ చేస్తారు. తరువాత, `ggplot2` ప్యాకేజీ ఉపయోగించి బార్ చార్ట్ ప్లాట్ చేసి వేర్వేరు వర్గాల రంగులు మరియు లేబుల్స్ను పేర్కొంటారు.
|
||||
|
||||

|
||||
|
||||
ఈ బార్ చార్ట్ చదవడానికి కష్టమైనది ఎందుకంటే చాలా డేటా గ్రూప్ చేయబడలేదు. మీరు ప్లాట్ చేయదలచుకున్న డేటాను మాత్రమే ఎంచుకోవాలి, కాబట్టి పక్షుల వర్గం ఆధారంగా వారి పొడవును చూద్దాం.
|
||||
|
||||
మీ డేటాను పక్షుల వర్గం మాత్రమే కలిగి ఉండేలా ఫిల్టర్ చేయండి.
|
||||
|
||||
చాలా వర్గాలు ఉన్నందున, ఈ చార్ట్ను నిలువుగా ప్రదర్శించి అందరి డేటా కోసం ఎత్తును సర్దుబాటు చేయవచ్చు:
|
||||
|
||||
```r
|
||||
birds_count<-dplyr::count(birds_filtered, Category, sort = TRUE)
|
||||
birds_count$Category <- factor(birds_count$Category, levels = birds_count$Category)
|
||||
ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()
|
||||
```
|
||||
ముందుగా `Category` కాలమ్లోని ప్రత్యేక విలువలను లెక్కించి, వాటిని కొత్త డేటాఫ్రేమ్ `birds_count` లో సర్దుబాటు చేస్తారు. ఈ సర్దుబాటు చేసిన డేటాను అదే స్థాయిలో ఫ్యాక్టర్ చేసి, సర్దుబాటు చేసిన విధంగా ప్లాట్ చేయబడుతుంది. `ggplot2` ఉపయోగించి బార్ చార్ట్ ప్లాట్ చేస్తారు. `coord_flip()` హారిజాంటల్ బార్లను ప్లాట్ చేస్తుంది.
|
||||
|
||||

|
||||
|
||||
ఈ బార్ చార్ట్ ప్రతి వర్గంలో పక్షుల సంఖ్యను బాగా చూపిస్తుంది. ఒక చూపులోనే, ఈ ప్రాంతంలో అత్యధిక సంఖ్యలో పక్షులు Ducks/Geese/Waterfowl వర్గంలో ఉన్నాయని మీరు చూడవచ్చు. మినెసోటా '10,000 సరస్సుల భూమి' కాబట్టి ఇది ఆశ్చర్యకరం కాదు!
|
||||
|
||||
✅ ఈ డేటాసెట్పై మరిన్ని లెక్కింపులు ప్రయత్నించండి. ఏదైనా ఆశ్చర్యంగా ఉందా?
|
||||
|
||||
## డేటాను పోల్చడం
|
||||
|
||||
మీరు గ్రూప్ చేసిన డేటాను వేరే అక్షాలతో పోల్చడం ప్రయత్నించవచ్చు. పక్షుల వర్గం ఆధారంగా గరిష్ట పొడవు (MaxLength) పోలిక ప్రయత్నించండి:
|
||||
|
||||
```r
|
||||
birds_grouped <- birds_filtered %>%
|
||||
group_by(Category) %>%
|
||||
summarise(
|
||||
MaxLength = max(MaxLength, na.rm = T),
|
||||
MinLength = max(MinLength, na.rm = T)
|
||||
) %>%
|
||||
arrange(Category)
|
||||
|
||||
ggplot(birds_grouped,aes(Category,MaxLength))+geom_bar(stat="identity")+coord_flip()
|
||||
```
|
||||
`birds_filtered` డేటాను `Category` ప్రకారం గ్రూప్ చేసి బార్ గ్రాఫ్ ప్లాట్ చేస్తారు.
|
||||
|
||||

|
||||
|
||||
ఇక్కడ ఏ ఆశ్చర్యం లేదు: హమ్మింగ్బర్డ్స్కు పెలికాన్స్ లేదా గీస్లతో పోలిస్తే తక్కువ MaxLength ఉంటుంది. డేటా తార్కికంగా అర్థమయ్యేలా ఉండటం మంచిది!
|
||||
|
||||
మీరు మరింత ఆసక్తికరమైన బార్ చార్ట్లను సృష్టించవచ్చు, డేటాను సూపరింపోజ్ చేసి. ఒక పక్షుల వర్గంపై కనిష్ట మరియు గరిష్ట పొడవును సూపరింపోజ్ చేద్దాం:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_grouped, aes(x=Category)) +
|
||||
geom_bar(aes(y=MaxLength), stat="identity", position ="identity", fill='blue') +
|
||||
geom_bar(aes(y=MinLength), stat="identity", position="identity", fill='orange')+
|
||||
coord_flip()
|
||||
```
|
||||

|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
ఈ పక్షుల డేటాసెట్ ఒక ప్రత్యేక పర్యావరణ వ్యవస్థలోని వివిధ రకాల పక్షుల గురించి సమృద్ధిగా సమాచారం అందిస్తుంది. ఇంటర్నెట్లో వెతకండి మరియు ఇతర పక్షుల డేటాసెట్లను కనుగొనండి. ఈ పక్షుల చుట్టూ చార్ట్లు మరియు గ్రాఫ్లను నిర్మించడం సాధన చేయండి, మీరు తెలియని విషయాలను కనుగొనండి.
|
||||
|
||||
## [పాఠం తర్వాత క్విజ్](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/17)
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
ఈ మొదటి పాఠం `ggplot2` ఉపయోగించి పరిమాణాలను ఎలా దృశ్యీకరించాలో కొంత సమాచారం ఇచ్చింది. దృశ్యీకరణ కోసం డేటాసెట్లతో పని చేసే ఇతర మార్గాల గురించి పరిశోధన చేయండి. [Lattice](https://stat.ethz.ch/R-manual/R-devel/library/lattice/html/Lattice.html) మరియు [Plotly](https://github.com/plotly/plotly.R#readme) వంటి ఇతర ప్యాకేజీలను ఉపయోగించి మీరు దృశ్యీకరించగల డేటాసెట్లను వెతకండి.
|
||||
|
||||
## అసైన్మెంట్
|
||||
[లైన్లు, స్కాటర్స్, మరియు బార్లు](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "0ea21b6513df5ade7419c6b7d65f10b1",
|
||||
"translation_date": "2025-12-19T16:34:28+00:00",
|
||||
"source_file": "3-Data-Visualization/R/09-visualization-quantities/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# లైన్లు, స్కాటర్స్ మరియు బార్లు
|
||||
|
||||
## సూచనలు
|
||||
|
||||
ఈ పాఠంలో, మీరు లైన్ చార్ట్లు, స్కాటర్ప్లాట్లు మరియు బార్ చార్ట్లతో ఈ డేటాసెట్ గురించి ఆసక్తికరమైన వాస్తవాలను చూపించారు. ఈ అసైన్మెంట్లో, ఒక నిర్దిష్ట పక్షి రకం గురించి ఒక వాస్తవాన్ని కనుగొనడానికి డేటాసెట్లో మరింత లోతుగా పరిశీలించండి. ఉదాహరణకు, స్నో గీస్ల గురించి మీరు కనుగొనగలిగిన అన్ని ఆసక్తికరమైన డేటాను విజువలైజ్ చేసే స్క్రిప్ట్ను సృష్టించండి. మీ నోట్బుక్లో కథ చెప్పడానికి పై మూడు ప్లాట్లను ఉపయోగించండి.
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణ | సరిపోతుంది | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
మంచి వ్యాఖ్యానాలు, బలమైన కథనం మరియు ఆకర్షణీయమైన గ్రాఫ్లతో ఒక స్క్రిప్ట్ అందించబడింది | ఈ అంశాలలో ఒకటి స్క్రిప్ట్లో లేదు | ఈ అంశాలలో రెండు స్క్రిప్ట్లో లేవు
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,185 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "ea67c0c40808fd723594de6896c37ccf",
|
||||
"translation_date": "2025-12-19T16:19:56+00:00",
|
||||
"source_file": "3-Data-Visualization/R/10-visualization-distributions/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# పంపిణీలను దృశ్యీకరించడం
|
||||
|
||||
| ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/10-Visualizing-Distributions.png)|
|
||||
|:---:|
|
||||
| పంపిణీలను దృశ్యీకరించడం - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
మునుపటి పాఠంలో, మీరు మినెసోటా పక్షుల గురించి ఒక డేటాసెట్ గురించి కొన్ని ఆసక్తికరమైన విషయాలను నేర్చుకున్నారు. మీరు అవుట్లయర్లను దృశ్యీకరించడం ద్వారా కొన్ని తప్పు డేటాను కనుగొన్నారు మరియు పక్షుల వర్గాల మధ్య గరిష్ట పొడవు ద్వారా తేడాలను పరిశీలించారు.
|
||||
|
||||
## [పాఠం ముందు క్విజ్](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18)
|
||||
## పక్షుల డేటాసెట్ను అన్వేషించండి
|
||||
|
||||
డేటాను లోతుగా పరిశీలించే మరో మార్గం దాని పంపిణీని చూడటం, లేదా డేటా ఒక అక్షం మీద ఎలా ఏర్పాటు చేయబడిందో చూడటం. ఉదాహరణకు, మీరు మినెసోటా పక్షుల గరిష్ట రెక్కపట్టు లేదా గరిష్ట శరీర ద్రవ్యరాశి యొక్క సాధారణ పంపిణీ గురించి తెలుసుకోవాలనుకోవచ్చు.
|
||||
|
||||
ఈ డేటాసెట్లో డేటా పంపిణీల గురించి కొన్ని విషయాలను కనుగొనండి. మీ R కన్సోల్లో `ggplot2` మరియు డేటాబేస్ను దిగుమతి చేసుకోండి. మునుపటి అంశంలో చేసినట్లుగా అవుట్లయర్లను డేటాబేస్ నుండి తీసివేయండి.
|
||||
|
||||
```r
|
||||
library(ggplot2)
|
||||
|
||||
birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
|
||||
|
||||
birds_filtered <- subset(birds, MaxWingspan < 500)
|
||||
head(birds_filtered)
|
||||
```
|
||||
| | Name | ScientificName | Category | Order | Family | Genus | ConservationStatus | MinLength | MaxLength | MinBodyMass | MaxBodyMass | MinWingspan | MaxWingspan |
|
||||
| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
|
||||
| 0 | Black-bellied whistling-duck | Dendrocygna autumnalis | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
|
||||
| 1 | Fulvous whistling-duck | Dendrocygna bicolor | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
|
||||
| 2 | Snow goose | Anser caerulescens | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
|
||||
| 3 | Ross's goose | Anser rossii | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
|
||||
| 4 | Greater white-fronted goose | Anser albifrons | Ducks/Geese/Waterfowl | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
|
||||
|
||||
సాధారణంగా, మీరు మునుపటి పాఠంలో చేసినట్లుగా స్కాటర్ ప్లాట్ ఉపయోగించి డేటా ఎలా పంపిణీ చేయబడిందో త్వరగా చూడవచ్చు:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
|
||||
geom_point() +
|
||||
ggtitle("Max Length per order") + coord_flip()
|
||||
```
|
||||

|
||||
|
||||
ఇది పక్షుల ఆర్డర్ ప్రకారం శరీర పొడవు యొక్క సాధారణ పంపిణీకి అవలోకనం ఇస్తుంది, కానీ ఇది నిజమైన పంపిణీలను ప్రదర్శించడానికి ఉత్తమ మార్గం కాదు. ఆ పని సాధారణంగా హిస్టోగ్రామ్ సృష్టించడం ద్వారా నిర్వహించబడుతుంది.
|
||||
## హిస్టోగ్రామ్లతో పని చేయడం
|
||||
|
||||
`ggplot2` హిస్టోగ్రామ్లను ఉపయోగించి డేటా పంపిణీని దృశ్యీకరించడానికి చాలా మంచి మార్గాలను అందిస్తుంది. ఈ రకమైన చార్ట్ ఒక బార్ చార్ట్ లాగా ఉంటుంది, ఇక్కడ బార్ల పెరుగుదల మరియు తగ్గుదల ద్వారా పంపిణీ కనిపిస్తుంది. హిస్టోగ్రామ్ నిర్మించడానికి, మీకు సంఖ్యాత్మక డేటా అవసరం. హిస్టోగ్రామ్ నిర్మించడానికి, మీరు చార్ట్ను 'hist' రకంగా నిర్వచించి ప్లాట్ చేయవచ్చు. ఈ చార్ట్ మొత్తం డేటాసెట్ యొక్క సంఖ్యాత్మక డేటా పరిధిలో MaxBodyMass పంపిణీని చూపిస్తుంది. డేటా శ్రేణిని చిన్న బిన్లుగా విభజించడం ద్వారా, ఇది డేటా విలువల పంపిణీని ప్రదర్శించగలదు:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
|
||||
geom_histogram(bins=10)+ylab('Frequency')
|
||||
```
|
||||

|
||||
|
||||
మీరు చూడగలిగినట్లుగా, ఈ డేటాసెట్లో 400+ పక్షులలో ఎక్కువ భాగం వారి గరిష్ట శరీర ద్రవ్యరాశి 2000 కంటే తక్కువ పరిధిలో ఉంటాయి. `bins` పారామీటర్ను 30 లాంటి ఎక్కువ సంఖ్యకు మార్చి డేటా గురించి మరింత అవగాహన పొందండి:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered, aes(x = MaxBodyMass)) + geom_histogram(bins=30)+ylab('Frequency')
|
||||
```
|
||||
|
||||

|
||||
|
||||
ఈ చార్ట్ పంపిణీని మరింత సూక్ష్మంగా చూపిస్తుంది. ఎడమవైపు తక్కువ వంకరగా ఉన్న చార్ట్ను మీరు ఇచ్చిన పరిధిలో మాత్రమే డేటాను ఎంచుకోవడం ద్వారా సృష్టించవచ్చు:
|
||||
|
||||
మీ డేటాను ఫిల్టర్ చేసి శరీర ద్రవ్యరాశి 60 కంటే తక్కువ ఉన్న పక్షులను మాత్రమే తీసుకోండి, మరియు 30 `bins` చూపించండి:
|
||||
|
||||
```r
|
||||
birds_filtered_1 <- subset(birds_filtered, MaxBodyMass > 1 & MaxBodyMass < 60)
|
||||
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
|
||||
geom_histogram(bins=30)+ylab('Frequency')
|
||||
```
|
||||
|
||||

|
||||
|
||||
✅ మరిన్ని ఫిల్టర్లు మరియు డేటా పాయింట్లను ప్రయత్నించండి. డేటా యొక్క పూర్తి పంపిణీని చూడటానికి, లేబుల్ చేయబడిన పంపిణీలను చూపించడానికి `['MaxBodyMass']` ఫిల్టర్ను తీసివేయండి.
|
||||
|
||||
హిస్టోగ్రామ్ కొన్ని మంచి రంగు మరియు లేబులింగ్ మెరుగుదలలను కూడా అందిస్తుంది:
|
||||
|
||||
రెండు పంపిణీల మధ్య సంబంధాన్ని పోల్చడానికి 2D హిస్టోగ్రామ్ సృష్టించండి. `MaxBodyMass` మరియు `MaxLength` ను పోల్చుకుందాం. `ggplot2` ప్రకాశవంతమైన రంగులను ఉపయోగించి సమీకరణాన్ని చూపించే అంతర్గత మార్గాన్ని అందిస్తుంది:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_filtered_1, aes(x=MaxBodyMass, y=MaxLength) ) +
|
||||
geom_bin2d() +scale_fill_continuous(type = "viridis")
|
||||
```
|
||||
ఈ రెండు అంశాల మధ్య అంచనా వేయదగిన సంబంధం కనిపిస్తుంది, ఒక ప్రత్యేకంగా బలమైన సమీకరణ బిందువు తో:
|
||||
|
||||

|
||||
|
||||
హిస్టోగ్రామ్లు సంఖ్యాత్మక డేటాకు డిఫాల్ట్గా బాగా పనిచేస్తాయి. మీరు టెక్స్ట్ డేటా ప్రకారం పంపిణీలను చూడాలనుకుంటే ఏమవుతుంది?
|
||||
## టెక్స్ట్ డేటా ఉపయోగించి పంపిణీలను అన్వేషించండి
|
||||
|
||||
ఈ డేటాసెట్ పక్షుల వర్గం, జనస్, జాతి, కుటుంబం మరియు సంరక్షణ స్థితి గురించి మంచి సమాచారం కూడా కలిగి ఉంది. ఈ సంరక్షణ సమాచారాన్ని లోతుగా పరిశీలిద్దాం. పక్షులు వారి సంరక్షణ స్థితి ప్రకారం ఎలా పంపిణీ చేయబడ్డాయి?
|
||||
|
||||
> ✅ డేటాసెట్లో, సంరక్షణ స్థితిని వివరించడానికి కొన్ని సంక్షిప్త రూపాలు ఉపయోగించబడ్డాయి. ఈ సంక్షిప్త రూపాలు [IUCN రెడ్ లిస్ట్ వర్గాలు](https://www.iucnredlist.org/) నుండి వచ్చాయి, ఇది జాతుల స్థితిని నమోదు చేసే సంస్థ.
|
||||
>
|
||||
> - CR: తీవ్రంగా ప్రమాదంలో ఉన్నది
|
||||
> - EN: ప్రమాదంలో ఉన్నది
|
||||
> - EX: అంతరించిపోయింది
|
||||
> - LC: తక్కువ ఆందోళన
|
||||
> - NT: సమీప ప్రమాదంలో ఉన్నది
|
||||
> - VU: ప్రమాదంలో ఉన్నది
|
||||
|
||||
ఇవి టెక్స్ట్ ఆధారిత విలువలు కాబట్టి మీరు హిస్టోగ్రామ్ సృష్టించడానికి ట్రాన్స్ఫార్మ్ చేయాలి. filteredBirds డేటాఫ్రేమ్ ఉపయోగించి, దాని సంరక్షణ స్థితిని మరియు కనిష్ట రెక్కపట్టును ప్రదర్శించండి. మీరు ఏమి చూస్తారు?
|
||||
|
||||
```r
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EX'] <- 'x1'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'CR'] <- 'x2'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EN'] <- 'x3'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'NT'] <- 'x4'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'VU'] <- 'x5'
|
||||
birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'LC'] <- 'x6'
|
||||
|
||||
ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
|
||||
geom_histogram(position = "identity", alpha = 0.4, bins = 20) +
|
||||
scale_fill_manual(name="Conservation Status",values=c("red","green","blue","pink"),labels=c("Endangered","Near Threathened","Vulnerable","Least Concern"))
|
||||
```
|
||||
|
||||

|
||||
|
||||
కనిష్ట రెక్కపట్టు మరియు సంరక్షణ స్థితి మధ్య మంచి సంబంధం కనిపించట్లేదు. ఈ పద్ధతిని ఉపయోగించి డేటాసెట్ యొక్క ఇతర అంశాలను పరీక్షించండి. మీరు ఏదైనా సంబంధం కనుగొంటారా?
|
||||
|
||||
## డెన్సిటీ ప్లాట్లు
|
||||
|
||||
ముందు చూసిన హిస్టోగ్రామ్లు 'స్టెప్ప్డ్' లాగా ఉంటాయి మరియు మృదువుగా వంకరగా ప్రవహించవు. మరింత మృదువైన డెన్సిటీ చార్ట్ చూపించడానికి, మీరు డెన్సిటీ ప్లాట్ ప్రయత్నించవచ్చు.
|
||||
|
||||
ఇప్పుడు డెన్సిటీ ప్లాట్లతో పని చేద్దాం!
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
|
||||
geom_density()
|
||||
```
|
||||

|
||||
|
||||
మీరు చూడగలరు, ఈ ప్లాట్ కనిష్ట రెక్కపట్టు డేటాకు ముందు ప్లాట్ను ప్రతిధ్వనిస్తుంది; ఇది కేవలం కొంచెం మృదువుగా ఉంటుంది. మీరు రెండవ చార్ట్లో ఉన్న ఆ జాగ్గీడ్ MaxBodyMass లైన్ను మృదువుగా చేయాలనుకుంటే, ఈ పద్ధతిని ఉపయోగించి దాన్ని బాగా సృష్టించవచ్చు:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
|
||||
geom_density()
|
||||
```
|
||||

|
||||
|
||||
మీకు చాలా మృదువుగా కాకుండా కొంత మృదువుగా ఉండే లైన్ కావాలంటే, `adjust` పారామీటర్ను సవరించండి:
|
||||
|
||||
```r
|
||||
ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
|
||||
geom_density(adjust = 1/5)
|
||||
```
|
||||

|
||||
|
||||
✅ ఈ రకమైన ప్లాట్ కోసం అందుబాటులో ఉన్న పారామీటర్ల గురించి చదవండి మరియు ప్రయోగాలు చేయండి!
|
||||
|
||||
ఈ రకమైన చార్ట్ అందమైన వివరణాత్మక దృశ్యీకరణలను అందిస్తుంది. కొన్ని కోడ్ లైన్లతో, ఉదాహరణకు, మీరు పక్షుల ఆర్డర్ ప్రకారం గరిష్ట శరీర ద్రవ్యరాశి డెన్సిటీని చూపించవచ్చు:
|
||||
|
||||
```r
|
||||
ggplot(data=birds_filtered_1,aes(x = MaxBodyMass, fill = Order)) +
|
||||
geom_density(alpha=0.5)
|
||||
```
|
||||

|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
హిస్టోగ్రామ్లు ప్రాథమిక స్కాటర్ప్లాట్లు, బార్ చార్ట్లు లేదా లైన్ చార్ట్ల కంటే మరింత సాంకేతికమైన చార్ట్ రకం. ఇంటర్నెట్లో హిస్టోగ్రామ్ల ఉపయోగానికి మంచి ఉదాహరణలను వెతకండి. అవి ఎలా ఉపయోగిస్తారు, ఏమి చూపిస్తాయి, మరియు ఏ రంగాలలో లేదా పరిశోధనా ప్రాంతాలలో ఎక్కువగా ఉపయోగిస్తారు?
|
||||
|
||||
## [పాఠం తర్వాత క్విజ్](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/19)
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
ఈ పాఠంలో, మీరు `ggplot2` ఉపయోగించి మరింత సాంకేతికమైన చార్ట్లను చూపించడం ప్రారంభించారు. `geom_density_2d()` గురించి కొంత పరిశోధన చేయండి, ఇది "ఒక లేదా ఎక్కువ కొలతలలో నిరంతర సంభావ్యతా సాంద్రత వక్రరేఖ". ఇది ఎలా పనిచేస్తుందో అర్థం చేసుకోవడానికి [డాక్యుమెంటేషన్](https://ggplot2.tidyverse.org/reference/geom_density_2d.html) చదవండి.
|
||||
|
||||
## అసైన్మెంట్
|
||||
|
||||
[మీ నైపుణ్యాలను వర్తించండి](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారులు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,27 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a233d542512136c4dd29aad38ca0175f",
|
||||
"translation_date": "2025-12-19T16:23:22+00:00",
|
||||
"source_file": "3-Data-Visualization/R/10-visualization-distributions/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# మీ నైపుణ్యాలను వర్తింపజేయండి
|
||||
|
||||
## సూచనలు
|
||||
|
||||
ఇప్పటివరకు, మీరు మిన్నెసోటా పక్షుల డేటాసెట్తో పని చేసి పక్షుల సంఖ్యలు మరియు జనాభా సాంద్రత గురించి సమాచారం కనుగొన్నారు. ఈ సాంకేతికతలను వేరే డేటాసెట్తో ప్రయోగించండి, ఉదాహరణకు [Kaggle](https://www.kaggle.com/) నుండి పొందినది కావచ్చు. ఈ డేటాసెట్ గురించి కథ చెప్పడానికి R స్క్రిప్ట్ను నిర్మించండి, మరియు దానిని చర్చించే సమయంలో హిస్టోగ్రామ్లను ఉపయోగించండి.
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణగా | సరిపోతుంది | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
ఈ డేటాసెట్ గురించి, దాని మూలం సహా వ్యాఖ్యానాలతో కూడిన స్క్రిప్ట్ అందించబడింది, మరియు డేటా గురించి నిజాలు కనుగొనడానికి కనీసం 5 హిస్టోగ్రామ్లను ఉపయోగిస్తుంది. | అసంపూర్ణ వ్యాఖ్యానాలు లేదా బగ్స్ ఉన్న స్క్రిప్ట్ అందించబడింది. | వ్యాఖ్యానాలు లేకుండా మరియు బగ్స్ ఉన్న స్క్రిప్ట్ అందించబడింది.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,204 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "47028abaaafa2bcb1079702d20569066",
|
||||
"translation_date": "2025-12-19T16:27:02+00:00",
|
||||
"source_file": "3-Data-Visualization/R/11-visualization-proportions/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# Visualizing Proportions
|
||||
|
||||
| ](../../../sketchnotes/11-Visualizing-Proportions.png)|
|
||||
|:---:|
|
||||
|Visualizing Proportions - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
|
||||
|
||||
ఈ పాఠంలో, మీరు మష్రూమ్స్ గురించి ఒక dataset లోని వివిధ రకాల ఫంగి ఎంతమేరలో ఉన్నాయో చూడటానికి ప్రకృతి-కేంద్రీకృత dataset ను ఉపయోగిస్తారు. Audubon నుండి తీసుకున్న 23 రకాల గిల్లెడ్ మష్రూమ్స్ గురించి వివరాలు ఉన్న dataset ను ఉపయోగించి ఈ ఆసక్తికరమైన ఫంగీలను పరిశీలిద్దాం. మీరు ఈ రుచికరమైన విజువలైజేషన్లతో ప్రయోగం చేయబోతున్నారు:
|
||||
|
||||
- పై చార్ట్లు 🥧
|
||||
- డోనట్ చార్ట్లు 🍩
|
||||
- వాఫిల్ చార్ట్లు 🧇
|
||||
|
||||
> 💡 Microsoft Research నుండి వచ్చిన [Charticulator](https://charticulator.com) అనే చాలా ఆసక్తికరమైన ప్రాజెక్ట్ డేటా విజువలైజేషన్ల కోసం ఉచిత డ్రాగ్ అండ్ డ్రాప్ ఇంటర్ఫేస్ అందిస్తుంది. వారి ట్యుటోరియల్స్ లో ఒకటిలో కూడా ఈ మష్రూమ్ dataset ఉపయోగించారు! కాబట్టి మీరు డేటాను అన్వేషించి లైబ్రరీని ఒకేసారి నేర్చుకోవచ్చు: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html).
|
||||
|
||||
## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20)
|
||||
|
||||
## మీ మష్రూమ్స్ ను తెలుసుకోండి 🍄
|
||||
|
||||
మష్రూమ్స్ చాలా ఆసక్తికరమైనవి. వాటిని అధ్యయనం చేయడానికి ఒక dataset ను దిగుమతి చేద్దాం:
|
||||
|
||||
```r
|
||||
mushrooms = read.csv('../../data/mushrooms.csv')
|
||||
head(mushrooms)
|
||||
```
|
||||
ఒక పట్టిక విశ్లేషణకు మంచి డేటాతో ప్రింట్ అవుతుంది:
|
||||
|
||||
|
||||
| class | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | stalk-root | stalk-surface-above-ring | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
|
||||
| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
|
||||
| Poisonous | Convex | Smooth | Brown | Bruises | Pungent | Free | Close | Narrow | Black | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
|
||||
| Edible | Convex | Smooth | Yellow | Bruises | Almond | Free | Close | Broad | Black | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Grasses |
|
||||
| Edible | Bell | Smooth | White | Bruises | Anise | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Meadows |
|
||||
| Poisonous | Convex | Scaly | White | Bruises | Pungent | Free | Close | Narrow | Brown | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban
|
||||
| Edible | Convex |Smooth | Green | No Bruises| None |Free | Crowded | Broad | Black | Tapering | Equal | Smooth | Smooth | White | White | Partial | White | One | Evanescent | Brown | Abundant | Grasses
|
||||
|Edible | Convex | Scaly | Yellow | Bruises | Almond | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Numerous | Grasses
|
||||
|
||||
తక్షణమే, మీరు గమనిస్తారు అన్ని డేటా వచన రూపంలో ఉంది. మీరు ఈ డేటాను చార్ట్ లో ఉపయోగించడానికి మార్చుకోవాలి. చాలా డేటా వాస్తవానికి ఒక ఆబ్జెక్ట్ రూపంలో ఉంటుంది:
|
||||
|
||||
```r
|
||||
names(mushrooms)
|
||||
```
|
||||
|
||||
ఫలితం:
|
||||
|
||||
```output
|
||||
[1] "class" "cap.shape"
|
||||
[3] "cap.surface" "cap.color"
|
||||
[5] "bruises" "odor"
|
||||
[7] "gill.attachment" "gill.spacing"
|
||||
[9] "gill.size" "gill.color"
|
||||
[11] "stalk.shape" "stalk.root"
|
||||
[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
|
||||
[15] "stalk.color.above.ring" "stalk.color.below.ring"
|
||||
[17] "veil.type" "veil.color"
|
||||
[19] "ring.number" "ring.type"
|
||||
[21] "spore.print.color" "population"
|
||||
[23] "habitat"
|
||||
```
|
||||
ఈ డేటాను తీసుకుని 'class' కాలమ్ ను category గా మార్చండి:
|
||||
|
||||
```r
|
||||
library(dplyr)
|
||||
grouped=mushrooms %>%
|
||||
group_by(class) %>%
|
||||
summarise(count=n())
|
||||
```
|
||||
|
||||
|
||||
ఇప్పుడు, మీరు మష్రూమ్స్ డేటాను ప్రింట్ చేస్తే, అది poisonous/edible క్లాస్ ప్రకారం వర్గీకరించబడిందని చూడవచ్చు:
|
||||
```r
|
||||
View(grouped)
|
||||
```
|
||||
|
||||
|
||||
| class | count |
|
||||
| --------- | --------- |
|
||||
| Edible | 4208 |
|
||||
| Poisonous| 3916 |
|
||||
|
||||
|
||||
|
||||
ఈ పట్టికలో చూపించిన క్రమాన్ని అనుసరించి మీ class category లేబుల్స్ సృష్టిస్తే, మీరు పై చార్ట్ తయారు చేయవచ్చు.
|
||||
|
||||
## పై!
|
||||
|
||||
```r
|
||||
pie(grouped$count,grouped$class, main="Edible?")
|
||||
```
|
||||
ఇది, ఈ రెండు మష్రూమ్ తరగతుల ప్రకారం డేటా యొక్క నిష్పత్తులను చూపించే పై చార్ట్. లేబుల్స్ క్రమం సరిగ్గా ఉండటం చాలా ముఖ్యం, కాబట్టి లేబుల్ అర్రే ఎలా తయారవుతుందో నిర్ధారించుకోండి!
|
||||
|
||||

|
||||
|
||||
## డోనట్స్!
|
||||
|
||||
కొంతమేర విజువల్ గా ఆసక్తికరమైన పై చార్ట్ డోనట్ చార్ట్, ఇది మధ్యలో రంధ్రం ఉన్న పై చార్ట్. ఈ పద్ధతిని ఉపయోగించి మన డేటాను చూద్దాం.
|
||||
|
||||
మష్రూమ్స్ పెరుగుతున్న వివిధ వాతావరణాలను చూడండి:
|
||||
|
||||
```r
|
||||
library(dplyr)
|
||||
habitat=mushrooms %>%
|
||||
group_by(habitat) %>%
|
||||
summarise(count=n())
|
||||
View(habitat)
|
||||
```
|
||||
ఫలితం:
|
||||
| habitat| count |
|
||||
| --------- | --------- |
|
||||
| Grasses | 2148 |
|
||||
| Leaves| 832 |
|
||||
| Meadows | 292 |
|
||||
| Paths| 1144 |
|
||||
| Urban | 368 |
|
||||
| Waste| 192 |
|
||||
| Wood| 3148 |
|
||||
|
||||
|
||||
ఇక్కడ, మీరు డేటాను habitat ప్రకారం వర్గీకరిస్తున్నారు. 7 వర్గాలు ఉన్నాయి, కాబట్టి వాటిని డోనట్ చార్ట్ లేబుల్స్ గా ఉపయోగించండి:
|
||||
|
||||
```r
|
||||
library(ggplot2)
|
||||
library(webr)
|
||||
PieDonut(habitat, aes(habitat, count=count))
|
||||
```
|
||||
|
||||

|
||||
|
||||
ఈ కోడ్ రెండు లైబ్రరీలు - ggplot2 మరియు webr ఉపయోగిస్తుంది. webr లైబ్రరీలో PieDonut ఫంక్షన్ ఉపయోగించి, డోనట్ చార్ట్ సులభంగా సృష్టించవచ్చు!
|
||||
|
||||
R లో డోనట్ చార్ట్లు ggplot2 లైబ్రరీ మాత్రమే ఉపయోగించి కూడా చేయవచ్చు. మీరు దీని గురించి మరింత తెలుసుకోవచ్చు [ఇక్కడ](https://www.r-graph-gallery.com/128-ring-or-donut-plot.html) మరియు స్వయంగా ప్రయత్నించండి.
|
||||
|
||||
ఇప్పుడు మీరు డేటాను వర్గీకరించి, దాన్ని పై లేదా డోనట్ గా ప్రదర్శించడం ఎలా చేయాలో తెలుసుకున్నారంటే, ఇతర రకాల చార్ట్లను అన్వేషించవచ్చు. వాఫిల్ చార్ట్ ప్రయత్నించండి, ఇది క్వాంటిటీని అన్వేషించడానికి వేరే విధానం.
|
||||
|
||||
## వాఫిల్స్!
|
||||
|
||||
'వాఫిల్' రకం చార్ట్ అనేది పరిమాణాలను 2D స్క్వేర్ అర్రే రూపంలో చూపించే వేరే విధానం. ఈ dataset లోని మష్రూమ్ క్యాప్ రంగుల వివిధ పరిమాణాలను విజువలైజ్ చేయండి. దీని కోసం, మీరు [waffle](https://cran.r-project.org/web/packages/waffle/waffle.pdf) అనే సహాయక లైబ్రరీని ఇన్స్టాల్ చేసి, దానిని ఉపయోగించి విజువలైజేషన్ సృష్టించాలి:
|
||||
|
||||
```r
|
||||
install.packages("waffle", repos = "https://cinc.rud.is")
|
||||
```
|
||||
|
||||
మీ డేటా నుండి ఒక భాగాన్ని ఎంచుకోండి:
|
||||
|
||||
```r
|
||||
library(dplyr)
|
||||
cap_color=mushrooms %>%
|
||||
group_by(cap.color) %>%
|
||||
summarise(count=n())
|
||||
View(cap_color)
|
||||
```
|
||||
|
||||
లేబుల్స్ సృష్టించి, డేటాను వర్గీకరించి వాఫిల్ చార్ట్ సృష్టించండి:
|
||||
|
||||
```r
|
||||
library(waffle)
|
||||
names(cap_color$count) = paste0(cap_color$cap.color)
|
||||
waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green",
|
||||
"pink", "purple", "red", "grey",
|
||||
"yellow","white"))
|
||||
```
|
||||
|
||||
వాఫిల్ చార్ట్ ఉపయోగించి, ఈ మష్రూమ్ dataset లో క్యాప్ రంగుల నిష్పత్తులను స్పష్టంగా చూడవచ్చు. ఆసక్తికరంగా, చాలా గ్రీన్ క్యాప్ మష్రూమ్స్ ఉన్నాయి!
|
||||
|
||||

|
||||
|
||||
ఈ పాఠంలో, మీరు నిష్పత్తులను విజువలైజ్ చేయడానికి మూడు మార్గాలు నేర్చుకున్నారు. మొదట, డేటాను వర్గాలుగా వర్గీకరించి, ఆ తర్వాత డేటాను ప్రదర్శించడానికి ఉత్తమ మార్గం - పై, డోనట్ లేదా వాఫిల్ ఎంచుకోవాలి. ఇవన్నీ రుచికరమైనవి మరియు dataset యొక్క తక్షణ స్నాప్షాట్ తో వినియోగదారుని సంతృప్తి పరుస్తాయి.
|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
ఈ రుచికరమైన చార్ట్లను [Charticulator](https://charticulator.com) లో మళ్లీ సృష్టించడానికి ప్రయత్నించండి.
|
||||
## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21)
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
ఎప్పుడు పై, డోనట్ లేదా వాఫిల్ చార్ట్ ఉపయోగించాలో ఎప్పుడూ స్పష్టంగా ఉండదు. ఈ విషయంపై చదవడానికి కొన్ని వ్యాసాలు:
|
||||
|
||||
https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
|
||||
|
||||
https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
|
||||
|
||||
https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
|
||||
|
||||
https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
|
||||
|
||||
ఈ క్లిష్ట నిర్ణయం గురించి మరింత సమాచారం కోసం పరిశోధన చేయండి.
|
||||
## అసైన్మెంట్
|
||||
|
||||
[Excel లో ప్రయత్నించండి](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకం వల్ల కలిగే ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,179 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "a33c5d4b4156a2b41788d8720b6f724c",
|
||||
"translation_date": "2025-12-19T16:24:03+00:00",
|
||||
"source_file": "3-Data-Visualization/R/12-visualization-relationships/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# సంబంధాలను దృశ్యీకరించడం: తేనె గురించి అన్ని విషయాలు 🍯
|
||||
|
||||
| ద్వారా ](../../../sketchnotes/12-Visualizing-Relationships.png)|
|
||||
|:---:|
|
||||
|సంబంధాలను దృశ్యీకరించడం - _స్కెచ్ నోట్ [@nitya](https://twitter.com/nitya) ద్వారా_ |
|
||||
|
||||
మా పరిశోధనలో ప్రకృతి దృష్టిని కొనసాగిస్తూ, [యునైటెడ్ స్టేట్స్ డిపార్ట్మెంట్ ఆఫ్ అగ్రికల్చర్](https://www.nass.usda.gov/About_NASS/index.php) నుండి పొందిన డేటాసెట్ ఆధారంగా వివిధ రకాల తేనె మధ్య సంబంధాలను చూపించే ఆసక్తికరమైన దృశ్యీకరణలను కనుగొనుకుందాం.
|
||||
|
||||
ఈ సుమారు 600 అంశాల డేటాసెట్ అనేక యుఎస్ రాష్ట్రాలలో తేనె ఉత్పత్తిని ప్రదర్శిస్తుంది. ఉదాహరణకు, మీరు ప్రతి రాష్ట్రం నుండి 1998-2012 మధ్య సంవత్సరానికి ఒక వరుసగా కాలనీల సంఖ్య, కాలనీకి ఉత్పత్తి, మొత్తం ఉత్పత్తి, నిల్వలు, పౌండ్కు ధర మరియు ఉత్పత్తి విలువను చూడవచ్చు.
|
||||
|
||||
ఒక రాష్ట్రం యొక్క సంవత్సరానికి ఉత్పత్తి మరియు ఆ రాష్ట్రంలో తేనె ధర మధ్య సంబంధాన్ని దృశ్యీకరించడం ఆసక్తికరం. లేదా, రాష్ట్రాల తేనె ఉత్పత్తి కాలనీకి మధ్య సంబంధాన్ని చూపవచ్చు. ఈ సంవత్సరాల వ్యవధి 2006లో మొదటగా కనిపించిన 'CCD' లేదా 'కాలనీ కాలపనితీరు వ్యాధి' (http://npic.orst.edu/envir/ccd.html) ను కవర్ చేస్తుంది, కాబట్టి ఇది అధ్యయనానికి భావోద్వేగమైన డేటాసెట్. 🐝
|
||||
|
||||
## [పూర్వ-ఉపన్యాస క్విజ్](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/22)
|
||||
|
||||
ఈ పాఠంలో, మీరు ముందుగా ఉపయోగించిన ggplot2 ను వేరియబుల్స్ మధ్య సంబంధాలను దృశ్యీకరించడానికి మంచి లైబ్రరీగా ఉపయోగించవచ్చు. ప్రత్యేకంగా ggplot2 యొక్క `geom_point` మరియు `qplot` ఫంక్షన్ ఉపయోగించి స్కాటర్ ప్లాట్లు మరియు లైన్ ప్లాట్లను త్వరగా '[సాంఖ్యిక సంబంధాలు](https://ggplot2.tidyverse.org/)' చూపించడానికి ఉపయోగిస్తారు, ఇది డేటా శాస్త్రవేత్తకు వేరియబుల్స్ ఎలా సంబంధం కలిగి ఉన్నాయో మెరుగ్గా అర్థం చేసుకోవడంలో సహాయపడుతుంది.
|
||||
|
||||
## స్కాటర్ ప్లాట్లు
|
||||
|
||||
ప్రతి రాష్ట్రానికి సంవత్సరానికి తేనె ధర ఎలా మారిందో చూపించడానికి స్కాటర్ ప్లాట్ ఉపయోగించండి. ggplot2, `ggplot` మరియు `geom_point` ఉపయోగించి, రాష్ట్ర డేటాను సమూహీకరించి, వర్గీకృత మరియు సంఖ్యాత్మక డేటా కోసం డేటా పాయింట్లను ప్రదర్శిస్తుంది.
|
||||
|
||||
ముందుగా డేటాను మరియు Seaborn ను దిగుమతి చేసుకుందాం:
|
||||
|
||||
```r
|
||||
honey=read.csv('../../data/honey.csv')
|
||||
head(honey)
|
||||
```
|
||||
మీరు గమనిస్తారు తేనె డేటాలో సంవత్సరము మరియు పౌండ్కు ధర వంటి కొన్ని ఆసక్తికరమైన కాలమ్స్ ఉన్నాయి. ఈ డేటాను యుఎస్ రాష్ట్రాల వారీగా సమూహీకరించి పరిశీలిద్దాం:
|
||||
|
||||
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|
||||
| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
|
||||
| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
|
||||
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
|
||||
| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
|
||||
| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
|
||||
| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
|
||||
| FL | 230000 | 98 |22540000 | 4508000 | 0.64 | 14426000 | 1998 |
|
||||
|
||||
తేనె ధర మరియు దాని ఉత్పత్తి రాష్ట్రం మధ్య సంబంధాన్ని చూపించడానికి ఒక ప్రాథమిక స్కాటర్ ప్లాట్ సృష్టించండి. అన్ని రాష్ట్రాలు ప్రదర్శించడానికి `y` అక్షాన్ని పొడవుగా చేయండి:
|
||||
|
||||
```r
|
||||
library(ggplot2)
|
||||
ggplot(honey, aes(x = priceperlb, y = state)) +
|
||||
geom_point(colour = "blue")
|
||||
```
|
||||

|
||||
|
||||
ఇప్పుడు, అదే డేటాను తేనె రంగు స్కీమ్తో చూపించి, సంవత్సరాల వారీగా ధర ఎలా మారిందో చూపించండి. మీరు 'scale_color_gradientn' పారామీటర్ జోడించడం ద్వారా సంవత్సరాల మార్పును చూపవచ్చు:
|
||||
|
||||
> ✅ [scale_color_gradientn](https://www.rdocumentation.org/packages/ggplot2/versions/0.9.1/topics/scale_colour_gradientn) గురించి మరింత తెలుసుకోండి - అందమైన రైన్బో రంగు స్కీమ్ ప్రయత్నించండి!
|
||||
|
||||
```r
|
||||
ggplot(honey, aes(x = priceperlb, y = state, color=year)) +
|
||||
geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7))
|
||||
```
|
||||

|
||||
|
||||
ఈ రంగు స్కీమ్ మార్పుతో, తేనె ధరలో సంవత్సరాల వారీగా స్పష్టమైన పెరుగుదల ఉందని మీరు చూడవచ్చు. నిజంగా, డేటాలో ఒక నమూనా సెట్ (ఉదాహరణకు అరిజోనా రాష్ట్రం) పరిశీలిస్తే, కొన్నిసార్లు తప్పులు ఉన్నా, ధర సంవత్సరాల వారీగా పెరుగుతుందని కనిపిస్తుంది:
|
||||
|
||||
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|
||||
| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
|
||||
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
|
||||
| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
|
||||
| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
|
||||
| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
|
||||
| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
|
||||
| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
|
||||
| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
|
||||
| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
|
||||
| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
|
||||
| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
|
||||
| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
|
||||
| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
|
||||
| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
|
||||
| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
|
||||
| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
|
||||
|
||||
రంగు బదులుగా పరిమాణం ఉపయోగించి ఈ పెరుగుదలని చూపించవచ్చు. రంగు దృష్టి లోపం ఉన్న వినియోగదారులకు ఇది మంచి ఎంపిక కావచ్చు. డాట్ వ్యాసార్థం పెరుగుదలతో ధర పెరుగుదలని చూపించడానికి మీ దృశ్యీకరణను సవరించండి:
|
||||
|
||||
```r
|
||||
ggplot(honey, aes(x = priceperlb, y = state)) +
|
||||
geom_point(aes(size = year),colour = "blue") +
|
||||
scale_size_continuous(range = c(0.25, 3))
|
||||
```
|
||||
డాట్ల పరిమాణం క్రమంగా పెరుగుతున్నట్లు మీరు చూడవచ్చు.
|
||||
|
||||

|
||||
|
||||
ఇది సరఫరా మరియు డిమాండ్ యొక్క సాదారణ ఉదాహరణనా? వాతావరణ మార్పులు మరియు కాలనీ కాలపనితీరు వంటి కారణాల వల్ల, సంవత్సరాల వారీగా తేనె కొంత తక్కువగా అందుబాటులో ఉండి, అందువల్ల ధర పెరుగుతుందా?
|
||||
|
||||
ఈ డేటాసెట్ లోని కొన్ని వేరియబుల్స్ మధ్య సంబంధాన్ని కనుగొనడానికి, కొన్ని లైన్ చార్ట్లను పరిశీలిద్దాం.
|
||||
|
||||
## లైన్ చార్ట్లు
|
||||
|
||||
ప్రశ్న: తేనె ధర సంవత్సరాల వారీగా స్పష్టంగా పెరుగుతుందా? మీరు ఒకే లైన్ చార్ట్ సృష్టించడం ద్వారా ఇది సులభంగా కనుగొనవచ్చు:
|
||||
|
||||
```r
|
||||
qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab = "priceperlb")
|
||||
```
|
||||
జవాబు: అవును, 2003 సంవత్సరానికి చుట్టూ కొన్ని మినహాయింపులతో:
|
||||
|
||||

|
||||
|
||||
ప్రశ్న: 2003లో తేనె సరఫరాలో కూడా పెరుగుదల కనిపిస్తుందా? సంవత్సరాల వారీగా మొత్తం ఉత్పత్తిని చూస్తే?
|
||||
|
||||
```python
|
||||
qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod")
|
||||
```
|
||||
|
||||

|
||||
|
||||
జవాబు: అంతగా కాదు. మొత్తం ఉత్పత్తిని చూస్తే, ఆ ప్రత్యేక సంవత్సరంలో పెరిగినట్లు కనిపిస్తుంది, అయితే సాధారణంగా ఈ సంవత్సరాలలో తేనె ఉత్పత్తి తగ్గుతోంది.
|
||||
|
||||
ప్రశ్న: ఆ సందర్భంలో, 2003లో తేనె ధర పెరుగుదలకు కారణం ఏమిటి?
|
||||
|
||||
దీనిని కనుగొనడానికి, మీరు ఫేసెట్ గ్రిడ్ను అన్వేషించవచ్చు.
|
||||
|
||||
## ఫేసెట్ గ్రిడ్లు
|
||||
|
||||
ఫేసెట్ గ్రిడ్లు మీ డేటాసెట్ యొక్క ఒక ఫేసెట్ తీసుకుంటాయి (మా సందర్భంలో, మీరు 'సంవత్సరం' ఎంచుకుని చాలా ఫేసెట్లు ఉత్పత్తి కాకుండా ఉండవచ్చు). Seaborn ఆ ఫేసెట్ల కోసం మీ ఎంచుకున్న x మరియు y కోఆర్డినేట్లతో ప్రతి ఫేసెట్ కోసం ప్లాట్ తయారు చేస్తుంది, ఇది సులభమైన దృశ్య తులన కోసం. 2003 ఈ రకమైన తులనలో ప్రత్యేకంగా కనిపిస్తుందా?
|
||||
|
||||
[ggplot2 డాక్యుమెంటేషన్](https://ggplot2.tidyverse.org/reference/facet_wrap.html) సిఫారసు చేసినట్లుగా `facet_wrap` ఉపయోగించి ఫేసెట్ గ్రిడ్ సృష్టించండి.
|
||||
|
||||
```r
|
||||
ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) +
|
||||
geom_line() + facet_wrap(vars(year))
|
||||
```
|
||||
ఈ దృశ్యీకరణలో, మీరు కాలనీకి ఉత్పత్తి మరియు కాలనీల సంఖ్యను సంవత్సరాల వారీగా, 3 కాలమ్స్తో wrap సెట్తో పక్కపక్కనే పోల్చవచ్చు:
|
||||
|
||||

|
||||
|
||||
ఈ డేటాసెట్ కోసం, కాలనీల సంఖ్య మరియు వాటి ఉత్పత్తి విషయంలో సంవత్సరాల వారీగా మరియు రాష్ట్రాల వారీగా ప్రత్యేకంగా ఏమీ కనిపించదు. ఈ రెండు వేరియబుల్స్ మధ్య సంబంధం కనుగొనడానికి వేరే దృశ్య పద్ధతి ఉందా?
|
||||
|
||||
## ద్విభుజ లైన్ ప్లాట్లు
|
||||
|
||||
R యొక్క `par` మరియు `plot` ఫంక్షన్ ఉపయోగించి రెండు లైన్ ప్లాట్లను ఒకదానిపై ఒకటి ఉంచి మల్టిలైన్ ప్లాట్ ప్రయత్నించండి. x అక్షంలో సంవత్సరం ప్రదర్శించి, రెండు y అక్షాలను చూపండి. కాబట్టి, కాలనీకి ఉత్పత్తి మరియు కాలనీల సంఖ్యను ఒకదానిపై ఒకటి ఉంచి ప్రదర్శించండి:
|
||||
|
||||
```r
|
||||
par(mar = c(5, 4, 4, 4) + 0.3)
|
||||
plot(honey$year, honey$numcol, pch = 16, col = 2,type="l")
|
||||
par(new = TRUE)
|
||||
plot(honey$year, honey$yieldpercol, pch = 17, col = 3,
|
||||
axes = FALSE, xlab = "", ylab = "",type="l")
|
||||
axis(side = 4, at = pretty(range(y2)))
|
||||
mtext("colony yield", side = 4, line = 3)
|
||||
```
|
||||

|
||||
|
||||
2003 సంవత్సరానికి చుట్టూ ఏదీ స్పష్టంగా కనిపించకపోయినా, ఈ పాఠాన్ని కొంత సంతోషకరంగా ముగించడానికి ఇది సహాయపడుతుంది: మొత్తం కాలనీల సంఖ్య తగ్గుతున్నప్పటికీ, వాటి ఉత్పత్తి తగ్గుతున్నా, కాలనీల సంఖ్య స్థిరపడుతోంది.
|
||||
|
||||
పోరు, తేనెలు, పోరు!
|
||||
|
||||
🐝❤️
|
||||
## 🚀 సవాలు
|
||||
|
||||
ఈ పాఠంలో, మీరు స్కాటర్ ప్లాట్లు మరియు లైన్ గ్రిడ్ల ఇతర ఉపయోగాల గురించి కొంత తెలుసుకున్నారు, ఫేసెట్ గ్రిడ్లు సహా. మీరు ఈ పాఠాల ముందు ఉపయోగించిన వేరే డేటాసెట్ ఉపయోగించి ఫేసెట్ గ్రిడ్ సృష్టించడానికి సవాలు చేయండి. అవి సృష్టించడానికి ఎంత సమయం పడుతుందో, మరియు ఈ సాంకేతికతలతో మీరు ఎంత గ్రిడ్లు డ్రా చేయాలో జాగ్రత్తగా ఉండాల్సిన అవసరం గురించి గమనించండి.
|
||||
## [ఉపన్యాసం తర్వాత క్విజ్](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/23)
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
లైన్ ప్లాట్లు సులభంగా లేదా చాలా సంక్లిష్టంగా ఉండవచ్చు. మీరు [ggplot2 డాక్యుమెంటేషన్](https://ggplot2.tidyverse.org/reference/geom_path.html#:~:text=geom_line()%20connects%20them%20in,which%20cases%20are%20connected%20together) లో వివిధ రకాలుగా వాటిని ఎలా నిర్మించాలో కొంత చదవండి. ఈ పాఠంలో మీరు నిర్మించిన లైన్ చార్ట్లను డాక్స్లో సూచించిన ఇతర పద్ధతులతో మెరుగుపరచడానికి ప్రయత్నించండి.
|
||||
## అసైన్మెంట్
|
||||
|
||||
[తేనెగుళ్లలోకి డైవ్ చేయండి](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వలన కలిగే ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,184 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "b4039f1c76548d144a0aee0bf28304ec",
|
||||
"translation_date": "2025-12-19T16:36:05+00:00",
|
||||
"source_file": "3-Data-Visualization/R/13-meaningful-vizualizations/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# అర్థవంతమైన విజువలైజేషన్లు చేయడం
|
||||
|
||||
| ద్వారా ](../../../sketchnotes/13-MeaningfulViz.png)|
|
||||
|:---:|
|
||||
| అర్థవంతమైన విజువలైజేషన్లు - _స్కెచ్ నోట్ [@nitya](https://twitter.com/nitya) ద్వారా_ |
|
||||
|
||||
> "మీరు డేటాను చాలాసేపు పీడిస్తే, అది ఏదైనా ఒప్పుకుంటుంది" -- [Ronald Coase](https://en.wikiquote.org/wiki/Ronald_Coase)
|
||||
|
||||
డేటా సైంటిస్ట్ యొక్క ప్రాథమిక నైపుణ్యాలలో ఒకటి, మీరు కలిగి ఉండవచ్చునని అనుకునే ప్రశ్నలకు సహాయం చేసే అర్థవంతమైన డేటా విజువలైజేషన్ సృష్టించే సామర్థ్యం. మీ డేటాను విజువలైజ్ చేయడానికి ముందు, మీరు గత పాఠాలలో చేసినట్లుగా అది శుభ్రపరచబడినదిగా మరియు సిద్ధంగా ఉందని నిర్ధారించుకోవాలి. ఆ తర్వాత, మీరు డేటాను ఎలా ఉత్తమంగా ప్రదర్శించాలో నిర్ణయించవచ్చు.
|
||||
|
||||
ఈ పాఠంలో, మీరు సమీక్షించబోతున్నది:
|
||||
|
||||
1. సరైన చార్ట్ రకాన్ని ఎలా ఎంచుకోవాలి
|
||||
2. మోసపూరిత చార్టింగ్ను ఎలా నివారించాలి
|
||||
3. రంగులతో ఎలా పని చేయాలి
|
||||
4. చదవడానికి సులభంగా మీ చార్టులను ఎలా స్టైల్ చేయాలి
|
||||
5. యానిమేటెడ్ లేదా 3D చార్టింగ్ పరిష్కారాలను ఎలా నిర్మించాలి
|
||||
6. సృజనాత్మక విజువలైజేషన్ను ఎలా నిర్మించాలి
|
||||
|
||||
## [ప్రీ-లెక్చర్ క్విజ్](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/24)
|
||||
|
||||
## సరైన చార్ట్ రకాన్ని ఎంచుకోండి
|
||||
|
||||
మునుపటి పాఠాలలో, మీరు Matplotlib మరియు Seaborn ఉపయోగించి అన్ని రకాల ఆసక్తికరమైన డేటా విజువలైజేషన్లను నిర్మించడంలో ప్రయోగించారు. సాధారణంగా, మీరు అడుగుతున్న ప్రశ్నకు సరిపోయే [సరైన రకమైన చార్ట్](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/)ను ఈ పట్టిక ఉపయోగించి ఎంచుకోవచ్చు:
|
||||
|
||||
| మీరు చేయవలసినది: | మీరు ఉపయోగించవలసింది: |
|
||||
| -------------------------- | ------------------------------- |
|
||||
| సమయానుగుణంగా డేటా ధోరణులను చూపించండి | లైన్ |
|
||||
| వర్గాలను పోల్చండి | బార్, పై |
|
||||
| మొత్తం మొత్తాలను పోల్చండి | పై, స్టాక్డ్ బార్ |
|
||||
| సంబంధాలను చూపించండి | స్కాటర్, లైన్, ఫేసెట్, డ్యూయల్ లైన్ |
|
||||
| పంపిణీలను చూపించండి | స్కాటర్, హిస్టోగ్రామ్, బాక్స్ |
|
||||
| భాగాలను చూపించండి | పై, డోనట్, వాఫుల్ |
|
||||
|
||||
> ✅ మీ డేటా నిర్మాణం ఆధారంగా, మీరు ఒక నిర్దిష్ట చార్ట్కు మద్దతు ఇవ్వడానికి దాన్ని టెక్స్ట్ నుండి సంఖ్యాత్మకంగా మార్చుకోవాల్సి ఉండవచ్చు.
|
||||
|
||||
## మోసాన్ని నివారించండి
|
||||
|
||||
డేటా సైంటిస్ట్ సరైన డేటాకు సరైన చార్ట్ ఎంచుకోవడానికి జాగ్రత్తగా ఉన్నా కూడా, డేటాను ఒక పాయింట్ నిరూపించడానికి ప్రదర్శించే అనేక మార్గాలు ఉన్నాయి, ఇది తరచుగా డేటాను తక్కువగా చూపించడంలో దోషం కలిగిస్తుంది. మోసపూరిత చార్టులు మరియు ఇన్ఫోగ్రాఫిక్స్ యొక్క అనేక ఉదాహరణలు ఉన్నాయి!
|
||||
|
||||
[](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
|
||||
|
||||
> 🎥 మోసపూరిత చార్టుల గురించి కాన్ఫరెన్స్ టాక్ కోసం పై చిత్రాన్ని క్లిక్ చేయండి
|
||||
|
||||
ఈ చార్ట్ X అక్షాన్ని తిరగబెడుతుంది, నిజానికి వ్యతిరేకంగా చూపించడానికి, తేదీ ఆధారంగా:
|
||||
|
||||

|
||||
|
||||
[ఈ చార్ట్](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) మరింత మోసపూరితంగా ఉంది, కళ్ళు కుడి వైపు ఆకర్షించబడి, కాలక్రమేణా వివిధ కౌంటీలలో COVID కేసులు తగ్గాయని తేల్చుకుంటుంది. నిజానికి, తేదీలను జాగ్రత్తగా పరిశీలిస్తే, అవి మోసపూరిత దిగువ ధోరణిని ఇవ్వడానికి తిరగబడినట్లు కనబడతాయి.
|
||||
|
||||

|
||||
|
||||
ఈ ప్రసిద్ధ ఉదాహరణ రంగు మరియు తిరగబడిన Y అక్షాన్ని ఉపయోగించి మోసం చేస్తుంది: తుపాకీ మిత్ర చట్టం ఆమోదం తర్వాత తుపాకీ మరణాలు పెరిగాయని తేల్చుకోవడం కాకుండా, కళ్ళు వ్యతిరేకం నిజమని భావించడానికి మోసం చేస్తాయి:
|
||||
|
||||

|
||||
|
||||
ఈ విచిత్ర చార్ట్ భాగస్వామ్యాన్ని ఎలా మోసం చేయవచ్చో హాస్యాస్పదంగా చూపిస్తుంది:
|
||||
|
||||

|
||||
|
||||
సమానమైన వాటిని పోల్చడం మరొక అన్యాయమైన ట్రిక్. 'స్పూరియస్ కారెలేషన్స్' గురించి ఒక [అద్భుతమైన వెబ్ సైట్](https://tylervigen.com/spurious-correlations) ఉంది, ఇది మైన్లో విడాకుల రేటు మరియు మార్జరిన్ వినియోగం వంటి విషయాలను కలిపి 'వాస్తవాలు' చూపిస్తుంది. Reddit గ్రూప్ కూడా డేటా యొక్క [అందం లేని ఉపయోగాలను](https://www.reddit.com/r/dataisugly/top/?t=all) సేకరిస్తుంది.
|
||||
|
||||
మోసపూరిత చార్టుల ద్వారా కళ్ళు ఎంత సులభంగా మోసపోయే అవకాశం ఉందో అర్థం చేసుకోవడం ముఖ్యం. డేటా సైంటిస్ట్ ఉద్దేశ్యం మంచిదైనా, చాలా వర్గాలను చూపించే పై చార్ట్ వంటి చెడు రకమైన చార్ట్ ఎంపిక మోసపూరితంగా ఉండవచ్చు.
|
||||
|
||||
## రంగు
|
||||
|
||||
మీరు పై 'ఫ్లోరిడా తుపాకీ హింస' చార్ట్లో రంగు చార్టులకు అదనపు అర్థాన్ని ఎలా అందించగలదో చూశారు, ముఖ్యంగా ggplot2 మరియు RColorBrewer వంటి లైబ్రరీలు ఉపయోగించని చార్టులలో, ఇవి వివిధ ధృవీకరించబడిన రంగు లైబ్రరీలు మరియు ప్యాలెట్లతో వస్తాయి. మీరు చేతితో చార్ట్ తయారు చేస్తుంటే, [రంగు సిద్ధాంతం](https://colormatters.com/color-and-design/basic-color-theory) కొంత అధ్యయనం చేయండి.
|
||||
|
||||
> ✅ చార్టులను డిజైన్ చేసే సమయంలో, విజువలైజేషన్లో ప్రాప్యత ఒక ముఖ్యమైన అంశం అని గుర్తుంచుకోండి. మీ వినియోగదారుల్లో కొంతమంది రంగు దృష్టి లోపం కలిగి ఉండవచ్చు - మీ చార్ట్ దృష్టి లోపం ఉన్న వినియోగదారులకు బాగా ప్రదర్శించబడుతుందా?
|
||||
|
||||
మీ చార్ట్ కోసం రంగులను ఎంచుకునేటప్పుడు జాగ్రత్తగా ఉండండి, ఎందుకంటే రంగు మీరు ఉద్దేశించని అర్థాన్ని కూడా వ్యక్తం చేయవచ్చు. పై 'ఎత్తు' చార్ట్లో 'పింక్ లేడీస్' స్పష్టంగా 'స్త్రీలింగ' అర్థాన్ని కలిగి ఉండటం చార్ట్ యొక్క విచిత్రతను పెంచుతుంది.
|
||||
|
||||
[రంగు అర్థం](https://colormatters.com/color-symbolism/the-meanings-of-colors) ప్రపంచంలోని వివిధ భాగాల్లో భిన్నంగా ఉండవచ్చు, మరియు వాటి షేడ్ల ప్రకారం అర్థం మారవచ్చు. సాధారణంగా, రంగుల అర్థాలు:
|
||||
|
||||
| రంగు | అర్థం |
|
||||
| ------ | ------------------- |
|
||||
| ఎరుపు | శక్తి |
|
||||
| నీలం | నమ్మకం, విశ్వాసం |
|
||||
| పసుపు | సంతోషం, జాగ్రత్త |
|
||||
| ఆకుపచ్చ | పర్యావరణం, అదృష్టం, అసూయ |
|
||||
| గులాబీ | సంతోషం |
|
||||
| నారింజ | ఉత్సాహం |
|
||||
|
||||
మీకు కస్టమ్ రంగులతో చార్ట్ నిర్మించమని బాధ్యత ఉంటే, మీ చార్టులు ప్రాప్యత కలిగి ఉండాలని మరియు మీరు వ్యక్తం చేయదలచిన అర్థంతో రంగు సరిపోవాలని నిర్ధారించుకోండి.
|
||||
|
||||
## చదవడానికి సులభంగా మీ చార్టులను స్టైల్ చేయడం
|
||||
|
||||
చార్టులు చదవడానికి సులభంగా లేకపోతే అర్థవంతంగా ఉండవు! మీ డేటాతో బాగా సరిపడేలా మీ చార్ట్ యొక్క వెడల్పు మరియు ఎత్తును స్టైల్ చేయడానికి కొంత సమయం తీసుకోండి. ఒక వేరియబుల్ (ఉదాహరణకు అన్ని 50 రాష్ట్రాలు) ప్రదర్శించాల్సిన అవసరం ఉంటే, వీటిని Y అక్షంపై నిలువుగా చూపించండి, తద్వారా ఆడంబరంగా స్క్రోల్ అయ్యే చార్ట్ తప్పించవచ్చు.
|
||||
|
||||
మీ అక్షాలను లేబుల్ చేయండి, అవసరమైతే లెజెండ్ ఇవ్వండి, మరియు డేటా మెరుగైన అవగాహన కోసం టూల్టిప్స్ అందించండి.
|
||||
|
||||
మీ డేటా X అక్షంపై వర్ణనాత్మకంగా ఉంటే, చదవడానికి మెరుగ్గా ఉండేందుకు టెక్స్ట్ను కోణంలో చూపించవచ్చు. [plot3D](https://cran.r-project.org/web/packages/plot3D/index.html) 3D ప్లాటింగ్ అందిస్తుంది, మీ డేటా దీనికి మద్దతు ఇస్తే. దీని ద్వారా సున్నితమైన డేటా విజువలైజేషన్లు తయారు చేయవచ్చు.
|
||||
|
||||

|
||||
|
||||
## యానిమేషన్ మరియు 3D చార్ట్ ప్రదర్శన
|
||||
|
||||
ఈ రోజుల్లో కొన్ని ఉత్తమ డేటా విజువలైజేషన్లు యానిమేటెడ్ ఉంటాయి. షిర్లీ వూ D3తో అద్భుతమైనవి చేసింది, ఉదాహరణకు '[ఫిల్మ్ ఫ్లవర్స్](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', ఇందులో ప్రతి పువ్వు ఒక సినిమా విజువలైజేషన్. గార్డియన్ కోసం మరో ఉదాహరణ 'బస్స్డ్ అవుట్', ఇది విజువలైజేషన్లను Greensock మరియు D3తో కలిపి NYC తన హోంలెస్ సమస్యను నగరానికి బయటికి బస్సు ద్వారా ఎలా నిర్వహిస్తుందో చూపించే స్క్రోలిటెల్లింగ్ ఆర్టికల్ ఫార్మాట్.
|
||||
|
||||

|
||||
|
||||
> "Bussed Out: How America Moves its Homeless" [గార్డియన్](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study) నుండి. విజువలైజేషన్లు: నాడీహ్ బ్రెమర్ & షిర్లీ వూ
|
||||
|
||||
ఈ పాఠం ఈ శక్తివంతమైన విజువలైజేషన్ లైబ్రరీలను లోతుగా నేర్పడానికి తగినంత కాదు, Vue.js యాప్లో D3తో ప్రయత్నించండి, "Dangerous Liaisons" పుస్తకాన్ని యానిమేటెడ్ సోషల్ నెట్వర్క్గా ప్రదర్శించడానికి లైబ్రరీ ఉపయోగించి.
|
||||
|
||||
> "Les Liaisons Dangereuses" అనేది ఎపిస్టోలరీ నవల, లేదా లేఖల సిరీస్గా ప్రదర్శించబడిన నవల. 1782లో చోడర్లోస్ డి లాక్లోస్ రాసినది, ఇది 18వ శతాబ్దం చివరలో ఫ్రెంచ్ అరిస్టోక్రసీ యొక్క రెండు ద్వంద్వ పాత్రధారుల, వికోంట్ డి వాల్మోంట్ మరియు మార్క్విస్ డి మెర్టోయిల్ యొక్క దుర్మార్గ, నైతికంగా దుర్బలమైన సామాజిక వ్యూహాల కథ. వారు చివరికి మరణిస్తారు కానీ పెద్ద సామాజిక నష్టం కలిగిస్తారు. నవల వివిధ వ్యక్తులకు రాసిన లేఖల సిరీస్గా విస్తరించబడుతుంది, ప్రతీకారం కోసం లేదా కేవలం సమస్యలు సృష్టించడానికి. ఈ లేఖల విజువలైజేషన్ సృష్టించి కథలో ప్రధాన పాత్రధారులను దృశ్యమానంగా కనుగొనండి.
|
||||
|
||||
మీరు ఈ సోషల్ నెట్వర్క్ యొక్క యానిమేటెడ్ వీక్షణను ప్రదర్శించే వెబ్ యాప్ను పూర్తి చేస్తారు. ఇది Vue.js మరియు D3 ఉపయోగించి [నెట్వర్క్ విజువలైజేషన్](https://github.com/emiliorizzo/vue-d3-network) సృష్టించడానికి రూపొందించిన లైబ్రరీని ఉపయోగిస్తుంది. యాప్ నడుస్తున్నప్పుడు, మీరు స్క్రీన్పై నోడ్లను తీయవచ్చు, డేటాను తిరగరాయడానికి.
|
||||
|
||||

|
||||
|
||||
## ప్రాజెక్ట్: D3.js ఉపయోగించి నెట్వర్క్ చూపించే చార్ట్ నిర్మించండి
|
||||
|
||||
> ఈ పాఠం ఫోల్డర్లో `solution` ఫోల్డర్ ఉంది, మీరు పూర్తి చేసిన ప్రాజెక్టును మీ సూచన కోసం చూడవచ్చు.
|
||||
|
||||
1. స్టార్టర్ ఫోల్డర్ రూట్లో ఉన్న README.md ఫైల్లో సూచనలను అనుసరించండి. మీ మెషీన్లో NPM మరియు Node.js నడుస్తున్నాయని నిర్ధారించుకోండి, ఆపై ప్రాజెక్ట్ డిపెండెన్సీలను ఇన్స్టాల్ చేయండి.
|
||||
|
||||
2. `starter/src` ఫోల్డర్ను తెరవండి. అక్కడ మీరు నవల నుండి అన్ని లేఖలతో కూడిన .json ఫైల్ ఉన్న `assets` ఫోల్డర్ను కనుగొంటారు, సంఖ్యలతో, 'to' మరియు 'from' అనోటేషన్తో.
|
||||
|
||||
3. `components/Nodes.vue` లోని కోడ్ను పూర్తి చేయండి, విజువలైజేషన్ను సక్రియం చేయడానికి. `createLinks()` అనే పద్ధతిని వెతకండి మరియు క్రింది నెస్టెడ్ లూప్ను జోడించండి.
|
||||
|
||||
.json ఆబ్జెక్ట్లోని లేఖల 'to' మరియు 'from' డేటాను పట్టుకుని `links` ఆబ్జెక్టును నిర్మించండి, తద్వారా విజువలైజేషన్ లైబ్రరీ దాన్ని ఉపయోగించగలదు:
|
||||
|
||||
```javascript
|
||||
//అక్షరాల ద్వారా లూప్ చేయండి
|
||||
let f = 0;
|
||||
let t = 0;
|
||||
for (var i = 0; i < letters.length; i++) {
|
||||
for (var j = 0; j < characters.length; j++) {
|
||||
|
||||
if (characters[j] == letters[i].from) {
|
||||
f = j;
|
||||
}
|
||||
if (characters[j] == letters[i].to) {
|
||||
t = j;
|
||||
}
|
||||
}
|
||||
this.links.push({ sid: f, tid: t });
|
||||
}
|
||||
```
|
||||
|
||||
టెర్మినల్ నుండి మీ యాప్ను నడపండి (npm run serve) మరియు విజువలైజేషన్ను ఆస్వాదించండి!
|
||||
|
||||
## 🚀 సవాలు
|
||||
|
||||
ఇంటర్నెట్లో మోసపూరిత విజువలైజేషన్లను కనుగొనండి. రచయిత ఎలా వినియోగదారుని మోసం చేస్తాడు, అది ఉద్దేశపూర్వకమా? ఆ విజువలైజేషన్లను సరిచేసి అవి ఎలా ఉండాలో చూపించండి.
|
||||
|
||||
## [పోస్ట్-లెక్చర్ క్విజ్](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/25)
|
||||
|
||||
## సమీక్ష & స్వీయ అధ్యయనం
|
||||
|
||||
ఇక్కడ మోసపూరిత డేటా విజువలైజేషన్ గురించి చదవడానికి కొన్ని వ్యాసాలు ఉన్నాయి:
|
||||
|
||||
https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
|
||||
|
||||
http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
|
||||
|
||||
చరిత్రాత్మక ఆస్తులు మరియు కళాఖండాల కోసం ఈ ఆసక్తికరమైన విజువలైజేషన్లను చూడండి:
|
||||
|
||||
https://handbook.pubpub.org/
|
||||
|
||||
యానిమేషన్ మీ విజువలైజేషన్లను ఎలా మెరుగుపరుస్తుందో ఈ వ్యాసాన్ని చూడండి:
|
||||
|
||||
https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
|
||||
|
||||
## అసైన్మెంట్
|
||||
|
||||
[మీ స్వంత కస్టమ్ విజువలైజేషన్ను నిర్మించండి](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,45 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "1441550a0d789796b2821e04f7f4cc94",
|
||||
"translation_date": "2025-12-19T13:34:37+00:00",
|
||||
"source_file": "3-Data-Visualization/README.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# విజువలైజేషన్లు
|
||||
|
||||

|
||||
> ఫోటో <a href="https://unsplash.com/@jenna2980?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">జెన్నా లీ</a> చేత <a href="https://unsplash.com/s/photos/bees-in-a-meadow?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">అన్స్ప్లాష్</a> లో
|
||||
|
||||
|
||||
డేటాను విజువలైజ్ చేయడం డేటా సైంటిస్ట్ యొక్క అత్యంత ముఖ్యమైన పనులలో ఒకటి. చిత్రాలు 1000 పదాల విలువ కలిగి ఉంటాయి, మరియు ఒక విజువలైజేషన్ మీ డేటాలోని స్పైక్స్, అవుట్లయర్స్, గ్రూపింగ్స్, ధోరణులు మరియు మరిన్ని వంటి అన్ని రకాల ఆసక్తికరమైన భాగాలను గుర్తించడంలో సహాయపడుతుంది, ఇది మీ డేటా చెప్పదలచుకున్న కథను అర్థం చేసుకోవడంలో సహాయపడుతుంది.
|
||||
|
||||
ఈ ఐదు పాఠాలలో, మీరు ప్రకృతి నుండి సేకరించిన డేటాను అన్వేషించి వివిధ సాంకేతికతలను ఉపయోగించి ఆసక్తికరమైన మరియు అందమైన విజువలైజేషన్లను సృష్టిస్తారు.
|
||||
|
||||
| టాపిక్ నంబర్ | టాపిక్ | లింక్ చేసిన పాఠం | రచయిత |
|
||||
| :-----------: | :--: | :-----------: | :----: |
|
||||
| 1. | పరిమాణాలను విజువలైజ్ చేయడం | <ul> <li> [Python](09-visualization-quantities/README.md)</li> <li>[R](../../../3-Data-Visualization/R/09-visualization-quantities) </li> </ul>|<ul> <li> [జెన్ లూపర్](https://twitter.com/jenlooper)</li><li> [విదుషి గుప్త](https://github.com/Vidushi-Gupta)</li> <li>[జస్లీన్ సొంధి](https://github.com/jasleen101010)</li></ul> |
|
||||
| 2. | పంపిణీని విజువలైజ్ చేయడం | <ul> <li> [Python](10-visualization-distributions/README.md)</li> <li>[R](../../../3-Data-Visualization/R/10-visualization-distributions) </li> </ul>|<ul> <li> [జెన్ లూపర్](https://twitter.com/jenlooper)</li><li> [విదుషి గుప్త](https://github.com/Vidushi-Gupta)</li> <li>[జస్లీన్ సొంధి](https://github.com/jasleen101010)</li></ul> |
|
||||
| 3. | నిష్పత్తులను విజువలైజ్ చేయడం | <ul> <li> [Python](11-visualization-proportions/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [జెన్ లూపర్](https://twitter.com/jenlooper)</li><li> [విదుషి గుప్త](https://github.com/Vidushi-Gupta)</li> <li>[జస్లీన్ సొంధి](https://github.com/jasleen101010)</li></ul> |
|
||||
| 4. | సంబంధాలను విజువలైజ్ చేయడం | <ul> <li> [Python](12-visualization-relationships/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [జెన్ లూపర్](https://twitter.com/jenlooper)</li><li> [విదుషి గుప్త](https://github.com/Vidushi-Gupta)</li> <li>[జస్లీన్ సొంధి](https://github.com/jasleen101010)</li></ul> |
|
||||
| 5. | అర్థవంతమైన విజువలైజేషన్లు చేయడం | <ul> <li> [Python](13-meaningful-visualizations/README.md)</li> <li>[R](../../../3-Data-Visualization) </li> </ul>|<ul> <li> [జెన్ లూపర్](https://twitter.com/jenlooper)</li><li> [విదుషి గుప్త](https://github.com/Vidushi-Gupta)</li> <li>[జస్లీన్ సొంధి](https://github.com/jasleen101010)</li></ul> |
|
||||
|
||||
### క్రెడిట్స్
|
||||
|
||||
ఈ విజువలైజేషన్ పాఠాలు 🌸 తో రాయబడ్డాయి [జెన్ లూపర్](https://twitter.com/jenlooper), [జస్లీన్ సొంధి](https://github.com/jasleen101010) మరియు [విదుషి గుప్త](https://github.com/Vidushi-Gupta) చేత.
|
||||
|
||||
🍯 US హనీ ప్రొడక్షన్ కోసం డేటా జెస్సికా లీ ప్రాజెక్ట్ నుండి [Kaggle](https://www.kaggle.com/jessicali9530/honey-production) లో సేకరించబడింది. [డేటా](https://usda.library.cornell.edu/concern/publications/rn301137d) [యునైటెడ్ స్టేట్స్ డిపార్ట్మెంట్ ఆఫ్ అగ్రికల్చర్](https://www.nass.usda.gov/About_NASS/index.php) నుండి తీసుకోబడింది.
|
||||
|
||||
🍄 మష్రూమ్ కోసం డేటా కూడా [Kaggle](https://www.kaggle.com/hatterasdunton/mushroom-classification-updated-dataset) నుండి సేకరించబడింది, హాటరాస్ డంటన్ ద్వారా సవరించబడింది. ఈ డేటాసెట్ 23 జాతుల గిల్లెడ్ మష్రూమ్స్ యొక్క హైపోథెటికల్ నమూనాల వివరణలను కలిగి ఉంది, ఇవి అగరికస్ మరియు లేపియోటా కుటుంబానికి చెందుతాయి. మష్రూమ్ ఆడుబోన్ సొసైటీ ఫీల్డ్ గైడ్ టు నార్త్ అమెరికన్ మష్రూమ్స్ (1981) నుండి తీసుకోబడింది. ఈ డేటాసెట్ 1987 లో UCI ML 27 కు దానం చేయబడింది.
|
||||
|
||||
🦆 మిన్నెసోటా పక్షుల డేటా [Kaggle](https://www.kaggle.com/hannahcollins/minnesota-birds) నుండి సేకరించబడింది, [వికీపీడియా](https://en.wikipedia.org/wiki/List_of_birds_of_Minnesota) నుండి హన్నా కాలిన్స్ ద్వారా స్క్రాప్ చేయబడింది.
|
||||
|
||||
ఈ అన్ని డేటాసెట్లు [CC0: క్రియేటివ్ కామన్స్](https://creativecommons.org/publicdomain/zero/1.0/) లైసెన్స్ కింద ఉన్నాయి.
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
@ -0,0 +1,39 @@
|
||||
<!--
|
||||
CO_OP_TRANSLATOR_METADATA:
|
||||
{
|
||||
"original_hash": "564445c39ad29a491abcb9356fc4d47d",
|
||||
"translation_date": "2025-12-19T15:28:32+00:00",
|
||||
"source_file": "4-Data-Science-Lifecycle/14-Introduction/assignment.md",
|
||||
"language_code": "te"
|
||||
}
|
||||
-->
|
||||
# డేటాసెట్ను అంచనా వేయడం
|
||||
|
||||
ఒక క్లయింట్ మీ బృందాన్ని న్యూయార్క్ సిటీలో టాక్సీ ప్రయాణికుల సీజనల్ ఖర్చుల అలవాట్లను పరిశీలించడంలో సహాయం కోసం సంప్రదించారు.
|
||||
|
||||
వారు తెలుసుకోవాలనుకుంటున్నారు: **న్యూయార్క్ సిటీలో పసుపు టాక్సీ ప్రయాణికులు శీతాకాలంలో లేదా వేసవిలో డ్రైవర్లకు ఎక్కువ టిప్ ఇస్తారా?**
|
||||
|
||||
మీ బృందం డేటా సైన్స్ లైఫ్సైకిల్ యొక్క [క్యాప్చరింగ్](Readme.md#Capturing) దశలో ఉంది మరియు మీరు డేటాసెట్ను నిర్వహించే బాధ్యత వహిస్తున్నారు. మీరు అన్వేషించడానికి ఒక నోట్బుక్ మరియు [డేటా](../../../../data/taxi.csv) అందజేయబడ్డాయి.
|
||||
|
||||
ఈ డైరెక్టరీలో [నోట్బుక్](notebook.ipynb) ఉంది, ఇది పాథాన్ ఉపయోగించి [NYC టాక్సీ & లిమోసిన్ కమిషన్](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets) నుండి పసుపు టాక్సీ ట్రిప్ డేటాను లోడ్ చేస్తుంది.
|
||||
మీరు టాక్సీ డేటా ఫైల్ను టెక్స్ట్ ఎడిటర్ లేదా ఎక్సెల్ వంటి స్ప్రెడ్షీట్ సాఫ్ట్వేర్లో కూడా తెరవవచ్చు.
|
||||
|
||||
## సూచనలు
|
||||
|
||||
- ఈ డేటాసెట్లోని డేటా ప్రశ్నకు సమాధానం ఇవ్వగలదా లేదా కాదా అని అంచనా వేయండి.
|
||||
- [NYC ఓపెన్ డేటా క్యాటలాగ్](https://data.cityofnewyork.us/browse?sortBy=most_accessed&utf8=%E2%9C%93) ను అన్వేషించండి. క్లయింట్ ప్రశ్నకు సమాధానం ఇవ్వడంలో సహాయపడగల మరో డేటాసెట్ను గుర్తించండి.
|
||||
- సమస్యను మరింత స్పష్టంగా అర్థం చేసుకోవడానికి మరియు క్లారిఫికేషన్ కోసం మీరు క్లయింట్కు అడగదలచుకున్న 3 ప్రశ్నలను రాయండి.
|
||||
|
||||
డేటా గురించి మరింత సమాచారం కోసం [డేటాసెట్ డిక్షనరీ](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) మరియు [యూజర్ గైడ్](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) ను చూడండి.
|
||||
|
||||
## రూబ్రిక్
|
||||
|
||||
ఉదాహరణాత్మకంగా | సరిపడా | మెరుగుదల అవసరం
|
||||
--- | --- | -- |
|
||||
|
||||
---
|
||||
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**అస్పష్టత**:
|
||||
ఈ పత్రాన్ని AI అనువాద సేవ [Co-op Translator](https://github.com/Azure/co-op-translator) ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
Loading…
Reference in new issue