|
|
1 month ago | |
|---|---|---|
| .. | ||
| README.md | 1 month ago | |
README.md
உறவுகளை காட்சிப்படுத்துதல்: தேனின் அழகிய உலகம் 🍯
![]() |
|---|
| உறவுகளை காட்சிப்படுத்துதல் - Sketchnote by @nitya |
எங்கள் ஆராய்ச்சியின் இயற்கை மையத்தை தொடர்ந்தும், அமெரிக்க வேளாண்மை துறை United States Department of Agriculture வழங்கிய தரவுத்தொகுப்பின் அடிப்படையில், பல்வேறு வகையான தேனின் உறவுகளை காட்சிப்படுத்துவதற்கான சுவாரஸ்யமான முறைகளை கண்டறிவோம்.
இந்த 600 பொருட்கள் கொண்ட தரவுத்தொகுப்பு அமெரிக்காவின் பல மாநிலங்களில் தேன் உற்பத்தியை காட்டுகிறது. உதாரணமாக, 1998-2012 காலகட்டத்தில் ஒவ்வொரு மாநிலத்திற்கும் ஆண்டுக்கு ஒரு வரிசை கொண்ட இந்த தரவுத்தொகுப்பில், கொள்கலன்களின் எண்ணிக்கை, ஒவ்வொரு கொள்கலனின் உற்பத்தி, மொத்த உற்பத்தி, கையிருப்பு, ஒரு பவுண்டுக்கு விலை மற்றும் உற்பத்தி மதிப்பு ஆகியவற்றை காணலாம்.
ஒரு மாநிலத்தின் ஆண்டுதோறும் உற்பத்தி மற்றும் அந்த மாநிலத்தில் தேனின் விலை ஆகியவற்றின் உறவுகளை காட்சிப்படுத்துவது சுவாரஸ்யமாக இருக்கும். மாற்றாக, ஒவ்வொரு கொள்கலனின் தேன் உற்பத்தி மற்றும் மாநிலங்களின் உறவுகளை காட்சிப்படுத்தலாம். இந்த காலகட்டம் 2006-ல் முதன்முதலாக கண்டறியப்பட்ட 'CCD' அல்லது 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) எனும் அழிவை உள்ளடக்கியதால், இது ஆய்வு செய்ய முக்கியமான தரவுத்தொகுப்பாகும். 🐝
முன்-வகுப்பு வினாடி வினா
இந்த பாடத்தில், நீங்கள் ggplot2-ஐ பயன்படுத்தலாம், இது மாறிகள் இடையேயான உறவுகளை காட்சிப்படுத்த ஒரு சிறந்த நூலகமாகும். குறிப்பாக, ggplot2-இன் geom_point மற்றும் qplot செயல்பாடுகளை பயன்படுத்தி 'statistical relationships' எனப்படும் புள்ளி மற்றும் கோடு வரைபடங்களை விரைவாக உருவாக்கலாம், இது தரவியல் விஞ்ஞானிகளுக்கு மாறிகள் எப்படி தொடர்புடையவை என்பதைப் புரிந்துகொள்ள உதவுகிறது.
புள்ளி வரைபடங்கள்
ஒவ்வொரு மாநிலத்திலும் ஆண்டுதோறும் தேனின் விலை எப்படி மாறியுள்ளது என்பதை காட்ட புள்ளி வரைபடத்தை பயன்படுத்துங்கள். ggplot2, ggplot மற்றும் geom_point ஆகியவற்றை பயன்படுத்தி, மாநில தரவுகளைத் தொகுத்து, வகை மற்றும் எண் தரவுகளுக்கான புள்ளிகளை காட்சிப்படுத்துகிறது.
முதலில் தரவுகளை இறக்குமதி செய்து Seaborn-ஐ தொடங்குங்கள்:
honey=read.csv('../../data/honey.csv')
head(honey)
இந்த தேன் தரவுகளில் ஆண்டு மற்றும் ஒரு பவுண்டுக்கு விலை போன்ற பல சுவாரஸ்யமான பத்திகள் உள்ளன. இந்த தரவுகளை, அமெரிக்க மாநிலங்களின் அடிப்படையில் தொகுத்து ஆராயுங்கள்:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|---|---|---|---|---|---|---|---|
| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
| FL | 230000 | 98 | 22540000 | 4508000 | 0.64 | 14426000 | 1998 |
தேனின் ஒரு பவுண்டுக்கு விலை மற்றும் அதன் அமெரிக்க மாநிலத்தின் உறவுகளை காட்ட ஒரு அடிப்படை புள்ளி வரைபடத்தை உருவாக்குங்கள். அனைத்து மாநிலங்களையும் காட்சிப்படுத்த y அச்சை போதுமான உயரமாக அமைக்கவும்:
library(ggplot2)
ggplot(honey, aes(x = priceperlb, y = state)) +
geom_point(colour = "blue")
இப்போது, ஆண்டுதோறும் தேனின் விலை எப்படி மாறுகிறது என்பதை தேன் நிறத்துடன் காட்டுங்கள். இதை 'scale_color_gradientn' பராமeter-ஐ சேர்த்து, ஆண்டுதோறும் மாற்றத்தை காட்சிப்படுத்தலாம்:
✅ scale_color_gradientn பற்றி மேலும் அறிக - ஒரு அழகான வானவில் நிறத்திட்டத்தை முயற்சிக்கவும்!
ggplot(honey, aes(x = priceperlb, y = state, color=year)) +
geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7))
இந்த நிறத்திட்ட மாற்றத்துடன், ஆண்டுதோறும் தேனின் விலை ஒரு பவுண்டுக்கு அதிகரித்திருப்பது தெளிவாக தெரிகிறது. உண்மையில், தரவுகளில் ஒரு மாதிரியைப் பாருங்கள் (அரிசோனா மாநிலத்தை எடுத்துக்கொள்ளுங்கள்), சில விதிவிலக்குகளைத் தவிர, ஆண்டுதோறும் விலை அதிகரிக்கும் முறைபாட்டை நீங்கள் காணலாம்:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
|---|---|---|---|---|---|---|---|
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
நிறமாற்றத்திற்கு பதிலாக அளவை பயன்படுத்துவது மற்றொரு வழியாகும். நிறக்குறைபாடு உள்ள பயனர்களுக்கு இது சிறந்த விருப்பமாக இருக்கலாம். விலையினை புள்ளியின் சுற்றளவினை அதிகரிப்பதன் மூலம் காட்சிப்படுத்த உங்கள் காட்சிப்படுத்தலைத் திருத்துங்கள்:
ggplot(honey, aes(x = priceperlb, y = state)) +
geom_point(aes(size = year),colour = "blue") +
scale_size_continuous(range = c(0.25, 3))
புள்ளிகளின் அளவு تدريجமாக அதிகரிப்பதை நீங்கள் காணலாம்.
இது ஒரு எளிய தேவைக்கும் வழங்கலுக்கும் இடையேயான உறவா? காலநிலை மாற்றம் மற்றும் கொள்கலன்களின் அழிவு போன்ற காரணங்களால், ஆண்டுதோறும் வாங்குவதற்கு தேன் குறைவாக உள்ளதா, அதனால் விலை அதிகரிக்கிறதா?
இந்த தரவுத்தொகுப்பில் சில மாறிகளுக்கு இடையேயான தொடர்பை கண்டறிய, சில கோடு வரைபடங்களை ஆராய்வோம்.
கோடு வரைபடங்கள்
கேள்வி: ஆண்டுதோறும் தேனின் விலை ஒரு பவுண்டுக்கு தெளிவாக அதிகரிக்கிறதா? அதை ஒரு கோடு வரைபடம் மூலம் எளிதாகக் கண்டறியலாம்:
qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab = "priceperlb")
பதில்: ஆம், 2003 ஆம் ஆண்டைச் சுற்றியுள்ள சில விதிவிலக்குகளுடன்:
கேள்வி: 2003 ஆம் ஆண்டில் தேன் வழங்கலில் ஒரு உச்சம் காண முடியுமா? ஆண்டுதோறும் மொத்த உற்பத்தியைப் பாருங்கள்:
qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod")
பதில்: அவ்வாறு இல்லை. மொத்த உற்பத்தியைப் பாருங்கள், குறிப்பிட்ட ஆண்டில் அது அதிகரித்திருப்பது போலவே தெரிகிறது, ஆனால் பொதுவாக இந்த ஆண்டுகளில் தேன் உற்பத்தி குறைந்து கொண்டிருக்கிறது.
கேள்வி: அப்படியென்றால், 2003 ஆம் ஆண்டில் தேனின் விலையின் உச்சத்தை ஏற்படுத்திய காரணம் என்ன?
இதைக் கண்டறிய, நீங்கள் ஒரு Facet Grid-ஐ ஆராயலாம்.
Facet Grids
Facet Grids உங்கள் தரவுத்தொகுப்பின் ஒரு அம்சத்தை (எங்கள் வழக்கில், 'ஆண்டு' என்பதைத் தேர்ந்தெடுக்கலாம்) எடுத்துக்கொள்கிறது. Seaborn உங்கள் தேர்ந்தெடுத்த x மற்றும் y இணக்கங்கள் மூலம் ஒவ்வொரு அம்சத்திற்கும் ஒரு வரைபடத்தை உருவாக்குகிறது, இது ஒப்பீட்டை எளிதாக்குகிறது. இந்த வகையான ஒப்பீட்டில் 2003 standout ஆகிறதா?
ggplot2-இன் ஆவணத்தில் பரிந்துரைக்கப்பட்ட facet_wrap ஐப் பயன்படுத்தி ஒரு Facet Grid உருவாக்குங்கள்.
ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) +
geom_line() + facet_wrap(vars(year))
இந்த காட்சிப்படுத்தலில், ஒவ்வொரு ஆண்டும் ஒவ்வொரு மாநிலமும் கொள்கலனின் உற்பத்தி மற்றும் எண்ணிக்கையை ஒப்பிடலாம், 3 க்கான நெடுவரிசை அமைப்புடன்:
இந்த தரவுத்தொகுப்பில், ஒவ்வொரு ஆண்டும் ஒவ்வொரு மாநிலமும் கொள்கலன்களின் எண்ணிக்கை மற்றும் அவற்றின் உற்பத்தியில் குறிப்பிடத்தக்க மாற்றம் எதுவும் இல்லை. இந்த இரண்டு மாறிகளுக்கு இடையேயான தொடர்பை கண்டறிய வேறொரு வழி இருக்கிறதா?
இரட்டை கோடு வரைபடங்கள்
R-இன் par மற்றும் plot செயல்பாடுகளைப் பயன்படுத்தி இரண்டு கோடு வரைபடங்களை ஒன்றின் மேல் ஒன்றாக ஒட்டிய ஒரு பல்கோடு வரைபடத்தை முயற்சிக்கவும். x அச்சில் ஆண்டை வரைபடம் செய்யவும், இரண்டு y அச்சுகளை காட்சிப்படுத்தவும். கொள்கலனின் உற்பத்தி மற்றும் கொள்கலன்களின் எண்ணிக்கையை காட்சிப்படுத்துங்கள்:
par(mar = c(5, 4, 4, 4) + 0.3)
plot(honey$year, honey$numcol, pch = 16, col = 2,type="l")
par(new = TRUE)
plot(honey$year, honey$yieldpercol, pch = 17, col = 3,
axes = FALSE, xlab = "", ylab = "",type="l")
axis(side = 4, at = pretty(range(y2)))
mtext("colony yield", side = 4, line = 3)
2003 ஆம் ஆண்டைச் சுற்றி கண்களுக்கு எதுவும் தெரியவில்லை, ஆனால் இது இந்த பாடத்தை ஒரு சிறிய மகிழ்ச்சியான குறிப்பில் முடிக்க அனுமதிக்கிறது: கொள்கலன்களின் எண்ணிக்கை குறைந்து கொண்டிருப்பதுடன், அவற்றின் உற்பத்தி குறைந்தாலும், கொள்கலன்களின் எண்ணிக்கை நிலைத்திருக்கிறது.
பூச்சிகள் வாழ்க!
🐝❤️
🚀 சவால்
இந்த பாடத்தில், நீங்கள் புள்ளி வரைபடங்கள் மற்றும் Facet Grids உட்பட பல்வேறு பயன்பாடுகளைப் பற்றி மேலும் அறிந்தீர்கள். இந்த தொழில்நுட்பங்களைப் பயன்படுத்தி, முந்தைய பாடங்களில் நீங்கள் பயன்படுத்திய வேறு ஒரு தரவுத்தொகுப்பைப் பயன்படுத்தி ஒரு Facet Grid உருவாக்க சவால் விடுங்கள். அவற்றை உருவாக்க எவ்வளவு நேரம் எடுத்துக்கொள்கிறது என்பதை கவனிக்கவும், இந்த முறைகளைப் பயன்படுத்தும்போது நீங்கள் வரைபடங்களை எவ்வளவு கவனமாக உருவாக்க வேண்டும் என்பதை கவனிக்கவும்.
பாடத்திற்குப் பின் வினாடி வினா
மதிப்பீடு & சுயபயிற்சி
கோடு வரைபடங்கள் எளிமையானவையாகவோ அல்லது மிகவும் சிக்கலானவையாகவோ இருக்கலாம். ggplot2 ஆவணத்தில் கொடுக்கப்பட்டுள்ள பல்வேறு முறைகளைப் பற்றி கொஞ்சம் படிக்கவும். இந்த பாடத்தில் நீங்கள் உருவாக்கிய கோடு வரைபடங்களை ஆவணத்தில் பட்டியலிடப்பட்டுள்ள பிற முறைகளுடன் மேம்படுத்த முயற்சிக்கவும்.
பணிக்கட்டளை
குறிப்பு:
இந்த ஆவணம் Co-op Translator என்ற AI மொழிபெயர்ப்பு சேவையைப் பயன்படுத்தி மொழிபெயர்க்கப்பட்டுள்ளது. நாங்கள் துல்லியத்திற்காக முயற்சிக்கின்றோம், ஆனால் தானியக்க மொழிபெயர்ப்புகளில் பிழைகள் அல்லது தவறான தகவல்கள் இருக்கக்கூடும் என்பதை தயவுசெய்து கவனத்தில் கொள்ளுங்கள். அதன் தாய்மொழியில் உள்ள மூல ஆவணம் அதிகாரப்பூர்வ ஆதாரமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிபெயர்ப்பு பரிந்துரைக்கப்படுகிறது. இந்த மொழிபெயர்ப்பைப் பயன்படுத்துவதால் ஏற்படும் எந்த தவறான புரிதல்கள் அல்லது தவறான விளக்கங்களுக்கு நாங்கள் பொறுப்பல்ல.







