You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

185 lines
22 KiB

<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "0764fd4077f3f04a1d968ec371227744",
"translation_date": "2025-09-06T11:50:12+00:00",
"source_file": "3-Data-Visualization/12-visualization-relationships/README.md",
"language_code": "my"
}
-->
# ဆက်ဆံရေးများကိုမြင်နိုင်စေခြင်း: ပျားရည်အကြောင်း 🍯
|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|ဆက်ဆံရေးများကိုမြင်နိုင်စေခြင်း - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
သဘာဝအပေါ်အာရုံစိုက်သော ကျွန်ုပ်တို့၏သုတေသနကို ဆက်လက်လုပ်ဆောင်ရင်း၊ အမျိုးမျိုးသောပျားရည်အမျိုးအစားများအကြား ဆက်ဆံရေးများကို ပြသနိုင်ရန် စိတ်ဝင်စားဖွယ်မြင်ကွင်းများကို ရှာဖွေကြမည်။ ဒီအချက်အလက်များကို [အမေရိကန်စိုက်ပျိုးရေးဌာန](https://www.nass.usda.gov/About_NASS/index.php) မှရရှိသော ဒေတာအရ ပြသထားပါသည်။
ဤဒေတာတွင် ၆၀၀ ကျော်သော အချက်အလက်များပါဝင်ပြီး အမေရိကန်ပြည်နယ်များတွင် ပျားရည်ထုတ်လုပ်မှုကို ပြသထားသည်။ ဥပမာအားဖြင့်၊ ၁၉၉၈-၂၀၁၂ ခုနှစ်အတွင်း တစ်နှစ်စီအတွက် တစ်ပြည်နယ်စီ၏ ပျားအုပ်အရေအတွက်၊ တစ်ပျားအုပ်၏ထွက်ရှိမှု၊ စုစုပေါင်းထုတ်လုပ်မှု၊ စတော့များ၊ တစ်ပေါင်စျေးနှုန်းနှင့် ထုတ်လုပ်မှုတန်ဖိုးတို့ကို ကြည့်နိုင်ပါသည်။
တစ်ပြည်နယ်၏ တစ်နှစ်စီထုတ်လုပ်မှုနှင့် ထိုပြည်နယ်ရှိ ပျားရည်စျေးနှုန်းအကြား ဆက်ဆံရေးကို မြင်နိုင်စေခြင်း စိတ်ဝင်စားဖွယ်ဖြစ်ပါသည်။ ဒါမှမဟုတ်၊ တစ်ပြည်နယ်စီ၏ တစ်ပျားအုပ်ထွက်ရှိမှုအကြား ဆက်ဆံရေးကို မြင်နိုင်စေခြင်းဖြစ်နိုင်ပါသည်။ ဤနှစ်အကွာအဝေးသည် ၂၀၀၆ ခုနှစ်တွင် ပထမဆုံးတွေ့ရှိခဲ့သော 'CCD' သို့မဟုတ် 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) ကိုလည်း ဖော်ပြထားသော ဒေတာဖြစ်ပြီး လေ့လာရန်အရေးကြီးသော ဒေတာဖြစ်သည်။ 🐝
## [Pre-lecture quiz](https://ff-quizzes.netlify.app/en/ds/quiz/22)
ဤသင်ခန်းစာတွင် သင်မကြာသေးမီက အသုံးပြုခဲ့သော Seaborn ကို အသုံးပြုနိုင်ပြီး အပြောင်းအလဲများအကြား ဆက်ဆံရေးများကို မြင်နိုင်စေသော စာကြည့်တိုက်ကောင်းတစ်ခုဖြစ်သည်။ အထူးသဖြင့် Seaborn ၏ `relplot` function ကို အသုံးပြုခြင်းဖြင့် scatter plots နှင့် line plots ကို အလွယ်တကူဖော်ဆောင်နိုင်ပြီး '[statistical relationships](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' ကို မြင်နိုင်စေသည်။ ဒါဟာ ဒေတာသိပ္ပံပညာရှင်များအတွက် အပြောင်းအလဲများအကြား ဆက်ဆံရေးကို ပိုမိုနားလည်စေသည်။
## Scatterplots
ပျားရည်စျေးနှုန်းသည် တစ်နှစ်စီ၊ တစ်ပြည်နယ်စီတွင် ဘယ်လိုပြောင်းလဲလာသည်ကို scatterplot ဖြင့် ပြသပါ။ Seaborn ၏ `relplot` ကို အသုံးပြုခြင်းဖြင့် ပြည်နယ်ဒေတာများကို အုပ်စုဖွဲ့ပြီး အမျိုးအစားနှင့် ကိန်းဂဏန်းဒေတာများအတွက် အချက်အလက်များကို ပြသနိုင်သည်။
ပျားရည်ဒေတာကို Seaborn နှင့်အတူ စတင်တင်သွင်းပါ:
```python
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
ပျားရည်ဒေတာတွင် နှစ်နှင့် တစ်ပေါင်စျေးနှုန်းတို့အပါအဝင် စိတ်ဝင်စားဖွယ်ကောင်းသော ကော်လံများရှိသည်ကို သတိပြုမိပါသည်။ အမေရိကန်ပြည်နယ်များအလိုက် အုပ်စုဖွဲ့ထားသော ဒေတာကို လေ့လာကြည့်ပါ:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
ပျားရည်တစ်ပေါင်စျေးနှုန်းနှင့် ၎င်း၏ အမေရိကန်ပြည်နယ်မူလအကြား ဆက်ဆံရေးကို ပြသရန် အခြေခံ scatterplot တစ်ခု ဖန်တီးပါ။ `y` axis ကို ပြည်နယ်အားလုံးကို ပြသနိုင်ရန် ရှည်လျားစေပါ:
```python
sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
```
![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.my.png)
ယခုနှစ်အလိုက် ပျားရည်စျေးနှုန်းသည် ဘယ်လိုပြောင်းလဲလာသည်ကို ပျားရည်အရောင်စနစ်ဖြင့် ပြသပါ။ ၎င်းကို 'hue' parameter ကို ထည့်သွင်းခြင်းဖြင့် ပြုလုပ်နိုင်ပြီး နှစ်အလိုက် ပြောင်းလဲမှုကို ပြသနိုင်သည်:
> ✅ Seaborn တွင် အသုံးပြုနိုင်သော [အရောင်ပလက်တီများ](https://seaborn.pydata.org/tutorial/color_palettes.html) အကြောင်းပိုမိုလေ့လာပါ - လှပသော rainbow အရောင်စနစ်ကို စမ်းကြည့်ပါ!
```python
sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5);
```
![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.my.png)
ဤအရောင်စနစ်ပြောင်းလဲမှုဖြင့် ပျားရည်တစ်ပေါင်စျေးနှုန်းသည် နှစ်အလိုက် အားကောင်းစွာတိုးတက်လာသည်ကို မြင်နိုင်ပါသည်။ အမှန်တကယ်၊ ဒေတာထဲမှ နမူနာတစ်ခုကို စစ်ဆေးပါက (ဥပမာအားဖြင့် Arizona) နှစ်အလိုက် စျေးနှုန်းတိုးတက်မှုပုံစံကို အချို့သောကိစ္စများမှလွဲ၍ မြင်နိုင်ပါသည်:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
အရောင်မမြင်နိုင်သောသူများအတွက် အရောင်အစား dot size ကို အသုံးပြုခြင်းသည် ပိုမိုကောင်းမွန်နိုင်သည်။ dot circumference တိုးတက်မှုဖြင့် စျေးနှုန်းတိုးတက်မှုကို ပြသရန် visualization ကို ပြင်ဆင်ပါ:
```python
sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5);
```
dot size များသည် တဖြည်းဖြည်းကြီးလာသည်ကို မြင်နိုင်ပါသည်။
![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.my.png)
ဤသည်မှာ supply နှင့် demand ရိုးရှင်းသောအကြောင်းအရာဖြစ်ပါသလား။ ရာသီဥတုပြောင်းလဲမှုနှင့် colony collapse ကဲ့သို့သောအကြောင်းအရာများကြောင့် နှစ်အလိုက် ဝယ်ယူနိုင်သော ပျားရည်ပမာဏလျော့နည်းလာပြီး စျေးနှုန်းတိုးတက်လာပါသလား။
ဤဒေတာတွင် အချို့သောအပြောင်းအလဲများအကြား ဆက်ဆံရေးကို ရှာဖွေရန် line charts များကို လေ့လာကြည့်ပါ။
## Line charts
မေးခွန်း- ပျားရည်တစ်ပေါင်စျေးနှုန်းသည် နှစ်အလိုက် တိုးတက်မှုရှိပါသလား။ single line chart တစ်ခုဖန်တီးခြင်းဖြင့် အလွယ်တကူရှာဖွေနိုင်ပါသည်။
```python
sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
```
အဖြေ- ဟုတ်ပါသည်၊ ၂၀၀၃ ခုနှစ်အနီးတွင် အချို့သောကွဲလွဲမှုများရှိသည်။
![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.my.png)
✅ Seaborn သည် တစ်ခုတည်းသောလိုင်းပေါ်တွင် ဒေတာကို စုစည်းထားပြီး "x value တစ်ခုစီတွင် အမျိုးမျိုးသောတိုင်းတာမှုများကို mean နှင့် mean အပေါ် 95% confidence interval ကို ပြသခြင်းဖြင့်" ဖော်ပြသည်။ [အရင်းအမြစ်](https://seaborn.pydata.org/tutorial/relational.html)။ ဤအချိန်စားသောအပြုအမူကို `ci=None` ထည့်သွင်းခြင်းဖြင့် ပယ်ဖျက်နိုင်သည်။
မေးခွန်း- ၂၀၀၃ ခုနှစ်တွင် ပျားရည်ပမာဏတက်လာမှုကိုလည်း မြင်နိုင်ပါသလား။ နှစ်အလိုက် စုစုပေါင်းထုတ်လုပ်မှုကို ကြည့်ပါ။
```python
sns.relplot(x="year", y="totalprod", kind="line", data=honey);
```
![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.my.png)
အဖြေ- အမှန်တကယ်မဟုတ်ပါ။ စုစုပေါင်းထုတ်လုပ်မှုကို ကြည့်ပါက ထိုနှစ်တွင် တိုးတက်လာသလိုပုံရပြီး၊ ယေဘူယျအားဖြင့် ထိုနှစ်များအတွင်း ပျားရည်ထုတ်လုပ်မှုပမာဏသည် လျော့နည်းလာသည်ကို မြင်နိုင်ပါသည်။
မေးခွန်း- ထိုကွာဟမှုကို ၂၀၀၃ ခုနှစ်တွင် ပျားရည်စျေးနှုန်းတက်လာမှုအကြောင်းရင်းဖြစ်စေသောအရာများကို ရှာဖွေပါ။
ဤအကြောင်းကို facet grid ကို အသုံးပြု၍ ရှာဖွေပါ။
## Facet grids
Facet grids သည် ဒေတာ၏ တစ်ခုတည်းသော facet ကို (ဤကိစ္စတွင် 'year' ကို ရွေးချယ်ပါ) အသုံးပြု၍ သင့်ရွေးချယ်ထားသော x နှင့် y coordinates အတွက် plot တစ်ခုစီကို ဖန်တီးနိုင်သည်။ ၂၀၀၃ ခုနှစ်သည် ဤမျိုးအမျိုးခြားခြင်းတွင် ထူးထူးခြားခြားပေါ်လွင်ပါသလား။
Seaborn ၏ [FacetGrid documentation](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) မှ အကြံပြုထားသော `relplot` ကို ဆက်လက်အသုံးပြု၍ facet grid တစ်ခုဖန်တီးပါ။
```python
sns.relplot(
data=honey,
x="yieldpercol", y="numcol",
col="year",
col_wrap=3,
kind="line"
)
```
ဤ visualization တွင် yield per colony နှင့် number of colonies ကို နှစ်အလိုက်၊ ပြည်နယ်အလိုက် wrap ကို 3 column အဖြစ်ထားပြီး ဘက်ဘက်ကွဲကွဲနှိုင်းယှဉ်နိုင်သည်။
![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.my.png)
ဤဒေတာအတွက်၊ နှစ်အလိုက်၊ ပြည်နယ်အလိုက် number of colonies နှင့် yield အကြား ထူးထူးခြားခြားသောအရာများမရှိပါ။ ဤ variable နှစ်ခုအကြား correlation ရှာဖွေခြင်းအတွက် အခြားနည်းလမ်းတစ်ခုရှိပါသလား။
## Dual-line Plots
Seaborn ၏ 'despine' ကို အသုံးပြု၍ ထိပ်နှင့်ညာဘက် spines ကို ဖယ်ရှားပြီး Matplotlib မှ [ax.twinx](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) ကို အသုံးပြု၍ multiline plot တစ်ခုကို စမ်းကြည့်ပါ။ Twinx သည် chart တစ်ခုကို x axis ကိုမျှဝေပြီး y axes နှစ်ခုကို ပြသနိုင်သည်။ yield per colony နှင့် number of colonies ကို superimposed ပြသပါ:
```python
fig, ax = plt.subplots(figsize=(12,6))
lineplot = sns.lineplot(x=honey['year'], y=honey['numcol'], data=honey,
label = 'Number of bee colonies', legend=False)
sns.despine()
plt.ylabel('# colonies')
plt.title('Honey Production Year over Year');
ax2 = ax.twinx()
lineplot2 = sns.lineplot(x=honey['year'], y=honey['yieldpercol'], ax=ax2, color="r",
label ='Yield per colony', legend=False)
sns.despine(right=False)
plt.ylabel('colony yield')
ax.figure.legend();
```
![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.my.png)
၂၀၀၃ ခုနှစ်အနီးတွင် ထူးထူးခြားခြားသောအရာများ မမြင်ရသော်လည်း၊ lesson ၏အဆုံးကို ပျော်ရွှင်စွာပြီးမြောက်စေသောအချက်တစ်ခုကို ပြသနိုင်သည်- colonies အရေအတွက်သည် လျော့နည်းနေသော်လည်း၊ ၎င်းတို့၏ yield per colony လျော့နည်းနေသည့်အချိန်တွင် colonies အရေအတွက်သည် တည်ငြိမ်နေသည်။
ပျားများအားပေးပါ။
🐝❤️
## 🚀 စိန်ခေါ်မှု
ဤသင်ခန်းစာတွင် scatterplots နှင့် line grids ၏ အခြားအသုံးများအကြောင်း၊ facet grids အပါအဝင် သင်လေ့လာခဲ့ပါသည်။ ယခင်သင်ခန်းစာများတွင် အသုံးပြုခဲ့သော ဒေတာတစ်ခုကို အသုံးပြု၍ facet grid တစ်ခုဖန်တီးရန် ကိုယ်တိုင်စိန်ခေါ်ပါ။ ၎င်းတို့ကို ဖန်တီးရန် ကြာမြင့်ချိန်နှင့် grid များအရေအတွက်ကို သတိထားရန်လိုအပ်သည်ကို သတိပြုပါ။
## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## ပြန်လည်သုံးသပ်ခြင်းနှင့် ကိုယ်တိုင်လေ့လာခြင်း
Line plots များသည် ရိုးရှင်းသည့်အရာဖြစ်နိုင်သလို အလွန်ရှုပ်ထွေးနိုင်ပါသည်။ [Seaborn documentation](https://seaborn.pydata.org/generated/seaborn.lineplot.html) တွင် ဖော်ပြထားသော အမျိုးမျိုးသောနည်းလမ်းများကို ဖတ်ရှုပါ။ သင်ဤသင်ခန်းစာတွင် ဖန်တီးခဲ့သော line charts များကို documentation တွင်ဖော်ပြထားသော အခြားနည်းလမ်းများဖြင့် တိုး
---
**အကြောင်းကြားချက်**:
ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု [Co-op Translator](https://github.com/Azure/co-op-translator) ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေသော်လည်း၊ အလိုအလျောက် ဘာသာပြန်ခြင်းတွင် အမှားများ သို့မဟုတ် မတိကျမှုများ ပါဝင်နိုင်သည်ကို သတိပြုပါ။ မူရင်းဘာသာစကားဖြင့် ရေးသားထားသော စာရွက်စာတမ်းကို အာဏာရှိသော ရင်းမြစ်အဖြစ် သတ်မှတ်သင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူ့ဘာသာပြန်ပညာရှင်များမှ ပရော်ဖက်ရှင်နယ် ဘာသာပြန်ခြင်းကို အကြံပြုပါသည်။ ဤဘာသာပြန်ကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအလွဲအချော်များ သို့မဟုတ် အနားယူမှုမှားများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။