diff --git a/translations/ar/3-Data-Visualization/12-visualization-relationships/README.md b/translations/ar/3-Data-Visualization/12-visualization-relationships/README.md index 288678b3..f22e6f4e 100644 --- a/translations/ar/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/ar/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,33 +1,33 @@ # تصور العلاقات: كل شيء عن العسل 🍯 -|![رسم توضيحي من [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/12-Visualizing-Relationships.png)| +|![ رسم توضيحي بواسطة [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|تصور العلاقات - _رسم توضيحي من [@nitya](https://twitter.com/nitya)_ | +|تصور العلاقات - _رسم توضيحي بواسطة [@nitya](https://twitter.com/nitya)_ | -استمرارًا في التركيز على الطبيعة في بحثنا، دعونا نستكشف تصورات مثيرة للاهتمام لعرض العلاقات بين أنواع العسل المختلفة، استنادًا إلى مجموعة بيانات مستمدة من [وزارة الزراعة الأمريكية](https://www.nass.usda.gov/About_NASS/index.php). +استمرارًا في التركيز على الطبيعة في بحثنا، دعونا نكتشف تصورات مثيرة للاهتمام لعرض العلاقات بين أنواع العسل المختلفة، وفقًا لمجموعة بيانات مستمدة من [وزارة الزراعة الأمريكية](https://www.nass.usda.gov/About_NASS/index.php). -تتضمن هذه المجموعة حوالي 600 عنصر تعرض إنتاج العسل في العديد من الولايات الأمريكية. على سبيل المثال، يمكنك الاطلاع على عدد المستعمرات، الإنتاجية لكل مستعمرة، إجمالي الإنتاج، المخزون، السعر لكل رطل، وقيمة العسل المنتج في ولاية معينة من عام 1998 إلى 2012، مع صف واحد لكل سنة لكل ولاية. +تتضمن هذه المجموعة حوالي 600 عنصر تعرض إنتاج العسل في العديد من الولايات الأمريكية. على سبيل المثال، يمكنك النظر في عدد المستعمرات، الإنتاج لكل مستعمرة، الإنتاج الإجمالي، المخزون، السعر لكل رطل، وقيمة العسل المنتج في ولاية معينة من عام 1998 إلى 2012، مع صف واحد لكل سنة لكل ولاية. -سيكون من المثير تصور العلاقة بين إنتاج ولاية معينة في سنة معينة وبين، على سبيل المثال، سعر العسل في تلك الولاية. بدلاً من ذلك، يمكنك تصور العلاقة بين إنتاجية العسل لكل مستعمرة في الولايات المختلفة. تغطي هذه الفترة الزمنية ظهور ظاهرة انهيار المستعمرات (CCD) التي شوهدت لأول مرة في عام 2006 (http://npic.orst.edu/envir/ccd.html)، مما يجعلها مجموعة بيانات مؤثرة للدراسة. 🐝 +سيكون من المثير تصور العلاقة بين إنتاج ولاية معينة سنويًا وبين، على سبيل المثال، سعر العسل في تلك الولاية. أو بدلاً من ذلك، يمكنك تصور العلاقة بين إنتاج العسل لكل مستعمرة في الولايات المختلفة. تغطي هذه الفترة الزمنية ظهور "اضطراب انهيار المستعمرات" أو "CCD" الذي شوهد لأول مرة في عام 2006 (http://npic.orst.edu/envir/ccd.html)، لذا فهي مجموعة بيانات مؤثرة للدراسة. 🐝 ## [اختبار ما قبل المحاضرة](https://ff-quizzes.netlify.app/en/ds/quiz/22) -في هذا الدرس، يمكنك استخدام مكتبة Seaborn، التي استخدمتها من قبل، كأداة رائعة لتصور العلاقات بين المتغيرات. من المثير للاهتمام بشكل خاص استخدام وظيفة `relplot` في Seaborn التي تتيح إنشاء مخططات نقطية وخطية بسرعة لتصور '[العلاقات الإحصائية](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)'، مما يساعد عالم البيانات على فهم كيفية ارتباط المتغيرات ببعضها البعض. +في هذه الدرس، يمكنك استخدام مكتبة Seaborn، التي استخدمتها من قبل، كأداة جيدة لتصور العلاقات بين المتغيرات. من الأمور المثيرة للاهتمام استخدام وظيفة `relplot` في Seaborn التي تسمح بإنشاء مخططات التبعثر والمخططات الخطية لتصور "[العلاقات الإحصائية](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)" بسرعة، مما يساعد عالم البيانات على فهم كيفية ارتباط المتغيرات ببعضها البعض. -## المخططات النقطية +## مخططات التبعثر -استخدم مخططًا نقطيًا لعرض كيفية تطور سعر العسل عامًا بعد عام لكل ولاية. تسهل Seaborn، باستخدام `relplot`، تجميع بيانات الولايات وعرض النقاط للبيانات الفئوية والعددية. +استخدم مخطط التبعثر لعرض كيفية تطور سعر العسل عامًا بعد عام لكل ولاية. تقوم Seaborn، باستخدام `relplot`، بتجميع بيانات الولايات وعرض نقاط البيانات لكل من البيانات الفئوية والرقمية. -لنبدأ باستيراد البيانات ومكتبة Seaborn: +لنبدأ باستيراد البيانات وSeaborn: ```python import pandas as pd @@ -38,93 +38,93 @@ honey.head() ``` ستلاحظ أن بيانات العسل تحتوي على عدة أعمدة مثيرة للاهتمام، بما في ذلك السنة والسعر لكل رطل. دعونا نستكشف هذه البيانات، مجمعة حسب الولايات الأمريكية: -| الولاية | عدد المستعمرات | الإنتاجية لكل مستعمرة | إجمالي الإنتاج | المخزون | السعر لكل رطل | قيمة الإنتاج | السنة | -|---------|----------------|-----------------------|----------------|-----------|---------------|--------------|-------| -| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | -| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | -| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | +| الولاية | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | السنة | +| ------- | ------ | ----------- | --------- | -------- | ---------- | --------- | ----- | +| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | +| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | +| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -قم بإنشاء مخطط نقطي أساسي لعرض العلاقة بين السعر لكل رطل من العسل وولاية المنشأ. اجعل المحور `y` طويلًا بما يكفي لعرض جميع الولايات: +قم بإنشاء مخطط تبعثر أساسي لعرض العلاقة بين السعر لكل رطل من العسل وولاية المنشأ. اجعل المحور `y` طويلًا بما يكفي لعرض جميع الولايات: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.ar.png) -الآن، اعرض نفس البيانات باستخدام نظام ألوان مستوحى من العسل لإظهار كيفية تطور السعر على مر السنين. يمكنك القيام بذلك عن طريق إضافة معلمة 'hue' لإظهار التغيير عامًا بعد عام: +الآن، اعرض نفس البيانات باستخدام نظام ألوان يشبه العسل لعرض كيفية تطور السعر على مدار السنوات. يمكنك القيام بذلك عن طريق إضافة معلمة 'hue' لعرض التغيير عامًا بعد عام: -> ✅ تعرف على المزيد حول [لوحات الألوان التي يمكنك استخدامها في Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - جرب لوحة ألوان قوس قزح الجميلة! +> ✅ تعرف على المزيد حول [أنظمة الألوان التي يمكنك استخدامها في Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - جرب نظام ألوان قوس قزح الجميل! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) - -مع هذا التغيير في نظام الألوان، يمكنك أن ترى بوضوح أن هناك تقدمًا قويًا على مر السنين فيما يتعلق بسعر العسل لكل رطل. في الواقع، إذا نظرت إلى مجموعة بيانات عينة للتحقق (اختر ولاية معينة، مثل أريزونا)، يمكنك رؤية نمط لزيادة الأسعار عامًا بعد عام، مع بعض الاستثناءات: - -| الولاية | عدد المستعمرات | الإنتاجية لكل مستعمرة | إجمالي الإنتاج | المخزون | السعر لكل رطل | قيمة الإنتاج | السنة | -|---------|----------------|-----------------------|----------------|----------|---------------|--------------|-------| -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | -| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | -| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | -| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | -| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | -| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | -| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | -| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | -| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | -| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | -| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | -| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | -| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | -| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | - -طريقة أخرى لتصور هذا التقدم هي استخدام الحجم بدلاً من اللون. بالنسبة للمستخدمين الذين يعانون من عمى الألوان، قد تكون هذه الطريقة أفضل. قم بتعديل التصور لإظهار زيادة السعر من خلال زيادة محيط النقطة: +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.ar.png) + +مع هذا التغيير في نظام الألوان، يمكنك أن ترى بوضوح تقدمًا قويًا على مدار السنوات فيما يتعلق بسعر العسل لكل رطل. بالفعل، إذا نظرت إلى مجموعة بيانات للتحقق (اختر ولاية معينة، مثل أريزونا)، يمكنك رؤية نمط زيادة الأسعار عامًا بعد عام، مع بعض الاستثناءات: + +| الولاية | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | السنة | +| ------- | ------ | ----------- | --------- | ------- | ---------- | --------- | ----- | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | +| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | +| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | +| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | +| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | +| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | +| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | +| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | +| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | +| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | +| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | +| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | +| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | +| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | + +طريقة أخرى لتصور هذا التقدم هي استخدام الحجم بدلاً من اللون. بالنسبة للمستخدمين الذين يعانون من عمى الألوان، قد تكون هذه الطريقة خيارًا أفضل. قم بتعديل التصور لعرض زيادة السعر من خلال زيادة محيط النقاط: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` يمكنك رؤية حجم النقاط يزداد تدريجيًا. -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.ar.png) هل هذا مجرد حالة بسيطة من العرض والطلب؟ بسبب عوامل مثل تغير المناخ وانهيار المستعمرات، هل هناك كمية أقل من العسل المتاحة للشراء عامًا بعد عام، وبالتالي ترتفع الأسعار؟ -لاكتشاف العلاقة بين بعض المتغيرات في هذه المجموعة، دعونا نستكشف بعض المخططات الخطية. +لاكتشاف العلاقة بين بعض المتغيرات في هذه المجموعة من البيانات، دعونا نستكشف بعض المخططات الخطية. ## المخططات الخطية -سؤال: هل هناك ارتفاع واضح في سعر العسل لكل رطل عامًا بعد عام؟ يمكنك اكتشاف ذلك بسهولة عن طريق إنشاء مخطط خطي واحد: +السؤال: هل هناك ارتفاع واضح في سعر العسل لكل رطل عامًا بعد عام؟ يمكنك اكتشاف ذلك بسهولة عن طريق إنشاء مخطط خطي واحد: ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` الإجابة: نعم، مع بعض الاستثناءات حول عام 2003: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.ar.png) -✅ لأن Seaborn يقوم بتجميع البيانات حول خط واحد، فإنه يعرض "القياسات المتعددة عند كل قيمة x عن طريق رسم المتوسط وفاصل الثقة بنسبة 95% حول المتوسط". [المصدر](https://seaborn.pydata.org/tutorial/relational.html). يمكن تعطيل هذا السلوك الذي يستغرق وقتًا بإضافة `ci=None`. +✅ لأن Seaborn يقوم بتجميع البيانات حول خط واحد، فإنه يعرض "القياسات المتعددة عند كل قيمة x عن طريق رسم المتوسط وفاصل الثقة بنسبة 95% حول المتوسط". [المصدر](https://seaborn.pydata.org/tutorial/relational.html). يمكن تعطيل هذا السلوك الذي يستغرق وقتًا عن طريق إضافة `ci=None`. -سؤال: حسنًا، في عام 2003، هل يمكننا أيضًا رؤية زيادة في إمدادات العسل؟ ماذا لو نظرت إلى إجمالي الإنتاج عامًا بعد عام؟ +السؤال: حسنًا، في عام 2003 هل يمكننا أيضًا رؤية زيادة في كمية العسل المتوفرة؟ ماذا لو نظرت إلى الإنتاج الإجمالي عامًا بعد عام؟ ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.ar.png) -الإجابة: ليس حقًا. إذا نظرت إلى إجمالي الإنتاج، يبدو أنه زاد في تلك السنة المحددة، على الرغم من أن كمية العسل المنتجة بشكل عام كانت في انخفاض خلال هذه السنوات. +الإجابة: ليس حقًا. إذا نظرت إلى الإنتاج الإجمالي، يبدو أنه قد زاد في ذلك العام تحديدًا، على الرغم من أن كمية العسل المنتجة عمومًا في انخفاض خلال هذه السنوات. -سؤال: في هذه الحالة، ما الذي يمكن أن يكون قد تسبب في ارتفاع سعر العسل حوالي عام 2003؟ +السؤال: في هذه الحالة، ما الذي يمكن أن يكون سبب تلك الزيادة في سعر العسل حول عام 2003؟ لاكتشاف ذلك، يمكنك استكشاف شبكة الأوجه. ## شبكات الأوجه -تأخذ شبكات الأوجه جانبًا واحدًا من مجموعة البيانات الخاصة بك (في حالتنا، يمكنك اختيار 'السنة' لتجنب إنتاج عدد كبير جدًا من الأوجه). يمكن لـ Seaborn بعد ذلك إنشاء مخطط لكل من هذه الأوجه للإحداثيات x وy التي اخترتها، مما يسهل المقارنة البصرية. هل يبرز عام 2003 في هذا النوع من المقارنة؟ +تأخذ شبكات الأوجه جانبًا واحدًا من مجموعة البيانات الخاصة بك (في حالتنا، يمكنك اختيار "السنة" لتجنب إنتاج عدد كبير جدًا من الأوجه). يمكن لـ Seaborn بعد ذلك إنشاء مخطط لكل من هذه الأوجه للإحداثيات x وy التي اخترتها للمقارنة بسهولة. هل يبرز عام 2003 في هذا النوع من المقارنة؟ قم بإنشاء شبكة أوجه باستخدام `relplot` كما هو موصى به في [وثائق Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid). @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -في هذا التصور، يمكنك مقارنة الإنتاجية لكل مستعمرة وعدد المستعمرات عامًا بعد عام جنبًا إلى جنب مع تعيين الأعمدة إلى 3: +في هذا التصور، يمكنك مقارنة الإنتاج لكل مستعمرة وعدد المستعمرات عامًا بعد عام، جنبًا إلى جنب مع التفاف مضبوط على 3 للأعمدة: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.ar.png) -بالنسبة لهذه المجموعة من البيانات، لا يبدو أن هناك شيئًا بارزًا بشكل خاص فيما يتعلق بعدد المستعمرات وإنتاجيتها، عامًا بعد عام وولاية بعد ولاية. هل هناك طريقة مختلفة للبحث عن علاقة بين هذين المتغيرين؟ +بالنسبة لهذه المجموعة من البيانات، لا يبرز شيء بشكل خاص فيما يتعلق بعدد المستعمرات وإنتاجها، عامًا بعد عام وولاية بعد ولاية. هل هناك طريقة مختلفة للبحث عن علاقة بين هذين المتغيرين؟ ## مخططات الخطوط المزدوجة -جرب مخططًا متعدد الخطوط عن طريق تراكب مخططين خطيين فوق بعضهما البعض، باستخدام وظيفة 'despine' في Seaborn لإزالة الحواف العلوية واليمنى، واستخدام `ax.twinx` [المستمدة من Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). تتيح Twinx للمخطط مشاركة المحور x وعرض محورين y. لذا، اعرض الإنتاجية لكل مستعمرة وعدد المستعمرات، متراكبين: +جرب مخططًا متعدد الخطوط عن طريق وضع مخططين خطيين فوق بعضهما البعض، باستخدام وظيفة 'despine' في Seaborn لإزالة الحواف العلوية واليمينية، واستخدام `ax.twinx` [المستمدة من Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). تتيح Twinx للمخطط مشاركة المحور x وعرض محورين y. لذا، قم بعرض الإنتاج لكل مستعمرة وعدد المستعمرات، متراكبين: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,22 +162,22 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.ar.png) -بينما لا يظهر شيء واضح حول عام 2003، إلا أنه يسمح لنا بإنهاء هذا الدرس بملاحظة أكثر تفاؤلاً: على الرغم من الانخفاض العام في عدد المستعمرات، يبدو أن عدد المستعمرات يستقر حتى لو كانت إنتاجيتها لكل مستعمرة تتناقص. +بينما لا يبرز شيء للعين حول عام 2003، فإنه يسمح لنا بإنهاء هذا الدرس بملاحظة أكثر إيجابية: على الرغم من وجود انخفاض عام في عدد المستعمرات، فإن عدد المستعمرات يستقر حتى لو كان إنتاجها لكل مستعمرة يتناقص. -هيا، أيها النحل، استمروا! 🐝❤️ +هيا أيها النحل، استمروا! -## 🚀 تحدٍ +🐝❤️ +## 🚀 التحدي -في هذا الدرس، تعلمت المزيد عن استخدامات المخططات النقطية وشبكات الخطوط، بما في ذلك شبكات الأوجه. تحدَّ نفسك لإنشاء شبكة أوجه باستخدام مجموعة بيانات مختلفة، ربما واحدة استخدمتها في الدروس السابقة. لاحظ الوقت الذي تستغرقه لإنشائها ومدى حاجتك إلى الحذر بشأن عدد الأوجه التي تحتاج إلى رسمها باستخدام هذه التقنيات. +في هذا الدرس، تعلمت المزيد عن استخدامات مخططات التبعثر وشبكات الخطوط، بما في ذلك شبكات الأوجه. تحدى نفسك لإنشاء شبكة أوجه باستخدام مجموعة بيانات مختلفة، ربما واحدة استخدمتها قبل هذه الدروس. لاحظ الوقت الذي تستغرقه لإنشائها وكيف تحتاج إلى الحذر بشأن عدد الشبكات التي تحتاج إلى رسمها باستخدام هذه التقنيات. ## [اختبار ما بعد المحاضرة](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## المراجعة والدراسة الذاتية يمكن أن تكون المخططات الخطية بسيطة أو معقدة للغاية. قم ببعض القراءة في [وثائق Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) حول الطرق المختلفة التي يمكنك من خلالها بناؤها. حاول تحسين المخططات الخطية التي أنشأتها في هذا الدرس باستخدام طرق أخرى مدرجة في الوثائق. - ## الواجب [استكشف خلية النحل](assignment.md) @@ -184,4 +185,4 @@ ax.figure.legend(); --- **إخلاء المسؤولية**: -تمت ترجمة هذا المستند باستخدام خدمة الترجمة الآلية [Co-op Translator](https://github.com/Azure/co-op-translator). بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية هو المصدر الموثوق. للحصول على معلومات حساسة أو هامة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة. \ No newline at end of file +تم ترجمة هذا المستند باستخدام خدمة الترجمة بالذكاء الاصطناعي [Co-op Translator](https://github.com/Azure/co-op-translator). بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية المصدر الرسمي. للحصول على معلومات حاسمة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة. \ No newline at end of file diff --git a/translations/bg/3-Data-Visualization/12-visualization-relationships/README.md b/translations/bg/3-Data-Visualization/12-visualization-relationships/README.md index 1df9998e..3065ea7b 100644 --- a/translations/bg/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/bg/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ -# 視覺化關係:關於蜂蜜的一切 🍯 +# 視覺化關係:關於蜂蜜 🍯 |![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| |視覺化關係 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -延續我們研究的自然主題,讓我們探索一些有趣的視覺化方式,展示不同種類蜂蜜之間的關係。這些數據來自[美國農業部](https://www.nass.usda.gov/About_NASS/index.php)。 +延續我們研究的自然主題,讓我們探索一些有趣的視覺化方式,展示不同種類蜂蜜之間的關係。這些視覺化基於一個來自[美國農業部](https://www.nass.usda.gov/About_NASS/index.php)的數據集。 -這份包含約 600 項數據的資料集展示了美國多個州的蜂蜜生產情況。例如,你可以查看每個州從 1998 年到 2012 年的蜂群數量、每群產量、總產量、庫存、每磅價格以及蜂蜜的總價值,每年每州一行數據。 +這個包含約600項目數據的數據集展示了美國多個州的蜂蜜生產情況。例如,您可以查看每個州在1998年至2012年間的蜂群數量、每群產量、總生產量、庫存、每磅價格以及蜂蜜的生產價值,每年每州一行數據。 -我們可以視覺化某個州每年的生產量與該州蜂蜜價格之間的關係。或者,你也可以視覺化各州每群蜂蜜產量的關係。這段時間涵蓋了 2006 年首次出現的毀滅性「蜂群崩潰症候群 (CCD)」(http://npic.orst.edu/envir/ccd.html),因此這是一個值得研究的數據集。🐝 +我們可以視覺化某州每年的生產量與該州蜂蜜價格之間的關係。或者,您也可以視覺化各州每群蜂蜜產量之間的關係。這段時間涵蓋了2006年首次出現的毀滅性“蜂群崩潰症”(CCD,Colony Collapse Disorder)(http://npic.orst.edu/envir/ccd.html),因此這是一個值得研究的數據集。🐝 ## [課前測驗](https://ff-quizzes.netlify.app/en/ds/quiz/22) -在這節課中,你可以使用 Seaborn(之前已經使用過),這是一個很好的工具庫,用於視覺化變數之間的關係。特別有趣的是 Seaborn 的 `relplot` 函數,它可以快速生成散點圖和折線圖,幫助我們視覺化「[統計關係](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)」,讓數據科學家更好地理解變數之間的關聯。 +在本課中,您可以使用之前使用過的 Seaborn 庫,這是一個很好的工具來視覺化變量之間的關係。特別有趣的是使用 Seaborn 的 `relplot` 函數,它可以快速生成散點圖和折線圖,視覺化[統計關係](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships),幫助數據科學家更好地理解變量之間的關聯。 ## 散點圖 -使用散點圖展示每州蜂蜜價格逐年變化的情況。Seaborn 的 `relplot` 可以方便地將州數據分組,並顯示分類數據和數值數據的數據點。 +使用散點圖展示蜂蜜價格每年每州的變化。Seaborn 的 `relplot` 可以方便地將州數據分組,並顯示分類和數值數據的數據點。 -讓我們從導入數據和 Seaborn 開始: +首先,導入數據和 Seaborn: ```python import pandas as pd @@ -36,97 +36,97 @@ import seaborn as sns honey = pd.read_csv('../../data/honey.csv') honey.head() ``` -你會注意到蜂蜜數據中有幾個有趣的列,包括年份和每磅價格。讓我們按美國各州分組來探索這些數據: +您會注意到蜂蜜數據中有幾個有趣的列,包括年份和每磅價格。讓我們探索按美國州分組的數據: -| 州 | 蜂群數量 | 每群產量 | 總產量 | 庫存 | 每磅價格 | 總價值 | 年份 | -|------|----------|----------|------------|----------|----------|------------|------| -| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | -| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | -| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | +| 州 | 蜂群數量 | 每群產量 | 總生產量 | 庫存 | 每磅價格 | 生產價值 | 年份 | +| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | +| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | +| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | +| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -創建一個基本的散點圖,展示每磅蜂蜜價格與其來源州之間的關係。讓 `y` 軸足夠高以顯示所有州: +創建一個基本散點圖,展示蜂蜜每磅價格與其來源州之間的關係。將 `y` 軸設置得足夠高以顯示所有州: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.hk.png) -接下來,使用蜂蜜色調來展示價格如何隨年份變化。你可以通過添加一個 'hue' 參數來顯示逐年的變化: +接下來,使用蜂蜜色調展示價格隨年份的變化。您可以通過添加 'hue' 參數來展示每年的變化: -> ✅ 了解更多關於 [Seaborn 可用的色彩調色盤](https://seaborn.pydata.org/tutorial/color_palettes.html) - 試試看美麗的彩虹色調! +> ✅ 了解更多 [Seaborn 可用的色彩調色板](https://seaborn.pydata.org/tutorial/color_palettes.html) - 試試美麗的彩虹色調! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) - -通過這種色彩變化,你可以清楚地看到每磅蜂蜜價格隨年份的明顯上升趨勢。事實上,如果你查看數據中的樣本集(例如選擇亞利桑那州),你會發現價格逐年上漲的模式,只有少數例外: - -| 州 | 蜂群數量 | 每群產量 | 總產量 | 庫存 | 每磅價格 | 總價值 | 年份 | -|------|----------|----------|------------|----------|----------|------------|------| -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | -| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | -| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | -| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | -| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | -| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | -| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | -| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | -| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | -| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | -| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | -| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | -| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | -| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | - -另一種視覺化這種變化的方法是使用大小而不是顏色。對於色盲用戶來說,這可能是一個更好的選擇。修改你的視覺化,通過點的大小來顯示價格的增長: +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.hk.png) + +通過這種色彩方案的改變,您可以清楚地看到蜂蜜每磅價格隨年份的明顯增長趨勢。事實上,如果您查看數據中的樣本集(例如選擇一個州,亞利桑那州),您可以看到價格每年增長的模式,只有少數例外: + +| 州 | 蜂群數量 | 每群產量 | 總生產量 | 庫存 | 每磅價格 | 生產價值 | 年份 | +| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | +| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | +| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | +| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | +| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | +| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | +| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | +| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | +| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | +| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | +| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | +| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | +| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | +| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | + +另一種視覺化這種進展的方法是使用大小而不是顏色。對於色盲用戶,這可能是一個更好的選擇。編輯您的視覺化,通過點的圓周大小展示價格的增長: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` -你可以看到點的大小逐漸增大。 +您可以看到點的大小逐漸增大。 -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.hk.png) -這是否只是供需的簡單案例?由於氣候變化和蜂群崩潰等因素,是否每年的蜂蜜供應減少,導致價格上漲? +這是否是一個簡單的供需問題?由於氣候變化和蜂群崩潰等因素,是否每年可供購買的蜂蜜減少,因此價格上漲? -為了發現這些數據集中某些變數之間的相關性,讓我們探索一些折線圖。 +為了探索數據集中某些變量之間的相關性,讓我們研究一些折線圖。 ## 折線圖 -問題:蜂蜜每磅價格是否逐年明顯上升?你可以通過創建一個單一的折線圖來最輕鬆地發現這一點: +問題:蜂蜜每磅價格是否每年都有明顯上漲?您可以通過創建一個單一折線圖來最容易地發現這一點: ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` -答案:是的,但在 2003 年左右有一些例外: +答案:是的,但在2003年左右有一些例外: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.hk.png) -✅ 由於 Seaborn 將數據聚合到一條線上,它通過繪製均值和均值周圍的 95% 置信區間來顯示「每個 x 值的多個測量值」。[來源](https://seaborn.pydata.org/tutorial/relational.html)。這種耗時的行為可以通過添加 `ci=None` 禁用。 +✅ 由於 Seaborn 將數據聚合到一條線上,它通過繪製均值和均值周圍的95%置信區間來顯示每個 x 值的多個測量值。[來源](https://seaborn.pydata.org/tutorial/relational.html)。這種耗時的行為可以通過添加 `ci=None` 禁用。 -問題:那麼,在 2003 年,我們是否也能看到蜂蜜供應的激增?如果你查看逐年的總產量呢? +問題:那麼,在2003年,我們是否也能看到蜂蜜供應的激增?如果您查看每年的總生產量呢? ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.hk.png) -答案:並不完全。如果你查看總產量,實際上在那一年似乎有所增加,儘管總體來說這些年份的蜂蜜產量在下降。 +答案:並不完全。如果您查看總生產量,實際上在那一年似乎有所增加,儘管總體而言蜂蜜的生產量在這些年中呈下降趨勢。 -問題:在這種情況下,2003 年蜂蜜價格的飆升可能是什麼原因? +問題:在這種情況下,2003年蜂蜜價格的激增可能是什麼原因? -為了發現這一點,你可以探索一個 Facet Grid。 +為了探索這一點,您可以使用 Facet Grid。 ## Facet Grids -Facet Grids 將數據集的一個面(在我們的例子中,你可以選擇「年份」以避免生成過多的面)分開。Seaborn 可以為每個面生成一個圖表,根據你選擇的 x 和 y 坐標進行更容易的視覺比較。2003 年是否在這種比較中脫穎而出? +Facet Grids 將數據集的一個方面(在我們的例子中,您可以選擇“年份”,以避免生成過多的 Facets)。Seaborn 可以為您選擇的 x 和 y 坐標生成每個 Facet 的圖表,方便比較。2003年是否在這種比較中脫穎而出? -通過繼續使用 `relplot` 創建一個 Facet Grid,這是 [Seaborn 文檔](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) 推薦的方法。 +繼續使用 Seaborn 的 `relplot` 創建 Facet Grid,正如 [Seaborn 文檔](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) 所推薦的。 ```python sns.relplot( @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -在這個視覺化中,你可以比較逐年每群產量和蜂群數量,並將列數設置為 3: +在這個視覺化中,您可以比較每年的每群產量和蜂群數量,並將列的 wrap 設置為3: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.hk.png) -對於這個數據集,逐年和逐州的蜂群數量及其產量並沒有特別突出的地方。是否有其他方式來尋找這兩個變數之間的相關性? +對於這個數據集,關於蜂群數量和每群產量,按年份和州比較並沒有特別突出的地方。是否有其他方式來尋找這兩個變量之間的相關性? ## 雙折線圖 -嘗試通過將兩個折線圖疊加在一起來創建多折線圖,使用 Seaborn 的 'despine' 移除圖表的頂部和右側框架,並使用 `ax.twinx` [來自 Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)。Twix 允許圖表共享 x 軸並顯示兩個 y 軸。因此,將每群產量和蜂群數量疊加顯示: +嘗試使用多折線圖,通過將兩個折線圖疊加在一起,使用 Seaborn 的 'despine' 移除其上方和右側的邊框,並使用 `ax.twinx` [源自 Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)。Twins 允許圖表共享 x 軸並顯示兩個 y 軸。因此,展示每群產量和蜂群數量的疊加圖: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,22 +162,22 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.hk.png) -雖然在 2003 年左右沒有明顯的異常,但這讓我們可以以一個稍微樂觀的結論結束這節課:儘管蜂群數量總體在下降,但蜂群數量正在穩定下來,即使每群產量在減少。 +雖然在2003年沒有明顯的異常,但這讓我們以一個稍微樂觀的結論結束本課:儘管蜂群數量總體上在下降,但蜂群數量正在穩定,即使每群產量在減少。 -加油,蜜蜂們!🐝❤️ +加油,蜜蜂們,加油! +🐝❤️ ## 🚀 挑戰 -在這節課中,你學到了更多關於散點圖和折線圖(包括 Facet Grids)的其他用途。挑戰自己使用不同的數據集(也許是你之前使用過的數據集)來創建一個 Facet Grid。注意它們的生成時間,以及在使用這些技術時需要小心的地方。 +在本課中,您學到了更多關於散點圖和折線圖的其他用途,包括 Facet Grids。挑戰自己使用不同的數據集創建 Facet Grid,也許是您之前使用過的數據集。注意它們的生成時間以及如何小心選擇需要繪製的 Facets 數量。 ## [課後測驗](https://ff-quizzes.netlify.app/en/ds/quiz/23) -## 複習與自學 - -折線圖可以很簡單,也可以很複雜。閱讀 [Seaborn 文檔](https://seaborn.pydata.org/generated/seaborn.lineplot.html),了解更多構建折線圖的方法。嘗試使用文檔中列出的方法來增強你在這節課中構建的折線圖。 +## 回顧與自學 +折線圖可以簡單也可以非常複雜。閱讀 [Seaborn 文檔](https://seaborn.pydata.org/generated/seaborn.lineplot.html) 中的各種構建方法。嘗試使用文檔中列出的其他方法來增強您在本課中構建的折線圖。 ## 作業 [深入蜂巢](assignment.md) @@ -184,4 +185,4 @@ ax.figure.legend(); --- **免責聲明**: -本文件已使用人工智能翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。儘管我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。原始語言的文件應被視為權威來源。對於重要資訊,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解釋概不負責。 \ No newline at end of file +此文件已使用人工智能翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原始語言的文件作為權威來源。對於關鍵資訊,建議尋求專業的人類翻譯。我們對因使用此翻譯而引起的任何誤解或誤釋不承擔責任。 \ No newline at end of file diff --git a/translations/hr/3-Data-Visualization/12-visualization-relationships/README.md b/translations/hr/3-Data-Visualization/12-visualization-relationships/README.md index a356e389..0a0036d4 100644 --- a/translations/hr/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/hr/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ -# Memvisualisasikan Hubungan: Semua Tentang Madu 🍯 +# Visualisasi Hubungan: Semua Tentang Madu 🍯 |![ Sketchnote oleh [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|Memvisualisasikan Hubungan - _Sketchnote oleh [@nitya](https://twitter.com/nitya)_ | +|Visualisasi Hubungan - _Sketchnote oleh [@nitya](https://twitter.com/nitya)_ | -Melanjutkan fokus penelitian kita pada alam, mari kita temukan visualisasi menarik untuk menunjukkan hubungan antara berbagai jenis madu, berdasarkan dataset yang diambil dari [Departemen Pertanian Amerika Serikat](https://www.nass.usda.gov/About_NASS/index.php). +Melanjutkan fokus penelitian kami pada alam, mari kita temukan visualisasi menarik untuk menunjukkan hubungan antara berbagai jenis madu, berdasarkan dataset yang berasal dari [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php). Dataset ini, yang terdiri dari sekitar 600 item, menampilkan produksi madu di banyak negara bagian AS. Sebagai contoh, Anda dapat melihat jumlah koloni, hasil per koloni, total produksi, stok, harga per pon, dan nilai madu yang diproduksi di negara bagian tertentu dari tahun 1998-2012, dengan satu baris per tahun untuk setiap negara bagian. -Akan menarik untuk memvisualisasikan hubungan antara produksi tahunan suatu negara bagian dan, misalnya, harga madu di negara bagian tersebut. Sebagai alternatif, Anda dapat memvisualisasikan hubungan antara hasil madu per koloni di berbagai negara bagian. Rentang tahun ini mencakup periode 'CCD' atau 'Colony Collapse Disorder' yang pertama kali terlihat pada tahun 2006 (http://npic.orst.edu/envir/ccd.html), sehingga dataset ini menjadi bahan studi yang menarik. 🐝 +Akan menarik untuk memvisualisasikan hubungan antara produksi tahunan suatu negara bagian dan, misalnya, harga madu di negara bagian tersebut. Alternatifnya, Anda dapat memvisualisasikan hubungan antara hasil madu per koloni di berbagai negara bagian. Rentang tahun ini mencakup periode 'CCD' atau 'Colony Collapse Disorder' yang pertama kali terlihat pada tahun 2006 (http://npic.orst.edu/envir/ccd.html), sehingga dataset ini menjadi bahan studi yang menyentuh. 🐝 ## [Kuis Pra-Pelajaran](https://ff-quizzes.netlify.app/en/ds/quiz/22) -Dalam pelajaran ini, Anda dapat menggunakan Seaborn, yang sebelumnya telah Anda gunakan, sebagai pustaka yang baik untuk memvisualisasikan hubungan antar variabel. Yang sangat menarik adalah penggunaan fungsi `relplot` dari Seaborn yang memungkinkan scatter plot dan line plot untuk dengan cepat memvisualisasikan '[hubungan statistik](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', yang memungkinkan data scientist untuk lebih memahami bagaimana variabel saling berhubungan. +Dalam pelajaran ini, Anda dapat menggunakan Seaborn, yang telah Anda gunakan sebelumnya, sebagai pustaka yang baik untuk memvisualisasikan hubungan antar variabel. Yang menarik adalah penggunaan fungsi `relplot` dari Seaborn yang memungkinkan scatter plot dan line plot untuk dengan cepat memvisualisasikan '[hubungan statistik](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', yang memungkinkan data scientist memahami lebih baik bagaimana variabel saling berhubungan. ## Scatterplot -Gunakan scatterplot untuk menunjukkan bagaimana harga madu berkembang dari tahun ke tahun di setiap negara bagian. Seaborn, dengan menggunakan `relplot`, secara praktis mengelompokkan data negara bagian dan menampilkan titik data untuk data kategoris dan numerik. +Gunakan scatterplot untuk menunjukkan bagaimana harga madu berkembang dari tahun ke tahun di setiap negara bagian. Seaborn, dengan menggunakan `relplot`, secara praktis mengelompokkan data negara bagian dan menampilkan titik data untuk data kategoris maupun numerik. Mari kita mulai dengan mengimpor data dan Seaborn: @@ -51,7 +51,7 @@ Buat scatterplot dasar untuk menunjukkan hubungan antara harga per pon madu dan ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.id.png) Sekarang, tampilkan data yang sama dengan skema warna madu untuk menunjukkan bagaimana harga berkembang dari tahun ke tahun. Anda dapat melakukannya dengan menambahkan parameter 'hue' untuk menunjukkan perubahan dari tahun ke tahun: @@ -60,9 +60,9 @@ Sekarang, tampilkan data yang sama dengan skema warna madu untuk menunjukkan bag ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.id.png) -Dengan perubahan skema warna ini, Anda dapat melihat bahwa ada perkembangan yang jelas dari tahun ke tahun dalam hal harga madu per pon. Memang, jika Anda melihat satu set data sampel untuk memverifikasi (pilih negara bagian tertentu, misalnya Arizona), Anda dapat melihat pola kenaikan harga dari tahun ke tahun, dengan beberapa pengecualian: +Dengan perubahan skema warna ini, Anda dapat melihat bahwa ada perkembangan yang jelas selama bertahun-tahun dalam hal harga madu per pon. Memang, jika Anda melihat sampel data untuk memverifikasi (pilih negara bagian tertentu, misalnya Arizona), Anda dapat melihat pola kenaikan harga dari tahun ke tahun, dengan beberapa pengecualian: | state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | | ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | @@ -82,16 +82,16 @@ Dengan perubahan skema warna ini, Anda dapat melihat bahwa ada perkembangan yang | AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | | AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | -Cara lain untuk memvisualisasikan perkembangan ini adalah dengan menggunakan ukuran, bukan warna. Untuk pengguna yang buta warna, ini mungkin menjadi opsi yang lebih baik. Edit visualisasi Anda untuk menunjukkan kenaikan harga dengan peningkatan ukuran lingkaran: +Cara lain untuk memvisualisasikan perkembangan ini adalah dengan menggunakan ukuran, bukan warna. Untuk pengguna yang buta warna, ini mungkin menjadi pilihan yang lebih baik. Edit visualisasi Anda untuk menunjukkan kenaikan harga dengan peningkatan lingkaran titik: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` Anda dapat melihat ukuran titik yang secara bertahap meningkat. -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.id.png) -Apakah ini hanya kasus sederhana dari penawaran dan permintaan? Karena faktor seperti perubahan iklim dan keruntuhan koloni, apakah madu yang tersedia untuk dibeli semakin sedikit dari tahun ke tahun, sehingga harga meningkat? +Apakah ini kasus sederhana dari hukum permintaan dan penawaran? Karena faktor seperti perubahan iklim dan keruntuhan koloni, apakah madu yang tersedia untuk dibeli semakin sedikit dari tahun ke tahun, sehingga harga meningkat? Untuk menemukan korelasi antara beberapa variabel dalam dataset ini, mari kita eksplorasi beberapa grafik garis. @@ -102,9 +102,9 @@ Pertanyaan: Apakah ada kenaikan harga madu per pon yang jelas dari tahun ke tahu ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` -Jawaban: Ya, dengan beberapa pengecualian di sekitar tahun 2003: +Jawaban: Ya, dengan beberapa pengecualian sekitar tahun 2003: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.id.png) ✅ Karena Seaborn mengagregasi data di sekitar satu garis, ia menampilkan "pengukuran ganda pada setiap nilai x dengan memplot rata-rata dan interval kepercayaan 95% di sekitar rata-rata". [Sumber](https://seaborn.pydata.org/tutorial/relational.html). Perilaku yang memakan waktu ini dapat dinonaktifkan dengan menambahkan `ci=None`. @@ -114,17 +114,17 @@ Pertanyaan: Nah, pada tahun 2003 apakah kita juga melihat lonjakan pasokan madu? sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.id.png) Jawaban: Tidak juga. Jika Anda melihat total produksi, sebenarnya tampaknya meningkat pada tahun tersebut, meskipun secara umum jumlah madu yang diproduksi menurun selama tahun-tahun ini. -Pertanyaan: Dalam hal ini, apa yang bisa menyebabkan lonjakan harga madu di sekitar tahun 2003? +Pertanyaan: Dalam hal ini, apa yang bisa menyebabkan lonjakan harga madu sekitar tahun 2003? Untuk menemukan ini, Anda dapat mengeksplorasi facet grid. -## Facet Grid +## Facet Grids -Facet grid mengambil satu aspek dari dataset Anda (dalam kasus ini, Anda dapat memilih 'tahun' untuk menghindari terlalu banyak facet yang dihasilkan). Seaborn kemudian dapat membuat plot untuk masing-masing aspek tersebut dari koordinat x dan y yang Anda pilih untuk perbandingan visual yang lebih mudah. Apakah tahun 2003 menonjol dalam jenis perbandingan ini? +Facet grid mengambil satu aspek dari dataset Anda (dalam kasus kami, Anda dapat memilih 'tahun' untuk menghindari terlalu banyak aspek yang dihasilkan). Seaborn kemudian dapat membuat plot untuk masing-masing aspek tersebut berdasarkan koordinat x dan y yang Anda pilih untuk perbandingan visual yang lebih mudah. Apakah tahun 2003 menonjol dalam jenis perbandingan ini? Buat facet grid dengan terus menggunakan `relplot` seperti yang direkomendasikan oleh [dokumentasi Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid). @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` Dalam visualisasi ini, Anda dapat membandingkan hasil per koloni dan jumlah koloni dari tahun ke tahun, berdampingan dengan pengaturan wrap pada 3 untuk kolom: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.id.png) Untuk dataset ini, tidak ada yang secara khusus menonjol terkait jumlah koloni dan hasilnya, dari tahun ke tahun dan negara bagian ke negara bagian. Apakah ada cara lain untuk menemukan korelasi antara kedua variabel ini? ## Grafik Garis Ganda -Cobalah grafik multiline dengan menumpangkan dua grafik garis di atas satu sama lain, menggunakan 'despine' dari Seaborn untuk menghapus spines atas dan kanan, dan menggunakan `ax.twinx` [berasal dari Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx memungkinkan grafik untuk berbagi sumbu x dan menampilkan dua sumbu y. Jadi, tampilkan hasil per koloni dan jumlah koloni, ditumpangkan: +Cobalah grafik multiline dengan menumpangkan dua grafik garis di atas satu sama lain, menggunakan 'despine' dari Seaborn untuk menghapus tulang belakang atas dan kanan mereka, dan menggunakan `ax.twinx` [berasal dari Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx memungkinkan grafik berbagi sumbu x dan menampilkan dua sumbu y. Jadi, tampilkan hasil per koloni dan jumlah koloni, ditumpangkan: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,27 +162,28 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.id.png) -Meskipun tidak ada yang mencolok di sekitar tahun 2003, ini memungkinkan kita untuk mengakhiri pelajaran ini dengan catatan yang sedikit lebih positif: meskipun jumlah koloni secara keseluruhan menurun, jumlah koloni mulai stabil meskipun hasil per koloni menurun. +Meskipun tidak ada yang mencolok di sekitar tahun 2003, ini memungkinkan kita mengakhiri pelajaran ini dengan catatan yang sedikit lebih bahagia: meskipun jumlah koloni secara keseluruhan menurun, jumlah koloni mulai stabil meskipun hasil per koloni menurun. -Semangat, lebah! 🐝❤️ +Semangat, lebah, semangat! +🐝❤️ ## 🚀 Tantangan -Dalam pelajaran ini, Anda belajar lebih banyak tentang penggunaan scatterplot dan line grid lainnya, termasuk facet grid. Tantang diri Anda untuk membuat facet grid menggunakan dataset yang berbeda, mungkin yang telah Anda gunakan sebelumnya dalam pelajaran ini. Perhatikan berapa lama waktu yang dibutuhkan untuk membuatnya dan bagaimana Anda perlu berhati-hati tentang jumlah grid yang perlu Anda gambar menggunakan teknik ini. +Dalam pelajaran ini, Anda belajar lebih banyak tentang penggunaan scatterplot dan line grid lainnya, termasuk facet grid. Tantang diri Anda untuk membuat facet grid menggunakan dataset yang berbeda, mungkin yang telah Anda gunakan sebelumnya dalam pelajaran ini. Perhatikan berapa lama waktu yang dibutuhkan untuk membuatnya dan bagaimana Anda perlu berhati-hati tentang berapa banyak grid yang perlu Anda gambar menggunakan teknik ini. ## [Kuis Pasca-Pelajaran](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## Tinjauan & Studi Mandiri -Grafik garis bisa sederhana atau cukup kompleks. Lakukan sedikit pembacaan di [dokumentasi Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) tentang berbagai cara Anda dapat membangunnya. Cobalah untuk meningkatkan grafik garis yang Anda buat dalam pelajaran ini dengan metode lain yang tercantum dalam dokumentasi. +Grafik garis bisa sederhana atau cukup kompleks. Lakukan sedikit pembacaan di [dokumentasi Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) tentang berbagai cara Anda dapat membangunnya. Cobalah untuk meningkatkan grafik garis yang Anda buat dalam pelajaran ini dengan metode lain yang tercantum dalam dokumen. ## Tugas -[Masuk lebih dalam ke sarang lebah](assignment.md) +[Masuk ke sarang lebah](assignment.md) --- **Penafian**: -Dokumen ini telah diterjemahkan menggunakan layanan penerjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Meskipun kami berupaya untuk memberikan hasil yang akurat, harap diperhatikan bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang berwenang. Untuk informasi yang bersifat kritis, disarankan menggunakan jasa penerjemahan manusia profesional. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang keliru yang timbul dari penggunaan terjemahan ini. \ No newline at end of file +Dokumen ini telah diterjemahkan menggunakan layanan terjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Meskipun kami berupaya untuk memberikan hasil yang akurat, harap diperhatikan bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang berwenang. Untuk informasi yang bersifat kritis, disarankan menggunakan jasa penerjemah manusia profesional. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang keliru yang timbul dari penggunaan terjemahan ini. \ No newline at end of file diff --git a/translations/it/3-Data-Visualization/12-visualization-relationships/README.md b/translations/it/3-Data-Visualization/12-visualization-relationships/README.md index 6fb95460..3796548a 100644 --- a/translations/it/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/it/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ # 関係の可視化: ハチミツについて 🍯 -|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| +|![ [(@sketchthedocs)](https://sketchthedocs.dev) によるスケッチノート ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|関係の可視化 - _スケッチノート by [@nitya](https://twitter.com/nitya)_ | +|関係の可視化 - _[@nitya](https://twitter.com/nitya) によるスケッチノート_ | -自然に焦点を当てた研究を続けながら、さまざまな種類のハチミツ間の関係を示す興味深い可視化を探ってみましょう。このデータセットは[アメリカ合衆国農務省](https://www.nass.usda.gov/About_NASS/index.php)から得られたものです。 +私たちの研究の自然に焦点を当てたテーマを続けて、[アメリカ合衆国農務省](https://www.nass.usda.gov/About_NASS/index.php)から得られたデータセットに基づいて、さまざまな種類のハチミツ間の関係を示す興味深い可視化を探ってみましょう。 -約600項目のデータセットには、アメリカの多くの州でのハチミツ生産が表示されています。例えば、州ごとのコロニー数、コロニーあたりの収量、総生産量、在庫、1ポンドあたりの価格、そして1998年から2012年までの各州の年間生産価値を確認できます。 +この約600項目のデータセットは、アメリカの多くの州におけるハチミツ生産を示しています。例えば、1998年から2012年までの各州ごとの年ごとのデータとして、コロニー数、コロニーあたりの収量、総生産量、在庫、1ポンドあたりの価格、そして生産価値を確認することができます。 -特定の州の年間生産量とその州のハチミツ価格の関係を可視化するのは興味深いでしょう。または、州ごとのコロニーあたりのハチミツ収量の関係を可視化することもできます。この期間には、2006年に初めて確認された「コロニー崩壊症候群(CCD)」(http://npic.orst.edu/envir/ccd.html)が含まれており、研究する価値のあるデータセットです。🐝 +特定の州の年間生産量とその州のハチミツ価格との関係を可視化するのは興味深いでしょう。または、州ごとのコロニーあたりのハチミツ収量の関係を可視化することもできます。この期間には、2006年に初めて確認された「コロニー崩壊症候群(CCD)」(http://npic.orst.edu/envir/ccd.html) が含まれており、研究するには感慨深いデータセットです。🐝 ## [講義前のクイズ](https://ff-quizzes.netlify.app/en/ds/quiz/22) -このレッスンでは、以前使用したSeabornを使って、変数間の関係を可視化する方法を学びます。特に興味深いのは、Seabornの`relplot`関数を使用して、散布図や折れ線グラフを作成し、データ科学者が変数間の関係をよりよく理解できるようにする「[統計的関係](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)」を迅速に可視化することです。 +このレッスンでは、以前使用したSeabornを使って、変数間の関係を可視化する方法を学びます。特に興味深いのは、Seabornの`relplot`関数を使用して、散布図や折れ線グラフを作成し、データサイエンティストが変数間の関係をよりよく理解できるようにする「[統計的関係](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)」を迅速に可視化することです。 ## 散布図 -州ごとのハチミツ価格が年々どのように変化しているかを示す散布図を作成します。Seabornの`relplot`を使用すると、州ごとのデータを便利にグループ化し、カテゴリカルデータと数値データの両方のデータポイントを表示できます。 +散布図を使用して、州ごとのハチミツ価格が年々どのように変化しているかを示しましょう。Seabornの`relplot`を使用すると、州ごとのデータを便利にグループ化し、カテゴリカルデータと数値データの両方のデータポイントを表示できます。 まず、データとSeabornをインポートしましょう: @@ -36,7 +36,7 @@ import seaborn as sns honey = pd.read_csv('../../data/honey.csv') honey.head() ``` -ハチミツデータには、年や1ポンドあたりの価格など、いくつか興味深い列が含まれています。このデータをアメリカの州ごとにグループ化して探索してみましょう: +ハチミツデータには、年や1ポンドあたりの価格など、いくつかの興味深い列が含まれていることに気づくでしょう。このデータをアメリカの州ごとにグループ化して調べてみましょう: | state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | | ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | @@ -46,23 +46,23 @@ honey.head() | CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | | CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -州ごとのハチミツの1ポンドあたりの価格とその州の出身地との関係を示す基本的な散布図を作成します。`y`軸をすべての州を表示できるように十分に高く設定してください: +1ポンドあたりのハチミツ価格とその州の関係を示す基本的な散布図を作成しましょう。`y`軸を十分に高くして、すべての州を表示できるようにします: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.ja.png) -次に、ハチミツの色合いを使用して、価格が年々どのように変化しているかを示します。これを行うには、'hue'パラメータを追加して、年ごとの変化を表示します: +次に、ハチミツの価格が年々どのように変化しているかを示すために、ハチミツの色合いを使用して同じデータを表示します。これを行うには、`hue`パラメータを追加して、年ごとの変化を示します: -> ✅ [Seabornで使用できるカラーパレット](https://seaborn.pydata.org/tutorial/color_palettes.html)について詳しく学びましょう - 美しい虹色のカラースキームを試してみてください! +> ✅ [Seabornで使用できるカラーパレット](https://seaborn.pydata.org/tutorial/color_palettes.html)についてもっと学びましょう - 美しい虹色のカラースキームを試してみてください! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.ja.png) -このカラースキームの変更により、ハチミツの1ポンドあたりの価格が年々明らかに強い進行を示していることがわかります。実際、データのサンプルセットを確認すると(例えばアリゾナ州を選択)、年々価格が上昇するパターンがいくつかの例外を除いて見られます: +このカラースキームの変更により、1ポンドあたりのハチミツ価格が年々明らかに上昇していることがわかります。実際、データのサンプルセットを確認すると(例えばアリゾナ州を選ぶ)、例外はあるものの、年々価格が上昇しているパターンが見られます: | state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | | ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | @@ -82,18 +82,18 @@ sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, | AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | | AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | -色ではなくサイズを使用してこの進行を可視化する別の方法があります。色覚異常のユーザーにとっては、これがより良い選択肢かもしれません。価格の増加を点の円周の増加で示すように可視化を編集してください: +色ではなくサイズを使用してこの進行を可視化する別の方法もあります。色覚異常のユーザーにとっては、こちらの方が適しているかもしれません。価格の上昇を点の直径の増加で示すように可視化を編集してみましょう: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` 点のサイズが徐々に大きくなっているのがわかります。 -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.ja.png) これは単純な需要と供給の問題でしょうか?気候変動やコロニー崩壊などの要因により、年々購入可能なハチミツが減少し、その結果価格が上昇しているのでしょうか? -このデータセット内のいくつかの変数間の相関関係を発見するために、折れ線グラフを探索してみましょう。 +このデータセット内のいくつかの変数間の相関を発見するために、折れ線グラフをいくつか探ってみましょう。 ## 折れ線グラフ @@ -102,31 +102,31 @@ sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspec ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` -答え: はい、2003年頃を除いて。 +答え: はい、2003年頃を除いて明確に上昇しています: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.ja.png) -✅ Seabornはデータを1本の線に集約しており、「各x値での複数の測定値を平均とその平均周辺の95%信頼区間をプロットすることで表示」しています。[出典](https://seaborn.pydata.org/tutorial/relational.html)。この時間のかかる動作は、`ci=None`を追加することで無効にできます。 +✅ Seabornはデフォルトで「各x値での複数の測定値を平均値とその周りの95%信頼区間をプロットすることで表示」します。[出典](https://seaborn.pydata.org/tutorial/relational.html)。この時間のかかる動作は、`ci=None`を追加することで無効にできます。 -質問: では、2003年にはハチミツ供給の急増も見られるのでしょうか?年々の総生産量を見てみたらどうでしょう? +質問: では、2003年にはハチミツ供給量の急増も見られますか?年ごとの総生産量を見てみましょう: ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.ja.png) -答え: そうではありません。総生産量を見ると、実際にはその年に増加しているように見えますが、一般的にはこれらの年の間に生産されるハチミツの量は減少しています。 +答え: 実際にはそうではありません。総生産量を見ると、特定の年に増加しているように見えますが、一般的にはこれらの年に生産量が減少していることがわかります。 質問: その場合、2003年頃のハチミツ価格の急上昇の原因は何だったのでしょうか? -これを発見するために、ファセットグリッドを探索してみましょう。 +これを発見するために、ファセットグリッドを探ってみましょう。 ## ファセットグリッド -ファセットグリッドはデータセットの1つのファセット(この場合は「年」を選択して、生成されるファセットが多すぎないようにします)を取り、Seabornが選択したx座標とy座標のプロットを各ファセットごとに作成します。これにより、比較が容易になります。2003年はこのタイプの比較で際立っているでしょうか? +ファセットグリッドは、データセットの1つのファセット(この場合、'year'を選ぶと、生成されるファセットが多すぎるのを避けられます)を取り、Seabornが選択したx座標とy座標のプロットを各ファセットごとに作成します。これにより、比較が容易になります。このタイプの比較で2003年が際立っているでしょうか? -[Seabornのドキュメント](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid)で推奨されているように、`relplot`を使用してファセットグリッドを作成します。 +Seabornのドキュメントで推奨されているように、`relplot`を使い続けてファセットグリッドを作成します。[Seabornのドキュメント](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid)を参照してください。 ```python sns.relplot( @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -この可視化では、コロニーあたりの収量とコロニー数を年々並べて比較できます。列のラップを3に設定します: +この可視化では、コロニーあたりの収量とコロニー数を年ごとに比較し、列を3つに設定してラップします: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.ja.png) -このデータセットでは、州ごとの年々のコロニー数とその収量に関して特に目立つものはありません。これら2つの変数間の相関関係を見つける別の方法はあるでしょうか? +このデータセットでは、州ごとの年ごとのコロニー数や収量に関して特に目立つものはありません。これら2つの変数間の相関を見つける別の方法はあるでしょうか? ## デュアルラインプロット -Seabornの'despine'を使用して上部と右側のスパインを削除し、Matplotlibから派生した`ax.twinx`を使用して2つの折れ線グラフを重ねて表示してみましょう。[Matplotlibのドキュメント](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)によると、Twinxはx軸を共有し、2つのy軸を表示することができます。コロニーあたりの収量とコロニー数を重ねて表示します: +Seabornの「despine」を使用して上部と右側のスパインを削除し、`ax.twinx`を使用して2つの折れ線グラフを重ねてみましょう。[Matplotlibから派生](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)したこの機能は、チャートがx軸を共有し、2つのy軸を表示できるようにします。コロニーあたりの収量とコロニー数を重ねて表示します: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,22 +162,22 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.ja.png) -2003年頃に目立つものはありませんが、全体的にコロニー数が減少している一方で、コロニー数が安定していることがわかります。コロニーあたりの収量は減少しているものの、少し希望が持てます。 +2003年頃に目立つものはありませんが、全体的にコロニー数が減少している一方で、コロニー数が安定していることがわかります。コロニーあたりの収量は減少しているものの、少し明るいニュースでこのレッスンを終えることができます。 がんばれ、ミツバチたち! 🐝❤️ ## 🚀 チャレンジ -このレッスンでは、散布図やライングリッドの他の用途について少し学びました。チャレンジとして、以前のレッスンで使用した別のデータセットを使用してファセットグリッドを作成してみましょう。これらの技術を使用して描画するグリッドの数に注意しながら、作成にどれくらい時間がかかるかを確認してください。 +このレッスンでは、散布図やライングリッドの他の用途について少し学びました。これらの技術を使用して、以前のレッスンで使用したデータセットを使い、ファセットグリッドを作成してみましょう。それらを作成するのにどれくらい時間がかかるか、また、描画するグリッドの数に注意する必要があることに気づくでしょう。 ## [講義後のクイズ](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## 復習と自己学習 -折れ線グラフはシンプルなものから非常に複雑なものまであります。[Seabornのドキュメント](https://seaborn.pydata.org/generated/seaborn.lineplot.html)で折れ線グラフのさまざまな作成方法について少し読んでみましょう。このレッスンで作成した折れ線グラフを、ドキュメントに記載されている他の方法を使用して強化してみてください。 +折れ線グラフはシンプルなものから非常に複雑なものまであります。[Seabornのドキュメント](https://seaborn.pydata.org/generated/seaborn.lineplot.html)を読んで、折れ線グラフを構築するさまざまな方法について学んでみてください。このレッスンで作成した折れ線グラフを、ドキュメントに記載されている他の方法で強化してみてください。 ## 課題 [ハチの巣に飛び込もう](assignment.md) @@ -184,4 +185,4 @@ ax.figure.legend(); --- **免責事項**: -この文書は、AI翻訳サービス [Co-op Translator](https://github.com/Azure/co-op-translator) を使用して翻訳されています。正確性を期すよう努めておりますが、自動翻訳には誤りや不正確な表現が含まれる可能性があります。原文(元の言語で記載された文書)が公式な情報源と見なされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の利用に起因する誤解や誤認について、当社は一切の責任を負いません。 \ No newline at end of file +この文書はAI翻訳サービス[Co-op Translator](https://github.com/Azure/co-op-translator)を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があります。元の言語で記載された文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤った解釈について、当方は責任を負いません。 \ No newline at end of file diff --git a/translations/ko/3-Data-Visualization/12-visualization-relationships/README.md b/translations/ko/3-Data-Visualization/12-visualization-relationships/README.md index 363f3afe..3318f6f9 100644 --- a/translations/ko/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/ko/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ -# 視覺化關係:關於蜂蜜的一切 🍯 +# 視覺化關係:蜂蜜的故事 🍯 -|![由 [(@sketchthedocs)](https://sketchthedocs.dev) 繪製的速記筆記](../../sketchnotes/12-Visualizing-Relationships.png)| +|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|視覺化關係 - _由 [@nitya](https://twitter.com/nitya) 繪製的速記筆記_ | +|視覺化關係 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -延續我們研究的自然主題,讓我們探索一些有趣的視覺化方式,展示不同類型蜂蜜之間的關係。這些數據來自[美國農業部](https://www.nass.usda.gov/About_NASS/index.php)的資料集。 +延續我們研究的自然主題,讓我們探索一些有趣的視覺化方式,來展示不同種類蜂蜜之間的關係。這些數據集來自[美國農業部](https://www.nass.usda.gov/About_NASS/index.php)。 -這個包含約600項的資料集展示了美國多個州的蜂蜜生產情況。例如,您可以查看每個州在1998年至2012年間的蜂群數量、每群產量、總產量、庫存、每磅價格以及蜂蜜的生產價值,每年每州一行數據。 +這個包含約600項的數據集展示了美國多個州的蜂蜜生產情況。例如,您可以查看每個州在1998年至2012年間的蜂群數量、每群產量、總產量、庫存、每磅價格以及蜂蜜的生產價值,每年每州一行數據。 -我們可以視覺化某州每年的生產量與該州蜂蜜價格之間的關係。或者,您可以視覺化各州每群蜂蜜產量之間的關係。這段時間涵蓋了2006年首次出現的毀滅性“蜂群崩潰症候群(CCD)”(http://npic.orst.edu/envir/ccd.html),因此這是一個值得研究的數據集。🐝 +我們可以視覺化某州每年的生產量與該州蜂蜜價格之間的關係。或者,您也可以視覺化各州每群蜂蜜產量之間的關係。這段時間涵蓋了2006年首次出現的毀滅性「蜂群崩潰症候群 (CCD)」(http://npic.orst.edu/envir/ccd.html),因此這是一個值得研究的數據集。🐝 ## [課前測驗](https://ff-quizzes.netlify.app/en/ds/quiz/22) -在本課中,您可以使用之前使用過的 Seaborn 庫,這是一個很好的工具來視覺化變數之間的關係。特別有趣的是使用 Seaborn 的 `relplot` 函數,它可以快速生成散點圖和折線圖,視覺化“[統計關係](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)”,幫助數據科學家更好地理解變數之間的關聯。 +在本課中,您可以使用之前使用過的 Seaborn 庫,這是一個很好的工具來視覺化變數之間的關係。特別有趣的是使用 Seaborn 的 `relplot` 函數,它可以快速生成散點圖和折線圖,視覺化「[統計關係](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)」,幫助數據科學家更好地理解變數之間的關聯。 ## 散點圖 @@ -38,7 +38,7 @@ honey.head() ``` 您會注意到蜂蜜數據中有幾個有趣的列,包括年份和每磅價格。讓我們按美國州分組來探索這些數據: -| 州 | 蜂群數量 | 每群產量 | 總產量 | 庫存 | 每磅價格 | 生產價值 | 年份 | +| 州 | 蜂群數量 | 每群產量 | 總產量 | 庫存 | 每磅價格 | 生產價值 | 年份 | | ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | | AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | | AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | @@ -46,25 +46,25 @@ honey.head() | CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | | CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -創建一個基本散點圖,展示每磅蜂蜜價格與其來源州之間的關係。讓 `y` 軸足夠高以顯示所有州: +創建一個基本的散點圖,展示每磅蜂蜜價格與其來源州之間的關係。讓 `y` 軸足夠高以顯示所有州: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![散點圖 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.mo.png) -接下來,使用蜂蜜色彩方案展示價格如何隨年份演變。您可以通過添加 'hue' 參數來展示年份的變化: +接下來,使用蜂蜜色系展示價格如何隨年份演變。您可以通過添加 'hue' 參數來顯示年份的變化: -> ✅ 了解更多 [Seaborn 中可用的色彩方案](https://seaborn.pydata.org/tutorial/color_palettes.html) - 試試美麗的彩虹色方案! +> ✅ 了解更多關於 [Seaborn 可用的色彩調色板](https://seaborn.pydata.org/tutorial/color_palettes.html) - 試試美麗的彩虹色系! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![散點圖 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.mo.png) -使用這種色彩方案,您可以清楚地看到蜂蜜每磅價格隨年份的明顯增長趨勢。事實上,如果您查看數據中的樣本集(例如選擇一個州,亞利桑那州),您可以看到價格逐年上漲的模式,僅有少數例外: +使用這種色彩方案,您可以清楚地看到蜂蜜每磅價格在多年來的明顯增長趨勢。事實上,如果您查看數據中的樣本集(例如選擇一個州,亞利桑那州),您會發現價格每年都有增長,只有少數例外: -| 州 | 蜂群數量 | 每群產量 | 總產量 | 庫存 | 每磅價格 | 生產價值 | 年份 | +| 州 | 蜂群數量 | 每群產量 | 總產量 | 庫存 | 每磅價格 | 生產價值 | 年份 | | ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | | AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | | AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | @@ -89,24 +89,24 @@ sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspec ``` 您可以看到點的大小逐漸增大。 -![散點圖 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.mo.png) 這是否只是供需的簡單案例?由於氣候變化和蜂群崩潰等因素,是否每年可供購買的蜂蜜減少,因此價格上漲? -為了探索這個數據集中某些變數之間的相關性,讓我們來看看一些折線圖。 +為了探索數據集中某些變數之間的相關性,讓我們來看看一些折線圖。 ## 折線圖 -問題:蜂蜜每磅價格是否隨年份明顯上漲?您可以通過創建一個單一折線圖來最容易地發現這一點: +問題:蜂蜜每磅價格是否每年都有明顯上漲?您可以通過創建一個單一折線圖來最容易地發現這一點: ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` -答案:是的,但在2003年左右有一些例外: +答案:是的,除了2003年左右有一些例外: -![折線圖 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.mo.png) -✅ 由於 Seaborn 將數據聚合到一條線上,它通過繪製均值和均值周圍的95%置信區間來顯示“每個 x 值的多個測量值”。[來源](https://seaborn.pydata.org/tutorial/relational.html)。這種耗時的行為可以通過添加 `ci=None` 禁用。 +✅ 由於 Seaborn 將數據聚合到一條線上,它通過繪製均值和均值周圍的95%置信區間來顯示「每個 x 值的多個測量值」。[來源](https://seaborn.pydata.org/tutorial/relational.html)。這種耗時的行為可以通過添加 `ci=None` 禁用。 問題:那麼,在2003年,我們是否也能看到蜂蜜供應的激增?如果您查看每年的總產量呢? @@ -114,19 +114,19 @@ sns.relplot(x="year", y="priceperlb", kind="line", data=honey); sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![折線圖 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.mo.png) -答案:並不完全。如果您查看總產量,實際上在那一年似乎有所增加,儘管總體而言蜂蜜的生產量在這些年中呈下降趨勢。 +答案:並不完全。如果您查看總產量,實際上在那一年似乎有所增加,儘管總體而言,蜂蜜的生產量在這些年中呈下降趨勢。 問題:在這種情況下,2003年蜂蜜價格的激增可能是什麼原因? 為了探索這一點,您可以使用 Facet Grid。 -## Facet Grid +## Facet Grids -Facet Grid 將數據集的一個方面(在我們的例子中,您可以選擇“年份”,以避免生成過多的 Facet)。Seaborn 可以為您選擇的 x 和 y 坐標生成每個 Facet 的圖表,方便比較。2003年在這種比較中是否突出? +Facet Grid 可以選擇數據集的一個面(在我們的例子中,您可以選擇「年份」以避免生成過多的面)。Seaborn 可以為您選擇的 x 和 y 坐標生成每個面的圖表,方便比較。2003年是否在這種比較中顯得突出? -根據 [Seaborn 的文檔](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid),繼續使用 `relplot` 創建 Facet Grid。 +繼續使用 Seaborn 的 `relplot` 創建 Facet Grid,正如 [Seaborn 文檔](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) 所推薦的。 ```python sns.relplot( @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -在這個視覺化中,您可以比較每群產量和蜂群數量隨年份的變化,並將列的包裹設置為3: +在這個視覺化中,您可以比較每年的每群產量和蜂群數量,並將列的包裹設置為3: -![Facet Grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.mo.png) -對於這個數據集,關於蜂群數量和每群產量,年份和州之間並沒有特別突出的地方。是否有其他方式可以找到這兩個變數之間的相關性? +對於這個數據集,關於蜂群數量和每群產量,按年份和州比較並沒有特別突出的地方。是否有其他方式來尋找這兩個變數之間的相關性? ## 雙折線圖 -嘗試使用多折線圖,通過將兩個折線圖疊加在一起,使用 Seaborn 的 'despine' 移除其上方和右側的邊框,並使用 `ax.twinx` [源自 Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)。Twins 允許圖表共享 x 軸並顯示兩個 y 軸。因此,顯示每群產量和蜂群數量的疊加圖: +嘗試使用多折線圖,通過將兩個折線圖疊加在一起,使用 Seaborn 的 'despine' 移除其上方和右側的框架,並使用 `ax.twinx` [源自 Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)。Twins 允許圖表共享 x 軸並顯示兩個 y 軸。因此,疊加顯示每群產量和蜂群數量: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,22 +162,22 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![疊加圖](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.mo.png) -雖然2003年並沒有明顯的異常,但這讓我們可以以一個稍微樂觀的結尾結束這節課:儘管蜂群數量總體上在下降,但蜂群數量正在穩定,即使每群產量在減少。 +雖然在2003年沒有明顯的異常,但這讓我們以一個稍微樂觀的結論結束這節課:儘管蜂群數量總體上在下降,但蜂群數量正在穩定,即使每群產量在減少。 加油,蜜蜂們,加油! 🐝❤️ ## 🚀 挑戰 -在本課中,您學到了更多關於散點圖和折線圖的其他用途,包括 Facet Grid。挑戰自己使用不同的數據集創建 Facet Grid,也許是您之前課程中使用過的數據集。注意它們的生成時間以及如何小心選擇需要繪製的網格數量。 +在本課中,您學到了更多關於散點圖和折線圖,包括 Facet Grid 的其他用途。挑戰自己使用不同的數據集創建 Facet Grid,也許是您之前使用過的數據集。注意它們的生成時間以及如何小心選擇需要繪製的網格數量。 ## [課後測驗](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## 回顧與自學 -折線圖可以是簡單的,也可以是非常複雜的。閱讀 [Seaborn 文檔](https://seaborn.pydata.org/generated/seaborn.lineplot.html) 中的各種構建方法。嘗試使用文檔中列出的其他方法來增強您在本課中構建的折線圖。 +折線圖可以很簡單,也可以非常複雜。閱讀 [Seaborn 文檔](https://seaborn.pydata.org/generated/seaborn.lineplot.html) 中的各種構建方法。嘗試使用文檔中列出的其他方法來增強您在本課中構建的折線圖。 ## 作業 [深入蜂巢](assignment.md) @@ -184,4 +185,4 @@ ax.figure.legend(); --- **免責聲明**: -本文件已使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。雖然我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵資訊,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或誤釋不承擔責任。 \ No newline at end of file +本文件使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原始語言的文件作為權威來源。對於關鍵資訊,建議尋求專業人工翻譯。我們對因使用此翻譯而產生的任何誤解或錯誤解讀概不負責。 \ No newline at end of file diff --git a/translations/mr/3-Data-Visualization/12-visualization-relationships/README.md b/translations/mr/3-Data-Visualization/12-visualization-relationships/README.md index 7c0dde2e..41154d74 100644 --- a/translations/mr/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/mr/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ -# Memvisualkan Hubungan: Semua Tentang Madu 🍯 +# Visualisasi Hubungan: Semua Tentang Madu 🍯 |![ Sketchnote oleh [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|Memvisualkan Hubungan - _Sketchnote oleh [@nitya](https://twitter.com/nitya)_ | +|Visualisasi Hubungan - _Sketchnote oleh [@nitya](https://twitter.com/nitya)_ | Meneruskan fokus kajian kita terhadap alam semula jadi, mari kita terokai visualisasi menarik untuk menunjukkan hubungan antara pelbagai jenis madu, berdasarkan dataset yang diperoleh daripada [Jabatan Pertanian Amerika Syarikat](https://www.nass.usda.gov/About_NASS/index.php). Dataset ini mengandungi kira-kira 600 item yang memaparkan pengeluaran madu di banyak negeri di Amerika Syarikat. Sebagai contoh, anda boleh melihat bilangan koloni, hasil per koloni, jumlah pengeluaran, stok, harga per paun, dan nilai madu yang dihasilkan di negeri tertentu dari tahun 1998-2012, dengan satu baris data bagi setiap tahun untuk setiap negeri. -Adalah menarik untuk memvisualkan hubungan antara pengeluaran tahunan negeri tertentu dan, sebagai contoh, harga madu di negeri tersebut. Sebagai alternatif, anda boleh memvisualkan hubungan antara hasil madu per koloni di negeri-negeri. Tempoh tahun ini merangkumi 'CCD' atau 'Colony Collapse Disorder' yang pertama kali dilihat pada tahun 2006 (http://npic.orst.edu/envir/ccd.html), menjadikannya dataset yang menyentuh hati untuk dikaji. 🐝 +Adalah menarik untuk memvisualisasikan hubungan antara pengeluaran tahunan negeri tertentu dan, sebagai contoh, harga madu di negeri tersebut. Sebagai alternatif, anda boleh memvisualisasikan hubungan antara hasil madu per koloni di negeri-negeri. Tempoh tahun ini meliputi 'CCD' atau 'Colony Collapse Disorder' yang pertama kali dilihat pada tahun 2006 (http://npic.orst.edu/envir/ccd.html), menjadikannya dataset yang bermakna untuk dikaji. 🐝 ## [Kuiz pra-pelajaran](https://ff-quizzes.netlify.app/en/ds/quiz/22) -Dalam pelajaran ini, anda boleh menggunakan Seaborn, yang telah anda gunakan sebelum ini, sebagai perpustakaan yang baik untuk memvisualkan hubungan antara pemboleh ubah. Yang paling menarik ialah penggunaan fungsi `relplot` Seaborn yang membolehkan plot taburan dan plot garis untuk memvisualkan '[hubungan statistik](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' dengan cepat, yang membantu saintis data memahami bagaimana pemboleh ubah saling berkaitan. +Dalam pelajaran ini, anda boleh menggunakan Seaborn, yang telah anda gunakan sebelum ini, sebagai perpustakaan yang baik untuk memvisualisasikan hubungan antara pemboleh ubah. Yang paling menarik ialah penggunaan fungsi `relplot` Seaborn yang membolehkan plot taburan dan plot garis untuk dengan cepat memvisualisasikan '[hubungan statistik](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', yang membantu saintis data memahami dengan lebih baik bagaimana pemboleh ubah saling berkaitan. ## Scatterplots @@ -40,56 +40,56 @@ Anda akan perasan bahawa data madu mempunyai beberapa kolum menarik, termasuk ta | negeri | numcol | hasilpercol | jumlahprod | stok | hargaperlb | nilaiprod | tahun | | ------ | ------ | ----------- | ---------- | -------- | ---------- | --------- | ----- | -| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | -| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | -| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | +| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | +| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | +| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | Buat scatterplot asas untuk menunjukkan hubungan antara harga per paun madu dan negeri asalnya di Amerika Syarikat. Jadikan paksi `y` cukup tinggi untuk memaparkan semua negeri: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.ms.png) Sekarang, tunjukkan data yang sama dengan skema warna madu untuk menunjukkan bagaimana harga berkembang dari tahun ke tahun. Anda boleh melakukannya dengan menambah parameter 'hue' untuk menunjukkan perubahan dari tahun ke tahun: -> ✅ Ketahui lebih lanjut tentang [palet warna yang boleh anda gunakan dalam Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - cuba skema warna pelangi yang indah! +> ✅ Ketahui lebih lanjut tentang [palet warna yang boleh digunakan dalam Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - cuba skema warna pelangi yang indah! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.ms.png) -Dengan perubahan skema warna ini, anda dapat melihat bahawa terdapat perkembangan yang jelas dari tahun ke tahun dalam harga madu per paun. Malah, jika anda melihat set sampel dalam data untuk mengesahkan (pilih negeri tertentu, Arizona sebagai contoh), anda dapat melihat pola kenaikan harga dari tahun ke tahun, dengan beberapa pengecualian: +Dengan perubahan skema warna ini, anda dapat melihat dengan jelas perkembangan yang kuat dari tahun ke tahun dalam harga madu per paun. Malah, jika anda melihat set sampel dalam data untuk mengesahkan (pilih negeri tertentu, contohnya Arizona), anda dapat melihat pola kenaikan harga dari tahun ke tahun, dengan beberapa pengecualian: | negeri | numcol | hasilpercol | jumlahprod | stok | hargaperlb | nilaiprod | tahun | | ------ | ------ | ----------- | ---------- | ------- | ---------- | --------- | ----- | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | -| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | -| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | -| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | -| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | -| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | -| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | -| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | -| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | -| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | -| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | -| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | -| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | -| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | - -Cara lain untuk memvisualkan perkembangan ini adalah dengan menggunakan saiz, bukannya warna. Untuk pengguna yang buta warna, ini mungkin pilihan yang lebih baik. Edit visualisasi anda untuk menunjukkan kenaikan harga dengan peningkatan saiz titik: +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | +| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | +| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | +| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | +| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | +| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | +| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | +| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | +| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | +| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | +| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | +| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | +| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | +| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | + +Cara lain untuk memvisualisasikan perkembangan ini adalah dengan menggunakan saiz, bukannya warna. Untuk pengguna yang buta warna, ini mungkin pilihan yang lebih baik. Edit visualisasi anda untuk menunjukkan kenaikan harga dengan kenaikan saiz titik: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` Anda dapat melihat saiz titik semakin besar. -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.ms.png) Adakah ini kes mudah permintaan dan penawaran? Disebabkan faktor seperti perubahan iklim dan keruntuhan koloni, adakah madu semakin kurang tersedia untuk dibeli dari tahun ke tahun, dan oleh itu harga meningkat? @@ -104,7 +104,7 @@ sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` Jawapan: Ya, dengan beberapa pengecualian sekitar tahun 2003: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.ms.png) ✅ Oleh kerana Seaborn mengagregatkan data di sekitar satu garis, ia memaparkan "pengukuran berganda pada setiap nilai x dengan memplotkan purata dan selang keyakinan 95% di sekitar purata". [Sumber](https://seaborn.pydata.org/tutorial/relational.html). Tingkah laku yang memakan masa ini boleh dilumpuhkan dengan menambah `ci=None`. @@ -114,19 +114,19 @@ Soalan: Nah, pada tahun 2003 adakah kita juga melihat lonjakan dalam bekalan mad sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.ms.png) -Jawapan: Tidak begitu. Jika anda melihat jumlah pengeluaran, ia sebenarnya kelihatan meningkat pada tahun tersebut, walaupun secara umumnya jumlah madu yang dihasilkan semakin menurun sepanjang tahun-tahun ini. +Jawapan: Tidak begitu. Jika anda melihat jumlah pengeluaran, ia sebenarnya kelihatan meningkat pada tahun tersebut, walaupun secara amnya jumlah madu yang dihasilkan menurun sepanjang tahun-tahun ini. Soalan: Dalam kes itu, apa yang boleh menyebabkan lonjakan harga madu sekitar tahun 2003? -Untuk menemui ini, anda boleh menerokai grid facet. +Untuk menemui ini, anda boleh menerokai grid faset. -## Grid Facet +## Grid Faset -Grid facet mengambil satu aspek dataset anda (dalam kes kita, anda boleh memilih 'tahun' untuk mengelakkan terlalu banyak facet dihasilkan). Seaborn kemudian boleh membuat plot untuk setiap aspek tersebut berdasarkan koordinat x dan y yang anda pilih untuk perbandingan visual yang lebih mudah. Adakah tahun 2003 menonjol dalam jenis perbandingan ini? +Grid faset mengambil satu faset dataset anda (dalam kes ini, anda boleh memilih 'tahun' untuk mengelakkan terlalu banyak faset dihasilkan). Seaborn kemudian boleh membuat plot untuk setiap faset koordinat x dan y yang anda pilih untuk perbandingan visual yang lebih mudah. Adakah tahun 2003 menonjol dalam jenis perbandingan ini? -Cipta grid facet dengan terus menggunakan `relplot` seperti yang disyorkan oleh [dokumentasi Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid). +Buat grid faset dengan terus menggunakan `relplot` seperti yang disarankan oleh [dokumentasi Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid). ```python sns.relplot( @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -Dalam visualisasi ini, anda boleh membandingkan hasil per koloni dan bilangan koloni dari tahun ke tahun, bersebelahan dengan wrap yang ditetapkan pada 3 untuk kolum: +Dalam visualisasi ini, anda boleh membandingkan hasil per koloni dan bilangan koloni dari tahun ke tahun, bersebelahan dengan susunan kolum sebanyak 3: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.ms.png) -Untuk dataset ini, tiada apa yang menonjol berkaitan dengan bilangan koloni dan hasilnya, dari tahun ke tahun dan negeri ke negeri. Adakah terdapat cara lain untuk mencari korelasi antara dua pemboleh ubah ini? +Untuk dataset ini, tiada apa yang benar-benar menonjol berkaitan dengan bilangan koloni dan hasilnya, dari tahun ke tahun dan negeri ke negeri. Adakah terdapat cara lain untuk mencari korelasi antara dua pemboleh ubah ini? ## Plot Garis Berganda -Cuba plot garis berganda dengan meletakkan dua plot garis di atas satu sama lain, menggunakan 'despine' Seaborn untuk menghapuskan tulang belakang atas dan kanan mereka, dan menggunakan `ax.twinx` [yang diperoleh daripada Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx membolehkan carta berkongsi paksi x dan memaparkan dua paksi y. Jadi, paparkan hasil per koloni dan bilangan koloni, yang disuperimposkan: +Cuba plot garis berganda dengan meletakkan dua plot garis di atas satu sama lain, menggunakan 'despine' Seaborn untuk menghapuskan tulang belakang atas dan kanan mereka, dan menggunakan `ax.twinx` [yang berasal dari Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx membolehkan carta berkongsi paksi x dan memaparkan dua paksi y. Jadi, paparkan hasil per koloni dan bilangan koloni, bertindih: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,18 +162,18 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.ms.png) -Walaupun tiada apa yang menonjol pada mata sekitar tahun 2003, ia membolehkan kita mengakhiri pelajaran ini dengan nota yang sedikit lebih gembira: walaupun terdapat penurunan bilangan koloni secara keseluruhan, bilangan koloni semakin stabil walaupun hasil per koloni semakin berkurangan. +Walaupun tiada apa yang menonjol di mata sekitar tahun 2003, ia membolehkan kita mengakhiri pelajaran ini dengan nota yang sedikit lebih gembira: walaupun terdapat penurunan bilangan koloni secara keseluruhan, bilangan koloni semakin stabil walaupun hasil per koloni semakin menurun. Teruskan, lebah, teruskan! 🐝❤️ ## 🚀 Cabaran -Dalam pelajaran ini, anda belajar sedikit lagi tentang kegunaan scatterplot dan grid garis, termasuk grid facet. Cabar diri anda untuk mencipta grid facet menggunakan dataset yang berbeza, mungkin yang anda gunakan sebelum pelajaran ini. Perhatikan berapa lama masa yang diambil untuk mencipta dan bagaimana anda perlu berhati-hati tentang berapa banyak grid yang perlu anda lukis menggunakan teknik ini. +Dalam pelajaran ini, anda belajar sedikit lagi tentang kegunaan lain scatterplots dan grid garis, termasuk grid faset. Cabar diri anda untuk mencipta grid faset menggunakan dataset yang berbeza, mungkin yang anda gunakan sebelum pelajaran ini. Perhatikan berapa lama masa yang diambil untuk mencipta dan bagaimana anda perlu berhati-hati tentang berapa banyak grid yang perlu anda lukis menggunakan teknik ini. -## [Kuiz selepas pelajaran](https://ff-quizzes.netlify.app/en/ds/quiz/23) +## [Kuiz pasca-pelajaran](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## Ulasan & Kajian Kendiri diff --git a/translations/my/3-Data-Visualization/12-visualization-relationships/README.md b/translations/my/3-Data-Visualization/12-visualization-relationships/README.md index fb2de0c8..fe63026b 100644 --- a/translations/my/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/my/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,33 +1,33 @@ -# ဆက်ဆံရေးများကို မြင်သာအောင် ဖော်ပြခြင်း: ပျားရည်အကြောင်း 🍯 +# ဆက်ဆံရေးများကိုမြင်နိုင်စေခြင်း: ပျားရည်အကြောင်း 🍯 |![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|ဆက်ဆံရေးများကို မြင်သာအောင် ဖော်ပြခြင်း - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +|ဆက်ဆံရေးများကိုမြင်နိုင်စေခြင်း - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -သဘာဝကို အခြေခံထားသော ကျွန်ုပ်တို့၏ သုတေသနကို ဆက်လက်လုပ်ဆောင်ရင်း၊ [အမေရိကန် စိုက်ပျိုးရေးဌာန](https://www.nass.usda.gov/About_NASS/index.php) မှ ရရှိသော ဒေတာအရ ပျားရည်အမျိုးမျိုးကြား ဆက်ဆံရေးများကို ဖော်ပြရန် စိတ်ဝင်စားဖွယ် မြင်ကွင်းများကို ရှာဖွေကြမည်။ +သဘာဝအပေါ်အာရုံစိုက်သော ကျွန်ုပ်တို့၏သုတေသနကို ဆက်လက်လုပ်ဆောင်ရင်း၊ အမျိုးမျိုးသောပျားရည်အမျိုးအစားများအကြား ဆက်ဆံရေးများကို ပြသနိုင်ရန် စိတ်ဝင်စားဖွယ်မြင်ကွင်းများကို ရှာဖွေကြမည်။ ဒီအချက်အလက်များကို [အမေရိကန်စိုက်ပျိုးရေးဌာန](https://www.nass.usda.gov/About_NASS/index.php) မှရရှိသော ဒေတာအရ ပြသထားပါသည်။ -ဤဒေတာတွင် အမေရိကန်ပြည်နယ်များစွာမှ ပျားရည်ထုတ်လုပ်မှုကို ဖော်ပြထားပြီး၊ ၁၉၉၈-၂၀၁၂ ခုနှစ်အတွင်း ပြည်နယ်တစ်ခုစီ၏ တစ်နှစ်စာ ဒေတာတစ်ကြောင်းစီပါဝင်သည်။ ဥပမာအားဖြင့်၊ ပြည်နယ်တစ်ခု၏ ပျားအုံအရေအတွက်၊ တစ်အုံလျှင် ထွက်ရှိမှု၊ စုစုပေါင်းထုတ်လုပ်မှု၊ စတော့များ၊ တစ်ပေါင်လျှင်ဈေးနှုန်းနှင့် ထုတ်လုပ်မှုတန်ဖိုးတို့ကို ကြည့်နိုင်ပါသည်။ +ဤဒေတာတွင် ၆၀၀ ကျော်သော အချက်အလက်များပါဝင်ပြီး အမေရိကန်ပြည်နယ်များတွင် ပျားရည်ထုတ်လုပ်မှုကို ပြသထားသည်။ ဥပမာအားဖြင့်၊ ၁၉၉၈-၂၀၁၂ ခုနှစ်အတွင်း တစ်နှစ်စီအတွက် တစ်ပြည်နယ်စီ၏ ပျားအုပ်အရေအတွက်၊ တစ်ပျားအုပ်၏ထွက်ရှိမှု၊ စုစုပေါင်းထုတ်လုပ်မှု၊ စတော့များ၊ တစ်ပေါင်စျေးနှုန်းနှင့် ထုတ်လုပ်မှုတန်ဖိုးတို့ကို ကြည့်နိုင်ပါသည်။ -ဥပမာအားဖြင့်၊ တစ်နှစ်နှင့်တစ်နှစ်အတွင်း ပြည်နယ်တစ်ခု၏ ထုတ်လုပ်မှုနှင့် ပျားရည်ဈေးနှုန်းကြား ဆက်ဆံရေးကို မြင်သာအောင် ဖော်ပြနိုင်ပါသည်။ ဒါမှမဟုတ်၊ တစ်အုံလျှင် ထွက်ရှိမှုနှင့် ပြည်နယ်များကြား ဆက်ဆံရေးကို ဖော်ပြနိုင်ပါသည်။ ဤနှစ်များတွင် ၂၀၀၆ ခုနှစ်တွင် ပထမဆုံးတွေ့ရှိခဲ့သော 'ပျားအုံပျက်စီးမှုရောဂါ (CCD)' (http://npic.orst.edu/envir/ccd.html) ပါဝင်သောကြောင့် ဤဒေတာသည် လေ့လာရန် အရေးကြီးသော ဒေတာတစ်ခုဖြစ်သည်။ 🐝 +တစ်ပြည်နယ်၏ တစ်နှစ်စီထုတ်လုပ်မှုနှင့် ထိုပြည်နယ်ရှိ ပျားရည်စျေးနှုန်းအကြား ဆက်ဆံရေးကို မြင်နိုင်စေခြင်း စိတ်ဝင်စားဖွယ်ဖြစ်ပါသည်။ ဒါမှမဟုတ်၊ တစ်ပြည်နယ်စီ၏ တစ်ပျားအုပ်ထွက်ရှိမှုအကြား ဆက်ဆံရေးကို မြင်နိုင်စေခြင်းဖြစ်နိုင်ပါသည်။ ဤနှစ်အကွာအဝေးသည် ၂၀၀၆ ခုနှစ်တွင် ပထမဆုံးတွေ့ရှိခဲ့သော 'CCD' သို့မဟုတ် 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) ကိုလည်း ဖော်ပြထားသော ဒေတာဖြစ်ပြီး လေ့လာရန်အရေးကြီးသော ဒေတာဖြစ်သည်။ 🐝 ## [Pre-lecture quiz](https://ff-quizzes.netlify.app/en/ds/quiz/22) -ဤသင်ခန်းစာတွင်၊ သင်မကြာသေးမီက အသုံးပြုခဲ့သော Seaborn ကို အသုံးပြုနိုင်ပြီး၊ အပြောင်းအလဲများကြား ဆက်ဆံရေးများကို မြင်သာအောင် ဖော်ပြရန် ကောင်းမွန်သော စာကြည့်တိုက်တစ်ခုဖြစ်သည်။ အထူးသဖြင့် Seaborn ၏ `relplot` function ကို အသုံးပြုခြင်းဖြင့် scatter plot နှင့် line plot များကို အလွယ်တကူ ဖော်ပြနိုင်ပြီး၊ '[statistical relationships](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' ကို မြင်သာစေကာ ဒေတာသိပ္ပံပညာရှင်များအနေဖြင့် အပြောင်းအလဲများကြား ဆက်ဆံရေးကို ပိုမိုနားလည်စေသည်။ +ဤသင်ခန်းစာတွင် သင်မကြာသေးမီက အသုံးပြုခဲ့သော Seaborn ကို အသုံးပြုနိုင်ပြီး အပြောင်းအလဲများအကြား ဆက်ဆံရေးများကို မြင်နိုင်စေသော စာကြည့်တိုက်ကောင်းတစ်ခုဖြစ်သည်။ အထူးသဖြင့် Seaborn ၏ `relplot` function ကို အသုံးပြုခြင်းဖြင့် scatter plots နှင့် line plots ကို အလွယ်တကူဖော်ဆောင်နိုင်ပြီး '[statistical relationships](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' ကို မြင်နိုင်စေသည်။ ဒါဟာ ဒေတာသိပ္ပံပညာရှင်များအတွက် အပြောင်းအလဲများအကြား ဆက်ဆံရေးကို ပိုမိုနားလည်စေသည်။ ## Scatterplots -ပျားရည်ဈေးနှုန်းသည် တစ်နှစ်နှင့်တစ်နှစ်အတွင်း ပြည်နယ်အလိုက် ဘယ်လိုပြောင်းလဲလာသည်ကို scatterplot ဖြင့် ဖော်ပြပါ။ Seaborn ၏ `relplot` ကို အသုံးပြုခြင်းဖြင့် ပြည်နယ်ဒေတာများကို အုပ်စုဖွဲ့ပြီး၊ အမျိုးအစားနှင့် ကိန်းဂဏန်းဒေတာများအတွက် ဒေတာအမှတ်များကို ဖော်ပြနိုင်သည်။ +ပျားရည်စျေးနှုန်းသည် တစ်နှစ်စီ၊ တစ်ပြည်နယ်စီတွင် ဘယ်လိုပြောင်းလဲလာသည်ကို scatterplot ဖြင့် ပြသပါ။ Seaborn ၏ `relplot` ကို အသုံးပြုခြင်းဖြင့် ပြည်နယ်ဒေတာများကို အုပ်စုဖွဲ့ပြီး အမျိုးအစားနှင့် ကိန်းဂဏန်းဒေတာများအတွက် အချက်အလက်များကို ပြသနိုင်သည်။ -ပထမဦးစွာ ဒေတာနှင့် Seaborn ကို သွင်းယူပါ- +ပျားရည်ဒေတာကို Seaborn နှင့်အတူ စတင်တင်သွင်းပါ: ```python import pandas as pd @@ -35,8 +35,8 @@ import matplotlib.pyplot as plt import seaborn as sns honey = pd.read_csv('../../data/honey.csv') honey.head() -``` -ပျားရည်ဒေတာတွင် တစ်နှစ်နှင့် တစ်ပေါင်လျှင်ဈေးနှုန်းအပါအဝင် စိတ်ဝင်စားဖွယ် ကော်လံများရှိသည်ကို သတိပြုမိပါသည်။ အမေရိကန်ပြည်နယ်အလိုက် အုပ်စုဖွဲ့ထားသော ဒေတာကို စူးစမ်းကြည့်ပါ- +``` +ပျားရည်ဒေတာတွင် နှစ်နှင့် တစ်ပေါင်စျေးနှုန်းတို့အပါအဝင် စိတ်ဝင်စားဖွယ်ကောင်းသော ကော်လံများရှိသည်ကို သတိပြုမိပါသည်။ အမေရိကန်ပြည်နယ်များအလိုက် အုပ်စုဖွဲ့ထားသော ဒေတာကို လေ့လာကြည့်ပါ: | state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | | ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | @@ -46,23 +46,23 @@ honey.head() | CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | | CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -ပျားရည်ဈေးနှုန်းနှင့် အမေရိကန်ပြည်နယ်တို့ကြား ဆက်ဆံရေးကို ဖော်ပြရန် အခြေခံ scatterplot တစ်ခု ဖန်တီးပါ။ `y` ဂဏန်းတန်းကို ပြည်နယ်အားလုံးကို ဖော်ပြနိုင်အောင် ရှည်လျားစေပါ- +ပျားရည်တစ်ပေါင်စျေးနှုန်းနှင့် ၎င်း၏ အမေရိကန်ပြည်နယ်မူလအကြား ဆက်ဆံရေးကို ပြသရန် အခြေခံ scatterplot တစ်ခု ဖန်တီးပါ။ `y` axis ကို ပြည်နယ်အားလုံးကို ပြသနိုင်ရန် ရှည်လျားစေပါ: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); -``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +``` +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.my.png) -ယခု၊ ပျားရည်အရောင်စနစ်ကို အသုံးပြု၍ ဈေးနှုန်းသည် တစ်နှစ်နှင့်တစ်နှစ်အတွင်း ဘယ်လိုပြောင်းလဲလာသည်ကို ဖော်ပြပါ။ ဤအရာကို 'hue' parameter ကို ထည့်သွင်းခြင်းဖြင့် ပြုလုပ်နိုင်ပြီး၊ တစ်နှစ်နှင့်တစ်နှစ်အတွင်း ပြောင်းလဲမှုကို ဖော်ပြသည်- +ယခုနှစ်အလိုက် ပျားရည်စျေးနှုန်းသည် ဘယ်လိုပြောင်းလဲလာသည်ကို ပျားရည်အရောင်စနစ်ဖြင့် ပြသပါ။ ၎င်းကို 'hue' parameter ကို ထည့်သွင်းခြင်းဖြင့် ပြုလုပ်နိုင်ပြီး နှစ်အလိုက် ပြောင်းလဲမှုကို ပြသနိုင်သည်: -> ✅ [Seaborn ၏ အရောင်စနစ်များ](https://seaborn.pydata.org/tutorial/color_palettes.html) အကြောင်းပိုမိုလေ့လာပါ - သင့်တင့်သော rainbow အရောင်စနစ်ကို စမ်းကြည့်ပါ! +> ✅ Seaborn တွင် အသုံးပြုနိုင်သော [အရောင်ပလက်တီများ](https://seaborn.pydata.org/tutorial/color_palettes.html) အကြောင်းပိုမိုလေ့လာပါ - လှပသော rainbow အရောင်စနစ်ကို စမ်းကြည့်ပါ! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); -``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) +``` +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.my.png) -ဤအရောင်စနစ်ပြောင်းလဲမှုဖြင့်၊ ပျားရည်ဈေးနှုန်းသည် တစ်နှစ်နှင့်တစ်နှစ်အတွင်း တိုးတက်လာသည်ကို အလွယ်တကူမြင်နိုင်ပါသည်။ ဥပမာအားဖြင့် Arizona ပြည်နယ်ကို ရွေးချယ်ပြီး ဒေတာတစ်စုကို စစ်ဆေးပါက၊ အချို့သောအထွေထွေကိစ္စများမှလွဲ၍ တစ်နှစ်နှင့်တစ်နှစ်အတွင်း ဈေးနှုန်းတိုးတက်မှုပုံစံကို တွေ့နိုင်ပါသည်- +ဤအရောင်စနစ်ပြောင်းလဲမှုဖြင့် ပျားရည်တစ်ပေါင်စျေးနှုန်းသည် နှစ်အလိုက် အားကောင်းစွာတိုးတက်လာသည်ကို မြင်နိုင်ပါသည်။ အမှန်တကယ်၊ ဒေတာထဲမှ နမူနာတစ်ခုကို စစ်ဆေးပါက (ဥပမာအားဖြင့် Arizona) နှစ်အလိုက် စျေးနှုန်းတိုးတက်မှုပုံစံကို အချို့သောကိစ္စများမှလွဲ၍ မြင်နိုင်ပါသည်: | state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | | ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | @@ -82,51 +82,51 @@ sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, | AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | | AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | -အရောင်အစား dot အရွယ်အစားကို အသုံးပြု၍ ဈေးနှုန်းတိုးတက်မှုကို ဖော်ပြပါ။ အရောင်မမြင်နိုင်သူများအတွက် ဤနည်းလမ်းသည် ပိုမိုကောင်းမွန်နိုင်ပါသည်။ dot circumference တိုးတက်မှုဖြင့် ဈေးနှုန်းတိုးတက်မှုကို ဖော်ပြရန် သင့် visualization ကို ပြင်ဆင်ပါ- +အရောင်မမြင်နိုင်သောသူများအတွက် အရောင်အစား dot size ကို အသုံးပြုခြင်းသည် ပိုမိုကောင်းမွန်နိုင်သည်။ dot circumference တိုးတက်မှုဖြင့် စျေးနှုန်းတိုးတက်မှုကို ပြသရန် visualization ကို ပြင်ဆင်ပါ: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); -``` -dot အရွယ်အစားသည် တဖြည်းဖြည်း တိုးတက်လာသည်ကို မြင်နိုင်ပါသည်။ +``` +dot size များသည် တဖြည်းဖြည်းကြီးလာသည်ကို မြင်နိုင်ပါသည်။ -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.my.png) -ဤအရာသည် တိုးတက်မှုနှင့် တိုက်ရိုက်ဆက်နွယ်မှုရှိသော supply နှင့် demand ရဲ့ ရိုးရှင်းသောအခြေအနေဖြစ်နိုင်ပါသလား။ ရာသီဥတုပြောင်းလဲမှုနှင့် ပျားအုံပျက်စီးမှုကြောင့် တစ်နှစ်နှင့်တစ်နှစ်အတွင်း ဝယ်ယူနိုင်သော ပျားရည်ပမာဏ လျော့နည်းလာပြီး ဈေးနှုန်းတိုးတက်လာသလား။ +ဤသည်မှာ supply နှင့် demand ရိုးရှင်းသောအကြောင်းအရာဖြစ်ပါသလား။ ရာသီဥတုပြောင်းလဲမှုနှင့် colony collapse ကဲ့သို့သောအကြောင်းအရာများကြောင့် နှစ်အလိုက် ဝယ်ယူနိုင်သော ပျားရည်ပမာဏလျော့နည်းလာပြီး စျေးနှုန်းတိုးတက်လာပါသလား။ -ဤဒေတာတွင် အချို့သော variable များကြား ဆက်နွယ်မှုကို ရှာဖွေရန်၊ line chart များကို စူးစမ်းကြည့်ပါ။ +ဤဒေတာတွင် အချို့သောအပြောင်းအလဲများအကြား ဆက်ဆံရေးကို ရှာဖွေရန် line charts များကို လေ့လာကြည့်ပါ။ ## Line charts -မေးခွန်း- တစ်နှစ်နှင့်တစ်နှစ်အတွင်း ပျားရည်တစ်ပေါင်ဈေးနှုန်းသည် တိုးတက်မှုရှိပါသလား။ single line chart တစ်ခုဖန်တီးခြင်းဖြင့် အလွယ်တကူ ရှာဖွေနိုင်ပါသည်- +မေးခွန်း- ပျားရည်တစ်ပေါင်စျေးနှုန်းသည် နှစ်အလိုက် တိုးတက်မှုရှိပါသလား။ single line chart တစ်ခုဖန်တီးခြင်းဖြင့် အလွယ်တကူရှာဖွေနိုင်ပါသည်။ ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); -``` -အဖြေ- ဟုတ်ကဲ့၊ ၂၀၀၃ ခုနှစ်အနီးတွင် အချို့သောအထွေထွေကိစ္စများမှလွဲ၍- +``` +အဖြေ- ဟုတ်ပါသည်၊ ၂၀၀၃ ခုနှစ်အနီးတွင် အချို့သောကွဲလွဲမှုများရှိသည်။ -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.my.png) -✅ Seaborn သည် တစ်ကြောင်းတည်းကို အချက်အလက်များစုစည်းပြီး၊ "x value တစ်ခုစီတွင် အနိမ့်ဆုံးနှင့် အမြင့်ဆုံး ၉၅% ယုံကြည်မှုအကွာအဝေးကို ဖော်ပြသည်"။ [ရင်းမြစ်](https://seaborn.pydata.org/tutorial/relational.html)။ ဤအချိန်စားလုပ်ဆောင်မှုကို `ci=None` ဖြင့် ပိတ်ထားနိုင်သည်။ +✅ Seaborn သည် တစ်ခုတည်းသောလိုင်းပေါ်တွင် ဒေတာကို စုစည်းထားပြီး "x value တစ်ခုစီတွင် အမျိုးမျိုးသောတိုင်းတာမှုများကို mean နှင့် mean အပေါ် 95% confidence interval ကို ပြသခြင်းဖြင့်" ဖော်ပြသည်။ [အရင်းအမြစ်](https://seaborn.pydata.org/tutorial/relational.html)။ ဤအချိန်စားသောအပြုအမူကို `ci=None` ထည့်သွင်းခြင်းဖြင့် ပယ်ဖျက်နိုင်သည်။ -မေးခွန်း- ၂၀၀၃ ခုနှစ်တွင် ပျားရည်ထုတ်လုပ်မှုတွင်လည်း တိုးတက်မှုရှိပါသလား။ တစ်နှစ်နှင့်တစ်နှစ်အတွင်း စုစုပေါင်းထုတ်လုပ်မှုကို ကြည့်ပါ- +မေးခွန်း- ၂၀၀၃ ခုနှစ်တွင် ပျားရည်ပမာဏတက်လာမှုကိုလည်း မြင်နိုင်ပါသလား။ နှစ်အလိုက် စုစုပေါင်းထုတ်လုပ်မှုကို ကြည့်ပါ။ ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); -``` +``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.my.png) -အဖြေ- မဟုတ်ပါ။ စုစုပေါင်းထုတ်လုပ်မှုကို ကြည့်ပါက၊ အထူးသဖြင့် ၂၀၀၃ ခုနှစ်တွင် တိုးတက်မှုရှိသော်လည်း၊ ယခုနှစ်များတွင် ပျားရည်ထုတ်လုပ်မှုသည် လျော့နည်းလာသည်ကို တွေ့နိုင်ပါသည်။ +အဖြေ- အမှန်တကယ်မဟုတ်ပါ။ စုစုပေါင်းထုတ်လုပ်မှုကို ကြည့်ပါက ထိုနှစ်တွင် တိုးတက်လာသလိုပုံရပြီး၊ ယေဘူယျအားဖြင့် ထိုနှစ်များအတွင်း ပျားရည်ထုတ်လုပ်မှုပမာဏသည် လျော့နည်းလာသည်ကို မြင်နိုင်ပါသည်။ -မေးခွန်း- ဤအခြေအနေတွင် ၂၀၀၃ ခုနှစ်တွင် ပျားရည်ဈေးနှုန်းတက်လာမှုကို ဘာက ဖြစ်စေခဲ့ပါသလဲ။ +မေးခွန်း- ထိုကွာဟမှုကို ၂၀၀၃ ခုနှစ်တွင် ပျားရည်စျေးနှုန်းတက်လာမှုအကြောင်းရင်းဖြစ်စေသောအရာများကို ရှာဖွေပါ။ -ဤအဖြေကို ရှာဖွေရန်၊ facet grid ကို စမ်းကြည့်ပါ။ +ဤအကြောင်းကို facet grid ကို အသုံးပြု၍ ရှာဖွေပါ။ ## Facet grids -Facet grid သည် ဒေတာ၏ တစ်ခုတည်းသော facet (ဤအခါတွင် 'year' ကို ရွေးချယ်ပါ) ကို အသုံးပြုသည်။ Seaborn သည် x နှင့် y ကိုယ်ရေးအချက်အလက်များအတွက် plot တစ်ခုစီ ဖန်တီးပြီး၊ အလွယ်တကူ နှိုင်းယှဉ်ကြည့်နိုင်စေရန် ဖော်ပြသည်။ ၂၀၀၃ ခုနှစ်သည် ဤအမျိုးအစားတွင် ထူးခြားမှုရှိပါသလား။ +Facet grids သည် ဒေတာ၏ တစ်ခုတည်းသော facet ကို (ဤကိစ္စတွင် 'year' ကို ရွေးချယ်ပါ) အသုံးပြု၍ သင့်ရွေးချယ်ထားသော x နှင့် y coordinates အတွက် plot တစ်ခုစီကို ဖန်တီးနိုင်သည်။ ၂၀၀၃ ခုနှစ်သည် ဤမျိုးအမျိုးခြားခြင်းတွင် ထူးထူးခြားခြားပေါ်လွင်ပါသလား။ -Seaborn ၏ [documentation](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) အကြံပြုချက်အတိုင်း `relplot` ကို ဆက်လက်အသုံးပြု၍ facet grid တစ်ခု ဖန်တီးပါ။ +Seaborn ၏ [FacetGrid documentation](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) မှ အကြံပြုထားသော `relplot` ကို ဆက်လက်အသုံးပြု၍ facet grid တစ်ခုဖန်တီးပါ။ ```python sns.relplot( @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" -``` -ဤ visualization တွင်၊ တစ်နှစ်နှင့်တစ်နှစ်အတွင်း yield per colony နှင့် number of colonies ကို နှိုင်းယှဉ်ကြည့်နိုင်ပါသည်- + ) +``` +ဤ visualization တွင် yield per colony နှင့် number of colonies ကို နှစ်အလိုက်၊ ပြည်နယ်အလိုက် wrap ကို 3 column အဖြစ်ထားပြီး ဘက်ဘက်ကွဲကွဲနှိုင်းယှဉ်နိုင်သည်။ -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.my.png) -ဤဒေတာအတွက်၊ တစ်နှစ်နှင့်တစ်နှစ်အတွင်းနှင့် ပြည်နယ်အလိုက် colony အရေအတွက်နှင့် yield ကြား ထူးခြားမှုမရှိပါ။ ဤ variable နှစ်ခုကြား correlation ရှာဖွေရန် အခြားနည်းလမ်းရှိပါသလား။ +ဤဒေတာအတွက်၊ နှစ်အလိုက်၊ ပြည်နယ်အလိုက် number of colonies နှင့် yield အကြား ထူးထူးခြားခြားသောအရာများမရှိပါ။ ဤ variable နှစ်ခုအကြား correlation ရှာဖွေခြင်းအတွက် အခြားနည်းလမ်းတစ်ခုရှိပါသလား။ ## Dual-line Plots -Seaborn ၏ 'despine' ကို အသုံးပြု၍ အပေါ်နှင့် ညာဘက် spines ကို ဖယ်ရှားပြီး၊ Matplotlib မှ [ax.twinx](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) ကို အသုံးပြု၍ dual-line plot တစ်ခု ဖန်တီးပါ။ Twinx သည် x axis ကို မျှဝေပြီး y axis နှစ်ခုကို ဖော်ပြနိုင်သည်။ yield per colony နှင့် number of colonies ကို superimposed ဖော်ပြပါ- +Seaborn ၏ 'despine' ကို အသုံးပြု၍ ထိပ်နှင့်ညာဘက် spines ကို ဖယ်ရှားပြီး Matplotlib မှ [ax.twinx](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) ကို အသုံးပြု၍ multiline plot တစ်ခုကို စမ်းကြည့်ပါ။ Twinx သည် chart တစ်ခုကို x axis ကိုမျှဝေပြီး y axes နှစ်ခုကို ပြသနိုင်သည်။ yield per colony နှင့် number of colonies ကို superimposed ပြသပါ: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -160,24 +161,25 @@ lineplot2 = sns.lineplot(x=honey['year'], y=honey['yieldpercol'], ax=ax2, color= sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); -``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +``` +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.my.png) -၂၀၀၃ ခုနှစ်အနီးတွင် ထူးခြားမှုမရှိသော်လည်း၊ အချို့သောအရာများကို ပိုမိုပျော်ရွှင်စေသောအချက်ဖြင့် ဤသင်ခန်းစာကို အဆုံးသတ်နိုင်ပါသည်- colony အရေအတွက်သည် လျော့နည်းနေသော်လည်း၊ တစ်အုံ yield လျော့နည်းနေသော်လည်း colony အရေအတွက်သည် တည်ငြိမ်နေသည်။ +၂၀၀၃ ခုနှစ်အနီးတွင် ထူးထူးခြားခြားသောအရာများ မမြင်ရသော်လည်း၊ lesson ၏အဆုံးကို ပျော်ရွှင်စွာပြီးမြောက်စေသောအချက်တစ်ခုကို ပြသနိုင်သည်- colonies အရေအတွက်သည် လျော့နည်းနေသော်လည်း၊ ၎င်းတို့၏ yield per colony လျော့နည်းနေသည့်အချိန်တွင် colonies အရေအတွက်သည် တည်ငြိမ်နေသည်။ -ပျားများအားပေးကြပါစို့! 🐝❤️ +ပျားများအားပေးပါ။ +🐝❤️ ## 🚀 စိန်ခေါ်မှု -ဤသင်ခန်းစာတွင် scatterplot နှင့် line grid များ၏ အခြားအသုံးများအကြောင်းပိုမိုလေ့လာခဲ့ပါသည်။ သင်မကြာသေးမီက အသုံးပြုခဲ့သော ဒေတာတစ်ခုကို အသုံးပြု၍ facet grid တစ်ခု ဖန်တီးရန် ကိုယ်တိုင်စိန်ခေါ်ပါ။ ၎င်းတို့ကို ဖန်တီးရန် ကြာချိန်နှင့် grid အရေအတွက်ကို သတိထားရန် လိုအပ်ကြောင်း သတိပြုပါ။ +ဤသင်ခန်းစာတွင် scatterplots နှင့် line grids ၏ အခြားအသုံးများအကြောင်း၊ facet grids အပါအဝင် သင်လေ့လာခဲ့ပါသည်။ ယခင်သင်ခန်းစာများတွင် အသုံးပြုခဲ့သော ဒေတာတစ်ခုကို အသုံးပြု၍ facet grid တစ်ခုဖန်တီးရန် ကိုယ်တိုင်စိန်ခေါ်ပါ။ ၎င်းတို့ကို ဖန်တီးရန် ကြာမြင့်ချိန်နှင့် grid များအရေအတွက်ကို သတိထားရန်လိုအပ်သည်ကို သတိပြုပါ။ ## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## ပြန်လည်သုံးသပ်ခြင်းနှင့် ကိုယ်တိုင်လေ့လာခြင်း -Line plot များသည် ရိုးရှင်းသော်လည်း အလွန်ရှုပ်ထွေးနိုင်ပါသည်။ [Seaborn documentation](https://seaborn.pydata.org/generated/seaborn.lineplot.html) တွင် ဖော်ပြထားသော နည်းလမ်းများအကြောင်း အနည်းငယ်ဖတ်ရှုပါ။ ဤသ +Line plots များသည် ရိုးရှင်းသည့်အရာဖြစ်နိုင်သလို အလွန်ရှုပ်ထွေးနိုင်ပါသည်။ [Seaborn documentation](https://seaborn.pydata.org/generated/seaborn.lineplot.html) တွင် ဖော်ပြထားသော အမျိုးမျိုးသောနည်းလမ်းများကို ဖတ်ရှုပါ။ သင်ဤသင်ခန်းစာတွင် ဖန်တီးခဲ့သော line charts များကို documentation တွင်ဖော်ပြထားသော အခြားနည်းလမ်းများဖြင့် တိုး --- **အကြောင်းကြားချက်**: -ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု [Co-op Translator](https://github.com/Azure/co-op-translator) ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေသော်လည်း၊ အလိုအလျောက် ဘာသာပြန်မှုများတွင် အမှားများ သို့မဟုတ် မတိကျမှုများ ပါဝင်နိုင်သည်ကို သတိပြုပါ။ မူရင်းစာရွက်စာတမ်းကို ၎င်း၏ မူရင်းဘာသာစကားဖြင့် အာဏာတရားရှိသော အရင်းအမြစ်အဖြစ် သတ်မှတ်သင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူ့ဘာသာပြန်ပညာရှင်များမှ ပရော်ဖက်ရှင်နယ် ဘာသာပြန်မှုကို အကြံပြုပါသည်။ ဤဘာသာပြန်မှုကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအမှားများ သို့မဟုတ် အနားလွဲမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။ \ No newline at end of file +ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု [Co-op Translator](https://github.com/Azure/co-op-translator) ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေသော်လည်း၊ အလိုအလျောက် ဘာသာပြန်ခြင်းတွင် အမှားများ သို့မဟုတ် မတိကျမှုများ ပါဝင်နိုင်သည်ကို သတိပြုပါ။ မူရင်းဘာသာစကားဖြင့် ရေးသားထားသော စာရွက်စာတမ်းကို အာဏာရှိသော ရင်းမြစ်အဖြစ် သတ်မှတ်သင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူ့ဘာသာပြန်ပညာရှင်များမှ ပရော်ဖက်ရှင်နယ် ဘာသာပြန်ခြင်းကို အကြံပြုပါသည်။ ဤဘာသာပြန်ကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအလွဲအချော်များ သို့မဟုတ် အနားယူမှုမှားများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။ \ No newline at end of file diff --git a/translations/ne/3-Data-Visualization/12-visualization-relationships/README.md b/translations/ne/3-Data-Visualization/12-visualization-relationships/README.md index 11fe5c10..635aac6b 100644 --- a/translations/ne/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/ne/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ -# Relaties visualiseren: Alles over honing 🍯 +# Relaties Visualiseren: Alles Over Honing 🍯 |![ Sketchnote door [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|Relaties visualiseren - _Sketchnote door [@nitya](https://twitter.com/nitya)_ | +|Relaties Visualiseren - _Sketchnote door [@nitya](https://twitter.com/nitya)_ | -In lijn met de natuurfocus van ons onderzoek, laten we interessante visualisaties ontdekken om de relaties tussen verschillende soorten honing te tonen, gebaseerd op een dataset afkomstig van het [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php). +In navolging van de natuurfocus van ons onderzoek, laten we interessante visualisaties ontdekken om de relaties tussen verschillende soorten honing te laten zien, gebaseerd op een dataset afkomstig van het [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php). -Deze dataset, met ongeveer 600 items, toont de honingproductie in veel Amerikaanse staten. Je kunt bijvoorbeeld kijken naar het aantal kolonies, opbrengst per kolonie, totale productie, voorraden, prijs per pond en de waarde van de geproduceerde honing in een bepaalde staat van 1998-2012, met één rij per jaar voor elke staat. +Deze dataset, met ongeveer 600 items, toont de honingproductie in veel Amerikaanse staten. Zo kun je bijvoorbeeld kijken naar het aantal kolonies, de opbrengst per kolonie, de totale productie, voorraden, prijs per pond en de waarde van de geproduceerde honing in een bepaalde staat van 1998-2012, met één rij per jaar per staat. -Het is interessant om de relatie te visualiseren tussen de productie van een bepaalde staat per jaar en bijvoorbeeld de prijs van honing in die staat. Alternatief kun je de relatie tussen de opbrengst per kolonie van verschillende staten visualiseren. Deze periode omvat de verwoestende 'CCD' of 'Colony Collapse Disorder', die voor het eerst werd waargenomen in 2006 (http://npic.orst.edu/envir/ccd.html), waardoor het een aangrijpende dataset is om te bestuderen. 🐝 +Het is interessant om de relatie te visualiseren tussen de productie van een bepaalde staat per jaar en bijvoorbeeld de honingprijs in die staat. Een andere optie is om de relatie tussen de honingopbrengst per kolonie in verschillende staten te visualiseren. Deze periode omvat de verwoestende 'CCD' of 'Colony Collapse Disorder', die voor het eerst werd waargenomen in 2006 (http://npic.orst.edu/envir/ccd.html), wat deze dataset extra betekenisvol maakt. 🐝 -## [Pre-lecture quiz](https://ff-quizzes.netlify.app/en/ds/quiz/22) +## [Quiz vóór de les](https://ff-quizzes.netlify.app/en/ds/quiz/22) -In deze les kun je Seaborn gebruiken, een bibliotheek die je al eerder hebt gebruikt, om relaties tussen variabelen te visualiseren. Vooral interessant is het gebruik van de `relplot`-functie van Seaborn, waarmee scatterplots en lijnplots snel '[statistische relaties](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' kunnen visualiseren. Dit stelt de datawetenschapper in staat om beter te begrijpen hoe variabelen zich tot elkaar verhouden. +In deze les kun je Seaborn gebruiken, een bibliotheek die je al eerder hebt gebruikt, om relaties tussen variabelen te visualiseren. Vooral interessant is het gebruik van Seaborn's `relplot`-functie, waarmee je snel scatterplots en lijndiagrammen kunt maken om '[statistische relaties](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' te visualiseren. Dit helpt datawetenschappers om beter te begrijpen hoe variabelen zich tot elkaar verhouden. ## Scatterplots -Gebruik een scatterplot om te laten zien hoe de prijs van honing zich jaar na jaar per staat heeft ontwikkeld. Seaborn, met behulp van `relplot`, groepeert handig de gegevens per staat en toont datapunten voor zowel categorische als numerieke gegevens. +Gebruik een scatterplot om te laten zien hoe de prijs van honing zich per jaar per staat heeft ontwikkeld. Seaborn, met behulp van `relplot`, groepeert handig de gegevens per staat en toont datapunten voor zowel categorische als numerieke gegevens. -Laten we beginnen met het importeren van de gegevens en Seaborn: +Laten we beginnen met het importeren van de data en Seaborn: ```python import pandas as pd @@ -36,9 +36,9 @@ import seaborn as sns honey = pd.read_csv('../../data/honey.csv') honey.head() ``` -Je merkt dat de honingdata verschillende interessante kolommen bevat, waaronder jaar en prijs per pond. Laten we deze gegevens verkennen, gegroepeerd per Amerikaanse staat: +Je merkt dat de honingdata verschillende interessante kolommen bevat, waaronder jaar en prijs per pond. Laten we deze data verkennen, gegroepeerd per Amerikaanse staat: -| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | jaar | +| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | | ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | | AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | | AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | @@ -46,25 +46,25 @@ Je merkt dat de honingdata verschillende interessante kolommen bevat, waaronder | CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | | CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -Maak een eenvoudige scatterplot om de relatie te tonen tussen de prijs per pond honing en de staat van herkomst. Maak de `y`-as hoog genoeg om alle staten weer te geven: +Maak een eenvoudige scatterplot om de relatie tussen de prijs per pond honing en de staat van herkomst te laten zien. Zorg ervoor dat de `y`-as hoog genoeg is om alle staten weer te geven: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.nl.png) -Toon nu dezelfde gegevens met een honingkleurenschema om te laten zien hoe de prijs zich door de jaren heen ontwikkelt. Je kunt dit doen door een 'hue'-parameter toe te voegen om de verandering jaar na jaar te tonen: +Laat nu dezelfde data zien met een honingkleurenschema om te laten zien hoe de prijs zich door de jaren heen ontwikkelt. Dit kun je doen door een 'hue'-parameter toe te voegen om de verandering per jaar te tonen: -> ✅ Lees meer over de [kleurenpaletten die je kunt gebruiken in Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - probeer een prachtig regenboogkleurenschema! +> ✅ Lees meer over de [kleurenpaletten die je in Seaborn kunt gebruiken](https://seaborn.pydata.org/tutorial/color_palettes.html) - probeer een prachtig regenboogkleurenschema! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.nl.png) -Met deze kleurenschemawijziging kun je duidelijk zien dat er een sterke progressie is in de prijs per pond honing door de jaren heen. Als je een steekproef uit de gegevens neemt om dit te verifiëren (kies bijvoorbeeld een bepaalde staat, Arizona), kun je een patroon van prijsstijgingen jaar na jaar zien, met enkele uitzonderingen: +Met deze kleurenschemawijziging kun je duidelijk zien dat er door de jaren heen een sterke stijging is in de honingprijs per pond. Als je een steekproef uit de data neemt om dit te controleren (bijvoorbeeld Arizona), zie je een patroon van prijsstijgingen per jaar, met enkele uitzonderingen: -| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | jaar | +| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | | ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | | AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | | AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | @@ -82,39 +82,39 @@ Met deze kleurenschemawijziging kun je duidelijk zien dat er een sterke progress | AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | | AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | -Een andere manier om deze progressie te visualiseren is door grootte te gebruiken in plaats van kleur. Voor kleurenblinde gebruikers kan dit een betere optie zijn. Pas je visualisatie aan om een prijsstijging te tonen door een toename in de omtrek van de stippen: +Een andere manier om deze ontwikkeling te visualiseren is door grootte in plaats van kleur te gebruiken. Voor kleurenblinde gebruikers kan dit een betere optie zijn. Pas je visualisatie aan om een prijsstijging te tonen door een toename in de omtrek van de stippen: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` -Je kunt zien dat de grootte van de stippen geleidelijk toeneemt. +Je ziet dat de grootte van de stippen geleidelijk toeneemt. -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.nl.png) -Is dit een eenvoudig geval van vraag en aanbod? Door factoren zoals klimaatverandering en kolonie-instorting is er misschien minder honing beschikbaar voor aankoop jaar na jaar, waardoor de prijs stijgt? +Is dit een eenvoudig geval van vraag en aanbod? Door factoren zoals klimaatverandering en kolonie-instorting is er misschien minder honing beschikbaar om te kopen, waardoor de prijs stijgt? -Om een correlatie tussen enkele variabelen in deze dataset te ontdekken, laten we enkele lijngrafieken verkennen. +Om een correlatie tussen enkele variabelen in deze dataset te ontdekken, laten we enkele lijndiagrammen verkennen. -## Lijngrafieken +## Lijndiagrammen -Vraag: Is er een duidelijke stijging in de prijs van honing per pond jaar na jaar? Dit kun je het gemakkelijkst ontdekken door een enkele lijngrafiek te maken: +Vraag: Is er een duidelijke stijging in de prijs van honing per pond door de jaren heen? Dit kun je het gemakkelijkst ontdekken door een enkel lijndiagram te maken: ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` Antwoord: Ja, met enkele uitzonderingen rond het jaar 2003: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.nl.png) -✅ Omdat Seaborn gegevens aggregeert rond één lijn, toont het "de meerdere metingen bij elke x-waarde door het gemiddelde en het 95% betrouwbaarheidsinterval rond het gemiddelde te plotten". [Bron](https://seaborn.pydata.org/tutorial/relational.html). Dit tijdrovende gedrag kan worden uitgeschakeld door `ci=None` toe te voegen. +✅ Omdat Seaborn data rond één lijn aggregeert, toont het "de meerdere metingen bij elke x-waarde door het gemiddelde en het 95% betrouwbaarheidsinterval rond het gemiddelde te plotten". [Bron](https://seaborn.pydata.org/tutorial/relational.html). Dit tijdrovende gedrag kan worden uitgeschakeld door `ci=None` toe te voegen. -Vraag: Kunnen we in 2003 ook een piek zien in de honingvoorraad? Wat als je kijkt naar de totale productie jaar na jaar? +Vraag: Kunnen we in 2003 ook een piek in de honingvoorraad zien? Wat als je kijkt naar de totale productie door de jaren heen? ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.nl.png) Antwoord: Niet echt. Als je kijkt naar de totale productie, lijkt deze in dat specifieke jaar zelfs te zijn toegenomen, hoewel de hoeveelheid geproduceerde honing over het algemeen in deze jaren afneemt. @@ -124,7 +124,7 @@ Om dit te ontdekken, kun je een facet grid verkennen. ## Facet grids -Facet grids nemen één facet van je dataset (in ons geval kun je 'jaar' kiezen om te voorkomen dat er te veel facetten worden geproduceerd). Seaborn kan dan een plot maken voor elk van die facetten van je gekozen x- en y-coördinaten voor een gemakkelijkere visuele vergelijking. Valt 2003 op in dit soort vergelijking? +Facet grids nemen één aspect van je dataset (in ons geval kun je 'jaar' kiezen om te voorkomen dat er te veel grids worden geproduceerd). Seaborn kan vervolgens een plot maken voor elk van die aspecten van je gekozen x- en y-coördinaten voor een eenvoudigere visuele vergelijking. Valt 2003 op in dit soort vergelijking? Maak een facet grid door `relplot` te blijven gebruiken zoals aanbevolen door [Seaborn's documentatie](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid). @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -In deze visualisatie kun je de opbrengst per kolonie en het aantal kolonies jaar na jaar vergelijken, naast elkaar met een wrap ingesteld op 3 voor de kolommen: +In deze visualisatie kun je de opbrengst per kolonie en het aantal kolonies door de jaren heen vergelijken, naast elkaar met een wrap ingesteld op 3 voor de kolommen: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.nl.png) Voor deze dataset valt er niets bijzonders op met betrekking tot het aantal kolonies en hun opbrengst, jaar na jaar en staat na staat. Is er een andere manier om een correlatie tussen deze twee variabelen te vinden? -## Dubbele-lijnplots +## Dubbele lijndiagrammen -Probeer een meerlijnige plot door twee lijnplots bovenop elkaar te leggen, gebruikmakend van Seaborn's 'despine' om de bovenste en rechter spines te verwijderen, en gebruik `ax.twinx` [afgeleid van Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx maakt het mogelijk dat een grafiek de x-as deelt en twee y-assen weergeeft. Toon dus de opbrengst per kolonie en het aantal kolonies, bovenop elkaar: +Probeer een meerlijnig diagram door twee lijndiagrammen over elkaar heen te leggen, gebruikmakend van Seaborn's 'despine' om de boven- en rechterassen te verwijderen, en gebruik `ax.twinx` [afkomstig van Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx maakt het mogelijk om een grafiek de x-as te laten delen en twee y-assen weer te geven. Toon dus de opbrengst per kolonie en het aantal kolonies, over elkaar heen gelegd: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,22 +162,22 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.nl.png) -Hoewel er rond het jaar 2003 niets opvallends te zien is, eindigen we deze les met een wat positiever noot: hoewel het aantal kolonies over het algemeen afneemt, stabiliseert het aantal kolonies zelfs als hun opbrengst per kolonie afneemt. +Hoewel er rond het jaar 2003 niets opvallends te zien is, eindigen we deze les toch met een iets positiever noot: hoewel het aantal kolonies over het algemeen afneemt, stabiliseert het aantal kolonies zich, zelfs als hun opbrengst per kolonie afneemt. Go, bijen, go! 🐝❤️ ## 🚀 Uitdaging -In deze les heb je meer geleerd over andere toepassingen van scatterplots en lijnroosters, waaronder facet grids. Daag jezelf uit om een facet grid te maken met een andere dataset, misschien een die je eerder in deze lessen hebt gebruikt. Let op hoe lang het duurt om ze te maken en hoe je voorzichtig moet zijn met hoeveel grids je moet tekenen met deze technieken. +In deze les heb je meer geleerd over andere toepassingen van scatterplots en lijngrafieken, inclusief facet grids. Daag jezelf uit om een facet grid te maken met een andere dataset, misschien een die je eerder in deze lessen hebt gebruikt. Let op hoe lang het duurt om ze te maken en hoe je voorzichtig moet zijn met het aantal grids dat je tekent met deze technieken. -## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ds/quiz/23) +## [Quiz na de les](https://ff-quizzes.netlify.app/en/ds/quiz/23) -## Review & Zelfstudie +## Herhaling & Zelfstudie -Lijnplots kunnen eenvoudig of behoorlijk complex zijn. Lees wat meer in de [Seaborn-documentatie](https://seaborn.pydata.org/generated/seaborn.lineplot.html) over de verschillende manieren waarop je ze kunt bouwen. Probeer de lijngrafieken die je in deze les hebt gemaakt te verbeteren met andere methoden die in de documentatie worden vermeld. +Lijndiagrammen kunnen eenvoudig of behoorlijk complex zijn. Lees wat meer in de [Seaborn-documentatie](https://seaborn.pydata.org/generated/seaborn.lineplot.html) over de verschillende manieren waarop je ze kunt bouwen. Probeer de lijndiagrammen die je in deze les hebt gemaakt te verbeteren met andere methoden die in de documentatie worden genoemd. ## Opdracht [Duik in de bijenkorf](assignment.md) @@ -184,4 +185,4 @@ Lijnplots kunnen eenvoudig of behoorlijk complex zijn. Lees wat meer in de [Seab --- **Disclaimer**: -Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling. \ No newline at end of file +Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling. \ No newline at end of file diff --git a/translations/no/3-Data-Visualization/12-visualization-relationships/README.md b/translations/no/3-Data-Visualization/12-visualization-relationships/README.md index 4884306a..d5702768 100644 --- a/translations/no/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/no/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ -# Vizualizarea Relațiilor: Totul Despre Miere 🍯 +# Vizualizarea Relațiilor: Totul despre Miere 🍯 -|![ Sketchnote de [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| +|![ Sketchnote realizat de [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|Vizualizarea Relațiilor - _Sketchnote de [@nitya](https://twitter.com/nitya)_ | +|Vizualizarea Relațiilor - _Sketchnote realizat de [@nitya](https://twitter.com/nitya)_ | -Continuând cu accentul pe natură al cercetării noastre, să descoperim vizualizări interesante pentru a arăta relațiile dintre diferite tipuri de miere, conform unui set de date derivat de la [Departamentul de Agricultură al Statelor Unite](https://www.nass.usda.gov/About_NASS/index.php). +Continuând cu tema naturii din cercetările noastre, să descoperim vizualizări interesante pentru a arăta relațiile dintre diferitele tipuri de miere, conform unui set de date derivat din [Departamentul de Agricultură al Statelor Unite](https://www.nass.usda.gov/About_NASS/index.php). -Acest set de date, care conține aproximativ 600 de elemente, prezintă producția de miere în multe state din SUA. De exemplu, poți analiza numărul de colonii, randamentul per colonie, producția totală, stocurile, prețul pe kilogram și valoarea mierii produse într-un anumit stat între anii 1998-2012, cu câte un rând pe an pentru fiecare stat. +Acest set de date, care conține aproximativ 600 de elemente, prezintă producția de miere în multe state din SUA. De exemplu, poți analiza numărul de colonii, producția per colonie, producția totală, stocurile, prețul pe liră și valoarea mierii produse într-un anumit stat între anii 1998-2012, cu câte un rând pentru fiecare an din fiecare stat. -Va fi interesant să vizualizăm relația dintre producția anuală a unui stat și, de exemplu, prețul mierii în acel stat. Alternativ, ai putea vizualiza relația dintre randamentul mierii per colonie în diferite state. Această perioadă acoperă devastatorul fenomen 'CCD' sau 'Colony Collapse Disorder', observat pentru prima dată în 2006 (http://npic.orst.edu/envir/ccd.html), ceea ce face ca acest set de date să fie unul emoționant de studiat. 🐝 +Ar fi interesant să vizualizăm relația dintre producția anuală a unui stat și, de exemplu, prețul mierii în acel stat. Alternativ, ai putea vizualiza relația dintre producția de miere per colonie în diferite state. Această perioadă acoperă apariția devastatoare a 'CCD' sau 'Colony Collapse Disorder', observată pentru prima dată în 2006 (http://npic.orst.edu/envir/ccd.html), ceea ce face ca acest set de date să fie unul deosebit de relevant pentru studiu. 🐝 ## [Chestionar înainte de lecție](https://ff-quizzes.netlify.app/en/ds/quiz/22) -În această lecție, poți folosi Seaborn, pe care l-ai utilizat anterior, ca o bibliotecă excelentă pentru a vizualiza relațiile dintre variabile. Este deosebit de interesantă funcția `relplot` din Seaborn, care permite realizarea de scatter plots și line plots pentru a vizualiza rapid '[relațiile statistice](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', ajutând astfel data scientist-ul să înțeleagă mai bine cum se relaționează variabilele între ele. +În această lecție, poți folosi Seaborn, o bibliotecă pe care ai mai utilizat-o, pentru a vizualiza relațiile dintre variabile. Este deosebit de interesantă funcția `relplot` din Seaborn, care permite crearea rapidă de diagrame scatter și diagrame liniare pentru a vizualiza '[relațiile statistice](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', ajutând astfel oamenii de știință în date să înțeleagă mai bine cum se raportează variabilele între ele. -## Scatterplots +## Diagrame Scatter -Folosește un scatterplot pentru a arăta cum a evoluat prețul mierii, an de an, în fiecare stat. Seaborn, utilizând `relplot`, grupează convenabil datele pe state și afișează puncte de date atât pentru date categorice, cât și pentru date numerice. +Folosește o diagramă scatter pentru a arăta cum a evoluat prețul mierii, an de an, în fiecare stat. Seaborn, prin `relplot`, grupează convenabil datele pe state și afișează puncte de date atât pentru date categorice, cât și numerice. -Să începem prin importarea datelor și a bibliotecii Seaborn: +Să începem prin a importa datele și biblioteca Seaborn: ```python import pandas as pd @@ -36,9 +36,9 @@ import seaborn as sns honey = pd.read_csv('../../data/honey.csv') honey.head() ``` -Observi că datele despre miere au mai multe coloane interesante, inclusiv anul și prețul pe kilogram. Să explorăm aceste date, grupate pe statele din SUA: +Observi că datele despre miere conțin mai multe coloane interesante, inclusiv anul și prețul pe liră. Să explorăm aceste date, grupate pe state din SUA: -| stat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | +| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | | ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | | AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | | AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | @@ -46,25 +46,25 @@ Observi că datele despre miere au mai multe coloane interesante, inclusiv anul | CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | | CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -Creează un scatterplot de bază pentru a arăta relația dintre prețul pe kilogram al mierii și statul de origine al acesteia. Fă ca axa `y` să fie suficient de înaltă pentru a afișa toate statele: +Creează o diagramă scatter de bază pentru a arăta relația dintre prețul pe liră al mierii și statul de origine. Fă axa `y` suficient de înaltă pentru a afișa toate statele: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.ro.png) -Acum, arată aceleași date cu o schemă de culori inspirată de miere pentru a evidenția cum evoluează prețul de-a lungul anilor. Poți face acest lucru adăugând un parametru 'hue' pentru a arăta schimbarea, an de an: +Acum, afișează aceleași date cu o schemă de culori inspirată de miere pentru a arăta cum evoluează prețul de-a lungul anilor. Poți face acest lucru adăugând un parametru 'hue' pentru a evidenția schimbările anuale: -> ✅ Află mai multe despre [paletele de culori pe care le poți folosi în Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - încearcă o frumoasă schemă de culori curcubeu! +> ✅ Află mai multe despre [paletele de culori pe care le poți folosi în Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - încearcă o schemă de culori curcubeu! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.ro.png) -Cu această schimbare de schemă de culori, poți observa clar o progresie puternică de-a lungul anilor în ceea ce privește prețul mierii pe kilogram. De fapt, dacă analizezi un set de date exemplu pentru verificare (alege un stat, Arizona de exemplu), poți vedea un model de creștere a prețului an de an, cu câteva excepții: +Cu această schimbare de culori, poți observa clar o progresie puternică de-a lungul anilor în ceea ce privește prețul pe liră al mierii. De fapt, dacă verifici un set de date eșantion (de exemplu, statul Arizona), poți observa un model de creștere a prețului an de an, cu câteva excepții: -| stat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | +| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | | ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | | AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | | AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | @@ -82,51 +82,51 @@ Cu această schimbare de schemă de culori, poți observa clar o progresie puter | AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | | AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | -O altă modalitate de a vizualiza această progresie este să folosești dimensiunea, în loc de culoare. Pentru utilizatorii daltoniști, aceasta ar putea fi o opțiune mai bună. Editează vizualizarea pentru a arăta creșterea prețului printr-o creștere a circumferinței punctelor: +O altă modalitate de a vizualiza această progresie este să folosești dimensiunea, în loc de culoare. Pentru utilizatorii cu deficiențe de vedere a culorilor, aceasta ar putea fi o opțiune mai bună. Editează vizualizarea pentru a arăta creșterea prețului printr-o creștere a circumferinței punctelor: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` Poți observa cum dimensiunea punctelor crește treptat. -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.ro.png) -Este acesta un caz simplu de cerere și ofertă? Din cauza unor factori precum schimbările climatice și colapsul coloniilor, există mai puțină miere disponibilă pentru cumpărare an de an, iar astfel prețul crește? +Este acesta un caz simplu de cerere și ofertă? Din cauza unor factori precum schimbările climatice și colapsul coloniilor, există mai puțină miere disponibilă pentru cumpărare an de an, ceea ce duce la creșterea prețului? -Pentru a descoperi o corelație între unele dintre variabilele din acest set de date, să explorăm câteva grafice de tip linie. +Pentru a descoperi o corelație între unele dintre variabilele din acest set de date, să explorăm câteva diagrame liniare. -## Grafice de tip linie +## Diagrame liniare -Întrebare: Există o creștere clară a prețului mierii pe kilogram an de an? Poți descoperi acest lucru cel mai ușor prin crearea unui singur grafic de tip linie: +Întrebare: Există o creștere clară a prețului mierii pe liră an de an? Poți descoperi acest lucru cel mai ușor prin crearea unei singure diagrame liniare: ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` Răspuns: Da, cu câteva excepții în jurul anului 2003: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.ro.png) -✅ Deoarece Seaborn agregă datele în jurul unei singure linii, afișează "măsurătorile multiple pentru fiecare valoare x prin reprezentarea mediei și a intervalului de încredere de 95% în jurul mediei". [Sursă](https://seaborn.pydata.org/tutorial/relational.html). Acest comportament consumator de timp poate fi dezactivat prin adăugarea `ci=None`. +✅ Deoarece Seaborn agregă datele într-o singură linie, afișează "măsurătorile multiple pentru fiecare valoare x prin reprezentarea mediei și a intervalului de încredere de 95% în jurul mediei". [Sursa](https://seaborn.pydata.org/tutorial/relational.html). Acest comportament consumator de timp poate fi dezactivat adăugând `ci=None`. -Întrebare: Ei bine, în 2003 putem observa și o creștere a cantității de miere? Ce se întâmplă dacă analizezi producția totală an de an? +Întrebare: Ei bine, în 2003 putem observa și o creștere a ofertei de miere? Ce se întâmplă dacă analizezi producția totală an de an? ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.ro.png) -Răspuns: Nu chiar. Dacă analizezi producția totală, pare să fi crescut în acel an specific, deși, în general, cantitatea de miere produsă este în scădere în acești ani. +Răspuns: Nu chiar. Dacă te uiți la producția totală, aceasta pare să fi crescut în acel an, deși, în general, cantitatea de miere produsă este în scădere în acești ani. -Întrebare: În acest caz, ce ar fi putut cauza acea creștere a prețului mierii în jurul anului 2003? +Întrebare: În acest caz, ce ar fi putut cauza creșterea prețului mierii în jurul anului 2003? -Pentru a descoperi acest lucru, poți explora un facet grid. +Pentru a descoperi acest lucru, poți explora o grilă de fațete. -## Facet grids +## Grile de fațete -Facet grids iau un aspect al setului tău de date (în cazul nostru, poți alege 'anul' pentru a evita producerea unui număr prea mare de aspecte). Seaborn poate apoi să creeze un grafic pentru fiecare dintre aceste aspecte ale coordonatelor x și y alese, pentru o comparație mai ușoară. Se remarcă anul 2003 în acest tip de comparație? +Grilele de fațete iau un aspect al setului de date (în cazul nostru, poți alege 'anul' pentru a evita generarea prea multor fațete). Seaborn poate apoi să creeze un grafic pentru fiecare dintre aceste fațete ale coordonatelor x și y alese, pentru o comparație mai ușoară. Se remarcă anul 2003 în acest tip de comparație? -Creează un facet grid continuând să folosești `relplot`, așa cum este recomandat de [documentația Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid). +Creează o grilă de fațete continuând să folosești `relplot`, așa cum este recomandat în [documentația Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid). ```python sns.relplot( @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -În această vizualizare, poți compara randamentul per colonie și numărul de colonii an de an, unul lângă altul, cu wrap setat la 3 pentru coloane: +În această vizualizare, poți compara producția per colonie și numărul de colonii an de an, alăturat, cu o împărțire pe 3 coloane: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.ro.png) -Pentru acest set de date, nimic nu pare să iasă în evidență în ceea ce privește numărul de colonii și randamentul acestora, an de an și stat cu stat. Există o altă modalitate de a găsi o corelație între aceste două variabile? +Pentru acest set de date, nimic nu iese în evidență în mod special în ceea ce privește numărul de colonii și producția lor, an de an și stat de stat. Există o altă modalitate de a analiza corelația dintre aceste două variabile? -## Grafice cu linii suprapuse +## Diagrame cu linii duble -Încearcă un grafic cu linii multiple prin suprapunerea a două grafice de tip linie unul peste altul, folosind funcția 'despine' din Seaborn pentru a elimina spinii de sus și din dreapta, și utilizând `ax.twinx` [derivat din Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx permite unui grafic să împartă axa x și să afișeze două axe y. Așadar, afișează randamentul per colonie și numărul de colonii, suprapuse: +Încearcă o diagramă cu linii multiple prin suprapunerea a două diagrame liniare una peste alta, folosind funcția 'despine' din Seaborn pentru a elimina spinii de sus și din dreapta și utilizând `ax.twinx` [derivat din Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx permite unui grafic să împartă axa x și să afișeze două axe y. Așadar, afișează producția per colonie și numărul de colonii, suprapuse: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,27 +162,27 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.ro.png) -Deși nimic nu sare în ochi în jurul anului 2003, acest lucru ne permite să încheiem lecția pe o notă puțin mai optimistă: deși numărul de colonii este în general în scădere, acesta pare să se stabilizeze, chiar dacă randamentul per colonie este în scădere. +Deși nimic nu sare în ochi în jurul anului 2003, acest grafic ne permite să încheiem lecția pe o notă mai optimistă: deși numărul coloniilor este în scădere, acesta pare să se stabilizeze, chiar dacă producția per colonie este în scădere. Hai, albine, hai! 🐝❤️ ## 🚀 Provocare -În această lecție, ai învățat mai multe despre alte utilizări ale scatterplots și line grids, inclusiv facet grids. Provocarea ta este să creezi un facet grid folosind un alt set de date, poate unul pe care l-ai utilizat înainte de aceste lecții. Observă cât timp durează să îl creezi și cât de atent trebuie să fii în privința numărului de grile pe care trebuie să le desenezi folosind aceste tehnici. +În această lecție, ai învățat mai multe despre alte utilizări ale diagramelor scatter și ale grilelor de fațete. Provocarea ta este să creezi o grilă de fațete folosind un alt set de date, poate unul pe care l-ai folosit înainte în aceste lecții. Observă cât timp durează să creezi grila și cât de atent trebuie să fii cu privire la numărul de grile pe care trebuie să le generezi folosind aceste tehnici. ## [Chestionar după lecție](https://ff-quizzes.netlify.app/en/ds/quiz/23) -## Recapitulare & Studiu Individual +## Recapitulare și Studiu Individual -Graficele de tip linie pot fi simple sau destul de complexe. Citește puțin în [documentația Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) despre diferitele moduri în care le poți construi. Încearcă să îmbunătățești graficele de tip linie pe care le-ai construit în această lecție cu alte metode listate în documentație. +Diagramele liniare pot fi simple sau destul de complexe. Citește mai multe în [documentația Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) despre diferitele moduri în care le poți construi. Încearcă să îmbunătățești diagramele liniare pe care le-ai construit în această lecție cu alte metode listate în documentație. ## Temă [Explorează stupul](assignment.md) --- -**Declinare de responsabilitate**: -Acest document a fost tradus folosind serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși ne străduim să asigurăm acuratețea, vă rugăm să fiți conștienți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa natală ar trebui considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm responsabilitatea pentru eventualele neînțelegeri sau interpretări greșite care pot apărea din utilizarea acestei traduceri. \ No newline at end of file +**Declinarea responsabilității**: +Acest document a fost tradus folosind serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși depunem eforturi pentru a asigura acuratețea, vă rugăm să rețineți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa nativă ar trebui considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm răspunderea pentru eventualele neînțelegeri sau interpretări greșite care pot apărea din utilizarea acestei traduceri. \ No newline at end of file diff --git a/translations/ru/3-Data-Visualization/12-visualization-relationships/README.md b/translations/ru/3-Data-Visualization/12-visualization-relationships/README.md index 54f4ee87..c23fb7b6 100644 --- a/translations/ru/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/ru/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ -# Визуализација односа: Све о меду 🍯 +# Визуелизација односа: Све о меду 🍯 |![ Скетч од [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|Визуализација односа - _Скетч од [@nitya](https://twitter.com/nitya)_ | +|Визуелизација односа - _Скетч од [@nitya](https://twitter.com/nitya)_ | -Настављајући са природним фокусом нашег истраживања, хајде да откријемо занимљиве визуализације које приказују односе између различитих врста меда, према подацима добијеним од [Министарства пољопривреде Сједињених Америчких Држава](https://www.nass.usda.gov/About_NASS/index.php). +Настављајући са природним фокусом нашег истраживања, хајде да откријемо занимљиве визуелизације које приказују односе између различитих врста меда, према скупу података добијеном од [Министарства пољопривреде Сједињених Држава](https://www.nass.usda.gov/About_NASS/index.php). -Овај скуп података, који садржи око 600 ставки, приказује производњу меда у многим америчким државама. На пример, можете погледати број колонија, принос по колонији, укупну производњу, залихе, цену по фунти и вредност произведеног меда у одређеној држави од 1998-2012, са једним редом по години за сваку државу. +Овај скуп података, који садржи око 600 ставки, приказује производњу меда у многим америчким државама. На пример, можете погледати број кошница, принос по кошници, укупну производњу, залихе, цену по фунти и вредност произведеног меда у датој држави од 1998. до 2012. године, са једним редом по години за сваку државу. -Биће занимљиво визуализовати однос између производње меда у одређеној држави по години и, на пример, цене меда у тој држави. Алтернативно, можете визуализовати однос између приноса меда по колонији у различитим државама. Овај временски период обухвата разарајући 'CCD' или 'Поремећај колапса колонија', који је први пут примећен 2006. године (http://npic.orst.edu/envir/ccd.html), па је то значајан скуп података за проучавање. 🐝 +Биће занимљиво визуелизовати однос између производње у одређеној држави по годинама и, на пример, цене меда у тој држави. Алтернативно, могли бисте визуелизовати однос између приноса меда по кошници у различитим државама. Овај временски период обухвата разорни феномен 'CCD' или 'Синдром колапса кошница', који је први пут примећен 2006. године (http://npic.orst.edu/envir/ccd.html), што чини овај скуп података посебно значајним за проучавање. 🐝 ## [Квиз пре предавања](https://ff-quizzes.netlify.app/en/ds/quiz/22) -У овом предавању можете користити Seaborn, који сте већ користили, као добру библиотеку за визуализацију односа између променљивих. Посебно је занимљива употреба функције `relplot` у Seaborn-у, која омогућава креирање расејаних графикона и линијских графикона за брзу визуализацију '[статистичких односа](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', што омогућава научнику података да боље разуме како се променљиве међусобно односе. +У овој лекцији можете користити Seaborn, библиотеку коју сте већ користили, као одличан алат за визуелизацију односа између променљивих. Посебно је занимљива функција `relplot` у Seaborn-у, која омогућава креирање расејаних и линијских графикона за брзу визуелизацију '[статистичких односа](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', што омогућава научницима података боље разумевање како су променљиве међусобно повезане. ## Расејани графикони -Користите расејани графикон да покажете како се цена меда развијала из године у годину, по државама. Seaborn, користећи `relplot`, практично групише податке по државама и приказује тачке за категоријске и нумеричке податке. +Користите расејани графикон да прикажете како се цена меда развијала из године у годину, по државама. Seaborn, користећи `relplot`, згодно групише податке по државама и приказује тачке за категоријске и нумеричке податке. -Хајде да почнемо са увозом података и Seaborn-а: +Хајде да почнемо са увозом података и библиотеке Seaborn: ```python import pandas as pd @@ -36,97 +36,97 @@ import seaborn as sns honey = pd.read_csv('../../data/honey.csv') honey.head() ``` -Приметићете да подаци о меду имају неколико занимљивих колона, укључујући годину и цену по фунти. Хајде да истражимо ове податке, груписане по америчким државама: +Приметићете да подаци о меду садрже неколико занимљивих колона, укључујући годину и цену по фунти. Истражимо ове податке, груписане по америчким државама: -| држава | бројкол | приноспокол | укупнапроизв | залихе | ценапофунти | вредностпр | година | -| ------ | ------- | ----------- | ------------ | -------- | ----------- | ---------- | ------ | -| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | -| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | -| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | +| држава | бројкош | приноскош | укупнопрод | залихе | ценапофунти | вредностпрод | година | +| ------ | ------- | --------- | ---------- | -------- | ----------- | ------------ | ------ | +| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | +| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | +| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -Креирајте основни расејани графикон да покажете однос између цене по фунти меда и његове државе порекла. Направите `y` осу довољно високом да прикаже све државе: +Креирајте основни расејани графикон да прикажете однос између цене по фунти меда и државе порекла. Учинимо `y` осу довољно високом да прикаже све државе: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.sr.png) -Сада, прикажите исте податке са шемом боја меда како бисте показали како се цена развија током година. То можете урадити додавањем параметра 'hue' да покажете промену из године у годину: +Сада прикажите исте податке са шемом боја меда како бисте приказали како се цена мењала током година. Ово можете урадити додавањем параметра 'hue' да прикажете промену из године у годину: -> ✅ Сазнајте више о [палетама боја које можете користити у Seaborn-у](https://seaborn.pydata.org/tutorial/color_palettes.html) - пробајте прелепу шему боја дуге! +> ✅ Сазнајте више о [палетама боја које можете користити у Seaborn-у](https://seaborn.pydata.org/tutorial/color_palettes.html) - испробајте прелепу шему боја дуге! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) - -Са овом променом шеме боја, можете видети да постоји очигледан снажан напредак током година у погледу цене меда по фунти. Заиста, ако погледате узорак података да бисте проверили (на пример, изаберите државу Аризону), можете видети образац повећања цена из године у годину, са неколико изузетака: - -| држава | бројкол | приноспокол | укупнапроизв | залихе | ценапофунти | вредностпр | година | -| ------ | ------- | ----------- | ------------ | ------- | ----------- | ---------- | ------ | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | -| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | -| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | -| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | -| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | -| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | -| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | -| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | -| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | -| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | -| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | -| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | -| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | -| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | - -Други начин да визуализујете овај напредак је да користите величину, уместо боје. За кориснике који су далтонисти, ово би могла бити боља опција. Уредите своју визуализацију да покажете повећање цене кроз повећање обима тачке: +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.sr.png) + +Са овом променом шеме боја, можете видети да постоји очигледан снажан напредак током година у погледу цене меда по фунти. Заиста, ако погледате узорак података (на пример, државу Аризону), можете уочити образац повећања цена из године у годину, са неколико изузетака: + +| држава | бројкош | приноскош | укупнопрод | залихе | ценапофунти | вредностпрод | година | +| ------ | ------- | --------- | ---------- | ------- | ----------- | ------------ | ------ | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | +| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | +| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | +| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | +| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | +| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | +| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | +| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | +| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | +| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | +| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | +| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | +| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | +| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | + +Други начин да визуелизујете овај напредак је коришћење величине уместо боје. За кориснике који су далтонисти, ово би могла бити боља опција. Измените своју визуелизацију тако да повећање цене буде приказано повећањем обима тачке: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` -Можете видети да се величина тачака постепено повећава. +Можете видети како се величина тачака постепено повећава. -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.sr.png) -Да ли је ово једноставан случај понуде и потражње? Због фактора као што су климатске промене и колапс колонија, да ли је мање меда доступно за куповину из године у годину, па самим тим цена расте? +Да ли је ово једноставан случај понуде и потражње? Због фактора као што су климатске промене и колапс кошница, да ли је мање меда доступно за куповину из године у годину, па самим тим цена расте? -Да бисмо открили корелацију између неких променљивих у овом скупу података, хајде да истражимо неке линијске графиконе. +Да бисмо открили корелацију између неких променљивих у овом скупу података, истражимо неке линијске графиконе. ## Линијски графикони -Питање: Да ли постоји јасан раст цене меда по фунти из године у годину? Најлакше можете то открити креирањем једног линијског графикона: +Питање: Да ли постоји јасан раст цене меда по фунти из године у годину? Најлакше ћете то открити креирањем једноставног линијског графикона: ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` Одговор: Да, са неким изузецима око 2003. године: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.sr.png) -✅ Пошто Seaborn агрегира податке око једне линије, он приказује "више мерења за сваку x вредност тако што црта просек и 95% интервал поверења око просека". [Извор](https://seaborn.pydata.org/tutorial/relational.html). Ово временски захтевно понашање може се онемогућити додавањем `ci=None`. +✅ Пошто Seaborn агрегира податке око једне линије, приказује "више мерења за сваку x вредност тако што приказује просек и 95% интервал поверења око просека". [Извор](https://seaborn.pydata.org/tutorial/relational.html). Ово временски захтевно понашање може се онемогућити додавањем `ci=None`. -Питање: Па, у 2003. години, да ли можемо видети и скок у залихама меда? Шта ако погледате укупну производњу из године у годину? +Питање: Па, да ли можемо видети и пораст у залихама меда око 2003. године? Шта ако погледате укупну производњу из године у годину? ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.sr.png) -Одговор: Не баш. Ако погледате укупну производњу, чини се да је она заправо повећана у тој конкретној години, иако генерално гледано количина произведеног меда опада током ових година. +Одговор: Не баш. Ако погледате укупну производњу, чини се да је она заправо порасла те године, иако генерално количина произведеног меда опада током ових година. -Питање: У том случају, шта је могло узроковати тај скок у цени меда око 2003. године? +Питање: У том случају, шта је могло изазвати тај скок у цени меда око 2003. године? -Да бисмо то открили, можемо истражити мрежу фасета. +Да бисмо то открили, можемо истражити facet grid. -## Мреже фасета +## Facet grids -Мреже фасета узимају један аспект вашег скупа података (у нашем случају, можете изабрати 'годину' да избегнете превише фасета). Seaborn затим може направити графикон за сваку од тих фасета ваших изабраних x и y координата ради лакшег визуелног поређења. Да ли се 2003. година истиче у оваквом поређењу? +Facet grids узимају један аспект вашег скупа података (у нашем случају, можете изабрати 'годину' како бисте избегли превише аспеката). Seaborn затим може направити графикон за сваки од тих аспеката ваших изабраних x и y координата ради лакшег визуелног поређења. Да ли се 2003. година издваја у оваквом поређењу? -Креирајте мрежу фасета настављајући да користите `relplot` како је препоручено у [документацији Seaborn-а](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid). +Креирајте facet grid настављајући да користите `relplot`, како препоручује [документација за Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid). ```python sns.relplot( @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -У овој визуализацији можете упоредити принос по колонији и број колонија из године у годину, један поред другог, са подешавањем wrap-а на 3 за колоне: +У овој визуелизацији можете упоредити принос по кошници и број кошница из године у годину, један поред другог, са wrap подешеним на 3 за колоне: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.sr.png) -За овај скуп података, ништа посебно се не истиче у погледу броја колонија и њиховог приноса, из године у годину и из државе у државу. Да ли постоји другачији начин да се пронађе корелација између ове две променљиве? +За овај скуп података, ништа посебно се не издваја у погледу броја кошница и њиховог приноса, из године у годину и из државе у државу. Постоји ли другачији начин да се пронађе корелација између ове две променљиве? ## Двоструки линијски графикони -Пробајте графикон са више линија тако што ћете преклопити два линијска графикона један преко другог, користећи Seaborn-ов 'despine' да уклоните њихове горње и десне кичме, и користећи `ax.twinx` [изведено из Matplotlib-а](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx омогућава графикону да дели x осу и приказује две y осе. Дакле, прикажите принос по колонији и број колонија, преклопљено: +Пробајте вишелинијски графикон тако што ћете преклопити два линијска графикона један преко другог, користећи Seaborn-ов 'despine' да уклоните горње и десне ивице, и користећи `ax.twinx` [изведено из Matplotlib-а](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx омогућава графикону да дели x осу и приказује две y осе. Дакле, прикажите принос по кошници и број кошница, преклопљено: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,22 +162,22 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.sr.png) -Иако ништа не упада у очи око 2003. године, ово нам омогућава да завршимо ово предавање на мало срећнијој ноти: иако укупно број колонија опада, број колонија се стабилизује чак и ако њихов принос по колонији опада. +Иако ништа не упада у очи око 2003. године, ово нам омогућава да завршимо лекцију на мало срећнијој ноти: иако укупан број кошница опада, број кошница се стабилизује, чак и ако њихов принос по кошници опада. Напред, пчеле, напред! 🐝❤️ ## 🚀 Изазов -У овом предавању, научили сте мало више о другим употребама расејаних графикона и линијских мрежа, укључујући мреже фасета. Изазовите себе да креирате мрежу фасета користећи другачији скуп података, можда онај који сте користили пре ових предавања. Приметите колико времена је потребно за креирање и како морате бити пажљиви у погледу броја мрежа које треба да нацртате користећи ове технике. +У овој лекцији сте научили нешто више о другим употребама расејаних графикона и линијских мрежа, укључујући facet grids. Изазовите себе да креирате facet grid користећи други скуп података, можда онај који сте користили пре ових лекција. Обратите пажњу на то колико времена је потребно за њихово креирање и како морате бити пажљиви у вези са бројем мрежа које треба нацртати користећи ове технике. -## [Квиз после предавања](https://ff-quizzes.netlify.app/en/ds/quiz/23) +## [Квиз након предавања](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## Преглед и самостално учење -Линијски графикони могу бити једноставни или прилично сложени. Урадите мало читања у [документацији Seaborn-а](https://seaborn.pydata.org/generated/seaborn.lineplot.html) о различитим начинима на које их можете изградити. Покушајте да побољшате линијске графиконе које сте направили у овом предавању другим методама наведеним у документацији. +Линијски графикони могу бити једноставни или прилично сложени. Прочитајте мало више у [документацији за Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) о различитим начинима на које их можете изградити. Покушајте да побољшате линијске графиконе које сте направили у овој лекцији другим методама наведеним у документацији. ## Задатак [Зароните у кошницу](assignment.md) diff --git a/translations/sv/3-Data-Visualization/12-visualization-relationships/README.md b/translations/sv/3-Data-Visualization/12-visualization-relationships/README.md index 32f35b4b..8a17fa79 100644 --- a/translations/sv/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/sv/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ # การแสดงความสัมพันธ์: เรื่องราวของน้ำผึ้ง 🍯 -|![ภาพสเก็ตช์โดย [(@sketchthedocs)](https://sketchthedocs.dev)](../../sketchnotes/12-Visualizing-Relationships.png)| +|![ สเก็ตโน้ตโดย [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|การแสดงความสัมพันธ์ - _ภาพสเก็ตช์โดย [@nitya](https://twitter.com/nitya)_ | +|การแสดงความสัมพันธ์ - _สเก็ตโน้ตโดย [@nitya](https://twitter.com/nitya)_ | -ต่อเนื่องจากการวิจัยที่เน้นธรรมชาติของเรา มาค้นพบวิธีการแสดงภาพที่น่าสนใจเพื่อแสดงความสัมพันธ์ระหว่างน้ำผึ้งประเภทต่าง ๆ โดยอ้างอิงจากชุดข้อมูลที่ได้มาจาก [กระทรวงเกษตรแห่งสหรัฐอเมริกา](https://www.nass.usda.gov/About_NASS/index.php) +ต่อเนื่องจากการวิจัยที่เน้นธรรมชาติ มาค้นพบวิธีการแสดงภาพที่น่าสนใจเพื่อแสดงความสัมพันธ์ระหว่างน้ำผึ้งประเภทต่าง ๆ โดยอ้างอิงจากชุดข้อมูลที่ได้มาจาก [กระทรวงเกษตรแห่งสหรัฐอเมริกา](https://www.nass.usda.gov/About_NASS/index.php) ชุดข้อมูลนี้มีประมาณ 600 รายการ แสดงการผลิตน้ำผึ้งในหลายรัฐของสหรัฐฯ ตัวอย่างเช่น คุณสามารถดูจำนวนรังผึ้ง ผลผลิตต่อรัง การผลิตรวม สต็อก ราคาเฉลี่ยต่อปอนด์ และมูลค่าของน้ำผึ้งที่ผลิตในแต่ละรัฐตั้งแต่ปี 1998-2012 โดยมีหนึ่งแถวต่อปีสำหรับแต่ละรัฐ -จะน่าสนใจมากหากเราสามารถแสดงภาพความสัมพันธ์ระหว่างการผลิตน้ำผึ้งในแต่ละปีของรัฐหนึ่ง ๆ กับราคาน้ำผึ้งในรัฐนั้น หรืออาจแสดงความสัมพันธ์ระหว่างผลผลิตน้ำผึ้งต่อรังในแต่ละรัฐ ช่วงเวลานี้ครอบคลุมเหตุการณ์ 'CCD' หรือ 'Colony Collapse Disorder' ที่เริ่มปรากฏในปี 2006 (http://npic.orst.edu/envir/ccd.html) ซึ่งทำให้ชุดข้อมูลนี้มีความสำคัญในการศึกษา 🐝 +จะน่าสนใจมากหากแสดงภาพความสัมพันธ์ระหว่างการผลิตน้ำผึ้งในแต่ละปีของรัฐหนึ่ง ๆ กับราคาน้ำผึ้งในรัฐนั้น หรืออาจแสดงความสัมพันธ์ระหว่างผลผลิตน้ำผึ้งต่อรังในแต่ละรัฐ ช่วงเวลานี้ครอบคลุมเหตุการณ์ 'CCD' หรือ 'Colony Collapse Disorder' ที่เริ่มปรากฏในปี 2006 (http://npic.orst.edu/envir/ccd.html) ซึ่งทำให้ชุดข้อมูลนี้มีความสำคัญต่อการศึกษา 🐝 ## [แบบทดสอบก่อนเรียน](https://ff-quizzes.netlify.app/en/ds/quiz/22) -ในบทเรียนนี้ คุณสามารถใช้ Seaborn ซึ่งคุณเคยใช้มาก่อน เป็นไลบรารีที่ดีในการแสดงภาพความสัมพันธ์ระหว่างตัวแปร โดยเฉพาะอย่างยิ่งการใช้ฟังก์ชัน `relplot` ของ Seaborn ที่ช่วยให้สร้าง scatter plots และ line plots เพื่อแสดง '[ความสัมพันธ์ทางสถิติ](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' ได้อย่างรวดเร็ว ซึ่งช่วยให้นักวิทยาศาสตร์ข้อมูลเข้าใจว่าตัวแปรต่าง ๆ มีความสัมพันธ์กันอย่างไร +ในบทเรียนนี้ คุณสามารถใช้ Seaborn ซึ่งคุณเคยใช้มาก่อน เป็นไลบรารีที่ดีในการแสดงภาพความสัมพันธ์ระหว่างตัวแปร โดยเฉพาะฟังก์ชัน `relplot` ของ Seaborn ที่ช่วยให้สร้าง scatter plots และ line plots เพื่อแสดง '[ความสัมพันธ์ทางสถิติ](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' ได้อย่างรวดเร็ว ซึ่งช่วยให้นักวิทยาศาสตร์ข้อมูลเข้าใจว่าตัวแปรต่าง ๆ มีความสัมพันธ์กันอย่างไร ## Scatterplots -ใช้ scatterplot เพื่อแสดงว่าราคาน้ำผึ้งเปลี่ยนแปลงไปอย่างไรในแต่ละปีในแต่ละรัฐ Seaborn โดยใช้ `relplot` สามารถจัดกลุ่มข้อมูลของรัฐและแสดงจุดข้อมูลสำหรับข้อมูลเชิงหมวดหมู่และข้อมูลเชิงตัวเลขได้อย่างสะดวก +ใช้ scatterplot เพื่อแสดงว่าราคาน้ำผึ้งเปลี่ยนแปลงไปอย่างไรในแต่ละปีในแต่ละรัฐ Seaborn โดยใช้ `relplot` สามารถจัดกลุ่มข้อมูลของรัฐและแสดงจุดข้อมูลสำหรับทั้งข้อมูลเชิงหมวดหมู่และข้อมูลเชิงตัวเลขได้อย่างสะดวก เริ่มต้นด้วยการนำเข้าข้อมูลและ Seaborn: @@ -36,7 +36,7 @@ import seaborn as sns honey = pd.read_csv('../../data/honey.csv') honey.head() ``` -คุณจะสังเกตเห็นว่าข้อมูลน้ำผึ้งมีหลายคอลัมน์ที่น่าสนใจ รวมถึงปีและราคาต่อปอนด์ ลองสำรวจข้อมูลนี้โดยจัดกลุ่มตามรัฐในสหรัฐฯ: +คุณจะสังเกตว่าข้อมูลน้ำผึ้งมีหลายคอลัมน์ที่น่าสนใจ รวมถึงปีและราคาต่อปอนด์ ลองสำรวจข้อมูลนี้โดยจัดกลุ่มตามรัฐในสหรัฐฯ: | state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year | | ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | @@ -51,7 +51,7 @@ honey.head() ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.th.png) ตอนนี้ แสดงข้อมูลเดียวกันด้วยโทนสีของน้ำผึ้งเพื่อแสดงว่าราคาเปลี่ยนแปลงไปอย่างไรในแต่ละปี คุณสามารถทำได้โดยเพิ่มพารามิเตอร์ 'hue' เพื่อแสดงการเปลี่ยนแปลงในแต่ละปี: @@ -60,7 +60,7 @@ sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.th.png) ด้วยการเปลี่ยนชุดสีนี้ คุณจะเห็นได้ชัดเจนว่ามีการเปลี่ยนแปลงอย่างต่อเนื่องในราคาน้ำผึ้งต่อปอนด์ในแต่ละปี หากคุณดูชุดข้อมูลตัวอย่างเพื่อยืนยัน (เลือกดูรัฐหนึ่ง เช่น รัฐแอริโซนา) คุณจะเห็นรูปแบบของการเพิ่มขึ้นของราคาปีต่อปี โดยมีข้อยกเว้นเล็กน้อย: @@ -89,32 +89,32 @@ sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspec ``` คุณจะเห็นขนาดของจุดเพิ่มขึ้นเรื่อย ๆ -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.th.png) นี่เป็นกรณีง่าย ๆ ของอุปสงค์และอุปทานหรือไม่? เนื่องจากปัจจัยต่าง ๆ เช่น การเปลี่ยนแปลงสภาพภูมิอากาศและการล่มสลายของรังผึ้ง มีน้ำผึ้งน้อยลงสำหรับการซื้อในแต่ละปี และทำให้ราคาสูงขึ้น? -เพื่อค้นหาความสัมพันธ์ระหว่างตัวแปรบางตัวในชุดข้อมูลนี้ ลองสำรวจแผนภูมิเส้นกันดู +เพื่อค้นหาความสัมพันธ์ระหว่างตัวแปรบางตัวในชุดข้อมูลนี้ ลองสำรวจกราฟเส้นกัน -## Line charts +## กราฟเส้น -คำถาม: มีการเพิ่มขึ้นของราคาน้ำผึ้งต่อปอนด์ในแต่ละปีอย่างชัดเจนหรือไม่? คุณสามารถค้นพบสิ่งนี้ได้ง่ายที่สุดโดยการสร้างแผนภูมิเส้นเดียว: +คำถาม: มีการเพิ่มขึ้นของราคาน้ำผึ้งต่อปอนด์อย่างชัดเจนในแต่ละปีหรือไม่? คุณสามารถค้นพบสิ่งนี้ได้ง่ายที่สุดโดยการสร้างกราฟเส้นเดียว: ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` -คำตอบ: ใช่ มีข้อยกเว้นบางประการในช่วงปี 2003: +คำตอบ: ใช่ โดยมีข้อยกเว้นบางประการในปี 2003: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.th.png) ✅ เนื่องจาก Seaborn กำลังรวบรวมข้อมูลรอบเส้นเดียว มันจะแสดง "การวัดหลายครั้งที่แต่ละค่าของ x โดยการวางค่าเฉลี่ยและช่วงความเชื่อมั่น 95% รอบค่าเฉลี่ย" [แหล่งที่มา](https://seaborn.pydata.org/tutorial/relational.html) พฤติกรรมที่ใช้เวลานานนี้สามารถปิดได้โดยเพิ่ม `ci=None` -คำถาม: ในปี 2003 เราสามารถเห็นการเพิ่มขึ้นของปริมาณน้ำผึ้งได้หรือไม่? หากคุณดูการผลิตรวมในแต่ละปีล่ะ? +คำถาม: ในปี 2003 เราเห็นการเพิ่มขึ้นของปริมาณน้ำผึ้งหรือไม่? หากคุณดูการผลิตรวมในแต่ละปีล่ะ? ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.th.png) คำตอบ: ไม่จริง หากคุณดูการผลิตรวม ดูเหมือนว่ามันจะเพิ่มขึ้นในปีนั้น แม้ว่าปริมาณน้ำผึ้งที่ผลิตโดยทั่วไปจะลดลงในช่วงปีเหล่านี้ @@ -124,7 +124,7 @@ sns.relplot(x="year", y="totalprod", kind="line", data=honey); ## Facet grids -Facet grids ใช้หนึ่ง facet ของชุดข้อมูลของคุณ (ในกรณีนี้ คุณสามารถเลือก 'ปี' เพื่อหลีกเลี่ยงการสร้าง facet มากเกินไป) Seaborn สามารถสร้างแผนภูมิสำหรับแต่ละ facet ของพิกัด x และ y ที่คุณเลือกเพื่อการเปรียบเทียบที่ง่ายขึ้น ปี 2003 โดดเด่นในประเภทการเปรียบเทียบนี้หรือไม่? +Facet grids ใช้หนึ่ง facet ของชุดข้อมูลของคุณ (ในกรณีนี้ คุณสามารถเลือก 'ปี' เพื่อหลีกเลี่ยงการสร้าง facet มากเกินไป) Seaborn สามารถสร้างกราฟสำหรับแต่ละ facet ของพิกัด x และ y ที่คุณเลือกเพื่อเปรียบเทียบได้ง่ายขึ้น ปี 2003 โดดเด่นในรูปแบบการเปรียบเทียบนี้หรือไม่? สร้าง facet grid โดยใช้ `relplot` ตามที่แนะนำใน [เอกสารของ Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -ในภาพนี้ คุณสามารถเปรียบเทียบผลผลิตต่อรังและจำนวนรังในแต่ละปี โดยจัดเรียง wrap ที่ 3 สำหรับคอลัมน์: +ในภาพนี้ คุณสามารถเปรียบเทียบผลผลิตต่อรังและจำนวนรังในแต่ละปีแบบเคียงข้างกัน โดยตั้งค่าการจัดวาง wrap ที่ 3 สำหรับคอลัมน์: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.th.png) สำหรับชุดข้อมูลนี้ ไม่มีสิ่งใดที่โดดเด่นเกี่ยวกับจำนวนรังและผลผลิตของมันในแต่ละปีและแต่ละรัฐ มีวิธีอื่นในการค้นหาความสัมพันธ์ระหว่างตัวแปรสองตัวนี้หรือไม่? -## Dual-line Plots +## กราฟเส้นคู่ -ลองใช้ multiline plot โดยการซ้อนทับ lineplots สองเส้นเข้าด้วยกัน ใช้ `despine` ของ Seaborn เพื่อลบ spine ด้านบนและด้านขวา และใช้ `ax.twinx` [ที่มาจาก Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) Twinx ช่วยให้แผนภูมิแชร์แกน x และแสดงแกน y สองแกน ดังนั้นแสดงผลผลิตต่อรังและจำนวนรังที่ซ้อนทับกัน: +ลองสร้างกราฟเส้นหลายเส้นโดยซ้อนกราฟเส้นสองเส้นไว้ด้วยกัน โดยใช้ฟังก์ชัน 'despine' ของ Seaborn เพื่อลบ spine ด้านบนและด้านขวา และใช้ `ax.twinx` [ที่มาจาก Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) Twinx ช่วยให้กราฟแชร์แกน x และแสดงแกน y สองแกน ดังนั้นแสดงผลผลิตต่อรังและจำนวนรังที่ซ้อนกัน: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,21 +162,22 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.th.png) -แม้ว่าไม่มีสิ่งใดที่โดดเด่นในช่วงปี 2003 แต่ก็ช่วยให้เราจบบทเรียนนี้ด้วยโน้ตที่มีความสุขเล็กน้อย: แม้ว่าจำนวนรังจะลดลงโดยรวม แต่จำนวนรังก็เริ่มคงที่ แม้ว่าผลผลิตต่อรังจะลดลง +แม้ว่าไม่มีสิ่งใดที่โดดเด่นในปี 2003 แต่ก็ช่วยให้เราจบบทเรียนนี้ด้วยโน้ตที่มีความสุขเล็กน้อย: แม้ว่าจำนวนรังจะลดลงโดยรวม แต่จำนวนรังก็เริ่มคงที่ แม้ว่าผลผลิตต่อรังจะลดลง -สู้ต่อไปนะ ผึ้ง! 🐝❤️ +สู้ต่อไปนะ ผึ้ง! +🐝❤️ ## 🚀 ความท้าทาย -ในบทเรียนนี้ คุณได้เรียนรู้เพิ่มเติมเกี่ยวกับการใช้ scatterplots และ line grids รวมถึง facet grids ท้าทายตัวเองด้วยการสร้าง facet grid โดยใช้ชุดข้อมูลอื่น อาจเป็นชุดข้อมูลที่คุณเคยใช้ก่อนหน้านี้ในบทเรียนเหล่านี้ สังเกตว่าต้องใช้เวลานานแค่ไหนในการสร้าง และคุณต้องระวังจำนวน grids ที่ต้องสร้างด้วยเทคนิคเหล่านี้อย่างไร +ในบทเรียนนี้ คุณได้เรียนรู้เพิ่มเติมเกี่ยวกับการใช้ scatterplots และ line grids รวมถึง facet grids ท้าทายตัวเองด้วยการสร้าง facet grid โดยใช้ชุดข้อมูลอื่น อาจเป็นชุดข้อมูลที่คุณเคยใช้ก่อนหน้านี้ในบทเรียนเหล่านี้ สังเกตว่าการสร้าง facet grid ใช้เวลานานแค่ไหน และคุณต้องระวังจำนวน grid ที่ต้องสร้างด้วยเทคนิคเหล่านี้ ## [แบบทดสอบหลังเรียน](https://ff-quizzes.netlify.app/en/ds/quiz/23) -## ทบทวนและศึกษาด้วยตัวเอง +## ทบทวนและศึกษาด้วยตนเอง -Line plots สามารถเรียบง่ายหรือซับซ้อนมากได้ ลองอ่านเพิ่มเติมใน [เอกสารของ Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) เกี่ยวกับวิธีต่าง ๆ ที่คุณสามารถสร้างมันได้ ลองปรับปรุงแผนภูมิเส้นที่คุณสร้างในบทเรียนนี้ด้วยวิธีอื่น ๆ ที่ระบุไว้ในเอกสาร +กราฟเส้นสามารถเรียบง่ายหรือซับซ้อนมากได้ ลองอ่านเพิ่มเติมใน [เอกสารของ Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) เกี่ยวกับวิธีต่าง ๆ ที่คุณสามารถสร้างกราฟเส้น ลองปรับปรุงกราฟเส้นที่คุณสร้างในบทเรียนนี้ด้วยวิธีอื่น ๆ ที่ระบุไว้ในเอกสาร ## งานที่ได้รับมอบหมาย @@ -184,4 +186,4 @@ Line plots สามารถเรียบง่ายหรือซับซ --- **ข้อจำกัดความรับผิดชอบ**: -เอกสารนี้ได้รับการแปลโดยใช้บริการแปลภาษา AI [Co-op Translator](https://github.com/Azure/co-op-translator) แม้ว่าเราจะพยายามให้การแปลมีความถูกต้องมากที่สุด แต่โปรดทราบว่าการแปลอัตโนมัติอาจมีข้อผิดพลาดหรือความไม่ถูกต้อง เอกสารต้นฉบับในภาษาต้นทางควรถือเป็นแหล่งข้อมูลที่เชื่อถือได้ สำหรับข้อมูลที่สำคัญ ขอแนะนำให้ใช้บริการแปลภาษามนุษย์ที่มีความเชี่ยวชาญ เราไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความผิดที่เกิดจากการใช้การแปลนี้ \ No newline at end of file +เอกสารนี้ได้รับการแปลโดยใช้บริการแปลภาษา AI [Co-op Translator](https://github.com/Azure/co-op-translator) แม้ว่าเราจะพยายามให้การแปลมีความถูกต้อง แต่โปรดทราบว่าการแปลอัตโนมัติอาจมีข้อผิดพลาดหรือความไม่แม่นยำ เอกสารต้นฉบับในภาษาต้นทางควรถือเป็นแหล่งข้อมูลที่เชื่อถือได้ สำหรับข้อมูลที่สำคัญ ขอแนะนำให้ใช้บริการแปลภาษามนุษย์มืออาชีพ เราจะไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความที่ผิดพลาดซึ่งเกิดจากการใช้การแปลนี้ \ No newline at end of file diff --git a/translations/tl/3-Data-Visualization/12-visualization-relationships/README.md b/translations/tl/3-Data-Visualization/12-visualization-relationships/README.md index 531b7997..69e9ea9d 100644 --- a/translations/tl/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/tl/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ # 視覺化關係:關於蜂蜜 🍯 -|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| +|![由 [(@sketchthedocs)](https://sketchthedocs.dev) 繪製的手繪筆記](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|視覺化關係 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | +|視覺化關係 - _由 [@nitya](https://twitter.com/nitya) 繪製的手繪筆記_ | -延續我們研究的自然主題,讓我們探索一些有趣的視覺化方式,來展示不同種類蜂蜜之間的關係。這些數據集來自[美國農業部](https://www.nass.usda.gov/About_NASS/index.php)。 +延續我們研究的自然主題,讓我們探索一些有趣的視覺化方式,來展示不同類型蜂蜜之間的關係。這些數據集來自[美國農業部](https://www.nass.usda.gov/About_NASS/index.php)。 -這個包含約 600 項目數據集展示了美國多個州的蜂蜜生產情況。例如,您可以查看每個州在 1998-2012 年間的蜂群數量、每群產量、總產量、庫存、每磅價格以及蜂蜜的生產價值,每年每州一行數據。 +這個包含約 600 項的數據集展示了美國多個州的蜂蜜生產情況。例如,您可以查看每個州在 1998-2012 年間的蜂群數量、每群蜂的產量、總產量、庫存、每磅價格以及蜂蜜的生產價值,每年每州一行數據。 -我們可以視覺化某州每年的生產量與該州蜂蜜價格之間的關係。或者,您可以視覺化各州每群蜂蜜產量之間的關係。這段時間涵蓋了 2006 年首次出現的毀滅性「蜂群崩潰症候群 (CCD)」(http://npic.orst.edu/envir/ccd.html),因此這是一個值得研究的數據集。🐝 +我們可以視覺化某州每年的生產量與該州蜂蜜價格之間的關係。或者,您也可以視覺化各州每群蜂的蜂蜜產量之間的關係。這段時間涵蓋了 2006 年首次出現的毀滅性「蜂群崩潰症候群 (CCD)」(http://npic.orst.edu/envir/ccd.html),因此這是一個值得研究的數據集。🐝 ## [課前測驗](https://ff-quizzes.netlify.app/en/ds/quiz/22) @@ -36,9 +36,9 @@ import seaborn as sns honey = pd.read_csv('../../data/honey.csv') honey.head() ``` -您會注意到蜂蜜數據中有幾個有趣的列,包括年份和每磅價格。讓我們探索按美國州分組的數據: +您會注意到蜂蜜數據中有幾個有趣的列,包括年份和每磅價格。讓我們按美國州分組來探索這些數據: -| 州 | 蜂群數量 | 每群產量 | 總產量 | 庫存 | 每磅價格 | 生產價值 | 年份 | +| 州 | 蜂群數量 | 每群蜂產量 | 總產量 | 庫存 | 每磅價格 | 生產價值 | 年份 | | ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | | AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | | AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | @@ -46,25 +46,25 @@ honey.head() | CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | | CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -創建一個基本散點圖,展示蜂蜜每磅價格與其來源州之間的關係。讓 `y` 軸足夠高以顯示所有州: +創建一個基本的散點圖,展示蜂蜜每磅價格與其來源州之間的關係。將 `y` 軸設置得足夠高以顯示所有州: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![散點圖 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.tw.png) 接下來,使用蜂蜜色調展示價格如何隨年份演變。您可以通過添加 'hue' 參數來顯示年份的變化: -> ✅ 了解更多關於 [Seaborn 可用的色彩調色板](https://seaborn.pydata.org/tutorial/color_palettes.html) - 試試美麗的彩虹色調! +> ✅ 了解更多 [Seaborn 中可用的色彩調色板](https://seaborn.pydata.org/tutorial/color_palettes.html) - 試試美麗的彩虹色調! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) +![散點圖 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.tw.png) -通過這種色彩方案的改變,您可以清楚地看到蜂蜜每磅價格在多年來的明顯增長趨勢。事實上,如果您查看數據中的樣本集(例如選擇一個州,亞利桑那州),您可以看到價格逐年上漲的模式,僅有少數例外: +通過這種色彩方案的改變,您可以清楚地看到蜂蜜每磅價格在多年來的明顯增長趨勢。事實上,如果您查看數據中的樣本集(例如選擇亞利桑那州),您可以看到價格逐年上漲的模式,僅有少數例外: -| 州 | 蜂群數量 | 每群產量 | 總產量 | 庫存 | 每磅價格 | 生產價值 | 年份 | +| 州 | 蜂群數量 | 每群蜂產量 | 總產量 | 庫存 | 每磅價格 | 生產價值 | 年份 | | ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | | AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | | AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | @@ -82,39 +82,39 @@ sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, | AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | | AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | -另一種視覺化這種進展的方法是使用大小而非顏色。對於色盲用戶,這可能是一個更好的選擇。編輯您的視覺化,通過點的圓周大小來展示價格的增長: +另一種視覺化這種進展的方法是使用大小而非顏色。對於色盲用戶,這可能是一個更好的選擇。編輯您的視覺化,通過點的大小來展示價格的增長: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` 您可以看到點的大小逐漸增大。 -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![散點圖 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.tw.png) 這是否是一個簡單的供需問題?由於氣候變化和蜂群崩潰等因素,是否每年可供購買的蜂蜜減少,因此價格上漲? -為了探索這個數據集中某些變數之間的相關性,讓我們來看看一些折線圖。 +為了探索數據集中某些變數之間的相關性,讓我們來看看一些折線圖。 ## 折線圖 -問題:蜂蜜每磅價格是否每年都有明顯上漲?您可以通過創建一個單一折線圖來最容易地發現這一點: +問題:蜂蜜每磅價格是否隨年份逐年明顯上升?您可以通過創建一個單一折線圖來最容易地發現這一點: ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` 答案:是的,但在 2003 年左右有一些例外: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![折線圖 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.tw.png) ✅ 由於 Seaborn 將數據聚合到一條線上,它通過繪製均值和均值周圍的 95% 置信區間來顯示「每個 x 值的多個測量值」。[來源](https://seaborn.pydata.org/tutorial/relational.html)。這種耗時的行為可以通過添加 `ci=None` 禁用。 -問題:那麼,在 2003 年,我們是否也能看到蜂蜜供應的激增?如果您查看每年的總產量呢? +問題:那麼,在 2003 年,我們是否也能看到蜂蜜供應的激增?如果您查看逐年總產量呢? ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![折線圖 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.tw.png) 答案:並不完全。如果您查看總產量,實際上在那一年似乎有所增加,儘管總體而言蜂蜜的生產量在這些年中呈下降趨勢。 @@ -122,11 +122,11 @@ sns.relplot(x="year", y="totalprod", kind="line", data=honey); 為了探索這一點,您可以使用 Facet Grid。 -## Facet Grids +## Facet Grid -Facet Grids 將數據集的一個面(在我們的例子中,您可以選擇「年份」以避免生成過多的面)。Seaborn 可以為您選擇的 x 和 y 坐標生成每個面的圖表,以便更容易進行視覺比較。2003 年在這種比較中是否突出? +Facet Grid 可以選擇數據集的一個方面(在我們的例子中,您可以選擇「年份」以避免生成過多的 Facet)。Seaborn 可以根據您選擇的 x 和 y 坐標為每個 Facet 繪製一個圖表,方便比較。2003 年是否在這種比較中顯得突出? -繼續使用 `relplot` 創建 Facet Grid,正如 [Seaborn 的文檔](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) 所推薦的。 +通過繼續使用 `relplot` 創建 Facet Grid,這是 [Seaborn 文檔](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) 中推薦的方法。 ```python sns.relplot( @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -在此視覺化中,您可以比較每群產量和蜂群數量隨年份的變化,並將列的包裹設置為 3: +在此視覺化中,您可以比較逐年每群蜂的產量和蜂群數量,並將列的包裹設置為 3: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![Facet Grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.tw.png) -對於這個數據集,關於蜂群數量及其產量,按年份和州比較並未顯示出特別突出的地方。是否有其他方式可以找到這兩個變數之間的相關性? +對於這個數據集,逐年和逐州的蜂群數量及其產量並沒有特別突出的地方。是否有其他方式來尋找這兩個變數之間的相關性? ## 雙折線圖 -嘗試使用多折線圖,通過將兩個折線圖疊加在一起,使用 Seaborn 的 'despine' 移除其上方和右側的框架,並使用 `ax.twinx` [源自 Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)。Twins 允許圖表共享 x 軸並顯示兩個 y 軸。因此,顯示每群產量和蜂群數量的疊加圖: +嘗試使用多折線圖,通過將兩個折線圖疊加在一起,使用 Seaborn 的 'despine' 移除其上方和右側的邊框,並使用 `ax.twinx` [源自 Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)。Twins 允許圖表共享 x 軸並顯示兩個 y 軸。因此,疊加顯示每群蜂的產量和蜂群數量: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,22 +162,22 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![疊加折線圖](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.tw.png) -雖然在 2003 年左右並未有明顯的異常,但這讓我們可以以一個稍微樂觀的結論結束本課:儘管蜂群數量總體上在下降,但蜂群數量正在穩定,即使每群的產量在減少。 +雖然在 2003 年左右沒有明顯的異常,但這讓我們可以以一個稍微樂觀的結論結束本課:儘管蜂群數量總體上在下降,但蜂群數量正在穩定,即使每群蜂的產量在減少。 加油,蜜蜂們! 🐝❤️ ## 🚀 挑戰 -在本課中,您學到了更多關於散點圖和折線圖網格的其他用途,包括 Facet Grids。挑戰自己使用不同的數據集創建 Facet Grid,也許是您之前課程中使用過的數據集。注意它們的生成時間以及如何小心選擇需要繪製的網格數量。 +在本課中,您學到了更多關於散點圖和折線圖的其他用途,包括 Facet Grid。挑戰自己使用不同的數據集創建 Facet Grid,也許是您之前課程中使用過的數據集。注意它們的生成時間以及如何小心選擇需要繪製的網格數量。 ## [課後測驗](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## 回顧與自學 -折線圖可以是簡單的,也可以是非常複雜的。閱讀 [Seaborn 文檔](https://seaborn.pydata.org/generated/seaborn.lineplot.html) 中關於構建折線圖的各種方法。嘗試使用文檔中列出的其他方法來增強您在本課中構建的折線圖。 +折線圖可以很簡單,也可以非常複雜。閱讀 [Seaborn 文檔](https://seaborn.pydata.org/generated/seaborn.lineplot.html) 中的相關內容,了解您可以如何構建它們。嘗試使用文檔中列出的其他方法來增強您在本課中構建的折線圖。 ## 作業 [深入蜂巢](assignment.md) @@ -184,4 +185,4 @@ ax.figure.legend(); --- **免責聲明**: -本文件使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原始語言的文件作為權威來源。對於關鍵資訊,建議尋求專業人工翻譯。我們對因使用此翻譯而產生的任何誤解或錯誤解讀概不負責。 \ No newline at end of file +本文件已使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。儘管我們致力於提供準確的翻譯,請注意自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於重要資訊,建議使用專業人工翻譯。我們對因使用此翻譯而產生的任何誤解或錯誤解釋不承擔責任。 \ No newline at end of file diff --git a/translations/uk/3-Data-Visualization/12-visualization-relationships/README.md b/translations/uk/3-Data-Visualization/12-visualization-relationships/README.md index d2b132d8..f56c5d83 100644 --- a/translations/uk/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/uk/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ # شہد کے تعلقات کی بصری نمائندگی: شہد کے بارے میں سب کچھ 🍯 -|![ [(@sketchthedocs)](https://sketchthedocs.dev) کی طرف سے اسکیچ نوٹ ](../../sketchnotes/12-Visualizing-Relationships.png)| +|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|تعلقات کی بصری نمائندگی - _[@nitya](https://twitter.com/nitya) کی طرف سے اسکیچ نوٹ_ | +|تعلقات کی بصری نمائندگی - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | -ہماری تحقیق کے قدرتی پہلو کو جاری رکھتے ہوئے، آئیے مختلف اقسام کے شہد کے تعلقات کو ظاہر کرنے کے لیے دلچسپ بصری نمائندگیوں کو دریافت کریں، جو [ریاستہائے متحدہ کے محکمہ زراعت](https://www.nass.usda.gov/About_NASS/index.php) سے حاصل کردہ ڈیٹا سیٹ کے مطابق ہیں۔ +ہماری تحقیق کے قدرتی پہلو کو جاری رکھتے ہوئے، آئیے مختلف اقسام کے شہد کے درمیان تعلقات کو ظاہر کرنے کے لیے دلچسپ بصری نمائندگیوں کو دریافت کریں، جو کہ [امریکہ کے محکمہ زراعت](https://www.nass.usda.gov/About_NASS/index.php) سے حاصل کردہ ڈیٹا سیٹ پر مبنی ہیں۔ -یہ ڈیٹا سیٹ تقریباً 600 آئٹمز پر مشتمل ہے اور مختلف امریکی ریاستوں میں شہد کی پیداوار کو ظاہر کرتا ہے۔ مثال کے طور پر، آپ کسی دی گئی ریاست میں 1998 سے 2012 تک کے سالوں کے دوران کالونیز کی تعداد، فی کالونی پیداوار، کل پیداوار، ذخائر، فی پاؤنڈ قیمت، اور پیداوار کی قدر دیکھ سکتے ہیں، ہر سال کے لیے ایک قطار کے ساتھ۔ +یہ ڈیٹا سیٹ تقریباً 600 اشیاء پر مشتمل ہے جو امریکہ کی مختلف ریاستوں میں شہد کی پیداوار کو ظاہر کرتا ہے۔ مثال کے طور پر، آپ دیکھ سکتے ہیں کہ کسی دی گئی ریاست میں 1998 سے 2012 کے درمیان ہر سال کے لیے کالونیوں کی تعداد، فی کالونی پیداوار، کل پیداوار، ذخائر، فی پاؤنڈ قیمت، اور پیداوار کی قیمت کیا تھی۔ -یہ دلچسپ ہوگا کہ کسی دی گئی ریاست کی سالانہ پیداوار اور اس ریاست میں شہد کی قیمت کے درمیان تعلق کو بصری طور پر ظاہر کیا جائے۔ متبادل طور پر، آپ ریاستوں کی فی کالونی شہد کی پیداوار کے تعلق کو ظاہر کر سکتے ہیں۔ یہ سالوں کا دورانیہ 2006 میں پہلی بار دیکھے گئے تباہ کن 'CCD' یا 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) کو بھی شامل کرتا ہے، لہذا یہ مطالعہ کے لیے ایک اہم ڈیٹا سیٹ ہے۔ 🐝 +یہ دلچسپ ہوگا کہ کسی دی گئی ریاست کی سالانہ پیداوار اور اس ریاست میں شہد کی قیمت کے درمیان تعلق کو بصری طور پر دکھایا جائے۔ متبادل طور پر، آپ ریاستوں کی فی کالونی شہد کی پیداوار کے درمیان تعلق کو ظاہر کر سکتے ہیں۔ یہ سال 2006 میں پہلی بار دیکھے گئے 'کالونی کولیپس ڈس آرڈر' (CCD) (http://npic.orst.edu/envir/ccd.html) کے دور کو بھی شامل کرتا ہے، اس لیے یہ مطالعہ کے لیے ایک اہم ڈیٹا سیٹ ہے۔ 🐝 ## [لیکچر سے پہلے کا کوئز](https://ff-quizzes.netlify.app/en/ds/quiz/22) -اس سبق میں، آپ Seaborn استعمال کر سکتے ہیں، جسے آپ پہلے بھی استعمال کر چکے ہیں، جو متغیرات کے درمیان تعلقات کو ظاہر کرنے کے لیے ایک اچھا لائبریری ہے۔ خاص طور پر دلچسپ ہے Seaborn کا `relplot` فنکشن، جو اسکیٹر پلاٹس اور لائن پلاٹس کو جلدی سے '[اعدادی تعلقات](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' ظاہر کرنے کی اجازت دیتا ہے، جو ڈیٹا سائنسدان کو بہتر طور پر سمجھنے میں مدد دیتا ہے کہ متغیرات ایک دوسرے سے کیسے تعلق رکھتے ہیں۔ +اس سبق میں، آپ Seaborn کا استعمال کر سکتے ہیں، جسے آپ پہلے بھی استعمال کر چکے ہیں، جو متغیرات کے درمیان تعلقات کو بصری طور پر ظاہر کرنے کے لیے ایک اچھی لائبریری ہے۔ خاص طور پر دلچسپ بات یہ ہے کہ Seaborn کے `relplot` فنکشن کا استعمال، جو اسکیٹر پلاٹس اور لائن پلاٹس کے ذریعے '[شماریاتی تعلقات](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' کو تیزی سے ظاہر کرنے کی اجازت دیتا ہے، جس سے ڈیٹا سائنسدان کو یہ سمجھنے میں مدد ملتی ہے کہ متغیرات ایک دوسرے سے کیسے جڑے ہوئے ہیں۔ ## اسکیٹر پلاٹس -اسکیٹر پلاٹ کا استعمال کریں تاکہ دکھایا جا سکے کہ شہد کی قیمت سال بہ سال، ہر ریاست کے لحاظ سے کیسے تبدیل ہوئی ہے۔ Seaborn، `relplot` کا استعمال کرتے ہوئے، ریاست کے ڈیٹا کو گروپ کرتا ہے اور زمرہ وار اور عددی ڈیٹا کے لیے ڈیٹا پوائنٹس ظاہر کرتا ہے۔ +اسکیٹر پلاٹ کا استعمال کرتے ہوئے دکھائیں کہ شہد کی قیمت سال بہ سال، ہر ریاست کے لیے کیسے بدلی ہے۔ Seaborn، `relplot` کا استعمال کرتے ہوئے، ریاستی ڈیٹا کو آسانی سے گروپ کرتا ہے اور زمرہ وار اور عددی ڈیٹا کے لیے ڈیٹا پوائنٹس دکھاتا ہے۔ آئیے ڈیٹا اور Seaborn کو درآمد کرنے سے شروع کریں: @@ -36,95 +36,95 @@ import seaborn as sns honey = pd.read_csv('../../data/honey.csv') honey.head() ``` -آپ دیکھیں گے کہ شہد کے ڈیٹا میں کئی دلچسپ کالمز ہیں، جن میں سال اور فی پاؤنڈ قیمت شامل ہیں۔ آئیے اس ڈیٹا کو امریکی ریاست کے لحاظ سے گروپ کر کے دریافت کریں: +آپ دیکھیں گے کہ شہد کے ڈیٹا میں کئی دلچسپ کالمز ہیں، جن میں سال اور فی پاؤنڈ قیمت شامل ہیں۔ آئیے اس ڈیٹا کو دریافت کریں، جو امریکی ریاستوں کے لحاظ سے گروپ کیا گیا ہے: -| ریاست | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | سال | -| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | -| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | -| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | -| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | +| ریاست | کالونیوں کی تعداد | فی کالونی پیداوار | کل پیداوار | ذخائر | فی پاؤنڈ قیمت | پیداوار کی قیمت | سال | +| ----- | ------------------ | ------------------ | ----------- | -------- | -------------- | ---------------- | ---- | +| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | +| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | +| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -ایک بنیادی اسکیٹر پلاٹ بنائیں تاکہ شہد کی فی پاؤنڈ قیمت اور اس کی امریکی ریاست کے ماخذ کے درمیان تعلق کو ظاہر کیا جا سکے۔ `y` محور کو اتنا لمبا بنائیں کہ تمام ریاستیں دکھائی دیں: +ایک بنیادی اسکیٹر پلاٹ بنائیں تاکہ شہد کی فی پاؤنڈ قیمت اور اس کی امریکی ریاست کے درمیان تعلق کو دکھایا جا سکے۔ `y` محور کو اتنا لمبا بنائیں کہ تمام ریاستیں نظر آئیں: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![scatterplot 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.ur.png) -اب، اسی ڈیٹا کو شہد کے رنگ سکیم کے ساتھ دکھائیں تاکہ یہ ظاہر ہو کہ قیمت سال بہ سال کیسے تبدیل ہوتی ہے۔ آپ یہ 'hue' پیرامیٹر شامل کر کے کر سکتے ہیں تاکہ سال بہ سال تبدیلی ظاہر ہو: +اب، اسی ڈیٹا کو شہد کے رنگ سکیم کے ساتھ دکھائیں تاکہ یہ ظاہر ہو کہ قیمت سال بہ سال کیسے بدلی ہے۔ آپ یہ 'hue' پیرامیٹر شامل کرکے کر سکتے ہیں تاکہ سال بہ سال تبدیلی کو دکھایا جا سکے: -> ✅ Seaborn میں استعمال ہونے والے [رنگ سکیموں کے بارے میں مزید جانیں](https://seaborn.pydata.org/tutorial/color_palettes.html) - ایک خوبصورت قوس قزح رنگ سکیم آزمائیں! +> ✅ Seaborn میں استعمال ہونے والے [رنگ سکیمز کے بارے میں مزید جانیں](https://seaborn.pydata.org/tutorial/color_palettes.html) - ایک خوبصورت رینبو رنگ سکیم آزمائیں! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![scatterplot 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) - -اس رنگ سکیم کی تبدیلی کے ساتھ، آپ واضح طور پر دیکھ سکتے ہیں کہ شہد کی فی پاؤنڈ قیمت میں سال بہ سال ایک مضبوط ترقی ہے۔ درحقیقت، اگر آپ ڈیٹا کے ایک نمونے کو تصدیق کے لیے دیکھیں (مثال کے طور پر، ایریزونا ریاست کو منتخب کریں) تو آپ سال بہ سال قیمت میں اضافے کا ایک نمونہ دیکھ سکتے ہیں، چند استثنائی صورتوں کے ساتھ: - -| ریاست | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | سال | -| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | -| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | -| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | -| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | -| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | -| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | -| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | -| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | -| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | -| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | -| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | -| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | -| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | -| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | - -ایک اور طریقہ یہ ہے کہ رنگ کے بجائے سائز کا استعمال کریں۔ رنگ اندھے صارفین کے لیے، یہ ایک بہتر آپشن ہو سکتا ہے۔ اپنی بصری نمائندگی کو اس طرح ایڈٹ کریں کہ قیمت میں اضافے کو نقطے کے دائرے کے اضافے کے ذریعے ظاہر کیا جائے: +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.ur.png) + +اس رنگ سکیم کی تبدیلی کے ساتھ، آپ واضح طور پر دیکھ سکتے ہیں کہ شہد کی فی پاؤنڈ قیمت میں سال بہ سال ایک مضبوط ترقی ہو رہی ہے۔ درحقیقت، اگر آپ ڈیٹا کے ایک نمونے کو جانچنے کے لیے دیکھیں (مثال کے طور پر، ایریزونا ریاست کو منتخب کریں) تو آپ دیکھ سکتے ہیں کہ قیمت میں سال بہ سال اضافے کا ایک نمونہ موجود ہے، چند استثنائی صورتوں کے ساتھ: + +| ریاست | کالونیوں کی تعداد | فی کالونی پیداوار | کل پیداوار | ذخائر | فی پاؤنڈ قیمت | پیداوار کی قیمت | سال | +| ----- | ------------------ | ------------------ | ----------- | ------- | -------------- | ---------------- | ---- | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | +| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | +| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | +| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | +| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | +| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | +| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | +| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | +| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | +| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | +| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | +| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | +| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | +| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | + +ایک اور طریقہ یہ ہے کہ اس ترقی کو رنگ کے بجائے سائز کے ذریعے دکھایا جائے۔ رنگ نابینا صارفین کے لیے، یہ ایک بہتر آپشن ہو سکتا ہے۔ اپنی بصری نمائندگی کو اس طرح ایڈٹ کریں کہ قیمت میں اضافے کو نقطے کے دائرے کے سائز میں اضافے کے ذریعے دکھایا جائے: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` -آپ دیکھ سکتے ہیں کہ نقطوں کا سائز بتدریج بڑھ رہا ہے۔ +آپ دیکھ سکتے ہیں کہ نقطوں کے سائز میں بتدریج اضافہ ہو رہا ہے۔ -![scatterplot 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.ur.png) -کیا یہ صرف طلب اور رسد کا معاملہ ہے؟ موسمیاتی تبدیلی اور کالونی کے خاتمے جیسے عوامل کی وجہ سے، کیا سال بہ سال خریداری کے لیے کم شہد دستیاب ہے، اور اس وجہ سے قیمت بڑھ رہی ہے؟ +کیا یہ صرف طلب اور رسد کا معاملہ ہے؟ موسمیاتی تبدیلی اور کالونی کولیپس جیسے عوامل کی وجہ سے، کیا سال بہ سال خریداری کے لیے کم شہد دستیاب ہے، اور اس لیے قیمت بڑھ رہی ہے؟ اس ڈیٹا سیٹ میں کچھ متغیرات کے درمیان تعلق کو دریافت کرنے کے لیے، آئیے کچھ لائن چارٹس کا جائزہ لیں۔ ## لائن چارٹس -سوال: کیا شہد کی فی پاؤنڈ قیمت میں سال بہ سال واضح اضافہ ہے؟ آپ سب سے آسانی سے یہ ایک سنگل لائن چارٹ بنا کر دریافت کر سکتے ہیں: +سوال: کیا شہد کی فی پاؤنڈ قیمت میں سال بہ سال واضح اضافہ ہوا ہے؟ آپ یہ سب سے آسانی سے ایک سنگل لائن چارٹ بنا کر دریافت کر سکتے ہیں: ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` -جواب: ہاں، کچھ استثنائی صورتوں کے ساتھ، خاص طور پر 2003 کے سال کے ارد گرد: +جواب: ہاں، کچھ استثنائی صورتوں کے ساتھ، خاص طور پر 2003 کے آس پاس: -![line chart 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.ur.png) -✅ چونکہ Seaborn ایک لائن کے ارد گرد ڈیٹا کو جمع کر رہا ہے، یہ "ہر x ویلیو پر متعدد پیمائشوں کو ظاہر کرتا ہے، اوسط اور اوسط کے ارد گرد 95% اعتماد کے وقفے کو پلاٹ کر کے"۔ [ماخذ](https://seaborn.pydata.org/tutorial/relational.html)۔ اس وقت لینے والے رویے کو `ci=None` شامل کر کے غیر فعال کیا جا سکتا ہے۔ +✅ چونکہ Seaborn ایک لائن کے ارد گرد ڈیٹا کو جمع کر رہا ہے، یہ "ہر x ویلیو پر متعدد پیمائشوں کو اوسط اور اوسط کے ارد گرد 95% اعتماد کے وقفے کو پلاٹ کر کے ظاہر کرتا ہے"۔ [ماخذ](https://seaborn.pydata.org/tutorial/relational.html)۔ اس وقت لینے والے رویے کو `ci=None` شامل کر کے غیر فعال کیا جا سکتا ہے۔ -سوال: ٹھیک ہے، 2003 میں کیا ہم شہد کی فراہمی میں بھی اضافہ دیکھ سکتے ہیں؟ اگر آپ سال بہ سال کل پیداوار کو دیکھیں تو کیا ہوگا؟ +سوال: ٹھیک ہے، کیا ہم 2003 میں شہد کی فراہمی میں بھی اضافہ دیکھ سکتے ہیں؟ اگر آپ کل پیداوار کو سال بہ سال دیکھیں تو کیا ہوگا؟ ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![line chart 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.ur.png) -جواب: واقعی نہیں۔ اگر آپ کل پیداوار کو دیکھیں، تو ایسا لگتا ہے کہ اس خاص سال میں یہ درحقیقت بڑھ گئی ہے، حالانکہ عام طور پر ان سالوں کے دوران پیدا ہونے والے شہد کی مقدار میں کمی ہو رہی ہے۔ +جواب: واقعی نہیں۔ اگر آپ کل پیداوار کو دیکھیں، تو یہ خاص سال میں درحقیقت بڑھتی ہوئی نظر آتی ہے، حالانکہ عمومی طور پر ان سالوں کے دوران شہد کی پیداوار میں کمی ہو رہی ہے۔ -سوال: اس صورت میں، 2003 کے ارد گرد شہد کی قیمت میں اضافے کی وجہ کیا ہو سکتی ہے؟ +سوال: اس صورت میں، 2003 کے آس پاس شہد کی قیمت میں اضافے کی وجہ کیا ہو سکتی ہے؟ یہ دریافت کرنے کے لیے، آپ ایک فیسٹ گرڈ کا جائزہ لے سکتے ہیں۔ ## فیسٹ گرڈز -فیسٹ گرڈز آپ کے ڈیٹا سیٹ کے ایک پہلو کو لیتے ہیں (ہمارے معاملے میں، آپ 'سال' کو منتخب کر سکتے ہیں تاکہ بہت زیادہ فیسٹس پیدا نہ ہوں)۔ پھر Seaborn آپ کے منتخب کردہ x اور y کوآرڈینیٹس کے لیے ہر فیسٹ کا پلاٹ بنا سکتا ہے تاکہ زیادہ آسان بصری موازنہ کیا جا سکے۔ کیا 2003 اس قسم کے موازنہ میں نمایاں ہے؟ +فیسٹ گرڈز آپ کے ڈیٹا سیٹ کے ایک پہلو کو لیتے ہیں (ہمارے معاملے میں، آپ 'سال' کو منتخب کر سکتے ہیں تاکہ بہت زیادہ فیسٹس پیدا نہ ہوں)۔ پھر Seaborn آپ کے منتخب کردہ x اور y کوآرڈینیٹس کے لیے ہر فیسٹ کا ایک پلاٹ بنا سکتا ہے تاکہ بصری موازنہ آسان ہو۔ کیا 2003 اس قسم کے موازنہ میں نمایاں نظر آتا ہے؟ فیسٹ گرڈ بنانے کے لیے `relplot` کا استعمال جاری رکھیں جیسا کہ [Seaborn کی دستاویزات](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) میں تجویز کیا گیا ہے۔ @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -اس بصری نمائندگی میں، آپ سال بہ سال اور ریاست بہ ریاست کالونی کی پیداوار اور کالونیوں کی تعداد کا موازنہ کر سکتے ہیں، کالمز کے لیے wrap کو 3 پر سیٹ کر کے: +اس بصری نمائندگی میں، آپ فی کالونی پیداوار اور کالونیوں کی تعداد کو سال بہ سال، ریاست بہ ریاست، 3 کالمز کے ساتھ موازنہ کر سکتے ہیں: -![facet grid](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.ur.png) اس ڈیٹا سیٹ کے لیے، کالونیوں کی تعداد اور ان کی پیداوار کے حوالے سے سال بہ سال اور ریاست بہ ریاست کچھ خاص نمایاں نہیں ہوتا۔ کیا ان دو متغیرات کے درمیان تعلق تلاش کرنے کے لیے دیکھنے کا کوئی مختلف طریقہ ہے؟ ## دوہری لائن پلاٹس -Seaborn کے 'despine' کا استعمال کرتے ہوئے دو لائن پلاٹس کو ایک دوسرے کے اوپر سپر امپوز کر کے ایک ملٹی لائن پلاٹ آزمائیں تاکہ ان کے اوپر اور دائیں اسپائنز کو ہٹا دیا جائے، اور `ax.twinx` [Matplotlib سے ماخوذ](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) کا استعمال کریں۔ Twinx ایک چارٹ کو x محور شیئر کرنے اور دو y محور ظاہر کرنے کی اجازت دیتا ہے۔ لہذا، کالونی کی پیداوار اور کالونیوں کی تعداد کو سپر امپوز کر کے ظاہر کریں: +Seaborn کے 'despine' کا استعمال کرتے ہوئے دو لائن پلاٹس کو ایک دوسرے کے اوپر سپر امپوز کرنے کی کوشش کریں تاکہ ان کے اوپر اور دائیں اسپائنز کو ہٹا دیا جائے، اور `ax.twinx` کا استعمال کریں [جو Matplotlib سے ماخوذ ہے](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)۔ Twinx ایک چارٹ کو x محور کا اشتراک کرنے اور دو y محور کو ظاہر کرنے کی اجازت دیتا ہے۔ تو، فی کالونی پیداوار اور کالونیوں کی تعداد کو سپر امپوزڈ دکھائیں: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,23 +162,22 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![superimposed plots](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.ur.png) -جبکہ 2003 کے سال کے ارد گرد آنکھ کو کچھ خاص نظر نہیں آتا، یہ ہمیں سبق کو ایک خوشگوار نوٹ پر ختم کرنے کی اجازت دیتا ہے: جبکہ مجموعی طور پر کالونیوں کی تعداد میں کمی ہو رہی ہے، کالونیوں کی تعداد مستحکم ہو رہی ہے، چاہے ان کی فی کالونی پیداوار کم ہو رہی ہو۔ +اگرچہ 2003 کے آس پاس آنکھ کو کچھ خاص نظر نہیں آتا، لیکن یہ ہمیں اس سبق کو ایک خوشگوار نوٹ پر ختم کرنے کی اجازت دیتا ہے: اگرچہ مجموعی طور پر کالونیوں کی تعداد میں کمی ہو رہی ہے، کالونیوں کی تعداد مستحکم ہو رہی ہے، چاہے ان کی فی کالونی پیداوار کم ہو رہی ہو۔ -جاؤ، شہد کی مکھیوں، جاؤ! +چلو، شہد کی مکھیوں، چلو! 🐝❤️ ## 🚀 چیلنج -اس سبق میں، آپ نے اسکیٹر پلاٹس اور لائن گرڈز کے دیگر استعمالات کے بارے میں تھوڑا سا مزید سیکھا، بشمول فیسٹ گرڈز۔ خود کو چیلنج کریں کہ ایک مختلف ڈیٹا سیٹ کا استعمال کرتے ہوئے ایک فیسٹ گرڈ بنائیں، شاید وہ جو آپ نے ان اسباق سے پہلے استعمال کیا ہو۔ نوٹ کریں کہ انہیں بنانے میں کتنا وقت لگتا ہے اور آپ کو ان تکنیکوں کا استعمال کرتے ہوئے کتنے گرڈز بنانے میں محتاط رہنے کی ضرورت ہے۔ +اس سبق میں، آپ نے اسکیٹر پلاٹس اور لائن گرڈز کے دیگر استعمالات کے بارے میں تھوڑا سا مزید سیکھا، بشمول فیسٹ گرڈز۔ اپنے آپ کو چیلنج کریں کہ کسی مختلف ڈیٹا سیٹ کا استعمال کرتے ہوئے ایک فیسٹ گرڈ بنائیں، شاید وہی جو آپ نے ان اسباق سے پہلے استعمال کیا ہو۔ نوٹ کریں کہ انہیں بنانے میں کتنا وقت لگتا ہے اور آپ کو ان تکنیکوں کا استعمال کرتے ہوئے کتنے گرڈز بنانے کی ضرورت ہے۔ ## [لیکچر کے بعد کا کوئز](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## جائزہ اور خود مطالعہ لائن پلاٹس سادہ یا کافی پیچیدہ ہو سکتے ہیں۔ [Seaborn کی دستاویزات](https://seaborn.pydata.org/generated/seaborn.lineplot.html) میں تھوڑا سا مطالعہ کریں کہ آپ انہیں بنانے کے مختلف طریقے کیا ہیں۔ ان طریقوں کو استعمال کرتے ہوئے اس سبق میں بنائے گئے لائن چارٹس کو بہتر بنانے کی کوشش کریں۔ - ## اسائنمنٹ [شہد کے چھتے میں غوطہ لگائیں](assignment.md) @@ -185,4 +185,4 @@ ax.figure.legend(); --- **ڈسکلیمر**: -یہ دستاویز AI ترجمہ سروس [Co-op Translator](https://github.com/Azure/co-op-translator) کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا غیر درستیاں ہو سکتی ہیں۔ اصل دستاویز کو اس کی اصل زبان میں مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ ہم اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے ذمہ دار نہیں ہیں۔ \ No newline at end of file +یہ دستاویز AI ترجمہ سروس [Co-op Translator](https://github.com/Azure/co-op-translator) کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستگی ہو سکتی ہیں۔ اصل دستاویز، جو اس کی اصل زبان میں ہے، کو مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے لیے ہم ذمہ دار نہیں ہیں۔ \ No newline at end of file diff --git a/translations/vi/3-Data-Visualization/12-visualization-relationships/README.md b/translations/vi/3-Data-Visualization/12-visualization-relationships/README.md index c6032a4a..b45dabf0 100644 --- a/translations/vi/3-Data-Visualization/12-visualization-relationships/README.md +++ b/translations/vi/3-Data-Visualization/12-visualization-relationships/README.md @@ -1,8 +1,8 @@ # 可视化关系:关于蜂蜜的一切 🍯 -|![由 [(@sketchthedocs)](https://sketchthedocs.dev) 绘制的草图笔记](../../sketchnotes/12-Visualizing-Relationships.png)| +|![ Sketchnote by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/12-Visualizing-Relationships.png)| |:---:| -|可视化关系 - _草图笔记由 [@nitya](https://twitter.com/nitya) 绘制_ | +|可视化关系 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ | 延续我们研究的自然主题,让我们探索一些有趣的可视化方法,展示不同类型蜂蜜之间的关系。这些数据集来源于[美国农业部](https://www.nass.usda.gov/About_NASS/index.php)。 -这个包含约600条记录的数据集展示了美国多个州的蜂蜜生产情况。例如,你可以查看从1998年到2012年间每个州的蜂群数量、每群产量、总产量、库存、每磅价格以及蜂蜜生产的总价值,每年每个州对应一行数据。 +这个包含约600项的数据集展示了美国多个州的蜂蜜生产情况。例如,你可以查看每个州从1998年至2012年间的蜂群数量、每群产量、总产量、库存、每磅价格以及蜂蜜生产的价值,每年每州一行数据。 -我们可以通过可视化来展示某个州每年的蜂蜜产量与该州蜂蜜价格之间的关系。或者,你也可以可视化展示各州每群蜂蜜的产量关系。这段时间还涵盖了2006年首次出现的毁灭性“蜂群崩溃症”(CCD,Colony Collapse Disorder)(http://npic.orst.edu/envir/ccd.html),因此这是一个值得研究的引人深思的数据集。🐝 +我们可以通过可视化来研究某个州每年的生产情况与该州蜂蜜价格之间的关系。或者,你也可以可视化各州每群蜂蜜产量之间的关系。这段时间涵盖了2006年首次出现的严重“蜂群崩溃失调”(CCD,Colony Collapse Disorder)(http://npic.orst.edu/envir/ccd.html),因此这是一个值得研究的深刻数据集。🐝 ## [课前测验](https://ff-quizzes.netlify.app/en/ds/quiz/22) -在本课中,你可以使用之前用过的 Seaborn,这是一个非常适合用来可视化变量关系的库。特别有趣的是 Seaborn 的 `relplot` 函数,它可以快速生成散点图和折线图,用于可视化“[统计关系](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)”,帮助数据科学家更好地理解变量之间的关系。 +在本课中,你可以使用之前用过的Seaborn库,这是一个很好的工具,用于可视化变量之间的关系。特别有趣的是使用Seaborn的`relplot`函数,它可以快速生成散点图和折线图来可视化“[统计关系](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)”,帮助数据科学家更好地理解变量之间的关联。 ## 散点图 -使用散点图展示蜂蜜价格在每个州逐年变化的情况。Seaborn 的 `relplot` 函数可以方便地对州数据进行分组,并显示分类数据和数值数据的点。 +使用散点图展示蜂蜜价格如何逐年在各州演变。Seaborn的`relplot`可以方便地对州数据进行分组,并显示分类数据和数值数据的点。 -首先导入数据和 Seaborn: +首先导入数据和Seaborn: ```python import pandas as pd @@ -36,97 +36,97 @@ import seaborn as sns honey = pd.read_csv('../../data/honey.csv') honey.head() ``` -你会注意到蜂蜜数据中有几个有趣的列,包括年份和每磅价格。让我们按美国各州分组来探索这些数据: +你会注意到蜂蜜数据中有几个有趣的列,包括年份和每磅价格。让我们按美国州分组来探索这些数据: -| 州 | 蜂群数量 | 每群产量 | 总产量 | 库存 | 每磅价格 | 生产价值 | 年份 | -|------|----------|----------|------------|----------|----------|----------|------| -| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | -| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | -| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | +| 州 | 蜂群数量 | 每群产量 | 总产量 | 库存 | 每磅价格 | 生产价值 | 年份 | +| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- | +| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 | +| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 | +| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 | -创建一个基础散点图,展示蜂蜜每磅价格与其产地州之间的关系。将 `y` 轴设置得足够高以显示所有州: +创建一个基础散点图,展示每磅蜂蜜价格与其来源州之间的关系。将`y`轴设置得足够高以显示所有州: ```python sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5); ``` -![散点图 1](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter1.png) +![scatterplot 1](../../../../translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.zh.png) -接下来,用蜂蜜的颜色主题展示同样的数据,显示价格如何随着年份变化。你可以通过添加一个 'hue' 参数来展示逐年的变化: +现在,用蜂蜜色调展示同样的数据,显示价格如何逐年变化。你可以通过添加一个“hue”参数来展示逐年的变化: -> ✅ 了解更多关于 [Seaborn 中可用的颜色调色板](https://seaborn.pydata.org/tutorial/color_palettes.html) - 尝试一个漂亮的彩虹配色方案! +> ✅ 了解更多关于[Seaborn中可用的颜色调色板](https://seaborn.pydata.org/tutorial/color_palettes.html) - 尝试一个美丽的彩虹色调! ```python sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5); ``` -![散点图 2](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter2.png) - -通过这种颜色方案的变化,你可以明显看到蜂蜜每磅价格在逐年上涨。如果你查看数据中的一个样本集(例如亚利桑那州),你会发现价格逐年上涨的模式,只有少数例外: - -| 州 | 蜂群数量 | 每群产量 | 总产量 | 库存 | 每磅价格 | 生产价值 | 年份 | -|------|----------|----------|------------|----------|----------|----------|------| -| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | -| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | -| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | -| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | -| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | -| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | -| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | -| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | -| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | -| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | -| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | -| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | -| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | -| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | -| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | - -另一种可视化这种变化的方法是使用点的大小,而不是颜色。对于色盲用户来说,这可能是一个更好的选择。编辑你的可视化,通过点的大小变化来展示价格的增长: +![scatterplot 2](../../../../translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.zh.png) + +通过这个颜色方案的变化,你可以明显看到蜂蜜每磅价格在逐年强劲增长。如果你查看数据中的一个样本集(例如选择亚利桑那州),你会发现价格逐年上涨的模式,虽然有少数例外: + +| 州 | 蜂群数量 | 每群产量 | 总产量 | 库存 | 每磅价格 | 生产价值 | 年份 | +| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- | +| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 | +| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 | +| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 | +| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 | +| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 | +| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 | +| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 | +| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 | +| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 | +| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 | +| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 | +| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 | +| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 | +| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 | +| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 | + +另一种可视化这种变化的方法是使用大小而不是颜色。对于色盲用户,这可能是一个更好的选择。编辑你的可视化,显示价格的增长通过点的大小来表示: ```python sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5); ``` -你可以看到点的大小逐渐增大。 +你可以看到点的大小逐渐增加。 -![散点图 3](../../../../3-Data-Visualization/12-visualization-relationships/images/scatter3.png) +![scatterplot 3](../../../../translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.zh.png) -这是否是一个简单的供需问题?由于气候变化和蜂群崩溃等因素,蜂蜜的供应是否逐年减少,从而导致价格上涨? +这是否是一个简单的供需问题?由于气候变化和蜂群崩溃等因素,蜂蜜的供应逐年减少,因此价格上涨? -为了发现这个数据集中某些变量之间的相关性,让我们探索一些折线图。 +为了发现数据集中某些变量之间的相关性,让我们探索一些折线图。 ## 折线图 -问题:蜂蜜每磅价格是否逐年明显上涨?你可以通过创建一张单一的折线图最容易发现这一点: +问题:蜂蜜每磅价格是否逐年明显上涨?你可以通过创建一个单一折线图来最容易地发现这一点: ```python sns.relplot(x="year", y="priceperlb", kind="line", data=honey); ``` -答案:是的,但在2003年左右有一些例外: +答案:是的,除了2003年左右的一些例外: -![折线图 1](../../../../3-Data-Visualization/12-visualization-relationships/images/line1.png) +![line chart 1](../../../../translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.zh.png) -✅ 由于 Seaborn 会围绕一条线聚合数据,它通过绘制均值和均值周围95%的置信区间来显示“每个 x 值的多次测量”。[来源](https://seaborn.pydata.org/tutorial/relational.html)。这种耗时的行为可以通过添加 `ci=None` 来禁用。 +✅ 由于Seaborn对数据进行聚合,它通过绘制均值和均值周围的95%置信区间来显示“每个x值的多个测量值”。[来源](https://seaborn.pydata.org/tutorial/relational.html)。这种耗时的行为可以通过添加`ci=None`来禁用。 -问题:那么,在2003年,我们是否也能看到蜂蜜供应的激增?如果你查看逐年的总产量呢? +问题:那么,在2003年我们是否也能看到蜂蜜供应的激增?如果你查看逐年的总产量呢? ```python sns.relplot(x="year", y="totalprod", kind="line", data=honey); ``` -![折线图 2](../../../../3-Data-Visualization/12-visualization-relationships/images/line2.png) +![line chart 2](../../../../translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.zh.png) -答案:并不明显。如果你查看总产量,实际上在那一年似乎有所增加,尽管总体而言,这些年蜂蜜的产量在下降。 +答案:并不完全。如果你查看总产量,实际上在那一年似乎有所增加,尽管总体而言蜂蜜的产量在这些年间呈下降趋势。 -问题:在这种情况下,2003年蜂蜜价格的激增可能是什么原因导致的? +问题:在这种情况下,是什么导致了2003年蜂蜜价格的激增? -为了发现这一点,你可以探索一个分面网格。 +为了发现这一点,你可以探索一个Facet Grid。 -## 分面网格 +## Facet Grids -分面网格可以选择数据集的一个方面(在我们的例子中,你可以选择“年份”,以避免生成过多的分面)。然后 Seaborn 可以为你选择的 x 和 y 坐标生成每个分面的图表,便于更轻松地进行视觉比较。2003年在这种比较中是否显得特别突出? +Facet Grids可以选择数据集中的一个方面(在我们的例子中,你可以选择“年份”,以避免生成过多的Facet)。然后,Seaborn可以为你选择的x和y坐标生成每个Facet的图表,以便更容易进行视觉比较。2003年在这种比较中是否显得特别突出? -通过继续使用 `relplot` 创建一个分面网格,正如 [Seaborn 文档](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) 所推荐的那样。 +通过继续使用`relplot`创建一个Facet Grid,正如[Seaborn文档](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid)所推荐的那样。 ```python sns.relplot( @@ -135,16 +135,17 @@ sns.relplot( col="year", col_wrap=3, kind="line" + ) ``` -在这个可视化中,你可以比较逐年每群产量和蜂群数量的变化,并将列数设置为3: +在这个可视化中,你可以比较逐年的每群产量和蜂群数量,并将列的wrap设置为3: -![分面网格](../../../../3-Data-Visualization/12-visualization-relationships/images/facet.png) +![facet grid](../../../../translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.zh.png) -对于这个数据集,逐年和各州之间,蜂群数量及其产量并没有特别突出的变化。有没有其他方法可以找到这两个变量之间的相关性? +对于这个数据集,逐年和各州之间的蜂群数量及其产量并没有特别显著的变化。是否有其他方法可以找到这两个变量之间的相关性? ## 双折线图 -尝试通过将两条折线图叠加在一起来创建多线图,使用 Seaborn 的 'despine' 去除顶部和右侧的脊线,并使用 `ax.twinx` [源自 Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)。Twix 允许图表共享 x 轴并显示两个 y 轴。因此,叠加显示每群产量和蜂群数量: +尝试通过将两个折线图叠加在一起来创建一个多折线图,使用Seaborn的'despine'移除顶部和右侧的轴线,并使用`ax.twinx` [源自Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)。Twins允许图表共享x轴并显示两个y轴。因此,叠加显示每群产量和蜂群数量: ```python fig, ax = plt.subplots(figsize=(12,6)) @@ -161,23 +162,22 @@ sns.despine(right=False) plt.ylabel('colony yield') ax.figure.legend(); ``` -![叠加图](../../../../3-Data-Visualization/12-visualization-relationships/images/dual-line.png) +![superimposed plots](../../../../translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.zh.png) -尽管在2003年没有明显的变化,但这让我们以一个稍微乐观的笔记结束这节课:尽管蜂群数量总体在减少,但蜂群数量正在趋于稳定,即使每群产量在下降。 +虽然2003年没有明显的异常,但这确实让我们以一个稍微乐观的结论结束这节课:尽管蜂群数量总体上在下降,但蜂群数量正在趋于稳定,尽管每群产量在减少。 -加油,蜜蜂们! +加油,蜜蜂们,加油! 🐝❤️ ## 🚀 挑战 -在本课中,你进一步了解了散点图和线网格的其他用途,包括分面网格。挑战自己使用一个不同的数据集创建一个分面网格,也许是你在之前课程中使用过的数据集。注意它们的创建时间,以及在使用这些技术时需要小心生成的网格数量。 +在本课中,你学习了更多关于散点图和折线图网格的其他用途,包括Facet Grids。挑战自己使用不同的数据集创建一个Facet Grid,也许是你之前使用过的数据集。注意它们的创建时间以及如何谨慎选择需要绘制的网格数量。 ## [课后测验](https://ff-quizzes.netlify.app/en/ds/quiz/23) ## 复习与自学 -折线图可以很简单,也可以非常复杂。阅读 [Seaborn 文档](https://seaborn.pydata.org/generated/seaborn.lineplot.html) 中关于构建折线图的各种方法。尝试用文档中列出的其他方法来增强你在本课中构建的折线图。 - +折线图可以很简单也可以很复杂。阅读[Seaborn文档](https://seaborn.pydata.org/generated/seaborn.lineplot.html)中关于构建折线图的各种方法。尝试使用文档中列出的其他方法来增强你在本课中构建的折线图。 ## 作业 [深入蜂巢](assignment.md) @@ -185,4 +185,4 @@ ax.figure.legend(); --- **免责声明**: -本文档使用AI翻译服务[Co-op Translator](https://github.com/Azure/co-op-translator)进行翻译。尽管我们努力确保准确性,但请注意,自动翻译可能包含错误或不准确之处。应以原始语言的文档作为权威来源。对于关键信息,建议使用专业人工翻译。因使用本翻译而导致的任何误解或误读,我们概不负责。 \ No newline at end of file +本文档使用AI翻译服务[Co-op Translator](https://github.com/Azure/co-op-translator)进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于关键信息,建议使用专业人工翻译。我们不对因使用此翻译而产生的任何误解或误读承担责任。 \ No newline at end of file