|](../../sketchnotes/12-Visualizing-Relationships.png)|
|](../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|تصور العلاقات - _رسم توضيحي من [@nitya](https://twitter.com/nitya)_ |
|تصور العلاقات - _رسم توضيحي بواسطة [@nitya](https://twitter.com/nitya)_ |
استمرارًا في التركيز على الطبيعة في بحثنا، دعونا نستكشف تصورات مثيرة للاهتمام لعرض العلاقات بين أنواع العسل المختلفة، استنادًا إلى مجموعة بيانات مستمدة من [وزارة الزراعة الأمريكية](https://www.nass.usda.gov/About_NASS/index.php).
استمرارًا في التركيز على الطبيعة في بحثنا، دعونا نكتشف تصورات مثيرة للاهتمام لعرض العلاقات بين أنواع العسل المختلفة، وفقًا لمجموعة بيانات مستمدة من [وزارة الزراعة الأمريكية](https://www.nass.usda.gov/About_NASS/index.php).
تتضمن هذه المجموعة حوالي 600 عنصر تعرض إنتاج العسل في العديد من الولايات الأمريكية. على سبيل المثال، يمكنك الاطلاع على عدد المستعمرات، الإنتاجية لكل مستعمرة، إجمالي الإنتاج، المخزون، السعر لكل رطل، وقيمة العسل المنتج في ولاية معينة من عام 1998 إلى 2012، مع صف واحد لكل سنة لكل ولاية.
تتضمن هذه المجموعة حوالي 600 عنصر تعرض إنتاج العسل في العديد من الولايات الأمريكية. على سبيل المثال، يمكنك النظر في عدد المستعمرات، الإنتاج لكل مستعمرة، الإنتاج الإجمالي، المخزون، السعر لكل رطل، وقيمة العسل المنتج في ولاية معينة من عام 1998 إلى 2012، مع صف واحد لكل سنة لكل ولاية.
سيكون من المثير تصور العلاقة بين إنتاج ولاية معينة في سنة معينة وبين، على سبيل المثال، سعر العسل في تلك الولاية. بدلاً من ذلك، يمكنك تصور العلاقة بين إنتاجية العسل لكل مستعمرة في الولايات المختلفة. تغطي هذه الفترة الزمنية ظهور ظاهرة انهيار المستعمرات (CCD) التي شوهدت لأول مرة في عام 2006 (http://npic.orst.edu/envir/ccd.html)، مما يجعلها مجموعة بيانات مؤثرة للدراسة. 🐝
سيكون من المثير تصور العلاقة بين إنتاج ولاية معينة سنويًا وبين، على سبيل المثال، سعر العسل في تلك الولاية. أو بدلاً من ذلك، يمكنك تصور العلاقة بين إنتاج العسل لكل مستعمرة في الولايات المختلفة. تغطي هذه الفترة الزمنية ظهور "اضطراب انهيار المستعمرات" أو "CCD" الذي شوهد لأول مرة في عام 2006 (http://npic.orst.edu/envir/ccd.html)، لذا فهي مجموعة بيانات مؤثرة للدراسة. 🐝
## [اختبار ما قبل المحاضرة](https://ff-quizzes.netlify.app/en/ds/quiz/22)
في هذا الدرس، يمكنك استخدام مكتبة Seaborn، التي استخدمتها من قبل، كأداة رائعة لتصور العلاقات بين المتغيرات. من المثير للاهتمام بشكل خاص استخدام وظيفة `relplot` في Seaborn التي تتيح إنشاء مخططات نقطية وخطية بسرعة لتصور '[العلاقات الإحصائية](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)'، مما يساعد عالم البيانات على فهم كيفية ارتباط المتغيرات ببعضها البعض.
في هذه الدرس، يمكنك استخدام مكتبة Seaborn، التي استخدمتها من قبل، كأداة جيدة لتصور العلاقات بين المتغيرات. من الأمور المثيرة للاهتمام استخدام وظيفة `relplot` في Seaborn التي تسمح بإنشاء مخططات التبعثر والمخططات الخطية لتصور "[العلاقات الإحصائية](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)" بسرعة، مما يساعد عالم البيانات على فهم كيفية ارتباط المتغيرات ببعضها البعض.
## المخططات النقطية
## مخططات التبعثر
استخدم مخططًانقطيًا لعرض كيفية تطور سعر العسل عامًا بعد عام لكل ولاية. تسهل Seaborn، باستخدام `relplot`، تجميع بيانات الولايات وعرض النقاط للبيانات الفئوية والعددية.
استخدم مخطط التبعثر لعرض كيفية تطور سعر العسل عامًا بعد عام لكل ولاية. تقوم Seaborn، باستخدام `relplot`، بتجميع بيانات الولايات وعرض نقاط البيانات لكل من البيانات الفئوية والرقمية.
لنبدأ باستيراد البيانات ومكتبة Seaborn:
لنبدأ باستيراد البيانات وSeaborn:
```python
import pandas as pd
@ -38,93 +38,93 @@ honey.head()
```
ستلاحظ أن بيانات العسل تحتوي على عدة أعمدة مثيرة للاهتمام، بما في ذلك السنة والسعر لكل رطل. دعونا نستكشف هذه البيانات، مجمعة حسب الولايات الأمريكية:
| الولاية | عدد المستعمرات | الإنتاجية لكل مستعمرة | إجمالي الإنتاج | المخزون | السعر لكل رطل | قيمة الإنتاج | السنة |
الآن، اعرض نفس البيانات باستخدام نظام ألوان مستوحى من العسل لإظهار كيفية تطور السعر على مر السنين. يمكنك القيام بذلك عن طريق إضافة معلمة 'hue' لإظهار التغيير عامًا بعد عام:
الآن، اعرض نفس البيانات باستخدام نظام ألوان يشبه العسل لعرض كيفية تطور السعر على مدار السنوات. يمكنك القيام بذلك عن طريق إضافة معلمة 'hue' لعرض التغيير عامًا بعد عام:
> ✅ تعرف على المزيد حول [لوحات الألوان التي يمكنك استخدامها في Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - جرب لوحة ألوان قوس قزح الجميلة!
> ✅ تعرف على المزيد حول [أنظمة الألوان التي يمكنك استخدامها في Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - جرب نظام ألوان قوس قزح الجميل!
مع هذا التغيير في نظام الألوان، يمكنك أن ترى بوضوح أن هناك تقدمًا قويًا على مر السنين فيما يتعلق بسعر العسل لكل رطل. في الواقع، إذا نظرت إلى مجموعة بيانات عينة للتحقق (اختر ولاية معينة، مثل أريزونا)، يمكنك رؤية نمط لزيادة الأسعار عامًا بعد عام، مع بعض الاستثناءات:
| الولاية | عدد المستعمرات | الإنتاجية لكل مستعمرة | إجمالي الإنتاج | المخزون | السعر لكل رطل | قيمة الإنتاج | السنة |
طريقة أخرى لتصور هذا التقدم هي استخدام الحجم بدلاً من اللون. بالنسبة للمستخدمين الذين يعانون من عمى الألوان، قد تكون هذه الطريقة أفضل. قم بتعديل التصور لإظهار زيادة السعر من خلال زيادة محيط النقطة:
مع هذا التغيير في نظام الألوان، يمكنك أن ترى بوضوح تقدمًا قويًا على مدار السنوات فيما يتعلق بسعر العسل لكل رطل. بالفعل، إذا نظرت إلى مجموعة بيانات للتحقق (اختر ولاية معينة، مثل أريزونا)، يمكنك رؤية نمط زيادة الأسعار عامًا بعد عام، مع بعض الاستثناءات:
| الولاية | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | السنة |
طريقة أخرى لتصور هذا التقدم هي استخدام الحجم بدلاً من اللون. بالنسبة للمستخدمين الذين يعانون من عمى الألوان، قد تكون هذه الطريقة خيارًا أفضل. قم بتعديل التصور لعرض زيادة السعر من خلال زيادة محيط النقاط:
هل هذا مجرد حالة بسيطة من العرض والطلب؟ بسبب عوامل مثل تغير المناخ وانهيار المستعمرات، هل هناك كمية أقل من العسل المتاحة للشراء عامًا بعد عام، وبالتالي ترتفع الأسعار؟
لاكتشاف العلاقة بين بعض المتغيرات في هذه المجموعة، دعونا نستكشف بعض المخططات الخطية.
لاكتشاف العلاقة بين بعض المتغيرات في هذه المجموعة من البيانات، دعونا نستكشف بعض المخططات الخطية.
## المخططات الخطية
سؤال: هل هناك ارتفاع واضح في سعر العسل لكل رطل عامًا بعد عام؟ يمكنك اكتشاف ذلك بسهولة عن طريق إنشاء مخطط خطي واحد:
السؤال: هل هناك ارتفاع واضح في سعر العسل لكل رطل عامًا بعد عام؟ يمكنك اكتشاف ذلك بسهولة عن طريق إنشاء مخطط خطي واحد:
✅ لأن Seaborn يقوم بتجميع البيانات حول خط واحد، فإنه يعرض "القياسات المتعددة عند كل قيمة x عن طريق رسم المتوسط وفاصل الثقة بنسبة 95% حول المتوسط". [المصدر](https://seaborn.pydata.org/tutorial/relational.html). يمكن تعطيل هذا السلوك الذي يستغرق وقتًا بإضافة `ci=None`.
✅ لأن Seaborn يقوم بتجميع البيانات حول خط واحد، فإنه يعرض "القياسات المتعددة عند كل قيمة x عن طريق رسم المتوسط وفاصل الثقة بنسبة 95% حول المتوسط". [المصدر](https://seaborn.pydata.org/tutorial/relational.html). يمكن تعطيل هذا السلوك الذي يستغرق وقتًا عن طريق إضافة `ci=None`.
سؤال: حسنًا، في عام 2003، هل يمكننا أيضًا رؤية زيادة في إمدادات العسل؟ ماذا لو نظرت إلى إجمالي الإنتاج عامًا بعد عام؟
السؤال: حسنًا، في عام 2003 هل يمكننا أيضًا رؤية زيادة في كمية العسل المتوفرة؟ ماذا لو نظرت إلى الإنتاج الإجمالي عامًا بعد عام؟
الإجابة: ليس حقًا. إذا نظرت إلى إجمالي الإنتاج، يبدو أنه زاد في تلك السنة المحددة، على الرغم من أن كمية العسل المنتجة بشكل عام كانت في انخفاض خلال هذه السنوات.
الإجابة: ليس حقًا. إذا نظرت إلى الإنتاج الإجمالي، يبدو أنه قد زاد في ذلك العام تحديدًا، على الرغم من أن كمية العسل المنتجة عمومًا في انخفاض خلال هذه السنوات.
سؤال: في هذه الحالة، ما الذي يمكن أن يكون قد تسبب في ارتفاع سعر العسل حوالي عام 2003؟
السؤال: في هذه الحالة، ما الذي يمكن أن يكون سبب تلك الزيادة في سعر العسل حول عام 2003؟
لاكتشاف ذلك، يمكنك استكشاف شبكة الأوجه.
## شبكات الأوجه
تأخذ شبكات الأوجه جانبًا واحدًا من مجموعة البيانات الخاصة بك (في حالتنا، يمكنك اختيار 'السنة' لتجنب إنتاج عدد كبير جدًا من الأوجه). يمكن لـ Seaborn بعد ذلك إنشاء مخطط لكل من هذه الأوجه للإحداثيات x وy التي اخترتها، مما يسهل المقارنة البصرية. هل يبرز عام 2003 في هذا النوع من المقارنة؟
تأخذ شبكات الأوجه جانبًا واحدًا من مجموعة البيانات الخاصة بك (في حالتنا، يمكنك اختيار "السنة" لتجنب إنتاج عدد كبير جدًا من الأوجه). يمكن لـ Seaborn بعد ذلك إنشاء مخطط لكل من هذه الأوجه للإحداثيات x وy التي اخترتها للمقارنة بسهولة. هل يبرز عام 2003 في هذا النوع من المقارنة؟
قم بإنشاء شبكة أوجه باستخدام `relplot` كما هو موصى به في [وثائق Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
في هذا التصور، يمكنك مقارنة الإنتاجية لكل مستعمرة وعدد المستعمرات عامًا بعد عام جنبًا إلى جنب مع تعيين الأعمدة إلى 3:
في هذا التصور، يمكنك مقارنة الإنتاج لكل مستعمرة وعدد المستعمرات عامًا بعد عام، جنبًا إلى جنب مع التفاف مضبوط على 3 للأعمدة:
بالنسبة لهذه المجموعة من البيانات، لا يبدو أن هناك شيئًا بارزًا بشكل خاص فيما يتعلق بعدد المستعمرات وإنتاجيتها، عامًا بعد عام وولاية بعد ولاية. هل هناك طريقة مختلفة للبحث عن علاقة بين هذين المتغيرين؟
بالنسبة لهذه المجموعة من البيانات، لا يبرز شيء بشكل خاص فيما يتعلق بعدد المستعمرات وإنتاجها، عامًا بعد عام وولاية بعد ولاية. هل هناك طريقة مختلفة للبحث عن علاقة بين هذين المتغيرين؟
## مخططات الخطوط المزدوجة
جرب مخططًا متعدد الخطوط عن طريق تراكب مخططين خطيين فوق بعضهما البعض، باستخدام وظيفة 'despine' في Seaborn لإزالة الحواف العلوية واليمنى، واستخدام `ax.twinx` [المستمدة من Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). تتيح Twinx للمخطط مشاركة المحور x وعرض محورين y. لذا، اعرض الإنتاجية لكل مستعمرة وعدد المستعمرات، متراكبين:
جرب مخططًا متعدد الخطوط عن طريق وضع مخططين خطيين فوق بعضهما البعض، باستخدام وظيفة 'despine' في Seaborn لإزالة الحواف العلوية واليمينية، واستخدام `ax.twinx` [المستمدة من Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). تتيح Twinx للمخطط مشاركة المحور x وعرض محورين y. لذا، قم بعرض الإنتاج لكل مستعمرة وعدد المستعمرات، متراكبين:
بينما لا يظهر شيء واضح حول عام 2003، إلا أنه يسمح لنا بإنهاء هذا الدرس بملاحظة أكثر تفاؤلاً: على الرغم من الانخفاض العام في عدد المستعمرات، يبدو أن عدد المستعمرات يستقر حتى لو كانت إنتاجيتها لكل مستعمرة تتناقص.
بينما لا يبرز شيء للعين حول عام 2003، فإنه يسمح لنا بإنهاء هذا الدرس بملاحظة أكثر إيجابية: على الرغم من وجود انخفاض عام في عدد المستعمرات، فإن عدد المستعمرات يستقر حتى لو كان إنتاجها لكل مستعمرة يتناقص.
هيا، أيها النحل، استمروا! 🐝❤️
هيا أيها النحل، استمروا!
## 🚀 تحدٍ
🐝❤️
## 🚀 التحدي
في هذا الدرس، تعلمت المزيد عن استخدامات المخططات النقطية وشبكات الخطوط، بما في ذلك شبكات الأوجه. تحدَّ نفسك لإنشاء شبكة أوجه باستخدام مجموعة بيانات مختلفة، ربما واحدة استخدمتها في الدروس السابقة. لاحظ الوقت الذي تستغرقه لإنشائها ومدى حاجتك إلى الحذر بشأن عدد الأوجه التي تحتاج إلى رسمها باستخدام هذه التقنيات.
في هذا الدرس، تعلمت المزيد عن استخدامات مخططات التبعثر وشبكات الخطوط، بما في ذلك شبكات الأوجه. تحدى نفسك لإنشاء شبكة أوجه باستخدام مجموعة بيانات مختلفة، ربما واحدة استخدمتها قبل هذه الدروس. لاحظ الوقت الذي تستغرقه لإنشائها وكيف تحتاج إلى الحذر بشأن عدد الشبكات التي تحتاج إلى رسمها باستخدام هذه التقنيات.
## [اختبار ما بعد المحاضرة](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## المراجعة والدراسة الذاتية
يمكن أن تكون المخططات الخطية بسيطة أو معقدة للغاية. قم ببعض القراءة في [وثائق Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) حول الطرق المختلفة التي يمكنك من خلالها بناؤها. حاول تحسين المخططات الخطية التي أنشأتها في هذا الدرس باستخدام طرق أخرى مدرجة في الوثائق.
## الواجب
[استكشف خلية النحل](assignment.md)
@ -184,4 +185,4 @@ ax.figure.legend();
---
**إخلاء المسؤولية**:
تمت ترجمة هذا المستند باستخدام خدمة الترجمة الآلية [Co-op Translator](https://github.com/Azure/co-op-translator). بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية هو المصدر الموثوق. للحصول على معلومات حساسة أو هامة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة.
تم ترجمة هذا المستند باستخدام خدمة الترجمة بالذكاء الاصطناعي [Co-op Translator](https://github.com/Azure/co-op-translator). بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو معلومات غير دقيقة. يجب اعتبار المستند الأصلي بلغته الأصلية المصدر الرسمي. للحصول على معلومات حاسمة، يُوصى بالاستعانة بترجمة بشرية احترافية. نحن غير مسؤولين عن أي سوء فهم أو تفسيرات خاطئة تنشأ عن استخدام هذه الترجمة.
|Визуализиране на връзки - _Скетч от [@nitya](https://twitter.com/nitya)_ |
Продължавайки с природната насоченост на нашето изследване, нека открием интересни визуализации, които показват връзките между различните видове мед, според набор от данни, получен от [Министерството на земеделието на САЩ](https://www.nass.usda.gov/About_NASS/index.php).
Продължавайки с природната насоченост на нашето изследване, нека открием интересни визуализации, които показват връзките между различните видове мед, според набор от данни, извлечен от [Министерството на земеделието на САЩ](https://www.nass.usda.gov/About_NASS/index.php).
Този набор от данни, съдържащ около 600 записа, показва производството на мед в много щати на САЩ. Например, можете да разгледате броя на колониите, добива на колония, общото производство, запасите, цената на килограм и стойността на произведения мед в даден щат за периода 1998-2012 г., като всеки ред представлява една година за всеки щат.
Този набор от данни, съдържащ около 600 записа, показва производството на мед в много щати на САЩ. Например, можете да разгледате броя на колониите, добива на колония, общото производство, запасите, цената на килограм и стойността на произведения мед в даден щат за периода 1998-2012 г., като всеки ред представлява година за всеки щат.
Ще бъде интересно да визуализираме връзката между производството на мед в даден щат за година и, например, цената на меда в този щат. Алтернативно, можете да визуализирате връзката между добива на мед на колония в различни щати. Този времеви период обхваща разрушителното явление „CCD“ или „Синдром на колапс на колониите“, което за първи път се наблюдава през 2006 г. (http://npic.orst.edu/envir/ccd.html), така че това е значим набор от данни за изследване. 🐝
Ще бъде интересно да визуализираме връзката между производството на мед в даден щат за година и, например, цената на меда в този щат. Алтернативно, бихте могли да визуализирате връзката между добива на мед на колония в различни щати. Този времеви обхват включва разрушителния феномен „CCD“ или „Синдром на колапс на колониите“, който за първи път е наблюдаван през 2006 г. (http://npic.orst.edu/envir/ccd.html), което прави този набор от данни особено значим за изследване. 🐝
## [Тест преди лекцията](https://ff-quizzes.netlify.app/en/ds/quiz/22)
В този урок можете да използвате Seaborn, който вече сте използвали, като добра библиотека за визуализиране на връзки между променливи. Особено интересна е функцията `relplot` на Seaborn, която позволява създаването на точкови и линейни графики за бързо визуализиране на '[статистически връзки](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', което помага на специалистите по данни да разберат по-добре как променливите се свързват помежду си.
В този урок можете да използвате Seaborn, който вече сте използвали, като добра библиотека за визуализиране на връзки между променливи. Особено интересна е функцията `relplot` на Seaborn, която позволява създаването на разсейващи диаграми и линейни графики за бързо визуализиране на '[статистически връзки](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', което помага на анализатора на данни да разбере по-добре как променливите се свързват помежду си.
## Точкови графики
## Разсейващи диаграми
Използвайте точкова графика, за да покажете как цената на меда сее развивала през годините в различните щати. Seaborn, чрез `relplot`, удобно групира данните по щати и показва точки както за категорийни, така и за числови данни.
Използвайте разсейваща диаграма, за да покажете как цената на меда сее развивала година след година за всеки щат. Seaborn, чрез `relplot`, удобно групира данните по щати и показва точки за както категорийни, така и числови данни.
Нека започнем с импортиране на данните и Seaborn:
@ -36,95 +36,95 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Ще забележите, че данните за меда имат няколко интересни колони, включително година и цена на килограм. Нека разгледаме тези данни, групирани по щати на САЩ:
Ще забележите, че данните за меда съдържат няколко интересни колони, включително година и цена на килограм. Нека изследваме тези данни, групирани по щати на САЩ:
| щат | колонии | добив/колония | общо производство | запаси | цена/кг | стойност на продукцията | година |
Създайте основна точкова графика, за да покажете връзката между цената на килограм мед и щата, от който произхожда. Направете `y` оста достатъчно висока, за да покажете всички щати:
Създайте основна разсейваща диаграма, за да покажете връзката между цената на килограм мед и щата, от който произхожда. Направете оста `y` достатъчно висока, за да покаже всички щати:
Сега покажете същите данни с цветова схема, вдъхновена от меда, за да покажете как цената се променя през годините. Можете да направите това, като добавите параметър 'hue', който показва промяната година след година:
Сега покажете същите данни с цветова схема, свързана с меда, за да покажете как цената се променя през годините. Можете да направите това, като добавите параметър 'hue', който показва промяната година след година:
> ✅ Научете повече за [цветовите палитри, които можете да използвате в Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - опитайте красива дъгова цветова схема!
> ✅ Научете повече за [цветовите палитри, които можете да използвате в Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - опитайте красива дъгова палитра!
С тази промяна в цветовата схема можете ясно да видите силна прогресия през годините по отношение на цената на меда на килограм. Всъщност, ако разгледате примерен набор от данни, за да проверите (например щата Аризона), можете да видите модел на увеличение на цените година след година, с малко изключения:
| щат | колонии | добив/колония | общо производство | запаси | цена/кг | стойност на продукцията | година |
Друг начин за визуализиране на тази прогресия е чрез използване на размер, вместо цвят. За потребители с цветна слепота това може да бъде по-добър вариант. Редактирайте визуализацията си, за да покажете увеличение на цената чрез увеличение на обиколката на точките:
С тази промяна в цветовата схема можете да видите, че има очевидна силна прогресия през годините по отношение на цената на килограм мед. Всъщност, ако разгледате примерен набор от данни, за да проверите (например за щата Аризона), можете да видите модел на увеличение на цената година след година, с малки изключения:
| щат | колонии | добив/кол. | общо прод. | запаси | цена/кг | стойност | година |
Друг начин да визуализирате тази прогресия е чрез използване на размер, вместо цвят. За потребители с цветна слепота това може да бъде по-добър вариант. Редактирайте визуализацията си, за да покажете увеличение на цената чрез увеличение на обиколката на точките:
Дали това е просто случай на търсене и предлагане? Поради фактори като климатични промени и колапс на колониите, има ли по-малко мед, достъпен за покупка година след година, и затова цената се увеличава?
Дали това е просто случай на търсене и предлагане? Поради фактори като климатични промени и колапс на колониите, има ли по-малко наличен мед за покупка година след година, което води до увеличение на цената?
За да открием корелация между някои от променливите в този набор от данни, нека разгледаме някои линейни графики.
За да открием корелация между някои от променливите в този набор от данни, нека изследваме някои линейни графики.
## Линейни графики
Въпрос: Има ли ясно увеличение на цената на меда на килограм година след година? Най-лесно можете да откриете това, като създадете единична линейна графика:
Въпрос: Има ли ясно увеличение на цената на килограм мед година след година? Най-лесно можете да откриете това, като създадете единична линейна графика:
✅ Тъй като Seaborn агрегира данни около една линия, той показва „многобройните измервания за всяка стойност на x, като изобразява средната стойност и 95% доверителен интервал около средната стойност“. [Източник](https://seaborn.pydata.org/tutorial/relational.html). Това времеемко поведение може да бъде деактивирано чрез добавяне на`ci=None`.
✅ Тъй като Seaborn агрегира данните около една линия, той показва „многобройните измервания за всяка стойност на x, като изобразява средната стойност и 95% доверителен интервал около средната стойност“. [Източник](https://seaborn.pydata.org/tutorial/relational.html). Това поведение, което отнема време, може да бъде изключено, като добавите`ci=None`.
Въпрос: Е, през 2003 година можем ли също да видим скок в предлагането на мед? Какво ще стане, ако разгледате общото производство година след година?
Въпрос: Ами през 2003 година, можем ли също да видим скок в предлагането на мед? Какво ще стане, ако разгледате общото производство година след година?
Отговор: Не съвсем. Ако разгледате общото производство, всъщност изглежда, че тосее увеличило през тази конкретна година, въпреки че като цяло количеството произведен мед намалява през тези години.
Отговор: Не съвсем. Ако разгледате общото производство, то всъщност изглежда, че сее увеличило през тази конкретна година, въпреки че като цяло количеството произведен мед намалява през тези години.
Въпрос: В такъв случай, какво би могло да е причинило този скок в цената на меда около 2003 година?
За да откриете това, можете да разгледате мрежа от фасети.
За да откриете това, можете да изследвате мрежа от фасети.
## Мрежи от фасети
Мрежите от фасети вземат един аспект от вашия набор от данни (в нашия случай можете да изберете 'година', за да избегнете създаването на твърде много фасети). Seaborn може да създаде графика за всеки от тези аспекти на избраните x и y координати за по-лесно визуално сравнение. Изпъква ли 2003 година в този тип сравнение?
Мрежите от фасети вземат един аспект от вашия набор от данни (в нашия случай можете да изберете 'година', за да избегнете твърде много фасети). Seaborn след това може да създаде графика за всяка от тези фасети на избраните x и y координати за по-лесно визуално сравнение. Изпъква ли 2003 година в този тип сравнение?
Създайте мрежа от фасети, като продължите да използвате `relplot`, както е препоръчано от [документацията на Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
В тази визуализация можете да сравните добива на колония и броя на колониите година след година, една до друга, с настройка на wrap за 3 колони:
В тази визуализация можете да сравните добива на колония и броя на колониите година след година, една до друга, с настройка на wrap на 3 за колоните:
За този набор от данни нищо особено не изпъква по отношение на броя на колониите и техния добив, година след година и щат след щат. Има ли различен начин да се открие корелация между тези две променливи?
За този набор от данни нищо особено не изпъква по отношение на броя на колониите и техния добив, година след година и щат след щат. Има ли друг начин да се намери корелация между тези две променливи?
## Двойни линейни графики
Опитайте многолинейна графика, като наложите две линейни графики една върху друга, използвайки `despine` на Seaborn, за да премахнете горните и десните оси, и използвайки `ax.twinx` [взет от Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx позволява графиката да споделя x оста и да показва две y оси. Така че, изобразете добива на колония и броя на колониите, наложени една върху друга:
Опитайте многолинейна графика, като наслагвате две линейни графики една върху друга, използвайки `despine` на Seaborn, за да премахнете горните и десните оси, и използвайки `ax.twinx` [взето от Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx позволява графиката да споделя оста x и да показва две оси y. Така че, изобразете добива на колония и броя на колониите, наслагвайки ги:
Докато нищо не изпъква около 2003 година, това ни позволява да завършим урока с малко по-щастлива нотка: въпреки че като цяло броят на колониите намалява, броят на колониите се стабилизира, дори ако техният добив на колония намалява.
Докато нищо не изпъква около 2003 година, това ни позволява да завършим урока с малко по-оптимистична нотка: въпреки че като цяло броят на колониите намалява, броят на колониите се стабилизира, дори ако техният добив на колония намалява.
Напред, пчели, напред!
🐝❤️
## 🚀 Предизвикателство
В този урок научихте малко повече за други приложения на точковите графики и линейните мрежи, включително мрежите от фасети. Предизвикайте себе си да създадете мрежа от фасети, използвайки различен набор от данни, може би такъв, който сте използвали преди тези уроци. Обърнете внимание колко време отнема създаването им и как трябва да бъдете внимателни относно броя на мрежите, които трябва да нарисувате, използвайки тези техники.
В този урок научихте малко повече за други приложения на разсейващите диаграми и линейните мрежи, включително мрежите от фасети. Предизвикайте себе си да създадете мрежа от фасети, използвайки различен набор от данни, може би такъв, който сте използвали преди тези уроци. Обърнете внимание колко време отнема създаването им и колко внимателни трябва да бъдете относно броя на мрежите, които трябва да се изобразят, използвайки тези техники.
## [Тест след лекцията](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Преглед и самостоятелно обучение
Линейните графики могат да бъдат прости или доста сложни. Прочетете малко повече в [документацията на Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) за различните начини, по които можете да ги изграждате. Опитайте да подобрите линейните графики, които създадохте в този урок, с други методи, изброени в документацията.
## Задание
Линейните графики могат да бъдат прости или доста сложни. Прочетете малко повече в [документацията на Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) за различните начини, по които можете да ги изградите. Опитайте да подобрите линейните графики, които създадохте в този урок, с други методи, изброени в документацията.
## Задача
[Потопете се в кошера](assignment.md)
---
**Отказ от отговорност**:
Този документ е преведен с помощта на AI услуга за превод [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи може да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за каквито и да е недоразумения или погрешни интерпретации, произтичащи от използването на този превод.
Този документ е преведен с помощта на AI услуга за превод [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи може да съдържат грешки или неточности. Оригиналният документ на неговия изходен език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален превод от човек. Ние не носим отговорност за каквито и да е недоразумения или погрешни интерпретации, произтичащи от използването на този превод.
এই প্রায় ৬০০ আইটেমের ডেটাসেটটি যুক্তরাষ্ট্রের বিভিন্ন রাজ্যে মধু উৎপাদন প্রদর্শন করে। উদাহরণস্বরূপ, আপনি ১৯৯৮-২০১২ সালের মধ্যে প্রতিটি রাজ্যের জন্য প্রতি বছর এক সারি সহ একটি নির্দিষ্ট রাজ্যে উপনিবেশের সংখ্যা, প্রতি উপনিবেশের উৎপাদন, মোট উৎপাদন, স্টক, প্রতি পাউন্ডের দাম এবং উৎপাদিত মধুর মূল্য দেখতে পারেন।
একটি নির্দিষ্ট রাজ্যের বার্ষিক উৎপাদন এবং সেই রাজ্যে মধুর দামের মধ্যে সম্পর্ক দেখানো আকর্ষণীয় হবে। বিকল্পভাবে, আপনি রাজ্যগুলির প্রতি উপনিবেশের মধু উৎপাদনের মধ্যে সম্পর্ক ভিজ্যুয়ালাইজ করতে পারেন। এই সময়কালটি ২০০৬ সালে প্রথম দেখা 'CCD' বা 'কলোনি ধস ব্যাধি' (http://npic.orst.edu/envir/ccd.html) এর ধ্বংসাত্মক প্রভাবকে অন্তর্ভুক্ত করে, তাই এটি অধ্যয়নের জন্য একটি গুরুত্বপূর্ণ ডেটাসেট। 🐝
একটি নির্দিষ্ট রাজ্যের বার্ষিক উৎপাদন এবং সেই রাজ্যে মধুর দামের মধ্যে সম্পর্ক দেখানো আকর্ষণীয় হবে। বিকল্পভাবে, আপনি রাজ্যগুলির প্রতি উপনিবেশের মধু উৎপাদনের মধ্যে সম্পর্ক ভিজ্যুয়ালাইজ করতে পারেন। এই সময়কালটি ২০০৬ সালে প্রথম দেখা 'CCD' বা 'কলোনি ধস ব্যাধি' (http://npic.orst.edu/envir/ccd.html) এর অন্তর্ভুক্ত, তাই এটি অধ্যয়নের জন্য একটি গুরুত্বপূর্ণ ডেটাসেট। 🐝
স্ক্যাটারপ্লট ব্যবহার করে দেখান কীভাবে মধুর দাম রাজ্য অনুযায়ী বছর ধরে পরিবর্তিত হয়েছে। Seaborn-এর `relplot` ব্যবহার করে রাজ্যের ডেটা গ্রুপ করা যায় এবং ক্যাটেগরিকাল এবং সংখ্যাগত ডেটার জন্য ডেটা পয়েন্ট প্রদর্শন করা যায়।
স্ক্যাটারপ্লট ব্যবহার করে দেখান কীভাবে মধুর দাম বছর বছর, রাজ্য অনুযায়ী পরিবর্তিত হয়েছে। Seaborn-এর `relplot` ব্যবহার করে রাজ্যের ডেটা গ্রুপ করা এবং উভয় শ্রেণীবদ্ধ এবং সংখ্যাসূচক ডেটার জন্য ডেটা পয়েন্ট প্রদর্শন করা সহজ।
এখন, একই ডেটা একটি মধু রঙের স্কিম ব্যবহার করে দেখান যাতে বছরের পর বছর ধরে দাম কীভাবে পরিবর্তিত হয়েছে তা বোঝা যায়। আপনি এটি 'hue' প্যারামিটার যোগ করে করতে পারেন, যা পরিবর্তন দেখায়:
এখন, একই ডেটা একটি মধু রঙের স্কিম দিয়ে দেখান যাতে বছরের পর বছর ধরে দাম কীভাবে পরিবর্তিত হয়েছে তা বোঝা যায়। আপনি এটি 'hue' প্যারামিটার যোগ করে করতে পারেন, যা পরিবর্তন দেখায়:
> ✅ Seaborn-এ আপনি যে [রঙের প্যালেটগুলি ব্যবহার করতে পারেন](https://seaborn.pydata.org/tutorial/color_palettes.html) সম্পর্কে আরও জানুন - একটি সুন্দর রংধনু রঙের স্কিম চেষ্টা করুন!
এই রঙের স্কিম পরিবর্তনের মাধ্যমে, আপনি স্পষ্টভাবে দেখতে পারেন যে বছরের পর বছর মধুর প্রতি পাউন্ডের দামে একটি শক্তিশালী অগ্রগতি রয়েছে। আসলে, যদি আপনি ডেটার একটি নমুনা সেট পরীক্ষা করেন (উদাহরণস্বরূপ, একটি নির্দিষ্ট রাজ্য, অ্যারিজোনা), আপনি দেখতে পাবেন যে বছরের পর বছর দামের বৃদ্ধির একটি প্যাটার্ন রয়েছে, কয়েকটি ব্যতিক্রম সহ:
আরেকটি উপায় হল রঙের পরিবর্তে আকার ব্যবহার করা। যারা রঙের পার্থক্য বুঝতে অসুবিধা করেন, তাদের জন্য এটি একটি ভালো বিকল্প হতে পারে। আপনার ভিজ্যুয়ালাইজেশন সম্পাদনা করুন যাতে দামের বৃদ্ধি ডটের পরিধি বৃদ্ধির মাধ্যমে দেখানো যায়:
আরেকটি উপায় হল রঙের পরিবর্তে আকার ব্যবহার করা। যারা রঙ দেখতে অসুবিধা করেন তাদের জন্য এটি একটি ভালো বিকল্প হতে পারে। আপনার ভিজ্যুয়ালাইজেশনটি সম্পাদনা করুন যাতে দামের বৃদ্ধি ডটের পরিধি বৃদ্ধির মাধ্যমে দেখানো যায়:
এটি কি সরবরাহ এবং চাহিদার একটি সাধারণ ঘটনা? জলবায়ু পরিবর্তন এবং কলোনি ধসের মতো কারণগুলির কারণে, প্রতি বছর কেনার জন্য কম মধু পাওয়া যাচ্ছে এবং তাই দাম বাড়ছে?
এটি কি সরবরাহ এবং চাহিদার একটি সাধারণ ঘটনা? জলবায়ু পরিবর্তন এবং কলোনি ধসের মতো কারণগুলির কারণে, প্রতি বছর কেনার জন্য কম মধু পাওয়া যাচ্ছে, এবং তাই দাম বাড়ছে?
এই ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে সম্পর্ক আবিষ্কার করতে, আসুন কিছু লাইন চার্ট অন্বেষণ করি।
এই ডেটাসেটে কিছু ভেরিয়েবলের মধ্যে সম্পর্ক আবিষ্কার করতে, আসুন কিছু লাইন চার্ট অন্বেষণ করি।
## লাইন চার্ট
প্রশ্ন: প্রতি পাউন্ড মধুর দামে বছরের পর বছর একটি স্পষ্ট বৃদ্ধি আছে কি? আপনি এটি সবচেয়ে সহজে একটি একক লাইন চার্ট তৈরি করে আবিষ্কার করতে পারেন:
প্রশ্ন: প্রতি পাউন্ড মধুর দামে বছর বছর স্পষ্ট বৃদ্ধি আছে কি? আপনি এটি সবচেয়ে সহজে একটি একক লাইন চার্ট তৈরি করে আবিষ্কার করতে পারেন:
✅ যেহেতু Seaborn একটি লাইন চার্টে ডেটা একত্রিত করছে, এটি "প্রতিটি x মানে একাধিক পরিমাপ প্রদর্শন করে গড় এবং গড়ের চারপাশে ৯৫% আত্মবিশ্বাসের সীমা প্লট করে"। [সূত্র](https://seaborn.pydata.org/tutorial/relational.html)। এই সময়সাপেক্ষ আচরণ`ci=None` যোগ করে অক্ষম করা যেতে পারে।
✅ যেহেতু Seaborn একটি লাইন চার্টে ডেটা একত্রিত করছে, এটি "প্রতিটি x মানে একাধিক পরিমাপ প্রদর্শন করে গড় এবং গড়ের চারপাশে ৯৫% আত্মবিশ্বাসের ব্যবধান প্লট করে"। [সূত্র](https://seaborn.pydata.org/tutorial/relational.html)। এই সময়সাপেক্ষ আচরণটি `ci=None` যোগ করে নিষ্ক্রিয় করা যেতে পারে।
প্রশ্ন: তাহলে, ২০০৩ সালে মধুর সরবরাহে কি কোনো স্পাইক দেখা যায়? যদি আপনি বছরের পর বছর মোট উৎপাদন দেখেন?
প্রশ্ন: তাহলে ২০০৩ সালে মধুর সরবরাহে কি কোনো স্পাইক দেখা যায়? যদি আপনি বছর বছর মোট উৎপাদন দেখেন?
উত্তর: আসলে না। যদি আপনি মোট উৎপাদন দেখেন, এটি সেই নির্দিষ্ট বছরে বৃদ্ধি পেয়েছে বলে মনে হয়, যদিও সাধারণভাবে এই বছরগুলিতে উৎপাদিত মধুর পরিমাণ হ্রাস পাচ্ছে।
প্রশ্ন: সেই ক্ষেত্রে, ২০০৩ সালের আশেপাশে মধুর দামের স্পাইক কী কারণে হতে পারে?
প্রশ্ন: তাহলে ২০০৩ সালের আশেপাশে মধুর দামের স্পাইক কী কারণে হতে পারে?
এটি আবিষ্কার করতে, আপনি একটি ফ্যাসেট গ্রিড অন্বেষণ করতে পারেন।
## ফ্যাসেট গ্রিড
ফ্যাসেট গ্রিড আপনার ডেটাসেটের একটি ফ্যাসেট (আমাদের ক্ষেত্রে, 'year' নির্বাচন করুন যাতে খুব বেশি ফ্যাসেট তৈরি না হয়) গ্রহণ করে। Seaborn তারপর আপনার নির্বাচিত x এবং y কোঅর্ডিনেটগুলির জন্য প্রতিটি ফ্যাসেটের একটি প্লট তৈরি করতে পারে, যা তুলনা সহজ করে। এই ধরনের তুলনায় ২০০৩ কি আলাদা দেখায়?
ফ্যাসেট গ্রিড আপনার ডেটাসেটের একটি ফ্যাসেট (আমাদের ক্ষেত্রে, 'year' নির্বাচন করুন যাতে খুব বেশি ফ্যাসেট তৈরি না হয়) গ্রহণ করে। Seaborn তারপর আপনার নির্বাচিত x এবং y কোঅর্ডিনেটের জন্য প্রতিটি ফ্যাসেটের একটি প্লট তৈরি করতে পারে যাতে তুলনা সহজ হয়। এই ধরনের তুলনায় ২০০৩ কি আলাদা করে দাঁড়ায়?
Seaborn-এর ডকুমেন্টেশনের [প্রস্তাবিত](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) `relplot` ব্যবহার করে একটি ফ্যাসেট গ্রিড তৈরি করুন।
@ -135,12 +135,13 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
এই ভিজ্যুয়ালাইজেশনে, আপনি প্রতি উপনিবেশের উৎপাদন এবং উপনিবেশের সংখ্যা বছরের পর বছর তুলনা করতে পারেন, ৩টি কলামের জন্য র্যাপ সেট করে:
এই ভিজ্যুয়ালাইজেশনে, আপনি প্রতি উপনিবেশের উৎপাদন এবং উপনিবেশের সংখ্যা বছর বছর, রাজ্য রাজ্য তুলনা করতে পারেন, যেখানে কলামের জন্য wrap ৩ সেট করা হয়েছে:
এই ডেটাসেটের জন্য, রাজ্য অনুযায়ী এবং বছর অনুযায়ী উপনিবেশের সংখ্যা এবং তাদের উৎপাদনের ক্ষেত্রে কিছুই বিশেষভাবে আলাদা দেখায় না। এই দুটি ভেরিয়েবলের মধ্যে সম্পর্ক খুঁজে বের করার জন্য কি অন্য কোনো উপায় আছে?
এই ডেটাসেটের জন্য, রাজ্য এবং বছর অনুযায়ী উপনিবেশের সংখ্যা এবং তাদের উৎপাদনের ক্ষেত্রে কিছুই বিশেষভাবে আলাদা করে দাঁড়ায় না। এই দুটি ভেরিয়েবলের মধ্যে সম্পর্ক খুঁজে বের করার জন্য কি দেখার অন্য কোনো উপায় আছে?
যদিও ২০০৩ সালের আশেপাশে চোখে কিছুই ধরা পড়ে না, এটি আমাদের এই পাঠটি একটি সামান্য সুখী নোটে শেষ করতে দেয়: যদিও উপনিবেশের সংখ্যা সামগ্রিকভাবে হ্রাস পাচ্ছে, উপনিবেশের সংখ্যা স্থিতিশীল হচ্ছে, যদিও তাদের প্রতি উপনিবেশের উৎপাদন হ্রাস পাচ্ছে।
যদিও ২০০৩ সালের আশেপাশে চোখে কিছুই ধরা পড়ে না, এটি আমাদের এই পাঠটি একটি সামান্য সুখী নোটে শেষ করার অনুমতি দেয়: যদিও উপনিবেশের সংখ্যা সামগ্রিকভাবে হ্রাস পাচ্ছে, উপনিবেশের সংখ্যা স্থিতিশীল হচ্ছে, যদিও তাদের প্রতি উপনিবেশের উৎপাদন হ্রাস পাচ্ছে।
চলো, মৌমাছি, চলো!
@ -176,12 +177,12 @@ ax.figure.legend();
## পর্যালোচনা এবং স্ব-অধ্যয়ন
লাইন প্লট সহজ বা বেশ জটিল হতে পারে। [Seaborn ডকুমেন্টেশন](https://seaborn.pydata.org/generated/seaborn.lineplot.html) এ বিভিন্ন উপায়ে লাইন প্লট তৈরি করার বিষয়ে কিছু পড়াশোনা করুন। এই পাঠে আপনি যে লাইন চার্ট তৈরি করেছেন তা ডকুমেন্টেশনে তালিকাভুক্ত অন্যান্য পদ্ধতি ব্যবহার করে উন্নত করার চেষ্টা করুন।
লাইন প্লটগুলি সহজ বা বেশ জটিল হতে পারে। [Seaborn ডকুমেন্টেশন](https://seaborn.pydata.org/generated/seaborn.lineplot.html) এ কিছু পড়াশোনা করুন বিভিন্ন উপায়ে আপনি সেগুলি তৈরি করতে পারেন। এই পাঠে আপনি যে লাইন চার্ট তৈরি করেছেন সেগুলি ডকুমেন্টেশনে তালিকাভুক্ত অন্যান্য পদ্ধতি ব্যবহার করে উন্নত করার চেষ্টা করুন।
## অ্যাসাইনমেন্ট
[মৌচাকের মধ্যে ডুব দিন](assignment.md)
[মৌচাকে ডুব দিন](assignment.md)
---
**অস্বীকৃতি**:
এই নথিটি AI অনুবাদ পরিষেবা [Co-op Translator](https://github.com/Azure/co-op-translator) ব্যবহার করে অনুবাদ করা হয়েছে। আমরা যথাসম্ভব সঠিক অনুবাদ প্রদানের চেষ্টা করি, তবে অনুগ্রহ করে মনে রাখবেন যে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। মূল ভাষায় থাকা নথিটিকে প্রামাণিক উৎস হিসেবে বিবেচনা করা উচিত। গুরুত্বপূর্ণ তথ্যের জন্য, পেশাদার মানব অনুবাদ সুপারিশ করা হয়। এই অনুবাদ ব্যবহারের ফলে কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যা হলে আমরা তার জন্য দায়ী থাকব না।
এই নথিটি AI অনুবাদ পরিষেবা [Co-op Translator](https://github.com/Azure/co-op-translator) ব্যবহার করে অনুবাদ করা হয়েছে। আমরা যথাসম্ভব সঠিক অনুবাদের চেষ্টা করি, তবে অনুগ্রহ করে মনে রাখবেন যে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। নথিটির মূল ভাষায় লেখা সংস্করণটিকেই প্রামাণিক উৎস হিসেবে বিবেচনা করা উচিত। গুরুত্বপূর্ণ তথ্যের জন্য, পেশাদার মানব অনুবাদ ব্যবহার করার পরামর্শ দেওয়া হচ্ছে। এই অনুবাদ ব্যবহারের ফলে সৃষ্ট কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যার জন্য আমরা দায়ী নই।
@ -17,7 +17,7 @@ Continuando com o foco na natureza em nossa pesquisa, vamos descobrir visualiza
Este conjunto de dados, com cerca de 600 itens, exibe a produção de mel em muitos estados dos EUA. Por exemplo, você pode observar o número de colônias, rendimento por colônia, produção total, estoques, preço por libra e valor do mel produzido em um determinado estado de 1998 a 2012, com uma linha por ano para cada estado.
Será interessante visualizar a relação entre a produção anual de um estado e, por exemplo, o preço do mel nesse estado. Alternativamente, você poderia visualizar a relação entre o rendimento de mel por colônia nos estados. Este período cobre o devastador 'CCD' ou 'Colony Collapse Disorder' (Desordem do Colapso das Colônias), observado pela primeira vez em 2006 (http://npic.orst.edu/envir/ccd.html), tornando este conjunto de dados especialmente relevante para estudo. 🐝
Será interessante visualizar a relação entre a produção anual de um estado e, por exemplo, o preço do mel nesse estado. Alternativamente, você poderia visualizar a relação entre o rendimento de mel por colônia nos estados. Este período cobre o devastador 'CCD' ou 'Colony Collapse Disorder' (Desordem do Colapso das Colônias), observado pela primeira vez em 2006 (http://npic.orst.edu/envir/ccd.html), tornando este um conjunto de dados significativo para estudo. 🐝
Você percebe que os dados de mel possuem várias colunas interessantes, incluindo ano e preço por libra. Vamos explorar esses dados, agrupados por estado dos EUA:
| estado | numcol | rendimento_por_col | produção_total | estoques | preço_por_libra | valor_prod | ano |
Crie um gráfico de dispersão básico para mostrar a relação entre o preço por libra de mel e seu estado de origem nos EUA. Ajuste o eixo `y` para ser alto o suficiente para exibir todos os estados:
Crie um gráfico de dispersão básico para mostrar a relação entre o preço por libra de mel e seu estado de origem nos EUA. Faça o eixo `y` alto o suficiente para exibir todos os estados:
Agora, mostre os mesmos dados com um esquema de cores de mel para ilustrar como o preço evolui ao longo dos anos. Você pode fazer isso adicionando um parâmetro 'hue' para mostrar a mudança ano após ano:
Agora, mostre os mesmos dados com um esquema de cores de mel para mostrar como o preço evolui ao longo dos anos. Você pode fazer isso adicionando um parâmetro 'hue' para mostrar a mudança ano após ano:
> ✅ Saiba mais sobre as [paletas de cores que você pode usar no Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - experimente um belo esquema de cores em arco-íris!
Com essa mudança de esquema de cores, você pode ver claramente uma forte progressão ao longo dos anos no preço do mel por libra. De fato, ao verificar um conjunto de amostra nos dados (escolha um estado, como o Arizona, por exemplo), é possível observar um padrão de aumento de preço ano após ano, com poucas exceções:
| estado | numcol | rendimento_por_col | produção_total | estoques | preço_por_libra | valor_prod | ano |
Outra maneira de visualizar essa progressão é usar tamanho, em vez de cor. Para usuários com daltonismo, isso pode ser uma opção melhor. Edite sua visualização para mostrar o aumento do preço por meio do aumento na circunferência dos pontos:
Com essa mudança de esquema de cores, você pode ver claramente uma forte progressão ao longo dos anos em termos de preço do mel por libra. De fato, se você observar um conjunto de amostra nos dados para verificar (escolha um estado, como o Arizona, por exemplo), pode ver um padrão de aumento de preço ano após ano, com poucas exceções:
| estado | numcol | yieldpercol | totalprod | estoques | priceperlb | prodvalue | ano |
Outra maneira de visualizar essa progressão é usar tamanho, em vez de cor. Para usuários daltônicos, isso pode ser uma opção melhor. Edite sua visualização para mostrar o aumento do preço por meio do aumento na circunferência dos pontos:
Isso é um caso simples de oferta e demanda? Devido a fatores como mudanças climáticas e colapso das colônias, há menos mel disponível para compra ano após ano, e, portanto, o preço aumenta?
@ -102,29 +102,29 @@ Pergunta: Há um aumento claro no preço do mel por libra ano após ano? Você p
✅ Como o Seaborn está agregando dados em torno de uma linha, ele exibe "as múltiplas medições em cada valor de x, plotando a média e o intervalo de confiança de 95% ao redor da média". [Fonte](https://seaborn.pydata.org/tutorial/relational.html). Esse comportamento que consome tempo pode ser desativado adicionando `ci=None`.
✅ Como o Seaborn está agregando dados em torno de uma linha, ele exibe "as múltiplas medições em cada valor de x, plotando a média e o intervalo de confiança de 95% em torno da média". [Fonte](https://seaborn.pydata.org/tutorial/relational.html). Esse comportamento demorado pode ser desativado adicionando `ci=None`.
Pergunta: Bem, em 2003 também podemos ver um aumento na oferta de mel? E se você observar a produção total ano após ano?
Pergunta: Bem, em 2003 também podemos ver um pico na oferta de mel? E se você observar a produção total ano após ano?
Resposta: Não exatamente. Se você observar a produção total, parece que ela realmente aumentou naquele ano específico, embora, de forma geral, a quantidade de mel produzida esteja em declínio durante esses anos.
Resposta: Não exatamente. Se você observar a produção total, parece que ela realmente aumentou naquele ano específico, embora, de forma geral, a quantidade de mel sendo produzida esteja em declínio durante esses anos.
Pergunta: Nesse caso, o que poderia ter causado o aumento no preço do mel por volta de 2003?
Pergunta: Nesse caso, o que poderia ter causado o aumento no preço do mel em torno de 2003?
Para descobrir isso, você pode explorar uma grade de facetas.
## Grades de Facetas
Grades de facetas pegam um aspecto do seu conjunto de dados (neste caso, você pode escolher 'ano' para evitar produzir muitas facetas). O Seaborn pode então criar um gráfico para cada uma dessas facetas de suas coordenadas x e y escolhidas, facilitando a comparação visual. O ano de 2003 se destaca nesse tipo de comparação?
Grades de facetas pegam um aspecto do seu conjunto de dados (neste caso, você pode escolher 'ano' para evitar produzir muitas facetas). O Seaborn pode então criar um gráfico para cada uma dessas facetas de suas coordenadas x e y escolhidas para facilitar a comparação visual. 2003 se destaca nesse tipo de comparação?
Crie uma grade de facetas continuando a usar `relplot`, conforme recomendado pela [documentação do Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Nesta visualização, você pode comparar o rendimento por colônia e o número de colônias ano após ano, lado a lado, com um wrap definido em 3 para as colunas:
Para este conjunto de dados, nada particularmente se destaca em relação ao número de colônias e seu rendimento, ano após ano e estado por estado. Existe uma maneira diferente de encontrar uma correlação entre essas duas variáveis?
## Gráficos de Linha Dupla
Experimente um gráfico de linha múltipla superpondo dois gráficos de linha um sobre o outro, usando o 'despine' do Seaborn para remover as bordas superior e direita, e usando `ax.twinx` [derivado do Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx permite que um gráfico compartilhe o eixo x e exiba dois eixos y. Então, exiba o rendimento por colônia e o número de colônias, superpostos:
Experimente um gráfico de linha múltipla sobrepondo dois gráficos de linha um sobre o outro, usando o 'despine' do Seaborn para remover as bordas superior e direita, e usando `ax.twinx` [derivado do Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx permite que um gráfico compartilhe o eixo x e exiba dois eixos y. Então, exiba o rendimento por colônia e o número de colônias, sobrepostos:
Embora nada salte aos olhos em torno do ano de 2003, isso nos permite terminar esta lição com uma nota um pouco mais feliz: embora o número de colônias esteja em declínio geral, ele está se estabilizando, mesmo que o rendimento por colônia esteja diminuindo.
@ -176,7 +177,7 @@ Nesta lição, você aprendeu um pouco mais sobre outros usos de gráficos de di
## Revisão & Autoestudo
Gráficos de linha podem ser simples ou bastante complexos. Leia um pouco na [documentação do Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) sobre as várias maneiras de construí-los. Tente aprimorar os gráficos de linha que você criou nesta lição com outros métodos listados na documentação.
Gráficos de linha podem ser simples ou bastante complexos. Leia um pouco na [documentação do Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) sobre as várias maneiras de construí-los. Tente aprimorar os gráficos de linha que você construiu nesta lição com outros métodos listados na documentação.
## Tarefa
@ -185,4 +186,4 @@ Gráficos de linha podem ser simples ou bastante complexos. Leia um pouco na [do
---
**Aviso Legal**:
Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional feita por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.
Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.
|Vizualizace vztahů - _Sketchnote od [@nitya](https://twitter.com/nitya)_ |
Pokračujeme v přírodním zaměření našeho výzkumu a objevujeme zajímavé vizualizace, které ukazují vztahy mezi různými typy medu podle datového souboru od [Ministerstva zemědělství Spojených států](https://www.nass.usda.gov/About_NASS/index.php).
Pokračujeme v přírodním zaměření našeho výzkumu a objevujeme zajímavé vizualizace, které ukazují vztahy mezi různými typy medu podle datasetu odvozeného z [Ministerstva zemědělství Spojených států](https://www.nass.usda.gov/About_NASS/index.php).
Tento datový soubor obsahuje přibližně 600 položek a zobrazuje produkci medu v mnoha státech USA. Například můžete sledovat počet včelstev, výnos na včelstvo, celkovou produkci, zásoby, cenu za libru a hodnotu medu vyprodukovaného v daném státě v letech 1998–2012, přičemž každý řádek představuje jeden rok pro každý stát.
Tento dataset obsahuje přibližně 600 položek a zobrazuje produkci medu v mnoha státech USA. Například můžete sledovat počet včelstev, výnos na včelstvo, celkovou produkci, zásoby, cenu za libru a hodnotu vyprodukovaného medu v daném státě od roku 1998 do roku 2012, přičemž každý řádek představuje jeden rok pro každý stát.
Bude zajímavé vizualizovat vztah mezi produkcí medu v daném státě za rok a například cenou medu v tomto státě. Alternativně můžete vizualizovat vztah mezi výnosem medu na včelstvo v jednotlivých státech. Toto časové období zahrnuje devastující 'CCD' neboli 'Colony Collapse Disorder', poprvé zaznamenané v roce 2006 (http://npic.orst.edu/envir/ccd.html), což z něj činí významný datový soubor ke studiu. 🐝
Bylo by zajímavé vizualizovat vztah mezi produkcí v daném státě za rok a například cenou medu v tomto státě. Alternativně byste mohli vizualizovat vztah mezi výnosem medu na včelstvo v jednotlivých státech. Toto časové období zahrnuje devastující „CCD“ neboli „Colony Collapse Disorder“ (kolaps včelstev), který byl poprvé zaznamenán v roce 2006 (http://npic.orst.edu/envir/ccd.html), což činí tento dataset obzvláště zajímavým ke studiu. 🐝
## [Kvíz před lekcí](https://ff-quizzes.netlify.app/en/ds/quiz/22)
V této lekci můžete použít knihovnu Seaborn, kterou jste již dříve používali, jako skvělý nástroj pro vizualizaci vztahů mezi proměnnými. Zvláště zajímavá je funkce `relplot` v Seabornu, která umožňuje rychle vytvářet bodové a čárové grafy pro vizualizaci '[statistických vztahů](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', což datovým vědcům pomáhá lépe pochopit, jak spolu proměnné souvisejí.
V této lekci můžete použít knihovnu Seaborn, kterou jste již dříve používali, jako skvělý nástroj pro vizualizaci vztahů mezi proměnnými. Zvláště zajímavá je funkce `relplot` v Seabornu, která umožňuje rychle vytvářet bodové a čárové grafy pro vizualizaci '[statistických vztahů](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', což datovým vědcům umožňuje lépe pochopit, jak spolu proměnné souvisejí.
## Bodové grafy
Použijte bodový graf k zobrazení, jak se cena medu vyvíjela rok od roku v jednotlivých státech. Seaborn, díky funkci `relplot`, pohodlně seskupuje data podle států a zobrazuje datové body pro kategorická i číselná data.
Použijte bodový graf k zobrazení, jak se cena medu vyvíjela rok od roku v jednotlivých státech. Seaborn, pomocí funkce `relplot`, pohodlně seskupí data podle států a zobrazí datové body jak pro kategorická, tak pro číselná data.
Začněme importem dat a knihovny Seaborn:
@ -46,23 +46,23 @@ Všimnete si, že data o medu obsahují několik zajímavých sloupců, včetně
Vytvořte základní bodový graf, který ukazuje vztah mezi cenou za libru medu a státem jeho původu. Udělejte osu `y` dostatečně vysokou, aby zobrazila všechny státy:
Vytvořte základní bodový graf, který ukáže vztah mezi cenou za libru medu a státem jeho původu. Osa `y` by měla být dostatečně vysoká, aby zobrazila všechny státy:
Nyní zobrazte stejná data s barevným schématem medu, které ukazuje, jak se cena vyvíjí v průběhu let. Toho můžete dosáhnout přidáním parametru 'hue', který ukazuje změny rok od roku:
Nyní zobrazte stejná data s barevným schématem připomínajícím med, abyste ukázali, jak se cena vyvíjela v průběhu let. Toho můžete dosáhnout přidáním parametru 'hue', který ukáže změnu rok od roku:
> ✅ Více o [barevných paletách, které můžete použít v Seabornu](https://seaborn.pydata.org/tutorial/color_palettes.html) - vyzkoušejte krásné duhové barevné schéma!
> ✅ Více o [barevných paletách v Seabornu](https://seaborn.pydata.org/tutorial/color_palettes.html) - vyzkoušejte krásné duhové schéma!
S touto změnou barevného schématu je zřejmé, že v průběhu let dochází k výraznému nárůstu ceny za libru medu. Pokud se podíváte na vzorek dat (například stát Arizona), můžete vidět vzorec zvyšování cen rok od roku, s několika výjimkami:
S touto změnou barevného schématu je zřejmé, že cena za libru medu v průběhu let výrazně stoupá. Pokud se podíváte na vzorek dat (například stát Arizona), můžete vidět vzorec zvyšování cen rok od roku s několika výjimkami:
| stát | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Dalším způsobem, jak vizualizovat tento vývoj, je použít velikost místo barvy. Pro uživatele s poruchou barevného vidění by to mohla být lepší volba. Upravte svou vizualizaci tak, aby ukazovala nárůst ceny zvětšením obvodu bodů:
Dalším způsobem, jak vizualizovat tento vývoj, je použití velikosti místo barvy. Pro uživatele s poruchami barevného vidění by to mohlo být lepší řešení. Upravte svou vizualizaci tak, aby zvýšení ceny bylo znázorněno zvětšením obvodu bodů:
Je to jednoduchý případ nabídky a poptávky? Kvůli faktorům, jako je změna klimatu a kolaps včelstev, je rok od roku k dispozici méně medu k prodeji, a proto cena stoupá?
Je to jednoduchý případ nabídky a poptávky? Kvůli faktorům, jako je změna klimatu a kolaps včelstev, je k dispozici méně medu k prodeji rok od roku, a proto cena stoupá?
Abychom objevili korelaci mezi některými proměnnými v tomto datovém souboru, prozkoumejme čárové grafy.
Pro zjištění korelace mezi některými proměnnými v tomto datasetu prozkoumejme čárové grafy.
## Čárové grafy
Otázka: Je zřejmý nárůst ceny medu za libru rok od roku? Nejjednodušeji to zjistíte vytvořením jednoho čárového grafu:
Otázka: Je zřejmý nárůst ceny medu za libru rok od roku? To můžete nejlépe zjistit vytvořením jednoduchého čárového grafu:
✅ Protože Seaborn agreguje data kolem jedné čáry, zobrazuje "vícenásobná měření na každé hodnotě x tím, že vykresluje průměr a 95% interval spolehlivosti kolem průměru". [Zdroj](https://seaborn.pydata.org/tutorial/relational.html). Toto časově náročné chování lze deaktivovat přidáním `ci=None`.
✅ Protože Seaborn agreguje data do jedné čáry, zobrazuje „vícenásobná měření pro každou hodnotu x vykreslením průměru a 95% intervalem spolehlivosti kolem průměru“. [Zdroj](https://seaborn.pydata.org/tutorial/relational.html). Toto časově náročné chování lze vypnout přidáním `ci=None`.
Otázka: No, v roce 2003 můžeme také vidět nárůst zásob medu? Co když se podíváte na celkovou produkci rok od roku?
Otázka: No, můžeme v roce 2003 také vidět nárůst zásob medu? Co když se podíváte na celkovou produkci rok od roku?
Odpověď: Ani ne. Pokud se podíváte na celkovou produkci, zdá se, že v tomto konkrétním roce skutečně vzrostla, i když obecně množství vyprodukovaného medu v těchto letech klesá.
Otázka: V tom případě, co mohlo způsobit ten nárůst ceny medu kolem roku 2003?
Otázka: V tom případě, co mohlo způsobit nárůst ceny medu kolem roku 2003?
Abychom to zjistili, můžeme prozkoumat mřížku facetů.
Pro zjištění toho můžete prozkoumat mřížku faset.
## Mřížky facetů
## Mřížky faset
Mřížky facetů berou jednu část vašeho datového souboru (v našem případě můžete zvolit 'rok', abyste se vyhnuli příliš mnoha vytvořeným facetům). Seaborn pak vytvoří graf pro každý z těchto facetů podle zvolených souřadnic x a y pro snadnější vizuální porovnání. Vyniká rok 2003 v tomto typu porovnání?
Mřížky faset vezmou jednu fasetu vašeho datasetu (v našem případě můžete zvolit 'rok', abyste se vyhnuli příliš mnoha fasetám). Seaborn pak vytvoří graf pro každou z těchto faset podle zvolených souřadnic x a y pro snadnější vizuální porovnání. Vyniká rok 2003 v tomto typu porovnání?
Vytvořte mřížku facetů pomocí funkce`relplot`, jak doporučuje [dokumentace Seabornu](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
Vytvořte mřížku faset pokračováním v používání`relplot`, jak doporučuje [dokumentace Seabornu](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
V této vizualizaci můžete porovnat výnos na včelstvo a počet včelstev rok od roku vedle sebe s nastavením wrapu na 3 pro sloupce:
V této vizualizaci můžete porovnat výnos na včelstvo a počet včelstev rok od roku vedle sebe s nastavením wrap na 3 pro sloupce:
Pro tento datový soubor nic zvláštního nevyniká, pokud jde o počet včelstev a jejich výnos rok od roku a stát od státu. Existuje jiný způsob, jak najít korelaci mezi těmito dvěma proměnnými?
Pro tento dataset nic zvláštního nevyniká, pokud jde o počet včelstev a jejich výnos rok od roku a stát od státu. Existuje jiný způsob, jak hledat korelaci mezi těmito dvěma proměnnými?
## Dvojité čárové grafy
Vyzkoušejte vícenásobný čárový graf překrytím dvou čárových grafů na sebe, pomocí funkce Seaborn 'despine' k odstranění jejich horních a pravých os a použitím `ax.twinx` [odvozeného z Matplotlibu](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx umožňuje grafu sdílet osu x a zobrazit dvě osy y. Zobrazte výnos na včelstvo a počet včelstev překryté:
Vyzkoušejte vícenásobný čárový graf překrytím dvou čárových grafů na sebe, pomocí funkce `despine` v Seabornu k odstranění horních a pravých os a použitím `ax.twinx` [odvozeného z Matplotlibu](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx umožňuje grafu sdílet osu x a zobrazit dvě osy y. Zobrazte výnos na včelstvo a počet včelstev překryté:
I když kolem roku 2003 nic výrazně nevyniká, umožňuje nám to zakončit tuto lekci na trochu pozitivnější notě: i když celkově počet včelstev klesá, jejich počet se stabilizuje, i když jejich výnos na včelstvo klesá.
I když kolem roku 2003 nic zvláštního nevyniká, umožňuje nám to zakončit tuto lekci na trochu pozitivnější notě: i když celkový počet včelstev klesá, jejich počet se stabilizuje, i když jejich výnos na včelstvo klesá.
Jen tak dál, včely!
Do toho, včely, do toho!
🐝❤️
## 🚀 Výzva
V této lekci jste se dozvěděli více o dalších využitích bodových grafů a mřížek facetů, včetně mřížek facetů. Vyzkoušejte si vytvořit mřížku facetů pomocí jiného datového souboru, možná jednoho, který jste použili před těmito lekcemi. Všimněte si, jak dlouho trvá jejich vytvoření a jak musíte být opatrní ohledně počtu mřížek, které potřebujete vykreslit pomocí těchto technik.
V této lekci jste se dozvěděli více o dalších využitích bodových grafů a mřížek faset, včetně mřížek faset. Vyzkoušejte si vytvořit mřížku faset pomocí jiného datasetu, možná takového, který jste použili v předchozích lekcích. Všimněte si, jak dlouho jejich vytvoření trvá a jak musíte být opatrní ohledně počtu mřížek, které potřebujete vykreslit pomocí těchto technik.
## [Kvíz po lekci](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Přehled & Samostudium
## Přehled a samostudium
Čárové grafy mohou být jednoduché nebo poměrně složité. Přečtěte si něco více v [dokumentaci Seabornu](https://seaborn.pydata.org/generated/seaborn.lineplot.html) o různých způsobech, jak je můžete vytvořit. Zkuste vylepšit čárové grafy, které jste vytvořili v této lekci, pomocí dalších metod uvedených v dokumentaci.
## Úkol
Čárové grafy mohou být jednoduché nebo poměrně složité. Přečtěte si více v [dokumentaci Seabornu](https://seaborn.pydata.org/generated/seaborn.lineplot.html) o různých způsobech, jak je můžete vytvořit. Zkuste vylepšit čárové grafy, které jste vytvořili v této lekci, pomocí dalších metod uvedených v dokumentaci.
## Zadání
[Ponořte se do úlu](assignment.md)
---
**Prohlášení**:
Tento dokument byl přeložen pomocí služby pro automatický překlad [Co-op Translator](https://github.com/Azure/co-op-translator). I když se snažíme o přesnost, mějte prosím na paměti, že automatické překlady mohou obsahovat chyby nebo nepřesnosti. Původní dokument v jeho původním jazyce by měl být považován za autoritativní zdroj. Pro důležité informace doporučujeme profesionální lidský překlad. Neodpovídáme za žádná nedorozumění nebo nesprávné interpretace vyplývající z použití tohoto překladu.
Tento dokument byl přeložen pomocí služby pro automatický překlad [Co-op Translator](https://github.com/Azure/co-op-translator). I když se snažíme o co největší přesnost, mějte prosím na paměti, že automatické překlady mohou obsahovat chyby nebo nepřesnosti. Za autoritativní zdroj by měl být považován původní dokument v jeho původním jazyce. Pro důležité informace doporučujeme profesionální lidský překlad. Neodpovídáme za žádná nedorozumění nebo nesprávné výklady vyplývající z použití tohoto překladu.
|Visualisering af relationer - _Sketchnote af [@nitya](https://twitter.com/nitya)_ |
Vi fortsætter med naturfokus i vores forskning og udforsker interessante visualiseringer, der viser relationerne mellem forskellige typer honning, baseret på et datasæt fra [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
Med fokus på naturen i vores forskning, lad os udforske interessante visualiseringer, der viser relationerne mellem forskellige typer honning, baseret på et datasæt fra [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
Dette datasæt med omkring 600 poster viser honningproduktion i mange amerikanske stater. For eksempel kan du se på antallet af kolonier, udbytte pr. koloni, total produktion, lagre, pris pr. pund og værdien af den producerede honning i en given stat fra 1998-2012, med én række pr. år for hver stat.
Dette datasæt med omkring 600 poster viser honningproduktion i mange amerikanske stater. For eksempel kan du se på antallet af kolonier, udbytte pr. koloni, den samlede produktion, lagre, pris pr. pund og værdien af den producerede honning i en given stat fra 1998-2012, med én række pr. år for hver stat.
Det vil være interessant at visualisere relationen mellem en given stats produktion pr. år og f.eks. prisen på honning i den stat. Alternativt kunne du visualisere relationen mellem staters honningudbytte pr. koloni. Denne tidsperiode dækker den ødelæggende 'CCD' eller 'Colony Collapse Disorder', som først blev observeret i 2006 (http://npic.orst.edu/envir/ccd.html), så det er et tankevækkende datasæt at studere. 🐝
Det kunne være interessant at visualisere forholdet mellem en stats produktion pr. år og for eksempel prisen på honning i den stat. Alternativt kunne du visualisere forholdet mellem staters honningudbytte pr. koloni. Denne tidsperiode dækker også den ødelæggende 'CCD' eller 'Colony Collapse Disorder', som først blev observeret i 2006 (http://npic.orst.edu/envir/ccd.html), hvilket gør det til et tankevækkende datasæt at studere. 🐝
## [Quiz før lektionen](https://ff-quizzes.netlify.app/en/ds/quiz/22)
I denne lektion kan du bruge Seaborn, som du har brugt før, som et godt bibliotek til at visualisere relationer mellem variabler. Særligt interessant er brugen af Seaborns `relplot`-funktion, der tillader scatterplots og linjediagrammer til hurtigt at visualisere '[statistiske relationer](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', hvilket giver dataforskeren en bedre forståelse af, hvordan variabler relaterer til hinanden.
I denne lektion kan du bruge Seaborn, som du tidligere har arbejdet med, som et godt bibliotek til at visualisere relationer mellem variabler. Især interessant er brugen af Seaborns `relplot`-funktion, der gør det muligt at lave scatterplots og linjediagrammer for hurtigt at visualisere '[statistiske relationer](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', hvilket giver dataforskeren en bedre forståelse af, hvordan variabler relaterer til hinanden.
## Scatterplots
Brug et scatterplot til at vise, hvordan prisen på honning har udviklet sig år for år pr. stat. Seaborn, ved brug af `relplot`, grupperer bekvemt data fra staterne og viser datapunkter for både kategoriske og numeriske data.
Brug et scatterplot til at vise, hvordan prisen på honning har udviklet sig år for år i hver stat. Seaborn, ved brug af `relplot`, grupperer praktisk statens data og viser datapunkter for både kategoriske og numeriske data.
Lad os starte med at importere dataene og Seaborn:
@ -36,9 +36,9 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Du bemærker, at honningdataene har flere interessante kolonner, inklusive år og pris pr. pund. Lad os udforske disse data, grupperet efter amerikanske stater:
Du bemærker, at honningdataene har flere interessante kolonner, herunder år og pris pr. pund. Lad os udforske disse data, grupperet efter amerikanske stater:
| stat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Lav et grundlæggende scatterplot for at vise relationen mellem prisen pr. pund honning og dens oprindelsesstat i USA. Gør `y`-aksen høj nok til at vise alle staterne:
Lav et grundlæggende scatterplot for at vise forholdet mellem prisen pr. pund honning og dens oprindelsesstat. Gør `y`-aksen høj nok til at vise alle stater:
Vis nu de samme data med en honningfarvepalet for at vise, hvordan prisen udvikler sig over årene. Du kan gøre dette ved at tilføje en 'hue'-parameter for at vise ændringen år for år:
Vis nu de samme data med en honningfarveskala for at vise, hvordan prisen udvikler sig over årene. Dette kan gøres ved at tilføje en 'hue'-parameter for at vise ændringen år for år:
> ✅ Lær mere om de [farvepaletter, du kan bruge i Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - prøv en smuk regnbuefarvepalet!
> ✅ Lær mere om de [farvepaletter, du kan bruge i Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - prøv en smuk regnbuefarveskala!
Med denne farveændring kan du tydeligt se en stærk progression over årene i forhold til honningprisen pr. pund. Hvis du ser på et eksempel i datasættet for at verificere (vælg en given stat, f.eks. Arizona), kan du se et mønster med prisstigninger år for år, med få undtagelser:
Med denne farveskalaændring kan du tydeligt se en stærk progression over årene i forhold til prisen på honning pr. pund. Hvis du ser på et eksempel i datasættet for at verificere (vælg for eksempel Arizona), kan du se et mønster af prisstigninger år for år med få undtagelser:
| stat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
En anden måde at visualisere denne progression på er at bruge størrelse i stedet for farve. For farveblinde brugere kan dette være en bedre mulighed. Rediger din visualisering for at vise en prisstigning ved en stigning i prikstørrelse:
En anden måde at visualisere denne progression på er at bruge størrelse i stedet for farve. For farveblinde brugere kan dette være en bedre løsning. Rediger din visualisering, så prisstigningen vises ved en stigning i prikstørrelse:
Er dette et simpelt tilfælde af udbud og efterspørgsel? På grund af faktorer som klimaforandringer og kolonikollaps er der mindre honning tilgængelig for køb år for år, og derfor stiger prisen?
Er dette et simpelt tilfælde af udbud og efterspørgsel? På grund af faktorer som klimaforandringer og kolonikollaps, er der mindre honning til rådighed år for år, og derfor stiger prisen?
For at finde en korrelation mellem nogle af variablerne i dette datasæt, lad os udforske nogle linjediagrammer.
For at finde en sammenhæng mellem nogle af variablerne i dette datasæt, lad os udforske nogle linjediagrammer.
## Linjediagrammer
Spørgsmål: Er der en klar stigning i prisen på honning pr. pund år for år? Du kan nemmest opdage dette ved at lave et enkelt linjediagram:
Spørgsmål: Er der en tydelig stigning i prisen på honning pr. pund år for år? Dette kan nemmest opdages ved at lave et enkelt linjediagram:
✅ Fordi Seaborn aggregerer data omkring én linje, viser det "de multiple målinger ved hver x-værdi ved at plotte gennemsnittet og 95% konfidensintervallet omkring gennemsnittet". [Kilde](https://seaborn.pydata.org/tutorial/relational.html). Denne tidskrævende adfærd kan deaktiveres ved at tilføje `ci=None`.
✅ Fordi Seaborn aggregerer data omkring én linje, viser den "de multiple målinger ved hver x-værdi ved at plotte gennemsnittet og det 95% konfidensinterval omkring gennemsnittet". [Kilde](https://seaborn.pydata.org/tutorial/relational.html). Denne tidskrævende adfærd kan deaktiveres ved at tilføje `ci=None`.
Spørgsmål: Nå, i 2003 kan vi også se en stigning i honningforsyningen? Hvad hvis du ser på den totale produktion år for år?
Spørgsmål: Nå, men i 2003, kan vi også se en stigning i honningforsyningen? Hvad hvis du ser på den samlede produktion år for år?
Svar: Ikke rigtig. Hvis du ser på den totale produktion, ser det faktisk ud til at være steget i det pågældende år, selvom mængden af produceret honning generelt er faldende i disse år.
Svar: Ikke rigtigt. Hvis du ser på den samlede produktion, ser det faktisk ud til at være steget i det pågældende år, selvom mængden af produceret honning generelt er faldende i disse år.
Spørgsmål: I så fald, hvad kunne have forårsaget den stigning i prisen på honning omkring 2003?
Spørgsmål: I så fald, hvad kunne have forårsaget stigningen i prisen på honning omkring 2003?
For at finde ud af dette kan du udforske et facet grid.
## Facet grids
Facet grids tager én facet af dit datasæt (i vores tilfælde kan du vælge 'år' for at undgå at producere for mange facetter). Seaborn kan derefter lave et plot for hver af disse facetter af dine valgte x- og y-koordinater for lettere visuel sammenligning. Skiller 2003 sig ud i denne type sammenligning?
Facet grids tager én facet af dit datasæt (i vores tilfælde kan du vælge 'år' for at undgå at få for mange facetter). Seaborn kan derefter lave et plot for hver af disse facetter af dine valgte x- og y-koordinater for lettere visuel sammenligning. Skiller 2003 sig ud i denne type sammenligning?
Lav et facet grid ved at fortsætte med at bruge `relplot` som anbefalet af [Seaborns dokumentation](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
I denne visualisering kan du sammenligne udbytte pr. koloni og antal kolonier år for år, side om side med en wrap sat til 3 for kolonnerne:
For dette datasæt skiller intet sig særligt ud med hensyn til antallet af kolonier og deres udbytte år for år og stat for stat. Er der en anden måde at finde en korrelation mellem disse to variabler?
For dette datasæt skiller intet sig særligt ud med hensyn til antallet af kolonier og deres udbytte, år for år og stat for stat. Er der en anden måde at finde en sammenhæng mellem disse to variabler?
## Dual-line plots
Prøv et multiline-plot ved at overlejre to linjediagrammer oven på hinanden, brug Seaborns 'despine' til at fjerne deres øverste og højre spines, og brug `ax.twinx` [afledt fra Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx tillader et diagram at dele x-aksen og vise to y-akser. Så vis udbytte pr. koloni og antal kolonier, overlejret:
Prøv et multiline-plot ved at overlejre to linjediagrammer oven på hinanden, brug Seaborns 'despine' til at fjerne deres øverste og højre akser, og brug `ax.twinx` [afledt fra Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx gør det muligt for et diagram at dele x-aksen og vise to y-akser. Så vis udbytte pr. koloni og antal kolonier, overlejret:
Selvom intet springer i øjnene omkring året 2003, giver det os mulighed for at afslutte denne lektion på en lidt gladere note: selvom der generelt er et faldende antal kolonier, stabiliserer antallet af kolonier sig, selvom deres udbytte pr. koloni er faldende.
Selvom intet springer i øjnene omkring året 2003, giver det os mulighed for at afslutte denne lektion på en lidt gladere note: Selvom antallet af kolonier generelt er faldende, stabiliserer antallet sig, selvom deres udbytte pr. koloni falder.
Kom så, bier, kom så!
🐝❤️
## 🚀 Udfordring
I denne lektion lærte du lidt mere om andre anvendelser af scatterplots og line grids, inklusive facet grids. Udfordr dig selv til at lave et facet grid ved hjælp af et andet datasæt, måske et du brugte før disse lektioner. Bemærk, hvor lang tid de tager at lave, og hvordan du skal være forsigtig med, hvor mange grids du skal tegne ved hjælp af disse teknikker.
I denne lektion lærte du lidt mere om andre anvendelser af scatterplots og linjegrids, herunder facet grids. Udfordr dig selv til at lave et facet grid ved hjælp af et andet datasæt, måske et du brugte tidligere i disse lektioner. Bemærk, hvor lang tid de tager at lave, og hvordan du skal være forsigtig med, hvor mange grids du skal tegne ved hjælp af disse teknikker.
## [Quiz efter lektionen](https://ff-quizzes.netlify.app/en/ds/quiz/23)
@ -184,4 +185,4 @@ Linjediagrammer kan være simple eller ret komplekse. Læs lidt i [Seaborns doku
---
**Ansvarsfraskrivelse**:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selvom vi bestræber os på at sikre nøjagtighed, skal du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det originale dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der måtte opstå som følge af brugen af denne oversættelse.
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selvom vi bestræber os på nøjagtighed, skal du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det originale dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der måtte opstå som følge af brugen af denne oversættelse.
|Beziehungen visualisieren - _Sketchnote von [@nitya](https://twitter.com/nitya)_ |
Im Rahmen unseres naturbezogenen Forschungsfokus wollen wir interessante Visualisierungen entdecken, um die Beziehungen zwischen verschiedenen Honigsorten darzustellen, basierend auf einem Datensatz des [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
Im Rahmen unseres naturbezogenen Forschungsfokus entdecken wir interessante Visualisierungen, um die Beziehungen zwischen verschiedenen Honigsorten darzustellen, basierend auf einem Datensatz des [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
Dieser Datensatz mit etwa 600 Einträgen zeigt die Honigproduktion in vielen US-Bundesstaaten. So können Sie beispielsweise die Anzahl der Bienenvölker, den Ertrag pro Volk, die Gesamtproduktion, Lagerbestände, den Preis pro Pfund und den Wert des produzierten Honigs in einem bestimmten Bundesstaat von 1998 bis 2012 betrachten, wobei jede Zeile ein Jahr pro Bundesstaat darstellt.
Es wäre interessant, die Beziehung zwischen der jährlichen Produktion eines Bundesstaates und beispielsweise dem Honigpreis in diesem Bundesstaat zu visualisieren. Alternativ könnten Sie die Beziehung zwischen den Erträgen pro Volk in verschiedenen Bundesstaaten darstellen. Dieser Zeitraum umfasst das verheerende „CCD“ oder „Colony Collapse Disorder“, das erstmals 2006 beobachtet wurde (http://npic.orst.edu/envir/ccd.html), was diesen Datensatz besonders interessant macht. 🐝
Es wäre interessant, die Beziehung zwischen der jährlichen Produktion eines Bundesstaates und beispielsweise dem Honigpreis in diesem Bundesstaat zu visualisieren. Alternativ könnten Sie die Beziehung zwischen den Erträgen pro Volk in verschiedenen Bundesstaaten darstellen. Dieser Zeitraum umfasst das verheerende 'CCD' oder 'Colony Collapse Disorder', das erstmals 2006 beobachtet wurde (http://npic.orst.edu/envir/ccd.html), was diesen Datensatz besonders relevant macht. 🐝
## [Quiz vor der Lektion](https://ff-quizzes.netlify.app/en/ds/quiz/22)
@ -25,7 +25,7 @@ In dieser Lektion können Sie Seaborn verwenden, eine Bibliothek, die Sie bereit
## Streudiagramme
Verwenden Sie ein Streudiagramm, um zu zeigen, wie sich der Honigpreis Jahr für Jahr in den einzelnen Bundesstaaten entwickelt hat. Seaborn gruppiert mit `relplot` bequem die Daten der Bundesstaaten und zeigt Datenpunkte sowohl für kategoriale als auch für numerische Daten an.
Verwenden Sie ein Streudiagramm, um zu zeigen, wie sich der Honigpreis Jahr für Jahr in den einzelnen Bundesstaaten entwickelt hat. Seaborn gruppiert mit `relplot` bequem die Daten der Bundesstaaten und zeigt Datenpunkte sowohl für kategoriale als auch numerische Daten an.
Beginnen wir mit dem Import der Daten und Seaborn:
@ -51,16 +51,16 @@ Erstellen Sie ein einfaches Streudiagramm, um die Beziehung zwischen dem Preis p
Zeigen Sie nun dieselben Daten mit einer Honig-Farbpalette, um zu zeigen, wie sich der Preis im Laufe der Jahre entwickelt. Sie können dies tun, indem Sie einen 'hue'-Parameter hinzufügen, um die Veränderung Jahr für Jahr darzustellen:
Zeigen Sie nun dieselben Daten mit einer honigfarbenen Farbpalette, um zu zeigen, wie sich der Preis im Laufe der Jahre entwickelt. Sie können dies tun, indem Sie einen 'hue'-Parameter hinzufügen, der die Veränderung Jahr für Jahr darstellt:
> ✅ Erfahren Sie mehr über die [Farbpaletten, die Sie in Seaborn verwenden können](https://seaborn.pydata.org/tutorial/color_palettes.html) - probieren Sie ein schönes Regenbogen-Farbschema aus!
Mit dieser Farbänderung können Sie deutlich sehen, dass es im Laufe der Jahre eine starke Entwicklung des Honigpreises pro Pfund gibt. Wenn Sie beispielsweise einen Bundesstaat wie Arizona auswählen, können Sie ein Muster von Preissteigerungen Jahr für Jahr mit wenigen Ausnahmen erkennen:
@ -82,14 +82,14 @@ Mit dieser Farbänderung können Sie deutlich sehen, dass es im Laufe der Jahre
Eine andere Möglichkeit, diese Entwicklung zu visualisieren, ist die Verwendung von Größe anstelle von Farbe. Für farbenblinde Benutzer könnte dies eine bessere Option sein. Bearbeiten Sie Ihre Visualisierung, um eine Preissteigerung durch eine Zunahme des Punktumfangs darzustellen:
Eine andere Möglichkeit, diese Entwicklung zu visualisieren, ist die Verwendung von Größe anstelle von Farbe. Für farbenblinde Benutzer könnte dies eine bessere Option sein. Bearbeiten Sie Ihre Visualisierung, um die Preissteigerung durch eine Zunahme des Punktumfangs darzustellen:
Ist dies ein einfacher Fall von Angebot und Nachfrage? Aufgrund von Faktoren wie Klimawandel und dem Zusammenbruch von Bienenvölkern gibt es Jahr für Jahr weniger Honig zu kaufen, und daher steigen die Preise?
✅ Da Seaborn die Daten um eine Linie aggregiert, zeigt es „die mehrfachen Messungen bei jedem x-Wert, indem es den Mittelwert und das 95%-Konfidenzintervall um den Mittelwert herum darstellt“. [Quelle](https://seaborn.pydata.org/tutorial/relational.html). Dieses zeitaufwändige Verhalten kann durch Hinzufügen von `ci=None` deaktiviert werden.
✅ Da Seaborn die Daten um eine Linie aggregiert, zeigt es "die mehrfachen Messungen bei jedem x-Wert, indem es den Mittelwert und das 95%-Konfidenzintervall um den Mittelwert herum darstellt". [Quelle](https://seaborn.pydata.org/tutorial/relational.html). Dieses zeitaufwändige Verhalten kann durch Hinzufügen von `ci=None` deaktiviert werden.
Frage: Nun, im Jahr 2003 können wir auch einen Anstieg des Honigangebots sehen? Was passiert, wenn Sie die Gesamtproduktion Jahr für Jahr betrachten?
Frage: Nun, können wir im Jahr 2003 auch einen Anstieg des Honigangebots sehen? Was passiert, wenn Sie die Gesamtproduktion Jahr für Jahr betrachten?
Antwort: Nicht wirklich. Wenn Sie die Gesamtproduktion betrachten, scheint sie in diesem Jahr tatsächlich gestiegen zu sein, obwohl die Honigproduktion im Allgemeinen in diesen Jahren rückläufig ist.
Frage: Was könnte in diesem Fall den Preisanstieg für Honig um das Jahr 2003 verursacht haben?
Frage: In diesem Fall, was könnte den Preisanstieg von Honig um das Jahr 2003 verursacht haben?
Um dies herauszufinden, können Sie ein Facet Grid erkunden.
## Facet Grids
Facet Grids nehmen eine Facette Ihres Datensatzes (in unserem Fall können Sie 'Jahr' wählen, um zu vermeiden, dass zu viele Facetten erstellt werden). Seaborn kann dann für jede dieser Facetten Ihrer gewählten x- und y-Koordinaten eine Grafik erstellen, um den Vergleich zu erleichtern. Fällt das Jahr 2003 in dieser Art von Vergleich auf?
Facet Grids nehmen eine Facette Ihres Datensatzes (in unserem Fall können Sie 'Jahr' wählen, um zu vermeiden, dass zu viele Facetten erstellt werden). Seaborn kann dann für jede dieser Facetten Ihrer gewählten x- und y-Koordinaten eine Grafik erstellen, um den Vergleich zu erleichtern. Fällt das Jahr 2003 in diesem Vergleich auf?
Erstellen Sie ein Facet Grid, indem Sie weiterhin `relplot` verwenden, wie in der [Seaborn-Dokumentation](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) empfohlen.
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
In dieser Visualisierung können Sie den Ertrag pro Volk und die Anzahl der Bienenvölker Jahr für Jahr nebeneinander vergleichen, mit einer Wrap-Einstellung von 3 für die Spalten:
Für diesen Datensatz fällt nichts Besonderes in Bezug auf die Anzahl der Bienenvölker und deren Ertrag Jahr für Jahr und Bundesstaat für Bundesstaat auf. Gibt es eine andere Möglichkeit, eine Korrelation zwischen diesen beiden Variablen zu finden?
## Dual-Line-Diagramme
Versuchen Sie ein Multiline-Diagramm, indem Sie zwei Liniendiagramme übereinander legen, Seaborns 'despine' verwenden, um die oberen und rechten Achsen zu entfernen, und `ax.twinx` [abgeleitet von Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) verwenden. Twinx ermöglicht es einem Diagramm, die x-Achse zu teilen und zwei y-Achsen anzuzeigen. Zeigen Sie den Ertrag pro Volk und die Anzahl der Bienenvölker übereinander an:
Versuchen Sie ein Multiline-Diagramm, indem Sie zwei Liniendiagramme übereinander legen, Seaborns 'despine' verwenden, um die oberen und rechten Achsen zu entfernen, und `ax.twinx` [abgeleitet von Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) verwenden. Twinx ermöglicht es einem Diagramm, die x-Achse zu teilen und zwei y-Achsen anzuzeigen. Zeigen Sie den Ertrag pro Volk und die Anzahl der Bienenvölker übereinandergelegt an:
Während nichts um das Jahr 2003 besonders auffällt, können wir diese Lektion mit einer etwas erfreulicheren Note abschließen: Obwohl die Anzahl der Bienenvölker insgesamt rückläufig ist, stabilisiert sich die Anzahl der Bienenvölker, auch wenn ihr Ertrag pro Volk abnimmt.
Während nichts um das Jahr 2003 besonders auffällt, können wir diese Lektion mit einer etwas erfreulicheren Note abschließen: Obwohl die Anzahl der Bienenvölker insgesamt abnimmt, stabilisiert sich die Anzahl der Bienenvölker, auch wenn ihr Ertrag pro Volk sinkt.
Go, bees, go!
@ -179,9 +180,9 @@ In dieser Lektion haben Sie mehr über andere Anwendungen von Streudiagrammen un
Liniendiagramme können einfach oder ziemlich komplex sein. Lesen Sie ein wenig in der [Seaborn-Dokumentation](https://seaborn.pydata.org/generated/seaborn.lineplot.html) über die verschiedenen Möglichkeiten, wie Sie sie erstellen können. Versuchen Sie, die Liniendiagramme, die Sie in dieser Lektion erstellt haben, mit anderen in den Dokumenten aufgeführten Methoden zu verbessern.
## Aufgabe
[Dive into the beehive](assignment.md)
[Tauchen Sie in den Bienenstock ein](assignment.md)
---
**Haftungsausschluss**:
Dieses Dokument wurde mithilfe des KI-Übersetzungsdienstes [Co-op Translator](https://github.com/Azure/co-op-translator) übersetzt. Obwohl wir uns um Genauigkeit bemühen, weisen wir darauf hin, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner ursprünglichen Sprache sollte als maßgebliche Quelle betrachtet werden. Für kritische Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die sich aus der Nutzung dieser Übersetzung ergeben.
Dieses Dokument wurde mit dem KI-Übersetzungsdienst [Co-op Translator](https://github.com/Azure/co-op-translator) übersetzt. Obwohl wir uns um Genauigkeit bemühen, beachten Sie bitte, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner ursprünglichen Sprache sollte als maßgebliche Quelle betrachtet werden. Für kritische Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die sich aus der Nutzung dieser Übersetzung ergeben.
|Οπτικοποίηση Σχέσεων - _Σκίτσο από [@nitya](https://twitter.com/nitya)_ |
Συνεχίζοντας με τη φυσική εστίαση της έρευνάς μας, ας ανακαλύψουμε ενδιαφέρουσες οπτικοποιήσεις γιανα δείξουμε τις σχέσεις μεταξύ διαφόρων τύπων μελιού, σύμφωνα με ένα σύνολο δεδομένων που προέρχεται από το [Υπουργείο Γεωργίας των Ηνωμένων Πολιτειών](https://www.nass.usda.gov/About_NASS/index.php).
Συνεχίζοντας με τη φυσική θεματολογία της έρευνάς μας, ας ανακαλύψουμε ενδιαφέρουσες οπτικοποιήσεις γιανα δείξουμε τις σχέσεις μεταξύ διαφόρων τύπων μελιού, σύμφωνα με ένα σύνολο δεδομένων που προέρχεται από το [Υπουργείο Γεωργίας των Ηνωμένων Πολιτειών](https://www.nass.usda.gov/About_NASS/index.php).
Αυτό το σύνολο δεδομένων, που περιλαμβάνει περίπου 600 στοιχεία, παρουσιάζει την παραγωγή μελιού σε πολλές πολιτείες των Η.Π.Α. Για παράδειγμα, μπορείτε ναδείτε τον αριθμό των αποικιών, την απόδοση ανά αποικία, τη συνολική παραγωγή, τα αποθέματα, την τιμή ανά λίβρα και την αξία του παραγόμενου μελιού σε μια δεδομένη πολιτεία από το 1998 έως το 2012, με μία γραμμή ανά έτος για κάθε πολιτεία.
Αυτό το σύνολο δεδομένων, που περιλαμβάνει περίπου 600 εγγραφές, παρουσιάζει την παραγωγή μελιού σε πολλές πολιτείες των Η.Π.Α. Για παράδειγμα, μπορείτε ναεξετάσετε τον αριθμό των αποικιών, την απόδοση ανά αποικία, τη συνολική παραγωγή, τα αποθέματα, την τιμή ανά λίβρα και την αξία του παραγόμενου μελιού σε μια συγκεκριμένη πολιτεία από το 1998 έως το 2012, με μία γραμμή δεδομένων ανά έτος για κάθε πολιτεία.
Θα ήταν ενδιαφέρον να οπτικοποιήσουμε τη σχέση μεταξύ της παραγωγής μιας πολιτείας ανά έτος και, για παράδειγμα, της τιμής του μελιού σε αυτή την πολιτεία. Εναλλακτικά, θα μπορούσατε να οπτικοποιήσετε τη σχέση μεταξύ της απόδοσης μελιού ανά αποικία στις πολιτείες. Αυτή η χρονική περίοδος περιλαμβάνει την καταστροφική «Διαταραχή Κατάρρευσης Αποικιών» (CCD), που παρατηρήθηκε για πρώτη φορά το 2006 (http://npic.orst.edu/envir/ccd.html), καθιστώντας το ένα σημαντικό σύνολο δεδομένων για μελέτη. 🐝
## [Κουίζ πριν το μάθημα](https://ff-quizzes.netlify.app/en/ds/quiz/22)
Σε αυτό το μάθημα, μπορείτε να χρησιμοποιήσετε τη βιβλιοθήκη Seaborn, την οποία έχετε χρησιμοποιήσει ξανά, ως ένα καλό εργαλείο για την οπτικοποίηση σχέσεων μεταξύ μεταβλητών. Ιδιαίτερα ενδιαφέρουσα είναι η χρήση της συνάρτησης `relplot` του Seaborn, που επιτρέπει τη δημιουργία διαγραμμάτων διασποράς και γραμμών για γρήγορη οπτικοποίηση των '[στατιστικών σχέσεων](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', βοηθώντας τον επιστήμονα δεδομένων να κατανοήσει καλύτερα πώς σχετίζονται οι μεταβλητές μεταξύ τους.
Σε αυτό το μάθημα, μπορείτε να χρησιμοποιήσετε τη βιβλιοθήκη Seaborn, την οποία έχετε ήδη χρησιμοποιήσει, ως ένα εξαιρετικό εργαλείο για την οπτικοποίηση σχέσεων μεταξύ μεταβλητών. Ιδιαίτερα ενδιαφέρουσα είναι η χρήση της συνάρτησης `relplot` του Seaborn, η οποία επιτρέπει τη δημιουργία διαγραμμάτων διασποράς και γραμμών για γρήγορη οπτικοποίηση των '[στατιστικών σχέσεων](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', βοηθώντας τον επιστήμονα δεδομένων να κατανοήσει καλύτερα πώς σχετίζονται οι μεταβλητές μεταξύ τους.
## Διαγράμματα Διασποράς
Χρησιμοποιήστε ένα διάγραμμα διασποράς γιανα δείξετε πώς εξελίχθηκε η τιμή του μελιού, χρόνο με τον χρόνο, ανά πολιτεία. Το Seaborn, χρησιμοποιώντας το `relplot`, ομαδοποιεί βολικά τα δεδομένα ανά πολιτεία και εμφανίζει σημεία δεδομένων για κατηγορικά και αριθμητικά δεδομένα.
Χρησιμοποιήστε ένα διάγραμμα διασποράς γιανα δείξετε πώς εξελίχθηκε η τιμή του μελιού, χρόνο με τον χρόνο, ανά πολιτεία. Το Seaborn, χρησιμοποιώντας το `relplot`, ομαδοποιεί βολικά τα δεδομένα ανά πολιτεία και εμφανίζει σημεία δεδομένων για κατηγορικές και αριθμητικές τιμές.
Ας ξεκινήσουμε εισάγοντας τα δεδομένα και το Seaborn:
Ας ξεκινήσουμε εισάγοντας τα δεδομένα και τη βιβλιοθήκη Seaborn:
Τώρα, δείξτε τα ίδια δεδομένα με μια χρωματική παλέτα που θυμίζει μέλι, γιανα δείξετε πώς εξελίσσεται η τιμή με την πάροδο των ετών. Μπορείτε να το κάνετε αυτό προσθέτοντας μια παράμετρο 'hue' γιανα δείξετε την αλλαγή, χρόνο με τον χρόνο:
Τώρα, δείξτε τα ίδια δεδομένα με μια χρωματική παλέτα που θυμίζει μέλι, γιανα δείξετε πώς εξελίσσεται η τιμή με την πάροδο των ετών. Μπορείτε να το κάνετε αυτό προσθέτοντας την παράμετρο 'hue' γιανα δείξετε την αλλαγή, χρόνο με τον χρόνο:
> ✅ Μάθετε περισσότερα για τις [χρωματικές παλέτες που μπορείτε να χρησιμοποιήσετε στο Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - δοκιμάστε μια όμορφη παλέτα ουράνιου τόξου!
Με αυτή την αλλαγή χρωματικής παλέτας, μπορείτε να δείτε ότι υπάρχει προφανώς μια ισχυρή εξέλιξη με την πάροδο των ετών όσον αφορά την τιμή του μελιού ανά λίβρα. Πράγματι, ανκοιτάξετε ένα δείγμα δεδομένων γιανα το επαληθεύσετε (π.χ. την πολιτεία της Αριζόνα), μπορείτε να δείτε ένα μοτίβο αύξησης της τιμής χρόνο με τον χρόνο, με λίγες εξαιρέσεις:
Με αυτή την αλλαγή χρωματικής παλέτας, μπορείτε να δείτε ότι υπάρχει προφανώς μια ισχυρή πρόοδος με την πάροδο των ετών όσον αφορά την τιμή του μελιού ανά λίβρα. Πράγματι, ανεξετάσετε ένα δείγμα δεδομένων (π.χ. την πολιτεία της Αριζόνα), μπορείτε να δείτε ένα μοτίβο αύξησης της τιμής χρόνο με τον χρόνο, με λίγες εξαιρέσεις:
| πολιτεία | αποικίες | απόδοση/αποικία | συνολική παραγωγή | αποθέματα | τιμή/λίβρα | αξία παραγωγής | έτος |
Ένας άλλος τρόπος να οπτικοποιήσετε αυτή την εξέλιξη είναι να χρησιμοποιήσετε το μέγεθος αντί για το χρώμα. Για χρήστες με αχρωματοψία, αυτό μπορεί να είναι μια καλύτερη επιλογή. Επεξεργαστείτε την οπτικοποίησή σας ώστε να δείξετε την αύξηση της τιμής μέσω της αύξησης της περιφέρειας των κουκκίδων:
Ένας άλλος τρόπος να οπτικοποιήσετε αυτή την πρόοδο είναι να χρησιμοποιήσετε το μέγεθος αντί για το χρώμα. Για χρήστες με αχρωματοψία, αυτό μπορεί να είναι μια καλύτερη επιλογή. Επεξεργαστείτε την οπτικοποίησή σας ώστε να δείξετε την αύξηση της τιμής μέσω της αύξησης της περιφέρειας των κουκκίδων:
Είναι αυτό μια απλή περίπτωση προσφοράς και ζήτησης; Λόγω παραγόντων όπως η κλιματική αλλαγή και η κατάρρευση αποικιών, υπάρχει λιγότερο διαθέσιμο μέλι για αγορά χρόνο με τον χρόνο, και έτσι η τιμή αυξάνεται;
Είναι αυτό μια απλή περίπτωση προσφοράς και ζήτησης; Λόγω παραγόντων όπως η κλιματική αλλαγή και η κατάρρευση αποικιών, υπάρχει λιγότερο διαθέσιμο μέλι για αγορά χρόνο με τον χρόνο, και έτσι αυξάνεται η τιμή;
Για να ανακαλύψουμε μια συσχέτιση μεταξύ ορισμένων μεταβλητών σε αυτό το σύνολο δεδομένων, ας εξερευνήσουμε μερικά διαγράμματα γραμμών.
Για να ανακαλύψουμε μια συσχέτιση μεταξύ ορισμένων μεταβλητών αυτού του συνόλου δεδομένων, ας εξερευνήσουμε μερικά διαγράμματα γραμμών.
## Διαγράμματα Γραμμών
Ερώτηση: Υπάρχει σαφής αύξηση της τιμής του μελιού ανά λίβρα χρόνο με τον χρόνο; Μπορείτε να το ανακαλύψετε πιο εύκολα δημιουργώντας ένα απλό διάγραμμα γραμμών:
Ερώτηση: Υπάρχει σαφής αύξηση της τιμής του μελιού ανά λίβρα χρόνο με τον χρόνο; Μπορείτε να το ανακαλύψετε εύκολα δημιουργώντας ένα απλό διάγραμμα γραμμής:
✅ Επειδή το Seaborn συγκεντρώνει δεδομένα γύρω από μία γραμμή, εμφανίζει «τις πολλαπλές μετρήσεις σε κάθε τιμή x σχεδιάζοντας τον μέσο όρο και το διάστημα εμπιστοσύνης 95% γύρω από τον μέσο όρο». [Πηγή](https://seaborn.pydata.org/tutorial/relational.html). Αυτή η χρονοβόρα συμπεριφορά μπορεί να απενεργοποιηθεί προσθέτοντας `ci=None`.
Απάντηση: Όχι ακριβώς. Αν κοιτάξετε τη συνολική παραγωγή, φαίνεται ότι αυξήθηκε εκείνη τη χρονιά, παρόλο που γενικά η ποσότητα του παραγόμενου μελιού μειώνεται κατά τη διάρκεια αυτών των ετών.
Απάντηση: Όχι ακριβώς. Αν κοιτάξετε τη συνολική παραγωγή, φαίνεται να έχει αυξηθεί εκείνη τη χρονιά, παρόλο που γενικά η ποσότητα του παραγόμενου μελιού μειώνεται κατά τη διάρκεια αυτών των ετών.
Ερώτηση: Σε αυτή την περίπτωση, τι θα μπορούσε ναπροκάλεσε αυτή την αύξηση στην τιμή του μελιού γύρω στο 2003;
Ερώτηση: Σε αυτή την περίπτωση, τι θα μπορούσε ναέχει προκαλέσει την αύξηση της τιμής του μελιού γύρω στο 2003;
Για να το ανακαλύψετε, μπορείτε να εξερευνήσετε ένα πλέγμα όψεων.
## Πλέγματα Όψεων
Τα πλέγματα όψεων λαμβάνουν μία όψη του συνόλου δεδομένων σας (στην περίπτωσή μας, μπορείτε να επιλέξετε το 'έτος' γιανα αποφύγετε την παραγωγή υπερβολικά πολλών όψεων). Το Seaborn μπορεί στη συνέχεια να δημιουργήσει ένα διάγραμμα για καθεμία από αυτές τις όψεις των επιλεγμένων συντεταγμένων x και y για πιο εύκολη οπτική σύγκριση. Ξεχωρίζει το 2003 σε αυτό το είδος σύγκρισης;
Τα πλέγματα όψεων λαμβάνουν μία όψη του συνόλου δεδομένων σας (στην περίπτωσή μας, μπορείτε να επιλέξετε το 'έτος' γιανα αποφύγετε την παραγωγή υπερβολικά πολλών όψεων). Το Seaborn μπορεί στη συνέχεια να δημιουργήσει ένα διάγραμμα για κάθε μία από αυτές τις όψεις των επιλεγμένων συντεταγμένων x και y για πιο εύκολη οπτική σύγκριση. Ξεχωρίζει το 2003 σε αυτό το είδος σύγκρισης;
Δημιουργήστε ένα πλέγμα όψεων συνεχίζοντας να χρησιμοποιείτε το `relplot`, όπως συνιστάται από την [τεκμηρίωση του Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Σε αυτή την οπτικοποίηση, μπορείτε να συγκρίνετε την απόδοση ανά αποικία και τον αριθμό των αποικιών χρόνο με τον χρόνο, δίπλα-δίπλα, με το περιτύλιγμα να έχει οριστεί στο 3 για τις στήλες:
Σε αυτή την οπτικοποίηση, μπορείτε να συγκρίνετε την απόδοση ανά αποικία και τον αριθμό των αποικιών χρόνο με τον χρόνο, δίπλα-δίπλα, με το περιτύλιγμα να έχει οριστεί στις 3 στήλες:
Για αυτό το σύνολο δεδομένων, τίποτα ιδιαίτερο δεν ξεχωρίζει όσον αφορά τον αριθμό των αποικιών και την απόδοσή τους, χρόνο με τον χρόνο και πολιτεία με πολιτεία. Υπάρχει διαφορετικός τρόπος να βρείτε μια συσχέτιση μεταξύ αυτών των δύο μεταβλητών;
## Διπλά Διαγράμματα Γραμμών
Δοκιμάστε ένα διάγραμμα πολλαπλών γραμμών, τοποθετώντας δύο διαγράμματα γραμμών το ένα πάνω στο άλλο, χρησιμοποιώντας το `despine` του Seaborn γιανα αφαιρέσετε τις πάνω και δεξιές γραμμές, και χρησιμοποιώντας το `ax.twinx` [που προέρχεται από το Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Το Twinx επιτρέπει σε ένα διάγραμμα να μοιράζεται τον άξονα x και να εμφανίζει δύο άξονες y. Έτσι, εμφανίστε την απόδοση ανά αποικία και τον αριθμό των αποικιών, τοποθετημένα το ένα πάνω στο άλλο:
Δοκιμάστε ένα διάγραμμα πολλαπλών γραμμών, τοποθετώντας δύο διαγράμματα γραμμών το ένα πάνω στο άλλο, χρησιμοποιώντας το 'despine' του Seaborn γιανα αφαιρέσετε τις πάνω και δεξιές γραμμές, και χρησιμοποιώντας το `ax.twinx` [που προέρχεται από το Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Το Twinx επιτρέπει σε ένα διάγραμμα να μοιράζεται τον άξονα x και να εμφανίζει δύο άξονες y. Έτσι, εμφανίστε την απόδοση ανά αποικία και τον αριθμό των αποικιών, τοποθετημένα το ένα πάνω στο άλλο:
Ενώ τίποτα δεν ξεχωρίζει ιδιαίτερα γύρω στο έτος 2003, αυτό μας επιτρέπει να κλείσουμε το μάθημα με μια πιο αισιόδοξη νότα: παρόλο που υπάρχει συνολικά μείωση στον αριθμό των αποικιών, ο αριθμός των αποικιών σταθεροποιείται, ακόμα κι αν η απόδοσή τους ανά αποικία μειώνεται.
Ενώ τίποτα δεν τραβάει την προσοχή γύρω στο έτος 2003, αυτό μας επιτρέπει να κλείσουμε το μάθημα με μια πιο αισιόδοξη νότα: ενώ υπάρχει συνολικά μια μείωση στον αριθμό των αποικιών, ο αριθμός των αποικιών σταθεροποιείται, ακόμα κι αν η απόδοσή τους ανά αποικία μειώνεται.
Πάμε, μέλισσες, πάμε!
🐝❤️
## 🚀 Πρόκληση
Σε αυτό το μάθημα, μάθατε λίγο περισσότερα για άλλες χρήσεις διαγραμμάτων διασποράς και πλεγμάτων γραμμών, συμπεριλαμβανομένων των πλεγμάτων όψεων. Προκαλέστε τον εαυτό σας να δημιουργήσει ένα πλέγμα όψεων χρησιμοποιώντας ένα διαφορετικό σύνολο δεδομένων, ίσως κάποιο που χρησιμοποιήσατε πριν από αυτά τα μαθήματα. Σημειώστε πόσο χρόνο χρειάζονται γιανα δημιουργηθούν και πόσο προσεκτικοί πρέπει να είστε σχετικά με το πόσα πλέγματα χρειάζεται να σχεδιάσετε χρησιμοποιώντας αυτές τις τεχνικές.
Σε αυτό το μάθημα, μάθατε περισσότερα για άλλες χρήσεις διαγραμμάτων διασποράς και πλεγμάτων γραμμών, συμπεριλαμβανομένων των πλεγμάτων όψεων. Προκαλέστε τον εαυτό σας να δημιουργήσει ένα πλέγμα όψεων χρησιμοποιώντας ένα διαφορετικό σύνολο δεδομένων, ίσως κάποιο που χρησιμοποιήσατε σε προηγούμενα μαθήματα. Σημειώστε πόσο χρόνο χρειάζονται γιανα δημιουργηθούν και πόσο προσεκτικοί πρέπει να είστε σχετικά με το πόσα πλέγματα χρειάζεται να σχεδιάσετε χρησιμοποιώντας αυτές τις τεχνικές.
## [Κουίζ μετά το μάθημα](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Ανασκόπηση & Αυτομελέτη
Τα διαγράμματα γραμμών μπορείνα είναι απλά ή αρκετά περίπλοκα. Κάντε λίγη ανάγνωση στην [τεκμηρίωση του Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) σχετικά με τους διάφορους τρόπους που μπορείτε να τα δημιουργήσετε. Προσπαθήστε να βελτιώσετε τα διαγράμματα γραμμών που δημιουργήσατε σε αυτό το μάθημα με άλλες μεθόδους που αναφέρονται στην τεκμηρίωση.
Τα διαγράμματα γραμμών μπορούννα είναι απλά ή αρκετά περίπλοκα. Κάντε λίγη ανάγνωση στην [τεκμηρίωση του Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) σχετικά με τους διάφορους τρόπους που μπορείτε να τα δημιουργήσετε. Προσπαθήστε να βελτιώσετε τα διαγράμματα γραμμών που δημιουργήσατε σε αυτό το μάθημα με άλλες μεθόδους που αναφέρονται στην τεκμηρίωση.
## Εργασία
[Βουτήξτε στην κυψέλη](assignment.md)
---
**Αποποίηση ευθύνης**:
**Αποποίηση Ευθύνης**:
Αυτό το έγγραφο έχει μεταφραστεί χρησιμοποιώντας την υπηρεσία αυτόματης μετάφρασης [Co-op Translator](https://github.com/Azure/co-op-translator). Παρόλο που καταβάλλουμε προσπάθειες για ακρίβεια, παρακαλούμε να έχετε υπόψη ότι οι αυτόματες μεταφράσεις ενδέχεται να περιέχουν σφάλματα ή ανακρίβειες. Το πρωτότυπο έγγραφο στη μητρική του γλώσσα θα πρέπει να θεωρείται η αυθεντική πηγή. Για κρίσιμες πληροφορίες, συνιστάται επαγγελματική ανθρώπινη μετάφραση. Δεν φέρουμε ευθύνη για τυχόν παρεξηγήσεις ή εσφαλμένες ερμηνείες που προκύπτουν από τη χρήση αυτής της μετάφρασης.
Continuing with the nature focus of our research, let's explore fascinating ways to visualize the relationships between different types of honey, based on a dataset from the [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
This dataset, containing around 600 entries, showcases honey production across various U.S. states. For instance, you can examine the number of colonies, yield per colony, total production, stocks, price per pound, and the value of honey produced in a specific state from 1998 to 2012, with one row per year for each state.
This dataset, containing around 600 entries, showcases honey production across various U.S. states. For instance, it includes data on the number of colonies, yield per colony, total production, stocks, price per pound, and the value of honey produced in each state from 1998 to 2012, with one row per year for each state.
It would be intriguing to visualize the relationship between a state's annual production and, for example, the price of honey in that state. Alternatively, you could explore the relationship between honey yield per colony across states. This time period includes the emergence of the devastating 'CCD' or 'Colony Collapse Disorder' first identified in 2006 (http://npic.orst.edu/envir/ccd.html), making this dataset particularly significant to study. 🐝
It would be intriguing to visualize the relationship between a state's annual production and, for example, the price of honey in that state. Alternatively, you could examine the relationship between honey yield per colony across states. This time period also includes the emergence of the devastating 'CCD' or 'Colony Collapse Disorder' first observed in 2006 (http://npic.orst.edu/envir/ccd.html), making this dataset particularly significant to study. 🐝
@ -25,7 +25,7 @@ In this lesson, you'll use Seaborn, a library you've worked with before, to effe
## Scatterplots
Use a scatterplot to show how the price of honey has changed year over year, for each state. Seaborn's `relplot` conveniently organizes state data and displays data points for both categorical and numeric data.
Use a scatterplot to show how the price of honey has changed year over year in each state. Seaborn's `relplot` conveniently organizes state data and displays data points for both categorical and numeric variables.
Let's begin by importing the data and Seaborn:
@ -36,7 +36,7 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
You'll notice that the honey dataset includes several interesting columns, such as year and price per pound. Let's examine this data, grouped by U.S. state:
You'll notice that the honey dataset includes several interesting columns, such as year and price per pound. Let's explore this data, grouped by U.S. state:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Create a basic scatterplot to show the relationship between the price per pound of honey and its U.S. state of origin. Adjust the `y` axis to ensure all states are visible:
Create a basic scatterplot to show the relationship between the price per pound of honey and its state of origin. Adjust the `y` axis to ensure all states are visible:
With this color scheme, you can clearly see a strong upward trend in honey prices over the years. If you examine a specific state, such as Arizona, you can observe a consistent pattern of price increases year over year, with only a few exceptions:
With this color scheme, you can clearly see a strong upward trend in honey prices over the years. If you examine a specific state, such as Arizona, you'll notice a consistent pattern of price increases year over year, with only a few exceptions:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Another way to visualize this trend is by using size instead of color. For colorblind users, this might be a better option. Modify your visualization to represent price increases with larger dot sizes:
Another way to visualize this progression is by using size instead of color. For colorblind users, this might be a better option. Modify your visualization to show price increases through larger dot sizes:
Is this simply a case of supply and demand? Could factors like climate change and colony collapse be reducing the availability of honey year over year, leading to price increases?
Is this simply a case of supply and demand? Could factors like climate change and colony collapse be reducing honey availability year over year, leading to price increases?
To investigate correlations between variables in this dataset, let's explore some line charts.
To explore correlations between variables in this dataset, let's examine some line charts.
## Line charts
@ -106,9 +106,9 @@ Answer: Yes, although there are some exceptions around 2003:
✅ Seaborn aggregates data into one line, displaying "multiple measurements at each x value by plotting the mean and the 95% confidence interval around the mean." [Source](https://seaborn.pydata.org/tutorial/relational.html). You can disable this time-consuming behavior by adding `ci=None`.
✅ Seaborn aggregates data into one line by "plotting the mean and the 95% confidence interval around the mean" for multiple measurements at each x value. [Source](https://seaborn.pydata.org/tutorial/relational.html). You can disable this behavior by adding `ci=None`.
Question: In 2003, was there also a spike in honey supply? What happens if you examine total production year over year?
Question: In 2003, can we also observe a spike in honey supply? What happens if you examine total production year over year?
For this dataset, nothing particularly stands out regarding the number of colonies and their yield year over year or state over state. Is there another way to explore correlations between these variables?
For this dataset, nothing particularly stands out regarding the number of colonies and their yield year over year or state by state. Is there another way to explore correlations between these two variables?
## Dual-line Plots
Try a multiline plot by overlaying two line plots, using Seaborn's 'despine' to remove the top and right spines, and `ax.twinx` [from Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx allows a chart to share the x-axis while displaying two y-axes. Display yield per colony and number of colonies, superimposed:
Try a multiline plot by overlaying two line plots, using Seaborn's 'despine' to remove the top and right spines, and `ax.twinx` [from Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx allows a chart to share the x-axis while displaying two y-axes. Superimpose yield per colony and number of colonies:
While nothing particularly stands out around 2003, this visualization ends the lesson on a slightly positive note: although the number of colonies is declining overall, it appears to be stabilizing, even if their yield per colony is decreasing.
While nothing particularly stands out around 2003, this visualization ends the lesson on a slightly positive note: although the number of colonies is declining overall, it seems to be stabilizing, even if their yield per colony is decreasing.
Go, bees, go!
@ -185,4 +186,4 @@ Line plots can range from simple to complex. Spend some time reading the [Seabor
---
**Disclaimer**:
This document has been translated using the AI translation service [Co-op Translator](https://github.com/Azure/co-op-translator). While we aim for accuracy, please note that automated translations may include errors or inaccuracies. The original document in its native language should be regarded as the authoritative source. For critical information, professional human translation is advised. We are not responsible for any misunderstandings or misinterpretations resulting from the use of this translation.
This document has been translated using the AI translation service [Co-op Translator](https://github.com/Azure/co-op-translator). While we strive for accuracy, please note that automated translations may contain errors or inaccuracies. The original document in its native language should be regarded as the authoritative source. For critical information, professional human translation is recommended. We are not responsible for any misunderstandings or misinterpretations resulting from the use of this translation.
Continuando con el enfoque en la naturaleza de nuestra investigación, descubramos visualizaciones interesantes para mostrar las relaciones entre varios tipos de miel, según un conjunto de datos derivado del [Departamento de Agricultura de los Estados Unidos](https://www.nass.usda.gov/About_NASS/index.php).
Este conjunto de datos, que contiene alrededor de 600 elementos, muestra la producción de miel en muchos estados de EE. UU. Por ejemplo, puedes observar el número de colonias, el rendimiento por colonia, la producción total, las existencias, el precio por libra y el valor de la miel producida en un estado determinado entre 1998 y 2012, con una fila por año para cada estado.
Este conjunto de datos, que incluye alrededor de 600 elementos, muestra la producción de miel en muchos estados de EE. UU. Por ejemplo, puedes observar el número de colonias, el rendimiento por colonia, la producción total, las existencias, el precio por libra y el valor de la miel producida en un estado determinado desde 1998 hasta 2012, con una fila por año para cada estado.
Será interesante visualizar la relación entre la producción anual de un estado y, por ejemplo, el precio de la miel en ese estado. Alternativamente, podrías visualizar la relación entre el rendimiento de miel por colonia en diferentes estados. Este período abarca el devastador 'CCD' o 'Desorden del Colapso de Colonias', observado por primera vez en 2006 (http://npic.orst.edu/envir/ccd.html), por lo que es un conjunto de datos conmovedor para estudiar. 🐝
Será interesante visualizar la relación entre la producción anual de un estado y, por ejemplo, el precio de la miel en ese estado. Alternativamente, podrías visualizar la relación entre el rendimiento de miel por colonia en diferentes estados. Este período abarca el devastador 'CCD' o 'Desorden del Colapso de Colonias', que se observó por primera vez en 2006 (http://npic.orst.edu/envir/ccd.html), por lo que es un conjunto de datos conmovedor para estudiar. 🐝
## [Cuestionario previo a la lección](https://ff-quizzes.netlify.app/en/ds/quiz/22)
En esta lección, puedes usar Seaborn, que ya has utilizado antes, como una excelente biblioteca para visualizar relaciones entre variables. Particularmente interesante es el uso de la función `relplot` de Seaborn, que permite crear gráficos de dispersión y gráficos de líneas para visualizar rápidamente '[relaciones estadísticas](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', lo que permite al científico de datos comprender mejor cómo se relacionan las variables entre sí.
En esta lección, puedes usar Seaborn, que ya has utilizado antes, como una buena biblioteca para visualizar relaciones entre variables. Particularmente interesante es el uso de la función `relplot` de Seaborn, que permite gráficos de dispersión y gráficos de líneas para visualizar rápidamente '[relaciones estadísticas](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', lo que permite al científico de datos comprender mejor cómo se relacionan las variables entre sí.
## Gráficos de dispersión
Usa un gráfico de dispersión para mostrar cómo ha evolucionado el precio de la miel, año tras año, por estado. Seaborn, utilizando `relplot`, agrupa convenientemente los datos por estado y muestra puntos de datos tanto para datos categóricos como numéricos.
Usa un gráfico de dispersión para mostrar cómo ha evolucionado el precio de la miel, año tras año, por estado. Seaborn, utilizando `relplot`, agrupa convenientemente los datos de los estados y muestra puntos de datos tanto para datos categóricos como numéricos.
Comencemos importando los datos y Seaborn:
@ -38,60 +38,60 @@ honey.head()
```
Notarás que los datos de miel tienen varias columnas interesantes, incluyendo el año y el precio por libra. Exploremos estos datos, agrupados por estado de EE. UU.:
| estado | numcol | rendimiento_col | prod_total | existencias | precio_lb | valor_prod | año |
Crea un gráfico de dispersión básico para mostrar la relación entre el precio por libra de miel y su estado de origen en EE. UU. Haz que el eje `y` sea lo suficientemente alto para mostrar todos los estados:
Crea un gráfico de dispersión básico para mostrar la relación entre el precio por libra de miel y su estado de origen en EE. UU. Haz que el eje `y` sea lo suficientemente alto como para mostrar todos los estados:
Ahora, muestra los mismos datos con una paleta de colores de miel para mostrar cómo evoluciona el precio a lo largo de los años. Puedes hacerlo agregando un parámetro 'hue' para mostrar el cambio, año tras año:
Ahora, muestra los mismos datos con un esquema de colores de miel para mostrar cómo el precio evoluciona a lo largo de los años. Puedes hacerlo agregando un parámetro 'hue' para mostrar el cambio, año tras año:
> ✅ Aprende más sobre las [paletas de colores que puedes usar en Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html): ¡prueba una hermosa paleta de colores arcoíris!
> ✅ Aprende más sobre las [paletas de colores que puedes usar en Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - ¡prueba un hermoso esquema de colores arcoíris!
Con este cambio de esquema de colores, puedes ver que hay una clara progresión a lo largo de los años en términos del precio de la miel por libra. De hecho, si observas un conjunto de datos de muestra para verificar (elige un estado, por ejemplo, Arizona), puedes ver un patrón de aumento de precios año tras año, con pocas excepciones:
| estado | numcol | rendimiento_col | prod_total | existencias | precio_lb | valor_prod | año |
Otra forma de visualizar esta progresión es usar el tamaño, en lugar del color. Para usuarios con daltonismo, esta podría ser una mejor opción. Edita tu visualización para mostrar un aumento en el precio mediante un aumento en la circunferencia de los puntos:
Con este cambio de esquema de colores, puedes ver que hay obviamente una fuerte progresión a lo largo de los años en términos de precio de la miel por libra. De hecho, si observas un conjunto de muestra en los datos para verificar (elige un estado, Arizona por ejemplo), puedes ver un patrón de aumento de precios año tras año, con pocas excepciones:
| estado | numcol | rendimiento_por_col | prod_total | existencias | precio_por_lib | valor_prod | año |
Otra forma de visualizar esta progresión es usar el tamaño, en lugar del color. Para usuarios con daltonismo, esta podría ser una mejor opción. Edita tu visualización para mostrar un aumento de precio mediante un aumento en la circunferencia de los puntos:
¿Es este un caso simple de oferta y demanda? Debido a factores como el cambio climático y el colapso de colonias, ¿hay menos miel disponible para la compra año tras año, y por eso el precio aumenta?
¿Es este un caso simple de oferta y demanda? Debido a factores como el cambio climático y el colapso de colonias, ¿hay menos miel disponible para la compra año tras año, y por lo tanto el precio aumenta?
Para descubrir una correlación entre algunas de las variables en este conjunto de datos, exploremos algunos gráficos de líneas.
✅ Debido a que Seaborn está agregando datos en una sola línea, muestra "las múltiples mediciones en cada valor de x trazando la media y el intervalo de confianza del 95% alrededor de la media". [Fuente](https://seaborn.pydata.org/tutorial/relational.html). Este comportamiento que consume tiempo puede desactivarse agregando `ci=None`.
✅ Debido a que Seaborn está agregando datos alrededor de una línea, muestra "las múltiples mediciones en cada valor de x trazando la media y el intervalo de confianza del 95% alrededor de la media". [Fuente](https://seaborn.pydata.org/tutorial/relational.html). Este comportamiento que consume tiempo puede desactivarse agregando `ci=None`.
Pregunta: Bueno, ¿en 2003 también podemos ver un aumento en el suministro de miel? ¿Qué pasa si observas la producción total año tras año?
Pregunta: Bueno, en 2003,¿también podemos ver un aumento en el suministro de miel? ¿Qué pasa si observas la producción total año tras año?
Respuesta: No realmente. Si observas la producción total, parece haber aumentado en ese año en particular, aunque en general la cantidad de miel producida está en declive durante estos años.
@ -124,7 +124,7 @@ Para descubrir esto, puedes explorar una cuadrícula de facetas.
## Cuadrículas de facetas
Las cuadrículas de facetas toman un aspecto de tu conjunto de datos (en nuestro caso, puedes elegir 'año' para evitar producir demasiadas facetas). Seaborn puede luego crear un gráfico para cada una de esas facetas de tus coordenadas x e y elegidas para una comparación visual más sencilla. ¿Destaca el año 2003 en este tipo de comparación?
Las cuadrículas de facetas toman un aspecto de tu conjunto de datos (en nuestro caso, puedes elegir 'año' para evitar producir demasiadas facetas). Seaborn puede entonces hacer un gráfico para cada una de esas facetas de tus coordenadas x e y elegidas para una comparación más fácil. ¿Destaca el año 2003 en este tipo de comparación?
Crea una cuadrícula de facetas continuando con el uso de `relplot` como se recomienda en la [documentación de Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
En esta visualización, puedes comparar el rendimiento por colonia y el número de colonias año tras año, lado a lado, con un ajuste de envoltura de 3 para las columnas:
En esta visualización, puedes comparar el rendimiento por colonia y el número de colonias año tras año, lado a lado con un ajuste de columnas en 3:
Para este conjunto de datos, nada particularmente destaca con respecto al número de colonias y su rendimiento, año tras año y estado por estado. ¿Hay una forma diferente de buscar una correlación entre estas dos variables?
Para este conjunto de datos, nada particularmente destaca con respecto al número de colonias y su rendimiento, año tras año y estado tras estado. ¿Hay una forma diferente de buscar una correlación entre estas dos variables?
## Gráficos de líneas duales
Prueba un gráfico de líneas múltiples superponiendo dos gráficos de líneas uno sobre otro, utilizando `despine` de Seaborn para eliminar las espinas superior y derecha, y usando `ax.twinx` [derivado de Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx permite que un gráfico comparta el eje x y muestre dos ejes y. Así que, muestra el rendimiento por colonia y el número de colonias, superpuestos:
Prueba un gráfico de líneas múltiples superponiendo dos gráficos de líneas uno encima del otro, usando el 'despine' de Seaborn para eliminar las espinas superior y derecha, y usando `ax.twinx` [derivado de Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx permite que un gráfico comparta el eje x y muestre dos ejes y. Entonces, muestra el rendimiento por colonia y el número de colonias, superpuestos:
Aunque nada salta a la vista alrededor del año 2003, esto nos permite terminar esta lección con una nota un poco más feliz: aunque en general hay un número decreciente de colonias, el número de colonias se está estabilizando, incluso si su rendimiento por colonia está disminuyendo.
Aunque nada salta a la vista alrededor del año 2003, esto nos permite terminar esta lección con una nota un poco más feliz: aunque hay un número decreciente de colonias en general, el número de colonias se está estabilizando incluso si su rendimiento por colonia está disminuyendo.
¡Vamos, abejas, vamos!
🐝❤️
## 🚀 Desafío
En esta lección, aprendiste un poco más sobre otros usos de los gráficos de dispersión y las cuadrículas de líneas, incluidas las cuadrículas de facetas. Desafíate a crear una cuadrícula de facetas utilizando un conjunto de datos diferente, tal vez uno que hayas usado antes en estas lecciones. Observa cuánto tiempo tardan en crearse y cómo necesitas ser cuidadoso con la cantidad de cuadrículas que necesitas dibujar utilizando estas técnicas.
En esta lección, aprendiste un poco más sobre otros usos de gráficos de dispersión y cuadrículas de líneas, incluyendo cuadrículas de facetas. Desafíate a crear una cuadrícula de facetas usando un conjunto de datos diferente, tal vez uno que hayas usado antes en estas lecciones. Nota cuánto tiempo tardan en crearse y cómo necesitas ser cuidadoso con la cantidad de cuadrículas que necesitas dibujar usando estas técnicas.
## [Cuestionario posterior a la lección](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Revisión y Autoestudio
Los gráficos de líneas pueden ser simples o bastante complejos. Lee un poco en la [documentación de Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) sobre las diversas formas en que puedes construirlos. Intenta mejorar los gráficos de líneas que construiste en esta lección con otros métodos listados en la documentación.
Los gráficos de líneas pueden ser simples o bastante complejos. Haz un poco de lectura en la [documentación de Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) sobre las diversas formas en que puedes construirlos. Intenta mejorar los gráficos de líneas que construiste en esta lección con otros métodos listados en la documentación.
با ادامه تمرکز بر طبیعت در تحقیقاتمان، بیایید تجسمهای جالبی را کشف کنیم که روابط بین انواع مختلف عسل را نشان میدهند، بر اساس یک مجموعه داده که از [وزارت کشاورزی ایالات متحده](https://www.nass.usda.gov/About_NASS/index.php) استخراج شده است.
این مجموعه داده شامل حدود ۶۰۰ مورد است که تولید عسل در بسیاری از ایالتهای آمریکا را نمایش میدهد. به عنوان مثال، میتوانید تعداد کلنیها، بازدهی هر کلنی، تولید کل، ذخایر، قیمت هر پوند و ارزش عسل تولید شده در یک ایالت خاص را از سال ۱۹۹۸ تا ۲۰۱۲ بررسی کنید، به طوری که هر ردیف نشاندهنده یک سال برای هر ایالت است.
این مجموعه داده شامل حدود ۶۰۰ مورد است که تولید عسل در بسیاری از ایالتهای آمریکا را نمایش میدهد. به عنوان مثال، میتوانید تعداد کلنیها، بازده هر کلنی، تولید کل، ذخایر، قیمت هر پوند و ارزش عسل تولید شده در یک ایالت خاص را از سال ۱۹۹۸ تا ۲۰۱۲ بررسی کنید، به طوری که هر ردیف نشاندهنده یک سال برای هر ایالت است.
جالب خواهد بود که رابطه بین تولید سالانه یک ایالت و مثلاً قیمت عسل در آن ایالت را تجسم کنیم. یا میتوانید رابطه بین بازدهی عسل هر کلنی در ایالتهای مختلف را تجسم کنید. این بازه زمانی شامل دورهای است که اختلال فروپاشی کلنی (CCD) برای اولین بار در سال ۲۰۰۶ مشاهده شد (http://npic.orst.edu/envir/ccd.html)، بنابراین این مجموعه داده برای مطالعه بسیار معنادار است. 🐝
جالب خواهد بود که رابطه بین تولید سالانه یک ایالت و مثلاً قیمت عسل در آن ایالت را تجسم کنیم. یا میتوانید رابطه بین بازده عسل هر کلنی در ایالتهای مختلف را بررسی کنید. این بازه زمانی شامل دورهای است که اختلال فروپاشی کلنی (CCD) برای اولین بار در سال ۲۰۰۶ مشاهده شد (http://npic.orst.edu/envir/ccd.html)، بنابراین این مجموعه داده برای مطالعه بسیار معنادار است. 🐝
## [آزمون پیش از درس](https://ff-quizzes.netlify.app/en/ds/quiz/22)
در این درس، میتوانید از Seaborn که قبلاً از آن استفاده کردهاید، به عنوان یک کتابخانه مناسب برای تجسم روابط بین متغیرها استفاده کنید. به خصوص استفاده از تابع `relplot` در Seaborn جالب است که امکان ایجاد نمودارهای پراکندگی و خطی را برای تجسم سریع '[روابط آماری](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' فراهم میکند و به دانشمند داده کمک میکند تا بهتر بفهمد متغیرها چگونه به یکدیگر مرتبط هستند.
در این درس، میتوانید از Seaborn که قبلاً از آن استفاده کردهاید، به عنوان یک کتابخانه مناسب برای تجسم روابط بین متغیرها استفاده کنید. به خصوص، استفاده از تابع `relplot` در Seaborn جالب است که امکان ایجاد نمودارهای پراکندگی و خطی را برای تجسم سریع '[روابط آماری](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' فراهم میکند و به دانشمند داده کمک میکند تا بهتر بفهمد متغیرها چگونه به یکدیگر مرتبط هستند.
## نمودارهای پراکندگی
از یک نمودار پراکندگی استفاده کنید تا نشان دهید قیمت عسل چگونه سال به سال در هر ایالت تغییر کرده است. Seaborn با استفاده از `relplot` دادههای ایالتها را گروهبندی کرده و نقاط داده را برای دادههای دستهای و عددی نمایش میدهد.
از یک نمودار پراکندگی استفاده کنید تا نشان دهید قیمت عسل چگونه در طول سالها، ایالت به ایالت، تغییر کرده است. Seaborn با استفاده از `relplot` دادههای ایالتها را گروهبندی کرده و نقاط داده را برای دادههای دستهای و عددی نمایش میدهد.
بیایید با وارد کردن دادهها و Seaborn شروع کنیم:
@ -38,49 +38,49 @@ honey.head()
```
متوجه میشوید که دادههای عسل شامل چندین ستون جالب است، از جمله سال و قیمت هر پوند. بیایید این دادهها را که بر اساس ایالتهای آمریکا گروهبندی شدهاند، بررسی کنیم:
| ایالت | تعداد کلنی | بازدهی هر کلنی | تولید کل | ذخایر | قیمت هر پوند | ارزش تولید | سال |
یک نمودار پراکندگی ساده ایجاد کنید تا رابطه بین قیمت هر پوند عسل و ایالت مبدأ آن را نشان دهید. محور `y` را به اندازه کافی بلند کنید تا تمام ایالتها نمایش داده شوند:
حالا، همان دادهها را با یک طرح رنگی مرتبط با عسل نمایش دهید تا نشان دهید قیمت چگونه در طول سالها تغییر کرده است. میتوانید این کار را با افزودن پارامتر 'hue' برای نمایش تغییرات سال به سال انجام دهید:
> ✅ درباره [طرحهای رنگی که میتوانید در Seaborn استفاده کنید](https://seaborn.pydata.org/tutorial/color_palettes.html) بیشتر بیاموزید - یک طرح رنگی رنگینکمانی زیبا را امتحان کنید!
> ✅ درباره [طرحهای رنگی موجود در Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) بیشتر بیاموزید - یک طرح رنگی رنگینکمانی زیبا را امتحان کنید!
با این تغییر طرح رنگ، میتوانید ببینید که به وضوح یک پیشرفت قوی در طول سالها از نظر قیمت عسل به ازای هر پوند وجود دارد. در واقع، اگر یک مجموعه نمونه از دادهها را برای تأیید بررسی کنید (مثلاً ایالت آریزونا)، میتوانید الگویی از افزایش قیمت سال به سال با چند استثنا مشاهده کنید:
| ایالت | تعداد کلنی | بازدهی هر کلنی | تولید کل | ذخایر | قیمت هر پوند | ارزش تولید | سال |
با این تغییر طرح رنگ، میتوانید ببینید که به وضوح یک پیشرفت قوی در طول سالها از نظر قیمت هر پوند عسل وجود دارد. در واقع، اگر یک مجموعه نمونه از دادهها را بررسی کنید (مثلاً ایالت آریزونا)، میتوانید الگویی از افزایش قیمت سال به سال را با چند استثنا مشاهده کنید:
| ایالت | تعداد کلنیها | بازده هر کلنی | تولید کل | ذخایر | قیمت هر پوند | ارزش تولید | سال |
راه دیگری برای تجسم این پیشرفت استفاده از اندازه به جای رنگ است. برای کاربران کوررنگ، این ممکن است گزینه بهتری باشد. تجسم خود را ویرایش کنید تا افزایش قیمت را با افزایش اندازه نقاط نشان دهید:
آیا این یک مورد ساده از عرضه و تقاضا است؟ آیا به دلیل عواملی مانند تغییرات اقلیمی و فروپاشی کلنی، عسل کمتری برای خرید در دسترس است و بنابراین قیمت افزایش مییابد؟
✅ از آنجا که Seaborn دادهها را حول یک خط تجمیع میکند، "اندازهگیریهای متعدد در هر مقدار x را با رسم میانگین و فاصله اطمینان ۹۵٪ در اطراف میانگین نمایش میدهد". [منبع](https://seaborn.pydata.org/tutorial/relational.html). این رفتار زمانبر را میتوان با افزودن `ci=None` غیرفعال کرد.
✅ از آنجا که Seaborn دادهها را در یک خط تجمیع میکند، "اندازهگیریهای متعدد در هر مقدار x را با رسم میانگین و فاصله اطمینان ۹۵٪ در اطراف میانگین نمایش میدهد". [منبع](https://seaborn.pydata.org/tutorial/relational.html). این رفتار زمانبر را میتوان با افزودن `ci=None` غیرفعال کرد.
سؤال: خب، آیا در سال ۲۰۰۳ میتوانیم افزایش در عرضه عسل را نیز مشاهده کنیم؟ اگر تولید کل را سال به سال بررسی کنید چه؟
پاسخ: نه واقعاً. اگر به تولید کل نگاه کنید، به نظر میرسد که در آن سال خاص افزایش یافته است، حتی اگر به طور کلی مقدار عسل تولید شده در این سالها در حال کاهش باشد.
سؤال: در این صورت، چه چیزی میتوانست باعث افزایش قیمت عسل در حدود سال ۲۰۰۳ شود؟
سؤال: در این صورت، چه چیزی میتوانسته باعث افزایش قیمت عسل در حدود سال ۲۰۰۳ شود؟
برای کشف این موضوع، میتوانید یک شبکه فاست را بررسی کنید.
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
در این تجسم، میتوانید بازدهی هر کلنی و تعداد کلنیها را سال به سال، کنار هم با تنظیم wrap روی ۳ برای ستونها مقایسه کنید:
در این تجسم، میتوانید بازده هر کلنی و تعداد کلنیها را سال به سال، کنار هم با تنظیم wrap در ۳ برای ستونها مقایسه کنید:
برای این مجموعه داده، هیچ چیز خاصی در مورد تعداد کلنیها و بازدهی آنها، سال به سال و ایالت به ایالت برجسته نیست. آیا راه دیگری برای یافتن همبستگی بین این دو متغیر وجود دارد؟
برای این مجموعه داده، هیچ چیز خاصی در مورد تعداد کلنیها و بازده آنها، سال به سال و ایالت به ایالت برجسته نیست. آیا راه دیگری برای یافتن همبستگی بین این دو متغیر وجود دارد؟
## نمودارهای دوخطی
یک نمودار چندخطی را با قرار دادن دو نمودار خطی روی یکدیگر امتحان کنید، با استفاده از 'despine' در Seaborn برای حذف ستونها و خطوط بالایی و سمت راست، و استفاده از `ax.twinx` [مشتق شده از Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx به یک نمودار اجازه میدهد تا محور x را به اشتراک بگذارد و دو محور y را نمایش دهد. بنابراین، بازدهی هر کلنی و تعداد کلنیها را روی هم نمایش دهید:
یک نمودار چندخطی را امتحان کنید که دو نمودار خطی را روی یکدیگر قرار میدهد، با استفاده از 'despine' در Seaborn برای حذف ستونها و خطوط بالایی و سمت راست، و استفاده از `ax.twinx` [مشتق شده از Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx به یک نمودار اجازه میدهد محور x را به اشتراک بگذارد و دو محور y را نمایش دهد. بنابراین، بازده هر کلنی و تعداد کلنیها را روی هم نمایش دهید:
در حالی که چیزی در حدود سال ۲۰۰۳ به چشم نمیآید، این نمودار به ما اجازه میدهد درس را با یک نکته خوشحالکنندهتر به پایان برسانیم: در حالی که تعداد کلنیها به طور کلی در حال کاهش است، تعداد کلنیها در حال تثبیت است، حتی اگر بازدهی هر کلنی کاهش یابد.
در حالی که چیزی در حدود سال ۲۰۰۳ به چشم نمیآید، این نمودار به ما اجازه میدهد این درس را با یک نکته خوشحالکنندهتر به پایان برسانیم: در حالی که تعداد کلنیها به طور کلی در حال کاهش است، تعداد کلنیها در حال تثبیت است حتی اگر بازده هر کلنی کاهش یابد.
زنده باد زنبورها! 🐝❤️
زنبورها، موفق باشید! 🐝❤️
## 🚀 چالش
در این درس، کمی بیشتر درباره استفادههای دیگر نمودارهای پراکندگی و شبکههای خطی، از جمله شبکههای فاست یاد گرفتید. خودتان را به چالش بکشید تا یک شبکه فاست با استفاده از یک مجموعه داده دیگر، شاید یکی از مجموعه دادههایی که قبلاً در این درسها استفاده کردهاید، ایجاد کنید. توجه کنید که ایجاد آنها چقدر طول میکشد و چگونه باید مراقب باشید که چند شبکه باید با استفاده از این تکنیکها رسم کنید.
در این درس، کمی بیشتر درباره استفادههای دیگر نمودارهای پراکندگی و شبکههای خطی، از جمله شبکههای فاست، یاد گرفتید. خودتان را به چالش بکشید تا یک شبکه فاست با استفاده از یک مجموعه داده دیگر ایجاد کنید، شاید یکی از مجموعه دادههایی که قبل از این درسها استفاده کردهاید. توجه کنید که ایجاد آنها چقدر زمان میبرد و چگونه باید مراقب باشید که چند شبکه باید با استفاده از این تکنیکها رسم کنید.
## [آزمون پس از درس](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## مرور و مطالعه شخصی
نمودارهای خطی میتوانند ساده یا بسیار پیچیده باشند. کمی در [مستندات Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) درباره روشهای مختلفی که میتوانید آنها را بسازید مطالعه کنید. سعی کنید نمودارهای خطی که در این درس ساختهاید را با روشهای دیگر ذکر شده در مستندات بهبود دهید.
نمودارهای خطی میتوانند ساده یا بسیار پیچیده باشند. کمی در [مستندات Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) درباره روشهای مختلفی که میتوانید آنها را بسازید مطالعه کنید. سعی کنید نمودارهای خطی که در این درس ساختهاید را با روشهای دیگر ذکر شده در مستندات بهبود ببخشید.
|Suhteiden visualisointi - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
Jatkaen tutkimuksemme luontoteemaa, tutustutaan mielenkiintoisiin visualisointeihin, jotka esittävät eri hunajatyyppeihin liittyviä suhteita Yhdysvaltain maatalousministeriön ([United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php)) tuottaman datasetin pohjalta.
Jatkaen tutkimuksemme luontoteemaa, tutustutaan mielenkiintoisiin visualisointeihin, jotka esittävät eri hunajatyyppeihin liittyviä suhteita Yhdysvaltain maatalousministeriön (USDA) [datasta](https://www.nass.usda.gov/About_NASS/index.php) johdettujen tietojen perusteella.
Tämä noin 600 kohteen datasetti näyttää hunajantuotannon monissa Yhdysvaltain osavaltioissa. Esimerkiksi voit tarkastella mehiläispesien määrää, tuottoa per pesä, kokonaistuotantoa, varastoja, hintaa per pauna ja hunajan tuotannon arvoa tietyssä osavaltiossa vuosina 1998–2012, yksi rivi per vuosi jokaiselle osavaltiolle.
Tämä noin 600 kohteen datasetti näyttää hunajantuotannon monissa Yhdysvaltain osavaltioissa. Esimerkiksi voit tarkastella mehiläispesien määrää, tuottoa per pesä, kokonaismäärää, varastoja, hintaa per pauna ja hunajan tuotannon arvoa tietyssä osavaltiossa vuosina 1998–2012, yksi rivi per vuosi jokaiselle osavaltiolle.
Olisi mielenkiintoista visualisoida suhde tietyn osavaltion vuosittaisen tuotannon ja esimerkiksi hunajan hinnan välillä kyseisessä osavaltiossa. Vaihtoehtoisesti voisit visualisoida osavaltioiden hunajan tuoton per pesä. Tämä aikaväli kattaa tuhoisan 'CCD:n' eli 'Colony Collapse Disorderin', joka havaittiin ensimmäisen kerran vuonna 2006 (http://npic.orst.edu/envir/ccd.html), joten datasetti on merkityksellinen tutkittavaksi. 🐝
Olisi mielenkiintoista visualisoida suhde tietyn osavaltion vuosittaisen tuotannon ja esimerkiksi hunajan hinnan välillä kyseisessä osavaltiossa. Vaihtoehtoisesti voisit visualisoida osavaltioiden hunajantuoton per pesä. Tämä ajanjakso kattaa tuhoisan 'CCD:n' eli 'Colony Collapse Disorderin', joka havaittiin ensimmäisen kerran vuonna 2006 (http://npic.orst.edu/envir/ccd.html), joten datasetti on merkityksellinen tutkittavaksi. 🐝
@ -25,7 +25,7 @@ Tässä oppitunnissa voit käyttää Seaborn-kirjastoa, jota olet käyttänyt ai
## Hajontakaaviot
Käytä hajontakaaviota näyttääksesi, miten hunajan hinta on kehittynyt vuosittain osavaltioittain. Seabornin `relplot` ryhmittelee kätevästi osavaltioiden dataa ja näyttää datapisteet sekä kategoriselle että numeeriselle datalle.
Käytä hajontakaaviota näyttääksesi, miten hunajan hinta on kehittynyt vuosittain osavaltioittain. Seabornin `relplot` ryhmittelee kätevästi osavaltiokohtaiset tiedot ja näyttää datapisteet sekä kategoriselle että numeeriselle datalle.
Aloitetaan datan ja Seabornin tuonnilla:
@ -51,18 +51,18 @@ Luo perushajontakaavio, joka näyttää hunajan hinnan ja sen alkuperäosavaltio
Näytä nyt sama data hunajan värimaailmalla, joka havainnollistaa hinnan kehitystä vuosien varrella. Voit tehdä tämän lisäämällä 'hue'-parametrin, joka näyttää muutoksen vuosi vuodelta:
Näytä nyt sama data hunajavärisävyillä, jotka kuvaavat hinnan kehitystä vuosien varrella. Voit tehdä tämän lisäämällä 'hue'-parametrin, joka näyttää muutoksen vuosi vuodelta:
> ✅ Lue lisää [Seabornin väripaleteista](https://seaborn.pydata.org/tutorial/color_palettes.html) - kokeile kaunista sateenkaarivärimaailmaa!
> ✅ Lue lisää [Seabornin väripaleteista](https://seaborn.pydata.org/tutorial/color_palettes.html) - kokeile kaunista sateenkaariväripalettia!
Tämän värimaailman muutoksen avulla näet selvästi vahvan kehityksen hunajan hinnassa vuosien varrella. Jos tarkastelet datasetin näytejoukkoa (valitse esimerkiksi Arizona), voit nähdä hinnan nousun vuosi vuodelta, muutamia poikkeuksia lukuun ottamatta:
Tämän värisävyjen muutoksen avulla näet selvästi vahvan kehityksen hunajan hinnassa vuosien varrella. Jos tarkastelet datan otosta varmistaaksesi (valitse esimerkiksi Arizona), näet hintojen nousun vuosi vuodelta, muutamia poikkeuksia lukuun ottamatta:
Toinen tapa visualisoida tätä kehitystä on käyttää kokoa värin sijaan. Värisokeille käyttäjille tämä voi olla parempi vaihtoehto. Muokkaa visualisointiasi näyttämään hinnan nousu pisteen ympärysmitan kasvulla:
Toinen tapa visualisoida tätä kehitystä on käyttää kokoa värin sijaan. Värisokeille käyttäjille tämä voi olla parempi vaihtoehto. Muokkaa visualisointiasi näyttämään hinnan nousu pisteen koon kasvuna:
Onko tämä yksinkertainen tapaus kysynnästä ja tarjonnasta? Ilmastonmuutoksen ja pesien romahtamisen kaltaisten tekijöiden vuoksi, onko hunajaa vähemmän saatavilla vuosi vuodelta, ja siksi hinta nousee?
Onko tämä yksinkertainen tapaus kysynnän ja tarjonnan laista? Ilmastonmuutoksen ja pesäkatojen kaltaisten tekijöiden vuoksi, onko hunajaa vähemmän saatavilla vuosi vuodelta, ja siksi hinta nousee?
Tutkiaksesi korrelaatiota joidenkin datasetin muuttujien välillä, tarkastellaan viivakaavioita.
Tutkiaksemme korrelaatiota joidenkin datasetin muuttujien välillä, tarkastellaan viivakaavioita.
✅ Koska Seaborn yhdistää dataa yhteen viivaan, se näyttää "useat mittaukset kussakin x-arvossa piirtämällä keskiarvon ja 95 %:n luottamusvälin keskiarvon ympärille". [Lähde](https://seaborn.pydata.org/tutorial/relational.html). Tämä aikaa vievä toiminto voidaan poistaa lisäämällä `ci=None`.
✅ Koska Seaborn yhdistää datan yhdeksi viivaksi, se näyttää "useat mittaukset kussakin x-arvossa piirtämällä keskiarvon ja 95 %:n luottamusvälin keskiarvon ympärille". [Lähde](https://seaborn.pydata.org/tutorial/relational.html). Tämä aikaa vievä toiminto voidaan poistaa lisäämällä `ci=None`.
Kysymys: No, vuonna 2003, näkyykö myös hunajan tarjonnassa piikki? Entä jos tarkastelet kokonaistuotantoa vuosi vuodelta?
Kysymys: No, vuonna 2003, näkyykö myös piikki hunajan tarjonnassa? Entä jos tarkastelet kokonaistuotantoa vuosi vuodelta?
Vastaus: Ei oikeastaan. Jos tarkastelet kokonaistuotantoa, se näyttää itse asiassa kasvaneen kyseisenä vuonna, vaikka yleisesti ottaen hunajan tuotantomäärä on laskussa näinä vuosina.
Kysymys: Siinä tapauksessa, mikä olisi voinut aiheuttaa hunajan hinnan piikin vuoden 2003 tienoilla?
Kysymys: Siinä tapauksessa, mikä olisi voinut aiheuttaa piikin hunajan hinnassa vuoden 2003 tienoilla?
Tämän selvittämiseksi voit tutkia facet grid -visualisointia.
@ -126,7 +126,7 @@ Tämän selvittämiseksi voit tutkia facet grid -visualisointia.
Facet gridit ottavat yhden datasetin osan (tässä tapauksessa voit valita 'vuoden', jotta vältetään liian monien facetien tuottaminen). Seaborn voi sitten tehdä kaavion jokaiselle facetille valituilla x- ja y-koordinaateilla helpottaakseen visuaalista vertailua. Erottuuko vuosi 2003 tässä vertailussa?
Luo facet grid jatkamalla `relplot`-toiminnon käyttöä, kuten [Seabornin dokumentaatio](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) suosittelee.
Luo facet grid jatkamalla `relplot`-toiminnon käyttöä, kuten [Seabornin dokumentaatiossa](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) suositellaan.
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Tässä visualisoinnissa voit verrata tuottoa per pesä ja pesien määrää vuosi vuodelta rinnakkain, sarakkeiden wrap-asetuksella 3:
Tässä visualisoinnissa voit verrata pesien tuottoa ja pesämäärää vuosi vuodelta rinnakkain, sarakkeiden wrap-asetuksella 3:
Tämän datasetin kohdalla mikään ei erityisesti erotu pesien määrän ja niiden tuoton osalta vuosi vuodelta ja osavaltioittain. Onko olemassa toinen tapa tarkastella korrelaatiota näiden kahden muuttujan välillä?
Tämän datasetin osalta mikään ei erityisesti erotu pesien määrän ja niiden tuoton osalta vuosi vuodelta ja osavaltioittain. Onko olemassa toinen tapa tarkastella korrelaatiota näiden kahden muuttujan välillä?
## Kaksiviivakaaviot
Kokeile moniviivakaaviota päällekkäin asetetuilla viivakaavioilla, käyttäen Seabornin 'despine'-toimintoa poistaaksesi kaavioiden ylä- ja oikeat reunat, ja käyttäen`ax.twinx`-toimintoa [Matplotlibista](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx mahdollistaa kaavion jakamaan x-akselin ja näyttämään kaksi y-akselia. Näytä tuotto per pesä ja pesien määrä päällekkäin:
Kokeile moniviivakaaviota päällekkäin asetetuilla viivakaavioilla, käyttäen Seabornin 'despine'-toimintoa poistamaan kaavioiden ylä- ja oikeat reunat, sekä`ax.twinx`-toimintoa [Matplotlibista](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx mahdollistaa kaavion jakamaan x-akselin ja näyttämään kaksi y-akselia. Näytä pesien tuotto ja pesämäärä päällekkäin:
Vaikka mikään ei erityisesti erotu vuoden 2003 kohdalla, tämä antaa meille mahdollisuuden päättää oppitunti hieman iloisemmalla nuotilla: vaikka pesien määrä on yleisesti laskussa, pesien määrä näyttää vakiintuvan, vaikka niiden tuotto per pesä on laskussa.
Vaikka mikään ei erityisesti erotu vuoden 2003 tienoilla, tämä antaa meille mahdollisuuden päättää oppitunti hieman iloisemmalla nuotilla: vaikka pesien määrä on yleisesti laskussa, pesien määrä näyttää vakiintuvan, vaikka niiden tuotto per pesä on laskussa.
Hyvä mehiläiset, jatkakaa! 🐝❤️
Go, mehiläiset, go!
🐝❤️
## 🚀 Haaste
Tässä oppitunnissa opit lisää hajontakaavioiden ja facet gridien käytöstä. Haasta itsesi luomaan facet grid käyttäen eri datasettiä, ehkä sellaista, jota käytit aiemmissa oppitunneissa. Huomaa, kuinka kauan niiden luominen kestää ja kuinka tarkkana täytyy olla facetien määrän kanssa näitä tekniikoita käyttäessä.
Tässä oppitunnissa opit lisää hajontakaavioiden ja facet gridien käytöstä. Haasta itsesi luomaan facet grid käyttäen eri datasettiä, ehkä sellaista, jota käytit aiemmissa oppitunneissa. Huomaa, kuinka kauan niiden luominen kestää ja kuinka tarkasti sinun täytyy harkita, kuinka monta gridia haluat piirtää näillä tekniikoilla.
Viivakaaviot voivat olla yksinkertaisia tai melko monimutkaisia. Lue lisää [Seabornin dokumentaatiosta](https://seaborn.pydata.org/generated/seaborn.lineplot.html) eri tavoista rakentaa niitä. Yritä parantaa oppitunnissa luomiasi viivakaavioita dokumentaatiossa mainituilla menetelmillä.
Viivakaaviot voivat olla yksinkertaisia tai melko monimutkaisia. Lue lisää [Seabornin dokumentaatiosta](https://seaborn.pydata.org/generated/seaborn.lineplot.html) eri tavoista rakentaa niitä. Yritä parantaa oppitunnissa luomiasi viivakaavioita dokumentaatiossa mainituilla muilla menetelmillä.
## Tehtävä
[Sukella mehiläispesään](assignment.md)
@ -184,4 +185,4 @@ Viivakaaviot voivat olla yksinkertaisia tai melko monimutkaisia. Lue lisää [Se
---
**Vastuuvapauslauseke**:
Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua [Co-op Translator](https://github.com/Azure/co-op-translator). Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäistä asiakirjaa sen alkuperäisellä kielellä tulee pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskääntämistä. Emme ole vastuussa väärinkäsityksistä tai virhetulkinnoista, jotka johtuvat tämän käännöksen käytöstä.
Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua [Co-op Translator](https://github.com/Azure/co-op-translator). Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäinen asiakirja sen alkuperäisellä kielellä tulisi pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskäännöstä. Emme ole vastuussa väärinkäsityksistä tai virhetulkinnoista, jotka johtuvat tämän käännöksen käytöstä.
@ -17,15 +17,15 @@ En poursuivant notre recherche axée sur la nature, découvrons des visualisatio
Cet ensemble de données, composé d'environ 600 éléments, montre la production de miel dans de nombreux États américains. Par exemple, vous pouvez examiner le nombre de colonies, le rendement par colonie, la production totale, les stocks, le prix par livre et la valeur du miel produit dans un État donné de 1998 à 2012, avec une ligne par année pour chaque État.
Il serait intéressant de visualiser la relation entre la production annuelle d'un État donné et, par exemple, le prix du miel dans cet État. Alternativement, vous pourriez visualiser la relation entre le rendement par colonie dans différents États. Cette période couvre l'apparition dévastatrice du 'CCD' ou 'Colony Collapse Disorder' observée pour la première fois en 2006 (http://npic.orst.edu/envir/ccd.html), ce qui en fait un ensemble de données poignant à étudier. 🐝
Il serait intéressant de visualiser la relation entre la production annuelle d'un État donné et, par exemple, le prix du miel dans cet État. Alternativement, vous pourriez visualiser la relation entre le rendement par colonie des différents États. Cette période couvre le dévastateur "CCD" ou "Colony Collapse Disorder" observé pour la première fois en 2006 (http://npic.orst.edu/envir/ccd.html), ce qui en fait un ensemble de données poignant à étudier. 🐝
## [Quiz avant le cours](https://ff-quizzes.netlify.app/en/ds/quiz/22)
Dans cette leçon, vous pouvez utiliser Seaborn, que vous avez déjà utilisé, comme une excellente bibliothèque pour visualiser les relations entre les variables. Particulièrement intéressant est l'utilisation de la fonction `relplot` de Seaborn qui permet de créer des diagrammes de dispersion et des graphiques linéaires pour visualiser rapidement les '[relations statistiques](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', permettant au data scientist de mieux comprendre comment les variables interagissent entre elles.
Dans cette leçon, vous pouvez utiliser Seaborn, que vous avez déjà utilisé, comme une excellente bibliothèque pour visualiser les relations entre les variables. Particulièrement intéressant est l'utilisation de la fonction `relplot` de Seaborn qui permet de créer des diagrammes de dispersion et des graphiques linéaires pour visualiser rapidement les '[relations statistiques](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', ce qui permet au data scientist de mieux comprendre comment les variables interagissent entre elles.
## Diagrammes de dispersion
Utilisez un diagramme de dispersion pour montrer comment le prix du miel a évolué, année après année, par État. Seaborn, grâce à `relplot`, regroupe commodément les données des États et affiche des points de données pour les données catégoriques et numériques.
Utilisez un diagramme de dispersion pour montrer comment le prix du miel a évolué, année après année, par État. Seaborn, grâce à `relplot`, regroupe commodément les données des États et affiche des points de données pour les données catégorielles et numériques.
Commençons par importer les données et Seaborn :
@ -46,23 +46,23 @@ Vous remarquez que les données sur le miel contiennent plusieurs colonnes inté
Créez un diagramme de dispersion basique pour montrer la relation entre le prix par livre du miel et son État d'origine aux États-Unis. Faites en sorte que l'axe `y` soit suffisamment grand pour afficher tous les États :
Créez un diagramme de dispersion basique pour montrer la relation entre le prix par livre de miel et son État d'origine aux États-Unis. Faites en sorte que l'axe `y` soit suffisamment grand pour afficher tous les États :
Maintenant, affichez les mêmes données avec un schéma de couleurs inspiré du miel pour montrer comment le prix évolue au fil des années. Vous pouvez le faire en ajoutant un paramètre 'hue' pour montrer le changement, année après année :
Maintenant, affichez les mêmes données avec un schéma de couleurs miel pour montrer comment le prix évolue au fil des années. Vous pouvez le faire en ajoutant un paramètre 'hue' pour montrer le changement, année après année :
> ✅ En savoir plus sur les [palettes de couleurs que vous pouvez utiliser dans Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - essayez un magnifique schéma de couleurs arc-en-ciel !
Avec ce changement de schéma de couleurs, vous pouvez voir qu'il y a évidemment une forte progression au fil des années en termes de prix du miel par livre. En effet, si vous examinez un échantillon de données pour vérifier (choisissez un État donné, l'Arizona par exemple), vous pouvez voir une tendance à l'augmentation des prix année après année, avec quelques exceptions :
Avec ce changement de schéma de couleurs, vous pouvez voir qu'il y a évidemment une forte progression au fil des années en termes de prix du miel par livre. En effet, si vous examinez un échantillon de données pour vérifier (choisissez un État donné, l'Arizona par exemple), vous pouvez voir un schéma d'augmentation des prix année après année, avec quelques exceptions :
Est-ce simplement une question d'offre et de demande ? En raison de facteurs tels que le changement climatique et l'effondrement des colonies, y a-t-il moins de miel disponible à l'achat année après année, ce qui entraîne une augmentation des prix ?
Est-ce un simple cas d'offre et de demande ? En raison de facteurs tels que le changement climatique et l'effondrement des colonies, y a-t-il moins de miel disponible à l'achat année après année, ce qui entraîne une augmentation des prix ?
Pour découvrir une corrélation entre certaines des variables de cet ensemble de données, explorons quelques graphiques linéaires.
✅ Parce que Seaborn agrège les données autour d'une seule ligne, il affiche "les multiples mesures à chaque valeur x en traçant la moyenne et l'intervalle de confiance à 95 % autour de la moyenne". [Source](https://seaborn.pydata.org/tutorial/relational.html). Ce comportement chronophage peut être désactivé en ajoutant `ci=None`.
@ -114,9 +114,9 @@ Question : Eh bien, en 2003, pouvons-nous également voir un pic dans l'approvis
Réponse : Pas vraiment. Si vous examinez la production totale, elle semble en fait avoir augmenté cette année-là, même si, de manière générale, la quantité de miel produite est en déclin au cours de ces années.
Réponse : Pas vraiment. Si vous examinez la production totale, il semble qu'elle ait en fait augmenté cette année-là, même si, de manière générale, la quantité de miel produite est en déclin au cours de ces années.
Question : Dans ce cas, qu'est-ce qui aurait pu provoquer ce pic du prix du miel autour de 2003 ?
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Dans cette visualisation, vous pouvez comparer le rendement par colonie et le nombre de colonies année après année, côte à côte avec un wrap défini à 3 pour les colonnes :
Pour cet ensemble de données, rien ne semble particulièrement se démarquer en ce qui concerne le nombre de colonies et leur rendement, année après année et État par État. Existe-t-il une autre façon de rechercher une corrélation entre ces deux variables ?
Pour cet ensemble de données, rien ne se démarque particulièrement en ce qui concerne le nombre de colonies et leur rendement, année après année et État par État. Existe-t-il une autre façon de rechercher une corrélation entre ces deux variables ?
## Graphiques à double ligne
Essayez un graphique à lignes multiples en superposant deux graphiques linéaires l'un sur l'autre, en utilisant la fonction 'despine' de Seaborn pour supprimer leurs épines supérieure et droite, et en utilisant `ax.twinx` [dérivé de Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx permet à un graphique de partager l'axe x et d'afficher deux axes y. Ainsi, affichez le rendement par colonie et le nombre de colonies, superposés :
Essayez un graphique à lignes multiples en superposant deux graphiques linéaires l'un sur l'autre, en utilisant la fonction 'despine' de Seaborn pour supprimer leurs épines supérieure et droite, et en utilisant `ax.twinx` [dérivé de Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx permet à un graphique de partager l'axe x et d'afficher deux axes y. Affichez donc le rendement par colonie et le nombre de colonies, superposés :
Bien que rien ne saute aux yeux autour de l'année 2003, cela nous permet de terminer cette leçon sur une note un peu plus positive : bien qu'il y ait globalement une diminution du nombre de colonies, le nombre de colonies se stabilise même si leur rendement par colonie diminue.
Bien que rien ne saute aux yeux autour de l'année 2003, cela nous permet de terminer cette leçon sur une note un peu plus joyeuse : bien qu'il y ait globalement un déclin du nombre de colonies, le nombre de colonies se stabilise même si leur rendement par colonie diminue.
Allez, les abeilles, allez !
@ -174,7 +175,7 @@ Dans cette leçon, vous avez appris un peu plus sur d'autres utilisations des di
## [Quiz après le cours](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Révision et auto-apprentissage
## Révision & Auto-apprentissage
Les graphiques linéaires peuvent être simples ou assez complexes. Faites un peu de lecture dans la [documentation de Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) sur les différentes façons de les construire. Essayez d'améliorer les graphiques linéaires que vous avez créés dans cette leçon avec d'autres méthodes listées dans la documentation.
@ -185,4 +186,4 @@ Les graphiques linéaires peuvent être simples ou assez complexes. Faites un pe
---
**Avertissement** :
Ce document a été traduit à l'aide du service de traduction automatique [Co-op Translator](https://github.com/Azure/co-op-translator). Bien que nous nous efforcions d'assurer l'exactitude, veuillez noter que les traductions automatisées peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d'origine doit être considéré comme la source faisant autorité. Pour des informations critiques, il est recommandé de faire appel à une traduction humaine professionnelle. Nous déclinons toute responsabilité en cas de malentendus ou d'interprétations erronées résultant de l'utilisation de cette traduction.
Ce document a été traduit à l'aide du service de traduction automatique [Co-op Translator](https://github.com/Azure/co-op-translator). Bien que nous nous efforcions d'assurer l'exactitude, veuillez noter que les traductions automatisées peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d'origine doit être considéré comme la source faisant autorité. Pour des informations critiques, il est recommandé de recourir à une traduction professionnelle réalisée par un humain. Nous déclinons toute responsabilité en cas de malentendus ou d'interprétations erronées résultant de l'utilisation de cette traduction.
|ויזואליזציה של קשרים - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_|
בהמשך להתמקדות שלנו בטבע, בואו נגלה ויזואליזציות מעניינות שמציגות את הקשרים בין סוגי דבש שונים, בהתבסס על מאגר נתונים שמקורו ב-[משרד החקלאות של ארצות הברית](https://www.nass.usda.gov/About_NASS/index.php).
בהמשך למיקוד שלנו בטבע, בואו נגלה ויזואליזציות מעניינות שמציגות את הקשרים בין סוגי דבש שונים, בהתבסס על מאגר נתונים שמקורו ב-[משרד החקלאות של ארצות הברית](https://www.nass.usda.gov/About_NASS/index.php).
מאגר הנתונים הזה, שמכיל כ-600 פריטים, מציג את ייצור הדבש במדינות שונות בארה"ב. לדוגמה, ניתן לבחון את מספר הכוורות, התפוקה לכל כוורת, הייצור הכולל, המלאי, המחיר לקילוגרם, והערך של הדבש שיוצר במדינה מסוימת בין השנים 1998-2012, כאשר כל שורה מייצגת שנה אחת לכל מדינה.
יהיה מעניין להמחיש את הקשר בין ייצור הדבש במדינה מסוימת בשנה מסוימת לבין, לדוגמה, המחיר של הדבש באותה מדינה. לחלופין, ניתן להמחיש את הקשר בין תפוקת הדבש לכל כוורת במדינות השונות. טווח השנים הזה כולל את התקופה שבה התגלה לראשונה "הפרעת קריסת המושבה" (CCD) בשנת 2006 (http://npic.orst.edu/envir/ccd.html), ולכן מדובר במאגר נתונים מרתק ללימוד. 🐝
יהיה מעניין להמחיש את הקשר בין ייצור שנתי במדינה מסוימת לבין, לדוגמה, המחיר של הדבש באותה מדינה. לחלופין, ניתן להמחיש את הקשר בין תפוקת הדבש לכל כוורת במדינות השונות. טווח השנים הזה כולל את התקופה שבה התגלה לראשונה "הפרעת קריסת המושבה" (CCD) בשנת 2006 (http://npic.orst.edu/envir/ccd.html), ולכן מדובר במאגר נתונים מרתק ללימוד. 🐝
## [שאלון לפני השיעור](https://ff-quizzes.netlify.app/en/ds/quiz/22)
בשיעור הזה, תוכלו להשתמש ב-Seaborn, ספרייה שכבר השתמשתם בה בעבר, כדי להמחיש קשרים בין משתנים. במיוחד מעניין השימוש בפונקציית `relplot` של Seaborn, שמאפשרת ליצור גרפים פיזוריים וגרפים קוויים כדי להמחיש במהירות '[קשרים סטטיסטיים](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', שמסייעים למדען הנתונים להבין טוב יותר כיצד משתנים קשורים זה לזה.
בשיעור זה, תוכלו להשתמש ב-Seaborn, ספרייה שכבר השתמשתם בה בעבר, ככלי מצוין לויזואליזציה של קשרים בין משתנים. במיוחד מעניין השימוש בפונקציית `relplot` של Seaborn, שמאפשרת ליצור גרפים פיזוריים וגרפים קוויים כדי להמחיש במהירות '[קשרים סטטיסטיים](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', המאפשרים למדען הנתונים להבין טוב יותר כיצד משתנים קשורים זה לזה.
## גרפי פיזור
השתמשו בגרף פיזור כדי להראות כיצד המחיר של דבש התפתח משנה לשנה, לפי מדינה. Seaborn, באמצעות `relplot`, מקבצת בנוחות את נתוני המדינות ומציגה נקודות נתונים עבור נתונים קטגוריים ומספריים כאחד.
השתמשו בגרף פיזור כדי להראות כיצד המחיר של הדבש התפתח משנה לשנה, לפי מדינה. Seaborn, באמצעות `relplot`, מקבץ בנוחות את נתוני המדינות ומציג נקודות נתונים עבור נתונים קטגוריים ומספריים כאחד.
כעת, הציגו את אותם נתונים עם סכמת צבעים של דבש כדי להראות כיצד המחיר מתפתח לאורך השנים. ניתן לעשות זאת על ידי הוספת פרמטר 'hue' כדי להציג את השינוי משנה לשנה:
> ✅ למדו עוד על [סכמות הצבעים שניתן להשתמש בהן ב-Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - נסו סכמת צבעים יפהפייה של קשת בענן!
> ✅ למדו עוד על [סכמות הצבעים שניתן להשתמש בהן ב-Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - נסו סכמת צבעים יפהפייה של קשת!
עם שינוי סכמת הצבעים, ניתן לראות בבירור שיש התקדמות חזקה לאורך השנים מבחינת המחיר לקילוגרם של דבש. אכן, אם תבחנו דוגמה מתוך הנתונים (למשל, מדינת אריזונה), תוכלו לראות דפוס של עליית מחירים משנה לשנה, עם מעט חריגות:
עם שינוי סכמת הצבעים, ניתן לראות בבירור שיש התקדמות חזקה לאורך השנים מבחינת המחיר לקילוגרם של דבש. אכן, אם תבחנו סט דגימה בנתונים כדי לאמת (בחרו מדינה מסוימת, כמו אריזונה לדוגמה), תוכלו לראות דפוס של עליית מחירים משנה לשנה, עם מעט חריגות:
| מדינה | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
דרך נוספת להמחיש את ההתקדמות הזו היא באמצעות גודל, במקום צבע. עבור משתמשים עיוורי צבעים, זו עשויה להיות אפשרות טובה יותר. ערכו את הוויזואליזציה כך שתציג עלייה במחיר באמצעות עלייה בהיקף הנקודות:
דרך נוספת להמחיש את ההתקדמות הזו היא להשתמש בגודל במקום בצבע. עבור משתמשים עיוורי צבעים, זו עשויה להיות אפשרות טובה יותר. ערכו את הוויזואליזציה כך שתציג עלייה במחיר באמצעות עלייה בהיקף הנקודות:
✅ מכיוון ש-Seaborn מאגדת נתונים סביב קו אחד, היא מציגה "את המדידות המרובות בכל ערך x על ידי הצגת הממוצע וטווח ביטחון של 95% סביב הממוצע". [מקור](https://seaborn.pydata.org/tutorial/relational.html). ניתן לבטל התנהגות זו על ידי הוספת `ci=None`.
✅ מכיוון ש-Seaborn מאגד נתונים סביב קו אחד, הוא מציג "את המדידות המרובות בכל ערך x על ידי הצגת הממוצע וטווח הביטחון של 95% סביב הממוצע". [מקור](https://seaborn.pydata.org/tutorial/relational.html). ניתן לבטל התנהגות זו על ידי הוספת `ci=None`.
שאלה: ובכן, בשנת 2003 האם ניתן לראות גם עלייה בהיצע הדבש? מה אם תבחנו את הייצור הכולל משנה לשנה?
רשת פאות לוקחת פאה אחת ממאגר הנתונים שלכם (במקרה שלנו, ניתן לבחור 'שנה' כדי להימנע מיצירת יותר מדי פאות). Seaborn יכולה אז ליצור גרף עבור כל אחת מהפאות של הקואורדינטות x ו-y שבחרתם, להשוואה קלה יותר. האם שנת 2003 בולטת בהשוואה מסוג זה?
רשת פאות לוקחת פאה אחת ממאגר הנתונים שלכם (במקרה שלנו, ניתן לבחור 'שנה' כדי להימנע מיצירת יותר מדי פאות). Seaborn יכול אז ליצור גרף עבור כל אחת מהפאות של הקואורדינטות שנבחרו ב-x וב-y להשוואה חזותית קלה יותר. האם שנת 2003 בולטת בהשוואה מסוג זה?
צרו רשת פאות על ידי המשך השימוש ב-`relplot` כפי שמומלץ ב-[תיעוד של Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
בוויזואליזציה הזו, ניתן להשוות את התפוקה לכל כוורת ומספר הכוורות משנה לשנה, זו לצד זו, עם הגדרת wrap ל-3 עבור העמודות:
בויזואליזציה זו, ניתן להשוות את התפוקה לכל כוורת ומספר הכוורות משנה לשנה, זו לצד זו, עם הגדרת wrap של 3 לעמודות:
עבור מאגר הנתונים הזה, אין משהו מיוחד שבולט ביחס למספר הכוורות והתפוקה שלהן, משנה לשנה ומדינה למדינה. האם יש דרך אחרת לחפש קשר בין שני המשתנים הללו?
עבור מאגר הנתונים הזה, שום דבר לא בולט במיוחד ביחס למספר הכוורות והתפוקה שלהן, משנה לשנה ומדינה למדינה. האם יש דרך אחרת לחפש קשר בין שני המשתנים הללו?
## גרפים קוויים כפולים
נסו גרף קווי מרובה על ידי חפיפת שני גרפים קוויים זה על גבי זה, תוך שימוש ב-'despine' של Seaborn להסרת הקווים העליונים והימניים, ובשימוש ב-`ax.twinx` [המבוסס על Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx מאפשר לגרף לשתף את ציר ה-x ולהציג שני צירי y. כך, הציגו את התפוקה לכל כוורת ומספר הכוורות, חופפים:
נסו גרף רב-קווי על ידי חפיפת שני גרפים קוויים זה על גבי זה, תוך שימוש ב-'despine' של Seaborn להסרת הקווים העליונים והימניים, ושימוש ב-`ax.twinx` [המבוסס על Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx מאפשר לגרף לשתף את ציר ה-x ולהציג שני צירי y. כך, הציגו את התפוקה לכל כוורת ומספר הכוורות, חופפים:
למרות שאין משהו שקופץ לעין סביב שנת 2003, זה מאפשר לנו לסיים את השיעור בנימה מעט שמחה יותר: למרות שיש ירידה כללית במספר הכוורות, מספר הכוורות מתייצב גם אם התפוקה לכל כוורת יורדת.
בעוד ששום דבר לא קופץ לעין סביב שנת 2003, זה מאפשר לנו לסיים את השיעור בנימה מעט שמחה יותר: למרות שיש ירידה כללית במספר הכוורות, מספר הכוורות מתייצב גם אם התפוקה לכל כוורת יורדת.
קדימה, דבורים, קדימה!
🐝❤️
## 🚀 אתגר
בשיעור הזה, למדתם קצת יותר על שימושים נוספים של גרפי פיזור ורשתות פאות, כולל רשתות פאות. אתגרו את עצמכם ליצור רשת פאות באמצעות מאגר נתונים אחר, אולי כזה שהשתמשתם בו בשיעורים קודמים. שימו לב כמה זמן לוקח ליצור אותן וכמה חשוב להיזהר מכמות הפאות שאתם מייצרים בטכניקות הללו.
בשיעור זה, למדתם קצת יותר על שימושים נוספים בגרפי פיזור ורשתות פאות, כולל רשתות פאות. אתגרו את עצמכם ליצור רשת פאות באמצעות מאגר נתונים אחר, אולי כזה שהשתמשתם בו בשיעורים קודמים. שימו לב כמה זמן לוקח ליצור אותן וכיצד עליכם להיזהר לגבי מספר הפאות שאתם צריכים לצייר באמצעות טכניקות אלו.
## [שאלון אחרי השיעור](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## סקירה ולימוד עצמי
גרפים קוויים יכולים להיות פשוטים או מורכבים למדי. קראו קצת בתיעוד של [Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) על הדרכים השונות שבהן ניתן לבנות אותם. נסו לשפר את הגרפים הקוויים שיצרתם בשיעור הזה באמצעות שיטות נוספות המפורטות בתיעוד.
גרפים קוויים יכולים להיות פשוטים או מורכבים למדי. קראו קצת בתיעוד של [Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) על הדרכים השונות שבהן ניתן לבנות אותם. נסו לשפר את הגרפים הקוויים שיצרתם בשיעור זה באמצעות שיטות נוספות המפורטות בתיעוד.
यह डेटा सेट लगभग 600 आइटम्स का है, जो कई अमेरिकी राज्यों में शहद उत्पादन को दर्शाता है। उदाहरण के लिए, आप किसी दिए गए राज्य में 1998-2012 के बीच प्रति वर्ष कॉलोनियों की संख्या, प्रति कॉलोनी उत्पादन, कुल उत्पादन, स्टॉक्स, प्रति पाउंड कीमत, और उत्पादित शहद का मूल्य देख सकते हैं, जिसमें प्रत्येक राज्य के लिए प्रति वर्ष एक पंक्ति होती है।
किसी दिए गए राज्य के वार्षिक उत्पादन और उस राज्य में शहद की कीमत के बीच संबंध को चित्रित करना दिलचस्प होगा। वैकल्पिक रूप से, आप राज्यों के प्रति कॉलोनी शहद उत्पादन के बीच संबंध को चित्रित कर सकते हैं। यह समय अवधि 2006 में पहली बार देखे गए विनाशकारी 'CCD' या 'कॉलोनी पतन विकार' (http://npic.orst.edu/envir/ccd.html) को कवर करती है, इसलिए यह अध्ययन करने के लिए एक महत्वपूर्ण डेटा सेट है। 🐝
किसी दिए गए राज्य के वार्षिक उत्पादन और उस राज्य में शहद की कीमत के बीच संबंध को चित्रित करना दिलचस्प होगा। वैकल्पिक रूप से, आप राज्यों के प्रति कॉलोनी शहद उत्पादन के बीच संबंध को चित्रित कर सकते हैं। यह समय अवधि 2006 में पहली बार देखे गए विनाशकारी 'CCD' या 'कॉलोनी कॉलैप्स डिसऑर्डर' (http://npic.orst.edu/envir/ccd.html) को कवर करती है, इसलिए यह अध्ययन करने के लिए एक महत्वपूर्ण डेटा सेट है। 🐝
इस पाठ में, आप Seaborn का उपयोग कर सकते हैं, जिसे आपने पहले उपयोग किया है, यह चर के बीच संबंधों को चित्रित करने के लिए एक अच्छा लाइब्रेरी है। विशेष रूप से दिलचस्प है Seaborn के `relplot` फ़ंक्शन का उपयोग, जो स्कैटर प्लॉट और लाइन प्लॉट को जल्दी से '[सांख्यिकीय संबंध](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' दिखाने की अनुमति देता है, जिससे डेटा वैज्ञानिक को यह बेहतर समझने में मदद मिलती है कि चर एक-दूसरे से कैसे संबंधित हैं।
इस पाठ में, आप Seaborn का उपयोग कर सकते हैं, जिसे आपने पहले उपयोग किया है, यह चर के बीच संबंधों को चित्रित करने के लिए एक अच्छा लाइब्रेरी है। विशेष रूप से दिलचस्प है Seaborn का `relplot` फ़ंक्शन, जो स्कैटर प्लॉट्स और लाइन प्लॉट्स को जल्दी से '[सांख्यिकीय संबंधों](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' को चित्रित करने की अनुमति देता है, जिससे डेटा वैज्ञानिक को यह बेहतर समझने में मदद मिलती है कि चर एक-दूसरे से कैसे संबंधित हैं।
## स्कैटरप्लॉट्स
शहद की कीमत कैसे साल दर साल, प्रति राज्य विकसित हुई है, इसे दिखाने के लिए एक स्कैटरप्लॉट का उपयोग करें। Seaborn, `relplot` का उपयोग करते हुए, राज्य डेटा को सुविधाजनक रूप से समूहित करता है और श्रेणीबद्ध और संख्यात्मक डेटा दोनों के लिए डेटा पॉइंट्स प्रदर्शित करता है।
शहद की कीमत कैसे विकसित हुई है, इसे वर्ष दर वर्ष, प्रति राज्य दिखाने के लिए एक स्कैटरप्लॉट का उपयोग करें। Seaborn, `relplot` का उपयोग करते हुए, राज्य डेटा को सुविधाजनक रूप से समूहित करता है और श्रेणीबद्ध और संख्यात्मक डेटा दोनों के लिए डेटा पॉइंट्स प्रदर्शित करता है।
आइए डेटा और Seaborn को इम्पोर्ट करके शुरू करें:
@ -36,7 +36,7 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
आप देखेंगे कि शहद डेटा में कई दिलचस्प कॉलम हैं, जिनमें वर्ष और प्रति पाउंड कीमत शामिल हैं। आइए इस डेटा का अन्वेषण करें, जो अमेरिकी राज्यों द्वारा समूहित है:
आप देखेंगे कि शहद डेटा में कई दिलचस्प कॉलम हैं, जिनमें वर्ष और प्रति पाउंड कीमत शामिल हैं। आइए इस डेटा का अन्वेषण करें, जिसे अमेरिकी राज्यों द्वारा समूहित किया गया है:
| राज्य | कॉलोनियों की संख्या | प्रति कॉलोनी उत्पादन | कुल उत्पादन | स्टॉक्स | प्रति पाउंड कीमत | उत्पादन मूल्य | वर्ष |
एक बुनियादी स्कैटरप्लॉट बनाएं जो शहद की प्रति पाउंड कीमत और उसके अमेरिकी राज्य के मूल के बीच संबंध दिखाए। `y` अक्ष को इतना लंबा बनाएं कि सभी राज्यों को प्रदर्शित किया जा सके:
एक साधारण स्कैटरप्लॉट बनाएं जो शहद की प्रति पाउंड कीमत और उसके अमेरिकी राज्य के बीच संबंध को दिखाए। `y` अक्ष को इतना लंबा बनाएं कि सभी राज्यों को प्रदर्शित किया जा सके:
अब, वही डेटा शहद के रंग योजना के साथ दिखाएं ताकि यह दिखाया जा सके कि कीमत वर्षों के साथ कैसे विकसित होती है। आप इसे 'hue' पैरामीटर जोड़कर कर सकते हैं ताकि साल दर साल बदलाव दिखाया जा सके:
अब, वही डेटा शहद के रंग योजना के साथ दिखाएं ताकि यह दिखाया जा सके कि कीमत वर्षों के साथ कैसे विकसित होती है। आप इसे 'hue' पैरामीटर जोड़कर कर सकते हैं ताकि वर्ष दर वर्ष परिवर्तन दिखाया जा सके:
> ✅ Seaborn में उपयोग की जाने वाली [रंग योजनाओं के बारे में अधिक जानें](https://seaborn.pydata.org/tutorial/color_palettes.html) - एक सुंदर इंद्रधनुष रंग योजना आज़माएं!
इस रंग योजना परिवर्तन के साथ, आप देख सकते हैं कि वर्षों के साथ शहद की प्रति पाउंड कीमत में स्पष्ट रूप से एक मजबूत प्रगति है। वास्तव में, यदि आप डेटा के एक नमूना सेट को सत्यापित करने के लिए देखते हैं (उदाहरण के लिए, एक राज्य चुनें, जैसे एरिज़ोना), तो आप देख सकते हैं कि कुछ अपवादों के साथ, साल दर साल कीमत बढ़ने का एक पैटर्न है:
इस रंग योजना परिवर्तन के साथ, आप देख सकते हैं कि वर्षों के साथ शहद की प्रति पाउंड कीमत में स्पष्ट रूप से एक मजबूत प्रगति है। वास्तव में, यदि आप डेटा के एक नमूना सेट को सत्यापित करने के लिए देखें (उदाहरण के लिए, एक राज्य, एरिज़ोना चुनें) तो आप देख सकते हैं कि कुछ अपवादों के साथ, कीमत में वर्ष दर वर्ष वृद्धि का एक पैटर्न है:
| राज्य | कॉलोनियों की संख्या | प्रति कॉलोनी उत्पादन | कुल उत्पादन | स्टॉक्स | प्रति पाउंड कीमत | उत्पादन मूल्य | वर्ष |
एक अन्य तरीका इस प्रगति को दिखाने का यह है कि रंग के बजाय आकार का उपयोग करें। रंग-अंधता वाले उपयोगकर्ताओं के लिए, यह एक बेहतर विकल्प हो सकता है। अपने विज़ुअलाइज़ेशन को संपादित करें ताकि कीमत में वृद्धि को डॉट के परिधि में वृद्धि के रूप में दिखाया जा सके:
एक अन्य तरीका इस प्रगति को चित्रित करने का यह है कि रंग के बजाय आकार का उपयोग करें। रंग-अंधता वाले उपयोगकर्ताओं के लिए, यह एक बेहतर विकल्प हो सकता है। अपने चित्रण को संपादित करें ताकि कीमत में वृद्धि को डॉट के परिधि में वृद्धि के रूप में दिखाया जा सके:
क्या यह केवल मांग और आपूर्ति का मामला है? जलवायु परिवर्तन और कॉलोनी पतन जैसे कारकों के कारण, क्या साल दर साल खरीदने के लिए कम शहद उपलब्ध है, और इसलिए कीमत बढ़ रही है?
क्या यह मांग और आपूर्ति का एक साधारण मामला है? जलवायु परिवर्तन और कॉलोनी कॉलैप्स जैसे कारकों के कारण, क्या वर्ष दर वर्ष खरीद के लिए कम शहद उपलब्ध है, और इसलिए कीमत बढ़ रही है?
इस डेटा सेट में कुछ चर के बीच संबंध खोजने के लिए, आइए कुछ लाइन चार्ट्स का अन्वेषण करें।
## लाइन चार्ट्स
प्रश्न: क्या शहद की प्रति पाउंड कीमत में साल दर साल स्पष्ट वृद्धि है? आप इसे सबसे आसानी से एक सिंगल लाइन चार्ट बनाकर खोज सकते हैं:
प्रश्न: क्या शहद की प्रति पाउंड कीमत में वर्ष दर वर्ष स्पष्ट वृद्धि है? आप इसे सबसे आसानी से एक सिंगल लाइन चार्ट बनाकर खोज सकते हैं:
✅ क्योंकि Seaborn डेटा को एक लाइन के चारों ओर समेकित कर रहा है, यह "प्रत्येक x मान पर कई मापों को औसत और औसत के चारों ओर 95% विश्वास अंतराल को प्लॉट करके प्रदर्शित करता है"। [स्रोत](https://seaborn.pydata.org/tutorial/relational.html)। इस समय लेने वाले व्यवहार को `ci=None` जोड़कर अक्षम किया जा सकता है।
प्रश्न: खैर, 2003 में क्या हम शहद की आपूर्ति में भी वृद्धि देख सकते हैं? यदि आप साल दर साल कुल उत्पादन को देखते हैं तो क्या होता है?
प्रश्न: खैर, 2003 में क्या हम शहद की आपूर्ति में भी वृद्धि देख सकते हैं? यदि आप कुल उत्पादन को वर्ष दर वर्ष देखें तो क्या होगा?
उत्तर: वास्तव में नहीं। यदि आप कुल उत्पादन को देखते हैं, तो ऐसा लगता है कि उस विशेष वर्ष में यह वास्तव में बढ़ गया है, हालांकि सामान्य रूप से शहद का उत्पादन इन वर्षों के दौरान गिरावट में है।
उत्तर: वास्तव में नहीं। यदि आप कुल उत्पादन को देखें, तो ऐसा लगता है कि उस विशेष वर्ष में यह वास्तव में बढ़ गया है, हालांकि सामान्य रूप से शहद का उत्पादन इन वर्षों के दौरान गिरावट में है।
प्रश्न: उस स्थिति में, 2003 के आसपास शहद की कीमत में उस वृद्धि का कारण क्या हो सकता है?
प्रश्न: उस स्थिति में, 2003 के आसपास शहद की कीमत में वृद्धि का कारण क्या हो सकता है?
इसे खोजने के लिए, आप एक फेसट ग्रिड का अन्वेषण कर सकते हैं।
## फेसट ग्रिड्स
फेसट ग्रिड्स आपके डेटा सेट के एक पहलू को लेते हैं (हमारे मामले में, आप 'वर्ष' चुन सकते हैं ताकि बहुत अधिक पहलू उत्पन्न न हों)। Seaborn तब आपके चुने हुए x और y निर्देशांक के लिए प्रत्येक पहलू का एक प्लॉट बना सकता है ताकि अधिक आसान दृश्य तुलना हो सके। क्या 2003 इस प्रकार की तुलना में अलग दिखता है?
फेसट ग्रिड्स आपके डेटा सेट के एक पहलू को लेते हैं (हमारे मामले में, आप 'वर्ष' चुन सकते हैं ताकि बहुत अधिक फेसट्स उत्पन्न न हों)। Seaborn तब आपके चुने हुए x और y निर्देशांक के लिए प्रत्येक फेसट का एक प्लॉट बना सकता है ताकि तुलना करना आसान हो। क्या 2003 इस प्रकार की तुलना में अलग दिखता है?
Seaborn के [डॉक्यूमेंटेशन](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) द्वारा अनुशंसित `relplot` का उपयोग जारी रखते हुए एक फेसट ग्रिड बनाएं।
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
इस विज़ुअलाइज़ेशन में, आप कॉलोनी प्रति उत्पादन और कॉलोनियों की संख्या को साल दर साल, राज्य दर राज्य, 3 कॉलम पर रैप सेट के साथ साइड बाय साइड तुलना कर सकते हैं:
इस चित्रण में, आप कॉलोनी की प्रति कॉलोनी उत्पादन और कॉलोनियों की संख्या को वर्ष दर वर्ष, राज्य दर राज्य, 3 कॉलम पर रैप सेट के साथ साइड बाय साइड तुलना कर सकते हैं:
इस डेटा सेट के लिए, कॉलोनियों की संख्या और उनके उत्पादन के संबंध में, साल दर साल और राज्य दर राज्य कुछ खास नहीं दिखता। क्या इन दो चर के बीच संबंध खोजने का कोई अलग तरीका है?
इस डेटा सेट के लिए, कॉलोनियों की संख्या और उनके उत्पादन के संबंध में वर्ष दर वर्ष और राज्य दर राज्य कुछ खास नहीं दिखता। क्या इन दो चर के बीच संबंध खोजने के लिए इसे देखने का कोई अलग तरीका है?
## डुअल-लाइन प्लॉट्स
Seaborn के 'despine' का उपयोग करके दो लाइनप्लॉट्स को एक-दूसरे के ऊपर सुपरइम्पोज़ करके एक मल्टीलाइन प्लॉट आज़माएं, और `ax.twinx` [Matplotlib से प्राप्त](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) का उपयोग करें। Twinx एक चार्ट को x अक्ष साझा करने और दो y अक्ष प्रदर्शित करने की अनुमति देता है। तो, कॉलोनी प्रति उत्पादन और कॉलोनियों की संख्या को सुपरइम्पोज़ करके प्रदर्शित करें:
Seaborn के 'despine' का उपयोग करके दो लाइनप्लॉट्स को एक-दूसरे के ऊपर सुपरइम्पोज़ करके एक मल्टीलाइन प्लॉट आज़माएं, और Matplotlib से [ax.twinx](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) का उपयोग करें। Twinx एक चार्ट को x अक्ष साझा करने और दो y अक्ष प्रदर्शित करने की अनुमति देता है। तो, कॉलोनी की प्रति कॉलोनी उत्पादन और कॉलोनियों की संख्या को सुपरइम्पोज़ करके प्रदर्शित करें:
हालांकि 2003 के आसपास आंखों को कुछ खास नहीं दिखता, यह हमें इस पाठ को थोड़ा खुशहाल नोट पर समाप्त करने की अनुमति देता है: जबकि कॉलोनियों की संख्या में समग्र रूप से गिरावट हो रही है, कॉलोनियों की संख्या स्थिर हो रही है, भले ही उनकी प्रति कॉलोनी उत्पादन घट रहा हो।
हालांकि 2003 के आसपास कुछ भी आंखों को नहीं खटकता, यह हमें इस पाठ को थोड़ा खुशहाल नोट पर समाप्त करने की अनुमति देता है: जबकि कॉलोनियों की संख्या में समग्र रूप से गिरावट हो रही है, कॉलोनियों की संख्या स्थिर हो रही है, भले ही उनकी प्रति कॉलोनी उत्पादन घट रहा हो।
जाओ, मधुमक्खियां, जाओ!
🐝❤️
## 🚀 चुनौती
इस पाठ में, आपने स्कैटरप्लॉट्स और लाइन ग्रिड्स के अन्य उपयोगों के बारे में थोड़ा और सीखा, जिसमें फेसट ग्रिड्स शामिल हैं। खुद को चुनौती दें कि आप एक अलग डेटा सेट का उपयोग करके एक फेसट ग्रिड बनाएं, शायद एक जिसे आपने इन पाठों से पहले उपयोग किया था। ध्यान दें कि उन्हें बनाने में कितना समय लगता है और आपको इन तकनीकों का उपयोग करते हुए कितने ग्रिड्स बनाने में सावधानी बरतनी चाहिए।
इस पाठ में, आपने स्कैटरप्लॉट्स और लाइन ग्रिड्स के अन्य उपयोगों के बारे में थोड़ा और सीखा, जिसमें फेसट ग्रिड्स शामिल हैं। खुद को चुनौती दें कि एक अलग डेटा सेट का उपयोग करके एक फेसट ग्रिड बनाएं, शायद एक जिसे आपने इन पाठों से पहले उपयोग किया था। ध्यान दें कि उन्हें बनाने में कितना समय लगता है और आपको इन तकनीकों का उपयोग करते हुए कितने ग्रिड्स बनाने की आवश्यकता है।
लाइन प्लॉट्स सरल या काफी जटिल हो सकते हैं। [Seaborn डॉक्यूमेंटेशन](https://seaborn.pydata.org/generated/seaborn.lineplot.html) में थोड़ा पढ़ाई करें कि आप उन्हें बनाने के विभिन्न तरीकों पर। इस पाठ में आपने जो लाइन चार्ट्स बनाए हैं, उन्हें डॉक्यूमेंटेशन में सूचीबद्ध अन्य तरीकों से बढ़ाने का प्रयास करें।
लाइन प्लॉट्स सरल या काफी जटिल हो सकते हैं। [Seaborn डॉक्यूमेंटेशन](https://seaborn.pydata.org/generated/seaborn.lineplot.html) में थोड़ा पढ़ें कि आप उन्हें बनाने के विभिन्न तरीकों पर। इस पाठ में आपने जो लाइन चार्ट्स बनाए हैं, उन्हें डॉक्यूमेंटेशन में सूचीबद्ध अन्य तरीकों से बढ़ाने का प्रयास करें।
## असाइनमेंट
[मधुमक्खियों के छत्ते में गोता लगाएं](assignment.md)
[मधुमक्खी के छत्ते में गोता लगाएं](assignment.md)
---
**अस्वीकरण**:
यह दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता सुनिश्चित करने का प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को प्रामाणिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम जिम्मेदार नहीं हैं।
यह दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता के लिए प्रयासरत हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को आधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।
|Vizualizacija odnosa - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
Nastavljajući s prirodnim fokusom našeg istraživanja, otkrijmo zanimljive vizualizacije koje prikazuju odnose između različitih vrsta meda, prema skupu podataka dobivenom od [Ministarstva poljoprivrede Sjedinjenih Američkih Država](https://www.nass.usda.gov/About_NASS/index.php).
Nastavljajući s prirodnim fokusom našeg istraživanja, istražimo zanimljive vizualizacije koje prikazuju odnose između različitih vrsta meda, prema skupu podataka dobivenom od [Ministarstva poljoprivrede Sjedinjenih Država](https://www.nass.usda.gov/About_NASS/index.php).
Ovaj skup podataka, koji sadrži oko 600 stavki, prikazuje proizvodnju meda u mnogim američkim saveznim državama. Na primjer, možete pogledati broj kolonija, prinos po koloniji, ukupnu proizvodnju, zalihe, cijenu po funti i vrijednost proizvedenog meda u određenoj državi od 1998. do 2012., s jednim redom po godini za svaku državu.
Ovaj skup podataka sadrži oko 600 stavki i prikazuje proizvodnju meda u mnogim američkim saveznim državama. Na primjer, možete pogledati broj kolonija, prinos po koloniji, ukupnu proizvodnju, zalihe, cijenu po funti i vrijednost proizvedenog meda u određenoj državi od 1998. do 2012., s jednim redom po godini za svaku državu.
Bit će zanimljivo vizualizirati odnos između proizvodnje određene države po godini i, na primjer, cijene meda u toj državi. Alternativno, mogli biste vizualizirati odnos između prinosa meda po koloniji u različitim državama. Ovo vremensko razdoblje obuhvaća razarajući 'CCD' ili 'Colony Collapse Disorder', prvi put zabilježen 2006. (http://npic.orst.edu/envir/ccd.html), što čini ovaj skup podataka značajnim za proučavanje. 🐝
Bilo bi zanimljivo vizualizirati odnos između proizvodnje određene države po godini i, na primjer, cijene meda u toj državi. Alternativno, mogli biste vizualizirati odnos između prinosa meda po koloniji u različitim državama. Ovo vremensko razdoblje obuhvaća razorni fenomen 'CCD' ili 'Sindrom kolapsa kolonija', prvi put zabilježen 2006. godine (http://npic.orst.edu/envir/ccd.html), što čini ovaj skup podataka posebno značajnim za proučavanje. 🐝
## [Kviz prije predavanja](https://ff-quizzes.netlify.app/en/ds/quiz/22)
U ovoj lekciji možete koristiti Seaborn, koji ste već koristili, kao dobru biblioteku za vizualizaciju odnosa između varijabli. Posebno je zanimljiva funkcija `relplot` u Seabornu koja omogućuje scatter plotove i line plotove za brzu vizualizaciju '[statističkih odnosa](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', što omogućuje data znanstveniku bolje razumijevanje kako se varijable međusobno odnose.
U ovoj lekciji možete koristiti Seaborn, biblioteku koju ste već koristili, kao odličan alat za vizualizaciju odnosa između varijabli. Posebno je zanimljiva funkcija `relplot` u Seabornu, koja omogućuje scatter plotove i linijske grafove za brzu vizualizaciju '[statističkih odnosa](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', što pomaže znanstvenicima u podacima da bolje razumiju kako su varijable međusobno povezane.
## Scatterplotovi
Koristite scatterplot za prikaz kako se cijena meda razvijala iz godine u godinu, po državama. Seaborn, koristeći `relplot`, praktično grupira podatke po državama i prikazuje točke za kategorijske i numeričke podatke.
Započnimo s uvozom podataka i Seaborna:
Započnimo uvozom podataka i biblioteke Seaborn:
```python
import pandas as pd
@ -36,7 +36,7 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Primijetit ćete da podaci o medu imaju nekoliko zanimljivih stupaca, uključujući godinu i cijenu po funti. Istražimo ove podatke, grupirane po američkim državama:
Primijetit ćete da podaci o medu sadrže nekoliko zanimljivih stupaca, uključujući godinu i cijenu po funti. Istražimo ove podatke grupirane po američkim državama:
| država | brojkol | prinospokol | ukupnaprod | zalihe | cijenapofunti | vrijednostprod | godina |
Napravite osnovni scatterplot za prikaz odnosa između cijene po funti meda i države podrijetla. Napravite `y` os dovoljno visokom da prikaže sve države:
Napravite osnovni scatterplot za prikaz odnosa između cijene po funti meda i države podrijetla. Postavite `y` os dovoljno visoko da prikaže sve države:
Sada prikažite iste podatke s bojama koje podsjećaju na med kako biste prikazali kako se cijena mijenja iz godine u godinu. To možete učiniti dodavanjem parametra 'hue' za prikaz promjena kroz godine:
Sada prikažite iste podatke s paletom boja inspiriranom medom kako biste pokazali kako se cijena mijenja tijekom godina. To možete učiniti dodavanjem parametra 'hue' za prikaz promjena iz godine u godinu:
> ✅ Saznajte više o [paletama boja koje možete koristiti u Seabornu](https://seaborn.pydata.org/tutorial/color_palettes.html) - isprobajte prekrasnu paletu boja u duginim nijansama!
> ✅ Saznajte više o [paletama boja koje možete koristiti u Seabornu](https://seaborn.pydata.org/tutorial/color_palettes.html) - isprobajte prekrasnu paletu boja poput duge!
S ovom promjenom boja možete vidjeti očigledan snažan napredak kroz godine u smislu cijene meda po funti. Doista, ako pogledate uzorak podataka za provjeru (odaberite određenu državu, na primjer Arizonu), možete vidjeti obrazac povećanja cijene iz godine u godinu, s nekoliko iznimaka:
S ovom promjenom palete boja možete jasno vidjeti snažan napredak tijekom godina u pogledu cijene meda po funti. Ako pogledate uzorak podataka za provjeru (na primjer, odaberite državu Arizonu), možete uočiti obrazac povećanja cijene iz godine u godinu, uz nekoliko iznimaka:
| država | brojkol | prinospokol | ukupnaprod | zalihe | cijenapofunti | vrijednostprod | godina |
Drugi način za vizualizaciju ovog napretka je korištenje veličine umjesto boje. Za korisnike s poteškoćama u razlikovanju boja, ovo bi mogla biti bolja opcija. Uredite svoju vizualizaciju kako biste prikazali povećanje cijene povećanjem opsega točaka:
Drugi način za vizualizaciju ovog napretka je korištenje veličine umjesto boje. Za korisnike s poteškoćama u razlikovanju boja, ovo bi mogla biti bolja opcija. Uredite svoju vizualizaciju tako da povećanje cijene prikažete povećanjem opsega točaka:
Je li ovo jednostavan slučaj ponude i potražnje? Zbog faktora poput klimatskih promjena i kolapsa kolonija, je li dostupno manje meda za kupnju iz godine u godinu, pa cijena raste?
Je li ovo jednostavan slučaj ponude i potražnje? Zbog čimbenika poput klimatskih promjena i kolapsa kolonija, je li dostupno manje meda za kupnju iz godine u godinu, pa cijena raste?
Kako biste otkrili korelaciju između nekih varijabli u ovom skupu podataka, istražimo neke linijske grafikone.
Kako bismo otkrili korelaciju između nekih varijabli u ovom skupu podataka, istražimo nekoliko linijskih grafova.
## Linijski grafikoni
## Linijski grafovi
Pitanje: Postoji li jasan porast cijene meda po funti iz godine u godinu? To možete najlakše otkriti stvaranjem jednog linijskog grafikona:
Pitanje: Postoji li jasan porast cijene meda po funti iz godine u godinu? To možete najlakše otkriti stvaranjem jednostavnog linijskog grafa:
✅ Budući da Seaborn agregira podatke oko jedne linije, prikazuje "višestruka mjerenja za svaku vrijednost x tako što crta srednju vrijednost i 95% interval pouzdanosti oko srednje vrijednosti". [Izvor](https://seaborn.pydata.org/tutorial/relational.html). Ovo vremenski zahtjevno ponašanje može se onemogućiti dodavanjem `ci=None`.
✅ Budući da Seaborn agregira podatke u jednu liniju, prikazuje "više mjerenja za svaku vrijednost x tako što crta srednju vrijednost i interval pouzdanosti od 95% oko srednje vrijednosti". [Izvor](https://seaborn.pydata.org/tutorial/relational.html). Ovo ponašanje koje oduzima vrijeme može se onemogućiti dodavanjem `ci=None`.
Pitanje: Pa, možemo li također vidjeti porast u zalihama meda oko 2003. godine? Što ako pogledate ukupnu proizvodnju iz godine u godinu?
Pitanje: Pa, možemo li također vidjeti porast u opskrbi medom oko 2003. godine? Što ako pogledate ukupnu proizvodnju iz godine u godinu?
Odgovor: Ne baš. Ako pogledate ukupnu proizvodnju, čini se da je zapravo porasla u toj godini, iako općenito gledano količina proizvedenog meda opada tijekom ovih godina.
Odgovor: Ne baš. Ako pogledate ukupnu proizvodnju, čini se da je zapravo porasla te godine, iako općenito količina proizvedenog meda opada tijekom tih godina.
Pitanje: U tom slučaju, što je moglo uzrokovati taj skok u cijeni meda oko 2003. godine?
Kako biste to otkrili, možete istražiti facet grid.
Kako bismo to otkrili, možemo istražiti facet grid.
## Facet gridovi
Facet gridovi uzimaju jedan aspekt vašeg skupa podataka (u našem slučaju, možete odabrati 'godinu' kako biste izbjegli previše proizvedenih faceta). Seaborn tada može napraviti grafikon za svaki od tih aspekata vaših odabranih x i y koordinata za lakšu vizualnu usporedbu. Ističe li se 2003. godina u ovoj vrsti usporedbe?
Facet gridovi uzimaju jedan aspekt vašeg skupa podataka (u našem slučaju, možete odabrati 'godinu' kako biste izbjegli previše proizvedenih gridova). Seaborn tada može napraviti graf za svaki od tih aspekata vaših odabranih x i y koordinata za lakšu vizualnu usporedbu. Ističe li se 2003. godina u ovoj vrsti usporedbe?
Napravite facet grid koristeći `relplot` kako je preporučeno u [dokumentaciji Seaborna](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
Napravite facet grid koristeći `relplot`, kako preporučuje [dokumentacija za Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
U ovoj vizualizaciji možete usporediti prinos po koloniji i broj kolonija iz godine u godinu, usporedno s postavkom wrapa na 3 za stupce:
U ovoj vizualizaciji možete usporediti prinos po koloniji i broj kolonija iz godine u godinu, usporedno s postavkom wrap na 3 za stupce:
Za ovaj skup podataka, ništa posebno ne ističe se u vezi s brojem kolonija i njihovim prinosom iz godine u godinu i države u državu. Postoji li drugačiji način za pronalaženje korelacije između ove dvije varijable?
Za ovaj skup podataka, ništa posebno ne iskače u vezi s brojem kolonija i njihovim prinosom, iz godine u godinu i iz države u državu. Postoji li drugačiji način za pronalaženje korelacije između ove dvije varijable?
## Dvostruki linijski grafikoni
## Dvostruki linijski grafovi
Isprobajte višelinijski grafikon superponiranjem dvaju linijskih grafikona jedan na drugi, koristeći Seabornov 'despine' za uklanjanje njihovih gornjih i desnih rubova, te koristeći `ax.twinx` [izvedeno iz Matplotliba](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx omogućuje grafikonu da dijeli x os i prikazuje dvije y osi. Dakle, prikažite prinos po koloniji i broj kolonija, superponirano:
Isprobajte višelinijski graf superponiranjem dvaju linijskih grafova jedan na drugi, koristeći Seabornov 'despine' za uklanjanje gornjih i desnih osi, te koristeći `ax.twinx` [iz Matplotliba](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx omogućuje dijagramu dijeljenje x osi i prikaz dviju y osi. Dakle, prikažite prinos po koloniji i broj kolonija, superponirano:
Iako ništa ne iskače oko 2003. godine, ovo nam omogućuje da završimo lekciju na malo sretnijoj noti: iako ukupno broj kolonija opada, broj kolonija se stabilizira čak i ako njihov prinos po koloniji opada.
Iako ništa posebno ne iskače oko 2003. godine, ovo nam omogućuje da završimo lekciju na malo sretnijoj noti: iako općenito dolazi do smanjenja broja kolonija, broj kolonija se stabilizira čak i ako njihov prinos po koloniji opada.
Naprijed, pčele, naprijed!
Naprijed, pčele! 🐝❤️
🐝❤️
## 🚀 Izazov
U ovoj lekciji naučili ste nešto više o drugim načinima korištenja scatterplotova i linijskih gridova, uključujući facet gridove. Izazovite se da napravite facet grid koristeći drugačiji skup podataka, možda onaj koji ste koristili prije ovih lekcija. Obratite pažnju na to koliko dugo traje njihovo stvaranje i kako morate biti oprezni oko broja gridova koje trebate nacrtati koristeći ove tehnike.
U ovoj lekciji naučili ste nešto više o drugim načinima korištenja scatterplotova i linijskih gridova, uključujući facet gridove. Izazovite se da napravite facet grid koristeći neki drugi skup podataka, možda onaj koji ste koristili prije ovih lekcija. Obratite pažnju na to koliko dugo traje njihovo stvaranje i koliko pažljivo trebate biti s brojem gridova koje trebate nacrtati koristeći ove tehnike.
## [Kviz nakon predavanja](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Pregled i samostalno učenje
Linijski grafikoni mogu biti jednostavni ili prilično složeni. Malo istražite [dokumentaciju Seaborna](https://seaborn.pydata.org/generated/seaborn.lineplot.html) o raznim načinima na koje ih možete izgraditi. Pokušajte poboljšati linijske grafikone koje ste izradili u ovoj lekciji koristeći druge metode navedene u dokumentaciji.
Linijski grafovi mogu biti jednostavni ili prilično složeni. Pročitajte malo više u [dokumentaciji za Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) o raznim načinima na koje ih možete izgraditi. Pokušajte unaprijediti linijske grafove koje ste izradili u ovoj lekciji koristeći druge metode navedene u dokumentaciji.
## Zadatak
[Zaronite u košnicu](assignment.md)
@ -184,4 +185,4 @@ Linijski grafikoni mogu biti jednostavni ili prilično složeni. Malo istražite
---
**Odricanje od odgovornosti**:
Ovaj dokument je preveden pomoću AI usluge za prevođenje [Co-op Translator](https://github.com/Azure/co-op-translator). Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati autoritativnim izvorom. Za ključne informacije preporučuje se profesionalni prijevod od strane ljudskog prevoditelja. Ne preuzimamo odgovornost za bilo kakve nesporazume ili pogrešne interpretacije koje proizlaze iz korištenja ovog prijevoda.
Ovaj dokument je preveden korištenjem AI usluge za prevođenje [Co-op Translator](https://github.com/Azure/co-op-translator). Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati mjerodavnim izvorom. Za ključne informacije preporučuje se profesionalni prijevod od strane stručnjaka. Ne preuzimamo odgovornost za bilo kakva nesporazuma ili pogrešna tumačenja koja mogu proizaći iz korištenja ovog prijevoda.
|Kapcsolatok vizualizálása - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
Folytatva kutatásunk természetközpontú témáját, fedezzük fel az érdekes vizualizációkat, amelyek bemutatják a különböző mézfajták közötti kapcsolatokat egy adatbázis alapján, amelyet az [Amerikai Mezőgazdasági Minisztérium](https://www.nass.usda.gov/About_NASS/index.php) állított össze.
Folytatva kutatásunk természetközpontú fókuszát, fedezzünk fel érdekes vizualizációkat, amelyek bemutatják a különböző mézfajták közötti kapcsolatokat egy, az [Amerikai Mezőgazdasági Minisztérium](https://www.nass.usda.gov/About_NASS/index.php) által összeállított adatbázis alapján.
Ez az adatbázis körülbelül 600 tételt tartalmaz, és az Egyesült Államok számos államában a méztermelést mutatja be. Például megvizsgálhatjuk az államok méhkolóniáinak számát, az egy kolóniára jutó hozamot, a teljes termelést, a készleteket, az árakat fontonként, valamint a termelt méz értékét 1998 és 2012 között, évente egy sorral minden államra vonatkozóan.
Ez az adatbázis körülbelül 600 tételt tartalmaz, és az Egyesült Államok különböző államaiban történő méztermelést mutatja be. Például megvizsgálhatjuk az államok méhcsaládjainak számát, a családonkénti hozamot, a teljes termelést, a készleteket, az árakat fontonként, valamint a termelt méz értékét 1998 és 2012 között, évente egy sorral minden államra vonatkozóan.
Érdekes lehet vizualizálni az adott állam éves termelése és például az állam mézének ára közötti kapcsolatot. Alternatívaként megvizsgálhatjuk az államok mézhozamát kolóniánként. Ez az időszak magában foglalja a pusztító 'CCD' vagy 'Colony Collapse Disorder' (Kolónia Összeomlási Rendellenesség) első megjelenését 2006-ban (http://npic.orst.edu/envir/ccd.html), így ez egy különösen érdekes adatbázis a tanulmányozáshoz. 🐝
Érdekes lehet vizualizálni egy adott állam éves termelése és például az adott állam mézének ára közötti kapcsolatot. Alternatívaként megvizsgálhatjuk az államok családonkénti mézhozamának kapcsolatát. Ez az időszak magában foglalja a pusztító 'CCD' vagy 'Colony Collapse Disorder' (méhcsalád összeomlási rendellenesség) első megjelenését 2006-ban (http://npic.orst.edu/envir/ccd.html), így ez egy különösen érdekes adatbázis a tanulmányozáshoz. 🐝
## [Előadás előtti kvíz](https://ff-quizzes.netlify.app/en/ds/quiz/22)
Ebben a leckében használhatod a Seaborn könyvtárat, amelyet korábban már használtál, hogy vizualizáld a változók közötti kapcsolatokat. Különösen érdekes a Seaborn `relplot` funkciója, amely lehetővé teszi szórásdiagramok és vonaldiagramok gyors létrehozását a '[statisztikai kapcsolatok](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' vizualizálásához, amelyek segítenek az adatelemzőnek jobban megérteni, hogyan kapcsolódnak egymáshoz a változók.
Ebben a leckében használhatod a Seaborn könyvtárat, amelyet korábban már használtál, hogy vizualizáld a változók közötti kapcsolatokat. Különösen érdekes a Seaborn `relplot` függvénye, amely lehetővé teszi szórásdiagramok és vonaldiagramok gyors létrehozását a '[statisztikai kapcsolatok](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' vizualizálására, amelyek segítenek az adatelemzőnek jobban megérteni, hogyan viszonyulnak egymáshoz a változók.
## Szórásdiagramok
Használj szórásdiagramot annak bemutatására, hogyan változott a méz ára évről évre, államonként. A Seaborn `relplot` funkciója kényelmesen csoportosítja az államok adatait, és megjeleníti az adatpontokat mind kategóriális, mind numerikus adatok esetében.
Használj szórásdiagramot annak bemutatására, hogyan változott a méz ára évről évre, államonként. A Seaborn `relplot` függvényével kényelmesen csoportosíthatod az államok adatait, és megjelenítheted az adatpontokat mind kategóriák, mind numerikus adatok esetében.
Kezdjük az adatok és a Seaborn importálásával:
@ -36,77 +36,77 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Láthatod, hogy a mézadatok számos érdekes oszlopot tartalmaznak, beleértve az évet és az árakat fontonként. Fedezzük fel ezeket az adatokat, csoportosítva az Egyesült Államok államai szerint:
Láthatod, hogy a mézadatok számos érdekes oszlopot tartalmaznak, például az évet és az árakat fontonként. Fedezzük fel ezeket az adatokat, csoportosítva az Egyesült Államok államai szerint:
| állam | kolóniák száma | hozam/kolónia | teljes termelés | készletek | ár/font | termelési érték | év |
Készíts egy alap szórásdiagramot, amely bemutatja a méz fontonkénti ára és az Egyesült Államok államai közötti kapcsolatot. Állítsd be az `y` tengelyt elég magasra, hogy minden állam látható legyen:
Most mutasd meg ugyanazt az adatot méz színvilággal, hogy bemutasd, hogyan változik az ár az évek során. Ezt úgy teheted meg, hogy hozzáadsz egy 'hue' paramétert, amely megmutatja az évről évre történő változást:
Most mutasd meg ugyanazt az adatot méz színvilággal, hogy bemutasd, hogyan változik az ár az évek során. Ezt úgy teheted meg, hogy hozzáadsz egy 'hue' paramétert, amely az évről évre történő változást mutatja:
> ✅ Tudj meg többet a [Seaborn színpalettáiról](https://seaborn.pydata.org/tutorial/color_palettes.html) - próbálj ki egy gyönyörű szivárvány színvilágot!
Ezzel a színvilág változtatással látható, hogy az évek során egyértelműen erős növekedés tapasztalható a méz fontonkénti árának alakulásában. Valóban, ha az adatok egy mintáját megvizsgáljuk (például Arizona államot), látható egy minta az árak évről évre történő növekedésére, néhány kivétellel:
| állam | kolóniák száma | hozam/kolónia | teljes termelés | készletek | ár/font | termelési érték | év |
Egy másik módja ennek a változásnak a vizualizálására a méret használata a szín helyett. Színvak felhasználók számára ez jobb opció lehet. Módosítsd a vizualizációt úgy, hogy az ár növekedését a pontok körméretének növekedésével mutasd:
Ezzel a színvilág változtatással egyértelműen látható az évek során a méz fontonkénti árának erős növekedése. Valóban, ha az adatok egy mintáját megvizsgálod (például Arizona államot), láthatod az árak évről évre történő növekedésének mintázatát, néhány kivétellel:
| állam | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | év |
Egy másik módja ennek a növekedésnek a vizualizálására a méret használata a szín helyett. Színvak felhasználók számára ez jobb opció lehet. Módosítsd a vizualizációt úgy, hogy az ár növekedését a pontok körméretének növekedésével mutasd:
Ez egyszerűen a kereslet és kínálat esete? Az olyan tényezők, mint az éghajlatváltozás és a kolónia összeomlás, kevesebb mézet eredményeznek évről évre, és így az árak növekednek?
Ez egyszerűen a kereslet és kínálat esete? Az olyan tényezők, mint az éghajlatváltozás és a méhcsalád összeomlása miatt kevesebb méz áll rendelkezésre évről évre, és ezért nő az ára?
Ahhoz, hogy felfedezzük az összefüggést az adatbázis néhány változója között, nézzünk meg néhány vonaldiagramot.
Ahhoz, hogy felfedezzük az adatokban lévő változók közötti korrelációt, nézzünk meg néhány vonaldiagramot.
## Vonaldiagramok
Kérdés: Van-e egyértelmű növekedés a méz fontonkénti árának alakulásában évről évre? Ezt legkönnyebben egyetlen vonaldiagram létrehozásával fedezhetjük fel:
Kérdés: Van-e egyértelmű növekedés a méz fontonkénti árának évről évre? Ezt legegyszerűbben egyetlen vonaldiagrammal fedezheted fel:
✅ Mivel a Seaborn aggregálja az adatokat egy vonal köré, "a több mérést minden x értéknél az átlag és az átlag körüli 95%-os konfidencia intervallum megjelenítésével ábrázolja". [Forrás](https://seaborn.pydata.org/tutorial/relational.html). Ez az időigényes viselkedés kikapcsolható a `ci=None` hozzáadásával.
✅ Mivel a Seaborn egyetlen vonal köré aggregálja az adatokat, "az x értékeknél lévő többszörös méréseket az átlag és az átlag körüli 95%-os konfidencia intervallum megjelenítésével ábrázolja". [Forrás](https://seaborn.pydata.org/tutorial/relational.html). Ez az időigényes viselkedés kikapcsolható a `ci=None` hozzáadásával.
Kérdés: Nos, 2003-ban láthatunk-e egy ugrást a mézkínálatban? Mi történik, ha megnézzük a teljes termelést évről évre?
@ -114,9 +114,9 @@ Kérdés: Nos, 2003-ban láthatunk-e egy ugrást a mézkínálatban? Mi történ
Válasz: Nem igazán. Ha megnézzük a teljes termelést, úgy tűnik, hogy az adott évben valóban növekedett, bár általánosságban a termelt méz mennyisége csökken ezekben az években.
Válasz: Nem igazán. Ha megnézzük a teljes termelést, úgy tűnik, hogy az adott évben valójában növekedett, bár általánosságban a méztermelés csökkenő tendenciát mutat ezekben az években.
Kérdés: Ebben az esetben mi okozhatta a méz árának ugrását 2003 körül?
@ -124,9 +124,9 @@ Ennek felfedezéséhez használhatunk egy facet gridet.
## Facet grid-ek
A facet grid-ek az adatbázis egy aspektusát veszik alapul (esetünkben választhatjuk az 'évet', hogy elkerüljük a túl sok grid létrehozását). A Seaborn ezután egy diagramot készít az adott aspektus minden x és y koordinátájáról, hogy könnyebben összehasonlíthassuk őket. Kitűnik-e 2003 ebben az összehasonlításban?
A facet grid-ek az adatbázis egy aspektusát veszik alapul (esetünkben választhatjuk az 'évet', hogy elkerüljük a túl sok grid létrehozását). A Seaborn ezután egy-egy diagramot készít az általad választott x és y koordináták alapján, megkönnyítve az összehasonlítást. Kitűnik-e 2003 ebben a típusú összehasonlításban?
Hozz létre egy facet grid-et a `relplot` használatával, ahogy azt a [Seaborn dokumentációja](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) ajánlja.
Készíts egy facet gridet a Seaborn dokumentációja által ajánlott `relplot` használatával ([Forrás](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid)).
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Ebben a vizualizációban összehasonlíthatod a kolóniánkénti hozamot és a kolóniák számát évről évre, egymás mellett, 3 oszlopos elrendezéssel:
Ebben a vizualizációban összehasonlíthatod a családonkénti hozamot és a méhcsaládok számát évről évre, egymás mellett, 3 oszlopos elrendezéssel:
Ebben az adatbázisban semmi különös nem tűnik ki a kolóniák számával és hozamával kapcsolatban évről évre és államonként. Van-e más módja annak, hogy összefüggést találjunk e két változó között?
Ebben az adatbázisban semmi különös nem tűnik ki a méhcsaládok számával és hozamával kapcsolatban évről évre és államonként. Van-e más módja annak, hogy korrelációt találjunk e két változó között?
## Kettős vonaldiagramok
Próbálj ki egy többvonalas diagramot, amely két vonaldiagramot helyez egymásra, a Seaborn 'despine' funkciójával eltávolítva a felső és jobb oldali kereteket, valamint az `ax.twinx` [Matplotlibből származó](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) funkcióval. Az Twinx lehetővé teszi, hogy egy diagram megossza az x tengelyt, és két y tengelyt jelenítsen meg. Tehát ábrázold a kolóniánkénti hozamot és a kolóniák számát egymásra helyezve:
Próbálj ki egy többsoros diagramot, amely két vonaldiagramot helyez egymásra, a Seaborn 'despine' funkciójával eltávolítva a felső és jobb oldali kereteket, valamint az `ax.twinx`használatával [Matplotlibből származó funkció](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). A Twinx lehetővé teszi, hogy egy diagram megossza az x tengelyt, és két y tengelyt jelenítsen meg. Tehát ábrázold a családonkénti hozamot és a méhcsaládok számát egymásra helyezve:
```python
fig, ax = plt.subplots(figsize=(12,6))
@ -161,16 +162,16 @@ sns.despine(right=False)
plt.ylabel('colony yield')
ax.figure.legend();
```


Bár semmi különös nem tűnik ki 2003 körül, ez lehetőséget ad arra, hogy a leckét egy kicsit pozitívabb hangvétellel zárjuk: bár összességében csökken a kolóniák száma, a kolóniák száma stabilizálódik, még akkor is, ha a kolóniánkénti hozam csökken.
Bár semmi különös nem tűnik ki 2003 körül, ez lehetőséget ad arra, hogy egy kicsit pozitívabb hangvétellel zárjuk a leckét: bár a méhcsaládok száma általánosságban csökken, a méhcsaládok száma stabilizálódik, még ha a családonkénti hozam csökken is.
Hajrá, méhek, hajrá!
🐝❤️
## 🚀 Kihívás
Ebben a leckében többet tanultál a szórásdiagramok és vonalhálók, köztük a facet grid-ek használatáról. Kihívásként készíts egy facet grid-et egy másik adatbázis alapján, talán olyat, amelyet korábban használtál ezekben a leckékben. Jegyezd meg, mennyi időbe telik létrehozni őket, és légy óvatos, hogy hány gridet kell rajzolnod ezekkel a technikákkal.
Ebben a leckében többet tanultál a szórásdiagramok és vonalhálók, köztük a facet grid-ek használatáról. Kihívásként készíts egy facet gridet egy másik adatbázis alapján, talán olyat, amelyet korábban használtál ezekben a leckékben. Jegyezd meg, mennyi időbe telik elkészíteni, és légy óvatos, hogy hány gridet kell rajzolnod ezekkel a technikákkal.
## [Előadás utáni kvíz](https://ff-quizzes.netlify.app/en/ds/quiz/23)
@ -183,5 +184,5 @@ A vonaldiagramok lehetnek egyszerűek vagy meglehetősen összetettek. Olvass eg
---
**Felelősségkizárása**:
Ez a dokumentum az AI fordítási szolgáltatás [Co-op Translator](https://github.com/Azure/co-op-translator) segítségével lett lefordítva. Bár törekszünk a pontosságra, kérjük, vegye figyelembe, hogy az automatikus fordítások hibákat vagy pontatlanságokat tartalmazhatnak. Az eredeti dokumentum az eredeti nyelvén tekintendő hiteles forrásnak. Kritikus információk esetén javasolt professzionális emberi fordítást igénybe venni. Nem vállalunk felelősséget a fordítás használatából eredő félreértésekért vagy téves értelmezésekért.
**Felelősségkizárás**:
Ez a dokumentum az [Co-op Translator](https://github.com/Azure/co-op-translator) AI fordítási szolgáltatás segítségével készült. Bár törekszünk a pontosságra, kérjük, vegye figyelembe, hogy az automatikus fordítások hibákat vagy pontatlanságokat tartalmazhatnak. Az eredeti dokumentum az eredeti nyelvén tekintendő hiteles forrásnak. Kritikus információk esetén javasolt a professzionális, emberi fordítás igénybevétele. Nem vállalunk felelősséget a fordítás használatából eredő félreértésekért vagy téves értelmezésekért.
# Memvisualisasikan Hubungan: Semua Tentang Madu 🍯
# Visualisasi Hubungan: Semua Tentang Madu 🍯
| ](../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|Memvisualisasikan Hubungan - _Sketchnote oleh [@nitya](https://twitter.com/nitya)_ |
|Visualisasi Hubungan - _Sketchnote oleh [@nitya](https://twitter.com/nitya)_ |
Melanjutkan fokus penelitian kita pada alam, mari kita temukan visualisasi menarik untuk menunjukkan hubungan antara berbagai jenis madu, berdasarkan dataset yang diambil dari [Departemen Pertanian Amerika Serikat](https://www.nass.usda.gov/About_NASS/index.php).
Melanjutkan fokus penelitian kami pada alam, mari kita temukan visualisasi menarik untuk menunjukkan hubungan antara berbagai jenis madu, berdasarkan dataset yang berasal dari [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
Dataset ini, yang terdiri dari sekitar 600 item, menampilkan produksi madu di banyak negara bagian AS. Sebagai contoh, Anda dapat melihat jumlah koloni, hasil per koloni, total produksi, stok, harga per pon, dan nilai madu yang diproduksi di negara bagian tertentu dari tahun 1998-2012, dengan satu baris per tahun untuk setiap negara bagian.
Akan menarik untuk memvisualisasikan hubungan antara produksi tahunan suatu negara bagian dan, misalnya, harga madu di negara bagian tersebut. Sebagai alternatif, Anda dapat memvisualisasikan hubungan antara hasil madu per koloni di berbagai negara bagian. Rentang tahun ini mencakup periode 'CCD' atau 'Colony Collapse Disorder' yang pertama kali terlihat pada tahun 2006 (http://npic.orst.edu/envir/ccd.html), sehingga dataset ini menjadi bahan studi yang menarik. 🐝
Akan menarik untuk memvisualisasikan hubungan antara produksi tahunan suatu negara bagian dan, misalnya, harga madu di negara bagian tersebut. Alternatifnya, Anda dapat memvisualisasikan hubungan antara hasil madu per koloni di berbagai negara bagian. Rentang tahun ini mencakup periode 'CCD' atau 'Colony Collapse Disorder' yang pertama kali terlihat pada tahun 2006 (http://npic.orst.edu/envir/ccd.html), sehingga dataset ini menjadi bahan studi yang menyentuh. 🐝
Dalam pelajaran ini, Anda dapat menggunakan Seaborn, yang sebelumnya telah Anda gunakan, sebagai pustaka yang baik untuk memvisualisasikan hubungan antar variabel. Yang sangat menarik adalah penggunaan fungsi `relplot` dari Seaborn yang memungkinkan scatter plot dan line plot untuk dengan cepat memvisualisasikan '[hubungan statistik](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', yang memungkinkan data scientist untuk lebih memahami bagaimana variabel saling berhubungan.
Dalam pelajaran ini, Anda dapat menggunakan Seaborn, yang telah Anda gunakan sebelumnya, sebagai pustaka yang baik untuk memvisualisasikan hubungan antar variabel. Yang menarik adalah penggunaan fungsi `relplot` dari Seaborn yang memungkinkan scatter plot dan line plot untuk dengan cepat memvisualisasikan '[hubungan statistik](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', yang memungkinkan data scientist memahami lebih baik bagaimana variabel saling berhubungan.
## Scatterplot
Gunakan scatterplot untuk menunjukkan bagaimana harga madu berkembang dari tahun ke tahun di setiap negara bagian. Seaborn, dengan menggunakan `relplot`, secara praktis mengelompokkan data negara bagian dan menampilkan titik data untuk data kategoris dan numerik.
Gunakan scatterplot untuk menunjukkan bagaimana harga madu berkembang dari tahun ke tahun di setiap negara bagian. Seaborn, dengan menggunakan `relplot`, secara praktis mengelompokkan data negara bagian dan menampilkan titik data untuk data kategoris maupun numerik.
Mari kita mulai dengan mengimpor data dan Seaborn:
@ -51,7 +51,7 @@ Buat scatterplot dasar untuk menunjukkan hubungan antara harga per pon madu dan
Sekarang, tampilkan data yang sama dengan skema warna madu untuk menunjukkan bagaimana harga berkembang dari tahun ke tahun. Anda dapat melakukannya dengan menambahkan parameter 'hue' untuk menunjukkan perubahan dari tahun ke tahun:
@ -60,9 +60,9 @@ Sekarang, tampilkan data yang sama dengan skema warna madu untuk menunjukkan bag
Dengan perubahan skema warna ini, Anda dapat melihat bahwa ada perkembangan yang jelas dari tahun ke tahun dalam hal harga madu per pon. Memang, jika Anda melihat satu set data sampel untuk memverifikasi (pilih negara bagian tertentu, misalnya Arizona), Anda dapat melihat pola kenaikan harga dari tahun ke tahun, dengan beberapa pengecualian:
Dengan perubahan skema warna ini, Anda dapat melihat bahwa ada perkembangan yang jelas selama bertahun-tahun dalam hal harga madu per pon. Memang, jika Anda melihat sampel data untuk memverifikasi (pilih negara bagian tertentu, misalnya Arizona), Anda dapat melihat pola kenaikan harga dari tahun ke tahun, dengan beberapa pengecualian:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Cara lain untuk memvisualisasikan perkembangan ini adalah dengan menggunakan ukuran, bukan warna. Untuk pengguna yang buta warna, ini mungkin menjadi opsi yang lebih baik. Edit visualisasi Anda untuk menunjukkan kenaikan harga dengan peningkatan ukuran lingkaran:
Cara lain untuk memvisualisasikan perkembangan ini adalah dengan menggunakan ukuran, bukan warna. Untuk pengguna yang buta warna, ini mungkin menjadi pilihan yang lebih baik. Edit visualisasi Anda untuk menunjukkan kenaikan harga dengan peningkatan lingkaran titik:
Apakah ini hanya kasus sederhana dari penawaran dan permintaan? Karena faktor seperti perubahan iklim dan keruntuhan koloni, apakah madu yang tersedia untuk dibeli semakin sedikit dari tahun ke tahun, sehingga harga meningkat?
Apakah ini kasus sederhana dari hukum permintaan dan penawaran? Karena faktor seperti perubahan iklim dan keruntuhan koloni, apakah madu yang tersedia untuk dibeli semakin sedikit dari tahun ke tahun, sehingga harga meningkat?
Untuk menemukan korelasi antara beberapa variabel dalam dataset ini, mari kita eksplorasi beberapa grafik garis.
@ -102,9 +102,9 @@ Pertanyaan: Apakah ada kenaikan harga madu per pon yang jelas dari tahun ke tahu
✅ Karena Seaborn mengagregasi data di sekitar satu garis, ia menampilkan "pengukuran ganda pada setiap nilai x dengan memplot rata-rata dan interval kepercayaan 95% di sekitar rata-rata". [Sumber](https://seaborn.pydata.org/tutorial/relational.html). Perilaku yang memakan waktu ini dapat dinonaktifkan dengan menambahkan `ci=None`.
@ -114,17 +114,17 @@ Pertanyaan: Nah, pada tahun 2003 apakah kita juga melihat lonjakan pasokan madu?
Jawaban: Tidak juga. Jika Anda melihat total produksi, sebenarnya tampaknya meningkat pada tahun tersebut, meskipun secara umum jumlah madu yang diproduksi menurun selama tahun-tahun ini.
Pertanyaan: Dalam hal ini, apa yang bisa menyebabkan lonjakan harga madu di sekitar tahun 2003?
Pertanyaan: Dalam hal ini, apa yang bisa menyebabkan lonjakan harga madu sekitar tahun 2003?
Untuk menemukan ini, Anda dapat mengeksplorasi facet grid.
## Facet Grid
## Facet Grids
Facet grid mengambil satu aspek dari dataset Anda (dalam kasus ini, Anda dapat memilih 'tahun' untuk menghindari terlalu banyak facet yang dihasilkan). Seaborn kemudian dapat membuat plot untuk masing-masing aspek tersebut dari koordinat x dan y yang Anda pilih untuk perbandingan visual yang lebih mudah. Apakah tahun 2003 menonjol dalam jenis perbandingan ini?
Facet grid mengambil satu aspek dari dataset Anda (dalam kasus kami, Anda dapat memilih 'tahun' untuk menghindari terlalu banyak aspek yang dihasilkan). Seaborn kemudian dapat membuat plot untuk masing-masing aspek tersebut berdasarkan koordinat x dan y yang Anda pilih untuk perbandingan visual yang lebih mudah. Apakah tahun 2003 menonjol dalam jenis perbandingan ini?
Buat facet grid dengan terus menggunakan `relplot` seperti yang direkomendasikan oleh [dokumentasi Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Dalam visualisasi ini, Anda dapat membandingkan hasil per koloni dan jumlah koloni dari tahun ke tahun, berdampingan dengan pengaturan wrap pada 3 untuk kolom:
Untuk dataset ini, tidak ada yang secara khusus menonjol terkait jumlah koloni dan hasilnya, dari tahun ke tahun dan negara bagian ke negara bagian. Apakah ada cara lain untuk menemukan korelasi antara kedua variabel ini?
## Grafik Garis Ganda
Cobalah grafik multiline dengan menumpangkan dua grafik garis di atas satu sama lain, menggunakan 'despine' dari Seaborn untuk menghapus spines atas dan kanan, dan menggunakan `ax.twinx` [berasal dari Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx memungkinkan grafik untuk berbagi sumbu x dan menampilkan dua sumbu y. Jadi, tampilkan hasil per koloni dan jumlah koloni, ditumpangkan:
Cobalah grafik multiline dengan menumpangkan dua grafik garis di atas satu sama lain, menggunakan 'despine' dari Seaborn untuk menghapus tulang belakang atas dan kanan mereka, dan menggunakan `ax.twinx` [berasal dari Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx memungkinkan grafik berbagi sumbu x dan menampilkan dua sumbu y. Jadi, tampilkan hasil per koloni dan jumlah koloni, ditumpangkan:
Meskipun tidak ada yang mencolok di sekitar tahun 2003, ini memungkinkan kita untuk mengakhiri pelajaran ini dengan catatan yang sedikit lebih positif: meskipun jumlah koloni secara keseluruhan menurun, jumlah koloni mulai stabil meskipun hasil per koloni menurun.
Meskipun tidak ada yang mencolok di sekitar tahun 2003, ini memungkinkan kita mengakhiri pelajaran ini dengan catatan yang sedikit lebih bahagia: meskipun jumlah koloni secara keseluruhan menurun, jumlah koloni mulai stabil meskipun hasil per koloni menurun.
Semangat, lebah! 🐝❤️
Semangat, lebah, semangat!
🐝❤️
## 🚀 Tantangan
Dalam pelajaran ini, Anda belajar lebih banyak tentang penggunaan scatterplot dan line grid lainnya, termasuk facet grid. Tantang diri Anda untuk membuat facet grid menggunakan dataset yang berbeda, mungkin yang telah Anda gunakan sebelumnya dalam pelajaran ini. Perhatikan berapa lama waktu yang dibutuhkan untuk membuatnya dan bagaimana Anda perlu berhati-hati tentang jumlah grid yang perlu Anda gambar menggunakan teknik ini.
Dalam pelajaran ini, Anda belajar lebih banyak tentang penggunaan scatterplot dan line grid lainnya, termasuk facet grid. Tantang diri Anda untuk membuat facet grid menggunakan dataset yang berbeda, mungkin yang telah Anda gunakan sebelumnya dalam pelajaran ini. Perhatikan berapa lama waktu yang dibutuhkan untuk membuatnya dan bagaimana Anda perlu berhati-hati tentang berapa banyak grid yang perlu Anda gambar menggunakan teknik ini.
Grafik garis bisa sederhana atau cukup kompleks. Lakukan sedikit pembacaan di [dokumentasi Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) tentang berbagai cara Anda dapat membangunnya. Cobalah untuk meningkatkan grafik garis yang Anda buat dalam pelajaran ini dengan metode lain yang tercantum dalam dokumentasi.
Grafik garis bisa sederhana atau cukup kompleks. Lakukan sedikit pembacaan di [dokumentasi Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) tentang berbagai cara Anda dapat membangunnya. Cobalah untuk meningkatkan grafik garis yang Anda buat dalam pelajaran ini dengan metode lain yang tercantum dalam dokumen.
## Tugas
[Masuk lebih dalam ke sarang lebah](assignment.md)
[Masuk ke sarang lebah](assignment.md)
---
**Penafian**:
Dokumen ini telah diterjemahkan menggunakan layanan penerjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Meskipun kami berupaya untuk memberikan hasil yang akurat, harap diperhatikan bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang berwenang. Untuk informasi yang bersifat kritis, disarankan menggunakan jasa penerjemahan manusia profesional. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang keliru yang timbul dari penggunaan terjemahan ini.
Dokumen ini telah diterjemahkan menggunakan layanan terjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Meskipun kami berupaya untuk memberikan hasil yang akurat, harap diperhatikan bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang berwenang. Untuk informasi yang bersifat kritis, disarankan menggunakan jasa penerjemah manusia profesional. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang keliru yang timbul dari penggunaan terjemahan ini.
Ora, mostra gli stessi dati con una palette di colori che richiama il miele per evidenziare come il prezzo evolve nel corso degli anni. Puoi farlo aggiungendo un parametro 'hue' per mostrare il cambiamento anno dopo anno:
Ora, mostra gli stessi dati con una palette di colori che richiami il miele per evidenziare come il prezzo si evolve nel corso degli anni. Puoi farlo aggiungendo un parametro 'hue' per mostrare il cambiamento anno dopo anno:
> ✅ Scopri di più sulle [palette di colori che puoi usare in Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - prova una bellissima palette arcobaleno!
Con questo cambiamento di colori, puoi vedere chiaramente una forte progressione nel corso degli anni in termini di prezzo del miele per libbra. Infatti, se guardi un campione di dati per verificare (scegli uno stato, ad esempio l'Arizona), puoi osservare un pattern di aumento dei prezzi anno dopo anno, con poche eccezioni:
È un semplice caso di domanda e offerta? A causa di fattori come il cambiamento climatico e il collasso delle colonie, c'è meno miele disponibile per l'acquisto anno dopo anno, e quindi il prezzo aumenta?
✅ Poiché Seaborn aggrega i dati attorno a una linea, mostra "le misurazioni multiple per ogni valore x tracciando la media e l'intervallo di confidenza al 95% attorno alla media". [Fonte](https://seaborn.pydata.org/tutorial/relational.html). Questo comportamento che richiede tempo può essere disabilitato aggiungendo `ci=None`.
✅ Poiché Seaborn aggrega i dati attorno a una linea, visualizza "le misurazioni multiple per ogni valore x tracciando la media e l'intervallo di confidenza al 95% attorno alla media". [Fonte](https://seaborn.pydata.org/tutorial/relational.html). Questo comportamento dispendioso in termini di tempo può essere disabilitato aggiungendo `ci=None`.
Domanda: Bene, nel 2003 possiamo anche vedere un picco nella fornitura di miele? E se guardassi la produzione totale anno dopo anno?
Domanda: Bene, nel 2003 possiamo anche vedere un picco nella fornitura di miele? E se guardi la produzione totale anno dopo anno?
Risposta: Non proprio. Se guardi la produzione totale, sembra effettivamente essere aumentata in quell'anno particolare, anche se generalmente parlando la quantità di miele prodotta è in declino durante questi anni.
Risposta: Non proprio. Se guardi la produzione totale, sembra effettivamente essere aumentata in quell'anno particolare, anche se generalmente parlando la quantità di miele prodotta è in calo durante questi anni.
Domanda: In tal caso, cosa potrebbe aver causato quel picco nel prezzo del miele intorno al 2003?
@ -124,7 +124,7 @@ Per scoprirlo, puoi esplorare una griglia di faccette.
## Griglie di faccette
Le griglie di faccette prendono una faccetta del tuo dataset (nel nostro caso, puoi scegliere 'anno' per evitare di produrre troppe faccette). Seaborn può quindi creare un grafico per ciascuna di queste faccette delle coordinate x e y scelte per un confronto visivo più semplice. Il 2003 si distingue in questo tipo di confronto?
Le griglie di faccette prendono una faccetta del tuo dataset (nel nostro caso, puoi scegliere 'anno' per evitare di produrre troppe faccette). Seaborn può quindi creare un grafico per ciascuna di queste faccette delle coordinate x e y scelte per un confronto più semplice. Il 2003 si distingue in questo tipo di confronto?
Crea una griglia di faccette continuando a utilizzare `relplot` come raccomandato dalla [documentazione di Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
In questa visualizzazione, puoi confrontare la resa per colonia e il numero di colonie anno dopo anno, fianco a fianco con un wrap impostato a 3 per le colonne:
Per questo dataset, nulla si distingue particolarmente riguardo al numero di colonie e alla loro resa, anno dopo anno e stato per stato. C'è un modo diverso per cercare di trovare una correlazione tra queste due variabili?
## Grafici a doppia linea
Prova un grafico multilinea sovrapponendo due grafici a linee uno sopra l'altro, utilizzando il 'despine' di Seaborn per rimuovere le spine superiore e destra, e utilizzando `ax.twinx` [derivato da Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx consente a un grafico di condividere l'asse x e visualizzare due assi y. Quindi, mostra la resa per colonia e il numero di colonie, sovrapposti:
Prova un grafico multilinea sovrapponendo due grafici a linee uno sopra l'altro, utilizzando il 'despine' di Seaborn per rimuovere le spine superiore e destra, e utilizzando `ax.twinx` [derivato da Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx consente a un grafico di condividere l'asse x e visualizzare due assi y. Quindi, visualizza la resa per colonia e il numero di colonie, sovrapposti:
Sebbene nulla salti all'occhio intorno all'anno 2003, ci permette di concludere questa lezione con una nota un po' più positiva: mentre il numero di colonie è generalmente in calo, il numero di colonie si sta stabilizzando anche se la loro resa per colonia è in diminuzione.
@ -170,14 +171,13 @@ Forza, api, forza!
🐝❤️
## 🚀 Sfida
In questa lezione, hai imparato un po' di più su altri usi degli scatterplot e delle griglie a linee, incluse le griglie di faccette. Sfida te stesso a creare una griglia di faccette utilizzando un dataset diverso, magari uno che hai usato prima di queste lezioni. Nota quanto tempo impiegano a essere create e quanto devi essere attento al numero di griglie che devi disegnare utilizzando queste tecniche.
In questa lezione, hai imparato un po' di più su altri usi degli scatterplot e delle griglie a linee, incluse le griglie di faccette. Sfida te stesso a creare una griglia di faccette utilizzando un dataset diverso, magari uno che hai usato prima di queste lezioni. Nota quanto tempo impiegano a essere create e come devi prestare attenzione al numero di griglie che devi disegnare utilizzando queste tecniche.
I grafici a linee possono essere semplici o piuttosto complessi. Fai un po' di lettura nella [documentazione di Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) sui vari modi in cui puoi costruirli. Prova a migliorare i grafici a linee che hai costruito in questa lezione con altri metodi elencati nella documentazione.
I grafici a linee possono essere semplici o piuttosto complessi. Fai un po' di lettura nella [documentazione di Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) sui vari modi in cui puoi costruirli. Prova a migliorare i grafici a linee che hai costruito in questa lezione con altri metodi elencati nei documenti.
## Compito
[Immergiti nell'alveare](assignment.md)
@ -185,4 +185,4 @@ I grafici a linee possono essere semplici o piuttosto complessi. Fai un po' di l
---
**Disclaimer**:
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica [Co-op Translator](https://github.com/Azure/co-op-translator). Sebbene ci impegniamo per garantire l'accuratezza, si prega di notare che le traduzioni automatiche possono contenere errori o imprecisioni. Il documento originale nella sua lingua nativa dovrebbe essere considerato la fonte autorevole. Per informazioni critiche, si raccomanda una traduzione professionale effettuata da un traduttore umano. Non siamo responsabili per eventuali incomprensioni o interpretazioni errate derivanti dall'uso di questa traduzione.
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica [Co-op Translator](https://github.com/Azure/co-op-translator). Sebbene ci impegniamo per garantire l'accuratezza, si prega di notare che le traduzioni automatiche potrebbero contenere errori o imprecisioni. Il documento originale nella sua lingua nativa dovrebbe essere considerato la fonte autorevole. Per informazioni critiche, si consiglia una traduzione professionale eseguita da un traduttore umano. Non siamo responsabili per eventuali fraintendimenti o interpretazioni errate derivanti dall'uso di questa traduzione.
| ](../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|관계 시각화 - _스케치노트 by [@nitya](https://twitter.com/nitya)_ |
|관계 시각화 - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
자연에 초점을 맞춘 연구를 계속하면서, [미국 농무부](https://www.nass.usda.gov/About_NASS/index.php)에서 제공한 데이터셋을 기반으로 다양한 종류의 꿀 사이의 관계를 보여주는 흥미로운 시각화를 살펴보겠습니다.
자연을 중심으로 한 연구를 계속하며, 다양한 꿀 종류 간의 관계를 보여주는 흥미로운 시각화를 탐구해 봅시다. 이 데이터셋은 [미국 농무부](https://www.nass.usda.gov/About_NASS/index.php)에서 제공된 자료를 기반으로 합니다.
약 600개의 항목으로 구성된 이 데이터셋은 미국 여러 주에서의 꿀 생산량을 보여줍니다. 예를 들어, 1998년부터 2012년까지 각 주별로 연도별로 한 행씩, 꿀벌 군집 수, 군집당 수확량, 총 생산량, 재고, 파운드당 가격, 그리고 생산된 꿀의 가치를 확인할 수 있습니다.
약 600개의 항목으로 구성된 이 데이터셋은 미국 여러 주에서의 꿀 생산을 보여줍니다. 예를 들어, 주별로 꿀벌 군집 수, 군집당 생산량, 총 생산량, 재고, 파운드당 가격, 그리고 1998년부터 2012년까지 각 주에서 생산된 꿀의 가치를 연도별로 확인할 수 있습니다.
특정 주의 연도별 생산량과 해당 주의 꿀 가격 간의 관계를 시각화하는 것도 흥미로울 것입니다. 또는 주별 군집당 꿀 수확량 간의 관계를 시각화할 수도 있습니다. 이 데이터는 2006년에 처음 관찰된 '꿀벌 군집 붕괴 현상(CCD)'(http://npic.orst.edu/envir/ccd.html)을 포함하는 기간을 다루고 있어 연구하기에 의미 있는 데이터셋입니다. 🐝
특정 주의 연간 생산량과 해당 주의 꿀 가격 간의 관계를 시각화하면 흥미로울 것입니다. 또는 주별 꿀벌 군집당 생산량 간의 관계를 시각화할 수도 있습니다. 이 기간은 2006년에 처음 발생한 '꿀벌 군집 붕괴 현상(CCD)'(http://npic.orst.edu/envir/ccd.html)을 포함하므로, 연구하기에 의미 있는 데이터셋입니다. 🐝
## [강의 전 퀴즈](https://ff-quizzes.netlify.app/en/ds/quiz/22)
이번 강의에서는 이전에 사용했던 Seaborn 라이브러리를 활용하여 변수 간의 관계를 시각화할 수 있습니다. 특히 Seaborn의 `relplot` 함수는 산점도와 선 그래프를 빠르게 생성하여 '[통계적 관계](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)'를 시각화하는 데 유용합니다. 이를 통해 데이터 과학자는 변수 간의 관계를 더 잘 이해할 수 있습니다.
이번 강의에서는 이전에 사용했던 Seaborn 라이브러리를 활용하여 변수 간의 관계를 시각화할 수 있습니다. 특히 Seaborn의 `relplot` 함수는 산점도와 선 그래프를 사용하여 '[통계적 관계](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)'를 빠르게 시각화할 수 있어 데이터 과학자가 변수 간의 관계를 더 잘 이해할 수 있도록 돕습니다.
## 산점도
산점도를 사용하여 주별로 연도별 꿀 가격이 어떻게 변화했는지 보여줍니다. Seaborn의 `relplot`을 사용하면 주 데이터를 그룹화하고 범주형 및 수치형 데이터를 모두 표시할 수 있습니다.
산점도를 사용하여 주별로 꿀 가격이 연도별로 어떻게 변화했는지 보여주세요. Seaborn의 `relplot`을 사용하면 주 데이터를 그룹화하고 범주형 및 숫자형 데이터를 모두 표시할 수 있습니다.
먼저 데이터를 가져오고 Seaborn을 불러옵니다:
먼저 데이터를 가져오고 Seaborn을 가져옵니다:
```python
import pandas as pd
@ -36,7 +36,7 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
꿀 데이터에는 연도와 파운드당 가격을 포함하여 여러 흥미로운 열이 있습니다. 이를 미국 주별로 그룹화하여 살펴보겠습니다:
꿀 데이터에는 연도와 파운드당 가격을 포함하여 여러 흥미로운 열이 있습니다. 이를 미국 주별로 그룹화하여 탐색해 봅시다:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
✅ Seaborn은 각 x 값에서 여러 측정을 평균으로 플로팅하고 평균 주위에 95% 신뢰 구간을 표시합니다. [출처](https://seaborn.pydata.org/tutorial/relational.html). 이 시간 소모적인 동작은 `ci=None`을 추가하여 비활성화할 수 있습니다.
✅ Seaborn은 데이터를 하나의 선으로 집계하며, "각 x 값에서 여러 측정을 평균과 평균 주변의 95% 신뢰 구간을 표시하여 플로팅합니다". [출처](https://seaborn.pydata.org/tutorial/relational.html). 이 시간 소모적인 동작은 `ci=None`을 추가하여 비활성화할 수 있습니다.
질문: 그렇다면 2003년에 꿀 공급량에서도 급증이 보이나요? 연도별 총 생산량을 살펴보면 어떨까요?
질문: 그렇다면 2003년에는 꿀 공급량에서도 급증이 있었나요? 연도별 총 생산량을 살펴보면 어떨까요?
답변: 꼭 그렇지는 않습니다. 총 생산량을 보면, 특정 연도에는 실제로 증가한 것으로 보이지만, 전반적으로는 이 기간 동안 꿀 생산량이 감소하고 있는 것으로 보입니다.
답변: 그렇지 않습니다. 총 생산량을 보면, 특정 연도에는 실제로 증가한 것으로 보이지만, 일반적으로 꿀 생산량은 이 기간 동안 감소하는 추세입니다.
질문: 그렇다면 2003년 꿀 가격 급등의 원인은 무엇일까요?
이를 알아보기 위해 Facet Grid를 탐색해 봅시다.
이를 알아내기 위해 Facet Grid를 탐구해 봅시다.
## Facet Grid
Facet Grid는 데이터셋의 한 측면(예: '연도')을 선택하여 각 x, y 좌표에 대해 더 쉽게 비교할 수 있도록 플롯을 생성합니다. 2003년이 이 비교에서 두드러지게 나타날까요?
Facet Grid는 데이터셋의 한 측면(예: '연도')을 선택하여 너무 많은 Facet이 생성되지 않도록 합니다. Seaborn은 선택한 x 및 y 좌표에 대해 각 Facet에 대해 플롯을 생성하여 비교를 쉽게 할 수 있습니다. 2003년이 이 비교에서 두드러지게 나타날까요?
Seaborn의 [문서](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid)를 참고하여 `relplot`을 계속 사용하여 Facet Grid를 생성합니다.
Seaborn의 [문서](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid)를 참고하여 `relplot`을 계속 사용하여 Facet Grid를 생성하세요.
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
이 시각화에서는 연도별로 군집당 수확량과 군집 수를 나란히 비교할 수 있습니다. 열은 3으로 설정하여 랩을 적용합니다:
이 시각화에서는 꿀벌 군집당 생산량과 꿀벌 군집 수를 연도별로 나란히 비교할 수 있으며, 열을 3으로 설정하여 랩을 적용합니다:
이 데이터셋에서는 연도별, 주별 군집 수와 수확량에 관해 특별히 두드러지는 점은 없습니다. 이 두 변수 간의 상관관계를 찾는 다른 방법이 있을까요?
이 데이터셋에서는 연도별, 주별 꿀벌 군집 수와 생산량에 관해 특별히 두드러지는 점은 없습니다. 이 두 변수 간의 상관관계를 찾는 다른 방법이 있을까요?
## 이중 선 그래프
Seaborn의 'despine'을 사용하여 상단과 오른쪽 축을 제거하고, Matplotlib에서 제공하는 `ax.twinx`를 사용하여 두 개의 선 그래프를 겹쳐 그려보세요. Twinx는 x축을 공유하고 두 개의 y축을 표시할 수 있습니다. 따라서 군집당 수확량과 군집 수를 겹쳐서 표시합니다:
Seaborn의 'despine'을 사용하여 상단 및 오른쪽 축을 제거하고, Matplotlib에서 제공하는 `ax.twinx`를 사용하여 두 개의 선 그래프를 겹쳐 보세요. Twinx는 x 축을 공유하고 두 개의 y 축을 표시할 수 있습니다. 꿀벌 군집당 생산량과 꿀벌 군집 수를 겹쳐서 표시하세요:
2003년을 전후로 눈에 띄는 점은 없지만, 이 강의를 조금 더 긍정적인 분위기로 마무리할 수 있습니다: 군집 수는 전반적으로 감소하고 있지만, 군집 수는 안정화되고 있으며 군집당 수확량은 감소하고 있습니다.
2003년을 중심으로 눈에 띄는 점은 없지만, 이 강의를 조금 더 긍정적인 노트로 마무리할 수 있습니다: 꿀벌 군집 수는 전반적으로 감소하고 있지만, 군집 수는 안정화되고 있으며 군집당 생산량은 감소하고 있습니다.
꿀벌들, 힘내라!
힘내라, 꿀벌들!
🐝❤️
## 🚀 도전 과제
이번 강의에서는 산점도와 선 그래프, Facet Grid의 다양한 활용법에 대해 배웠습니다. 이전 강의에서 사용했던 다른 데이터셋을 활용하여 Facet Grid를 생성해 보세요. 생성하는 데 걸리는 시간과 그리드 수를 신중히 고려해야 함을 유의하세요.
이번 강의에서는 산점도와 선 그래프, Facet Grid를 포함한 다양한 시각화 방법에 대해 배웠습니다. 이전 강의에서 사용했던 다른 데이터셋을 사용하여 Facet Grid를 생성해 보세요. 이를 생성하는 데 걸리는 시간과 그리드 수를 조정해야 하는 점에 주의하세요.
## [강의 후 퀴즈](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## 복습 및 자기 학습
선 그래프는 단순하거나 매우 복잡할 수 있습니다. [Seaborn 문서](https://seaborn.pydata.org/generated/seaborn.lineplot.html)를 읽으며 선 그래프를 구성하는 다양한 방법을 학습하세요. 이번 강의에서 만든 선 그래프를 문서에 나와 있는 다른 방법으로 개선해 보세요.
선 그래프는 간단하거나 매우 복잡할 수 있습니다. [Seaborn 문서](https://seaborn.pydata.org/generated/seaborn.lineplot.html)를 읽으며 선 그래프를 구축하는 다양한 방법에 대해 알아보세요. 이번 강의에서 만든 선 그래프를 문서에 나와 있는 다른 방법으로 개선해 보세요.
## 과제
[벌집 속으로 뛰어들기](assignment.md)
[꿀벌의 세계로 뛰어들기](assignment.md)
---
**면책 조항**:
이 문서는 AI 번역 서비스 [Co-op Translator](https://github.com/Azure/co-op-translator)를 사용하여 번역되었습니다. 정확성을 위해 최선을 다하고 있지만, 자동 번역에는 오류나 부정확성이 포함될 수 있습니다. 원본 문서의 원어 버전을 권위 있는 출처로 간주해야 합니다. 중요한 정보의 경우, 전문적인 인간 번역을 권장합니다. 이 번역 사용으로 인해 발생하는 오해나 잘못된 해석에 대해 책임을 지지 않습니다.
이 문서는 AI 번역 서비스 [Co-op Translator](https://github.com/Azure/co-op-translator)를 사용하여 번역되었습니다. 정확성을 위해 최선을 다하고 있으나, 자동 번역에는 오류나 부정확성이 포함될 수 있습니다. 원본 문서를 해당 언어로 작성된 상태에서 권위 있는 자료로 간주해야 합니다. 중요한 정보의 경우, 전문적인 인간 번역을 권장합니다. 이 번역 사용으로 인해 발생하는 오해나 잘못된 해석에 대해 당사는 책임을 지지 않습니다.
|Ryšių vizualizavimas - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
Tęsdami mūsų tyrimų dėmesį į gamtą, atraskime įdomius vizualizacijos būdus, kaip parodyti ryšius tarp įvairių medaus rūšių, remiantis duomenų rinkiniu, gautu iš [JAV Žemės ūkio departamento](https://www.nass.usda.gov/About_NASS/index.php).
Tęsdami gamtos tematiką mūsų tyrimuose, atraskime įdomius būdus vizualizuoti ryšius tarp įvairių medaus rūšių, remdamiesi duomenų rinkiniu, gautu iš [JAV Žemės ūkio departamento](https://www.nass.usda.gov/About_NASS/index.php).
Šis duomenų rinkinys, turintis apie 600 elementų, rodo medaus gamybą daugelyje JAV valstijų. Pavyzdžiui, galite peržiūrėti kolonijų skaičių, derlių vienai kolonijai, bendrą gamybą, atsargas, kainą už svarą ir medaus vertę tam tikroje valstijoje nuo 1998 iki 2012 metų, su viena eilute per metus kiekvienai valstijai.
Šis maždaug 600 įrašų duomenų rinkinys rodo medaus gamybą įvairiose JAV valstijose. Pavyzdžiui, galite analizuoti kolonijų skaičių, derlių vienai kolonijai, bendrą gamybą, atsargas, kainą už svarą ir medaus vertę tam tikroje valstijoje nuo 1998 iki 2012 metų, kur kiekviena eilutė atitinka vienerius metus kiekvienoje valstijoje.
Būtų įdomu vizualizuoti ryšį tarp tam tikros valstijos gamybos per metus ir, pavyzdžiui, medaus kainos toje valstijoje. Arba galite vizualizuoti ryšį tarp valstijų medaus derliaus vienai kolonijai. Šis laikotarpis apima niokojantį „CCD“ arba „Kolonijų žlugimo sutrikimą“, pirmą kartą pastebėtą 2006 m. (http://npic.orst.edu/envir/ccd.html), todėl tai yra prasmingas duomenų rinkinys tyrimui. 🐝
Būtų įdomu vizualizuoti ryšį tarp tam tikros valstijos metinės gamybos ir, pavyzdžiui, medaus kainos toje valstijoje. Arba galite vizualizuoti ryšį tarp valstijų medaus derliaus vienai kolonijai. Šis laikotarpis apima niokojantį „kolonijų žlugimo sutrikimą“ (angl. Colony Collapse Disorder, CCD), pirmą kartą pastebėtą 2006 m. (http://npic.orst.edu/envir/ccd.html), todėl tai yra prasmingas duomenų rinkinys tyrimui. 🐝
Šioje pamokoje galite naudoti Seaborn, kurį jau naudojote anksčiau, kaip puikią biblioteką vizualizuoti ryšius tarp kintamųjų. Ypač įdomi yra Seaborn funkcija `relplot`, kuri leidžia greitai kurti sklaidos diagramas ir linijines diagramas, vizualizuojant '[statistinius ryšius](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', padedančius duomenų mokslininkui geriau suprasti, kaip kintamieji tarpusavyje susiję.
Šioje pamokoje galite naudoti Seaborn biblioteką, kurią jau naudojote anksčiau, kaip puikų įrankį vizualizuoti ryšius tarp kintamųjų. Ypač įdomi yra Seaborn funkcija `relplot`, leidžianti greitai kurti sklaidos diagramas ir linijines diagramas, skirtas '[statistiniams ryšiams](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' vizualizuoti. Tai padeda duomenų mokslininkams geriau suprasti, kaip kintamieji yra susiję tarpusavyje.
## Sklaidos diagramos
Naudokite sklaidos diagramą, kad parodytumėte, kaip medaus kaina keitėsi metai iš metų, kiekvienoje valstijoje. Seaborn, naudodamas `relplot`, patogiai grupuoja valstijų duomenis ir rodo duomenų taškus tiek kategoriniams, tiek skaitiniams duomenims.
Naudokite sklaidos diagramą, kad parodytumėte, kaip medaus kaina keitėsi metai iš metų kiekvienoje valstijoje. Seaborn, naudodamas `relplot`, patogiai grupuoja valstijų duomenis ir rodo duomenų taškus tiek kategoriniams, tiek skaitiniams duomenims.
Pradėkime importuodami duomenis ir Seaborn:
@ -38,93 +38,93 @@ honey.head()
```
Pastebėsite, kad medaus duomenyse yra keletas įdomių stulpelių, įskaitant metus ir kainą už svarą. Išnagrinėkime šiuos duomenis, suskirstytus pagal JAV valstijas:
| valstija | kolonijų skaičius | derlius vienai kolonijai | bendra gamyba | atsargos | kaina už svarą | gamybos vertė | metai |
Sukurkite paprastą sklaidos diagramą, kad parodytumėte ryšį tarp medaus kainos už svarą ir jo kilmės valstijos. Padarykite `y` ašį pakankamai aukštą, kad būtų matomos visos valstijos:


Dabar parodykite tuos pačius duomenis su medaus spalvų schema, kad pavaizduotumėte, kaip kaina keičiasi metai iš metų. Tai galite padaryti pridėdami 'hue' parametrą, kuris parodys pokyčius per metus:
Dabar parodykite tuos pačius duomenis su medaus spalvų schema, kad pavaizduotumėte, kaip kaina keitėsi per metus. Tai galite padaryti pridėdami 'hue' parametrą, kuris parodys pokyčius metai iš metų:
> ✅ Sužinokite daugiau apie [spalvų paletes, kurias galite naudoti Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - išbandykite gražią vaivorykštės spalvų schemą!

Su šiuo spalvų schemos pakeitimu galite pastebėti, kad per metus medaus kaina už svarą akivaizdžiai kyla. Iš tiesų, jei pažiūrėsite į duomenų pavyzdį, kad patikrintumėte (pasirinkite tam tikrą valstiją, pavyzdžiui, Arizoną), galite pastebėti kainų kilimo modelį metai iš metų, su keliomis išimtimis:
| valstija | kolonijų skaičius | derlius vienai kolonijai | bendra gamyba | atsargos | kaina už svarą | gamybos vertė | metai |
Kitas būdas vizualizuoti šį progresą yra naudoti dydį, o ne spalvą. Spalvų aklumo turintiems vartotojams tai gali būti geresnis pasirinkimas. Redaguokite savo vizualizaciją, kad parodytumėte kainos didėjimą, didinant taško apskritimo dydį:

Naudodami šią spalvų schemą, galite pastebėti, kad medaus kaina už svarą akivaizdžiai didėja metai iš metų. Iš tiesų, jei patikrinsite duomenų pavyzdį (pavyzdžiui, Arizonos valstiją), galite pastebėti kainų didėjimo tendenciją su keliomis išimtimis:
| valstija | kolonijų skaičius | derlius vienai kolonijai | bendra gamyba | atsargos | kaina už svarą | gamybos vertė | metai |
Kitas būdas vizualizuoti šį progresą yra naudoti dydį, o ne spalvą. Spalvų neskiriantiems vartotojams tai gali būti geresnis pasirinkimas. Redaguokite savo vizualizaciją, kad kainos didėjimas būtų parodytas didėjančiu taško apskritimu:
Galite pastebėti, kad taškų dydis palaipsniui didėja.
Galite pastebėti, kaip taškų dydis palaipsniui didėja.


Ar tai paprastas pasiūlos ir paklausos atvejis? Dėl tokių veiksnių kaip klimato kaita ir kolonijų žlugimas, ar medaus kiekis, kurį galima įsigyti, mažėja metai iš metų, todėl kaina kyla?
Ar tai paprastas pasiūlos ir paklausos atvejis? Dėl tokių veiksnių kaip klimato kaita ir kolonijų žlugimas, ar metai iš metų mažėja medaus pasiūla, todėl kaina kyla?
Norėdami atrasti koreliaciją tarp kai kurių šio duomenų rinkinio kintamųjų, panagrinėkime keletą linijinių diagramų.
## Linijinės diagramos
Klausimas: Ar yra aiškus medaus kainos už svarą kilimas metai iš metų? Tai galite lengviausiai atrasti sukurdami vieną linijinę diagramą:
Klausimas: Ar yra aiškus medaus kainos už svarą kilimas metai iš metų? Tai galite lengviausiai pastebėti sukurdami vieną linijinę diagramą:
Atsakymas: Taip, su kai kuriomis išimtimis apie 2003 metus:
Atsakymas: Taip, su keliomis išimtimis apie 2003 metus:


✅ Kadangi Seaborn agreguoja duomenis aplink vieną liniją, jis rodo „kelis matavimus kiekvienoje x reikšmėje, braižydamas vidurkį ir 95% pasitikėjimo intervalą aplink vidurkį“. [Šaltinis](https://seaborn.pydata.org/tutorial/relational.html). Šį laiko reikalaujantį elgesį galima išjungti pridėjus `ci=None`.
✅ Kadangi Seaborn agreguoja duomenis aplink vieną liniją, jis rodo „kelis matavimus kiekvienoje x reikšmėje, braižydamas vidurkį ir 95% pasitikėjimo intervalą aplink vidurkį“. [Šaltinis](https://seaborn.pydata.org/tutorial/relational.html). Šį laikui imlų veiksmą galima išjungti pridėjus `ci=None`.
Klausimas: Na, o 2003 metais, ar galime pastebėti medaus pasiūlos šuolį? Ką, jei pažvelgtumėte į bendrą gamybą metai iš metų?
Klausimas: Na, o 2003 metais, ar taip pat matome medaus pasiūlos šuolį? Ką, jei pažvelgtume į bendrą gamybą metai iš metų?


Atsakymas: Ne visai. Jei pažvelgsite į bendrą gamybą, atrodo, kad ji iš tikrųjų padidėjo tais metais, nors apskritai medaus gamybos kiekis mažėja per šiuos metus.
Atsakymas: Ne visai. Jei pažvelgsite į bendrą gamybą, ji iš tikrųjų atrodo padidėjusi tais metais, nors apskritai medaus gamyba mažėja per šiuos metus.
Klausimas: Tokiu atveju, kas galėjo sukelti medaus kainos šuolį apie 2003 metus?
Norėdami tai atrasti, galite naudoti facet grid.
Norėdami tai išsiaiškinti, galite naudoti facet grid.
## Facet grid
Facet grid leidžia pasirinkti vieną jūsų duomenų rinkinio aspektą (mūsų atveju galite pasirinkti 'metus', kad išvengtumėte per daug facetų). Tada Seaborn gali sukurti diagramą kiekvienam iš šių aspektų, pasirinktų x ir y koordinačių, kad būtų lengviau palyginti. Ar 2003 metai išsiskiria tokio tipo palyginime?
Facet grid leidžia pasirinkti vieną jūsų duomenų rinkinio aspektą (mūsų atveju galite pasirinkti 'metus', kad būtų išvengta per daug facetų). Seaborn tada gali sukurti diagramą kiekvienam iš šių aspektų, naudojant pasirinktus x ir y koordinates, kad būtų lengviau palyginti. Ar 2003 metai išsiskiria tokiame palyginime?
Sukurkite facet grid, toliau naudodami `relplot`, kaip rekomenduoja [Seaborn dokumentacija](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Šioje vizualizacijoje galite palyginti derlių vienai kolonijai ir kolonijų skaičių metai iš metų, šalia vienas kito, su wrap nustatytu 3 stulpeliams:
Šiam duomenų rinkiniui niekas ypatingai neišsiskiria, kalbant apie kolonijų skaičių ir jų derlių, metai iš metų ir valstija po valstijos. Ar yra kitoks būdas ieškoti koreliacijos tarp šių dviejų kintamųjų?
Šiame duomenų rinkinyje niekas ypatingai neišsiskiria, kalbant apie kolonijų skaičių ir jų derlių metai iš metų bei valstija iš valstijos. Ar yra kitas būdas ieškoti koreliacijos tarp šių dviejų kintamųjų?
## Dvigubos linijos diagramos
## Dvigubos linijinės diagramos
Išbandykite daugiagubą linijinę diagramą, uždėdami dvi linijines diagramas viena ant kitos, naudodami Seaborn 'despine', kad pašalintumėte jų viršutines ir dešines linijas, ir naudodami `ax.twinx` [gautą iš Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx leidžia diagramai dalintis x ašimi ir rodyti dvi y ašis. Taigi, parodykite derlių vienai kolonijai ir kolonijų skaičių, uždėtus vienas ant kito:
Išbandykite daugiagubą linijinę diagramą, uždėdami dvi linijines diagramas vieną ant kitos, naudodami Seaborn funkciją 'despine', kad pašalintumėte viršutines ir dešines ašis, ir naudodami `ax.twinx` [iš Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx leidžia diagramai dalintis x ašimi ir rodyti dvi y ašis. Taigi, parodykite derlių vienai kolonijai ir kolonijų skaičių, uždėtus vieną ant kito:
Nors niekas akivaizdžiai neišsiskiria apie 2003 metus, tai leidžia mums užbaigti šią pamoką šiek tiek laimingesne nata: nors kolonijų skaičius apskritai mažėja, kolonijų skaičius stabilizuojasi, net jei jų derlius vienai kolonijai mažėja.
Nors niekas akivaizdžiai neišsiskiria apie 2003 metus, tai leidžia mums užbaigti šią pamoką šiek tiek linksmesne nata: nors kolonijų skaičius apskritai mažėja, jų skaičius stabilizuojasi, net jei derlius vienai kolonijai mažėja.
Pirmyn, bitės, pirmyn!
🐝❤️
## 🚀 Iššūkis
Šioje pamokoje sužinojote šiek tiek daugiau apie kitus sklaidos diagramų ir linijinių tinklų naudojimo būdus, įskaitant facet grid. Išbandykite save, sukurdami facet grid naudodami kitą duomenų rinkinį, galbūt tą, kurį naudojote prieš šias pamokas. Atkreipkite dėmesį, kiek laiko jie užtrunka ir kaip reikia būti atsargiems dėl to, kiek tinklų reikia piešti naudojant šiuos metodus.
Šioje pamokoje sužinojote daugiau apie sklaidos diagramų ir linijinių tinklų, įskaitant facet grid, naudojimą. Iššūkis sau: sukurkite facet grid naudodami kitą duomenų rinkinį, galbūt tą, kurį naudojote prieš šias pamokas. Atkreipkite dėmesį, kiek laiko užtrunka jų kūrimas ir kaip reikia būti atsargiems dėl to, kiek tinklų reikia piešti naudojant šiuos metodus.
Linijinės diagramos gali būti paprastos arba gana sudėtingos. Šiek tiek paskaitykite [Seaborn dokumentacijoje](https://seaborn.pydata.org/generated/seaborn.lineplot.html) apie įvairius būdus, kaip jas kurti. Pabandykite patobulinti linijines diagramas, kurias sukūrėte šioje pamokoje, naudodami kitus metodus, išvardytus dokumentacijoje.
Linijinės diagramos gali būti paprastos arba gana sudėtingos. Šiek tiek pasiskaitykite [Seaborn dokumentacijoje](https://seaborn.pydata.org/generated/seaborn.lineplot.html) apie įvairius būdus, kaip jas kurti. Pabandykite patobulinti linijines diagramas, kurias sukūrėte šioje pamokoje, naudodami kitus metodus, išvardytus dokumentacijoje.
## Užduotis
[Pasinerkite į avilį](assignment.md)
@ -184,4 +186,4 @@ Linijinės diagramos gali būti paprastos arba gana sudėtingos. Šiek tiek pasi
---
**Atsakomybės apribojimas**:
Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors siekiame tikslumo, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama naudoti profesionalų žmogaus vertimą. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus interpretavimus, atsiradusius dėl šio vertimo naudojimo.
Šis dokumentas buvo išverstas naudojant dirbtinio intelekto vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors siekiame tikslumo, atkreipiame dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama naudotis profesionalių vertėjų paslaugomis. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus aiškinimus, kylančius dėl šio vertimo naudojimo.
आपल्या संशोधनाच्या निसर्ग-केंद्रित दृष्टिकोनाला पुढे नेत, विविध प्रकारच्या मधामधील नातेसंबंध दाखवण्यासाठी काही मनोरंजक दृश्यांकन शोधूया, जे [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php) कडून मिळालेल्या डेटासेटवर आधारित आहे.
सुमारे 600 आयटम्सचा हा डेटासेट अनेक अमेरिकन राज्यांमधील मध उत्पादन दाखवतो. उदाहरणार्थ, तुम्ही 1998-2012 दरम्यान प्रत्येक राज्यासाठी एका वर्षाच्या डेटावर आधारित, मधाच्या वसाहतींची संख्या, प्रति वसाहती उत्पादन, एकूण उत्पादन, साठा, प्रति पाउंड किंमत, आणि त्या राज्यात तयार झालेल्या मधाची किंमत पाहू शकता.
सुमारे 600 आयटम्सचा हा डेटासेट अनेक अमेरिकन राज्यांमधील मध उत्पादन दाखवतो. उदाहरणार्थ, तुम्ही एखाद्या राज्यातील 1998-2012 दरम्यानच्या वर्षानुसार मध उत्पादन, मधाच्या किंमती, मधाच्या मूल्य, मधाच्या साठा, मधाच्या वसाहतींची संख्या, आणि प्रति वसाहती उत्पादन यावर आधारित डेटा पाहू शकता.
एखाद्या राज्याच्या वार्षिक उत्पादन आणि त्या राज्यातील मधाच्या किंमतीमधील नातेसंबंधाचे दृश्यांकन करणे मनोरंजक ठरेल. पर्यायाने, तुम्ही राज्यांमधील प्रति वसाहती मध उत्पादनाचे नातेसंबंध देखील दाखवू शकता. या वर्षांच्या कालावधीत 2006 मध्ये प्रथम दिसलेला 'CCD' किंवा 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) समाविष्ट आहे, त्यामुळे हा अभ्यास करण्यासाठी एक महत्त्वपूर्ण डेटासेट आहे. 🐝
एखाद्या राज्याच्या वार्षिक उत्पादन आणि त्या राज्यातील मधाच्या किंमतीमधील नातेसंबंधाचे दृश्यांकन करणे मनोरंजक ठरेल. किंवा, तुम्ही राज्यांमधील प्रति वसाहती मध उत्पादनाचे नातेसंबंध दाखवू शकता. या कालावधीत 2006 मध्ये प्रथम दिसलेला 'CCD' किंवा 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) चा प्रभाव आहे, त्यामुळे हा डेटासेट अभ्यास करण्यासाठी महत्त्वाचा आहे. 🐝
या धड्यात, तुम्ही Seaborn वापरू शकता, ज्याचा तुम्ही यापूर्वी वापर केला आहे, जो व्हेरिएबल्समधील नातेसंबंधांचे दृश्यांकन करण्यासाठी एक चांगले लायब्ररी आहे. विशेषतः Seaborn च्या `relplot` फंक्शनचा वापर, ज्यामुळे स्कॅटर प्लॉट्स आणि लाइन प्लॉट्सद्वारे '[statistical relationships](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' पटकन दाखवता येतात, डेटा सायंटिस्टला व्हेरिएबल्समधील नातेसंबंध अधिक चांगल्या प्रकारे समजून घेण्यास मदत होते.
या धड्यात, तुम्ही Seaborn वापरू शकता, ज्याचा तुम्ही यापूर्वी वापर केला आहे, जो व्हेरिएबल्समधील नातेसंबंधांचे दृश्यांकन करण्यासाठी एक चांगले लायब्ररी आहे. विशेषतः Seaborn च्या `relplot` फंक्शनचा वापर, ज्यामुळे स्कॅटर प्लॉट्स आणि लाइन प्लॉट्सद्वारे '[statistical relationships](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' लवकर दाखवता येतात, डेटा सायंटिस्टला व्हेरिएबल्समधील नातेसंबंध अधिक चांगल्या प्रकारे समजून घेण्यास मदत होते.
## स्कॅटरप्लॉट्स
मधाच्या किंमतीने वर्षानुवर्षे, प्रत्येक राज्यासाठी कसा बदल केला आहे हे दाखवण्यासाठी स्कॅटरप्लॉट वापरा. Seaborn चा `relplot` वापरून, राज्य डेटा गटबद्ध करून श्रेणीसंबंधित आणि संख्यात्मक डेटा दोन्ही प्रकारासाठी डेटा पॉइंट्स दाखवतो.
मधाच्या किंमतीने वर्षानुवर्षे, राज्यानुसार कसा बदल केला आहे हे दाखवण्यासाठी स्कॅटरप्लॉट वापरा. Seaborn च्या `relplot` चा वापर करून, राज्य डेटा गटबद्ध करून श्रेणीसंबंधी आणि संख्यात्मक डेटा दोन्ही दाखवतो.
चला डेटा आणि Seaborn आयात करून सुरुवात करूया:
@ -36,7 +36,7 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
तुम्हाला लक्षात येईल की मधाच्या डेटामध्ये वर्ष आणि प्रति पाउंड किंमत यासह अनेक मनोरंजक कॉलम्स आहेत. चला हा डेटा, अमेरिकन राज्यांनुसार गटबद्ध करून, एक्सप्लोर करूया:
तुम्हाला लक्षात येईल की मधाच्या डेटामध्ये वर्ष आणि प्रति पाउंड किंमत यासारख्या अनेक मनोरंजक कॉलम्स आहेत. चला हा डेटा, अमेरिकन राज्यांनुसार गटबद्ध करून एक्सप्लोर करूया:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
प्रति पाउंड मधाच्या किंमती आणि त्याच्या अमेरिकन राज्याच्या मूळमधील नातेसंबंध दाखवण्यासाठी एक मूलभूत स्कॅटरप्लॉट तयार करा. `y` अक्ष पुरेसा उंच ठेवा जेणेकरून सर्व राज्ये दिसतील:
मधाच्या प्रति पाउंड किंमती आणि त्याच्या मूळ राज्यामधील नातेसंबंध दाखवण्यासाठी एक साधा स्कॅटरप्लॉट तयार करा. `y` अक्ष इतका उंच ठेवा की सर्व राज्ये दिसतील:
आता, मधाच्या रंगसंगतीसह वर्षानुवर्षे किंमत कशी बदलते हे दाखवा. तुम्ही 'hue' पॅरामीटर जोडून वर्षानुवर्षे बदल दाखवू शकता:
आता, मधाच्या रंगसंगतीसह वर्षानुवर्षे किंमत कशी बदलते हे दाखवा. तुम्ही 'hue' पॅरामीटर जोडून वर्षानुसार बदल दाखवू शकता:
> ✅ Seaborn मध्ये वापरता येणाऱ्या [रंग पॅलेट्सबद्दल अधिक जाणून घ्या](https://seaborn.pydata.org/tutorial/color_palettes.html) - सुंदर इंद्रधनुष्य रंगसंगती वापरून पहा!
या रंगसंगती बदलासह, तुम्हाला स्पष्टपणे दिसते की मधाच्या प्रति पाउंड किंमतीत वर्षानुवर्षे मजबूत प्रगती आहे. खरंच, जर तुम्ही डेटामधील नमुना सेट तपासला (उदाहरणार्थ, एरिझोना राज्य निवडा) तर तुम्हाला किंमतीत वर्षानुवर्षे वाढीचा नमुना दिसतो, काही अपवादांसह:
या रंगसंगती बदलासह, तुम्हाला स्पष्टपणे दिसते की मधाच्या प्रति पाउंड किंमतीत वर्षानुवर्षे मजबूत प्रगती आहे. खरंच, जर तुम्ही डेटामधील नमुना सेट तपासला (उदाहरणार्थ, एरिझोना राज्य निवडा) तर तुम्हाला किंमतीत वर्षानुवर्षे वाढ होण्याचा नमुना दिसतो, काही अपवाद वगळता:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
दृष्टीदोष असलेल्या वापरकर्त्यांसाठी, रंगाऐवजी आकार वापरणे हा एक चांगला पर्याय असू शकतो. किंमतीत वाढ दाखवण्यासाठी डॉट्सच्या परिघात वाढ दाखवण्यासाठी तुमचे दृश्यांकन संपादित करा:
दुसऱ्या प्रकारे, रंगाऐवजी आकार वापरून ही प्रगती दाखवा. रंगांधळ्या वापरकर्त्यांसाठी, हा पर्याय अधिक चांगला ठरू शकतो. किंमतीत वाढ दाखवण्यासाठी डॉट्सच्या परिघात वाढ दाखवण्यासाठी तुमचे दृश्यांकन संपादित करा:
हे साध्या पुरवठा आणि मागणीचे प्रकरण आहे का? हवामान बदल आणि वसाहतींचा नाश यासारख्या घटकांमुळे, वर्षानुवर्षे खरेदीसाठी कमी मध उपलब्ध आहे का, आणि त्यामुळे किंमत वाढते?
हे साध्या पुरवठा आणि मागणीचे प्रकरण आहे का? हवामान बदल आणि वसाहतींचा नाश यासारख्या घटकांमुळे, वर्षानुवर्षे खरेदीसाठी कमी मध उपलब्ध आहे का, आणि त्यामुळे किंमती वाढत आहेत?
या डेटासेटमधील काही व्हेरिएबल्समधील सहसंबंध शोधण्यासाठी, चला काही लाइन चार्ट्स एक्सप्लोर करूया.
या डेटासेटमधील काही व्हेरिएबल्समधील नातेसंबंध शोधण्यासाठी, चला काही लाइन चार्ट्स एक्सप्लोर करूया.
## लाइन चार्ट्स
प्रश्न: मधाच्या प्रति पाउंड किंमतीत वर्षानुवर्षे स्पष्ट वाढ आहे का? तुम्ही एकच लाइन चार्ट तयार करून ते सहज शोधू शकता:
प्रश्न: मधाच्या प्रति पाउंड किंमतीत वर्षानुवर्षे स्पष्ट वाढ आहे का? तुम्ही एकच लाइन चार्ट तयार करून हे सहज शोधू शकता:
✅ कारण Seaborn एकाच रेषेभोवती डेटा एकत्रित करत आहे, तो "प्रत्येक x मूल्यावर एकाधिक मोजमापांचे सरासरी आणि सरासरीभोवती 95% विश्वास अंतर" प्लॉट करून दाखवतो. [Source](https://seaborn.pydata.org/tutorial/relational.html). ही वेळखाऊ प्रक्रिया `ci=None` जोडून अक्षम केली जाऊ शकते.
✅ कारण Seaborn डेटा एका रेषेभोवती एकत्रित करत आहे, तो "प्रत्येक x मूल्यावर एकाधिक मोजमापांचे सरासरी आणि सरासरीभोवती 95% विश्वास अंतर प्लॉट करून" दाखवतो. [Source](https://seaborn.pydata.org/tutorial/relational.html). ही वेळखाऊ प्रक्रिया `ci=None` जोडून अक्षम केली जाऊ शकते.
प्रश्न: बरं, 2003 मध्ये मधाच्या पुरवठ्यातही वाढ दिसते का? जर तुम्ही वर्षानुवर्षे एकूण उत्पादन पाहिले तर काय?
प्रश्न: बरं, 2003 मध्ये मध पुरवठ्यातही वाढ दिसते का? जर तुम्ही वर्षानुवर्षे एकूण उत्पादन पाहिले तर काय?
उत्तर: खरं तर नाही. जर तुम्ही एकूण उत्पादन पाहिले तर, त्या विशिष्ट वर्षात ते प्रत्यक्षात वाढलेले दिसते, जरी सामान्यतः या वर्षांमध्ये तयार होणाऱ्या मधाचे प्रमाण कमी होत आहे.
उत्तर: खरं तर नाही. जर तुम्ही एकूण उत्पादन पाहिले तर, त्या विशिष्ट वर्षात ते वाढलेले दिसते, जरी सामान्यतः या वर्षांमध्ये मध उत्पादन कमी होत आहे.
प्रश्न: त्या परिस्थितीत, 2003 च्या सुमारास मधाच्या किंमतीत वाढीचे कारण काय असू शकते?
प्रश्न: त्या परिस्थितीत, 2003 च्या सुमारास मधाच्या किंमतीत वाढ होण्याचे कारण काय असू शकते?
हे शोधण्यासाठी, तुम्ही फॅसेट ग्रिड एक्सप्लोर करू शकता.
## फॅसेट ग्रिड्स
फॅसेट ग्रिड्स तुमच्या डेटासेटचा एक फॅसेट घेतात (आपल्या बाबतीत, 'वर्ष' निवडू शकता जेणेकरून खूप जास्त फॅसेट्स तयार होणार नाहीत). Seaborn नंतर तुमच्या निवडलेल्या x आणि y समन्वयांसाठी प्रत्येक फॅसेटसाठी एक प्लॉट तयार करू शकतो, ज्यामुळे तुलना करणे सोपे होते. या प्रकारच्या तुलनेत 2003 वेगळे दिसते का?
फॅसेट ग्रिड्स तुमच्या डेटासेटचा एक फॅसेट घेतात (आपल्या बाबतीत, 'वर्ष' निवडू शकता जेणेकरून खूप जास्त फॅसेट्स तयार होणार नाहीत). Seaborn नंतर तुमच्या निवडलेल्या x आणि y समन्वयांसाठी प्रत्येक फॅसेटसाठी एक प्लॉट तयार करू शकतो, ज्यामुळे तुलना करणे सोपे होते. 2003 या प्रकारच्या तुलनेत वेगळे दिसते का?
Seaborn च्या [डॉक्युमेंटेशन](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) च्या शिफारशीनुसार `relplot` वापरणे सुरू ठेवून फॅसेट ग्रिड तयार करा.
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
या दृश्यांकनात, तुम्ही प्रति वसाहती उत्पादन आणि वसाहतींची संख्या वर्षानुवर्षे, राज्यानुसार बाजूने तुलना करू शकता, 3 कॉलम्ससाठी रॅप सेट करून:
या डेटासेटसाठी, वसाहतींची संख्या आणि त्यांचे उत्पादन, वर्षानुवर्षे आणि राज्यानुसार, काहीही विशेषतः वेगळे दिसत नाही. या दोन व्हेरिएबल्समधील सहसंबंध शोधण्यासाठी वेगळ्या प्रकारे पाहण्याचा प्रयत्न करता येईल का?
या डेटासेटसाठी, राज्यानुसार आणि वर्षानुसार वसाहतींची संख्या आणि त्यांचे उत्पादन याबाबत काहीही विशेषतः वेगळे दिसत नाही. या दोन व्हेरिएबल्समधील नातेसंबंध शोधण्यासाठी वेगळ्या प्रकारे पाहण्याचा प्रयत्न करता येईल का?
## ड्युअल-लाइन प्लॉट्स
Seaborn च्या 'despine' वापरून त्यांच्या वरच्या आणि उजव्या स्पाईन्स काढून टाकून, आणि `ax.twinx` [Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) मधून घेतलेला वापरून, दोन लाइनप्लॉट्स एकमेकांवर सुपरइम्पोज करून मल्टीलाइन प्लॉट तयार करा. Twinx चार्टला x अक्ष सामायिक करण्यास आणि दोन y अक्ष दाखवण्यास अनुमती देते. त्यामुळे, प्रति वसाहती उत्पादन आणि वसाहतींची संख्या, सुपरइम्पोज करून दाखवा:
Seaborn च्या 'despine' चा वापर करून दोन लाइनप्लॉट्स एकमेकांवर सुपरइम्पोज करून, आणि `ax.twinx` [Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) मधून घेतलेला वापरून मल्टीलाइन प्लॉट तयार करा. Twinx चार्टला x अक्ष सामायिक करण्यास आणि दोन y अक्ष दाखवण्यास परवानगी देते. त्यामुळे, प्रति वसाहती उत्पादन आणि वसाहतींची संख्या सुपरइम्पोज करा:
2003 च्या सुमारास डोळ्यांना काहीही वेगळे दिसत नसले तरी, हे आपल्याला थोड्या आनंददायक नोटवर धडा संपवण्याची परवानगी देते: जरी वसाहतींची संख्या एकूण कमी होत असली तरी, वसाहतींची संख्या स्थिर होत आहे, जरी त्यांच्या प्रति वसाहती उत्पादन कमी होत आहे.
2003 च्या सुमारास डोळ्यांना काहीही वेगळे दिसत नाही, परंतु हे आपल्याला थोड्या आनंददायक नोटवर धडा संपवण्याची परवानगी देते: जरी वसाहतींची संख्या एकूण कमी होत असली तरी, वसाहतींची संख्या स्थिर होत आहे जरी त्यांचे प्रति वसाहती उत्पादन कमी होत आहे.
जा, मधमाशा, जा!
🐝❤️
## 🚀 आव्हान
या धड्यात, तुम्ही स्कॅटरप्लॉट्स आणि लाइन ग्रिड्सच्या इतर उपयोगांबद्दल थोडे अधिक शिकलात, ज्यामध्ये फॅसेट ग्रिड्स समाविष्ट आहेत. या तंत्रांचा वापर करून फॅसेट ग्रिड तयार करण्यासाठी स्वतःला आव्हान द्या, कदाचित तुम्ही या धड्यांपूर्वी वापरलेला वेगळा डेटासेट वापरा. ते तयार करण्यासाठी किती वेळ लागतो आणि तुम्हाला किती ग्रिड्स तयार करायचे आहेत याबद्दल काळजी घेणे आवश्यक आहे हे लक्षात ठेवा.
या धड्यात, तुम्ही स्कॅटरप्लॉट्स आणि लाइन ग्रिड्सच्या इतर उपयोगांबद्दल थोडे अधिक शिकले, ज्यामध्ये फॅसेट ग्रिड्सचा समावेश आहे. स्वतःला आव्हान द्या की तुम्ही वेगळ्या डेटासेटचा वापर करून फॅसेट ग्रिड तयार करा, कदाचित तुम्ही या धड्यांपूर्वी वापरलेला डेटासेट वापरा. ते तयार करण्यासाठी किती वेळ लागतो आणि तुम्हाला किती ग्रिड्स तयार करायचे आहेत याबाबत तुम्हाला काळजी घ्यावी लागते हे लक्षात ठेवा.
लाइन प्लॉट्स साधे किंवा खूप जटिल असू शकतात. [Seaborn डॉक्युमेंटेशन](https://seaborn.pydata.org/generated/seaborn.lineplot.html) मध्ये तुम्ही त्यांना तयार करण्याच्या विविध मार्गांबद्दल थोडे वाचन करा. तुम्ही या धड्यात तयार केलेल्या लाइन चार्ट्सना डॉक्युमेंटेशनमध्ये सूचीबद्ध केलेल्या इतर पद्धतींसह सुधारण्याचा प्रयत्न करा.
लाइन प्लॉट्स साधे किंवा खूप जटिल असू शकतात. [Seaborn डॉक्युमेंटेशन](https://seaborn.pydata.org/generated/seaborn.lineplot.html) मध्ये थोडे वाचन करा की तुम्ही त्यांना तयार करण्याच्या विविध पद्धतींवर. तुम्ही या धड्यात तयार केलेल्या लाइन चार्ट्सना डॉक्युमेंटेशनमध्ये सूचीबद्ध केलेल्या इतर पद्धतींसह सुधारण्याचा प्रयत्न करा.
## असाइनमेंट
[Dive into the beehive](assignment.md)
@ -184,4 +185,4 @@ ax.figure.legend();
---
**अस्वीकरण**:
हा दस्तऐवज AI भाषांतर सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून निर्माण होणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.
हा दस्तऐवज AI भाषांतर सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील मूळ दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर केल्यामुळे उद्भवणाऱ्या कोणत्याही गैरसमजांकरिता किंवा चुकीच्या अर्थ लावण्याकरिता आम्ही जबाबदार राहणार नाही.
| ](../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|Memvisualkan Hubungan - _Sketchnote oleh [@nitya](https://twitter.com/nitya)_ |
|Visualisasi Hubungan - _Sketchnote oleh [@nitya](https://twitter.com/nitya)_ |
Meneruskan fokus kajian kita terhadap alam semula jadi, mari kita terokai visualisasi menarik untuk menunjukkan hubungan antara pelbagai jenis madu, berdasarkan dataset yang diperoleh daripada [Jabatan Pertanian Amerika Syarikat](https://www.nass.usda.gov/About_NASS/index.php).
Dataset ini mengandungi kira-kira 600 item yang memaparkan pengeluaran madu di banyak negeri di Amerika Syarikat. Sebagai contoh, anda boleh melihat bilangan koloni, hasil per koloni, jumlah pengeluaran, stok, harga per paun, dan nilai madu yang dihasilkan di negeri tertentu dari tahun 1998-2012, dengan satu baris data bagi setiap tahun untuk setiap negeri.
Adalah menarik untuk memvisualkan hubungan antara pengeluaran tahunan negeri tertentu dan, sebagai contoh, harga madu di negeri tersebut. Sebagai alternatif, anda boleh memvisualkan hubungan antara hasil madu per koloni di negeri-negeri. Tempoh tahun ini merangkumi 'CCD' atau 'Colony Collapse Disorder' yang pertama kali dilihat pada tahun 2006 (http://npic.orst.edu/envir/ccd.html), menjadikannya dataset yang menyentuh hati untuk dikaji. 🐝
Adalah menarik untuk memvisualisasikan hubungan antara pengeluaran tahunan negeri tertentu dan, sebagai contoh, harga madu di negeri tersebut. Sebagai alternatif, anda boleh memvisualisasikan hubungan antara hasil madu per koloni di negeri-negeri. Tempoh tahun ini meliputi 'CCD' atau 'Colony Collapse Disorder' yang pertama kali dilihat pada tahun 2006 (http://npic.orst.edu/envir/ccd.html), menjadikannya dataset yang bermakna untuk dikaji. 🐝
Dalam pelajaran ini, anda boleh menggunakan Seaborn, yang telah anda gunakan sebelum ini, sebagai perpustakaan yang baik untuk memvisualkan hubungan antara pemboleh ubah. Yang paling menarik ialah penggunaan fungsi `relplot` Seaborn yang membolehkan plot taburan dan plot garis untuk memvisualkan '[hubungan statistik](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' dengan cepat, yang membantu saintis data memahami bagaimana pemboleh ubah saling berkaitan.
Dalam pelajaran ini, anda boleh menggunakan Seaborn, yang telah anda gunakan sebelum ini, sebagai perpustakaan yang baik untuk memvisualisasikan hubungan antara pemboleh ubah. Yang paling menarik ialah penggunaan fungsi `relplot` Seaborn yang membolehkan plot taburan dan plot garis untuk dengan cepat memvisualisasikan '[hubungan statistik](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', yang membantu saintis data memahami dengan lebih baik bagaimana pemboleh ubah saling berkaitan.
## Scatterplots
@ -40,56 +40,56 @@ Anda akan perasan bahawa data madu mempunyai beberapa kolum menarik, termasuk ta
| negeri | numcol | hasilpercol | jumlahprod | stok | hargaperlb | nilaiprod | tahun |
Buat scatterplot asas untuk menunjukkan hubungan antara harga per paun madu dan negeri asalnya di Amerika Syarikat. Jadikan paksi `y` cukup tinggi untuk memaparkan semua negeri:
Sekarang, tunjukkan data yang sama dengan skema warna madu untuk menunjukkan bagaimana harga berkembang dari tahun ke tahun. Anda boleh melakukannya dengan menambah parameter 'hue' untuk menunjukkan perubahan dari tahun ke tahun:
> ✅ Ketahui lebih lanjut tentang [palet warna yang boleh anda gunakan dalam Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - cuba skema warna pelangi yang indah!
> ✅ Ketahui lebih lanjut tentang [palet warna yang boleh digunakan dalam Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - cuba skema warna pelangi yang indah!
Dengan perubahan skema warna ini, anda dapat melihat bahawa terdapat perkembangan yang jelas dari tahun ke tahun dalam harga madu per paun. Malah, jika anda melihat set sampel dalam data untuk mengesahkan (pilih negeri tertentu, Arizona sebagai contoh), anda dapat melihat pola kenaikan harga dari tahun ke tahun, dengan beberapa pengecualian:
Dengan perubahan skema warna ini, anda dapat melihat dengan jelas perkembangan yang kuat dari tahun ke tahun dalam harga madu per paun. Malah, jika anda melihat set sampel dalam data untuk mengesahkan (pilih negeri tertentu, contohnya Arizona), anda dapat melihat pola kenaikan harga dari tahun ke tahun, dengan beberapa pengecualian:
| negeri | numcol | hasilpercol | jumlahprod | stok | hargaperlb | nilaiprod | tahun |
Cara lain untuk memvisualkan perkembangan ini adalah dengan menggunakan saiz, bukannya warna. Untuk pengguna yang buta warna, ini mungkin pilihan yang lebih baik. Edit visualisasi anda untuk menunjukkan kenaikan harga dengan peningkatan saiz titik:
Cara lain untuk memvisualisasikan perkembangan ini adalah dengan menggunakan saiz, bukannya warna. Untuk pengguna yang buta warna, ini mungkin pilihan yang lebih baik. Edit visualisasi anda untuk menunjukkan kenaikan harga dengan kenaikan saiz titik:
Adakah ini kes mudah permintaan dan penawaran? Disebabkan faktor seperti perubahan iklim dan keruntuhan koloni, adakah madu semakin kurang tersedia untuk dibeli dari tahun ke tahun, dan oleh itu harga meningkat?
✅ Oleh kerana Seaborn mengagregatkan data di sekitar satu garis, ia memaparkan "pengukuran berganda pada setiap nilai x dengan memplotkan purata dan selang keyakinan 95% di sekitar purata". [Sumber](https://seaborn.pydata.org/tutorial/relational.html). Tingkah laku yang memakan masa ini boleh dilumpuhkan dengan menambah `ci=None`.
@ -114,19 +114,19 @@ Soalan: Nah, pada tahun 2003 adakah kita juga melihat lonjakan dalam bekalan mad
Jawapan: Tidak begitu. Jika anda melihat jumlah pengeluaran, ia sebenarnya kelihatan meningkat pada tahun tersebut, walaupun secara umumnya jumlah madu yang dihasilkan semakin menurun sepanjang tahun-tahun ini.
Jawapan: Tidak begitu. Jika anda melihat jumlah pengeluaran, ia sebenarnya kelihatan meningkat pada tahun tersebut, walaupun secara amnya jumlah madu yang dihasilkan menurun sepanjang tahun-tahun ini.
Soalan: Dalam kes itu, apa yang boleh menyebabkan lonjakan harga madu sekitar tahun 2003?
Untuk menemui ini, anda boleh menerokai grid facet.
Untuk menemui ini, anda boleh menerokai grid faset.
## Grid Facet
## Grid Faset
Grid facet mengambil satu aspek dataset anda (dalam kes kita, anda boleh memilih 'tahun' untuk mengelakkan terlalu banyak facet dihasilkan). Seaborn kemudian boleh membuat plot untuk setiap aspek tersebut berdasarkan koordinat x dan y yang anda pilih untuk perbandingan visual yang lebih mudah. Adakah tahun 2003 menonjol dalam jenis perbandingan ini?
Grid faset mengambil satu faset dataset anda (dalam kes ini, anda boleh memilih 'tahun' untuk mengelakkan terlalu banyak faset dihasilkan). Seaborn kemudian boleh membuat plot untuk setiap faset koordinat x dan y yang anda pilih untuk perbandingan visual yang lebih mudah. Adakah tahun 2003 menonjol dalam jenis perbandingan ini?
Cipta grid facet dengan terus menggunakan `relplot` seperti yang disyorkan oleh [dokumentasi Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
Buat grid faset dengan terus menggunakan `relplot` seperti yang disarankan oleh [dokumentasi Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Dalam visualisasi ini, anda boleh membandingkan hasil per koloni dan bilangan koloni dari tahun ke tahun, bersebelahan dengan wrap yang ditetapkan pada 3 untuk kolum:
Dalam visualisasi ini, anda boleh membandingkan hasil per koloni dan bilangan koloni dari tahun ke tahun, bersebelahan dengan susunan kolum sebanyak 3:
Untuk dataset ini, tiada apa yang menonjol berkaitan dengan bilangan koloni dan hasilnya, dari tahun ke tahun dan negeri ke negeri. Adakah terdapat cara lain untuk mencari korelasi antara dua pemboleh ubah ini?
Untuk dataset ini, tiada apa yang benar-benar menonjol berkaitan dengan bilangan koloni dan hasilnya, dari tahun ke tahun dan negeri ke negeri. Adakah terdapat cara lain untuk mencari korelasi antara dua pemboleh ubah ini?
## Plot Garis Berganda
Cuba plot garis berganda dengan meletakkan dua plot garis di atas satu sama lain, menggunakan 'despine' Seaborn untuk menghapuskan tulang belakang atas dan kanan mereka, dan menggunakan `ax.twinx` [yang diperoleh daripada Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx membolehkan carta berkongsi paksi x dan memaparkan dua paksi y. Jadi, paparkan hasil per koloni dan bilangan koloni, yang disuperimposkan:
Cuba plot garis berganda dengan meletakkan dua plot garis di atas satu sama lain, menggunakan 'despine' Seaborn untuk menghapuskan tulang belakang atas dan kanan mereka, dan menggunakan `ax.twinx` [yang berasal dari Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx membolehkan carta berkongsi paksi x dan memaparkan dua paksi y. Jadi, paparkan hasil per koloni dan bilangan koloni, bertindih:
Walaupun tiada apa yang menonjol pada mata sekitar tahun 2003, ia membolehkan kita mengakhiri pelajaran ini dengan nota yang sedikit lebih gembira: walaupun terdapat penurunan bilangan koloni secara keseluruhan, bilangan koloni semakin stabil walaupun hasil per koloni semakin berkurangan.
Walaupun tiada apa yang menonjol di mata sekitar tahun 2003, ia membolehkan kita mengakhiri pelajaran ini dengan nota yang sedikit lebih gembira: walaupun terdapat penurunan bilangan koloni secara keseluruhan, bilangan koloni semakin stabil walaupun hasil per koloni semakin menurun.
Teruskan, lebah, teruskan!
🐝❤️
## 🚀 Cabaran
Dalam pelajaran ini, anda belajar sedikit lagi tentang kegunaan scatterplot dan grid garis, termasuk grid facet. Cabar diri anda untuk mencipta grid facet menggunakan dataset yang berbeza, mungkin yang anda gunakan sebelum pelajaran ini. Perhatikan berapa lama masa yang diambil untuk mencipta dan bagaimana anda perlu berhati-hati tentang berapa banyak grid yang perlu anda lukis menggunakan teknik ini.
Dalam pelajaran ini, anda belajar sedikit lagi tentang kegunaan lain scatterplots dan grid garis, termasuk grid faset. Cabar diri anda untuk mencipta grid faset menggunakan dataset yang berbeza, mungkin yang anda gunakan sebelum pelajaran ini. Perhatikan berapa lama masa yang diambil untuk mencipta dan bagaimana anda perlu berhati-hati tentang berapa banyak grid yang perlu anda lukis menggunakan teknik ini.
## [Kuiz selepas pelajaran](https://ff-quizzes.netlify.app/en/ds/quiz/23)
ဤဒေတာတွင် အချို့သော variable များကြား ဆက်နွယ်မှုကို ရှာဖွေရန်၊ line chart များကို စူးစမ်းကြည့်ပါ။
ဤဒေတာတွင် အချို့သောအပြောင်းအလဲများအကြား ဆက်ဆံရေးကို ရှာဖွေရန် line charts များကို လေ့လာကြည့်ပါ။
## Line charts
မေးခွန်း- တစ်နှစ်နှင့်တစ်နှစ်အတွင်း ပျားရည်တစ်ပေါင်ဈေးနှုန်းသည် တိုးတက်မှုရှိပါသလား။ single line chart တစ်ခုဖန်တီးခြင်းဖြင့် အလွယ်တကူ ရှာဖွေနိုင်ပါသည်-
မေးခွန်း- ပျားရည်တစ်ပေါင်စျေးနှုန်းသည် နှစ်အလိုက် တိုးတက်မှုရှိပါသလား။ single line chart တစ်ခုဖန်တီးခြင်းဖြင့် အလွယ်တကူရှာဖွေနိုင်ပါသည်။
यो लगभग ६०० वस्तुहरूको डेटासेटले धेरै अमेरिकी राज्यहरूमा मह उत्पादन देखाउँछ। उदाहरणका लागि, तपाईंले १९९८-२०१२ को अवधिमा प्रत्येक राज्यको लागि प्रति वर्ष एक पङ्क्ति सहित, उपनिवेशहरूको संख्या, प्रति उपनिवेश उत्पादन, कुल उत्पादन, स्टकहरू, प्रति पाउन्ड मूल्य, र उत्पादनको मूल्य हेर्न सक्नुहुन्छ।
यो रोचक हुनेछ कि कुनै राज्यको वार्षिक उत्पादन र त्यस राज्यको महको मूल्य बीचको सम्बन्ध देखाउने दृश्य बनाउने। वैकल्पिक रूपमा, तपाईंले राज्यहरूको प्रति उपनिवेश मह उत्पादनको सम्बन्ध देखाउन सक्नुहुन्छ। यो समयावधि २००६ मा पहिलो पटक देखिएको 'CCD' वा 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) समेट्छ, जसले यो अध्ययन गर्न भावनात्मक डेटासेट बनाउँछ। 🐝
यो रोचक हुनेछ कि कुनै राज्यको वार्षिक उत्पादन र त्यस राज्यको महको मूल्य बीचको सम्बन्ध देखाउने दृश्य बनाउने। वैकल्पिक रूपमा, तपाईंले राज्यहरूको प्रति उपनिवेश मह उत्पादनको सम्बन्ध देखाउन सक्नुहुन्छ। यो समयावधि २००६ मा पहिलो पटक देखिएको 'CCD' वा 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) समेट्छ, त्यसैले यो अध्ययन गर्न भावनात्मक डेटासेट हो। 🐝
## [पाठ अघि क्विज](https://ff-quizzes.netlify.app/en/ds/quiz/22)
यस पाठमा, तपाईंले पहिले प्रयोग गरिसकेको Seaborn लाई प्रयोग गर्न सक्नुहुन्छ, जुन चरहरू बीचको सम्बन्ध देखाउन राम्रो पुस्तकालय हो। विशेष रूपमा रोचक छ Seaborn को `relplot`कार्य, जसले छिटो '[सांख्यिकीय सम्बन्धहरू](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' देखाउन स्क्याटर प्लट र लाइन प्लटहरू अनुमति दिन्छ, जसले डेटा वैज्ञानिकलाई चरहरू एकअर्कासँग कसरी सम्बन्धित छन् भन्ने राम्रोसँग बुझ्न मद्दत गर्दछ।
यस पाठमा, तपाईंले पहिले प्रयोग गरिसकेको Seaborn लाई प्रयोग गर्न सक्नुहुन्छ, जुन चरहरू बीचको सम्बन्ध देखाउन राम्रो पुस्तकालय हो। विशेष रूपमा रोचक छ Seaborn को `relplot`फङ्क्शन, जसले छिटो '[सांख्यिकीय सम्बन्धहरू](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' देखाउन स्क्याटर प्लट र लाइन प्लटहरू अनुमति दिन्छ, जसले डेटा वैज्ञानिकलाई चरहरू एकअर्कासँग कसरी सम्बन्धित छन् भन्ने राम्रोसँग बुझ्न मद्दत गर्दछ।
## स्क्याटरप्लटहरू
महको मूल्य वर्ष दर वर्ष, प्रति राज्य कसरी विकसित भएको छ भन्ने देखाउन स्क्याटरप्लट प्रयोग गर्नुहोस्। Seaborn,`relplot` प्रयोग गरेर, राज्य डेटा समूहबद्ध गर्दछ र श्रेणीगत र संख्यात्मक डेटा दुवैका लागि डेटा बिन्दुहरू देखाउँछ।
महको मूल्य वर्ष दर वर्ष, प्रति राज्य कसरी परिवर्तन भएको छ भन्ने देखाउन स्क्याटरप्लट प्रयोग गर्नुहोस्। Seaborn ले`relplot` प्रयोग गरेर राज्यको डेटा समूहबद्ध गर्दछ र श्रेणीगत र संख्यात्मक डेटा दुवैका लागि डेटा बिन्दुहरू देखाउँछ।
आउनुहोस्, डेटा र Seaborn आयात गरेर सुरु गरौं:
@ -36,7 +36,7 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
तपाईंले देख्नुहुन्छ कि मह डेटामा वर्ष र प्रति पाउन्ड मूल्य सहित धेरै रोचक स्तम्भहरू छन्। यस डेटालाई अमेरिकी राज्य अनुसार समूहबद्ध गरेर अन्वेषण गरौं:
तपाईंले देख्नुहुन्छ कि महको डेटामा वर्ष र प्रति पाउन्ड मूल्य सहित धेरै रोचक स्तम्भहरू छन्। यो डेटा अमेरिकी राज्य अनुसार समूहबद्ध गरेर अन्वेषण गरौं:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
महको प्रति पाउन्ड मूल्य र यसको अमेरिकी राज्यको उत्पत्तिको बीचको सम्बन्ध देखाउन आधारभूत स्क्याटरप्लट बनाउनुहोस्। `y` अक्षलाई सबै राज्यहरू देखाउन पर्याप्त अग्लो बनाउनुहोस्:
महको प्रति पाउन्ड मूल्य र यसको अमेरिकी राज्यको उत्पत्तिबीचको सम्बन्ध देखाउन आधारभूत स्क्याटरप्लट बनाउनुहोस्। `y` अक्षलाई सबै राज्यहरू देखाउन पर्याप्त अग्लो बनाउनुहोस्:
अब, महको मूल्य वर्ष दर वर्ष कसरी विकसित भएको छ भन्ने देखाउन महको रंग योजना प्रयोग गरेर उही डेटा देखाउनुहोस्। तपाईंले 'hue' प्यारामिटर थपेर परिवर्तन देखाउन सक्नुहुन्छ:
अब, महको रंग योजनाको प्रयोग गरेर वर्ष दर वर्ष मूल्य कसरी परिवर्तन भएको छ भन्ने देखाउनुहोस्। तपाईंले 'hue' प्यारामिटर थपेर परिवर्तन देखाउन सक्नुहुन्छ:
> ✅ Seaborn मा प्रयोग गर्न सकिने [रंग योजनाहरू](https://seaborn.pydata.org/tutorial/color_palettes.html) को बारेमा थप जान्नुहोस् - सुन्दर इन्द्रेणी रंग योजना प्रयास गर्नुहोस्!
यस रंग योजना परिवर्तनसँगै, तपाईंले देख्न सक्नुहुन्छ कि महको प्रति पाउन्ड मूल्यमा वर्ष दर वर्ष स्पष्ट प्रगति छ। वास्तवमा, यदि तपाईंले डेटाको नमूना सेट हेर्नुहुन्छ (उदाहरणका लागि, एरिजोना राज्य चयन गर्नुहोस्) तपाईंले वर्ष दर वर्ष मूल्य वृद्धि भएको देख्न सक्नुहुन्छ, केही अपवादहरू सहित:
यो रंग योजनाको परिवर्तनसँगै, तपाईंले स्पष्ट रूपमा देख्न सक्नुहुन्छ कि महको प्रति पाउन्ड मूल्यमा वर्ष दर वर्ष बलियो प्रगति भएको छ। वास्तवमा, यदि तपाईं डेटाको नमूना सेट हेर्नुहुन्छ (उदाहरणका लागि, एरिजोना राज्य चयन गर्नुहोस्) तपाईंले वर्ष दर वर्ष मूल्य वृद्धि भएको ढाँचा देख्न सक्नुहुन्छ, केही अपवादहरू सहित:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
रंगको सट्टा आकार प्रयोग गरेर यो प्रगति देखाउने अर्को तरिका हो। रंग अन्धोपन भएका प्रयोगकर्ताहरूका लागि, यो राम्रो विकल्प हुन सक्छ। मूल्य वृद्धि देखाउन बिन्दुको परिधि वृद्धि गरेर आफ्नो दृश्य परिवर्तन गर्नुहोस्:
रंगको सट्टा आकार प्रयोग गरेर यो प्रगति देखाउने अर्को तरिका हो। रंग अन्धोपन भएका प्रयोगकर्ताहरूका लागि, यो राम्रो विकल्प हुन सक्छ। मूल्य वृद्धि देखाउन बिन्दुको परिधि वृद्धि गर्ने गरी आफ्नो दृश्यलाई सम्पादन गर्नुहोस्:
✅ किनभने Seaborn एक लाइन वरिपरि डेटा समग्र गर्दैछ, यसले "प्रत्येक x मानमा बहु मापनहरू औसत र औसत वरिपरि ९५% विश्वास अन्तराल प्लट गरेर देखाउँछ।" [स्रोत](https://seaborn.pydata.org/tutorial/relational.html)। यो समय लाग्ने व्यवहारलाई `ci=None` थपेर अक्षम गर्न सकिन्छ।
✅ किनकि Seaborn ले एक लाइन वरिपरि डेटा समेट्दै छ, यसले "प्रत्येक x मानमा बहु मापनहरू औसत र औसत वरिपरि ९५% विश्वास अन्तराल प्लट गरेर देखाउँछ।" [स्रोत](https://seaborn.pydata.org/tutorial/relational.html)। यो समय लाग्ने व्यवहारलाई `ci=None` थपेर अक्षम गर्न सकिन्छ।
प्रश्न: खैर, २००३ मा महको आपूर्तिमा पनि वृद्धि देख्न सकिन्छ? यदि तपाईंले कुल उत्पादन वर्ष दर वर्ष हेर्नुभयो भने के हुन्छ?
प्रश्न: खैर, २००३ मा महको आपूर्तिमा पनि वृद्धि देख्न सकिन्छ? यदि तपाईंले वर्ष दर वर्ष कुल उत्पादन हेर्नुभयो भने के हुन्छ?
उत्तर: वास्तवमा होइन। यदि तपाईंले कुल उत्पादन हेर्नुभयो भने, यो विशेष वर्षमा बढेको जस्तो देखिन्छ, यद्यपि सामान्य रूपमा मह उत्पादनको मात्रा यी वर्षहरूमा घट्दै गएको छ।
प्रश्न: त्यस अवस्थामा, २००३ को वरिपरि महको मूल्यमा भएको वृद्धि के कारण हुन सक्छ?
यो पत्ता लगाउन, तपाईंले एक फेसेट ग्रिड अन्वेषण गर्न सक्नुहुन्छ।
यो पत्ता लगाउन, तपाईंले फेसेट ग्रिड अन्वेषण गर्न सक्नुहुन्छ।
## फेसेट ग्रिडहरू
फेसेट ग्रिडहरूले तपाईंको डेटासेटको एक पक्ष (हाम्रो मामलामा, तपाईंले 'वर्ष' चयन गर्न सक्नुहुन्छ ताकि धेरै धेरै फेसेटहरू उत्पादन नगरियोस्) लिन्छ। त्यसपछि Seaborn ले तपाईंको चयन गरिएको x र y निर्देशांकहरूको लागि प्रत्येक फेसेटको प्लट बनाउन सक्छ, जसले तुलनालाई सजिलो बनाउँछ। के २००३ यस प्रकारको तुलनामा बाहिर देखिन्छ?
फेसेट ग्रिडहरूले तपाईंको डेटासेटको एउटा पक्ष (हाम्रो मामलामा, 'वर्ष' चयन गर्न सक्नुहुन्छ ताकि धेरै धेरै फेसेटहरू उत्पादन नगरियोस्) लिन्छ। Seaborn ले त्यसपछि तपाईंको चयन गरिएको x र y निर्देशांकहरूको प्रत्येक फेसेटको लागि प्लट बनाउन सक्छ, सजिलो दृश्य तुलना गर्न। के २००३ यस प्रकारको तुलनामा बाहिर देखिन्छ?
Seaborn को [डकुमेन्टेसन](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) द्वारा सिफारिस गरिएको `relplot` प्रयोग गरेर फेसेट ग्रिड बनाउनुहोस्।
Seaborn को [डकुमेन्टेसन](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) द्वारा सिफारिस गरिएको `relplot` प्रयोग गरेर फेसेट ग्रिड बनाउनुहोस्।
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
यस दृश्यमा, तपाईंले प्रति उपनिवेश उत्पादन र उपनिवेशहरूको संख्या वर्ष दर वर्ष, राज्य दर राज्य, सँगसँगै तुलना गर्न सक्नुहुन्छ, स्तम्भहरूको लागि wrap ३ मा सेट गरिएको छ:
यस दृश्यमा, तपाईंले प्रति उपनिवेश उत्पादन र उपनिवेशहरूको संख्या वर्ष दर वर्ष, राज्य दर राज्य, सँगसँगै तुलना गर्न सक्नुहुन्छ, स्तम्भहरूको लागि wrap लाई ३ मा सेट गरेर:
यस डेटासेटको लागि, उपनिवेशहरूको संख्या र तिनीहरूको उत्पादनको सम्बन्धमा वर्ष दर वर्ष र राज्य दर राज्य केही विशेष कुरा बाहिर देखिँदैन। के यी दुई चरहरू बीचको सम्बन्ध पत्ता लगाउन हेर्ने फरक तरिका छ?
यस डेटासेटका लागि, उपनिवेशहरूको संख्या र तिनीहरूको उत्पादनको सम्बन्धमा वर्ष दर वर्ष र राज्य दर राज्य केही विशेष कुरा बाहिर देखिँदैन। के यी दुई चरहरू बीचको सम्बन्ध पत्ता लगाउन हेर्ने फरक तरिका छ?
## डुअल-लाइन प्लटहरू
Seaborn को 'despine' प्रयोग गरेर दुई लाइनप्लटहरू एकअर्काको माथि सुपरइम्पोज गरेर, र `ax.twinx` [Matplotlib बाट व्युत्पन्न](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) प्रयोग गरेर मल्टिलाइन प्लट प्रयास गर्नुहोस्। Twinx ले चार्टलाई x अक्ष साझा गर्न र दुई y अक्षहरू देखाउन अनुमति दिन्छ। त्यसैले, प्रति उपनिवेश उत्पादन र उपनिवेशहरूको संख्या सुपरइम्पोज गरेर देखाउनुहोस्:
Seaborn को 'despine' प्रयोग गरेर दुई लाइनप्लटहरू एकअर्काको माथि सुपरइम्पोज गरेर, र `ax.twinx` [Matplotlib बाट व्युत्पन्न](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) प्रयोग गरेर मल्टिलाइन प्लट प्रयास गर्नुहोस्। Twinx ले चार्टलाई x अक्ष साझा गर्न र दुई y अक्षहरू देखाउन अनुमति दिन्छ। त्यसैले, प्रति उपनिवेश उत्पादन र उपनिवेशहरूको संख्या, सुपरइम्पोज गरिएको देखाउनुहोस्:
२००३ को वरिपरि आँखा बाहिर केही नजम्पे पनि, यसले हामीलाई यो पाठलाई अलिकति खुशीको नोटमा अन्त्य गर्न अनुमति दिन्छ: उपनिवेशहरूको संख्या घट्दै गएको भए पनि, उपनिवेशहरूको संख्या स्थिर हुँदैछ, यद्यपि तिनीहरूको प्रति उपनिवेश उत्पादन घट्दैछ।
@ -170,7 +171,7 @@ ax.figure.legend();
🐝❤️
## 🚀 चुनौती
यस पाठमा, तपाईंले स्क्याटरप्लटहरू र लाइन ग्रिडहरूको अन्य प्रयोगहरू, फेसेट ग्रिडहरू सहित, बारेमा अलिकति बढी सिक्नुभयो। चुनौती दिनुहोस् कि तपाईंले यस पाठहरू अघि प्रयोग गरेको फरक डेटासेट प्रयोग गरेर फेसेट ग्रिड बनाउनुहोस्। तिनीहरू बनाउन कति समय लाग्छ र यी प्रविधिहरू प्रयोग गर्दा तपाईंले कति ग्रिडहरू बनाउन आवश्यक छ भन्ने कुरामा सावधान रहनु पर्ने कुरा नोट गर्नुहोस्।
यस पाठमा, तपाईंले स्क्याटरप्लटहरू र लाइन ग्रिडहरूको अन्य प्रयोगहरू, फेसेट ग्रिडहरू सहित, बारेमा अलिकति बढी सिक्नुभयो। चुनौती दिनुहोस् कि तपाईंले यस पाठहरू अघि प्रयोग गरेको फरक डेटासेट प्रयोग गरेर फेसेट ग्रिड बनाउनुहोस्। तिनीहरू बनाउन कति समय लाग्छ र यी प्रविधिहरू प्रयोग गरेर तपाईंले कति ग्रिडहरू बनाउन आवश्यक छ भन्ने कुरामा ध्यान दिनुहोस्।
## [पाठ पछि क्विज](https://ff-quizzes.netlify.app/en/ds/quiz/23)
@ -179,9 +180,9 @@ ax.figure.legend();
लाइन प्लटहरू सरल वा धेरै जटिल हुन सक्छन्। [Seaborn डकुमेन्टेसन](https://seaborn.pydata.org/generated/seaborn.lineplot.html) मा विभिन्न तरिकाहरूमा निर्माण गर्न सकिने लाइन प्लटहरूको बारेमा केही पढाइ गर्नुहोस्। तपाईंले यस पाठमा निर्माण गरेका लाइन चार्टहरूलाई डकुमेन्टेसनमा सूचीबद्ध अन्य विधिहरू प्रयोग गरेर सुधार गर्ने प्रयास गर्नुहोस्।
## असाइनमेन्ट
[महको छत्तामा डुब्नुहोस्](assignment.md)
[Dive into the beehive](assignment.md)
---
**अस्वीकरण**:
यो दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) प्रयोग गरी अनुवाद गरिएको हो। हामी यथासम्भव सटीकता सुनिश्चित गर्न प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटि वा अशुद्धता हुन सक्छ। यसको मूल भाषामा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्त्वपूर्ण जानकारीका लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याका लागि हामी जिम्मेवार हुने छैनौं।
यो दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) प्रयोग गरी अनुवाद गरिएको हो। हामी यथासम्भव सटीकता सुनिश्चित गर्न प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटिहरू वा अशुद्धताहरू हुन सक्छन्। यसको मूल भाषामा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्त्वपूर्ण जानकारीका लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याका लागि हामी जिम्मेवार हुने छैनौं।
| ](../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|Relaties visualiseren - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
|Relaties Visualiseren - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
In lijn met de natuurfocus van ons onderzoek, laten we interessante visualisaties ontdekken om de relaties tussen verschillende soorten honing te tonen, gebaseerd op een dataset afkomstig van het [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
In navolging van de natuurfocus van ons onderzoek, laten we interessante visualisaties ontdekken om de relaties tussen verschillende soorten honing te laten zien, gebaseerd op een dataset afkomstig van het [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
Deze dataset, met ongeveer 600 items, toont de honingproductie in veel Amerikaanse staten. Je kunt bijvoorbeeld kijken naar het aantal kolonies, opbrengst per kolonie, totale productie, voorraden, prijs per pond en de waarde van de geproduceerde honing in een bepaalde staat van 1998-2012, met één rij per jaar voor elke staat.
Deze dataset, met ongeveer 600 items, toont de honingproductie in veel Amerikaanse staten. Zo kun je bijvoorbeeld kijken naar het aantal kolonies, de opbrengst per kolonie, de totale productie, voorraden, prijs per pond en de waarde van de geproduceerde honing in een bepaalde staat van 1998-2012, met één rij per jaar per staat.
Het is interessant om de relatie te visualiseren tussen de productie van een bepaalde staat per jaar en bijvoorbeeld de prijs van honing in die staat. Alternatief kun je de relatie tussen de opbrengst per kolonie van verschillende staten visualiseren. Deze periode omvat de verwoestende 'CCD' of 'Colony Collapse Disorder', die voor het eerst werd waargenomen in 2006 (http://npic.orst.edu/envir/ccd.html), waardoor het een aangrijpende dataset is om te bestuderen. 🐝
Het is interessant om de relatie te visualiseren tussen de productie van een bepaalde staat per jaar en bijvoorbeeld de honingprijs in die staat. Een andere optie is om de relatie tussen de honingopbrengst per kolonie in verschillende staten te visualiseren. Deze periode omvat de verwoestende 'CCD' of 'Colony Collapse Disorder', die voor het eerst werd waargenomen in 2006 (http://npic.orst.edu/envir/ccd.html), wat deze dataset extra betekenisvol maakt. 🐝
## [Quiz vóór de les](https://ff-quizzes.netlify.app/en/ds/quiz/22)
In deze les kun je Seaborn gebruiken, een bibliotheek die je al eerder hebt gebruikt, om relaties tussen variabelen te visualiseren. Vooral interessant is het gebruik van de `relplot`-functie van Seaborn, waarmee scatterplots en lijnplots snel '[statistische relaties](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' kunnen visualiseren. Dit stelt de datawetenschapper in staat om beter te begrijpen hoe variabelen zich tot elkaar verhouden.
In deze les kun je Seaborn gebruiken, een bibliotheek die je al eerder hebt gebruikt, om relaties tussen variabelen te visualiseren. Vooral interessant is het gebruik van Seaborn's `relplot`-functie, waarmee je snel scatterplots en lijndiagrammen kunt maken om '[statistische relaties](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' te visualiseren. Dit helpt datawetenschappers om beter te begrijpen hoe variabelen zich tot elkaar verhouden.
## Scatterplots
Gebruik een scatterplot om te laten zien hoe de prijs van honing zich jaar na jaar per staat heeft ontwikkeld. Seaborn, met behulp van `relplot`, groepeert handig de gegevens per staat en toont datapunten voor zowel categorische als numerieke gegevens.
Gebruik een scatterplot om te laten zien hoe de prijs van honing zich per jaar per staat heeft ontwikkeld. Seaborn, met behulp van `relplot`, groepeert handig de gegevens per staat en toont datapunten voor zowel categorische als numerieke gegevens.
Laten we beginnen met het importeren van de gegevens en Seaborn:
Laten we beginnen met het importeren van de data en Seaborn:
```python
import pandas as pd
@ -36,9 +36,9 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Je merkt dat de honingdata verschillende interessante kolommen bevat, waaronder jaar en prijs per pond. Laten we deze gegevens verkennen, gegroepeerd per Amerikaanse staat:
Je merkt dat de honingdata verschillende interessante kolommen bevat, waaronder jaar en prijs per pond. Laten we deze data verkennen, gegroepeerd per Amerikaanse staat:
| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | jaar |
| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Maak een eenvoudige scatterplot om de relatie te tonen tussen de prijs per pond honing en de staat van herkomst. Maak de `y`-as hoog genoeg om alle staten weer te geven:
Maak een eenvoudige scatterplot om de relatie tussen de prijs per pond honing en de staat van herkomst te laten zien. Zorg ervoor dat de `y`-as hoog genoeg is om alle staten weer te geven:
Toon nu dezelfde gegevens met een honingkleurenschema om te laten zien hoe de prijs zich door de jaren heen ontwikkelt. Je kunt dit doen door een 'hue'-parameter toe te voegen om de verandering jaar na jaar te tonen:
Laat nu dezelfde data zien met een honingkleurenschema om te laten zien hoe de prijs zich door de jaren heen ontwikkelt. Dit kun je doen door een 'hue'-parameter toe te voegen om de verandering per jaar te tonen:
> ✅ Lees meer over de [kleurenpaletten die je kunt gebruiken in Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - probeer een prachtig regenboogkleurenschema!
> ✅ Lees meer over de [kleurenpaletten die je in Seaborn kunt gebruiken](https://seaborn.pydata.org/tutorial/color_palettes.html) - probeer een prachtig regenboogkleurenschema!
Met deze kleurenschemawijziging kun je duidelijk zien dat er een sterke progressie is in de prijs per pond honing door de jaren heen. Als je een steekproef uit de gegevens neemt om dit te verifiëren (kies bijvoorbeeld een bepaalde staat, Arizona), kun je een patroon van prijsstijgingen jaar na jaar zien, met enkele uitzonderingen:
Met deze kleurenschemawijziging kun je duidelijk zien dat er door de jaren heen een sterke stijging is in de honingprijs per pond. Als je een steekproef uit de data neemt om dit te controleren (bijvoorbeeld Arizona), zie je een patroon van prijsstijgingen per jaar, met enkele uitzonderingen:
| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | jaar |
| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Een andere manier om deze progressie te visualiseren is door grootte te gebruiken in plaats van kleur. Voor kleurenblinde gebruikers kan dit een betere optie zijn. Pas je visualisatie aan om een prijsstijging te tonen door een toename in de omtrek van de stippen:
Een andere manier om deze ontwikkeling te visualiseren is door grootte in plaats van kleur te gebruiken. Voor kleurenblinde gebruikers kan dit een betere optie zijn. Pas je visualisatie aan om een prijsstijging te tonen door een toename in de omtrek van de stippen:
Is dit een eenvoudig geval van vraag en aanbod? Door factoren zoals klimaatverandering en kolonie-instorting is er misschien minder honing beschikbaar voor aankoop jaar na jaar, waardoor de prijs stijgt?
Is dit een eenvoudig geval van vraag en aanbod? Door factoren zoals klimaatverandering en kolonie-instorting is er misschien minder honing beschikbaar om te kopen, waardoor de prijs stijgt?
Om een correlatie tussen enkele variabelen in deze dataset te ontdekken, laten we enkele lijngrafieken verkennen.
Om een correlatie tussen enkele variabelen in deze dataset te ontdekken, laten we enkele lijndiagrammen verkennen.
## Lijngrafieken
## Lijndiagrammen
Vraag: Is er een duidelijke stijging in de prijs van honing per pond jaar na jaar? Dit kun je het gemakkelijkst ontdekken door een enkele lijngrafiek te maken:
Vraag: Is er een duidelijke stijging in de prijs van honing per pond door de jaren heen? Dit kun je het gemakkelijkst ontdekken door een enkel lijndiagram te maken:
✅ Omdat Seaborn gegevens aggregeert rond één lijn, toont het "de meerdere metingen bij elke x-waarde door het gemiddelde en het 95% betrouwbaarheidsinterval rond het gemiddelde te plotten". [Bron](https://seaborn.pydata.org/tutorial/relational.html). Dit tijdrovende gedrag kan worden uitgeschakeld door `ci=None` toe te voegen.
✅ Omdat Seaborn data rond één lijn aggregeert, toont het "de meerdere metingen bij elke x-waarde door het gemiddelde en het 95% betrouwbaarheidsinterval rond het gemiddelde te plotten". [Bron](https://seaborn.pydata.org/tutorial/relational.html). Dit tijdrovende gedrag kan worden uitgeschakeld door `ci=None` toe te voegen.
Vraag: Kunnen we in 2003 ook een piek zien in de honingvoorraad? Wat als je kijkt naar de totale productie jaar na jaar?
Vraag: Kunnen we in 2003 ook een piek in de honingvoorraad zien? Wat als je kijkt naar de totale productie door de jaren heen?
Antwoord: Niet echt. Als je kijkt naar de totale productie, lijkt deze in dat specifieke jaar zelfs te zijn toegenomen, hoewel de hoeveelheid geproduceerde honing over het algemeen in deze jaren afneemt.
@ -124,7 +124,7 @@ Om dit te ontdekken, kun je een facet grid verkennen.
## Facet grids
Facet grids nemen één facet van je dataset (in ons geval kun je 'jaar' kiezen om te voorkomen dat er te veel facetten worden geproduceerd). Seaborn kan dan een plot maken voor elk van die facetten van je gekozen x- en y-coördinaten voor een gemakkelijkere visuele vergelijking. Valt 2003 op in dit soort vergelijking?
Facet grids nemen één aspect van je dataset (in ons geval kun je 'jaar' kiezen om te voorkomen dat er te veel grids worden geproduceerd). Seaborn kan vervolgens een plot maken voor elk van die aspecten van je gekozen x- en y-coördinaten voor een eenvoudigere visuele vergelijking. Valt 2003 op in dit soort vergelijking?
Maak een facet grid door `relplot` te blijven gebruiken zoals aanbevolen door [Seaborn's documentatie](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
In deze visualisatie kun je de opbrengst per kolonie en het aantal kolonies jaar na jaar vergelijken, naast elkaar met een wrap ingesteld op 3 voor de kolommen:
In deze visualisatie kun je de opbrengst per kolonie en het aantal kolonies door de jaren heen vergelijken, naast elkaar met een wrap ingesteld op 3 voor de kolommen:
Voor deze dataset valt er niets bijzonders op met betrekking tot het aantal kolonies en hun opbrengst, jaar na jaar en staat na staat. Is er een andere manier om een correlatie tussen deze twee variabelen te vinden?
## Dubbele-lijnplots
## Dubbele lijndiagrammen
Probeer een meerlijnige plot door twee lijnplots bovenop elkaar te leggen, gebruikmakend van Seaborn's 'despine' om de bovenste en rechter spines te verwijderen, en gebruik `ax.twinx` [afgeleid van Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx maakt het mogelijk dat een grafiek de x-as deelt en twee y-assen weergeeft. Toon dus de opbrengst per kolonie en het aantal kolonies, bovenop elkaar:
Probeer een meerlijnig diagram door twee lijndiagrammen over elkaar heen te leggen, gebruikmakend van Seaborn's 'despine' om de boven- en rechterassen te verwijderen, en gebruik `ax.twinx` [afkomstig van Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx maakt het mogelijk om een grafiek de x-as te laten delen en twee y-assen weer te geven. Toon dus de opbrengst per kolonie en het aantal kolonies, over elkaar heen gelegd:
Hoewel er rond het jaar 2003 niets opvallends te zien is, eindigen we deze les met een wat positiever noot: hoewel het aantal kolonies over het algemeen afneemt, stabiliseert het aantal kolonies zelfs als hun opbrengst per kolonie afneemt.
Hoewel er rond het jaar 2003 niets opvallends te zien is, eindigen we deze les toch met een iets positiever noot: hoewel het aantal kolonies over het algemeen afneemt, stabiliseert het aantal kolonies zich, zelfs als hun opbrengst per kolonie afneemt.
Go, bijen, go!
🐝❤️
## 🚀 Uitdaging
In deze les heb je meer geleerd over andere toepassingen van scatterplots en lijnroosters, waaronder facet grids. Daag jezelf uit om een facet grid te maken met een andere dataset, misschien een die je eerder in deze lessen hebt gebruikt. Let op hoe lang het duurt om ze te maken en hoe je voorzichtig moet zijn met hoeveel grids je moet tekenen met deze technieken.
In deze les heb je meer geleerd over andere toepassingen van scatterplots en lijngrafieken, inclusief facet grids. Daag jezelf uit om een facet grid te maken met een andere dataset, misschien een die je eerder in deze lessen hebt gebruikt. Let op hoe lang het duurt om ze te maken en hoe je voorzichtig moet zijn met het aantal grids dat je tekent met deze technieken.
## [Quiz na de les](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Review& Zelfstudie
## Herhaling& Zelfstudie
Lijnplots kunnen eenvoudig of behoorlijk complex zijn. Lees wat meer in de [Seaborn-documentatie](https://seaborn.pydata.org/generated/seaborn.lineplot.html) over de verschillende manieren waarop je ze kunt bouwen. Probeer de lijngrafieken die je in deze les hebt gemaakt te verbeteren met andere methoden die in de documentatie worden vermeld.
Lijndiagrammen kunnen eenvoudig of behoorlijk complex zijn. Lees wat meer in de [Seaborn-documentatie](https://seaborn.pydata.org/generated/seaborn.lineplot.html) over de verschillende manieren waarop je ze kunt bouwen. Probeer de lijndiagrammen die je in deze les hebt gemaakt te verbeteren met andere methoden die in de documentatie worden genoemd.
## Opdracht
[Duik in de bijenkorf](assignment.md)
@ -184,4 +185,4 @@ Lijnplots kunnen eenvoudig of behoorlijk complex zijn. Lees wat meer in de [Seab
---
**Disclaimer**:
Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
|Visualisering av relasjoner - _Sketchnote av [@nitya](https://twitter.com/nitya)_ |
Vi fortsetter med naturfokuset i forskningen vår og utforsker interessante visualiseringer for å vise relasjoner mellom ulike typer honning, basert på et datasett fra [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
Fortsetter med naturfokuset i vår forskning, la oss utforske interessante visualiseringer for å vise relasjonene mellom ulike typer honning, basert på et datasett fra [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
Dette datasettet,som inneholder rundt 600 elementer, viser honningproduksjon i mange amerikanske delstater. For eksempel kan du se på antall kolonier, avkastning per koloni, total produksjon, lagerbeholdning, pris per pund og verdien av honningen produsert i en gitt delstat fra 1998-2012, med én rad per år for hver delstat.
Dette datasettet med rundt 600 elementer viser honningproduksjon i mange amerikanske stater. For eksempel kan du se på antall kolonier, avkastning per koloni, total produksjon, lagerbeholdning, pris per pund og verdien av honningen produsert i en gitt stat fra 1998-2012, med én rad per år for hver stat.
Det kan være interessant å visualisere relasjonen mellom en gitt delstats produksjon per år og for eksempel prisen på honning i den delstaten. Alternativt kan du visualisere relasjonen mellom delstatenes honningavkastning per koloni. Denne tidsperioden dekker den ødeleggende 'CCD' eller 'Colony Collapse Disorder', som først ble observert i 2006 (http://npic.orst.edu/envir/ccd.html), så det er et tankevekkende datasett å studere. 🐝
Det vil være interessant å visualisere relasjonen mellom en gitt stats produksjon per år og for eksempel prisen på honning i den staten. Alternativt kan du visualisere relasjonen mellom statenes honningavkastning per koloni. Denne tidsperioden dekker den ødeleggende 'CCD' eller 'Colony Collapse Disorder' som først ble observert i 2006 (http://npic.orst.edu/envir/ccd.html), så det er et gripende datasett å studere. 🐝
## [Quiz før forelesning](https://ff-quizzes.netlify.app/en/ds/quiz/22)
## [Quiz før leksjonen](https://ff-quizzes.netlify.app/en/ds/quiz/22)
I denne leksjonen kan du bruke Seaborn, som du har brukt tidligere, som et godt bibliotek for å visualisere relasjoner mellom variabler. Spesielt interessant er bruken av Seaborns `relplot`-funksjon, som tillater spredningsdiagrammer og linjediagrammer for raskt å visualisere '[statistiske relasjoner](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', noe som gir dataforskeren bedre forståelse av hvordan variabler henger sammen.
I denne leksjonen kan du bruke Seaborn, som du har brukt tidligere, som et godt bibliotek for å visualisere relasjoner mellom variabler. Spesielt interessant er bruken av Seaborns `relplot`-funksjon som tillater spredningsdiagrammer og linjediagrammer for raskt å visualisere '[statistiske relasjoner](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', som hjelper dataforskeren med å bedre forstå hvordan variabler henger sammen.
## Spredningsdiagrammer
Bruk et spredningsdiagram for å vise hvordan prisen på honning har utviklet seg år for år, per delstat. Seaborn, ved bruk av `relplot`, grupperer praktisk delstatsdata og viser datapunkter for både kategoriske og numeriske data.
Bruk et spredningsdiagram for å vise hvordan prisen på honning har utviklet seg, år for år, per stat. Seaborn, ved bruk av `relplot`, grupperer praktisk statensdata og viser datapunkter for både kategoriske og numeriske data.
La oss starte med å importere dataene og Seaborn:
@ -36,9 +36,9 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Du legger merke til at honningdataene har flere interessante kolonner, inkludert år og pris per pund. La oss utforske disse dataene, gruppert etter amerikanskedelstater:
Du legger merke til at honningdataene har flere interessante kolonner, inkludert år og pris per pund. La oss utforske disse dataene, gruppert etter amerikansk stat:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| stat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Lag et enkelt spredningsdiagram for å vise relasjonen mellom prisen per pund honning og dens opprinnelsesdelstat i USA. Gjør `y`-aksen høy nok til å vise alle delstatene:
Lag et grunnleggende spredningsdiagram for å vise relasjonen mellom prisen per pund honning og dens opprinnelsesstat i USA. Gjør `y`-aksen høy nok til å vise alle statene:
Vis nå de samme dataene med et honningfarget fargeskjema for å vise hvordan prisen utvikler seg over årene. Du kan gjøre dette ved å legge til en 'hue'-parameter for å vise endringen år for år:
Vis nå de samme dataene med et honningfarget fargetema for å vise hvordan prisen utvikler seg over årene. Du kan gjøre dette ved å legge til en 'hue'-parameter for å vise endringen, år for år:
> ✅ Lær mer om [fargepalettene du kan bruke i Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - prøv et vakkert regnbuefargeskjema!
> ✅ Lær mer om [fargepalettene du kan bruke i Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - prøv et vakkert regnbuefargetema!
Med denne fargeendringen kan du tydelig se en sterk progresjon over årene når det gjelder prisen på honning per pund. Faktisk, hvis du ser på et utvalg i dataene for å verifisere (velg en gitt delstat, for eksempel Arizona), kan du se et mønster av prisøkninger år for år, med få unntak:
Med denne fargeendringen kan du tydelig se en sterk progresjon over årene når det gjelder honningpris per pund. Faktisk, hvis du ser på et utvalg i dataene for å verifisere (velg en gitt stat, for eksempel Arizona), kan du se et mønster av prisøkninger år for år, med få unntak:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| stat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
En annen måte å visualisere denne progresjonen på er å bruke størrelse i stedet for farge. For fargeblinde brukere kan dette være et bedre alternativ. Rediger visualiseringen din for å vise en økning i pris ved en økning i prikkens omkrets:
En annen måte å visualisere denne progresjonen på er å bruke størrelse i stedet for farge. For fargeblinde brukere kan dette være et bedre alternativ. Rediger visualiseringen for å vise en økning i pris ved en økning i prikkens omkrets:
Er dette et enkelt tilfelle av tilbud og etterspørsel? På grunn av faktorer som klimaendringer og kollaps av kolonier, er det mindre honning tilgjengelig for kjøp år for år, og dermed øker prisen?
@ -97,28 +97,28 @@ For å oppdage en korrelasjon mellom noen av variablene i dette datasettet, la o
## Linjediagrammer
Spørsmål: Er det en tydelig økning i prisen på honning per pund år for år? Du kan enklest oppdage dette ved å lage et enkelt linjediagram:
Spørsmål: Er det en klar økning i prisen på honning per pund år for år? Du kan enklest oppdage dette ved å lage et enkelt linjediagram:
✅ Fordi Seaborn aggregerer data rundt én linje, viser den "de flere målingene ved hver x-verdi ved å plotte gjennomsnittet og 95% konfidensintervallet rundt gjennomsnittet". [Kilde](https://seaborn.pydata.org/tutorial/relational.html). Denne tidkrevende oppførselen kan deaktiveres ved å legge til `ci=None`.
✅ Fordi Seaborn aggregerer data rundt én linje, viser det "de flere målingene ved hver x-verdi ved å plotte gjennomsnittet og 95% konfidensintervallet rundt gjennomsnittet". [Kilde](https://seaborn.pydata.org/tutorial/relational.html). Denne tidkrevende oppførselen kan deaktiveres ved å legge til `ci=None`.
Spørsmål: Vel, i 2003, kan vi også se en topp i honningtilførselen? Hva om du ser på total produksjon år for år?
Spørsmål: Vel, i 2003 kan vi også se en topp i honningtilførselen? Hva om du ser på total produksjon år for år?
Svar: Ikke egentlig. Hvis du ser på total produksjon, ser det faktisk ut til at den økte det året, selv om mengden honning som produseres generelt sett er i nedgang i løpet av disse årene.
Svar: Ikke egentlig. Hvis du ser på total produksjon, ser det faktisk ut til å ha økt det året, selv om mengden honning som produseres generelt sett er i nedgang i disse årene.
Spørsmål: I så fall, hva kan ha forårsaket den prisøkningen på honning rundt 2003?
Spørsmål: I så fall, hva kan ha forårsaket den toppen i prisen på honning rundt 2003?
For å oppdage dette kan du utforske et facet grid.
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
I denne visualiseringen kan du sammenligne avkastning per koloni og antall kolonier år for år, side om side med en wrap satt til 3 for kolonnene:
I denne visualiseringen kan du sammenligne avkastning per koloni og antall kolonier år for år, side om side med wrap satt til 3 for kolonnene:
For dette datasettet skiller ingenting seg spesielt ut med hensyn til antall kolonier og deres avkastning, år for år og delstat for delstat. Er det en annen måte å finne en korrelasjon mellom disse to variablene?
For dette datasettet skiller ingenting seg spesielt ut med hensyn til antall kolonier og deres avkastning, år for år og stat for stat. Er det en annen måte å se på korrelasjonen mellom disse to variablene?
## Dobbeltlinjediagrammer
## Dual-line Plots
Prøv et flerdobbeltdiagram ved å legge to linjediagrammer oppå hverandre, ved å bruke Seaborns 'despine' for å fjerne topp- og høyresidene, og ved å bruke `ax.twinx` [fra Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx lar et diagram dele x-aksen og vise to y-akser. Så, vis avkastning per koloni og antall kolonier, lagt oppå hverandre:
Prøv et multiline diagram ved å legge to linjediagrammer oppå hverandre, ved å bruke Seaborns 'despine' for å fjerne deres øvre og høyre ryggrad, og bruke `ax.twinx` [avledet fra Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx lar et diagram dele x-aksen og vise to y-akser. Så, vis avkastning per koloni og antall kolonier, lagt oppå hverandre:
Selv om ingenting skiller seg ut rundt året 2003, lar det oss avslutte denne leksjonen på en litt gladere tone: selv om det totalt sett er et synkende antall kolonier, stabiliserer antallet kolonier seg, selv om avkastningen per koloni synker.
Selv om ingenting skiller seg ut rundt året 2003, lar det oss avslutte denne leksjonen på en litt lykkeligere tone: selv om det generelt er et synkende antall kolonier, stabiliserer antallet kolonier seg, selv om deres avkastning per koloni er i nedgang.
Heia biene! 🐝❤️
Heia, bier, heia!
🐝❤️
## 🚀 Utfordring
I denne leksjonen lærte du litt mer om andre bruksområder for spredningsdiagrammer og linjenett, inkludert facet grids. Utfordre deg selv til å lage et facet grid ved å bruke et annet datasett, kanskje et du brukte tidligere i disse leksjonene. Legg merke til hvor lang tid det tar å lage dem, og hvor forsiktig du må være med hvor mange grids du trenger å tegne ved bruk av disse teknikkene.
I denne leksjonen lærte du litt mer om andre bruksområder for spredningsdiagrammer og linjediagrammer, inkludert facet grids. Utfordre deg selv til å lage et facet grid ved å bruke et annet datasett, kanskje et du brukte tidligere i disse leksjonene. Legg merke til hvor lang tid det tar å lage dem og hvordan du må være forsiktig med hvor mange grids du trenger å tegne ved bruk av disse teknikkene.
## [Quiz etter forelesning](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## [Quiz etter leksjonen](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Gjennomgang og selvstudium
Linjediagrammer kan være enkle eller ganske komplekse. Les litt i [Seaborns dokumentasjon](https://seaborn.pydata.org/generated/seaborn.lineplot.html) om de ulike måtene du kan bygge dem på. Prøv å forbedre linjediagrammene du laget i denne leksjonen med andre metoder som er oppført i dokumentasjonen.
## Gjennomgang & Selvstudie
Linjediagrammer kan være enkle eller ganske komplekse. Les litt i [Seaborns dokumentasjon](https://seaborn.pydata.org/generated/seaborn.lineplot.html) om de ulike måtene du kan bygge dem på. Prøv å forbedre linjediagrammene du bygde i denne leksjonen med andre metoder som er oppført i dokumentasjonen.
## Oppgave
[Utforsk bikuben](assignment.md)
[Dykk inn i bikuben](assignment.md)
---
**Ansvarsfraskrivelse**:
Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selv om vi tilstreber nøyaktighet, vennligst vær oppmerksom på at automatiske oversettelser kan inneholde feil eller unøyaktigheter. Det originale dokumentet på sitt opprinnelige språk bør anses som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for eventuelle misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen.
Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selv om vi streber etter nøyaktighet, vær oppmerksom på at automatiske oversettelser kan inneholde feil eller unøyaktigheter. Det originale dokumentet på sitt opprinnelige språk bør anses som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen.
|Wizualizacja relacji - _Sketchnote autorstwa [@nitya](https://twitter.com/nitya)_ |
Kontynuując nasz fokus na naturę w badaniach, odkryjmy ciekawe wizualizacje, które pokazują relacje między różnymi rodzajami miodu, zgodnie z danymi pochodzącymi z [Departamentu Rolnictwa Stanów Zjednoczonych](https://www.nass.usda.gov/About_NASS/index.php).
Kontynuując nasz fokus na naturę w badaniach, odkryjmy ciekawe wizualizacje, które pokazują relacje między różnymi rodzajami miodu, na podstawie danych pochodzących z [Departamentu Rolnictwa Stanów Zjednoczonych](https://www.nass.usda.gov/About_NASS/index.php).
Ten zestaw danych, zawierający około 600 pozycji, przedstawia produkcję miodu w wielu stanach USA. Na przykład można przeanalizować liczbę kolonii, wydajność na kolonię, całkowitą produkcję, zapasy, cenę za funt oraz wartość wyprodukowanego miodu w danym stanie w latach 1998-2012, z jednym wierszem na rok dla każdego stanu.
Ten zbiór danych, zawierający około 600 pozycji, przedstawia produkcję miodu w wielu stanach USA. Można na przykład przeanalizować liczbę kolonii, wydajność na kolonię, całkowitą produkcję, zapasy, cenę za funt oraz wartość wyprodukowanego miodu w danym stanie w latach 1998-2012, z jednym wierszem na każdy rok dla każdego stanu.
Ciekawie będzie zwizualizować relację między produkcją danego stanu w danym roku a, na przykład, ceną miodu w tym stanie. Alternatywnie, można zwizualizować relację między wydajnością miodu na kolonię w różnych stanach. Ten zakres lat obejmuje niszczycielski 'CCD' czyli 'Colony Collapse Disorder', który po raz pierwszy zaobserwowano w 2006 roku (http://npic.orst.edu/envir/ccd.html), co czyni ten zestaw danych szczególnie interesującym do analizy. 🐝
Ciekawie będzie zwizualizować relację między produkcją w danym stanie w danym roku a, na przykład, ceną miodu w tym stanie. Alternatywnie, można zwizualizować relację między wydajnością miodu na kolonię w różnych stanach. Ten zakres czasowy obejmuje niszczycielski okres 'CCD' (Colony Collapse Disorder), który po raz pierwszy zaobserwowano w 2006 roku (http://npic.orst.edu/envir/ccd.html), co czyni ten zbiór danych szczególnie wartym analizy. 🐝
## [Quiz przed wykładem](https://ff-quizzes.netlify.app/en/ds/quiz/22)
W tej lekcji możesz użyć biblioteki Seaborn, którą już wcześniej stosowałeś, jako świetnego narzędzia do wizualizacji relacji między zmiennymi. Szczególnie interesująca jest funkcja `relplot` w Seaborn, która umożliwia tworzenie wykresów punktowych i liniowych, aby szybko zwizualizować '[relacje statystyczne](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', co pozwala naukowcom danych lepiej zrozumieć, jak zmienne są ze sobą powiązane.
W tej lekcji możesz użyć biblioteki Seaborn, którą już wcześniej stosowałeś, jako świetnego narzędzia do wizualizacji relacji między zmiennymi. Szczególnie interesująca jest funkcja `relplot` w Seaborn, która pozwala na szybkie tworzenie wykresów punktowych i liniowych, aby zwizualizować '[relacje statystyczne](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', co pozwala naukowcom danych lepiej zrozumieć, jak zmienne są ze sobą powiązane.
## Wykresy punktowe
Użyj wykresu punktowego, aby pokazać, jak cena miodu zmieniała się rok po roku w poszczególnych stanach. Seaborn, korzystając z `relplot`, wygodnie grupuje dane stanowe i wyświetla punkty danych zarówno dla danych kategorycznych, jak i numerycznych.
Użyj wykresu punktowego, aby pokazać, jak cena miodu zmieniała się rok po roku w poszczególnych stanach. Seaborn, korzystając z `relplot`, wygodnie grupuje dane stanowe i wyświetla punkty danych zarówno dla danych kategorycznych, jak i liczbowych.
Zacznijmy od zaimportowania danych i biblioteki Seaborn:
@ -36,9 +36,9 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Zauważ, że dane o miodzie zawierają kilka interesujących kolumn, w tym rok i cenę za funt. Przyjrzyjmy się tym danym, pogrupowanym według stanów USA:
Zauważysz, że dane o miodzie zawierają kilka interesujących kolumn, w tym rok i cenę za funt. Przyjrzyjmy się tym danym, pogrupowanym według stanów USA:
| stan | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | rok |
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Stwórz podstawowy wykres punktowy, aby pokazać relację między ceną za funt miodu a stanem jego pochodzenia. Ustaw oś `y`wystarczająco wysoką, aby wyświetlić wszystkie stany:
Stwórz podstawowy wykres punktowy, aby pokazać relację między ceną za funt miodu a stanem jego pochodzenia. Ustaw oś `y`na tyle wysoką, aby wyświetlić wszystkie stany:
Teraz pokaż te same dane z kolorystyką inspirowaną miodem, aby zobrazować, jak cena zmienia się na przestrzeni lat. Możesz to zrobić, dodając parametr 'hue', który pokazuje zmiany rok po roku:
Teraz pokaż te same dane z kolorystyką nawiązującą do miodu, aby zobrazować, jak cena zmienia się na przestrzeni lat. Możesz to zrobić, dodając parametr 'hue', który pokaże zmiany rok po roku:
> ✅ Dowiedz się więcej o [paletach kolorów dostępnych w Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - wypróbuj piękną tęczową paletę kolorów!
> ✅ Dowiedz się więcej o [paletach kolorów dostępnych w Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - wypróbuj piękną paletę tęczową!
Dzięki tej zmianie kolorystyki widać wyraźnie silny postęp w cenach na przestrzeni lat. Rzeczywiście, jeśli spojrzysz na próbkę danych, aby to zweryfikować (wybierz na przykład stan Arizona), możesz zauważyć wzorzec wzrostu cen rok po roku, z kilkoma wyjątkami:
Dzięki tej zmianie kolorystyki możesz zauważyć wyraźny wzrost ceny na przestrzeni lat. Jeśli spojrzysz na próbkę danych (na przykład dla stanu Arizona), zobaczysz wzorzec wzrostu cen rok po roku, z kilkoma wyjątkami:
| stan | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | rok |
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Innym sposobem wizualizacji tego postępu jest użycie rozmiaru zamiast koloru. Dla osób z daltonizmem może to być lepsza opcja. Zmień swoją wizualizację, aby pokazać wzrost ceny poprzez zwiększenie obwodu punktów:
Innym sposobem wizualizacji tego wzrostu jest użycie rozmiaru zamiast koloru. Dla osób z daltonizmem może to być lepsza opcja. Zmień wizualizację, aby pokazać wzrost ceny poprzez zwiększenie obwodu punktów:
Czy to prosty przypadek podaży i popytu? Czy z powodu takich czynników jak zmiany klimatyczne i zanik kolonii jest mniej miodu dostępnego do zakupu rok po roku, a co za tym idzie, cena wzrasta?
Czy to prosty przypadek podaży i popytu? Czy z powodu takich czynników jak zmiany klimatyczne i zapaść kolonii dostępność miodu maleje z roku na rok, a cena rośnie?
Aby odkryć korelację między niektórymi zmiennymi w tym zestawie danych, przyjrzyjmy się wykresom liniowym.
Aby odkryć korelację między niektórymi zmiennymi w tym zbiorze danych, przyjrzyjmy się wykresom liniowym.
## Wykresy liniowe
@ -102,31 +102,31 @@ Pytanie: Czy istnieje wyraźny wzrost ceny miodu za funt rok po roku? Najłatwie
✅ Ponieważ Seaborn agreguje dane wokół jednej linii, wyświetla "wiele pomiarów dla każdej wartości x, rysując średnią i 95% przedział ufności wokół średniej". [Źródło](https://seaborn.pydata.org/tutorial/relational.html). To czasochłonne zachowanie można wyłączyć, dodając `ci=None`.
✅ Ponieważ Seaborn agreguje dane w jednej linii, wyświetla "wiele pomiarów dla każdej wartości x, rysując średnią i 95% przedział ufności wokół średniej". [Źródło](https://seaborn.pydata.org/tutorial/relational.html). To czasochłonne zachowanie można wyłączyć, dodając `ci=None`.
Pytanie: Cóż, czy w 2003 roku można również zauważyć wzrost podaży miodu? Co jeśli spojrzysz na całkowitą produkcję rok po roku?
Pytanie: Czy w 2003 roku można również zauważyć wzrost podaży miodu? Co jeśli spojrzysz na całkowitą produkcję rok po roku?
Odpowiedź: Niekoniecznie. Jeśli spojrzysz na całkowitą produkcję, wydaje się, że faktycznie wzrosła w tym konkretnym roku, mimo że ogólnie rzecz biorąc ilość produkowanego miodu maleje w tych latach.
Odpowiedź: Niekoniecznie. Jeśli spojrzysz na całkowitą produkcję, wydaje się, że w tym konkretnym roku faktycznie wzrosła, mimo że ogólnie rzecz biorąc ilość produkowanego miodu maleje w tych latach.
Pytanie: W takim razie, co mogło spowodować ten wzrost ceny miodu w okolicach roku 2003?
Pytanie: W takim razie, co mogło spowodować wzrost ceny miodu w okolicach roku 2003?
Aby to odkryć, możesz zbadać siatkę wykresów.
Aby to odkryć, możesz zbadać siatkę wykresów (facet grid).
## Siatki wykresów
## Siatki wykresów (Facet grids)
Siatki wykresów biorą jeden aspekt twojego zestawu danych (w naszym przypadku możesz wybrać 'rok', aby uniknąć zbyt wielu wygenerowanych wykresów). Seaborn może następnie stworzyć wykres dla każdego z tych aspektów, używając wybranych współrzędnych x i y, co ułatwia porównanie. Czy rok 2003 wyróżnia się w tego typu porównaniu?
Siatki wykresów pozwalają na podział danych na mniejsze części (w naszym przypadku możesz wybrać 'rok', aby uniknąć zbyt wielu podziałów). Seaborn może następnie stworzyć wykres dla każdej z tych części, co ułatwia porównanie. Czy rok 2003 wyróżnia się w tego typu porównaniu?
Stwórz siatkę wykresów, kontynuując użycie `relplot`, zgodnie z zaleceniami [dokumentacji Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
Stwórz siatkę wykresów, kontynuując użycie `relplot`, jak zaleca [dokumentacja Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Na tej wizualizacji możesz porównać wydajność na kolonię i liczbę kolonii rok po roku, obok siebie, z ustawionym wrapem na 3 dla kolumn:
Na tej wizualizacji możesz porównać wydajność na kolonię i liczbę kolonii rok po roku, obok siebie, z ustawieniem wrap na 3 dla kolumn:
Dla tego zestawu danych nic szczególnego nie wyróżnia się w odniesieniu do liczby kolonii i ich wydajności rok po roku oraz stan po stanie. Czy istnieje inny sposób na znalezienie korelacji między tymi dwoma zmiennymi?
Dla tego zbioru danych nic szczególnego nie wyróżnia się w odniesieniu do liczby kolonii i ich wydajności rok po roku oraz stan po stanie. Czy istnieje inny sposób na znalezienie korelacji między tymi dwiema zmiennymi?
## Wykresy z dwiema liniami
Spróbuj wykresu wieloliniowego, nakładając na siebie dwa wykresy liniowe, używając funkcji 'despine' w Seaborn, aby usunąć górne i prawe osie, oraz funkcji`ax.twinx` [pochodzącej z Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx pozwala wykresowi dzielić oś x i wyświetlać dwie osie y. Wyświetl wydajność na kolonię i liczbę kolonii, nałożone na siebie:
Spróbuj stworzyć wykres z wieloma liniami, nakładając na siebie dwa wykresy liniowe, używając funkcji 'despine' w Seaborn, aby usunąć górne i prawe osie, oraz `ax.twinx` [pochodzącej z Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx pozwala na współdzielenie osi x i wyświetlanie dwóch osi y. Wyświetl wydajność na kolonię i liczbę kolonii, nakładając je na siebie:
Chociaż nic szczególnego nie rzuca się w oczy w okolicach roku 2003, pozwala nam to zakończyć tę lekcję na nieco bardziej optymistycznej nucie: mimo że ogólnie liczba kolonii maleje, liczba kolonii stabilizuje się, nawet jeśli ich wydajność na kolonię spada.
Chociaż nic szczególnego nie rzuca się w oczy w okolicach roku 2003, pozwala to zakończyć tę lekcję na nieco bardziej optymistycznej nucie: mimo ogólnego spadku liczby kolonii, ich liczba stabilizuje się, nawet jeśli wydajność na kolonię maleje.
Brawo, pszczoły, brawo!
Do boju, pszczoły! 🐝❤️
🐝❤️
## 🚀 Wyzwanie
W tej lekcji dowiedziałeś się więcej o innych zastosowaniach wykresów punktowych i siatek wykresów, w tym siatek wykresów. Wyzwanie dla ciebie: stwórz siatkę wykresów, używając innego zestawu danych, może takiego, którego używałeś wcześniej w tych lekcjach. Zauważ, jak długo zajmuje ich tworzenie i jak musisz być ostrożny w kwestii liczby siatek, które chcesz wygenerować, korzystając z tych technik.
W tej lekcji dowiedziałeś się więcej o zastosowaniach wykresów punktowych i siatek wykresów, w tym siatek typu facet. Wyzwanie dla Ciebie: stwórz siatkę wykresów, używając innego zbioru danych, być może takiego, którego używałeś wcześniej w tych lekcjach. Zwróć uwagę, ile czasu zajmuje ich tworzenie i jak ważne jest ostrożne dobieranie liczby siatek do rysowania przy użyciu tych technik.
## [Quiz po wykładzie](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Przegląd i samodzielna nauka
Wykresy liniowe mogą być proste lub dość złożone. Poczytaj trochę w [dokumentacji Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) o różnych sposobach ich budowy. Spróbuj ulepszyć wykresy liniowe, które stworzyłeś w tej lekcji, korzystając z innych metod wymienionych w dokumentacji.
Wykresy liniowe mogą być proste lub dość złożone. Przeczytaj trochę w [dokumentacji Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) o różnych sposobach ich budowy. Spróbuj ulepszyć wykresy liniowe, które stworzyłeś w tej lekcji, korzystając z innych metod wymienionych w dokumentacji.
## Zadanie
[Zanurz się w ulu](assignment.md)
@ -184,4 +185,4 @@ Wykresy liniowe mogą być proste lub dość złożone. Poczytaj trochę w [doku
---
**Zastrzeżenie**:
Ten dokument został przetłumaczony za pomocą usługi tłumaczenia AI [Co-op Translator](https://github.com/Azure/co-op-translator). Chociaż dokładamy wszelkich starań, aby zapewnić poprawność tłumaczenia, prosimy pamiętać, że automatyczne tłumaczenia mogą zawierać błędy lub nieścisłości. Oryginalny dokument w jego rodzimym języku powinien być uznawany za wiarygodne źródło. W przypadku informacji o kluczowym znaczeniu zaleca się skorzystanie z profesjonalnego tłumaczenia przez człowieka. Nie ponosimy odpowiedzialności za jakiekolwiek nieporozumienia lub błędne interpretacje wynikające z użycia tego tłumaczenia.
Ten dokument został przetłumaczony za pomocą usługi tłumaczeniowej AI [Co-op Translator](https://github.com/Azure/co-op-translator). Chociaż dokładamy wszelkich starań, aby tłumaczenie było precyzyjne, prosimy pamiętać, że automatyczne tłumaczenia mogą zawierać błędy lub nieścisłości. Oryginalny dokument w jego rodzimym języku powinien być uznawany za wiarygodne źródło. W przypadku informacji krytycznych zaleca się skorzystanie z profesjonalnego tłumaczenia wykonanego przez człowieka. Nie ponosimy odpowiedzialności za jakiekolwiek nieporozumienia lub błędne interpretacje wynikające z korzystania z tego tłumaczenia.
|Visualizar Relações - _Sketchnote por [@nitya](https://twitter.com/nitya)_ |
Dando continuidade ao foco na natureza da nossa pesquisa, vamos descobrir visualizações interessantes para mostrar as relações entre vários tipos de mel, de acordo com um conjunto de dados derivado do [Departamento de Agricultura dos Estados Unidos](https://www.nass.usda.gov/About_NASS/index.php).
Dando continuidade ao foco na natureza da nossa pesquisa, vamos descobrir visualizações interessantes para mostrar as relações entre vários tipos de mel, com base num conjunto de dados derivado do [Departamento de Agricultura dos Estados Unidos](https://www.nass.usda.gov/About_NASS/index.php).
Este conjunto de dados, com cerca de 600 itens, apresenta a produção de mel em muitos estados dos EUA. Por exemplo, é possível analisar o número de colmeias, a produção por colmeia, a produção total, os estoques, o preço por libra e o valor do mel produzido em um determinado estado entre 1998 e 2012, com uma linha por ano para cada estado.
Este conjunto de dados, com cerca de 600 itens, apresenta a produção de mel em vários estados dos EUA. Por exemplo, é possível analisar o número de colmeias, a produção por colmeia, a produção total, os estoques, o preço por libra e o valor do mel produzido em determinado estado entre 1998 e 2012, com uma linha por ano para cada estado.
Será interessante visualizar a relação entre a produção anual de um estado e, por exemplo, o preço do mel nesse estado. Alternativamente, pode-se visualizar a relação entre a produção por colmeia em diferentes estados. Este período abrange o devastador 'CCD' ou 'Colony Collapse Disorder' (Desordem do Colapso das Colmeias), observado pela primeira vez em 2006 (http://npic.orst.edu/envir/ccd.html), tornando este um conjunto de dados significativo para estudo. 🐝
Será interessante visualizar a relação entre a produção anual de um estado e, por exemplo, o preço do mel nesse estado. Alternativamente, pode-se visualizar a relação entre a produção por colmeia em diferentes estados. Este período inclui o devastador 'CCD' ou 'Colony Collapse Disorder' (Desordem do Colapso das Colónias), observado pela primeira vez em 2006 (http://npic.orst.edu/envir/ccd.html), tornando este um conjunto de dados relevante para estudo. 🐝
Nesta lição, pode-se usar o Seaborn, que já foi utilizado anteriormente, como uma boa biblioteca para visualizar relações entre variáveis. Particularmente interessante é o uso da função `relplot` do Seaborn, que permite criar gráficos de dispersão e gráficos de linha para visualizar rapidamente '[relações estatísticas](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', ajudando o cientista de dados a compreender melhor como as variáveis se relacionam.
Nesta lição, pode-se usar o Seaborn, que já foi utilizado anteriormente, como uma boa biblioteca para visualizar relações entre variáveis. Particularmente interessante é o uso da função `relplot` do Seaborn, que permite criar gráficos de dispersão e gráficos de linhas para visualizar rapidamente '[relações estatísticas](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', ajudando o cientista de dados a compreender melhor como as variáveis se relacionam.
## Gráficos de Dispersão
Use um gráfico de dispersão para mostrar como o preço do mel evoluiu, ano após ano, por estado. O Seaborn, utilizando `relplot`, agrupa convenientemente os dados por estado e exibe pontos de dados para dados categóricos e numéricos.
Vamos começar importando os dados e o Seaborn:
Vamos começar por importar os dados e o Seaborn:
```python
import pandas as pd
@ -36,22 +36,22 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Você notará que os dados sobre mel possuem várias colunas interessantes, incluindo ano e preço por libra. Vamos explorar esses dados, agrupados por estado dos EUA:
Nota-se que os dados sobre o mel possuem várias colunas interessantes, incluindo o ano e o preço por libra. Vamos explorar esses dados, agrupados por estado dos EUA:
| estado | numcol | prodporcol | prodtotal | estoques | precoporlibra | valorprod | ano |
Crie um gráfico de dispersão básico para mostrar a relação entre o preço por libra de mel e o estado de origem nos EUA. Ajuste o eixo `y` para ser alto o suficiente para exibir todos os estados:
Crie um gráfico de dispersão básico para mostrar a relação entre o preço por libra do mel e o estado de origem nos EUA. Ajuste o eixo `y` para ser alto o suficiente para exibir todos os estados:


Agora, mostre os mesmos dados com um esquema de cores de mel para ilustrar como o preço evolui ao longo dos anos. Pode-se fazer isso adicionando um parâmetro 'hue' para mostrar a mudança, ano após ano:
@ -60,73 +60,73 @@ Agora, mostre os mesmos dados com um esquema de cores de mel para ilustrar como

Com essa mudança no esquema de cores, é possível perceber claramente uma forte progressão ao longo dos anos no preço do mel por libra. De fato, ao verificar um conjunto de amostras nos dados (escolha um estado, como o Arizona, por exemplo), é possível observar um padrão de aumento de preços ano após ano, com poucas exceções:
| estado | numcol | prodporcol | prodtotal | estoques | precoporlibra | valorprod | ano |
Outra forma de visualizar essa progressão é usar o tamanho, em vez da cor. Para utilizadores daltônicos, isso pode ser uma opção melhor. Edite a visualização para mostrar o aumento do preço através do aumento na circunferência dos pontos:

Com esta mudança no esquema de cores, é possível perceber claramente uma forte progressão ao longo dos anos no preço do mel por libra. De fato, ao verificar um conjunto de amostras nos dados (escolha um estado, como o Arizona, por exemplo), é possível observar um padrão de aumento de preços ano após ano, com poucas exceções:
| estado | numcol | prodporcol | prodtotal | estoques | precoporlb | valorprod | ano |
Outra forma de visualizar esta progressão é usar o tamanho, em vez da cor. Para utilizadores daltónicos, esta pode ser uma opção melhor. Edite a visualização para mostrar o aumento do preço através do aumento da circunferência dos pontos:
Pode-se observar que o tamanho dos pontos aumenta gradualmente.


Será que isso é um caso simples de oferta e procura? Devido a fatores como mudanças climáticas e o colapso das colmeias, há menos mel disponível para compra ano após ano, e, portanto, o preço aumenta?
Será este um caso simples de oferta e procura? Devido a fatores como mudanças climáticas e o colapso das colónias, haverá menos mel disponível para compra ano após ano, e, assim, o preço aumenta?
Para descobrir uma correlação entre algumas das variáveis deste conjunto de dados, vamos explorar alguns gráficos de linha.
Para descobrir uma correlação entre algumas das variáveis deste conjunto de dados, vamos explorar alguns gráficos de linhas.
## Gráficos de Linha
## Gráficos de Linhas
Pergunta: Existe um aumento claro no preço do mel por libra ao longo dos anos? Isso pode ser facilmente descoberto criando um único gráfico de linha:
Pergunta: Existe um aumento claro no preço do mel por libra ao longo dos anos? Pode-se descobrir isso facilmente criando um único gráfico de linhas:
Resposta: Sim, com algumas exceções por volta do ano 2003:


✅ Como o Seaborn está agregando dados em torno de uma linha, ele exibe "as múltiplas medições em cada valor de x, traçando a média e o intervalo de confiança de 95% em torno da média". [Fonte](https://seaborn.pydata.org/tutorial/relational.html). Esse comportamento, que consome tempo, pode ser desativado adicionando `ci=None`.
✅ Como o Seaborn está a agregar dados numa única linha, ele exibe "as múltiplas medições em cada valor de x, traçando a média e o intervalo de confiança de 95% em torno da média". [Fonte](https://seaborn.pydata.org/tutorial/relational.html). Este comportamento, que consome tempo, pode ser desativado adicionando `ci=None`.
Pergunta: Bem, em 2003 também é possível observar um pico na oferta de mel? E se analisarmos a produção total ano após ano?
Pergunta: Bem, em 2003 também podemos observar um pico na oferta de mel? E se analisarmos a produção total ano após ano?


Resposta: Não exatamente. Ao observar a produção total, parece que ela realmente aumentou naquele ano específico, embora, de forma geral, a quantidade de mel produzida esteja em declínio durante esses anos.
Resposta: Não exatamente. Ao observar a produção total, parece que ela realmente aumentou naquele ano específico, embora, de forma geral, a quantidade de mel produzido esteja em declínio durante esses anos.
Pergunta: Nesse caso, o que poderia ter causado o aumento no preço do mel por volta de 2003?
Para descobrir isso, pode-se explorar uma grade de facetas.
Para descobrir isso, pode-se explorar uma grelha de facetas.
## Grades de Facetas
## Grelhas de Facetas
As grades de facetas utilizam uma faceta do conjunto de dados (neste caso, pode-se escolher 'ano' para evitar a produção de muitas facetas). O Seaborn pode então criar um gráfico para cada uma dessas facetas com as coordenadas x e y escolhidas, facilitando a comparação visual. O ano de 2003 se destaca nesse tipo de comparação?
As grelhas de facetas utilizam uma faceta do conjunto de dados (neste caso, pode-se escolher 'ano' para evitar produzir muitas facetas). O Seaborn pode então criar um gráfico para cada uma dessas facetas com as coordenadas x e y escolhidas, facilitando a comparação visual. O ano de 2003 destaca-se neste tipo de comparação?
Crie uma grade de facetas continuando a usar `relplot`, conforme recomendado pela [documentação do Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
Crie uma grelha de facetas continuando a usar `relplot`, conforme recomendado pela [documentação do Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Nesta visualização, pode-se comparar a produção por colmeia e o número de colmeias ano após ano, lado a lado, com um limite de 3 colunas:


Para este conjunto de dados, nada particularmente se destaca em relação ao número de colmeias e sua produção, ano após ano e estado por estado. Existe uma forma diferente de encontrar uma correlação entre essas duas variáveis?
Para este conjunto de dados, nada particularmente se destaca em relação ao número de colmeias e sua produção, ano após ano e estado por estado. Existe uma forma diferente de encontrar uma correlação entre estas duas variáveis?
## Gráficos de Linhas Duplas
Experimente um gráfico de linhas múltiplas sobrepondo dois gráficos de linha, utilizando o 'despine' do Seaborn para remover as bordas superior e direita, e usando `ax.twinx` [derivado do Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). O Twinx permite que um gráfico compartilhe o eixo x e exiba dois eixos y. Assim, exiba a produção por colmeia e o número de colmeias, sobrepostos:
Experimente um gráfico de linhas múltiplas sobrepondo dois gráficos de linhas um sobre o outro, utilizando o 'despine' do Seaborn para remover as margens superior e direita, e usando `ax.twinx` [derivado do Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). O Twinx permite que um gráfico compartilhe o eixo x e exiba dois eixos y. Assim, exiba a produção por colmeia e o número de colmeias, sobrepostos:
Embora nada salte aos olhos em torno do ano de 2003, isso nos permite terminar esta lição com uma nota um pouco mais feliz: embora o número de colmeias esteja em declínio geral, ele está a estabilizar-se, mesmo que a produção por colmeia esteja a diminuir.
Embora nada salte aos olhos em relação ao ano de 2003, isso permite encerrar esta lição com uma nota um pouco mais feliz: embora o número de colmeias esteja em declínio geral, ele está a estabilizar, mesmo que a produção por colmeia esteja a diminuir.
Força, abelhas! 🐝❤️
## 🚀 Desafio
Nesta lição, aprendeu-se um pouco mais sobre outros usos de gráficos de dispersão e grades de linha, incluindo grades de facetas. Desafie-se a criar uma grade de facetas utilizando um conjunto de dados diferente, talvez um que tenha sido usado anteriormente nestas lições. Note quanto tempo leva para criar e como é necessário ter cuidado com o número de grades a serem desenhadas utilizando essas técnicas.
Nesta lição, aprendeu-se um pouco mais sobre outros usos de gráficos de dispersão e grelhas de linhas, incluindo grelhas de facetas. Desafie-se a criar uma grelha de facetas utilizando um conjunto de dados diferente, talvez um que tenha usado antes destas lições. Note quanto tempo demora a criar e como é necessário ter cuidado com o número de grelhas a desenhar utilizando estas técnicas.
Os gráficos de linha podem ser simples ou bastante complexos. Faça uma leitura na [documentação do Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) sobre as várias formas de construí-los. Tente melhorar os gráficos de linha criados nesta lição com outros métodos listados na documentação.
Os gráficos de linhas podem ser simples ou bastante complexos. Leia um pouco mais na [documentação do Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) sobre as várias formas de construí-los. Tente melhorar os gráficos de linhas que criou nesta lição com outros métodos listados na documentação.
## Tarefa
@ -184,4 +185,4 @@ Os gráficos de linha podem ser simples ou bastante complexos. Faça uma leitura
---
**Aviso Legal**:
Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução.
Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional humana. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.
| ](../../sketchnotes/12-Visualizing-Relationships.png)|
| ](../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|Vizualizarea Relațiilor - _Sketchnote de [@nitya](https://twitter.com/nitya)_ |
|Vizualizarea Relațiilor - _Sketchnote realizat de [@nitya](https://twitter.com/nitya)_ |
Continuând cu accentul pe natură al cercetării noastre, să descoperim vizualizări interesante pentru a arăta relațiile dintre diferite tipuri de miere, conform unui set de date derivat de la [Departamentul de Agricultură al Statelor Unite](https://www.nass.usda.gov/About_NASS/index.php).
Continuând cu tema naturii din cercetările noastre, să descoperim vizualizări interesante pentru a arăta relațiile dintre diferitele tipuri de miere, conform unui set de date derivat din [Departamentul de Agricultură al Statelor Unite](https://www.nass.usda.gov/About_NASS/index.php).
Acest set de date, care conține aproximativ 600 de elemente, prezintă producția de miere în multe state din SUA. De exemplu, poți analiza numărul de colonii, randamentul per colonie, producția totală, stocurile, prețul pe kilogram și valoarea mierii produse într-un anumit stat între anii 1998-2012, cu câte un rând pe an pentru fiecare stat.
Acest set de date, care conține aproximativ 600 de elemente, prezintă producția de miere în multe state din SUA. De exemplu, poți analiza numărul de colonii, producția per colonie, producția totală, stocurile, prețul pe liră și valoarea mierii produse într-un anumit stat între anii 1998-2012, cu câte un rând pentru fiecare an din fiecare stat.
Va fi interesant să vizualizăm relația dintre producția anuală a unui stat și, de exemplu, prețul mierii în acel stat. Alternativ, ai putea vizualiza relația dintre randamentul mierii per colonie în diferite state. Această perioadă acoperă devastatorul fenomen 'CCD' sau 'Colony Collapse Disorder', observat pentru prima dată în 2006 (http://npic.orst.edu/envir/ccd.html), ceea ce face ca acest set de date să fie unul emoționant de studiat. 🐝
Ar fi interesant să vizualizăm relația dintre producția anuală a unui stat și, de exemplu, prețul mierii în acel stat. Alternativ, ai putea vizualiza relația dintre producția de miere per colonie în diferite state. Această perioadă acoperă apariția devastatoare a 'CCD' sau 'Colony Collapse Disorder', observată pentru prima dată în 2006 (http://npic.orst.edu/envir/ccd.html), ceea ce face ca acest set de date să fie unul deosebit de relevant pentru studiu. 🐝
## [Chestionar înainte de lecție](https://ff-quizzes.netlify.app/en/ds/quiz/22)
În această lecție, poți folosi Seaborn, pe care l-ai utilizat anterior, ca o bibliotecă excelentă pentru a vizualiza relațiile dintre variabile. Este deosebit de interesantă funcția `relplot` din Seaborn, care permite realizarea de scatter plots și line plots pentru a vizualiza rapid '[relațiile statistice](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', ajutând astfel data scientist-ul să înțeleagă mai bine cum se relaționează variabilele între ele.
În această lecție, poți folosi Seaborn, o bibliotecă pe care ai mai utilizat-o, pentru a vizualiza relațiile dintre variabile. Este deosebit de interesantă funcția `relplot` din Seaborn, care permite crearea rapidă de diagrame scatter și diagrame liniare pentru a vizualiza '[relațiile statistice](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', ajutând astfel oamenii de știință în date să înțeleagă mai bine cum se raportează variabilele între ele.
## Scatterplots
## Diagrame Scatter
Folosește un scatterplot pentru a arăta cum a evoluat prețul mierii, an de an, în fiecare stat. Seaborn, utilizând`relplot`, grupează convenabil datele pe state și afișează puncte de date atât pentru date categorice, cât și pentru date numerice.
Folosește o diagramă scatter pentru a arăta cum a evoluat prețul mierii, an de an, în fiecare stat. Seaborn, prin`relplot`, grupează convenabil datele pe state și afișează puncte de date atât pentru date categorice, cât și numerice.
Să începem prin importarea datelor și a bibliotecii Seaborn:
Să începem prin a importa datele și biblioteca Seaborn:
```python
import pandas as pd
@ -36,9 +36,9 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Observi că datele despre miere au mai multe coloane interesante, inclusiv anul și prețul pe kilogram. Să explorăm aceste date, grupate pe statele din SUA:
Observi că datele despre miere conțin mai multe coloane interesante, inclusiv anul și prețul pe liră. Să explorăm aceste date, grupate pe state din SUA:
| stat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Creează un scatterplot de bază pentru a arăta relația dintre prețul pe kilogram al mierii și statul de origine al acesteia. Fă ca axa `y` să fie suficient de înaltă pentru a afișa toate statele:
Creează o diagramă scatter de bază pentru a arăta relația dintre prețul pe liră al mierii și statul de origine. Fă axa `y` suficient de înaltă pentru a afișa toate statele:
Acum, arată aceleași date cu o schemă de culori inspirată de miere pentru a evidenția cum evoluează prețul de-a lungul anilor. Poți face acest lucru adăugând un parametru 'hue' pentru a arăta schimbarea, an de an:
Acum, afișează aceleași date cu o schemă de culori inspirată de miere pentru a arăta cum evoluează prețul de-a lungul anilor. Poți face acest lucru adăugând un parametru 'hue' pentru a evidenția schimbările anuale:
> ✅ Află mai multe despre [paletele de culori pe care le poți folosi în Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - încearcă o frumoasă schemă de culori curcubeu!
> ✅ Află mai multe despre [paletele de culori pe care le poți folosi în Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - încearcă o schemă de culori curcubeu!
Cu această schimbare de schemă de culori, poți observa clar o progresie puternică de-a lungul anilor în ceea ce privește prețul mierii pe kilogram. De fapt, dacă analizezi un set de date exemplu pentru verificare (alege un stat, Arizona de exemplu), poți vedea un model de creștere a prețului an de an, cu câteva excepții:
Cu această schimbare de culori, poți observa clar o progresie puternică de-a lungul anilor în ceea ce privește prețul pe liră al mierii. De fapt, dacă verifici un set de date eșantion (de exemplu, statul Arizona), poți observa un model de creștere a prețului an de an, cu câteva excepții:
| stat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
O altă modalitate de a vizualiza această progresie este să folosești dimensiunea, în loc de culoare. Pentru utilizatorii daltoniști, aceasta ar putea fi o opțiune mai bună. Editează vizualizarea pentru a arăta creșterea prețului printr-o creștere a circumferinței punctelor:
O altă modalitate de a vizualiza această progresie este să folosești dimensiunea, în loc de culoare. Pentru utilizatorii cu deficiențe de vedere a culorilor, aceasta ar putea fi o opțiune mai bună. Editează vizualizarea pentru a arăta creșterea prețului printr-o creștere a circumferinței punctelor:
Este acesta un caz simplu de cerere și ofertă? Din cauza unor factori precum schimbările climatice și colapsul coloniilor, există mai puțină miere disponibilă pentru cumpărare an de an, iar astfel prețul crește?
Este acesta un caz simplu de cerere și ofertă? Din cauza unor factori precum schimbările climatice și colapsul coloniilor, există mai puțină miere disponibilă pentru cumpărare an de an, ceea ce duce la creșterea prețului?
Pentru a descoperi o corelație între unele dintre variabilele din acest set de date, să explorăm câteva grafice de tip linie.
Pentru a descoperi o corelație între unele dintre variabilele din acest set de date, să explorăm câteva diagrame liniare.
## Grafice de tip linie
## Diagrame liniare
Întrebare: Există o creștere clară a prețului mierii pe kilogram an de an? Poți descoperi acest lucru cel mai ușor prin crearea unui singur grafic de tip linie:
Întrebare: Există o creștere clară a prețului mierii pe liră an de an? Poți descoperi acest lucru cel mai ușor prin crearea unei singure diagrame liniare:
✅ Deoarece Seaborn agregă datele în jurul unei singure linii, afișează "măsurătorile multiple pentru fiecare valoare x prin reprezentarea mediei și a intervalului de încredere de 95% în jurul mediei". [Sursă](https://seaborn.pydata.org/tutorial/relational.html). Acest comportament consumator de timp poate fi dezactivat prin adăugarea`ci=None`.
✅ Deoarece Seaborn agregă datele într-o singură linie, afișează "măsurătorile multiple pentru fiecare valoare x prin reprezentarea mediei și a intervalului de încredere de 95% în jurul mediei". [Sursa](https://seaborn.pydata.org/tutorial/relational.html). Acest comportament consumator de timp poate fi dezactivat adăugând`ci=None`.
Întrebare: Ei bine, în 2003 putem observa și o creștere a cantității de miere? Ce se întâmplă dacă analizezi producția totală an de an?
Întrebare: Ei bine, în 2003 putem observa și o creștere a ofertei de miere? Ce se întâmplă dacă analizezi producția totală an de an?
Răspuns: Nu chiar. Dacă analizezi producția totală, pare să fi crescut în acel an specific, deși, în general, cantitatea de miere produsă este în scădere în acești ani.
Răspuns: Nu chiar. Dacă te uiți la producția totală, aceasta pare să fi crescut în acel an, deși, în general, cantitatea de miere produsă este în scădere în acești ani.
Întrebare: În acest caz, ce ar fi putut cauza acea creșterea prețului mierii în jurul anului 2003?
Întrebare: În acest caz, ce ar fi putut cauza creșterea prețului mierii în jurul anului 2003?
Pentru a descoperi acest lucru, poți explora un facet grid.
Pentru a descoperi acest lucru, poți explora o grilă de fațete.
## Facet grids
## Grile de fațete
Facet grids iau un aspect al setului tău de date (în cazul nostru, poți alege 'anul' pentru a evita producerea unui număr prea mare de aspecte). Seaborn poate apoi să creeze un grafic pentru fiecare dintre aceste aspecte ale coordonatelor x și y alese, pentru o comparație mai ușoară. Se remarcă anul 2003 în acest tip de comparație?
Grilele de fațete iau un aspect al setului de date (în cazul nostru, poți alege 'anul' pentru a evita generarea prea multor fațete). Seaborn poate apoi să creeze un grafic pentru fiecare dintre aceste fațete ale coordonatelor x și y alese, pentru o comparație mai ușoară. Se remarcă anul 2003 în acest tip de comparație?
Creează un facet grid continuând să folosești `relplot`, așa cum este recomandat de [documentația Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
Creează o grilă de fațete continuând să folosești `relplot`, așa cum este recomandat în [documentația Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
În această vizualizare, poți compara randamentul per colonie și numărul de colonii an de an, unul lângă altul, cu wrap setat la 3 pentru coloane:
În această vizualizare, poți compara producția per colonie și numărul de colonii an de an, alăturat, cu o împărțire pe 3 coloane:
Pentru acest set de date, nimic nu pare să iasă în evidență în ceea ce privește numărul de colonii și randamentul acestora, an de an și stat cu stat. Există o altă modalitate de a găsi o corelație între aceste două variabile?
Pentru acest set de date, nimic nu iese în evidență în mod special în ceea ce privește numărul de colonii și producția lor, an de an și stat de stat. Există o altă modalitate de a analiza corelația dintre aceste două variabile?
## Grafice cu linii suprapuse
## Diagrame cu linii duble
Încearcă un grafic cu linii multiple prin suprapunerea a două grafice de tip linie unul peste altul, folosind funcția 'despine' din Seaborn pentru a elimina spinii de sus și din dreapta, și utilizând `ax.twinx` [derivat din Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx permite unui grafic să împartă axa x și să afișeze două axe y. Așadar, afișează randamentul per colonie și numărul de colonii, suprapuse:
Încearcă o diagramă cu linii multiple prin suprapunerea a două diagrame liniare una peste alta, folosind funcția 'despine' din Seaborn pentru a elimina spinii de sus și din dreapta și utilizând `ax.twinx` [derivat din Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx permite unui grafic să împartă axa x și să afișeze două axe y. Așadar, afișează producția per colonie și numărul de colonii, suprapuse:
Deși nimic nu sare în ochi în jurul anului 2003, acest lucru ne permite să încheiem lecția pe o notă puțin mai optimistă: deși numărul de colonii este în general în scădere, acesta pare să se stabilizeze, chiar dacă randamentul per colonie este în scădere.
Deși nimic nu sare în ochi în jurul anului 2003, acest grafic ne permite să încheiem lecția pe o notă mai optimistă: deși numărul coloniilor este în scădere, acesta pare să se stabilizeze, chiar dacă producția per colonie este în scădere.
Hai, albine, hai!
🐝❤️
## 🚀 Provocare
În această lecție, ai învățat mai multe despre alte utilizări ale scatterplots și line grids, inclusiv facet grids. Provocarea ta este să creezi un facet grid folosind un alt set de date, poate unul pe care l-ai utilizat înainte de aceste lecții. Observă cât timp durează să îl creezi și cât de atent trebuie să fii în privința numărului de grile pe care trebuie să le desenezi folosind aceste tehnici.
În această lecție, ai învățat mai multe despre alte utilizări ale diagramelor scatter și ale grilelor de fațete. Provocarea ta este să creezi o grilă de fațete folosind un alt set de date, poate unul pe care l-ai folosit înainte în aceste lecții. Observă cât timp durează să creezi grila și cât de atent trebuie să fii cu privire la numărul de grile pe care trebuie să le generezi folosind aceste tehnici.
## [Chestionar după lecție](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Recapitulare & Studiu Individual
## Recapitulare și Studiu Individual
Graficele de tip linie pot fi simple sau destul de complexe. Citește puțin în [documentația Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) despre diferitele moduri în care le poți construi. Încearcă să îmbunătățești graficele de tip linie pe care le-ai construit în această lecție cu alte metode listate în documentație.
Diagramele liniare pot fi simple sau destul de complexe. Citește mai multe în [documentația Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) despre diferitele moduri în care le poți construi. Încearcă să îmbunătățești diagramele liniare pe care le-ai construit în această lecție cu alte metode listate în documentație.
## Temă
[Explorează stupul](assignment.md)
---
**Declinare de responsabilitate**:
Acest document a fost tradus folosind serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși ne străduim să asigurăm acuratețea, vă rugăm să fiți conștienți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa natală ar trebui considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm responsabilitatea pentru eventualele neînțelegeri sau interpretări greșite care pot apărea din utilizarea acestei traduceri.
**Declinarea responsabilității**:
Acest document a fost tradus folosind serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși depunem eforturi pentru a asigura acuratețea, vă rugăm să rețineți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa nativă ar trebui considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm răspunderea pentru eventualele neînțelegeri sau interpretări greșite care pot apărea din utilizarea acestei traduceri.
|Визуализация связей - _Скетчноут от [@nitya](https://twitter.com/nitya)_ |
Продолжая исследование, связанное с природой, давайте изучим интересные способы визуализации связей между различными типами мёда, основываясь на наборе данных, полученном из [Министерства сельского хозяйства США](https://www.nass.usda.gov/About_NASS/index.php).
Продолжая исследование, связанное с природой, давайте изучим интересные способы визуализации связей между различными типами мёда, основываясь на наборе данных, полученном от [Министерства сельского хозяйства США](https://www.nass.usda.gov/About_NASS/index.php).
Этот набор данных, содержащий около 600 записей, отображает производство мёда в различных штатах США. Например, можно изучить количество колоний, урожайность на одну колонию, общий объём производства, запасы, цену за фунт и стоимость произведённого мёда в конкретном штате за период с 1998 по 2012 год, где каждая строка представляет данные за год для каждого штата.
Этот набор данных, содержащий около 600 записей, отображает производство мёда в различных штатах США. Например, можно изучить количество колоний, урожайность на колонию, общий объём производства, запасы, цену за фунт и стоимость произведённого мёда в каждом штате за период с 1998 по 2012 год, где каждая строка представляет данные за год для конкретного штата.
Будет интересно визуализировать связь между объёмом производства в конкретном штате за год и, например, ценой мёда в этом штате. Также можно визуализировать связь между урожайностью мёда на одну колонию в разных штатах. Этот временной период охватывает разрушительное явление "Синдром разрушения колоний" (CCD), впервые зафиксированное в 2006 году (http://npic.orst.edu/envir/ccd.html), что делает этот набор данных особенно значимым для изучения. 🐝
Будет интересно визуализировать связь между производством мёда в определённом штате за год и, например, ценой мёда в этом штате. Также можно визуализировать связь между урожайностью мёда на колонию в разных штатах. Этот временной период охватывает разрушительное явление "Синдром разрушения колоний" (CCD), впервые зафиксированное в 2006 году (http://npic.orst.edu/envir/ccd.html), что делает этот набор данных особенно значимым для изучения. 🐝
## [Тест перед лекцией](https://ff-quizzes.netlify.app/en/ds/quiz/22)
В этом уроке вы можете использовать библиотеку Seaborn, с которой вы уже знакомы, чтобы визуализировать связи между переменными. Особенно интересна функция `relplot` в Seaborn, которая позволяет создавать диаграммы рассеяния и линейные графики для быстрой визуализации '[статистических связей](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', что помогает специалисту по данным лучше понять, как переменные связаны друг с другом.
В этом уроке вы можете использовать библиотеку Seaborn, с которой вы уже знакомы, для визуализации связей между переменными. Особенно интересна функция `relplot` в Seaborn, которая позволяет создавать диаграммы рассеяния и линейные графики для быстрой визуализации '[статистических связей](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', что помогает специалисту по данным лучше понять, как переменные связаны друг с другом.
## Диаграммы рассеяния
@ -38,58 +38,58 @@ honey.head()
```
Вы заметите, что данные о мёде содержат несколько интересных столбцов, включая год и цену за фунт. Давайте изучим эти данные, сгруппированные по штатам США:
| Штат | Колонии | Урожайность | Общее производство | Запасы | Цена за фунт | Стоимость производства | Год |
Создайте базовую диаграмму рассеяния, чтобы показать связь между ценой за фунт мёда и штатом его происхождения. Сделайте ось `y` достаточно высокой, чтобы отобразить все штаты:
Теперь покажите те же данные с цветовой схемой, напоминающей цвет мёда, чтобы продемонстрировать, как цена меняется год за годом. Вы можете сделать это, добавив параметр 'hue', чтобы показать изменения по годам:
Теперь покажите те же данные с цветовой схемой, напоминающей цвет мёда, чтобы отобразить, как цена меняется год за годом. Вы можете сделать это, добавив параметр 'hue', чтобы показать изменения:
> ✅ Узнайте больше о [цветовых палитрах, которые можно использовать в Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - попробуйте красивую радужную палитру!
С изменением цветовой схемы становится очевидным, что цена за фунт мёда значительно увеличивается с годами. Если вы проверите это на примере одного штата, например Аризоны, вы увидите закономерность роста цен год за годом, за редкими исключениями:
| Штат | Колонии | Урожайность | Общее производство | Запасы | Цена за фунт | Стоимость производства | Год |
Другой способ визуализировать этот процесс — использовать размер вместо цвета. Для пользователей с нарушением цветового восприятия это может быть более удобным вариантом. Измените визуализацию, чтобы показать увеличение цены через увеличение диаметра точек:
С изменением цветовой схемы становится очевидным, что цена за фунт мёда значительно увеличивается с годами. Если вы проверите это на выборке данных (например, выберите штат Аризона), вы увидите закономерность роста цен год за годом, за редкими исключениями:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Другой способ визуализировать этот прогресс — использовать размер вместо цвета. Для пользователей с нарушением цветового восприятия это может быть более удобным вариантом. Измените визуализацию, чтобы показать увеличение цены через увеличение диаметра точек:
Это простой случай спроса и предложения? Из-за таких факторов, как изменение климата и разрушение колоний, становится ли мёда меньше с каждым годом, что приводит к росту цен?
✅ Поскольку Seaborn агрегирует данные в одну линию, он отображает "несколько измерений для каждого значения x, строя среднее значение и 95% доверительный интервал вокруг среднего". [Источник](https://seaborn.pydata.org/tutorial/relational.html). Это трудоёмкое поведение можно отключить, добавив `ci=None`.
Вопрос: А в 2003 году можно также увидеть всплеск в объёме поставок мёда? Что если посмотреть на общее производство год за годом?
Вопрос: А в 2003 году можно ли также увидеть всплеск в запасах мёда? Что если посмотреть на общий объём производства год за годом?
Ответ: Не совсем. Если посмотреть на общее производство, оно, наоборот, кажется увеличившимся в этот год, хотя в целом объём производства мёда снижается в течение этих лет.
Ответ: Не совсем. Если посмотреть на общий объём производства, он, наоборот, кажется увеличившимся в этот год, хотя в целом объём производства мёда снижается в течение этих лет.
Вопрос: В таком случае, что могло вызвать скачок цены на мёд около 2003 года?
Вопрос: В таком случае, что могло вызвать всплеск цены на мёд около 2003 года?
Чтобы выяснить это, можно использовать сетку фасетов.
## Сетки фасетов
Сетки фасетов позволяют выбрать одну грань вашего набора данных (в нашем случае, можно выбрать 'год', чтобы избежать создания слишком большого количества фасетов). Seaborn затем создаёт график для каждого из этих фасетовс выбранными координатами x и y для более удобного визуального сравнения. Выделяется ли 2003 год в таком сравнении?
Сетки фасетов позволяют выбрать одну грань вашего набора данных (в нашем случае можно выбрать 'год', чтобы избежать создания слишком большого количества фасетов). Seaborn затем создаёт график для каждого фасетас выбранными координатами x и y для более удобного визуального сравнения. Выделяется ли 2003 год в таком сравнении?
Создайте сетку фасетов, продолжая использовать `relplot`, как рекомендовано в [документации Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
В этой визуализации вы можете сравнить урожайность на одну колонию и количество колоний год за годом, бок о бок, с wrap, установленным на 3 для столбцов:
В этой визуализации вы можете сравнить урожайность на колонию и количество колоний год за годом, рядом друг с другом, с wrap, установленным на 3 для столбцов:
Для этого набора данных ничего особенно не выделяется в отношении количества колоний и их урожайности год за годом и штат за штатом. Есть ли другой способ найти корреляцию между этими двумя переменными?
## Двухлинейные графики
Попробуйте многолинейный график, наложив два линейных графика друг на друга, используя функцию Seaborn 'despine', чтобы убрать верхние и правые оси, и`ax.twinx` [из библиотеки Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx позволяет графику делить ось x и отображать две оси y. Отобразите урожайность на одну колонию и количество колоний, наложив их друг на друга:
Попробуйте многолинейный график, наложив два линейных графика друг на друга, используя функцию Seaborn 'despine' для удаления верхних и правых осей, а также`ax.twinx` [из библиотеки Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx позволяет графику делить ось x и отображать две оси y. Отобразите урожайность на колонию и количество колоний, наложенные друг на друга:
Хотя ничего явно не выделяется около 2003 года, это позволяет завершить урок на более позитивной ноте: несмотря на общее снижение количества колоний, их число стабилизируется, даже если урожайность на одну колонию уменьшается.
Хотя ничего явно не выделяется около 2003 года, это позволяет завершить урок на более позитивной ноте: несмотря на общее снижение количества колоний, их число стабилизируется, даже если урожайность на колонию уменьшается.
Вперёд, пчёлы, вперёд!
🐝❤️
## 🚀 Задание
В этом уроке вы узнали больше о других способах использования диаграмм рассеяния и линейных сеток, включая сетки фасетов. Попробуйте создать сетку фасетов, используя другой набор данных, возможно, тот, который вы использовали ранее. Обратите внимание, сколько времени требуется для их создания и как важно учитывать количество создаваемых фасетов при использовании этих техник.
В этом уроке вы узнали больше о других способах использования диаграмм рассеяния и линейных сеток, включая сетки фасетов. Попробуйте создать сетку фасетов, используя другой набор данных, возможно, тот, который вы использовали ранее. Обратите внимание, сколько времени требуется для её создания и как важно учитывать количество сеток, которые нужно нарисовать, используя эти техники.
## [Тест после лекции](https://ff-quizzes.netlify.app/en/ds/quiz/23)
|Vizualizácia vzťahov - _Sketchnote od [@nitya](https://twitter.com/nitya)_ |
Pokračujúc v našom výskume zameranom na prírodu, objavme zaujímavé vizualizácie, ktoré ukazujú vzťahy medzi rôznymi typmi medu podľa datasetu odvodeného od [Ministerstva poľnohospodárstva Spojených štátov](https://www.nass.usda.gov/About_NASS/index.php).
Pokračujúc v prírodnom zameraní nášho výskumu, objavme zaujímavé vizualizácie na zobrazenie vzťahov medzi rôznymi druhmi medu podľa datasetu odvodeného z [Ministerstva poľnohospodárstva Spojených štátov](https://www.nass.usda.gov/About_NASS/index.php).
Tento dataset obsahuje približne 600 položiek a zobrazuje produkciu medu v mnohých štátoch USA. Napríklad môžete preskúmať počet kolónií, výnos na kolóniu, celkovú produkciu, zásoby, cenu za libru a hodnotu medu vyprodukovaného v danom štáte od roku 1998 do 2012, pričom každý riadok predstavuje jeden rok pre každý štát.
Tento dataset obsahuje približne 600 položiek a zobrazuje produkciu medu v mnohých štátoch USA. Napríklad môžete preskúmať počet kolónií, výnos na kolóniu, celkovú produkciu, zásoby, cenu za libru a hodnotu vyprodukovaného medu v danom štáte od roku 1998 do 2012, pričom každý riadok predstavuje jeden rok pre každý štát.
Bude zaujímavé vizualizovať vzťah medzi produkciou daného štátu za rok a napríklad cenou medu v tomto štáte. Alternatívne môžete vizualizovať vzťah medzi výnosom medu na kolóniu v jednotlivých štátoch. Toto časové obdobie zahŕňa ničivý fenomén 'CCD' alebo 'Colony Collapse Disorder', ktorý bol prvýkrát zaznamenaný v roku 2006 (http://npic.orst.edu/envir/ccd.html), takže ide o dojímavý dataset na štúdium. 🐝
Bude zaujímavé vizualizovať vzťah medzi produkciou v danom štáte za rok a napríklad cenou medu v tom istom štáte. Alternatívne by ste mohli vizualizovať vzťah medzi výnosom medu na kolóniu v jednotlivých štátoch. Toto obdobie zahŕňa aj ničivý fenomén 'CCD' alebo 'Colony Collapse Disorder', ktorý bol prvýkrát zaznamenaný v roku 2006 (http://npic.orst.edu/envir/ccd.html), takže ide o dojímavý dataset na štúdium. 🐝
## [Kvíz pred prednáškou](https://ff-quizzes.netlify.app/en/ds/quiz/22)
V tejto lekcii môžete použiť knižnicu Seaborn, ktorú ste už predtým používali, ako dobrý nástroj na vizualizáciu vzťahov medzi premennými. Obzvlášť zaujímavé je použitie funkcie `relplot` v Seaborne, ktorá umožňuje scatter ploty a line ploty na rýchlu vizualizáciu '[štatistických vzťahov](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', čo umožňuje dátovému analytikovi lepšie pochopiť, ako sa premenné navzájom ovplyvňujú.
V tejto lekcii môžete použiť knižnicu Seaborn, ktorú ste už používali, ako skvelý nástroj na vizualizáciu vzťahov medzi premennými. Obzvlášť zaujímavé je použitie funkcie `relplot` v Seaborne, ktorá umožňuje rýchlo vytvárať bodové a čiarové grafy na vizualizáciu '[štatistických vzťahov](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', čo umožňuje dátovému analytikovi lepšie pochopiť, ako sa premenné navzájom ovplyvňujú.
## Scatterploty
## Bodové grafy
Použite scatterplot na zobrazenie, ako sa cena medu vyvíjala rok po roku v jednotlivých štátoch. Seaborn, pomocou `relplot`, pohodlne zoskupuje údaje o štátoch a zobrazuje dátové body pre kategorizované aj numerické údaje.
Použite bodový graf na zobrazenie, ako sa cena medu vyvíjala rok čo rok v jednotlivých štátoch. Seaborn, pomocou `relplot`, pohodlne zoskupuje údaje podľa štátov a zobrazuje dátové body pre kategorizované aj číselné údaje.
Začnime importovaním dát a knižnice Seaborn:
Začnime importovaním údajov a knižnice Seaborn:
```python
import pandas as pd
@ -38,95 +38,95 @@ honey.head()
```
Všimnete si, že údaje o mede obsahujú niekoľko zaujímavých stĺpcov, vrátane roku a ceny za libru. Preskúmajme tieto údaje, zoskupené podľa štátov USA:
| štát | numcol | yieldpercol | totalprod | zásoby | priceperlb | prodvalue | rok |
Vytvorte základný scatterplot na zobrazenie vzťahu medzi cenou za libru medu a jeho pôvodom v USA. Urobte os `y` dostatočne vysokú na zobrazenie všetkých štátov:
Vytvorte základný bodový graf na zobrazenie vzťahu medzi cenou za libru medu a jeho pôvodným štátom v USA. Nastavte os `y` dostatočne vysokú, aby zobrazila všetky štáty:
Teraz zobrazte tie isté údaje s farebnou schémou medu, aby ste ukázali, ako sa cena vyvíja v priebehu rokov. Môžete to urobiť pridaním parametra 'hue', ktorý ukáže zmenu rok po roku:
Teraz zobrazte tie isté údaje s farebnou schémou pripomínajúcou med, aby ste ukázali, ako sa cena vyvíja v priebehu rokov. Môžete to dosiahnuť pridaním parametra 'hue', ktorý ukáže zmenu rok čo rok:
> ✅ Viac sa dozviete o [farebných paletách, ktoré môžete použiť v Seaborne](https://seaborn.pydata.org/tutorial/color_palettes.html) - vyskúšajte krásnu dúhovú farebnú schému!
> ✅ Viac o [farebných paletách, ktoré môžete použiť v Seaborne](https://seaborn.pydata.org/tutorial/color_palettes.html) - vyskúšajte krásnu dúhovú farebnú schému!
S touto zmenou farebnej schémy môžete vidieť, že existuje zjavný silný progres v priebehu rokov, pokiaľ ide o cenu medu za libru. Ak sa pozriete na vzorku údajov na overenie (vyberte si napríklad štát Arizona), môžete vidieť vzor zvyšovania cien rok po roku, s niekoľkými výnimkami:
| štát | numcol | yieldpercol | totalprod | zásoby | priceperlb | prodvalue | rok |
Ďalším spôsobom vizualizácie tohto progresu je použitie veľkosti namiesto farby. Pre používateľov s poruchou farebného vnímania to môže byť lepšia možnosť. Upraviť vizualizáciu tak, aby ukazovala nárast ceny zväčšením obvodu bodov:
S touto zmenou farebnej schémy môžete vidieť, že v priebehu rokov existuje zjavný silný progres v cene medu za libru. Ak sa pozriete na vzorku údajov na overenie (napríklad vyberte štát Arizona), môžete vidieť vzor zvyšovania cien rok čo rok, s niekoľkými výnimkami:
| štát | počet kolónií | výnos na kolóniu | celková produkcia | zásoby | cena za libru | hodnota produkcie | rok |
Ďalším spôsobom, ako vizualizovať tento progres, je použiť veľkosť namiesto farby. Pre používateľov s poruchami farebného vnímania by to mohla byť lepšia možnosť. Upravte svoju vizualizáciu tak, aby ukázala nárast ceny zväčšením obvodu bodov:
Je to jednoduchý prípad ponuky a dopytu? Kvôli faktorom, ako je klimatická zmena a kolaps kolónií, je rok po roku menej medu dostupného na kúpu, a preto cena stúpa?
Je to jednoduchý prípad ponuky a dopytu? Kvôli faktorom, ako je klimatická zmena a kolaps kolónií, je k dispozícii menej medu na predaj rok čo rok, a preto cena rastie?
Na objavenie korelácie medzi niektorými premennými v tomto datasete preskúmajme niektoré line charty.
Aby sme objavili koreláciu medzi niektorými premennými v tomto datasete, preskúmajme niekoľko čiarových grafov.
## Line charty
## Čiarové grafy
Otázka: Je zjavný nárast ceny medu za libru rok po roku? Najjednoduchšie to zistíte vytvorením jedného line chartu:
Otázka: Existuje jasný nárast ceny medu za libru rok čo rok? Najjednoduchšie to zistíte vytvorením jedného čiarového grafu:
✅ Keďže Seaborn agreguje údaje okolo jednej línie, zobrazuje "viacero meraní pri každej hodnote x tým, že vykresľuje priemer a 95% interval spoľahlivosti okolo priemeru". [Zdroj](https://seaborn.pydata.org/tutorial/relational.html). Toto časovo náročné správanie môžete vypnúť pridaním `ci=None`.
✅ Pretože Seaborn agreguje údaje okolo jednej čiary, zobrazuje "viacero meraní pri každej hodnote x tým, že vykresľuje priemer a 95% interval spoľahlivosti okolo priemeru". [Zdroj](https://seaborn.pydata.org/tutorial/relational.html). Toto časovo náročné správanie môžete vypnúť pridaním `ci=None`.
Otázka: No, v roku 2003 môžeme tiež vidieť nárast zásob medu? Čo ak sa pozriete na celkovú produkciu rok po roku?
Otázka: No, v roku 2003 môžeme tiež vidieť nárast v zásobách medu? Čo ak sa pozriete na celkovú produkciu rok čo rok?
Odpoveď: Nie úplne. Ak sa pozriete na celkovú produkciu, zdá sa, že v tomto konkrétnom roku skutočne vzrástla, aj keď všeobecne produkcia medu v týchto rokoch klesá.
Odpoveď: Nie celkom. Ak sa pozriete na celkovú produkciu, zdá sa, že v tom konkrétnom roku skutočne vzrástla, aj keď všeobecne množstvo vyprodukovaného medu v týchto rokoch klesá.
Otázka: V tom prípade, čo mohlo spôsobiť nárast ceny medu okolo roku 2003?
Otázka: V tom prípade, čo mohlo spôsobiť ten nárast ceny medu okolo roku 2003?
Na objavenie tohto môžete preskúmať facet grid.
Aby sme to zistili, môžeme preskúmať mriežku aspektov.
## Facet gridy
## Mriežky aspektov
Facet gridy berú jednu vlastnosť vášho datasetu (v našom prípade môžete zvoliť 'rok', aby ste sa vyhli príliš veľkému počtu vytvorených gridov). Seaborn potom môže vytvoriť graf pre každý z týchto aspektov vašich zvolených x a y súradníc pre jednoduchšie vizuálne porovnanie. Vyniká rok 2003 v tomto type porovnania?
Mriežky aspektov berú jeden aspekt vášho datasetu (v našom prípade môžete zvoliť 'rok', aby sa nevytvorilo príliš veľa aspektov). Seaborn potom môže vytvoriť graf pre každý z týchto aspektov vašich zvolených súradníc x a y pre jednoduchšie vizuálne porovnanie. Vyniká rok 2003 v tomto type porovnania?
Vytvorte facet grid pokračovaním v používaní `relplot`, ako odporúča [dokumentácia Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
Vytvorte mriežku aspektov pokračovaním v používaní `relplot`, ako odporúča [dokumentácia Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
V tejto vizualizácii môžete porovnať výnos na kolóniu a počet kolónií rok po roku, vedľa seba, s wrap nastaveným na 3 pre stĺpce:
V tejto vizualizácii môžete porovnať výnos na kolóniu a počet kolónií rok čo rok, vedľa seba, s nastavením wrap na 3 pre stĺpce:
Pre tento dataset nič zvláštne nevyniká, pokiaľ ide o počet kolónií a ich výnos, rok po roku a štát po štáte. Existuje iný spôsob, ako hľadať koreláciu medzi týmito dvoma premennými?
Pre tento dataset nič zvlášť nevyniká, pokiaľ ide o počet kolónií a ich výnos, rok čo rok a štát po štáte. Existuje iný spôsob, ako nájsť koreláciu medzi týmito dvoma premennými?
## Dvojité line ploty
## Dvojité čiarové grafy
Vyskúšajte multiline plot superponovaním dvoch lineplotov na seba, pomocou funkcie Seaborn 'despine' na odstránenie ich horných a pravých osí a použitia `ax.twinx` [odvodeného z Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx umožňuje grafu zdieľať os x a zobraziť dve osi y. Zobrazte výnos na kolóniu a počet kolónií, superponované:
Vyskúšajte viacnásobný čiarový graf prekrytím dvoch čiarových grafov na seba, pomocou funkcie Seaborn 'despine' na odstránenie horných a pravých osí a použitia `ax.twinx` [odvodeného z Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx umožňuje grafu zdieľať os x a zobraziť dve osi y. Zobrazte výnos na kolóniu a počet kolónií, prekryté:
Aj keď nič výrazne nevyniká okolo roku 2003, umožňuje nám to ukončiť túto lekciu na trochu pozitívnejšiu poznámku: aj keď celkovo počet kolónií klesá, počet kolónií sa stabilizuje, aj keď ich výnos na kolóniu klesá.
Aj keď okolo roku 2003 nič zvlášť nevyniká, umožňuje nám to ukončiť túto lekciu na trochu pozitívnejšiu nôtu: aj keď počet kolónií celkovo klesá, ich počet sa stabilizuje, aj keď ich výnos na kolóniu klesá.
Do toho, včely, do toho!
🐝❤️
## 🚀 Výzva
V tejto lekcii ste sa dozvedeli viac o iných využitiach scatterplotov a line gridov, vrátane facet gridov. Vyzvite sa na vytvorenie facet gridu pomocou iného datasetu, možno takého, ktorý ste použili pred týmito lekciami. Všimnite si, ako dlho trvá ich vytvorenie a ako musíte byť opatrní pri počte gridov, ktoré potrebujete vykresliť pomocou týchto techník.
V tejto lekcii ste sa dozvedeli viac o iných využitiach bodových grafov a mriežok čiar, vrátane mriežok aspektov. Vyzvite sa na vytvorenie mriežky aspektov pomocou iného datasetu, možno takého, ktorý ste použili pred týmito lekciami. Všimnite si, ako dlho trvá ich vytvorenie a ako musíte byť opatrní pri počte mriežok, ktoré potrebujete vykresliť pomocou týchto techník.
## [Kvíz po prednáške](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Prehľad & Samoštúdium
## Prehľad a samoštúdium
Line ploty môžu byť jednoduché alebo pomerne zložité. Prečítajte si trochu viac v [dokumentácii Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) o rôznych spôsoboch, akými ich môžete vytvoriť. Pokúste sa vylepšiť line charty, ktoré ste vytvorili v tejto lekcii, pomocou iných metód uvedených v dokumentácii.
Čiarové grafy môžu byť jednoduché alebo pomerne zložité. Prečítajte si trochu viac v [dokumentácii Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) o rôznych spôsoboch, ako ich môžete vytvoriť. Skúste vylepšiť čiarové grafy, ktoré ste vytvorili v tejto lekcii, pomocou iných metód uvedených v dokumentácii.
## Zadanie
[Ponorte sa do úľa](assignment.md)
@ -184,4 +185,4 @@ Line ploty môžu byť jednoduché alebo pomerne zložité. Prečítajte si troc
---
**Upozornenie**:
Tento dokument bol preložený pomocou služby AI prekladu [Co-op Translator](https://github.com/Azure/co-op-translator). Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho pôvodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nie sme zodpovední za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.
Tento dokument bol preložený pomocou služby na automatický preklad [Co-op Translator](https://github.com/Azure/co-op-translator). Aj keď sa snažíme o presnosť, upozorňujeme, že automatické preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho pôvodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre dôležité informácie sa odporúča profesionálny ľudský preklad. Nezodpovedáme za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.
Nadaljujmo z naravoslovno usmerjenostjo našega raziskovanja in odkrijmo zanimive vizualizacije, ki prikazujejo odnose med različnimi vrstami medu, na podlagi podatkovne zbirke, pridobljene od [Ministrstva za kmetijstvo Združenih držav Amerike](https://www.nass.usda.gov/About_NASS/index.php).
Ta podatkovna zbirka, ki vsebuje približno 600 postavk, prikazuje proizvodnjo medu v številnih zveznih državah ZDA. Na primer, lahko si ogledate število kolonij, donos na kolonijo, skupno proizvodnjo, zaloge, ceno na funt in vrednost proizvedenega medu v določeni državi od leta 1998 do 2012, pri čemer je ena vrstica na leto za vsako državo.
Ta podatkovna zbirka, ki vsebuje približno 600 elementov, prikazuje proizvodnjo medu v številnih zveznih državah ZDA. Na primer, lahko si ogledate število kolonij, donos na kolonijo, skupno proizvodnjo, zaloge, ceno na funt in vrednost proizvedenega medu v določeni državi od leta 1998 do 2012, pri čemer je ena vrstica na leto za vsako državo.
Zanimivo bo vizualizirati odnos med letno proizvodnjo določene države in, na primer, ceno medu v tej državi. Alternativno bi lahko vizualizirali odnos med donosom medu na kolonijo v različnih državah. To časovno obdobje zajema uničujočo 'CCD' ali 'motnjo propada kolonij', ki je bila prvič opažena leta 2006 (http://npic.orst.edu/envir/ccd.html), zato je to ganljiva podatkovna zbirka za preučevanje. 🐝
V tej lekciji lahko uporabite knjižnico Seaborn, ki ste jo že uporabljali, kot odlično orodje za vizualizacijo odnosov med spremenljivkami. Še posebej zanimiva je funkcija `relplot` v Seabornu, ki omogoča hitro ustvarjanje razpršenih in linijskih grafov za vizualizacijo '[statističnih odnosov](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', kar podatkovnemu znanstveniku omogoča boljše razumevanje, kako se spremenljivke med seboj povezujejo.
V tej lekciji lahko uporabite knjižnico Seaborn, ki ste jo že uporabljali, kot odlično orodje za vizualizacijo odnosov med spremenljivkami. Še posebej zanimiva je funkcija `relplot` v Seabornu, ki omogoča hitro ustvarjanje razpršenih in linijskih grafov za vizualizacijo '[statističnih odnosov](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', kar podatkovnemu znanstveniku pomaga bolje razumeti, kako se spremenljivke med seboj povezujejo.
## Razpršeni grafi
Uporabite razpršeni graf za prikaz, kako se je cena medu spreminjala iz leta v leto, po posameznih državah. Seaborn, z uporabo `relplot`, priročno združi podatke držav in prikaže podatkovne točke za tako kategorijske kot numerične podatke.
Uporabite razpršeni graf za prikaz, kako se je cena medu spreminjala iz leta v leto, po posameznih državah. Seaborn, z uporabo `relplot`, priročno združi podatke držav in prikaže točke za kategorijske in numerične podatke.
Začnimo z uvozom podatkov in knjižnice Seaborn:
@ -40,18 +40,18 @@ Opazili boste, da ima podatkovna zbirka medu več zanimivih stolpcev, vključno
| država | št_kolonij | donos_na_kolonijo | skupna_proizvodnja | zaloge | cena_na_funt | vrednost_proizvodnje | leto |
Sedaj prikažite iste podatke z barvno shemo medu, da pokažete, kako se cena spreminja skozi leta. To lahko storite z dodajanjem parametra 'hue', ki prikazuje spremembe iz leta v leto:
@ -60,27 +60,27 @@ Sedaj prikažite iste podatke z barvno shemo medu, da pokažete, kako se cena sp
S to spremembo barvne sheme lahko vidite, da je očitno močan napredek skozi leta glede cene medu na funt. Če pogledate vzorec podatkov (na primer za določeno državo, kot je Arizona), lahko opazite vzorec naraščanja cen iz leta v leto, z nekaj izjemami:
S to spremembo barvne sheme lahko jasno vidite močan napredek skozi leta glede cene medu na funt. Če pogledate vzorec podatkov (na primer za določeno državo, recimo Arizono), lahko opazite vzorec naraščanja cen iz leta v leto, z nekaj izjemami:
| država | št_kolonij | donos_na_kolonijo | skupna_proizvodnja | zaloge | cena_na_funt | vrednost_proizvodnje | leto |
Drug način za vizualizacijo tega napredka je uporaba velikosti namesto barve. Za uporabnike z barvno slepoto je to morda boljša možnost. Spremenite svojo vizualizacijo tako, da pokažete povečanje cene z večanjem obsega točk:
Je to preprost primer ponudbe in povpraševanja? Zaradi dejavnikov, kot so podnebne spremembe in propad kolonij, je na voljo manj medu za nakup iz leta v leto, zato se cena povečuje?
@ -97,16 +97,16 @@ Da bi odkrili korelacijo med nekaterimi spremenljivkami v tej podatkovni zbirki,
## Linijski grafi
Vprašanje: Ali obstaja jasen porast cene medu na funt iz leta v leto? To lahko najlažje odkrijete z ustvarjanjem enega samega linijskega grafa:
Vprašanje: Ali je jasno vidno naraščanje cene medu na funt iz leta v leto? To lahko najlažje odkrijete z ustvarjanjem enega samega linijskega grafa:
✅ Ker Seaborn združuje podatke okoli ene linije, prikazuje "več meritev pri vsaki vrednosti x z risanjem povprečja in 95% intervala zaupanja okoli povprečja". [Vir](https://seaborn.pydata.org/tutorial/relational.html). To časovno zahtevno vedenje lahko onemogočite z dodajanjem `ci=None`.
✅ Ker Seaborn združuje podatke okoli ene črte, prikazuje "več meritev pri vsaki vrednosti x z izrisom povprečja in 95% intervala zaupanja okoli povprečja". [Vir](https://seaborn.pydata.org/tutorial/relational.html). To časovno zahtevno vedenje lahko onemogočite z dodajanjem `ci=None`.
Vprašanje: No, ali lahko leta 2003 opazimo tudi porast zaloge medu? Kaj pa, če pogledate skupno proizvodnjo iz leta v leto?
@ -114,7 +114,7 @@ Vprašanje: No, ali lahko leta 2003 opazimo tudi porast zaloge medu? Kaj pa, če
Odgovor: Ne ravno. Če pogledate skupno proizvodnjo, se zdi, da se je v tem letu dejansko povečala, čeprav na splošno količina proizvedenega medu v teh letih upada.
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
V tej vizualizaciji lahko primerjate donos na kolonijo in število kolonij iz leta v leto, ena ob drugi, z nastavitvijo ovitka na 3 za stolpce:
V tej vizualizaciji lahko primerjate donos na kolonijo in število kolonij iz leta v leto, ena ob drugi, z nastavitvijo razporeditve na 3 za stolpce:
Za to podatkovno zbirko nič posebej ne izstopa glede števila kolonij in njihovega donosa, iz leta v leto in iz države v državo. Ali obstaja drugačen način za iskanje korelacije med tema dvema spremenljivkama?
## Dvovrstični grafi
Poskusite večlinijski graf z nadgradnjo dveh linijskih grafov enega na drugega, z uporabo funkcije 'despine' v Seabornu za odstranitev zgornjih in desnih osi ter z uporabo `ax.twinx` [izpeljano iz Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx omogoča grafu, da deli os x in prikaže dve osi y. Prikažite donos na kolonijo in število kolonij, nadgrajeno:
Poskusite večvrstični graf z nadgradnjo dveh linijskih grafov enega na drugega, z uporabo funkcije 'despine' v Seabornu za odstranitev zgornjih in desnih osi ter z uporabo `ax.twinx` [iz Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx omogoča grafu, da deli os x in prikaže dve osi y. Prikažite donos na kolonijo in število kolonij, nadgrajeno:
Čeprav nič ne izstopa okoli leta 2003, nam to omogoča, da zaključimo to lekcijo na nekoliko bolj veseli noti: čeprav je skupno število kolonij v upadu, se število kolonij stabilizira, tudi če njihov donos na kolonijo upada.
Čeprav nič ne izstopa okoli leta 2003, nam to omogoča, da zaključimo to lekcijo na nekoliko bolj pozitivni noti: čeprav se število kolonij na splošno zmanjšuje, se število kolonij stabilizira, tudi če njihov donos na kolonijo upada.
Naprej, čebele, naprej!
🐝❤️
## 🚀 Izziv
V tej lekciji ste se naučili nekaj več o drugih uporabah razpršenih grafov in mrež faset, vključno z mrežami faset. Izzovite se in ustvarite mrežo faset z uporabo druge podatkovne zbirke, morda tiste, ki ste jo uporabili pred temi lekcijami. Opazujte, kako dolgo traja njihovo ustvarjanje in kako morate biti previdni glede števila mrež, ki jih morate narisati z uporabo teh tehnik.
V tej lekciji ste se naučili nekaj več o drugih uporabah razpršenih grafov in mrež faset, vključno z mrežami faset. Izzovite se in ustvarite mrežo faset z uporabo drugačne podatkovne zbirke, morda tiste, ki ste jo uporabili pred temi lekcijami. Opazujte, kako dolgo traja njihova izdelava in kako morate biti previdni glede števila mrež, ki jih morate narisati z uporabo teh tehnik.
Linijski grafi so lahko preprosti ali precej kompleksni. Preberite nekaj več v [dokumentaciji Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) o različnih načinih, kako jih lahko zgradite. Poskusite izboljšati linijske grafe, ki ste jih zgradili v tej lekciji, z drugimi metodami, navedenimi v dokumentaciji.
Linijski grafi so lahko preprosti ali precej zapleteni. Preberite nekaj več v [dokumentaciji Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) o različnih načinih, kako jih lahko zgradite. Poskusite izboljšati linijske grafe, ki ste jih zgradili v tej lekciji, z drugimi metodami, navedenimi v dokumentaciji.
## Naloga
[Potopite se v čebelnjak](assignment.md)
@ -184,4 +185,4 @@ Linijski grafi so lahko preprosti ali precej kompleksni. Preberite nekaj več v
---
**Omejitev odgovornosti**:
Ta dokument je bil preveden z uporabo storitve za prevajanje z umetno inteligenco [Co-op Translator](https://github.com/Azure/co-op-translator). Čeprav si prizadevamo za natančnost, vas prosimo, da upoštevate, da lahko avtomatizirani prevodi vsebujejo napake ali netočnosti. Izvirni dokument v njegovem maternem jeziku je treba obravnavati kot avtoritativni vir. Za ključne informacije priporočamo profesionalni človeški prevod. Ne prevzemamo odgovornosti za morebitna napačna razumevanja ali napačne interpretacije, ki bi nastale zaradi uporabe tega prevoda.
Ta dokument je bil preveden z uporabo storitve za strojno prevajanje [Co-op Translator](https://github.com/Azure/co-op-translator). Čeprav si prizadevamo za natančnost, vas prosimo, da se zavedate, da lahko avtomatizirani prevodi vsebujejo napake ali netočnosti. Izvirni dokument v njegovem izvirnem jeziku je treba obravnavati kot avtoritativni vir. Za ključne informacije priporočamo strokovno človeško prevajanje. Ne prevzemamo odgovornosti za morebitna nesporazumevanja ali napačne razlage, ki izhajajo iz uporabe tega prevoda.
| ](../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|Визуализација односа - _Скетч од [@nitya](https://twitter.com/nitya)_ |
|Визуелизација односа - _Скетч од [@nitya](https://twitter.com/nitya)_ |
Настављајући са природним фокусом нашег истраживања, хајде да откријемо занимљиве визуализације које приказују односе између различитих врста меда, према подацима добијеним од [Министарства пољопривреде Сједињених Америчких Држава](https://www.nass.usda.gov/About_NASS/index.php).
Настављајући са природним фокусом нашег истраживања, хајде да откријемо занимљиве визуелизације које приказују односе између различитих врста меда, према скупу података добијеном од [Министарства пољопривреде Сједињених Држава](https://www.nass.usda.gov/About_NASS/index.php).
Овај скуп података, који садржи око 600 ставки, приказује производњу меда у многим америчким државама. На пример, можете погледати број колонија, принос по колонији, укупну производњу, залихе, цену по фунти и вредност произведеног меда уодређеној држави од 1998-2012, са једним редом по години за сваку државу.
Овај скуп података, који садржи око 600 ставки, приказује производњу меда у многим америчким државама. На пример, можете погледати број кошница, принос по кошници, укупну производњу, залихе, цену по фунти и вредност произведеног меда удатој држави од 1998. до 2012. године, са једним редом по години за сваку државу.
Биће занимљиво визуализовати однос између производње меда у одређеној држави по години и, на пример, цене меда у тој држави. Алтернативно, можете визуализовати однос између приноса меда по колонији у различитим државама. Овај временски период обухвата разарајући 'CCD' или 'Поремећај колапса колонија', који је први пут примећен 2006. године (http://npic.orst.edu/envir/ccd.html), па је то значајан скуп података за проучавање. 🐝
Биће занимљиво визуелизовати однос између производње у одређеној држави по годинама и, на пример, цене меда у тој држави. Алтернативно, могли бисте визуелизовати однос између приноса меда по кошници у различитим државама. Овај временски период обухвата разорни феномен 'CCD' или 'Синдром колапса кошница', који је први пут примећен 2006. године (http://npic.orst.edu/envir/ccd.html), што чини овај скуп података посебно значајним за проучавање. 🐝
## [Квиз пре предавања](https://ff-quizzes.netlify.app/en/ds/quiz/22)
У овом предавању можете користити Seaborn, који сте већ користили, као добру библиотеку за визуализацију односа између променљивих. Посебно је занимљива употреба функције`relplot`у Seaborn-у, која омогућава креирање расејаних графикона и линијских графикона за брзу визуализацију '[статистичких односа](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', што омогућава научнику података да боље разуме како се променљиве међусобно односе.
У овој лекцији можете користити Seaborn, библиотеку коју сте већ користили, као одличан алат за визуелизацију односа између променљивих. Посебно је занимљива функција`relplot`у Seaborn-у, која омогућава креирање расејаних и линијских графикона за брзу визуелизацију '[статистичких односа](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', што омогућава научницима података боље разумевање како су променљиве међусобно повезане.
## Расејани графикони
Користите расејани графикон да покажете како се цена меда развијала из године у годину, по државама. Seaborn, користећи `relplot`, практично групише податке по државама и приказује тачке за категоријске и нумеричке податке.
Користите расејани графикон да прикажете како се цена меда развијала из године у годину, по државама. Seaborn, користећи `relplot`, згодно групише податке по државама и приказује тачке за категоријске и нумеричке податке.
Хајде да почнемо са увозом података и Seaborn-а:
Хајде да почнемо са увозом података и библиотеке Seaborn:
```python
import pandas as pd
@ -36,97 +36,97 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Приметићете да подаци о меду имају неколико занимљивих колона, укључујући годину и цену по фунти. Хајде да истражимо ове податке, груписане по америчким државама:
Приметићете да подаци о меду садрже неколико занимљивих колона, укључујући годину и цену по фунти. Истражимо ове податке, груписане по америчким државама:
| држава | бројкол | приноспокол | укупнапроизв | залихе | ценапофунти | вредностпр | година |
Креирајте основни расејани графикон да покажете однос између цене по фунти меда и његове државе порекла. Направите`y`осу довољно високом да прикаже све државе:
Креирајте основни расејани графикон да прикажете однос између цене по фунти меда и државе порекла. Учинимо`y`осу довољно високом да прикаже све државе:
Сада, прикажите исте податке са шемом боја меда како бисте показали како се цена развија током година. То можете урадити додавањем параметра 'hue' да покажете промену из године у годину:
Сада прикажите исте податке са шемом боја меда како бисте приказали како се цена мењала током година. Ово можете урадити додавањем параметра 'hue' да прикажете промену из године у годину:
> ✅ Сазнајте више о [палетама боја које можете користити у Seaborn-у](https://seaborn.pydata.org/tutorial/color_palettes.html) - пробајте прелепу шему боја дуге!
> ✅ Сазнајте више о [палетама боја које можете користити у Seaborn-у](https://seaborn.pydata.org/tutorial/color_palettes.html) - испробајте прелепу шему боја дуге!
Са овом променом шеме боја, можете видети да постоји очигледан снажан напредак током година у погледу цене меда по фунти. Заиста, ако погледате узорак података да бисте проверили (на пример, изаберите државу Аризону), можете видети образац повећања цена из године у годину, са неколико изузетака:
| држава | бројкол | приноспокол | укупнапроизв | залихе | ценапофунти | вредностпр | година |
Други начин да визуализујете овај напредак је да користите величину, уместо боје. За кориснике који су далтонисти, ово би могла бити боља опција. Уредите своју визуализацију да покажете повећање цене кроз повећање обима тачке:
Са овом променом шеме боја, можете видети да постоји очигледан снажан напредак током година у погледу цене меда по фунти. Заиста, ако погледате узорак података (на пример, државу Аризону), можете уочити образац повећања цена из године у годину, са неколико изузетака:
| држава | бројкош | приноскош | укупнопрод | залихе | ценапофунти | вредностпрод | година |
Други начин да визуелизујете овај напредак је коришћење величине уместо боје. За кориснике који су далтонисти, ово би могла бити боља опција. Измените своју визуелизацију тако да повећање цене буде приказано повећањем обима тачке:
Да ли је ово једноставан случај понуде и потражње? Због фактора као што су климатске промене и колапс колонија, да ли је мање меда доступно за куповину из године у годину, па самим тим цена расте?
Да ли је ово једноставан случај понуде и потражње? Због фактора као што су климатске промене и колапс кошница, да ли је мање меда доступно за куповину из године у годину, па самим тим цена расте?
Да бисмо открили корелацију између неких променљивих у овом скупу података, хајде да истражимо неке линијске графиконе.
Да бисмо открили корелацију између неких променљивих у овом скупу података, истражимо неке линијске графиконе.
## Линијски графикони
Питање: Да ли постоји јасан раст цене меда по фунти из године у годину? Најлакше можете то открити креирањем једног линијског графикона:
Питање: Да ли постоји јасан раст цене меда по фунти из године у годину? Најлакше ћете то открити креирањем једноставног линијског графикона:
✅ Пошто Seaborn агрегира податке око једне линије, он приказује "више мерења за сваку x вредност тако што црта просек и 95% интервал поверења око просека". [Извор](https://seaborn.pydata.org/tutorial/relational.html). Ово временски захтевно понашање може се онемогућити додавањем `ci=None`.
✅ Пошто Seaborn агрегира податке око једне линије, приказује "више мерења за сваку x вредност тако што приказује просек и 95% интервал поверења око просека". [Извор](https://seaborn.pydata.org/tutorial/relational.html). Ово временски захтевно понашање може се онемогућити додавањем `ci=None`.
Питање: Па, у 2003. години, да ли можемо видети и скок у залихама меда? Шта ако погледате укупну производњу из године у годину?
Питање: Па, да ли можемо видети и пораст у залихама меда око 2003. године? Шта ако погледате укупну производњу из године у годину?
Одговор: Не баш. Ако погледате укупну производњу, чини се да је она заправо повећана у тој конкретној години, иако генерално гледано количина произведеног меда опада током ових година.
Одговор: Не баш. Ако погледате укупну производњу, чини се да је она заправо порасла те године, иако генерално количина произведеног меда опада током ових година.
Питање: У том случају, шта је могло узроковати тај скок у цени меда око 2003. године?
Питање: У том случају, шта је могло изазвати тај скок у цени меда око 2003. године?
Да бисмо то открили, можемо истражити мрежу фасета.
Да бисмо то открили, можемо истражити facet grid.
## Мреже фасета
## Facet grids
Мреже фасета узимају један аспект вашег скупа података (у нашем случају, можете изабрати 'годину' да избегнете превише фасета). Seaborn затим може направити графикон за сваку од тих фасета ваших изабраних x и y координата ради лакшег визуелног поређења. Да ли се 2003. година истичеу оваквом поређењу?
Facet grids узимају један аспект вашег скупа података (у нашем случају, можете изабрати 'годину' како бисте избегли превише аспеката). Seaborn затим може направити графикон за сваки од тих аспеката ваших изабраних x и y координата ради лакшег визуелног поређења. Да ли се 2003. година издвајау оваквом поређењу?
Креирајте мрежу фасета настављајући да користите `relplot` како је препоручено у [документацији Seaborn-а](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
Креирајте facet grid настављајући да користите `relplot`, како препоручује [документација за Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
У овој визуализацији можете упоредити принос по колонији и број колонија из године у годину, један поред другог, са подешавањем wrap-а на 3 за колоне:
У овој визуелизацији можете упоредити принос по кошници и број кошница из године у годину, један поред другог, саwrap подешеним на 3 за колоне:
За овај скуп података, ништа посебно се не истиче у погледу броја колонија и њиховог приноса, из године у годину и из државе у државу. Да ли постоји другачији начин да се пронађе корелација између ове две променљиве?
За овај скуп података, ништа посебно се не издваја у погледу броја кошница и њиховог приноса, из године у годину и из државе у државу. Постоји ли другачији начин да се пронађе корелација између ове две променљиве?
## Двоструки линијски графикони
Пробајте графикон савишелинија тако што ћете преклопити два линијска графикона један преко другог, користећи Seaborn-ов 'despine' да уклоните њихове горње и десне кичме, и користећи `ax.twinx` [изведено из Matplotlib-а](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx омогућава графикону да дели x осу и приказује две y осе. Дакле, прикажите принос по колонији и број колонија, преклопљено:
Пробајте вишелинијски графикон тако што ћете преклопити два линијска графикона један преко другог, користећи Seaborn-ов 'despine' да уклоните горње и десне ивице, и користећи `ax.twinx` [изведено из Matplotlib-а](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx омогућава графикону да дели x осу и приказује две y осе. Дакле, прикажите принос по кошници и број кошница, преклопљено:
Иако ништа не упада у очи око 2003. године, ово нам омогућава да завршимо ово предавање на мало срећнијој ноти: иако укупно број колонија опада, број колонија се стабилизује чак и ако њихов принос по колонији опада.
Иако ништа не упада у очи око 2003. године, ово нам омогућава да завршимо лекцију на мало срећнијој ноти: иако укупан број кошница опада, број кошница се стабилизује, чак и ако њихов принос по кошници опада.
Напред, пчеле, напред!
🐝❤️
## 🚀 Изазов
У овом предавању, научили сте мало више о другим употребама расејаних графикона и линијских мрежа, укључујући мреже фасета. Изазовите себе да креирате мрежу фасета користећи другачији скуп података, можда онај који сте користили пре ових предавања. Приметите колико времена је потребно за креирање и како морате бити пажљиви упогледу броја мрежа које треба да нацртате користећи ове технике.
У овој лекцији сте научили нешто више о другим употребама расејаних графикона и линијских мрежа, укључујући facet grids. Изазовите себе да креирате facet grid користећи други скуп података, можда онај који сте користили пре ових лекција. Обратите пажњу на то колико времена је потребно за њихово креирање и како морате бити пажљиви увези са бројем мрежа које треба нацртати користећи ове технике.
## [Квиз после предавања](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## [Квиз након предавања](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Преглед и самостално учење
Линијски графикони могу бити једноставни или прилично сложени. Урадите мало читања у [документацији Seaborn-а](https://seaborn.pydata.org/generated/seaborn.lineplot.html) о различитим начинима на које их можете изградити. Покушајте да побољшате линијске графиконе које сте направили у овом предавању другим методама наведеним у документацији.
Линијски графикони могу бити једноставни или прилично сложени. Прочитајте мало више у [документацији за Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) о различитим начинима на које их можете изградити. Покушајте да побољшате линијске графиконе које сте направили у овој лекцији другим методама наведеним у документацији.
@ -21,11 +21,11 @@ Det kan vara intressant att visualisera relationen mellan en viss delstats produ
## [Quiz före lektionen](https://ff-quizzes.netlify.app/en/ds/quiz/22)
I denna lektion kan du använda Seaborn, som du har använt tidigare, som ett bra bibliotek för att visualisera relationer mellan variabler. Särskilt intressant är användningen av Seaborns `relplot`-funktion, som möjliggör scatterplots och linjediagram för att snabbt visualisera '[statistiska relationer](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', vilket hjälper dataforskare att bättre förstå hur variabler relaterar till varandra.
I den här lektionen kan du använda Seaborn, som du har använt tidigare, som ett bra bibliotek för att visualisera relationer mellan variabler. Särskilt intressant är användningen av Seaborns `relplot`-funktion, som möjliggör spridningsdiagram och linjediagram för att snabbt visualisera '[statistiska relationer](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', vilket hjälper dataforskaren att bättre förstå hur variabler relaterar till varandra.
## Scatterplots
## Spridningsdiagram
Använd ett scatterplot för att visa hur priset på honung har utvecklats år för år per delstat. Seaborn, med hjälp av `relplot`, grupperar bekvämt delstatsdata och visar datapunkter för både kategoriska och numeriska data.
Använd ett spridningsdiagram för att visa hur priset på honung har utvecklats år för år per delstat. Seaborn, med hjälp av `relplot`, grupperar bekvämt delstatsdata och visar datapunkter för både kategoriska och numeriska data.
Låt oss börja med att importera data och Seaborn:
@ -36,7 +36,7 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Du märker att honungsdatan har flera intressanta kolumner, inklusive år och pris per pound. Låt oss utforska denna data, grupperad per amerikansk delstat:
Du märker att honungsdatan har flera intressanta kolumner, inklusive år och pris per pound. Låt oss utforska denna data, grupperad efter amerikansk delstat:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Skapa ett grundläggande scatterplot för att visa relationen mellan priset per pound honung och dess ursprungsdelstat i USA. Gör `y`-axeln tillräckligt hög för att visa alla delstater:
Skapa ett grundläggande spridningsdiagram för att visa relationen mellan priset per pound honung och dess ursprungsdelstat i USA. Gör `y`-axeln tillräckligt hög för att visa alla delstater:
Visa nu samma data med ett honungsfärgat tema för att visa hur priset utvecklas över åren. Du kan göra detta genom att lägga till en 'hue'-parameter för att visa förändringen år för år:
Visa nu samma data med ett honungsfärgschema för att visa hur priset utvecklas över åren. Du kan göra detta genom att lägga till en 'hue'-parameter för att visa förändringen år för år:
> ✅ Läs mer om de [färgpaletter du kan använda i Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - prova ett vackert regnbågstema!
> ✅ Läs mer om de [färgpaletter du kan använda i Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - prova ett vackert regnbågsfärgschema!
Med denna färgförändring kan du tydligt se en stark progression över åren när det gäller priset på honung per pound. Om du tittar på ett urval av data för att verifiera (välj en viss delstat, till exempel Arizona) kan du se ett mönster av prisökningar år för år, med få undantag:
Med denna färgschemaförändring kan du tydligt se en stark progression över åren när det gäller priset på honung per pound. Om du tittar på ett urval av data för att verifiera (välj en viss delstat, till exempel Arizona) kan du se ett mönster av prisökningar år för år, med få undantag:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Ett annat sätt att visualisera denna progression är att använda storlek istället för färg. För färgblinda användare kan detta vara ett bättre alternativ. Redigera din visualisering för att visa en ökning av priset genom en ökning av punktens omkrets:
Ett annat sätt att visualisera denna progression är att använda storlek istället för färg. För färgblinda användare kan detta vara ett bättre alternativ. Ändra din visualisering för att visa en ökning av priset genom en ökning av punktens omkrets:
Är detta ett enkelt fall av utbud och efterfrågan? På grund av faktorer som klimatförändringar och kollaps av bisamhällen, finns det mindre honung tillgänglig för köp år för år, och därmed ökar priset?
✅ Eftersom Seaborn aggregerar data runt en linje, visar den "de flera mätningarna vid varje x-värde genom att plotta medelvärdet och 95 % konfidensintervallet runt medelvärdet". [Källa](https://seaborn.pydata.org/tutorial/relational.html). Detta tidskrävande beteende kan inaktiveras genom att lägga till `ci=None`.
@ -114,7 +114,7 @@ Fråga: Kan vi också se en topp i honungstillgången runt 2003? Vad händer om
Svar: Inte riktigt. Om du tittar på den totala produktionen verkar den faktiskt ha ökat det året, även om mängden producerad honung generellt sett minskar under dessa år.
@ -124,7 +124,7 @@ För att upptäcka detta kan du utforska ett facet grid.
## Facet grids
Facet grids tar en aspekt av ditt dataset (i vårt fall kan du välja 'år' för att undvika att skapa för många facetter). Seaborn kan sedan skapa en plot för varje av dessa facetter av dina valda x- och y-koordinater för enklare visuell jämförelse. Står 2003 ut i denna typ av jämförelse?
Facet grids tar en aspekt av ditt dataset (i vårt fall kan du välja 'år' för att undvika att för många facetter skapas). Seaborn kan sedan skapa en plot för var och en av dessa facetter av dina valda x- och y-koordinater för enklare visuell jämförelse. Står 2003 ut i denna typ av jämförelse?
Skapa ett facet grid genom att fortsätta använda `relplot` som rekommenderas av [Seaborns dokumentation](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,12 +135,13 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
I denna visualisering kan du jämföra avkastning per samhälle och antal samhällen år för år, sida vid sida med en wrap inställd på 3 för kolumnerna:
För detta dataset sticker inget särskilt ut när det gäller antalet samhällen och deras avkastning, år för år och delstat för delstat. Finns det ett annat sätt att hitta en korrelation mellan dessa två variabler?
För detta dataset framträder inget särskilt med avseende på antalet samhällen och deras avkastning, år för år och delstat för delstat. Finns det ett annat sätt att hitta en korrelation mellan dessa två variabler?
Även om inget särskilt sticker ut runt år 2003, låter det oss avsluta denna lektion på en lite gladare not: även om antalet samhällen totalt sett minskar, stabiliseras antalet samhällen även om deras avkastning per samhälle minskar.
Även om inget särskilt framträder runt år 2003, låter det oss avsluta denna lektion på en lite gladare not: även om antalet samhällen totalt sett minskar, stabiliseras antalet samhällen även om deras avkastning per samhälle minskar.
Heja bina! 🐝❤️
## 🚀 Utmaning
I denna lektion lärde du dig lite mer om andra användningsområden för scatterplots och linjediagram, inklusive facet grids. Utmana dig själv att skapa ett facet grid med ett annat dataset, kanske ett du använt tidigare i dessa lektioner. Notera hur lång tid det tar att skapa och hur du behöver vara försiktig med hur många grids du behöver rita med dessa tekniker.
I den här lektionen lärde du dig lite mer om andra användningsområden för spridningsdiagram och linjediagram, inklusive facet grids. Utmana dig själv att skapa ett facet grid med ett annat dataset, kanske ett du använt tidigare i dessa lektioner. Notera hur lång tid det tar att skapa och hur du behöver vara försiktig med hur många grids du behöver rita med dessa tekniker.
## [Quiz efter lektionen](https://ff-quizzes.netlify.app/en/ds/quiz/23)
|Kuonyesha Mahusiano - _Sketchnote na [@nitya](https://twitter.com/nitya)_ |
Tukiendelea na mtazamo wa asili katika utafiti wetu, hebu tujifunze mbinu za kuvutia za kuonyesha mahusiano kati ya aina mbalimbali za asali, kulingana na seti ya data iliyotolewa na [Idara ya Kilimo ya Marekani](https://www.nass.usda.gov/About_NASS/index.php).
Tukiendelea na mtazamo wa asili katika utafiti wetu, hebu tujifunze njia za kuvutia za kuonyesha mahusiano kati ya aina mbalimbali za asali, kulingana na seti ya data iliyotolewa na [Idara ya Kilimo ya Marekani](https://www.nass.usda.gov/About_NASS/index.php).
Seti hii ya data yenye takriban vitu 600 inaonyesha uzalishaji wa asali katika majimbo mengi ya Marekani. Kwa mfano, unaweza kuchunguza idadi ya makoloni, mavuno kwa kila koloni, uzalishaji wa jumla, akiba, bei kwa pauni, na thamani ya asali iliyozalishwa katika jimbo fulani kuanzia mwaka 1998-2012, na safu moja kwa kila mwaka kwa kila jimbo.
Seti hii ya data yenye takriban vitu 600 inaonyesha uzalishaji wa asali katika majimbo mengi ya Marekani. Kwa mfano, unaweza kuangalia idadi ya makoloni, mavuno kwa kila koloni, uzalishaji wa jumla, akiba, bei kwa pauni, na thamani ya asali iliyozalishwa katika jimbo fulani kuanzia mwaka 1998-2012, na safu moja kwa kila mwaka kwa kila jimbo.
Itakuwa ya kuvutia kuonyesha mahusiano kati ya uzalishaji wa jimbo fulani kwa mwaka na, kwa mfano, bei ya asali katika jimbo hilo. Vinginevyo, unaweza kuonyesha mahusiano kati ya mavuno ya asali kwa kila koloni katika majimbo mbalimbali. Kipindi hiki cha miaka kinajumuisha tukio la kusikitisha la 'CCD' au 'Colony Collapse Disorder' lililoonekana kwa mara ya kwanza mwaka 2006 (http://npic.orst.edu/envir/ccd.html), kwa hivyo ni seti ya data yenye umuhimu wa kusoma. 🐝
Itakuwa ya kuvutia kuonyesha mahusiano kati ya uzalishaji wa jimbo fulani kwa mwaka na, kwa mfano, bei ya asali katika jimbo hilo. Vinginevyo, unaweza kuonyesha mahusiano kati ya mavuno ya asali kwa kila koloni katika majimbo mbalimbali. Kipindi hiki cha miaka kinajumuisha tukio la kusikitisha la 'CCD' au 'Colony Collapse Disorder' lililoonekana kwa mara ya kwanza mwaka 2006 (http://npic.orst.edu/envir/ccd.html), kwa hivyo ni seti ya data yenye umuhimu wa kipekee wa kusoma. 🐝
## [Jaribio la awali la somo](https://ff-quizzes.netlify.app/en/ds/quiz/22)
## [Jaribio la kabla ya somo](https://ff-quizzes.netlify.app/en/ds/quiz/22)
Katika somo hili, unaweza kutumia Seaborn, ambayo umewahi kuitumia hapo awali, kama maktaba nzuri ya kuonyesha mahusiano kati ya vigezo. Jambo la kuvutia hasa ni matumizi ya kipengele cha `relplot` cha Seaborn ambacho huruhusu grafu za alama na grafu za mistari kuonyesha haraka '[mahusiano ya takwimu](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', ambayo humsaidia mtaalamu wa data kuelewa vyema jinsi vigezo vinavyohusiana.
## Grafu za Alama
Tumia grafu ya alama kuonyesha jinsi bei ya asali imebadilika, mwaka hadi mwaka, kwa kila jimbo. Seaborn, kwa kutumia `relplot`, huweka data ya majimbo pamoja na kuonyesha alama za data kwa data ya kategoria na ya nambari.
Tumia grafu ya alama kuonyesha jinsi bei ya asali imebadilika, mwaka hadi mwaka, kwa kila jimbo. Seaborn, kwa kutumia `relplot`, huweka data ya majimbo pamoja na kuonyesha alama za data kwa data ya kategoria na ya namba.
Hebu tuanze kwa kuingiza data na Seaborn:
@ -46,21 +46,21 @@ Unagundua kuwa data ya asali ina safu kadhaa za kuvutia, zikiwemo mwaka na bei k
Tengeneza grafu ya msingi ya alama kuonyesha mahusiano kati ya bei kwa pauni ya asali na jimbo la asili la asali hiyo. Fanya mhimili wa `y` uwe mrefu vya kutosha kuonyesha majimbo yote:
Unda grafu ya msingi ya alama kuonyesha mahusiano kati ya bei kwa pauni ya asali na jimbo la asili. Fanya mhimili wa `y` uwe mrefu vya kutosha kuonyesha majimbo yote:
Sasa, onyesha data hiyo hiyo kwa kutumia mpangilio wa rangi ya asali ili kuonyesha jinsi bei inavyobadilika mwaka hadi mwaka. Unaweza kufanya hivi kwa kuongeza kipengele cha 'hue' kuonyesha mabadiliko, mwaka hadi mwaka:
Sasa, onyesha data hiyo hiyo kwa mpangilio wa rangi ya asali ili kuonyesha jinsi bei inavyobadilika mwaka hadi mwaka. Unaweza kufanya hivi kwa kuongeza kipengele cha 'hue' kuonyesha mabadiliko, mwaka hadi mwaka:
> ✅ Jifunze zaidi kuhusu [paleti za rangi unazoweza kutumia katika Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - jaribu mpangilio mzuri wa rangi za upinde wa mvua!
Kwa mabadiliko haya ya mpangilio wa rangi, unaweza kuona wazi kuwa kuna mwelekeo wa ongezeko la bei kwa pauni ya asali mwaka hadi mwaka. Kwa kweli, ukichunguza seti ya sampuli katika data ili kuthibitisha (chagua jimbo fulani, Arizona kwa mfano) unaweza kuona mwelekeo wa ongezeko la bei mwaka hadi mwaka, isipokuwa kwa baadhi ya miaka:
@ -82,51 +82,51 @@ Kwa mabadiliko haya ya mpangilio wa rangi, unaweza kuona wazi kuwa kuna mwelekeo
Njia nyingine ya kuonyesha mwelekeo huu ni kutumia ukubwa badala ya rangi. Kwa watumiaji wenye matatizo ya kuona rangi, hii inaweza kuwa chaguo bora. Hariri grafu yako kuonyesha ongezeko la bei kwa ongezeko la mduara wa alama:
Njia nyingine ya kuonyesha mwelekeo huu ni kutumia ukubwa badala ya rangi. Kwa watumiaji wenye matatizo ya kuona rangi, hii inaweza kuwa chaguo bora. Hariri grafu yako ili kuonyesha ongezeko la bei kwa ongezeko la mduara wa alama:
Je, hili ni suala rahisi la mahitaji na usambazaji? Kutokana na mambo kama mabadiliko ya hali ya hewa na kuporomoka kwa makoloni, je, kuna asali kidogo inayopatikana kwa ununuzi mwaka hadi mwaka, na hivyo bei inaongezeka?
Je, hili ni suala rahisi la mahitaji na usambazaji? Kutokana na mambo kama mabadiliko ya hali ya hewa na kuporomoka kwa makoloni, je, kuna asali kidogo inayopatikana kwa ununuzi mwaka hadi mwaka, na hivyo bei kuongezeka?
Ili kugundua uhusiano kati ya baadhi ya vigezo katika seti hii ya data, hebu tuchunguze grafu za mistari.
## Grafu za Mistari
Swali: Je, kuna ongezeko dhahiri la bei ya asali kwa pauni mwaka hadi mwaka? Unaweza kugundua hili kwa urahisi kwa kutengeneza grafu moja ya mstari:
Swali: Je, kuna ongezeko dhahiri la bei ya asali kwa pauni mwaka hadi mwaka? Unaweza kugundua hili kwa urahisi kwa kuunda grafu moja ya mstari:
✅ Kwa sababu Seaborn inakusanya data kuzunguka mstari mmoja, inaonyesha "vipimo vingi kwa kila thamani ya x kwa kuonyesha wastani na kipimo cha kujiamini cha 95% kuzunguka wastani". [Chanzo](https://seaborn.pydata.org/tutorial/relational.html). Tabia hii inayochukua muda inaweza kuzimwa kwa kuongeza `ci=None`.
Swali: Vema, mwaka 2003 tunaweza pia kuona ongezeko la usambazaji wa asali? Je, ukichunguza uzalishaji wa jumla mwaka hadi mwaka?
Swali: Vema, mwaka 2003 tunaweza pia kuona ongezeko la usambazaji wa asali? Je, ukitazama uzalishaji wa jumla mwaka hadi mwaka?
Jibu: Sio kweli. Ukichunguza uzalishaji wa jumla, inaonekana kuwa uliongezeka katika mwaka huo, ingawa kwa ujumla uzalishaji wa asali unaonekana kupungua katika miaka hiyo.
Jibu: Sio kweli. Ukitazama uzalishaji wa jumla, inaonekana kuwa uliongezeka katika mwaka huo, ingawa kwa ujumla uzalishaji wa asali unaonekana kupungua katika miaka hiyo.
Swali: Katika hali hiyo, ni nini kingeweza kusababisha ongezeko la bei ya asali karibu na mwaka 2003?
Ili kugundua hili, unaweza kuchunguza gridi ya vipengele.
## Gridi za Vipengele
## Gridi ya Vipengele
Gridi za vipengele huchukua kipengele kimoja cha seti yako ya data (katika hali yetu, unaweza kuchagua 'mwaka' ili kuepuka kuwa na vipengele vingi vilivyotengenezwa). Seaborn inaweza kisha kutengeneza grafu kwa kila kipengele cha x na y ulichokichagua kwa kulinganisha kwa urahisi. Je, mwaka 2003 unajitokeza katika aina hii ya kulinganisha?
Gridi ya vipengele huchukua kipengele kimoja cha seti yako ya data (katika hali yetu, unaweza kuchagua 'mwaka' ili kuepuka kuzalisha vipengele vingi sana). Seaborn inaweza kisha kutengeneza grafu kwa kila kipengele cha x na y unazochagua kwa kulinganisha kwa urahisi. Je, mwaka 2003 unajitokeza katika aina hii ya kulinganisha?
Tengeneza gridi ya vipengele kwa kuendelea kutumia `relplot` kama inavyopendekezwa na [nyaraka za Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
Unda gridi ya vipengele kwa kuendelea kutumia `relplot` kama inavyopendekezwa na [hati za Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
```python
sns.relplot(
@ -135,12 +135,13 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Katika grafu hii, unaweza kulinganisha mavuno kwa kila koloni na idadi ya makoloni mwaka hadi mwaka, sambamba na safu zilizowekwa 3 kwa kila safu:
Katika grafu hii, unaweza kulinganisha mavuno kwa kila koloni na idadi ya makoloni mwaka hadi mwaka, sambamba na mpangilio wa safu 3:
Kwa seti hii ya data, hakuna kitu kinachojitokeza hasa kuhusu idadi ya makoloni na mavuno yao, mwaka hadi mwaka na jimbo hadi jimbo. Je, kuna njia tofauti ya kutafuta uhusiano kati ya vigezo hivi viwili?
Kwa seti hii ya data, hakuna kitu kinachojitokeza hasa kuhusu idadi ya makoloni na mavuno yao, mwaka hadi mwaka na jimbo hadi jimbo. Je, kuna njia tofauti ya kutazama uhusiano kati ya vigezo hivi viwili?
Ingawa hakuna kitu kinachojitokeza kwa macho karibu na mwaka 2003, inaturuhusu kumaliza somo hili kwa mtazamo wa furaha kidogo: ingawa kuna kupungua kwa idadi ya makoloni kwa ujumla, idadi ya makoloni inaonekana kuwa imara hata kama mavuno yao kwa kila koloni yanapungua.
Ingawa hakuna kitu kinachojitokeza kwa macho karibu na mwaka 2003, inaturuhusu kumaliza somo hili kwa maelezo ya furaha kidogo: ingawa kuna idadi inayopungua ya makoloni, idadi ya makoloni inastabilisha hata kama mavuno yao kwa kila koloni yanapungua.
Endeleeni nyuki, endeleeni!
🐝❤️
## 🚀 Changamoto
Katika somo hili, umejifunza zaidi kuhusu matumizi mengine ya grafu za alama na gridi za mistari, ikiwemo gridi za vipengele. Jipatie changamoto ya kutengeneza gridi ya vipengele kwa kutumia seti tofauti ya data, labda moja uliyotumia kabla ya masomo haya. Angalia muda unaochukua kutengeneza na jinsi unavyohitaji kuwa makini kuhusu idadi ya gridi unazohitaji kuchora kwa kutumia mbinu hizi.
Katika somo hili, umejifunza zaidi kuhusu matumizi mengine ya grafu za alama na gridi za mistari, ikiwemo gridi za vipengele. Jipatie changamoto ya kuunda gridi ya vipengele kwa kutumia seti tofauti ya data, labda moja uliyoitumia kabla ya masomo haya. Angalia muda wanaochukua kuunda na jinsi unavyohitaji kuwa makini kuhusu idadi ya gridi unazohitaji kuchora kwa kutumia mbinu hizi.
## [Jaribio la baada ya somo](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Mapitio na Kujisomea
Grafu za mistari zinaweza kuwa rahisi au ngumu sana. Soma kidogo katika [nyaraka za Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) kuhusu njia mbalimbali unazoweza kuzitumia kujenga grafu hizi. Jaribu kuboresha grafu za mistari ulizotengeneza katika somo hili kwa kutumia mbinu nyingine zilizoorodheshwa katika nyaraka.
Grafu za mistari zinaweza kuwa rahisi au ngumu sana. Fanya usomaji kidogo katika [hati za Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) kuhusu njia mbalimbali unazoweza kuzitumia kuzijenga. Jaribu kuboresha grafu za mistari ulizojenga katika somo hili kwa kutumia mbinu nyingine zilizoorodheshwa katika hati.
## Kazi ya Nyumbani
## Kazi
[Chunguza mzinga wa nyuki](assignment.md)
---
**Kanusho**:
Hati hii imetafsiriwa kwa kutumia huduma ya tafsiri ya AI [Co-op Translator](https://github.com/Azure/co-op-translator). Ingawa tunajitahidi kuhakikisha usahihi, tafadhali fahamu kuwa tafsiri za kiotomatiki zinaweza kuwa na makosa au kutokuwa sahihi. Hati ya asili katika lugha yake ya awali inapaswa kuzingatiwa kama chanzo cha mamlaka. Kwa taarifa muhimu, tafsiri ya kitaalamu ya binadamu inapendekezwa. Hatutawajibika kwa kutoelewana au tafsiri zisizo sahihi zinazotokana na matumizi ya tafsiri hii.
Hati hii imetafsiriwa kwa kutumia huduma ya tafsiri ya AI [Co-op Translator](https://github.com/Azure/co-op-translator). Ingawa tunajitahidi kwa usahihi, tafadhali fahamu kuwa tafsiri za kiotomatiki zinaweza kuwa na makosa au kutokuwa sahihi. Hati ya asili katika lugha yake ya awali inapaswa kuzingatiwa kama chanzo cha mamlaka. Kwa taarifa muhimu, inashauriwa kutumia huduma ya tafsiri ya kitaalamu ya binadamu. Hatutawajibika kwa maelewano mabaya au tafsiri zisizo sahihi zinazotokana na matumizi ya tafsiri hii.
Sa pagpapatuloy ng ating pananaliksik na nakatuon sa kalikasan, tuklasin natin ang mga kawili-wiling paraan ng pagpapakita ng relasyon sa pagitan ng iba't ibang uri ng pulot, batay sa dataset mula sa [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
Ang dataset na ito, na may humigit-kumulang 600 item, ay nagpapakita ng produksyon ng pulot sa maraming estado ng U.S. Halimbawa, maaari mong tingnan ang bilang ng mga kolonya, ani bawat kolonya, kabuuang produksyon, imbentaryo, presyo bawat libra, at halaga ng pulot na ginawa sa isang partikular na estado mula 1998-2012, na may isang hilera bawat taon para sa bawat estado.
Ang dataset na ito, na may humigit-kumulang 600 item, ay nagpapakita ng produksyon ng pulot sa maraming estado sa U.S. Halimbawa, maaari mong tingnan ang bilang ng mga kolonya, ani bawat kolonya, kabuuang produksyon, imbentaryo, presyo bawat libra, at halaga ng pulot na ginawa sa isang partikular na estado mula 1998-2012, na may isang row bawat taon para sa bawat estado.
Magiging kawili-wiling ipakita ang relasyon sa pagitan ng produksyon ng isang estado bawat taon at, halimbawa, ang presyo ng pulot sa estado na iyon. Bilang alternatibo, maaari mong ipakita ang relasyon sa pagitan ng ani ng pulot bawat kolonya sa iba't ibang estado. Ang saklaw ng taon na ito ay sumasaklaw sa mapaminsalang 'CCD' o 'Colony Collapse Disorder' na unang nakita noong 2006 (http://npic.orst.edu/envir/ccd.html), kaya't ito ay isang makabuluhang dataset na pag-aralan. 🐝
@ -46,23 +46,23 @@ Mapapansin mo na ang data ng pulot ay may ilang kawili-wiling mga column, kabila
Gumawa ng simpleng scatterplot upang ipakita ang relasyon sa pagitan ng presyo bawat libra ng pulot at ng estado kung saan ito nagmula. Gawing sapat na mataas ang `y` axis upang maipakita ang lahat ng estado:
Gumawa ng basic scatterplot upang ipakita ang relasyon sa pagitan ng presyo bawat libra ng pulot at ng estado kung saan ito nagmula. Gawing sapat na mataas ang `y` axis upang maipakita ang lahat ng estado:
Ngayon, ipakita ang parehong data gamit ang isang kulay ng pulot upang ipakita kung paano nagbabago ang presyo sa paglipas ng mga taon. Maaari mong gawin ito sa pamamagitan ng pagdaragdag ng 'hue' parameter upang ipakita ang pagbabago, taon-taon:
Ngayon, ipakita ang parehong data gamit ang isang honey color scheme upang ipakita kung paano nagbabago ang presyo sa paglipas ng mga taon. Magagawa mo ito sa pamamagitan ng pagdaragdag ng 'hue' parameter upang ipakita ang pagbabago, taon-taon:
> ✅ Alamin ang higit pa tungkol sa [mga color palettes na maaari mong gamitin sa Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - subukan ang isang magandang rainbow color scheme!
Sa pagbabago ng color scheme na ito, makikita mo na malinaw na may malakas na pag-usad sa paglipas ng mga taon sa presyo ng pulot bawat libra. Sa katunayan, kung titingnan mo ang isang sample set sa data upang i-verify (pumili ng isang partikular na estado, Arizona halimbawa) makikita mo ang pattern ng pagtaas ng presyo taon-taon, na may ilang mga eksepsyon:
Sa pagbabago ng color scheme na ito, makikita mo na malinaw na may malakas na pagtaas sa paglipas ng mga taon sa presyo ng pulot bawat libra. Sa katunayan, kung titingnan mo ang isang sample set sa data upang i-verify (pumili ng isang partikular na estado, Arizona halimbawa) makikita mo ang pattern ng pagtaas ng presyo taon-taon, na may ilang mga eksepsyon:
| estado | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Isa pang paraan upang ipakita ang pag-usad na ito ay ang paggamit ng laki, sa halip na kulay. Para sa mga gumagamit na may colorblindness, maaaring mas magandang opsyon ito. I-edit ang iyong visualization upang ipakita ang pagtaas ng presyo sa pamamagitan ng pagtaas ng circumference ng mga tuldok:
Isa pang paraan upang ipakita ang progresyon na ito ay ang paggamit ng laki, sa halip na kulay. Para sa mga gumagamit na may colorblindness, maaaring mas magandang opsyon ito. I-edit ang iyong visualization upang ipakita ang pagtaas ng presyo sa pamamagitan ng pagtaas ng circumference ng mga tuldok:
Ito ba ay simpleng kaso ng supply at demand? Dahil sa mga salik tulad ng pagbabago ng klima at colony collapse, mas kaunti ba ang pulot na magagamit para bilhin taon-taon, kaya't tumataas ang presyo?
Upang matuklasan ang ugnayan sa pagitan ng ilan sa mga variable sa dataset na ito, tuklasin natin ang ilang line charts.
Upang matuklasan ang ugnayan sa pagitan ng ilang mga variable sa dataset na ito, tuklasin natin ang ilang line charts.
## Line charts
@ -102,21 +102,21 @@ Tanong: May malinaw bang pagtaas sa presyo ng pulot bawat libra taon-taon? Pinak
✅ Dahil ang Seaborn ay nag-aaggregate ng data sa isang linya, ipinapakita nito "ang maraming sukat sa bawat x value sa pamamagitan ng pag-plot ng mean at ang 95% confidence interval sa paligid ng mean". [Source](https://seaborn.pydata.org/tutorial/relational.html). Ang behavior na ito na kumakain ng oras ay maaaring i-disable sa pamamagitan ng pagdaragdag ng `ci=None`.
✅ Dahil ang Seaborn ay nag-a-aggregate ng data sa isang linya, ipinapakita nito "ang maramihang sukat sa bawat x value sa pamamagitan ng pag-plot ng mean at ang 95% confidence interval sa paligid ng mean". [Source](https://seaborn.pydata.org/tutorial/relational.html). Ang time-consuming na behavior na ito ay maaaring i-disable sa pamamagitan ng pagdaragdag ng `ci=None`.
Tanong: Sa 2003, makikita ba natin ang pagtaas sa supply ng pulot? Paano kung tingnan mo ang kabuuang produksyon taon-taon?
Tanong: Sa 2003, makikita rin ba natin ang pagtaas sa supply ng pulot? Paano kung tingnan mo ang kabuuang produksyon taon-taon?
Sagot: Hindi talaga. Kung titingnan mo ang kabuuang produksyon, tila ito ay talagang tumaas sa partikular na taon, kahit na sa pangkalahatan ang dami ng pulot na ginagawa ay bumababa sa mga taong ito.
Sagot: Hindi talaga. Kung titingnan mo ang kabuuang produksyon, tila ito ay tumaas sa partikular na taon, kahit na sa pangkalahatan ang dami ng pulot na ginagawa ay bumababa sa mga taong ito.
Tanong: Sa kasong iyon, ano kaya ang sanhi ng pagtaas ng presyo ng pulot sa paligid ng 2003?
@ -124,7 +124,7 @@ Upang matuklasan ito, maaari kang mag-explore ng facet grid.
## Facet grids
Ang facet grids ay kumukuha ng isang aspeto ng iyong dataset (sa ating kaso, maaari mong piliin ang 'year' upang maiwasan ang sobrang dami ng facets na ginawa). Ang Seaborn ay maaaring gumawa ng plot para sa bawat isa sa mga aspeto ng iyong napiling x at y coordinates para sa mas madaling visual na paghahambing. Namumukod-tangi ba ang 2003 sa ganitong uri ng paghahambing?
Ang facet grids ay kumukuha ng isang aspeto ng iyong dataset (sa ating kaso, maaari mong piliin ang 'year' upang maiwasan ang sobrang dami ng facets). Ang Seaborn ay maaaring gumawa ng plot para sa bawat isa sa mga facets ng iyong napiling x at y coordinates para sa mas madaling visual na paghahambing. Kapansin-pansin ba ang 2003 sa ganitong uri ng paghahambing?
Gumawa ng facet grid sa pamamagitan ng patuloy na paggamit ng `relplot` tulad ng inirerekomenda ng [Seaborn's documentation](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,12 +135,13 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Sa visualization na ito, maaari mong ihambing ang ani bawat kolonya at bilang ng mga kolonya taon-taon, magkatabi na may wrap na nakatakda sa 3 para sa mga column:
Para sa dataset na ito, walang partikular na namumukod-tangi kaugnay sa bilang ng mga kolonya at kanilang ani, taon-taon at estado sa estado. Mayroon bang ibang paraan upang tingnan ang paghahanap ng ugnayan sa pagitan ng dalawang variable na ito?
Para sa dataset na ito, walang partikular na kapansin-pansin tungkol sa bilang ng mga kolonya at kanilang ani, taon-taon at estado sa estado. Mayroon bang ibang paraan upang tingnan ang paghahanap ng ugnayan sa pagitan ng dalawang variable na ito?
Habang walang masyadong kapansin-pansin sa mata sa paligid ng taong 2003, pinapayagan tayo nitong tapusin ang araling ito sa mas masayang tala: habang sa pangkalahatan ay bumababa ang bilang ng mga kolonya, ang bilang ng mga kolonya ay nagiging matatag kahit na ang kanilang ani bawat kolonya ay bumababa.
Habang walang kapansin-pansin sa mata sa paligid ng taong 2003, pinapayagan tayo nitong tapusin ang araling ito sa isang mas masayang tala: habang may pangkalahatang pagbaba sa bilang ng mga kolonya, ang bilang ng mga kolonya ay nagiging matatag kahit na ang kanilang ani bawat kolonya ay bumababa.
Go, bees, go!
@ -176,7 +177,7 @@ Sa araling ito, natutunan mo ang higit pa tungkol sa iba pang gamit ng scatterpl
## Review & Self Study
Ang mga line plots ay maaaring simple o medyo kumplikado. Magbasa nang kaunti sa [Seaborn documentation](https://seaborn.pydata.org/generated/seaborn.lineplot.html) tungkol sa iba't ibang paraan kung paano mo sila mabubuo. Subukang pagandahin ang mga line charts na ginawa mo sa araling ito gamit ang iba pang mga pamamaraan na nakalista sa docs.
Ang mga line plots ay maaaring simple o medyo kumplikado. Magbasa nang kaunti sa [Seaborn documentation](https://seaborn.pydata.org/generated/seaborn.lineplot.html) tungkol sa iba't ibang paraan kung paano mo ito mabubuo. Subukang pagandahin ang mga line charts na ginawa mo sa araling ito gamit ang iba pang mga pamamaraan na nakalista sa docs.
## Assignment
@ -185,4 +186,4 @@ Ang mga line plots ay maaaring simple o medyo kumplikado. Magbasa nang kaunti sa
---
**Paunawa**:
Ang dokumentong ito ay isinalin gamit ang AI translation service na [Co-op Translator](https://github.com/Azure/co-op-translator). Bagama't sinisikap naming maging tumpak, pakatandaan na ang mga awtomatikong pagsasalin ay maaaring maglaman ng mga pagkakamali o hindi pagkakatugma. Ang orihinal na dokumento sa kanyang katutubong wika ang dapat ituring na opisyal na sanggunian. Para sa mahalagang impormasyon, inirerekomenda ang propesyonal na pagsasalin ng tao. Hindi kami mananagot sa anumang hindi pagkakaunawaan o maling interpretasyon na maaaring magmula sa paggamit ng pagsasaling ito.
Ang dokumentong ito ay isinalin gamit ang AI translation service na [Co-op Translator](https://github.com/Azure/co-op-translator). Bagama't sinisikap naming maging tumpak, pakitandaan na ang mga awtomatikong pagsasalin ay maaaring maglaman ng mga pagkakamali o hindi pagkakatugma. Ang orihinal na dokumento sa kanyang orihinal na wika ang dapat ituring na opisyal na sanggunian. Para sa mahalagang impormasyon, inirerekomenda ang propesyonal na pagsasalin ng tao. Hindi kami mananagot sa anumang hindi pagkakaunawaan o maling interpretasyon na maaaring magmula sa paggamit ng pagsasaling ito.
|İlişkileri Görselleştirme - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
Araştırmamızın doğa odaklı temasına devam ederek, Amerika Birleşik Devletleri Tarım Bakanlığı'ndan ([United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php)) alınan bir veri setine göre farklı bal türleri arasındaki ilişkileri göstermek için ilginç görselleştirmeler keşfedelim.
Araştırmamızın doğa odaklı temasına devam ederek, çeşitli bal türleri arasındaki ilişkileri göstermek için ilginç görselleştirmeler keşfedelim. Bu görselleştirmeler, [Amerika Birleşik Devletleri Tarım Bakanlığı](https://www.nass.usda.gov/About_NASS/index.php) tarafından sağlanan bir veri setine dayanmaktadır.
Yaklaşık 600 öğeden oluşan bu veri seti, birçok ABD eyaletindeki bal üretimini gösteriyor. Örneğin, bir eyaletteki kolonilerin sayısını, koloni başına verimi, toplam üretimi, stokları, pound başına fiyatı ve 1998-2012 yılları arasında üretilen balın değerini inceleyebilirsiniz. Her yıl için her eyalet bir satırda temsil edilir.
Yaklaşık 600 öğeden oluşan bu veri seti, birçok ABD eyaletindeki bal üretimini göstermektedir. Örneğin, bir eyaletteki kolonilerin sayısını, koloni başına verimi, toplam üretimi, stokları, pound başına fiyatı ve 1998-2012 yılları arasında üretilen balın değerini inceleyebilirsiniz. Her eyalet için her yıl bir satır bulunmaktadır.
Bir eyaletin yıllık üretimi ile o eyaletteki bal fiyatı arasındaki ilişkiyi görselleştirmek ilginç olabilir. Alternatif olarak, eyaletlerin koloni başına bal verimi arasındaki ilişkiyi görselleştirebilirsiniz. Bu zaman aralığı, ilk kez 2006 yılında görülen 'Koloni Çöküş Bozukluğu' (CCD) (http://npic.orst.edu/envir/ccd.html) gibi yıkıcı olayları kapsadığı için çalışılması anlamlı bir veri setidir. 🐝
Bir eyaletin yıllık üretimi ile o eyaletteki bal fiyatı arasındaki ilişkiyi görselleştirmek ilginç olabilir. Alternatif olarak, eyaletlerin koloni başına bal verimi arasındaki ilişkiyi görselleştirebilirsiniz. Bu zaman aralığı, ilk olarak 2006 yılında görülen 'CCD' veya 'Koloni Çöküş Bozukluğu' (http://npic.orst.edu/envir/ccd.html) dönemini kapsadığı için çalışılması anlamlı bir veri setidir. 🐝
## [Ders Öncesi Test](https://ff-quizzes.netlify.app/en/ds/quiz/22)
Bu derste, daha önce kullandığınız Seaborn kütüphanesini değişkenler arasındaki ilişkileri görselleştirmek için kullanabilirsiniz. Özellikle ilginç olan, Seaborn'un `relplot` fonksiyonunu kullanarak '[istatistiksel ilişkileri](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' hızlı bir şekilde görselleştirebilmenizdir. Bu, veri bilimcinin değişkenlerin birbirleriyle nasıl ilişkili olduğunu daha iyi anlamasına olanak tanır.
Bu derste, daha önce kullandığınız Seaborn kütüphanesini, değişkenler arasındaki ilişkileri görselleştirmek için kullanabilirsiniz. Özellikle ilginç olan, Seaborn'un `relplot` fonksiyonunu kullanarak '[istatistiksel ilişkileri](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' hızlı bir şekilde görselleştirebilmenizdir. Bu, veri bilimcilerin değişkenlerin birbirleriyle nasıl ilişkili olduğunu daha iyi anlamalarına olanak tanır.
## Dağılım Grafikleri
Bir eyaletteki bal fiyatının yıllar içinde nasıl değiştiğini göstermek için bir dağılım grafiği kullanın. Seaborn, `relplot` kullanarak eyalet verilerini gruplar ve hem kategorik hem de sayısal veriler için veri noktalarını görüntüler.
Bir eyalette bal fiyatının yıllar içinde nasıl değiştiğini göstermek için bir dağılım grafiği kullanın. Seaborn, `relplot` kullanarak eyalet verilerini gruplar ve hem kategorik hem de sayısal veriler için veri noktalarını görüntüler.
Hadi verileri ve Seaborn'u içe aktararak başlayalım:
@ -36,22 +36,22 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Bal verilerinin yıl ve pound başına fiyat gibi birkaç ilginç sütuna sahip olduğunu fark ediyorsunuz. Bu verileri ABD eyaletlerine göre gruplandırarak keşfedelim:
Bal verilerinin yıl ve pound başına fiyat gibi birkaç ilginç sütun içerdiğini fark ediyorsunuz. Bu verileri ABD eyaletlerine göre gruplayarak keşfedelim:
Balın pound başına fiyatı ile ABD'deki üretim eyaletleri arasındaki ilişkiyi göstermek için temel bir dağılım grafiği oluşturun. `y` eksenini tüm eyaletleri gösterecek kadar uzun yapın:
Şimdi, aynı verileri yıllar içinde fiyatın nasıl değiştiğini göstermek için bal renk şemasıyla gösterin. Bunu, yıllar içinde değişimi göstermek için bir 'hue' parametresi ekleyerek yapabilirsiniz:
Bu renk şeması değişikliğiyle, yıllar içinde pound başına bal fiyatında güçlü bir ilerleme olduğunu açıkça görebilirsiniz. Gerçekten de, verilerde bir örnek seti doğrulamak için (örneğin Arizona'yı seçin) yıllar içinde fiyat artışlarının bir modelini, birkaç istisna dışında görebilirsiniz:
Bu ilerlemeyi görselleştirmenin bir başka yolu, renk yerine boyut kullanmaktır. Renk körü kullanıcılar için bu daha iyi bir seçenek olabilir. Fiyat artışını nokta çevresinin artışıyla göstermek için görselleştirmenizi düzenleyin:
Bu renk şeması değişikliğiyle, yıllar içinde pound başına bal fiyatında güçlü bir ilerleme olduğunu açıkça görebilirsiniz. Gerçekten de, verilerde bir örnek seti inceleyerek (örneğin Arizona'yı seçerek) yıllar içinde fiyat artışlarının bir desenini, birkaç istisna dışında görebilirsiniz:
Bu ilerlemeyi görselleştirmenin başka bir yolu, renk yerine boyut kullanmaktır. Renk körü kullanıcılar için bu daha iyi bir seçenek olabilir. Görselleştirmenizi, fiyat artışını nokta çevresinin büyüklüğüyle gösterecek şekilde düzenleyin:
Bu basit bir arz-talep meselesi mi? İklim değişikliği ve koloni çöküşü gibi faktörler nedeniyle, yıllar içinde satın alınabilecek daha az bal mı var ve bu nedenle fiyat mı artıyor?
Bu basit bir arz ve talep meselesi mi? İklim değişikliği ve koloni çöküşü gibi faktörler nedeniyle, yıllar içinde satın alınabilecek daha az bal mı var ve bu nedenle fiyat mı artıyor?
Bu veri setindeki bazı değişkenler arasında bir korelasyon bulmak için, bazı çizgi grafiklerini keşfedelim.
Bu veri setindeki bazı değişkenler arasındaki korelasyonu keşfetmek için bazı çizgi grafiklerini inceleyelim.
✅ Seaborn, verileri tek bir çizgi etrafında topladığı için "her x değerindeki birden fazla ölçümü ortalamayı ve ortalama etrafındaki %95 güven aralığını çizerek" gösterir. [Kaynak](https://seaborn.pydata.org/tutorial/relational.html). Bu zaman alıcı davranış, `ci=None` eklenerek devre dışı bırakılabilir.
Soru: Peki, 2003 yılında bal arzında bir artış görebilir miyiz? Yıllar içinde toplam üretime bakarsanız ne olur?
Soru: Peki, 2003 yılında bal arzında bir artış da görebiliyor muyuz? Yıllar içinde toplam üretime bakarsanız ne görürsünüz?
Cevap: Pek değil. Toplam üretime bakarsanız, aslında o yıl artmış gibi görünüyor, ancak genel olarak konuşursak, bu yıllar boyunca üretilen bal miktarı düşüşte.
Cevap: Pek değil. Toplam üretime bakarsanız, aslında o yıl üretimin arttığını görürsünüz, ancak genel olarak bu yıllar boyunca üretilen bal miktarının azaldığı görülmektedir.
Soru: Bu durumda, 2003 yılı civarındaki bal fiyatındaki artışa ne sebep olmuş olabilir?
Bunu keşfetmek için bir facet grid oluşturabilirsiniz.
Bunu keşfetmek için bir facet grid inceleyebilirsiniz.
## Facet Gridler
Facet gridler, veri setinizin bir yönünü (bizim durumumuzda 'yıl'ı seçebilirsiniz) alır ve Seaborn, seçtiğiniz x ve y koordinatları için daha kolay görsel karşılaştırma yapmak üzere her bir facet için bir grafik oluşturur. Bu tür bir karşılaştırmada 2003 yılı öne çıkıyor mu?
Facet gridler, veri setinizin bir yönünü (bizim durumumuzda 'yıl' seçebilirsiniz) alır ve seçtiğiniz x ve y koordinatları için daha kolay görsel karşılaştırma yapabilmek adına her bir facet için bir grafik oluşturur. Bu tür bir karşılaştırmada 2003 yılı öne çıkıyor mu?
Seaborn'un [belgelerinde önerildiği](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) gibi `relplot` kullanmaya devam ederek bir facet grid oluşturun.
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Bu görselleştirmede, koloni başına verim ve koloni sayısını yıllar içinde yan yana, sütunlar için wrap 3 olarak ayarlanmış şekilde karşılaştırabilirsiniz:
Bu veri seti için, yıllar içinde ve eyaletler arasında koloni sayısı ve verim açısından özellikle dikkat çeken bir şey yok. Bu iki değişken arasında bir korelasyon bulmanın farklı bir yolu var mı?
Bu veri seti için, eyaletler ve yıllar arasında koloni sayısı ve verim açısından belirgin bir şey öne çıkmıyor. Bu iki değişken arasında bir korelasyon bulmanın farklı bir yolu var mı?
## Çift Çizgi Grafikleri
Seaborn'un 'despine' özelliğini kullanarak üst ve sağ kenar çizgilerini kaldırın ve Matplotlib'den [ax.twinx](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) kullanarak iki çizgi grafiği üst üste bindirin. Twinx, bir grafiğin x eksenini paylaşmasına ve iki y ekseni görüntülemesine olanak tanır. Koloni başına verim ve koloni sayısını üst üste bindirerek gösterin:
Seaborn'un 'despine' özelliğini kullanarak üst ve sağ kenar çizgilerini kaldırın ve Matplotlib'den [ax.twinx](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) kullanarak iki çizgi grafiği üst üste bindirin. Twinx, bir grafiğin x eksenini paylaşmasına ve iki y ekseni görüntülemesine olanak tanır. Koloni başına verim ve koloni sayısını üst üste bindirerek görüntüleyin:
2003 yılı civarında göze çarpan bir şey olmasa da, bu dersi biraz daha mutlu bir notla bitirmemize olanak tanıyor: genel olarak azalan koloni sayısına rağmen, koloni sayısı istikrar kazanıyor, ancak koloni başına verim azalıyor.
2003 yılı civarında göze çarpan bir şey olmasa da, bu dersi biraz daha mutlu bir notla bitirmemize olanak tanıyor: kolonilerin sayısı genel olarak azalıyor olsa da, koloni sayısı sabitleniyor, ancak koloni başına verim azalıyor.
Haydi arılar, haydi! 🐝❤️
Haydi arılar, devam edin!
🐝❤️
## 🚀 Meydan Okuma
Bu derste, dağılım grafikleri ve çizgi gridlerinin diğer kullanım alanları hakkında biraz daha bilgi edindiniz, facet gridler dahil. Daha önceki derslerde kullandığınız farklı bir veri seti kullanarak bir facet grid oluşturmayı deneyin. Bunları oluşturmanın ne kadar sürdüğünü ve bu teknikleri kullanarak kaç grid çizmeniz gerektiği konusunda dikkatli olmanız gerektiğini not edin.
Bu derste, dağılım grafikleri ve çizgi gridleri gibi diğer kullanım alanlarını biraz daha öğrendiniz. Daha önceki derslerde kullandığınız farklı bir veri setiyle bir facet grid oluşturmayı deneyerek kendinize meydan okuyun. Bunları oluşturmanın ne kadar sürdüğünü ve bu teknikleri kullanırken kaç tane grid çizmeniz gerektiğine dikkat etmeniz gerektiğini not edin.
## [Ders Sonrası Test](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Gözden Geçirme ve Kendi Kendine Çalışma
Çizgi grafikleri basit veya oldukça karmaşık olabilir. [Seaborn belgelerinde](https://seaborn.pydata.org/generated/seaborn.lineplot.html) çizgi grafikleri oluşturmanın çeşitli yolları hakkında biraz okuma yapın. Bu derste oluşturduğunuz çizgi grafiklerini belgelerde listelenen diğer yöntemlerle geliştirmeyi deneyin.
## Ödev
[Arı kovanına dalın](assignment.md)
@ -184,4 +185,4 @@ Bu derste, dağılım grafikleri ve çizgi gridlerinin diğer kullanım alanlar
---
**Feragatname**:
Bu belge, AI çeviri hizmeti [Co-op Translator](https://github.com/Azure/co-op-translator) kullanılarak çevrilmiştir. Doğruluk için çaba göstersek de, otomatik çevirilerin hata veya yanlışlık içerebileceğini lütfen unutmayın. Belgenin orijinal dili, yetkili kaynak olarak kabul edilmelidir. Kritik bilgiler için profesyonel insan çevirisi önerilir. Bu çevirinin kullanımından kaynaklanan yanlış anlamalar veya yanlış yorumlamalardan sorumlu değiliz.
Bu belge, [Co-op Translator](https://github.com/Azure/co-op-translator) adlı bir yapay zeka çeviri hizmeti kullanılarak çevrilmiştir. Doğruluk için çaba göstersek de, otomatik çevirilerin hata veya yanlışlıklar içerebileceğini lütfen unutmayın. Belgenin orijinal dili, yetkili kaynak olarak kabul edilmelidir. Kritik bilgiler için profesyonel bir insan çevirisi önerilir. Bu çevirinin kullanımından kaynaklanan yanlış anlamalar veya yanlış yorumlamalar için sorumluluk kabul etmiyoruz.
|Візуалізація взаємозв'язків - _Скетчнот від [@nitya](https://twitter.com/nitya)_ |
Продовжуючи дослідження природи, давайте відкриємо цікаві способи візуалізації, щоб показати взаємозв'язки між різними типами меду, відповідно до набору даних, отриманого від [Департаменту сільського господарства США](https://www.nass.usda.gov/About_NASS/index.php).
Продовжуючи дослідження природи, давайте відкриємо цікаві способи візуалізації взаємозв'язків між різними типами меду, використовуючи набір даних, отриманий від [Департаменту сільського господарства США](https://www.nass.usda.gov/About_NASS/index.php).
Цей набір даних, що містить близько 600 елементів, демонструє виробництво меду в багатьох штатах США. Наприклад, ви можете переглянути кількість колоній, урожайність на колонію, загальне виробництво, запаси, ціну за фунт і вартість виробленого меду в певному штаті з 1998 по 2012 рік, де кожен рядок відповідає одному року для кожного штату.
Цей набір даних, що містить близько 600 елементів, демонструє виробництво меду в багатьох штатах США. Наприклад, можна переглянути кількість колоній, урожайність на колонію, загальне виробництво, запаси, ціну за фунт і вартість виробленого меду в конкретному штаті за період з 1998 по 2012 рік, де кожен рядок представляє один рік для кожного штату.
Цікаво буде візуалізувати взаємозв'язок між виробництвом меду в певному штаті за рік і, наприклад, ціною меду в цьому штаті. Або ж можна візуалізувати взаємозв'язок між урожайністю меду на колонію в різних штатах. Цей часовий проміжок охоплює руйнівний феномен "CCD" або "Синдром руйнування колоній", вперше зафіксований у 2006 році (http://npic.orst.edu/envir/ccd.html), тому це важливий набір даних для дослідження. 🐝
Цікаво буде візуалізувати взаємозв'язок між виробництвом меду в конкретному штаті за рік і, наприклад, ціною меду в цьому штаті. Або ж можна візуалізувати взаємозв'язок між урожайністю меду на колонію в різних штатах. Цей період охоплює руйнівний феномен "CCD" або "Синдром колапсу колоній", вперше зафіксований у 2006 році (http://npic.orst.edu/envir/ccd.html), тому це важливий набір даних для дослідження. 🐝
## [Тест перед лекцією](https://ff-quizzes.netlify.app/en/ds/quiz/22)
У цьому уроці ви можете використовувати Seaborn, який ви вже використовували раніше, як чудову бібліотеку для візуалізації взаємозв'язків між змінними. Особливо цікавим є використання функції `relplot`у Seaborn, яка дозволяє створювати точкові та лінійні графіки для швидкої візуалізації '[статистичних взаємозв'язків](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', що допомагає дата-аналітикам краще зрозуміти, як змінні взаємодіють одна з одною.
У цьому уроці ви можете використовувати Seaborn, який ви вже використовували раніше, як чудову бібліотеку для візуалізації взаємозв'язків між змінними. Особливо цікавим є використання функції `relplot`у Seaborn, яка дозволяє створювати точкові та лінійні графіки для швидкої візуалізації '[статистичних взаємозв'язків](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', що допомагає аналітику даних краще зрозуміти, як змінні взаємодіють одна з одною.
## Точкові графіки
Використовуйте точковий графік, щоб показати, як ціна меду змінювалася рік за роком у кожному штаті. Seaborn, використовуючи `relplot`, зручно групує дані по штатах і відображає точки даних як для категоріальних, так і для числових даних.
Використовуйте точковий графік, щоб показати, як ціна меду змінювалася рік за роком у кожному штаті. Seaborn, використовуючи `relplot`, зручно групує дані по штатах і відображає точки для категорійних і числових даних.
Тепер покажіть ті ж дані з кольоровою схемою меду, щоб продемонструвати, як ціна змінюється рік за роком. Ви можете зробити це, додавши параметр 'hue', щоб показати зміни за роками:
З цією зміною кольорової схеми ви можете побачити очевидну тенденцію до зростання ціни за фунт меду протягом років. Дійсно, якщо ви перевірите вибірку даних (наприклад, виберіть штат Аризона), ви побачите закономірність зростання цін рік за роком, з деякими винятками:
Чи це простий випадок попиту та пропозиції? Через такі фактори, як зміна клімату та руйнування колоній, чи стає меду менше для покупки рік за роком, і тому ціна зростає?
Чи це простий випадок попиту та пропозиції? Через такі фактори, як зміна клімату та колапс колоній, чи стає меду менше для покупки рік за роком, і тому ціна зростає?
Щоб знайти кореляцію між деякими змінними в цьому наборі даних, давайте дослідимо лінійні графіки.
## Лінійні графіки
Запитання: Чи є чітке зростання ціни меду за фунт рік за роком? Найпростіше це можна побачити, створивши один лінійний графік:
Питання: Чи є чітке зростання ціни меду за фунт рік за роком? Найпростіше це можна побачити, створивши один лінійний графік:
✅ Оскільки Seaborn агрегує дані навколо однієї лінії, він відображає "кілька вимірювань для кожного значення x, показуючи середнє значення та 95% довірчий інтервал навколо середнього". [Джерело](https://seaborn.pydata.org/tutorial/relational.html). Цю ресурсомістку поведінку можна вимкнути, додавши `ci=None`.
✅ Оскільки Seaborn агрегує дані навколо однієї лінії, він відображає "кілька вимірювань для кожного значення x, показуючи середнє значення та 95% довірчий інтервал навколо середнього". [Джерело](https://seaborn.pydata.org/tutorial/relational.html). Цю поведінку, яка займає багато часу, можна вимкнути, додавши `ci=None`.
Запитання: Ну, а чи можемо ми також побачити сплеск у постачанні меду в 2003 році? Що, якщо ви подивитеся на загальне виробництво рік за роком?
Питання: Ну, а чи можемо ми також побачити сплеск у постачанні меду в 2003 році? Що, якщо ви подивитеся на загальне виробництво рік за роком?
Відповідь: Не зовсім. Якщо подивитися на загальне виробництво, здається, що воно фактично збільшилося в цьому конкретному році, хоча загалом кількість виробленого меду зменшується протягом цих років.
Запитання: У такому разі, що могло спричинити сплеск ціни меду близько 2003 року?
Питання: У такому разі, що могло спричинити сплеск ціни меду близько 2003 року?
Щоб це з'ясувати, можна дослідити сітку фасетів.
## Сітки фасетів
Сітки фасетів беруть одну грань вашого набору даних (у нашому випадку можна вибрати 'рік', щоб уникнути створення надто великої кількості фасетів). Seaborn може створити графік для кожної з цих граней за обраними координатами x і y для більш зручного візуального порівняння. Чи виділяється 2003 рік у такому порівнянні?
Сітки фасетів беруть одну грань вашого набору даних (у нашому випадку можна вибрати 'рік', щоб уникнути створення надто великої кількості фасетів). Seaborn може створити графік для кожної з цих граней за обраними координатами x і y для більш зручного порівняння. Чи виділяється 2003 рік у такому порівнянні?
Створіть сітку фасетів, продовжуючи використовувати `relplot`, як рекомендовано в [документації Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
@ -135,10 +135,11 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
У цій візуалізації ви можете порівняти урожайність на колонію та кількість колоній рік за роком, поруч із wrap, встановленим на 3 для колонок:
Для цього набору даних нічого особливого не виділяється щодо кількості колоній та їх урожайності рік за роком і штат за штатом. Чи є інший спосіб знайти кореляцію між цими двома змінними?
Хоча нічого особливого не виділяється близько 2003 року, це дозволяє нам завершити цей урок на трохи щасливішій ноті: хоча загалом кількість колоній зменшується, їх кількість стабілізується, навіть якщо їх урожайність на колонію знижується.
@ -170,18 +171,18 @@ ax.figure.legend();
🐝❤️
## 🚀 Виклик
У цьому уроці ви дізналися трохи більше про інші способи використання точкових графіків і сіток ліній, включаючи сітки фасетів. Викличте себе на створення сітки фасетів, використовуючи інший набір даних, можливо, той, який ви використовували до цих уроків. Зверніть увагу, скільки часу потрібно для їх створення і як важливо бути обережним із кількістю сіток, які потрібно намалювати за допомогою цих технік.
У цьому уроці ви дізналися трохи більше про інші способи використання точкових графіків ілінійних сіток, включаючи сітки фасетів. Викличте себе, створивши сітку фасетів, використовуючи інший набір даних, можливо, той, який ви використовували до цих уроків. Зверніть увагу, скільки часу потрібно для їх створення і як важливо бути обережним із кількістю сіток, які потрібно намалювати за допомогою цих технік.
## [Тест після лекції](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Огляд і самостійне навчання
Лінійні графіки можуть бути простими або досить складними. Почитайте [документацію Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) про різні способи їх побудови. Спробуйте вдосконалити лінійні графіки, які ви створили в цьому уроці, використовуючи інші методи, зазначені в документації.
Лінійні графіки можуть бути простими або досить складними. Почитайте [документацію Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) про різні способи їх створення. Спробуйте вдосконалити лінійні графіки, які ви створили в цьому уроці, використовуючи інші методи, зазначені в документації.
## Завдання
[Занурення у вулик](assignment.md)
[Зануртеся у вулик](assignment.md)
---
**Відмова від відповідальності**:
Цей документ був перекладений за допомогою сервісу автоматичного перекладу [Co-op Translator](https://github.com/Azure/co-op-translator). Хоча ми прагнемо до точності, будь ласка, майте на увазі, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ на його рідній мові слід вважати авторитетним джерелом. Для критичної інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникають внаслідок використання цього перекладу.
Цей документ було перекладено за допомогою сервісу автоматичного перекладу [Co-op Translator](https://github.com/Azure/co-op-translator). Хоча ми прагнемо до точності, зверніть увагу, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ мовою оригіналу слід вважати авторитетним джерелом. Для критично важливої інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникли внаслідок використання цього перекладу.
# شہد کے تعلقات کی بصری نمائندگی: شہد کے بارے میں سب کچھ 🍯
| کی طرف سے اسکیچ نوٹ ](../../sketchnotes/12-Visualizing-Relationships.png)|
| ](../../sketchnotes/12-Visualizing-Relationships.png)|
|:---:|
|تعلقات کی بصری نمائندگی - _[@nitya](https://twitter.com/nitya) کی طرف سے اسکیچ نوٹ_ |
|تعلقات کی بصری نمائندگی - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
ہماری تحقیق کے قدرتی پہلو کو جاری رکھتے ہوئے، آئیے مختلف اقسام کے شہد کے تعلقات کو ظاہر کرنے کے لیے دلچسپ بصری نمائندگیوں کو دریافت کریں، جو [ریاستہائے متحدہ کے محکمہ زراعت](https://www.nass.usda.gov/About_NASS/index.php) سے حاصل کردہ ڈیٹا سیٹ کے مطابق ہیں۔
ہماری تحقیق کے قدرتی پہلو کو جاری رکھتے ہوئے، آئیے مختلف اقسام کے شہد کے درمیان تعلقات کو ظاہر کرنے کے لیے دلچسپ بصری نمائندگیوں کو دریافت کریں، جو کہ [امریکہ کے محکمہ زراعت](https://www.nass.usda.gov/About_NASS/index.php) سے حاصل کردہ ڈیٹا سیٹ پر مبنی ہیں۔
یہ ڈیٹا سیٹ تقریباً 600 آئٹمز پر مشتمل ہے اور مختلف امریکی ریاستوں میں شہد کی پیداوار کو ظاہر کرتا ہے۔ مثال کے طور پر، آپ کسی دی گئی ریاست میں 1998 سے 2012 تک کے سالوں کے دوران کالونیز کی تعداد، فی کالونی پیداوار، کل پیداوار، ذخائر، فی پاؤنڈ قیمت، اور پیداوار کی قدر دیکھ سکتے ہیں، ہر سال کے لیے ایک قطار کے ساتھ۔
یہ ڈیٹا سیٹ تقریباً 600 اشیاء پر مشتمل ہے جو امریکہ کی مختلف ریاستوں میں شہد کی پیداوار کو ظاہر کرتا ہے۔ مثال کے طور پر، آپ دیکھ سکتے ہیں کہ کسی دی گئی ریاست میں 1998 سے 2012 کے درمیان ہر سال کے لیے کالونیوں کی تعداد، فی کالونی پیداوار، کل پیداوار، ذخائر، فی پاؤنڈ قیمت، اور پیداوار کی قیمت کیا تھی۔
یہ دلچسپ ہوگا کہ کسی دی گئی ریاست کی سالانہ پیداوار اور اس ریاست میں شہد کی قیمت کے درمیان تعلق کو بصری طور پر ظاہر کیا جائے۔ متبادل طور پر، آپ ریاستوں کی فی کالونی شہد کی پیداوار کے تعلق کو ظاہر کر سکتے ہیں۔ یہ سالوں کا دورانیہ 2006 میں پہلی بار دیکھے گئے تباہ کن 'CCD' یا 'Colony Collapse Disorder' (http://npic.orst.edu/envir/ccd.html) کو بھی شامل کرتا ہے، لہذا یہ مطالعہ کے لیے ایک اہم ڈیٹا سیٹ ہے۔ 🐝
یہ دلچسپ ہوگا کہ کسی دی گئی ریاست کی سالانہ پیداوار اور اس ریاست میں شہد کی قیمت کے درمیان تعلق کو بصری طور پر دکھایا جائے۔ متبادل طور پر، آپ ریاستوں کی فی کالونی شہد کی پیداوار کے درمیان تعلق کو ظاہر کر سکتے ہیں۔ یہ سال 2006 میں پہلی بار دیکھے گئے 'کالونی کولیپس ڈس آرڈر' (CCD) (http://npic.orst.edu/envir/ccd.html) کے دور کو بھی شامل کرتا ہے، اس لیے یہ مطالعہ کے لیے ایک اہم ڈیٹا سیٹ ہے۔ 🐝
## [لیکچر سے پہلے کا کوئز](https://ff-quizzes.netlify.app/en/ds/quiz/22)
اس سبق میں، آپ Seaborn استعمال کر سکتے ہیں، جسے آپ پہلے بھی استعمال کر چکے ہیں، جو متغیرات کے درمیان تعلقات کو ظاہر کرنے کے لیے ایک اچھا لائبریری ہے۔ خاص طور پر دلچسپ ہے Seaborn کا `relplot` فنکشن، جو اسکیٹر پلاٹس اور لائن پلاٹس کو جلدی سے '[اعدادی تعلقات](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' ظاہر کرنے کی اجازت دیتا ہے، جو ڈیٹا سائنسدان کو بہتر طور پر سمجھنے میں مدد دیتا ہے کہ متغیرات ایک دوسرے سے کیسے تعلق رکھتے ہیں۔
اس سبق میں، آپ Seaborn کا استعمال کر سکتے ہیں، جسے آپ پہلے بھی استعمال کر چکے ہیں، جو متغیرات کے درمیان تعلقات کو بصری طور پر ظاہر کرنے کے لیے ایک اچھی لائبریری ہے۔ خاص طور پر دلچسپ بات یہ ہے کہ Seaborn کے `relplot` فنکشن کا استعمال، جو اسکیٹر پلاٹس اور لائن پلاٹس کے ذریعے '[شماریاتی تعلقات](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' کو تیزی سے ظاہر کرنے کی اجازت دیتا ہے، جس سے ڈیٹا سائنسدان کو یہ سمجھنے میں مدد ملتی ہے کہ متغیرات ایک دوسرے سے کیسے جڑے ہوئے ہیں۔
## اسکیٹر پلاٹس
اسکیٹر پلاٹ کا استعمال کریں تاکہ دکھایا جا سکے کہ شہد کی قیمت سال بہ سال، ہر ریاست کے لحاظ سے کیسے تبدیل ہوئی ہے۔ Seaborn، `relplot` کا استعمال کرتے ہوئے، ریاست کے ڈیٹا کو گروپ کرتا ہے اور زمرہ وار اور عددی ڈیٹا کے لیے ڈیٹا پوائنٹس ظاہر کرتا ہے۔
اسکیٹر پلاٹ کا استعمال کرتے ہوئے دکھائیں کہ شہد کی قیمت سال بہ سال، ہر ریاست کے لیے کیسے بدلی ہے۔ Seaborn، `relplot` کا استعمال کرتے ہوئے، ریاستی ڈیٹا کو آسانی سے گروپ کرتا ہے اور زمرہ وار اور عددی ڈیٹا کے لیے ڈیٹا پوائنٹس دکھاتا ہے۔
آئیے ڈیٹا اور Seaborn کو درآمد کرنے سے شروع کریں:
@ -36,95 +36,95 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
آپ دیکھیں گے کہ شہد کے ڈیٹا میں کئی دلچسپ کالمز ہیں، جن میں سال اور فی پاؤنڈ قیمت شامل ہیں۔ آئیے اس ڈیٹا کو امریکی ریاست کے لحاظ سے گروپ کر کے دریافت کریں:
آپ دیکھیں گے کہ شہد کے ڈیٹا میں کئی دلچسپ کالمز ہیں، جن میں سال اور فی پاؤنڈ قیمت شامل ہیں۔ آئیے اس ڈیٹا کو دریافت کریں، جو امریکی ریاستوں کے لحاظ سے گروپ کیا گیا ہے:
| ریاست | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | سال |
ایک بنیادی اسکیٹر پلاٹ بنائیں تاکہ شہد کی فی پاؤنڈ قیمت اور اس کی امریکی ریاست کے ماخذ کے درمیان تعلق کو ظاہر کیا جا سکے۔ `y` محور کو اتنا لمبا بنائیں کہ تمام ریاستیں دکھائی دیں:
ایک بنیادی اسکیٹر پلاٹ بنائیں تاکہ شہد کی فی پاؤنڈ قیمت اور اس کی امریکی ریاست کے درمیان تعلق کو دکھایا جا سکے۔ `y` محور کو اتنا لمبا بنائیں کہ تمام ریاستیں نظر آئیں:
اب، اسی ڈیٹا کو شہد کے رنگ سکیم کے ساتھ دکھائیں تاکہ یہ ظاہر ہو کہ قیمت سال بہ سال کیسے تبدیل ہوتی ہے۔ آپ یہ 'hue' پیرامیٹر شامل کرکے کر سکتے ہیں تاکہ سال بہ سال تبدیلی ظاہر ہو:
اب، اسی ڈیٹا کو شہد کے رنگ سکیم کے ساتھ دکھائیں تاکہ یہ ظاہر ہو کہ قیمت سال بہ سال کیسے بدلی ہے۔ آپ یہ 'hue' پیرامیٹر شامل کرکے کر سکتے ہیں تاکہ سال بہ سال تبدیلی کو دکھایا جا سکے:
> ✅ Seaborn میں استعمال ہونے والے [رنگ سکیموں کے بارے میں مزید جانیں](https://seaborn.pydata.org/tutorial/color_palettes.html) - ایک خوبصورت قوس قزح رنگ سکیم آزمائیں!
> ✅ Seaborn میں استعمال ہونے والے [رنگ سکیمز کے بارے میں مزید جانیں](https://seaborn.pydata.org/tutorial/color_palettes.html) - ایک خوبصورت رینبو رنگ سکیم آزمائیں!
اس رنگ سکیم کی تبدیلی کے ساتھ، آپ واضح طور پر دیکھ سکتے ہیں کہ شہد کی فی پاؤنڈ قیمت میں سال بہ سال ایک مضبوط ترقی ہے۔ درحقیقت، اگر آپ ڈیٹا کے ایک نمونے کو تصدیق کے لیے دیکھیں (مثال کے طور پر، ایریزونا ریاست کو منتخب کریں) تو آپ سال بہ سال قیمت میں اضافے کا ایک نمونہ دیکھ سکتے ہیں، چند استثنائی صورتوں کے ساتھ:
| ریاست | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | سال |
ایک اور طریقہ یہ ہے کہ رنگ کے بجائے سائز کا استعمال کریں۔ رنگ اندھے صارفین کے لیے، یہ ایک بہتر آپشن ہو سکتا ہے۔ اپنی بصری نمائندگی کو اس طرح ایڈٹ کریں کہ قیمت میں اضافے کو نقطے کے دائرے کے اضافے کے ذریعے ظاہر کیا جائے:
اس رنگ سکیم کی تبدیلی کے ساتھ، آپ واضح طور پر دیکھ سکتے ہیں کہ شہد کی فی پاؤنڈ قیمت میں سال بہ سال ایک مضبوط ترقی ہو رہی ہے۔ درحقیقت، اگر آپ ڈیٹا کے ایک نمونے کو جانچنے کے لیے دیکھیں (مثال کے طور پر، ایریزونا ریاست کو منتخب کریں) تو آپ دیکھ سکتے ہیں کہ قیمت میں سال بہ سال اضافے کا ایک نمونہ موجود ہے، چند استثنائی صورتوں کے ساتھ:
| ریاست | کالونیوں کی تعداد | فی کالونی پیداوار | کل پیداوار | ذخائر | فی پاؤنڈ قیمت | پیداوار کی قیمت | سال |
ایک اور طریقہ یہ ہے کہ اس ترقی کو رنگ کے بجائے سائز کے ذریعے دکھایا جائے۔ رنگ نابینا صارفین کے لیے، یہ ایک بہتر آپشن ہو سکتا ہے۔ اپنی بصری نمائندگی کو اس طرح ایڈٹ کریں کہ قیمت میں اضافے کو نقطے کے دائرے کے سائز میں اضافے کے ذریعے دکھایا جائے:
کیا یہ صرف طلب اور رسد کا معاملہ ہے؟ موسمیاتی تبدیلی اور کالونی کے خاتمے جیسے عوامل کی وجہ سے، کیا سال بہ سال خریداری کے لیے کم شہد دستیاب ہے، اور اس وجہ سے قیمت بڑھ رہی ہے؟
کیا یہ صرف طلب اور رسد کا معاملہ ہے؟ موسمیاتی تبدیلی اور کالونی کولیپس جیسے عوامل کی وجہ سے، کیا سال بہ سال خریداری کے لیے کم شہد دستیاب ہے، اور اس لیے قیمت بڑھ رہی ہے؟
اس ڈیٹا سیٹ میں کچھ متغیرات کے درمیان تعلق کو دریافت کرنے کے لیے، آئیے کچھ لائن چارٹس کا جائزہ لیں۔
## لائن چارٹس
سوال: کیا شہد کی فی پاؤنڈ قیمت میں سال بہ سال واضح اضافہ ہے؟ آپ سب سے آسانی سے یہ ایک سنگل لائن چارٹ بنا کر دریافت کر سکتے ہیں:
سوال: کیا شہد کی فی پاؤنڈ قیمت میں سال بہ سال واضح اضافہ ہوا ہے؟ آپ یہ سب سے آسانی سے ایک سنگل لائن چارٹ بنا کر دریافت کر سکتے ہیں:
✅ چونکہ Seaborn ایک لائن کے ارد گرد ڈیٹا کو جمع کر رہا ہے، یہ "ہر x ویلیو پر متعدد پیمائشوں کو ظاہر کرتا ہے، اوسط اور اوسط کے ارد گرد 95% اعتماد کے وقفے کو پلاٹ کر کے"۔ [ماخذ](https://seaborn.pydata.org/tutorial/relational.html)۔ اس وقت لینے والے رویے کو `ci=None` شامل کر کے غیر فعال کیا جا سکتا ہے۔
✅ چونکہ Seaborn ایک لائن کے ارد گرد ڈیٹا کو جمع کر رہا ہے، یہ "ہر x ویلیو پر متعدد پیمائشوں کو اوسط اور اوسط کے ارد گرد 95% اعتماد کے وقفے کو پلاٹ کر کے ظاہر کرتا ہے"۔ [ماخذ](https://seaborn.pydata.org/tutorial/relational.html)۔ اس وقت لینے والے رویے کو `ci=None` شامل کر کے غیر فعال کیا جا سکتا ہے۔
سوال: ٹھیک ہے، 2003 میں کیا ہم شہد کی فراہمی میں بھی اضافہ دیکھ سکتے ہیں؟ اگر آپ سال بہ سال کل پیداوار کو دیکھیں تو کیا ہوگا؟
سوال: ٹھیک ہے، کیا ہم 2003 میں شہد کی فراہمی میں بھی اضافہ دیکھ سکتے ہیں؟ اگر آپ کل پیداوار کو سال بہ سال دیکھیں تو کیا ہوگا؟
جواب: واقعی نہیں۔ اگر آپ کل پیداوار کو دیکھیں، تو ایسا لگتا ہے کہ اس خاص سال میں یہ درحقیقت بڑھ گئی ہے، حالانکہ عام طور پر ان سالوں کے دوران پیدا ہونے والے شہد کی مقدار میں کمی ہو رہی ہے۔
جواب: واقعی نہیں۔ اگر آپ کل پیداوار کو دیکھیں، تو یہ خاص سال میں درحقیقت بڑھتی ہوئی نظر آتی ہے، حالانکہ عمومی طور پر ان سالوں کے دوران شہد کی پیداوار میں کمی ہو رہی ہے۔
سوال: اس صورت میں، 2003 کے ارد گرد شہد کی قیمت میں اضافے کی وجہ کیا ہو سکتی ہے؟
سوال: اس صورت میں، 2003 کے آس پاس شہد کی قیمت میں اضافے کی وجہ کیا ہو سکتی ہے؟
یہ دریافت کرنے کے لیے، آپ ایک فیسٹ گرڈ کا جائزہ لے سکتے ہیں۔
## فیسٹ گرڈز
فیسٹ گرڈز آپ کے ڈیٹا سیٹ کے ایک پہلو کو لیتے ہیں (ہمارے معاملے میں، آپ 'سال' کو منتخب کر سکتے ہیں تاکہ بہت زیادہ فیسٹس پیدا نہ ہوں)۔ پھر Seaborn آپ کے منتخب کردہ x اور y کوآرڈینیٹس کے لیے ہر فیسٹ کا پلاٹ بنا سکتا ہے تاکہ زیادہ آسان بصری موازنہ کیا جا سکے۔ کیا 2003 اس قسم کے موازنہ میں نمایاں ہے؟
فیسٹ گرڈز آپ کے ڈیٹا سیٹ کے ایک پہلو کو لیتے ہیں (ہمارے معاملے میں، آپ 'سال' کو منتخب کر سکتے ہیں تاکہ بہت زیادہ فیسٹس پیدا نہ ہوں)۔ پھر Seaborn آپ کے منتخب کردہ x اور y کوآرڈینیٹس کے لیے ہر فیسٹ کا ایک پلاٹ بنا سکتا ہے تاکہ بصری موازنہ آسان ہو۔ کیا 2003 اس قسم کے موازنہ میں نمایاں نظر آتا ہے؟
فیسٹ گرڈ بنانے کے لیے `relplot` کا استعمال جاری رکھیں جیسا کہ [Seaborn کی دستاویزات](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) میں تجویز کیا گیا ہے۔
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
اس بصری نمائندگی میں، آپ سال بہ سال اور ریاست بہ ریاست کالونی کی پیداوار اور کالونیوں کی تعداد کا موازنہ کر سکتے ہیں، کالمز کے لیے wrap کو 3 پر سیٹ کر کے:
اس بصری نمائندگی میں، آپ فی کالونی پیداوار اور کالونیوں کی تعداد کو سال بہ سال، ریاست بہ ریاست، 3 کالمز کے ساتھ موازنہ کر سکتے ہیں:
اس ڈیٹا سیٹ کے لیے، کالونیوں کی تعداد اور ان کی پیداوار کے حوالے سے سال بہ سال اور ریاست بہ ریاست کچھ خاص نمایاں نہیں ہوتا۔ کیا ان دو متغیرات کے درمیان تعلق تلاش کرنے کے لیے دیکھنے کا کوئی مختلف طریقہ ہے؟
## دوہری لائن پلاٹس
Seaborn کے 'despine' کا استعمال کرتے ہوئے دو لائن پلاٹس کو ایک دوسرے کے اوپر سپر امپوز کر کے ایک ملٹی لائن پلاٹ آزمائیں تاکہ ان کے اوپر اور دائیں اسپائنز کو ہٹا دیا جائے، اور `ax.twinx` [Matplotlib سے ماخوذ](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) کا استعمال کریں۔ Twinx ایک چارٹ کو x محور شیئر کرنے اور دو y محور ظاہر کرنے کی اجازت دیتا ہے۔ لہذا، کالونی کی پیداوار اور کالونیوں کی تعداد کو سپر امپوز کر کے ظاہر کریں:
Seaborn کے 'despine' کا استعمال کرتے ہوئے دو لائن پلاٹس کو ایک دوسرے کے اوپر سپر امپوز کرنے کی کوشش کریں تاکہ ان کے اوپر اور دائیں اسپائنز کو ہٹا دیا جائے، اور `ax.twinx`کا استعمال کریں [جو Matplotlib سے ماخوذ ہے](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html)۔ Twinx ایک چارٹ کو x محور کا اشتراک کرنے اور دو y محور کو ظاہر کرنے کی اجازت دیتا ہے۔ تو، فی کالونی پیداوار اور کالونیوں کی تعداد کو سپر امپوزڈ دکھائیں:
جبکہ 2003 کے سال کے ارد گرد آنکھ کو کچھ خاص نظر نہیں آتا، یہ ہمیں سبق کو ایک خوشگوار نوٹ پر ختم کرنے کی اجازت دیتا ہے: جبکہ مجموعی طور پر کالونیوں کی تعداد میں کمی ہو رہی ہے، کالونیوں کی تعداد مستحکم ہو رہی ہے، چاہے ان کی فی کالونی پیداوار کم ہو رہی ہو۔
اگرچہ 2003 کے آس پاس آنکھ کو کچھ خاص نظر نہیں آتا، لیکن یہ ہمیں اس سبق کو ایک خوشگوار نوٹ پر ختم کرنے کی اجازت دیتا ہے: اگرچہ مجموعی طور پر کالونیوں کی تعداد میں کمی ہو رہی ہے، کالونیوں کی تعداد مستحکم ہو رہی ہے، چاہے ان کی فی کالونی پیداوار کم ہو رہی ہو۔
جاؤ، شہد کی مکھیوں، جاؤ!
چلو، شہد کی مکھیوں، چلو!
🐝❤️
## 🚀 چیلنج
اس سبق میں، آپ نے اسکیٹر پلاٹس اور لائن گرڈز کے دیگر استعمالات کے بارے میں تھوڑا سا مزید سیکھا، بشمول فیسٹ گرڈز۔ خود کو چیلنج کریں کہ ایک مختلف ڈیٹا سیٹ کا استعمال کرتے ہوئے ایک فیسٹ گرڈ بنائیں، شاید وہ جو آپ نے ان اسباق سے پہلے استعمال کیا ہو۔ نوٹ کریں کہ انہیں بنانے میں کتنا وقت لگتا ہے اور آپ کو ان تکنیکوں کا استعمال کرتے ہوئے کتنے گرڈز بنانے میں محتاط رہنے کی ضرورت ہے۔
اس سبق میں، آپ نے اسکیٹر پلاٹس اور لائن گرڈز کے دیگر استعمالات کے بارے میں تھوڑا سا مزید سیکھا، بشمول فیسٹ گرڈز۔ اپنے آپ کو چیلنج کریں کہ کسی مختلف ڈیٹا سیٹ کا استعمال کرتے ہوئے ایک فیسٹ گرڈ بنائیں، شاید وہی جو آپ نے ان اسباق سے پہلے استعمال کیا ہو۔ نوٹ کریں کہ انہیں بنانے میں کتنا وقت لگتا ہے اور آپ کو ان تکنیکوں کا استعمال کرتے ہوئے کتنے گرڈز بنانے کی ضرورت ہے۔
## [لیکچر کے بعد کا کوئز](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## جائزہ اور خود مطالعہ
لائن پلاٹس سادہ یا کافی پیچیدہ ہو سکتے ہیں۔ [Seaborn کی دستاویزات](https://seaborn.pydata.org/generated/seaborn.lineplot.html) میں تھوڑا سا مطالعہ کریں کہ آپ انہیں بنانے کے مختلف طریقے کیا ہیں۔ ان طریقوں کو استعمال کرتے ہوئے اس سبق میں بنائے گئے لائن چارٹس کو بہتر بنانے کی کوشش کریں۔
## اسائنمنٹ
[شہد کے چھتے میں غوطہ لگائیں](assignment.md)
@ -185,4 +185,4 @@ ax.figure.legend();
---
**ڈسکلیمر**:
یہ دستاویز AI ترجمہ سروس [Co-op Translator](https://github.com/Azure/co-op-translator) کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا غیر درستیاں ہو سکتی ہیں۔ اصل دستاویز کو اس کی اصل زبان میں مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ ہم اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے ذمہ دار نہیں ہیں۔
یہ دستاویز AI ترجمہ سروس [Co-op Translator](https://github.com/Azure/co-op-translator) کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستگی ہو سکتی ہیں۔ اصل دستاویز، جو اس کی اصل زبان میں ہے، کو مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے لیے ہم ذمہ دار نہیں ہیں۔
|Hình dung Mối quan hệ - _Sketchnote của [@nitya](https://twitter.com/nitya)_ |
Tiếp tục với chủ đề thiên nhiên trong nghiên cứu của chúng ta, hãy khám phá các cách hình dung thú vị để thể hiện mối quan hệ giữa các loại mật ong khác nhau, dựa trên một tập dữ liệu từ [Bộ Nông nghiệp Hoa Kỳ](https://www.nass.usda.gov/About_NASS/index.php).
Tiếp tục với trọng tâm về thiên nhiên trong nghiên cứu của chúng ta, hãy khám phá các cách hình dung thú vị để thể hiện mối quan hệ giữa các loại mật ong khác nhau, dựa trên một tập dữ liệu từ [Bộ Nông nghiệp Hoa Kỳ](https://www.nass.usda.gov/About_NASS/index.php).
Tập dữ liệu này gồm khoảng 600 mục, hiển thị sản lượng mật ong ở nhiều bang của Hoa Kỳ. Ví dụ, bạn có thể xem số lượng đàn ong, sản lượng mỗi đàn, tổng sản lượng, lượng tồn kho, giá mỗi pound và giá trị mật ong được sản xuất ở một bang cụ thể từ năm 1998-2012, với mỗi hàng tương ứng với một năm cho từng bang.
Tập dữ liệu này gồm khoảng 600 mục hiển thị sản lượng mật ong ở nhiều bang của Hoa Kỳ. Ví dụ, bạn có thể xem số lượng đàn ong, sản lượng mỗi đàn, tổng sản lượng, tồn kho, giá mỗi pound, và giá trị mật ong được sản xuất ở một bang từ năm 1998-2012, với mỗi hàng đại diện cho một năm của từng bang.
Sẽ rất thú vị khi hình dung mối quan hệ giữa sản lượng hàng năm của một bang và, chẳng hạn, giá mật ong ở bang đó. Hoặc, bạn có thể hình dung mối quan hệ giữa sản lượng mật ong mỗi đàn của các bang. Khoảng thời gian này bao gồm sự kiện 'CCD' hay 'Hội chứng Sụp đổ Đàn ong' lần đầu tiên được ghi nhận vào năm 2006 (http://npic.orst.edu/envir/ccd.html), vì vậy đây là một tập dữ liệu đáng để nghiên cứu. 🐝
Sẽ rất thú vị khi hình dung mối quan hệ giữa sản lượng của một bang trong một năm nhất định và, ví dụ, giá mật ong ở bang đó. Ngoài ra, bạn có thể hình dung mối quan hệ giữa sản lượng mật ong mỗi đàn của các bang. Khoảng thời gian này bao gồm sự kiện 'CCD' hay 'Hội chứng Sụp đổ Đàn ong' lần đầu tiên được ghi nhận vào năm 2006 (http://npic.orst.edu/envir/ccd.html), vì vậy đây là một tập dữ liệu đáng để nghiên cứu. 🐝
## [Câu hỏi trước bài giảng](https://ff-quizzes.netlify.app/en/ds/quiz/22)
Trong bài học này, bạn có thể sử dụng Seaborn, một thư viện mà bạn đã sử dụng trước đó, để hình dung mối quan hệ giữa các biến. Đặc biệt thú vị là việc sử dụng hàm `relplot` của Seaborn, cho phép tạo biểu đồ phân tán và biểu đồ đường để nhanh chóng hình dung '[mối quan hệ thống kê](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', giúp nhà khoa học dữ liệu hiểu rõ hơn cách các biến liên quan đến nhau.
Trong bài học này, bạn có thể sử dụng Seaborn, thư viện mà bạn đã sử dụng trước đây, để hình dung mối quan hệ giữa các biến. Đặc biệt thú vị là việc sử dụng hàm `relplot` của Seaborn, cho phép tạo biểu đồ phân tán và biểu đồ đường để nhanh chóng hình dung '[mối quan hệ thống kê](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', giúp nhà khoa học dữ liệu hiểu rõ hơn về cách các biến liên quan đến nhau.
## Biểu đồ phân tán
Sử dụng biểu đồ phân tán để hiển thị cách giá mật ong thay đổi qua từng năm, theo từng bang. Seaborn, với `relplot`, thuận tiện nhóm dữ liệu theo bang và hiển thị các điểm dữ liệu cho cả dữ liệu phân loại và số.
Sử dụng biểu đồ phân tán để hiển thị cách giá mật ong thay đổi theo năm, từng bang. Seaborn, với `relplot`, tiện lợi nhóm dữ liệu của các bang và hiển thị các điểm dữ liệu cho cả dữ liệu phân loại và dữ liệu số.
Hãy bắt đầu bằng cách nhập dữ liệu và thư viện Seaborn:
Hãy bắt đầu bằng cách nhập dữ liệu và Seaborn:
```python
import pandas as pd
@ -36,7 +36,7 @@ import seaborn as sns
honey = pd.read_csv('../../data/honey.csv')
honey.head()
```
Bạn sẽ nhận thấy rằng dữ liệu mật ong có một số cột thú vị, bao gồm năm và giá mỗi pound. Hãy khám phá dữ liệu này, được nhóm theo các bang của Hoa Kỳ:
Bạn sẽ thấy rằng dữ liệu mật ong có một số cột thú vị, bao gồm năm và giá mỗi pound. Hãy khám phá dữ liệu này, được nhóm theo bang của Hoa Kỳ:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Bây giờ, hiển thị cùng dữ liệu với bảng màu mật ong để thể hiện cách giá thay đổi qua các năm. Bạn có thể làm điều này bằng cách thêm tham số 'hue' để hiển thị sự thay đổi qua từng năm:
Bây giờ, hiển thị cùng dữ liệu với một bảng màu mật ong để thể hiện cách giá thay đổi theo năm. Bạn có thể làm điều này bằng cách thêm tham số 'hue' để hiển thị sự thay đổi theo năm:
> ✅ Tìm hiểu thêm về [bảng màu bạn có thể sử dụng trong Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - thử một bảng màu cầu vồng đẹp mắt!
Với sự thay đổi bảng màu này, bạn có thể thấy rõ ràng rằng có một sự tiến triển mạnh mẽ qua các năm về giá mật ong mỗi pound. Thật vậy, nếu bạn xem xét một tập dữ liệu mẫu để xác minh (chọn một bang cụ thể, chẳng hạn Arizona), bạn có thể thấy một mô hình tăng giá qua từng năm, với một vài ngoại lệ:
Với sự thay đổi bảng màu này, bạn có thể thấy rõ ràng rằng có một sự tiến triển mạnh mẽ theo năm về giá mật ong mỗi pound. Thực tế, nếu bạn xem xét một tập mẫu trong dữ liệu để xác minh (chọn một bang cụ thể, ví dụ Arizona), bạn có thể thấy một xu hướng tăng giá theo năm, với một vài ngoại lệ:
| state | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
Đây có phải là một trường hợp đơn giản của cung và cầu? Do các yếu tố như biến đổi khí hậu và sự sụp đổ của đàn ong, liệu có ít mật ong hơn để mua qua từng năm, và do đó giá tăng?
Đây có phải là một trường hợp đơn giản của cung và cầu? Do các yếu tố như biến đổi khí hậu và sự sụp đổ của đàn ong, liệu có ít mật ong hơn để mua theo năm, và do đó giá tăng lên?
Để khám phá mối tương quan giữa một số biến trong tập dữ liệu này, hãy cùng tìm hiểu một số biểu đồ đường.
## Biểu đồ đường
Câu hỏi: Liệu có sự tăng giá rõ ràng của mật ong mỗi pound qua từng năm không? Bạn có thể dễ dàng khám phá điều đó bằng cách tạo một biểu đồ đường đơn:
Câu hỏi: Có sự tăng giá rõ ràng của mật ong mỗi pound theo năm không? Bạn có thể dễ dàng khám phá điều này bằng cách tạo một biểu đồ đường đơn:
✅ Vì Seaborn đang tổng hợp dữ liệu xung quanh một đường, nó hiển thị "các phép đo lặp lại tại mỗi giá trị x bằng cách vẽ trung bình và khoảng tin cậy 95% xung quanh trung bình". [Nguồn](https://seaborn.pydata.org/tutorial/relational.html). Hành vi tốn thời gian này có thể bị vô hiệu hóa bằng cách thêm `ci=None`.
✅ Vì Seaborn đang tổng hợp dữ liệu xung quanh một đường, nó hiển thị "các phép đo nhiều lần tại mỗi giá trị x bằng cách vẽ trung bình và khoảng tin cậy 95% xung quanh trung bình". [Nguồn](https://seaborn.pydata.org/tutorial/relational.html). Hành vi tốn thời gian này có thể bị vô hiệu hóa bằng cách thêm `ci=None`.
Câu hỏi: Vậy, vào năm 2003, liệu chúng ta có thể thấy sự tăng đột biến trong nguồn cung mật ong không? Điều gì sẽ xảy ra nếu bạn xem xét tổng sản lượng qua từng năm?
Câu hỏi: Vậy, vào năm 2003, liệu chúng ta có thể thấy sự tăng đột biến trong nguồn cung mật ong không? Nếu bạn xem xét tổng sản lượng theo năm thì sao?
Trả lời: Không hẳn. Nếu bạn xem xét tổng sản lượng, thực tế nó dường như đã tăng trong năm đó, mặc dù nhìn chung lượng mật ong được sản xuất đang giảm trong những năm này.
Câu hỏi: Trong trường hợp đó, điều gì có thể đã gây ra sự tăng giá mật ong vào khoảng năm 2003?
Để khám phá điều này, bạn có thể sử dụng lưới mặt cắt.
Để khám phá điều này, bạn có thể sử dụng một lưới facet.
## Lưới mặt cắt
## Lưới facet
Lưới mặt cắt lấy một khía cạnh của tập dữ liệu (trong trường hợp của chúng ta, bạn có thể chọn 'năm' để tránh tạo ra quá nhiều mặt cắt). Seaborn sau đó có thể tạo một biểu đồ cho mỗi mặt cắt của các tọa độ x và y bạn chọn để so sánh dễ dàng hơn. Liệu năm 2003 có nổi bật trong loại so sánh này?
Lưới facet lấy một khía cạnh của tập dữ liệu của bạn (trong trường hợp này, bạn có thể chọn 'năm' để tránh tạo quá nhiều facet). Seaborn sau đó có thể tạo một biểu đồ cho mỗi facet của các tọa độ x và y bạn chọn để so sánh dễ dàng hơn. Liệu năm 2003 có nổi bật trong loại so sánh này?
Tạo một lưới mặt cắt bằng cách tiếp tục sử dụng `relplot` như được khuyến nghị bởi [tài liệu của Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
Tạo một lưới facet bằng cách tiếp tục sử dụng `relplot` như được khuyến nghị bởi [tài liệu của Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
```python
sns.relplot(
@ -135,16 +135,17 @@ sns.relplot(
col="year",
col_wrap=3,
kind="line"
)
```
Trong hình dung này, bạn có thể so sánh sản lượng mỗi đàn và số lượng đàn ong qua từng năm, cạnh nhau với số cột được đặt là 3:
Trong hình dung này, bạn có thể so sánh sản lượng mỗi đàn và số lượng đàn ong theo năm, cạnh nhau với wrap được đặt là 3 cho các cột:
Đối với tập dữ liệu này, không có điều gì đặc biệt nổi bật liên quan đến số lượng đàn ong và sản lượng của chúng, qua từng năm và từng bang. Liệu có cách nào khác để tìm mối tương quan giữa hai biến này?
Đối với tập dữ liệu này, không có gì đặc biệt nổi bật liên quan đến số lượng đàn ong và sản lượng của chúng theo năm và theo bang. Có cách nào khác để tìm mối tương quan giữa hai biến này không?
## Biểu đồ đường kép
Thử một biểu đồ đường nhiều dòng bằng cách chồng hai biểu đồ đường lên nhau, sử dụng 'despine' của Seaborn để loại bỏ các cạnh trên và phải, và sử dụng `ax.twinx` [dựa trên Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx cho phép một biểu đồ chia sẻ trục x và hiển thị hai trục y. Vì vậy, hiển thị sản lượng mỗi đàn và số lượng đàn ong, chồng lên nhau:
Thử một biểu đồ đa đường bằng cách chồng hai biểu đồ đường lên nhau, sử dụng 'despine' của Seaborn để loại bỏ các cạnh trên và phải, và sử dụng `ax.twinx` [dựa trên Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx cho phép một biểu đồ chia sẻ trục x và hiển thị hai trục y. Vì vậy, hiển thị sản lượng mỗi đàn và số lượng đàn ong, chồng lên nhau:
Mặc dù không có điều gì nổi bật vào khoảng năm 2003, nhưng điều này cho phép chúng ta kết thúc bài học với một ghi chú tích cực hơn: mặc dù số lượng đàn ong đang giảm, nhưng số lượng đàn ong đang ổn định ngay cả khi sản lượng mỗi đàn đang giảm.
Mặc dù không có gì nổi bật vào khoảng năm 2003, nó cho phép chúng ta kết thúc bài học này với một ghi chú tích cực hơn: mặc dù số lượng đàn ong đang giảm, số lượng đàn ong đang ổn định ngay cả khi sản lượng mỗi đàn đang giảm.
Cố lên, những chú ong! 🐝❤️
Cố lên, ong nhé!
🐝❤️
## 🚀 Thử thách
Trong bài học này, bạn đã học thêm về các cách sử dụng khác của biểu đồ phân tán và lưới mặt cắt, bao gồm cả lưới mặt cắt. Thử thách bản thân để tạo một lưới mặt cắt sử dụng một tập dữ liệu khác, có thể là một tập dữ liệu bạn đã sử dụng trước đó trong các bài học này. Lưu ý thời gian tạo và cần cẩn thận như thế nào về số lượng lưới bạn cần vẽ bằng các kỹ thuật này.
Trong bài học này, bạn đã học thêm về các cách sử dụng biểu đồ phân tán và lưới đường, bao gồm lưới facet. Thử thách bản thân để tạo một lưới facet sử dụng một tập dữ liệu khác, có thể là một tập dữ liệu bạn đã sử dụng trước đây trong các bài học này. Lưu ý thời gian tạo và cách bạn cần cẩn thận về số lượng lưới cần vẽ khi sử dụng các kỹ thuật này.
## [Câu hỏi sau bài giảng](https://ff-quizzes.netlify.app/en/ds/quiz/23)
## Ôn tập & Tự học
Biểu đồ đường có thể đơn giản hoặc khá phức tạp. Hãy đọc thêm trong [tài liệu của Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) về các cách khác nhau bạn có thể xây dựng chúng. Thử cải thiện các biểu đồ đường bạn đã tạo trong bài học này bằng các phương pháp khác được liệt kê trong tài liệu.