You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
ML-For-Beginners/translations/he/9-Real-World/1-Applications/README.md

18 KiB

פוסטסקריפט: למידת מכונה בעולם האמיתי

סיכום של למידת מכונה בעולם האמיתי בסקצ'נוט

סקצ'נוט מאת Tomomi Imura

במהלך הקורס הזה, למדתם דרכים רבות להכנת נתונים לאימון וליצירת מודלים של למידת מכונה. בניתם סדרה של מודלים קלאסיים כמו רגרסיה, אשכולות, סיווג, עיבוד שפה טבעית ומודלים של סדרות זמן. כל הכבוד! עכשיו, אתם אולי תוהים למה כל זה נועד... מהן היישומים בעולם האמיתי של המודלים הללו?

למרות שהרבה עניין בתעשייה מתמקד בבינה מלאכותית, שלרוב עושה שימוש בלמידה עמוקה, עדיין יש יישומים חשובים למודלים קלאסיים של למידת מכונה. ייתכן שאפילו אתם משתמשים בחלק מהיישומים הללו היום! בשיעור הזה, תחקור כיצד שמונה תעשיות ותחומים שונים משתמשים במודלים אלו כדי להפוך את היישומים שלהם ליותר יעילים, אמינים, חכמים ובעלי ערך למשתמשים.

שאלון לפני השיעור

💰 פיננסים

תחום הפיננסים מציע הזדמנויות רבות ללמידת מכונה. בעיות רבות בתחום זה מתאימות למידול ופתרון באמצעות למידת מכונה.

זיהוי הונאות בכרטיסי אשראי

למדנו על אשכולות k-means מוקדם יותר בקורס, אבל איך ניתן להשתמש בהם כדי לפתור בעיות הקשורות להונאות בכרטיסי אשראי?

אשכולות k-means מועילים בטכניקה לזיהוי הונאות בכרטיסי אשראי הנקראת זיהוי חריגות. חריגות, או סטיות בתצפיות על סט נתונים, יכולות להצביע אם כרטיס אשראי נמצא בשימוש רגיל או אם מתרחש משהו חריג. כפי שמוצג במאמר המקושר למטה, ניתן למיין נתוני כרטיסי אשראי באמצעות אלגוריתם אשכולות k-means ולהקצות כל עסקה לאשכול על סמך מידת החריגות שלה. לאחר מכן, ניתן להעריך את האשכולות המסוכנים ביותר כדי להבחין בין עסקאות הונאה לעסקאות לגיטימיות.
Reference

ניהול עושר

בניהול עושר, אדם או חברה מנהלים השקעות עבור לקוחותיהם. תפקידם הוא לשמר ולהגדיל את העושר לטווח הארוך, ולכן חשוב לבחור השקעות שמניבות ביצועים טובים.

אחת הדרכים להעריך את ביצועי ההשקעה היא באמצעות רגרסיה סטטיסטית. רגרסיה ליניארית היא כלי חשוב להבנת ביצועי קרן ביחס למדד מסוים. ניתן גם להסיק האם תוצאות הרגרסיה הן משמעותיות סטטיסטית, או כמה הן ישפיעו על השקעות הלקוח. ניתן להרחיב את הניתוח באמצעות רגרסיה מרובה, שבה ניתן לקחת בחשבון גורמי סיכון נוספים. לדוגמה כיצד זה יעבוד עבור קרן ספציפית, עיינו במאמר למטה על הערכת ביצועי קרן באמצעות רגרסיה.
Reference

🎓 חינוך

תחום החינוך הוא גם תחום מעניין שבו ניתן ליישם למידת מכונה. ישנן בעיות מעניינות להתמודד איתן כמו זיהוי רמאות במבחנים או חיבורים, או ניהול הטיות, מכוונות או לא, בתהליך התיקון.

חיזוי התנהגות תלמידים

Coursera, ספק קורסים פתוחים מקוון, מחזיק בלוג טכנולוגי נהדר שבו הם דנים בהחלטות הנדסיות רבות. במקרה זה, הם שרטטו קו רגרסיה כדי לנסות לחקור כל קשר בין דירוג NPS (Net Promoter Score) נמוך לבין שמירה על קורס או נשירה ממנו.
Reference

הפחתת הטיות

Grammarly, עוזר כתיבה שבודק שגיאות כתיב ודקדוק, משתמש במערכות מתקדמות של עיבוד שפה טבעית במוצריו. הם פרסמו מחקר מעניין בבלוג הטכנולוגי שלהם על איך הם התמודדו עם הטיה מגדרית בלמידת מכונה, כפי שלמדתם בשיעור ההוגנות המבואי שלנו.
Reference

👜 קמעונאות

תחום הקמעונאות יכול בהחלט להרוויח משימוש בלמידת מכונה, החל מיצירת מסע לקוח טוב יותר ועד לניהול מלאי בצורה אופטימלית.

התאמת מסע הלקוח

ב-Wayfair, חברה שמוכרת מוצרים לבית כמו רהיטים, עזרה ללקוחות למצוא את המוצרים הנכונים לטעמם ולצרכיהם היא קריטית. במאמר זה, מהנדסים מהחברה מתארים כיצד הם משתמשים בלמידת מכונה ובעיבוד שפה טבעית כדי "להציג את התוצאות הנכונות ללקוחות". במיוחד, מנוע כוונת השאילתה שלהם נבנה כדי להשתמש בחילוץ ישויות, אימון מסווגים, חילוץ נכסים ודעות, ותיוג רגשות על ביקורות לקוחות. זהו מקרה שימוש קלאסי של איך NLP עובד בקמעונאות מקוונת.
Reference

ניהול מלאי

חברות חדשניות וזריזות כמו StitchFix, שירות קופסאות ששולח בגדים לצרכנים, מסתמכות רבות על למידת מכונה להמלצות וניהול מלאי. צוותי הסטיילינג שלהם עובדים יחד עם צוותי הסחורה שלהם, למעשה: "אחד ממדעני הנתונים שלנו התנסה באלגוריתם גנטי ויישם אותו על בגדים כדי לחזות מה יהיה פריט לבוש מצליח שלא קיים היום. הבאנו את זה לצוות הסחורה ועכשיו הם יכולים להשתמש בזה ככלי."
Reference

🏥 בריאות

תחום הבריאות יכול לנצל למידת מכונה כדי לייעל משימות מחקר וגם בעיות לוגיסטיות כמו אשפוז חוזר של מטופלים או עצירת התפשטות מחלות.

ניהול ניסויים קליניים

רעילות בניסויים קליניים היא דאגה מרכזית עבור יצרני תרופות. כמה רעילות היא נסבלת? במחקר זה, ניתוח שיטות ניסוי קליניות שונות הוביל לפיתוח גישה חדשה לחיזוי הסיכויים לתוצאות ניסויים קליניים. במיוחד, הם הצליחו להשתמש ביער אקראי כדי ליצור מסווג שמסוגל להבחין בין קבוצות של תרופות.
Reference

ניהול אשפוז חוזר בבתי חולים

טיפול בבתי חולים הוא יקר, במיוחד כאשר מטופלים צריכים להתאשפז שוב. מאמר זה דן בחברה שמשתמשת בלמידת מכונה כדי לחזות פוטנציאל אשפוז חוזר באמצעות אלגוריתמי אשכולות. אשכולות אלו עוזרים לאנליסטים "לגלות קבוצות של אשפוזים חוזרים שעשויים לחלוק סיבה משותפת".
Reference

ניהול מחלות

המגפה האחרונה שמה זרקור על הדרכים שבהן למידת מכונה יכולה לעזור בעצירת התפשטות מחלות. במאמר זה, תזהו שימוש ב-ARIMA, עקומות לוגיסטיות, רגרסיה ליניארית ו-SARIMA. "עבודה זו היא ניסיון לחשב את שיעור התפשטות הנגיף הזה וכך לחזות את מקרי המוות, ההחלמות והמקרים המאושרים, כך שזה עשוי לעזור לנו להתכונן טוב יותר ולהישאר בחיים."
Reference

🌲 אקולוגיה וטכנולוגיה ירוקה

הטבע והאקולוגיה מורכבים ממערכות רגישות רבות שבהן האינטראקציה בין בעלי חיים לטבע נכנסת למוקד. חשוב להיות מסוגלים למדוד מערכות אלו בצורה מדויקת ולפעול בהתאם אם משהו קורה, כמו שריפת יער או ירידה באוכלוסיית בעלי החיים.

ניהול יערות

למדתם על למידת חיזוקים בשיעורים קודמים. היא יכולה להיות מאוד שימושית כאשר מנסים לחזות דפוסים בטבע. במיוחד, ניתן להשתמש בה כדי לעקוב אחר בעיות אקולוגיות כמו שריפות יער והתפשטות מינים פולשים. בקנדה, קבוצת חוקרים השתמשה בלמידת חיזוקים כדי לבנות מודלים של דינמיקת שריפות יער מתמונות לוויין. באמצעות "תהליך התפשטות מרחבי (SSP)" חדשני, הם דמיינו שריפת יער כ"סוכן בכל תא בנוף". "סט הפעולות שהאש יכולה לבצע ממיקום בכל נקודת זמן כולל התפשטות צפונה, דרומה, מזרחה או מערבה או אי התפשטות.

גישה זו הופכת את ההגדרה הרגילה של למידת חיזוקים מכיוון שהדינמיקה של תהליך ההחלטה של מרקוב (MDP) המתאים היא פונקציה ידועה להתפשטות מיידית של שריפות." קראו עוד על האלגוריתמים הקלאסיים שבהם השתמשה הקבוצה בקישור למטה.
Reference

חישת תנועה של בעלי חיים

בעוד שלמידה עמוקה יצרה מהפכה במעקב חזותי אחר תנועות בעלי חיים (ניתן לבנות עוקב דובי קוטב משלכם כאן), למידת מכונה קלאסית עדיין יש מקום במשימה זו.

חיישנים למעקב אחר תנועות של בעלי חיים בחוות ו-IoT עושים שימוש בסוג זה של עיבוד חזותי, אך טכניקות למידת מכונה בסיסיות יותר מועילות לעיבוד מקדים של נתונים. לדוגמה, במאמר זה, תנוחות כבשים נוטרו ונותחו באמצעות אלגוריתמי מסווגים שונים. ייתכן שתזהו את עקומת ROC בעמוד 335.
Reference

ניהול אנרגיה

בשיעורים שלנו על חיזוי סדרות זמן, העלינו את הרעיון של מדחנים חכמים כדי לייצר הכנסות לעיר על סמך הבנת היצע וביקוש. מאמר זה דן בפירוט כיצד אשכולות, רגרסיה וחיזוי סדרות זמן שולבו כדי לעזור לחזות שימוש עתידי באנרגיה באירלנד, בהתבסס על מדידה חכמה.
Reference

💼 ביטוח

תחום הביטוח הוא תחום נוסף שמשתמש בלמידת מכונה כדי לבנות ולייעל מודלים פיננסיים ואקטואריים.

ניהול תנודתיות

MetLife, ספק ביטוח חיים, פתוח לגבי הדרך שבה הם מנתחים ומפחיתים תנודתיות במודלים הפיננסיים שלהם. במאמר זה תבחינו בהדמיות סיווג בינאריות ואורדינליות. תגלו גם הדמיות חיזוי.
Reference

🎨 אמנות, תרבות וספרות

בתחום האמנות, למשל בעיתונאות, ישנן בעיות מעניינות רבות. זיהוי חדשות מזויפות הוא בעיה גדולה שכן הוכח שהיא משפיעה על דעת הקהל ואפילו על הפלת דמוקרטיות. מוזיאונים יכולים גם להרוויח משימוש בלמידת מכונה בכל דבר, החל ממציאת קשרים בין פריטים ועד תכנון משאבים.

זיהוי חדשות מזויפות

זיהוי חדשות מזויפות הפך למשחק של חתול ועכבר במדיה של היום. במאמר זה, חוקרים מציעים שמערכת שמשלבת כמה מטכניקות למידת המכונה שלמדנו יכולה להיבחן והמודל הטוב ביותר ייושם: "מערכת זו מבוססת על עיבוד שפה טבעית כדי לחלץ תכונות מהנתונים ולאחר מכן תכונות אלו משמשות לאימון מסווגי למידת מכונה כמו Naive Bayes, Support Vector Machine (SVM), Random Forest (RF), Stochastic Gradient Descent (SGD), ו-Logistic Regression (LR)."
Reference

מאמר זה מראה כיצד שילוב תחומים שונים של למידת מכונה יכול להפיק תוצאות מעניינות שיכולות לעזור לעצור את התפשטות החדשות המזויפות ולמנוע נזק אמיתי; במקרה זה, המניע היה התפשטות שמועות על טיפולי COVID שגרמו לאלימות המונית.

למידת מכונה במוזיאונים

מוזיאונים נמצאים על סף מהפכת AI שבה קטלוג ודיגיטציה של אוספים ומציאת קשרים בין פריטים הופכים לקלים יותר ככל שהטכנולוגיה מתקדמת. פרויקטים כמו In Codice Ratio עוזרים לפתוח את המסתורין של אוספים בלתי נגישים כמו הארכיונים של הוותיקן. אבל, ההיבט העסקי של מוזיאונים מרוויח גם ממודלים של למידת מכונה.

לדוגמה, מכון האמנות של שיקגו בנה מודלים כדי לחזות מה מעניין את הקהל ומתי הוא יגיע לתערוכות. המטרה היא ליצור חוויות מבקר מותאמות ואופטימליות בכל פעם שהמשתמש מבקר במוזיאון. "במהלך שנת הכספים 2017, המודל חזה נוכחות והכנסות בדיוק של 1 אחוז, אומר אנדרו סימניק, סגן נשיא בכיר במכון האמנות."
Reference

🏷 שיווק

פילוח לקוחות

אסטרטגיות השיווק היעילות ביותר מכוונות ללקוחות בדרכים שונות בהתבסס על קבוצות שונות. במאמר זה, נדונים השימושים באלגוריתמי אשכולות כדי לתמוך בשיווק מובחן. שיווק מובחן עוזר לחברות לשפר את זיהוי המותג, להגיע ליותר לקוחות ולהרוויח יותר כסף.
Reference

🚀 אתגר

זהו תחום נוסף שמרוויח מחלק מהטכניקות שלמדתם בקורס זה, וגלה כיצד הוא משתמש בלמידת מכונה.

שאלון לאחר ההרצאה

סקירה ולימוד עצמי

לצוות מדעי הנתונים של Wayfair יש כמה סרטונים מעניינים על איך הם משתמשים בלמידת מכונה בחברה שלהם. שווה להציץ!

משימה

חיפוש אוצר בלמידת מכונה


כתב ויתור:
מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית Co-op Translator. בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.