35 KiB
מבוא לאתיקה של נתונים
![]() |
---|
אתיקה במדעי הנתונים - סקיצה מאת @nitya |
כולנו אזרחים של נתונים החיים בעולם מבוסס נתונים.
מגמות השוק מראות שעד שנת 2022, אחת מתוך שלוש ארגונים גדולים תקנה ותמכור את הנתונים שלה דרך שווקים ומרכזי מסחר מקוונים. בתור מפתחי אפליקציות, יהיה לנו קל וזול יותר לשלב תובנות מבוססות נתונים ואוטומציה מבוססת אלגוריתמים בחוויות היומיום של המשתמשים. אך ככל שהבינה המלאכותית הופכת לנפוצה, נצטרך גם להבין את הנזקים הפוטנציאליים הנגרמים משימוש לרעה באלגוריתמים כאלה בקנה מידה רחב.
מגמות נוספות מצביעות על כך שניצור ונצרוך מעל 180 זטה-בייטים של נתונים עד שנת 2025. בתור מדעני נתונים, זה מעניק לנו רמות חסרות תקדים של גישה לנתונים אישיים. המשמעות היא שנוכל לבנות פרופילים התנהגותיים של משתמשים ולהשפיע על קבלת ההחלטות בדרכים שיוצרות אשליה של בחירה חופשית, תוך כדי דחיפת המשתמשים לתוצאות שאנחנו מעדיפים. זה גם מעלה שאלות רחבות יותר על פרטיות נתונים והגנה על משתמשים.
אתיקה של נתונים היא כיום מסגרת הכרחית למדעי הנתונים וההנדסה, המסייעת לנו למזער נזקים פוטנציאליים ותוצאות בלתי צפויות מפעולותינו מבוססות הנתונים. מחזור ההייפ של גרטנר עבור AI מזהה מגמות רלוונטיות באתיקה דיגיטלית, AI אחראי, וממשל AI כגורמים מרכזיים למגמות רחבות יותר סביב דמוקרטיזציה ו_תיעוש_ של AI.
בשיעור זה, נחקור את התחום המרתק של אתיקה של נתונים - החל ממושגים ואתגרים מרכזיים, דרך מחקרי מקרה ועד מושגים יישומיים כמו ממשל AI - המסייעים לבסס תרבות אתית בצוותים ובארגונים העובדים עם נתונים ו-AI.
שאלון לפני השיעור 🎯
הגדרות בסיסיות
נתחיל בהבנת המונחים הבסיסיים.
המילה "אתיקה" מגיעה מהמילה היוונית ethikos (ושורשה "ethos") שמשמעותה אופי או טבע מוסרי.
אתיקה עוסקת בערכים משותפים ועקרונות מוסריים שמנחים את התנהגותנו בחברה. אתיקה מבוססת לא על חוקים אלא על נורמות מקובלות של מה "נכון מול לא נכון". עם זאת, שיקולים אתיים יכולים להשפיע על יוזמות ממשל תאגידי ורגולציות ממשלתיות שיוצרות תמריצים נוספים לציות.
אתיקה של נתונים היא ענף חדש של אתיקה שחוקר ומעריך בעיות מוסריות הקשורות ל_נתונים, אלגוריתמים ופרקטיקות נלוות_. כאן, "נתונים" מתמקדים בפעולות הקשורות ליצירה, רישום, אצירה, עיבוד, הפצה, שיתוף ושימוש; "אלגוריתמים" מתמקדים ב-AI, סוכנים, למידת מכונה ורובוטים; ו**"פרקטיקות"** מתמקדות בנושאים כמו חדשנות אחראית, תכנות, פריצה וקודי אתיקה.
אתיקה יישומית היא יישום מעשי של שיקולים מוסריים. זהו תהליך של חקירה פעילה של סוגיות אתיות בהקשר של פעולות, מוצרים ותהליכים בעולם האמיתי, ולקיחת צעדים מתקנים כדי להבטיח שהם נשארים מיושרים עם הערכים האתיים שהוגדרו.
תרבות אתית עוסקת בהפעלה של אתיקה יישומית כדי להבטיח שהעקרונות והפרקטיקות האתיים שלנו מאומצים באופן עקבי וניתן להרחבה בכל רחבי הארגון. תרבויות אתיות מצליחות מגדירות עקרונות אתיים ברמת הארגון, מספקות תמריצים משמעותיים לציות, ומחזקות נורמות אתיות על ידי עידוד והגברת התנהגויות רצויות בכל רמות הארגון.
מושגי אתיקה
בקטע זה נדון במושגים כמו ערכים משותפים (עקרונות) ואתגרים אתיים (בעיות) באתיקה של נתונים - ונחקור מחקרי מקרה שיעזרו לכם להבין את המושגים הללו בהקשרים של העולם האמיתי.
1. עקרונות אתיים
כל אסטרטגיה של אתיקה של נתונים מתחילה בהגדרת עקרונות אתיים - "ערכים משותפים" שמתארים התנהגויות מקובלות ומנחים פעולות תואמות בפרויקטים של נתונים ו-AI שלנו. ניתן להגדיר אותם ברמה האישית או הצוותית. עם זאת, רוב הארגונים הגדולים מגדירים אותם בהצהרת משימה או מסגרת של AI אתי ברמת הארגון, ומיישמים אותם באופן עקבי בכל הצוותים.
דוגמה: הצהרת המשימה של AI אחראי של מיקרוסופט אומרת: "אנחנו מחויבים לקידום AI מונחה עקרונות אתיים שמעמידים את האנשים במרכז" - ומזהה 6 עקרונות אתיים במסגרת הבאה:
בואו נחקור בקצרה את העקרונות הללו. שקיפות ו_אחריות_ הם ערכים יסודיים שעליהם נבנים עקרונות אחרים - אז נתחיל שם:
- אחריות הופכת את העוסקים בתחום ל_אחראים_ על פעולותיהם בתחום הנתונים וה-AI, ועל הציות לעקרונות האתיים הללו.
- שקיפות מבטיחה שפעולות הנתונים וה-AI יהיו מובנות (ניתנות לפרשנות) למשתמשים, תוך הסבר על מה ולמה מאחורי ההחלטות.
- הוגנות - מתמקדת בהבטחת יחס הוגן לכל האנשים, תוך התמודדות עם הטיות חברתיות-טכניות מערכתיות או סמיות בנתונים ובמערכות.
- אמינות ובטיחות - מבטיחה ש-AI מתנהג בעקביות עם ערכים מוגדרים, תוך מזעור נזקים פוטנציאליים או תוצאות בלתי צפויות.
- פרטיות ואבטחה - עוסקת בהבנת שושלת הנתונים ובמתן הגנה על פרטיות נתונים למשתמשים.
- הכללה - עוסקת בעיצוב פתרונות AI מתוך כוונה, והתאמתם למגוון רחב של צרכים ויכולות אנושיות.
🚨 חשבו על מה יכולה להיות הצהרת המשימה של אתיקה של נתונים שלכם. חקרו מסגרות AI אתיות מארגונים אחרים - הנה דוגמאות מ-IBM, Google, ו-Facebook. אילו ערכים משותפים יש להם במשותף? כיצד עקרונות אלה קשורים למוצרי AI או לתעשייה שבה הם פועלים?
2. אתגרים אתיים
לאחר שהגדרנו עקרונות אתיים, השלב הבא הוא להעריך את פעולות הנתונים וה-AI שלנו כדי לראות אם הן מתיישרות עם הערכים המשותפים הללו. חשבו על הפעולות שלכם בשתי קטגוריות: איסוף נתונים ו_עיצוב אלגוריתמים_.
באיסוף נתונים, הפעולות יכללו ככל הנראה נתונים אישיים או מידע אישי מזהה (PII) עבור אנשים מזוהים. זה כולל פריטים מגוונים של נתונים לא אישיים שמזהים ביחד אדם. אתגרים אתיים יכולים להיות קשורים ל_פרטיות נתונים_, בעלות על נתונים, ונושאים קשורים כמו הסכמה מדעת ו_זכויות קניין רוחני_ של משתמשים.
בעיצוב אלגוריתמים, הפעולות יכללו איסוף ואצירה של מאגרי נתונים, ואז שימוש בהם לאימון ופריסה של מודלים נתונים שמנבאים תוצאות או מבצעים אוטומציה של החלטות בהקשרים של העולם האמיתי. אתגרים אתיים יכולים לנבוע מ_הטיות במאגרי נתונים_, בעיות איכות נתונים, חוסר הוגנות, ו_ייצוג שגוי_ באלגוריתמים - כולל כמה נושאים שהם מערכתיים בטבעם.
בשני המקרים, אתגרים אתיים מדגישים אזורים שבהם הפעולות שלנו עשויות להיתקל בקונפליקט עם הערכים המשותפים שלנו. כדי לזהות, למזער, למנוע או לבטל את החששות הללו - עלינו לשאול שאלות מוסריות "כן/לא" הקשורות לפעולותינו, ואז לנקוט צעדים מתקנים לפי הצורך. בואו נבחן כמה אתגרים אתיים והשאלות המוסריות שהם מעלים:
2.1 בעלות על נתונים
איסוף נתונים כולל לעיתים קרובות נתונים אישיים שיכולים לזהות את נושאי הנתונים. בעלות על נתונים עוסקת ב_שליטה_ וזכויות משתמשים הקשורות ליצירה, עיבוד והפצה של נתונים.
השאלות המוסריות שעלינו לשאול הן:
- מי הבעלים של הנתונים? (משתמש או ארגון)
- אילו זכויות יש לנושאי הנתונים? (לדוגמה: גישה, מחיקה, ניידות)
- אילו זכויות יש לארגונים? (לדוגמה: תיקון ביקורות משתמשים מזיקות)
2.2 הסכמה מדעת
הסכמה מדעת מגדירה את פעולת המשתמשים בהסכמה לפעולה (כמו איסוף נתונים) עם הבנה מלאה של עובדות רלוונטיות כולל המטרה, הסיכונים הפוטנציאליים והחלופות.
שאלות לחקור כאן הן:
- האם המשתמש (נושא הנתונים) נתן רשות לאיסוף ושימוש בנתונים?
- האם המשתמש הבין את המטרה שלשמה נאספו הנתונים?
- האם המשתמש הבין את הסיכונים הפוטנציאליים מהשתתפותו?
2.3 קניין רוחני
קניין רוחני מתייחס ליצירות בלתי מוחשיות הנובעות מיוזמה אנושית, שעשויות להיות בעלות ערך כלכלי לאנשים או עסקים.
שאלות לחקור כאן הן:
- האם לנתונים שנאספו יש ערך כלכלי למשתמש או לעסק?
- האם למשתמש יש קניין רוחני כאן?
- האם לארגון יש קניין רוחני כאן?
- אם זכויות אלו קיימות, כיצד אנו מגנים עליהן?
2.4 פרטיות נתונים
פרטיות נתונים או פרטיות מידע מתייחסת לשמירה על פרטיות המשתמש והגנה על זהותו ביחס למידע אישי מזהה.
שאלות לחקור כאן הן:
- האם הנתונים האישיים של המשתמשים מוגנים מפני פריצות ודליפות?
- האם הנתונים של המשתמשים נגישים רק למשתמשים מורשים והקשרים מורשים?
- האם האנונימיות של המשתמשים נשמרת כאשר הנתונים משותפים או מופצים?
- האם ניתן לזהות משתמש מתוך מאגרי נתונים אנונימיים?
2.5 הזכות להישכח
הזכות להישכח או הזכות למחיקה מספקת הגנה נוספת על נתונים אישיים למשתמשים. באופן ספציפי, היא מעניקה למשתמשים את הזכות לבקש מחיקה או הסרה של נתונים אישיים מחיפושים באינטרנט וממקומות אחרים, בתנאים מסוימים - ומאפשרת להם התחלה חדשה ברשת מבלי שפעולות עבר יעמדו נגדם.
שאלות לחקור כאן הן:
- האם המערכת מאפשרת לנושאי נתונים לבקש מחיקה?
- האם ביטול הסכמת המשתמש צריך להפעיל מחיקה אוטומטית?
- האם נתונים נאספו ללא הסכמה או באמצעים בלתי חוקיים?
- האם אנו עומדים ברגולציות ממשלתיות לפרטיות נתונים?
2.6 הטיות במאגרי נתונים
הטיות במאגרי נתונים או הטיות באיסוף עוסקות בבחירת תת-קבוצה לא מייצגת של נתונים לפיתוח אלגוריתמים, מה שיוצר פוטנציאל לחוסר הוגנות בתוצאות עבור קבוצות מגוונות. סוגי הטיות כוללים הטיית בחירה או דגימה, הטיית מתנדבים והטיית מכשירים.
שאלות לחקור כאן הן:
- האם גייסנו קבוצה מייצגת של נושאי נתונים?
- האם בדקנו את מאגר הנתונים שנאסף או נאצר עבור הטיות שונות?
- האם אנו יכולים למזער או להסיר הטיות שהתגלו?
2.7 איכות נתונים
איכות נתונים בוחנת את תקפות מאגר הנתונים שנאצר לפיתוח האלגוריתמים שלנו, ובודקת אם התכונות והרשומות עומדות בדרישות לרמת דיוק ועקביות הנדרשת למטרת ה-AI שלנו.
שאלות לחקור כאן הן:
- האם אספנו תכונות תקפות למקרה השימוש שלנו?
- האם הנתונים נאספו בעקביות ממקורות נתונים מגוונים?
- האם מאגר הנתונים שלם עבור תנאים או תרחישים מגוונים?
- האם המידע שנאסף מדויק ומשקף את המציאות?
2.8 הוגנות אלגוריתמים
Algorithm Fairness בודק האם עיצוב האלגוריתם מפלה באופן שיטתי נגד קבוצות משנה מסוימות של נבדקים, מה שמוביל לנזקים פוטנציאליים ב_הקצאה_ (כאשר משאבים נשללים או נמנעים מאותה קבוצה) וב_איכות השירות_ (כאשר הבינה המלאכותית אינה מדויקת באותה מידה עבור קבוצות משנה מסוימות כמו שהיא עבור אחרות).
שאלות שכדאי לבחון כאן:
- האם הערכנו את דיוק המודל עבור קבוצות משנה ותנאים מגוונים?
- האם בדקנו את המערכת לנזקים פוטנציאליים (לדוגמה, סטריאוטיפים)?
- האם ניתן לשנות נתונים או לאמן מחדש מודלים כדי להפחית נזקים שזוהו?
חקור משאבים כמו AI Fairness checklists כדי ללמוד עוד.
2.9 ייצוג שגוי
ייצוג שגוי של נתונים עוסק בשאלה האם אנו מתקשרים תובנות מנתונים שדווחו בכנות באופן מטעה כדי לתמוך בנרטיב רצוי.
שאלות שכדאי לבחון כאן:
- האם אנו מדווחים נתונים לא שלמים או לא מדויקים?
- האם אנו מציגים נתונים באופן שמוביל למסקנות מטעות?
- האם אנו משתמשים בטכניקות סטטיסטיות סלקטיביות כדי לעוות תוצאות?
- האם קיימות הסברים חלופיים שיכולים להציע מסקנה שונה?
2.10 בחירה חופשית
אשליית הבחירה החופשית מתרחשת כאשר "ארכיטקטורות בחירה" של מערכת משתמשות באלגוריתמים לקבלת החלטות כדי להניע אנשים לקחת תוצאה מועדפת תוך יצירת רושם שיש להם אפשרויות ושליטה. דפוסים אפלים אלו יכולים לגרום לנזקים חברתיים וכלכליים למשתמשים. מכיוון שהחלטות משתמש משפיעות על פרופילי התנהגות, פעולות אלו עשויות להניע בחירות עתידיות שיכולות להעצים או להרחיב את השפעת הנזקים הללו.
שאלות שכדאי לבחון כאן:
- האם המשתמש הבין את ההשלכות של קבלת הבחירה הזו?
- האם המשתמש היה מודע לבחירות (חלופיות) וליתרונות וחסרונות של כל אחת?
- האם המשתמש יכול להפוך בחירה אוטומטית או מושפעת מאוחר יותר?
3. מחקרי מקרה
כדי לשים את האתגרים האתיים הללו בהקשרים של העולם האמיתי, כדאי להסתכל על מחקרי מקרה שמדגישים את הנזקים וההשלכות הפוטנציאליים על יחידים וחברה, כאשר הפרות אתיות כאלה מתעלמים מהן.
הנה כמה דוגמאות:
אתגר אתי | מחקר מקרה |
---|---|
הסכמה מדעת | 1972 - מחקר העגבת בטסקיגי - גברים אפרו-אמריקאים שהשתתפו במחקר הובטחה להם טיפול רפואי חינם אך הוטעו על ידי חוקרים שלא יידעו את הנבדקים על האבחנה שלהם או על זמינות הטיפול. רבים מהנבדקים מתו, ושותפים או ילדים הושפעו; המחקר נמשך 40 שנה. |
פרטיות נתונים | 2007 - פרס נתוני נטפליקס סיפק לחוקרים 10 מיליון דירוגי סרטים אנונימיים מ-50 אלף לקוחות כדי לעזור לשפר אלגוריתמי המלצות. עם זאת, חוקרים הצליחו לקשר נתונים אנונימיים לנתונים מזהים אישית ב_מאגרי נתונים חיצוניים_ (לדוגמה, תגובות IMDb) - למעשה "דה-אנונימיזציה" של חלק ממנויי נטפליקס. |
הטיה באיסוף נתונים | 2013 - עיריית בוסטון פיתחה את Street Bump, אפליקציה שאפשרה לאזרחים לדווח על בורות, מה שנתן לעיר נתוני כבישים טובים יותר כדי למצוא ולתקן בעיות. עם זאת, לאנשים בקבוצות הכנסה נמוכה הייתה פחות גישה למכוניות וטלפונים, מה שהפך את בעיות הכבישים שלהם לבלתי נראות באפליקציה זו. מפתחים עבדו עם אקדמאים כדי לטפל ב_נושאי גישה שוויונית ופערים דיגיטליים_ למען הוגנות. |
הוגנות אלגוריתמית | 2018 - מחקר Gender Shades של MIT העריך את דיוק מוצרי AI לסיווג מגדר, וחשף פערים בדיוק עבור נשים ואנשים בעלי צבע עור כהה. כרטיס האשראי של אפל משנת 2019 נראה שהציע פחות אשראי לנשים מאשר לגברים. שניהם הדגימו בעיות בהטיה אלגוריתמית שהובילה לנזקים חברתיים-כלכליים. |
ייצוג שגוי של נתונים | 2020 - משרד הבריאות של ג'ורג'יה פרסם גרפים של מקרי COVID-19 שנראה כי הטעו אזרחים לגבי מגמות במקרים מאושרים עם סדר לא כרונולוגי על ציר ה-x. זה מדגים ייצוג שגוי באמצעות טריקים ויזואליים. |
אשליית הבחירה החופשית | 2020 - אפליקציית הלמידה ABCmouse שילמה 10 מיליון דולר כדי ליישב תלונה של ה-FTC שבה הורים נלכדו בתשלום עבור מנויים שהם לא יכלו לבטל. זה מדגים דפוסים אפלים בארכיטקטורות בחירה, שבהן משתמשים הונעו לעבר בחירות שעלולות להזיק. |
פרטיות נתונים וזכויות משתמש | 2021 - פרצת נתונים בפייסבוק חשפה נתונים מ-530 מיליון משתמשים, מה שהוביל להסדר של 5 מיליארד דולר עם ה-FTC. עם זאת, החברה סירבה להודיע למשתמשים על הפרצה, מה שהפר את זכויות המשתמשים בנוגע לשקיפות נתונים וגישה. |
רוצה לחקור עוד מחקרי מקרה? בדוק את המשאבים הבאים:
- Ethics Unwrapped - דילמות אתיות בתעשיות מגוונות.
- קורס אתיקה במדעי הנתונים - מחקרי מקרה מרכזיים נבחנים.
- מקרים שבהם דברים השתבשו - רשימת בדיקות של דיאון עם דוגמאות.
🚨 חשבו על מחקרי המקרה שראיתם - האם חוויתם או הושפעתם מאתגר אתי דומה בחייכם? האם אתם יכולים לחשוב על לפחות מחקר מקרה אחד נוסף שממחיש אחד מהאתגרים האתיים שדנו בהם בסעיף זה?
אתיקה יישומית
דיברנו על מושגי אתיקה, אתגרים ומחקרי מקרה בהקשרים של העולם האמיתי. אבל איך מתחילים ליישם עקרונות ושיטות אתיים בפרויקטים שלנו? ואיך מפעילים את השיטות הללו למען ממשל טוב יותר? בואו נחקור כמה פתרונות בעולם האמיתי:
1. קודים מקצועיים
קודים מקצועיים מציעים אפשרות אחת לארגונים "לתמרץ" חברים לתמוך בעקרונות האתיים שלהם ובהצהרת המשימה. קודים הם הנחיות מוסריות להתנהגות מקצועית, שעוזרות לעובדים או חברים לקבל החלטות שמתיישרות עם עקרונות הארגון שלהם. הם טובים רק כמו הציות מרצון מצד החברים; עם זאת, ארגונים רבים מציעים תגמולים ועונשים נוספים כדי להניע ציות מצד החברים.
דוגמאות כוללות:
- Oxford Munich Code of Ethics
- Data Science Association Code of Conduct (נוצר ב-2013)
- ACM Code of Ethics and Professional Conduct (מאז 1993)
🚨 האם אתם חברים בארגון מקצועי להנדסה או מדעי הנתונים? חקרו את האתר שלהם כדי לראות אם הם מגדירים קוד אתיקה מקצועי. מה זה אומר על העקרונות האתיים שלהם? איך הם "מתמרצים" חברים לעקוב אחרי הקוד?
2. רשימות בדיקה אתיות
בעוד שקודים מקצועיים מגדירים התנהגות אתית נדרשת מצד העוסקים בתחום, הם מוגבלים ידועים באכיפה, במיוחד בפרויקטים רחבי היקף. במקום זאת, מומחי מדעי הנתונים רבים ממליצים על רשימות בדיקה, שיכולות לחבר עקרונות לשיטות בדרכים יותר דטרמיניסטיות וניתנות לפעולה.
רשימות בדיקה ממירות שאלות למשימות "כן/לא" שניתן להפעיל, ומאפשרות לעקוב אחריהן כחלק מזרימות עבודה סטנדרטיות לשחרור מוצרים.
דוגמאות כוללות:
- Deon - רשימת בדיקה כללית לאתיקה במדעי הנתונים שנוצרה מהמלצות תעשייה עם כלי שורת פקודה לשילוב קל.
- Privacy Audit Checklist - מספקת הנחיות כלליות לשיטות טיפול במידע מנקודות מבט משפטיות וחברתיות.
- AI Fairness Checklist - נוצרה על ידי מומחי AI כדי לתמוך באימוץ ושילוב בדיקות הוגנות במחזורי פיתוח AI.
- 22 שאלות לאתיקה במדעי הנתונים ובינה מלאכותית - מסגרת פתוחה יותר, מובנית לחקירה ראשונית של סוגיות אתיות בעיצוב, יישום והקשרים ארגוניים.
3. רגולציות אתיות
אתיקה עוסקת בהגדרת ערכים משותפים ועשיית הדבר הנכון מרצון. ציות עוסק ב_עמידה בחוק_ אם וכאשר מוגדר. ממשל מכסה באופן רחב את כל הדרכים שבהן ארגונים פועלים כדי לאכוף עקרונות אתיים ולעמוד בחוקים שנקבעו.
כיום, ממשל לובש שתי צורות בתוך ארגונים. ראשית, מדובר בהגדרת עקרונות AI אתיים וביסוס שיטות להפעלת אימוץ בכל הפרויקטים הקשורים ל-AI בארגון. שנית, מדובר בעמידה בכל רגולציות הגנת נתונים שהממשלה מחייבת עבור האזורים שבהם היא פועלת.
דוגמאות לרגולציות הגנת נתונים ופרטיות:
1974
, חוק הפרטיות בארה"ב - מסדיר את איסוף, השימוש והגילוי של מידע אישי על ידי הממשלה הפדרלית.1996
, חוק הניידות והאחריות של ביטוח בריאות בארה"ב (HIPAA) - מגן על נתוני בריאות אישיים.1998
, חוק הגנת פרטיות ילדים באינטרנט בארה"ב (COPPA) - מגן על פרטיות נתונים של ילדים מתחת לגיל 13.2018
, רגולציית הגנת נתונים כללית (GDPR) - מספקת זכויות משתמש, הגנת נתונים ופרטיות.2018
, חוק פרטיות הצרכן של קליפורניה (CCPA) מעניק לצרכנים יותר זכויות על הנתונים האישיים שלהם.2021
, חוק הגנת מידע אישי של סין שנחקק לאחרונה, יוצר אחת הרגולציות החזקות ביותר לפרטיות נתונים באינטרנט בעולם.
🚨 האיחוד האירופי הגדיר את GDPR (רגולציית הגנת נתונים כללית) שנשארת אחת הרגולציות המשפיעות ביותר לפרטיות נתונים כיום. האם ידעתם שהיא גם מגדירה 8 זכויות משתמש כדי להגן על פרטיות דיגיטלית ונתונים אישיים של אזרחים? למדו על מה הן, ולמה הן חשובות.
4. תרבות אתית
שימו לב שקיים פער בלתי מוחשי בין ציות (עשיית מספיק כדי לעמוד "באות החוק") לבין טיפול בבעיות מערכתיות (כמו אוסיפיקציה, אסימטריה מידעית ואי-צדק חלוקתי) שיכולות להאיץ את השימוש לרעה ב-AI.
האחרון דורש גישות שיתופיות להגדרת תרבויות אתיות שבונות קשרים רגשיים וערכים משותפים עקביים בין ארגונים בתעשייה. זה קורא ליותר תרבויות אתיות פורמליות בארגונים - שמאפשרות לכל אחד למשוך את חוט אנדון (כדי להעלות חששות אתיים מוקדם בתהליך) ועושות הערכות אתיות (לדוגמה, בגיוס עובדים) קריטריון מרכזי להרכבת צוותים בפרויקטים של AI.
שאלון לאחר ההרצאה 🎯
סקירה ולימוד עצמי
קורסים וספרים עוזרים להבין מושגי אתיקה מרכזיים ואתגרים, בעוד שמחקרי מקרה וכלים עוזרים עם שיטות אתיקה יישומיות בהקשרים של העולם האמיתי. הנה כמה משאבים להתחיל איתם.
- Machine Learning For Beginners - שיעור על הוגנות, ממיקרוסופט.
- עקרונות הבינה המלאכותית האחראית - מסלול לימוד חינמי מ-Microsoft Learn.
- אתיקה ומדעי הנתונים - ספר אלקטרוני של O'Reilly (מ. לוקיידס, ה. מייסון ואחרים).
- אתיקה במדעי הנתונים - קורס מקוון מאוניברסיטת מישיגן.
- אתיקה ללא כיסוי - מחקרי מקרה מאוניברסיטת טקסס.
משימה
כתיבת מחקר מקרה בנושא אתיקה בנתונים
כתב ויתור:
מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית Co-op Translator. בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.