History

localizeflow[bot] 188a326676 chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes)		6 months ago
..
README.md	chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes)	6 months ago
assignment.md	chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes)	6 months ago

README.md

Introducere în Etica Datelor


Etica în Știința Datelor - Sketchnote de @nitya

Suntem cu toții cetățeni ai datelor, trăind într-o lume dominată de informații.

Tendințele pieței ne arată că, până în 2022, 1 din 3 organizații mari va cumpăra și vinde date prin intermediul Piațelor și Schimburilor Online. Ca Dezvoltatori de Aplicații, vom găsi mai ușor și mai ieftin să integrăm informații bazate pe date și automatizări bazate pe algoritmi în experiențele zilnice ale utilizatorilor. Dar, pe măsură ce AI devine omniprezent, va trebui să înțelegem și potențialele daune cauzate de utilizarea abuzivă a acestor algoritmi la scară largă.

Tendințele sugerează că, până în 2025, vom genera și consuma peste 180 zettabytes de date. Pentru Oamenii de Știință în Date, această explozie de informații oferă acces fără precedent la date personale și comportamentale. Odată cu aceasta vine puterea de a construi profiluri detaliate ale utilizatorilor și de a influența subtil luarea deciziilor—adesea în moduri care creează o iluzie de alegere liberă. Deși acest lucru poate fi utilizat pentru a ghida utilizatorii către rezultate preferate, ridică și întrebări critice despre confidențialitatea datelor, autonomia și limitele etice ale influenței algoritmice.

Etica datelor reprezintă acum balustradele necesare pentru știința și ingineria datelor, ajutându-ne să minimizăm potențialele daune și consecințele neintenționate ale acțiunilor noastre bazate pe date. Ciclul de Hype Gartner pentru AI identifică tendințe relevante în etica digitală, AI responsabil și guvernanța AI ca factori cheie pentru megatendințele mai mari legate de democratizarea și industrializarea AI.

În această lecție, vom explora domeniul fascinant al eticii datelor - de la concepte de bază și provocări, la studii de caz și concepte aplicate de AI, cum ar fi guvernanța - care ajută la stabilirea unei culturi etice în echipele și organizațiile care lucrează cu date și AI.

Chestionar înainte de lecție 🎯

Definiții de bază

Să începem prin a înțelege terminologia de bază.

Cuvântul "etică" provine din cuvântul grecesc "ethikos" (și rădăcina sa "ethos") care înseamnă caracter sau natură morală.

Etica se referă la valorile comune și principiile morale care guvernează comportamentul nostru în societate. Etica nu se bazează pe legi, ci pe norme larg acceptate despre ceea ce este "corect vs. greșit". Totuși, considerațiile etice pot influența inițiativele de guvernanță corporativă și reglementările guvernamentale care creează mai multe stimulente pentru conformitate.

Etica Datelor este o ramură nouă a eticii care "studiază și evaluează problemele morale legate de date, algoritmi și practicile corespunzătoare". Aici, "datele" se concentrează pe acțiuni legate de generare, înregistrare, curare, procesare, diseminare, partajare și utilizare, "algoritmii" se concentrează pe AI, agenți, învățare automată și roboți, iar "practicile" se concentrează pe subiecte precum inovația responsabilă, programarea, hacking-ul și codurile de etică.

Etica Aplicată este aplicarea practică a considerațiilor morale. Este procesul de investigare activă a problemelor etice în contextul acțiunilor, produselor și proceselor din lumea reală, și de luare a măsurilor corective pentru a ne asigura că acestea rămân aliniate cu valorile noastre etice definite.

Cultura Eticii se referă la operaționalizarea eticii aplicate pentru a ne asigura că principiile și practicile noastre etice sunt adoptate într-un mod consistent și scalabil în întreaga organizație. Culturile etice de succes definesc principii etice la nivel organizațional, oferă stimulente semnificative pentru conformitate și întăresc normele etice prin încurajarea și amplificarea comportamentelor dorite la fiecare nivel al organizației.

Concepte de Etică

În această secțiune, vom discuta concepte precum valori comune (principii) și provocări etice (probleme) pentru etica datelor - și vom explora studii de caz care te ajută să înțelegi aceste concepte în contexte reale.

1. Principii Etice

Fiecare strategie de etică a datelor începe prin definirea principiilor etice - "valorile comune" care descriu comportamentele acceptabile și ghidează acțiunile conforme în proiectele noastre de date și AI. Le poți defini la nivel individual sau de echipă. Totuși, majoritatea organizațiilor mari le conturează într-o declarație de misiune sau cadru de AI etic definit la nivel corporativ și aplicat în mod consistent în toate echipele.

Exemplu: Declarația de misiune AI Responsabil de la Microsoft spune: "Suntem dedicați avansării AI ghidată de principii etice care pun oamenii pe primul loc" - identificând 6 principii etice în cadrul de mai jos:

Să explorăm pe scurt aceste principii. Transparența și responsabilitatea sunt valori fundamentale pe care se construiesc celelalte principii - așa că să începem cu acestea:

Responsabilitatea face ca practicienii să fie responsabili pentru operațiunile lor de date și AI și pentru conformitatea cu aceste principii etice.
Transparența asigură că acțiunile legate de date și AI sunt ușor de înțeles (interpretabile) pentru utilizatori, explicând ce și de ce în spatele deciziilor.
Echitatea - se concentrează pe asigurarea că AI tratează toți oamenii în mod echitabil, abordând orice prejudecăți socio-tehnice sistemice sau implicite în date și sisteme.
Fiabilitatea și Siguranța - asigură că AI se comportă consistent cu valorile definite, minimizând potențialele daune sau consecințele neintenționate.
Confidențialitatea și Securitatea - se referă la înțelegerea provenienței datelor și la oferirea de protecții legate de confidențialitatea datelor utilizatorilor.
Incluziunea - se referă la proiectarea soluțiilor AI cu intenție, adaptându-le pentru a răspunde unei game largi de nevoi și capacități umane.

🚨 Gândește-te la ce ar putea fi declarația ta de misiune pentru etica datelor. Explorează cadrele de AI etic de la alte organizații - iată exemple de la IBM, Google, și Facebook. Ce valori comune au în comun? Cum se raportează aceste principii la produsul sau industria AI în care operează?

2. Provocări Etice

Odată ce avem principiile etice definite, următorul pas este să evaluăm acțiunile noastre legate de date și AI pentru a vedea dacă se aliniază cu acele valori comune. Gândește-te la acțiunile tale în două categorii: colectarea datelor și designul algoritmilor.

În cazul colectării datelor, acțiunile vor implica probabil date personale sau informații personale identificabile (PII) pentru indivizi identificabili. Acestea includ diverse elemente de date non-personale care în mod colectiv identifică un individ. Provocările etice pot fi legate de confidențialitatea datelor, proprietatea datelor și subiecte conexe precum consimțământul informat și drepturile de proprietate intelectuală ale utilizatorilor.

În cazul designului algoritmilor, acțiunile vor implica colectarea și curarea seturilor de date, apoi utilizarea acestora pentru a antrena și implementa modele de date care prezic rezultate sau automatizează decizii în contexte reale. Provocările etice pot apărea din prejudecăți în seturile de date, probleme de calitate a datelor, inechitate și reprezentare greșită în algoritmi - inclusiv unele probleme care sunt de natură sistemică.

În ambele cazuri, provocările etice evidențiază zonele în care acțiunile noastre pot intra în conflict cu valorile noastre comune. Pentru a detecta, atenua, minimiza sau elimina aceste preocupări - trebuie să punem întrebări morale "da/nu" legate de acțiunile noastre, apoi să luăm măsuri corective, după cum este necesar. Să aruncăm o privire asupra unor provocări etice și întrebările morale pe care le ridică:

2.1 Proprietatea Datelor

Colectarea datelor implică adesea date personale care pot identifica subiecții datelor. Proprietatea datelor se referă la control și drepturile utilizatorilor legate de crearea, procesarea și diseminarea datelor.

Întrebările morale pe care trebuie să le punem sunt:

Cine deține datele? (utilizator sau organizație)
Ce drepturi au subiecții datelor? (ex: acces, ștergere, portabilitate)
Ce drepturi au organizațiile? (ex: rectificarea recenziilor utilizatorilor malițioase)

2.2 Consimțământul Informat

Consimțământul informat definește actul utilizatorilor de a fi de acord cu o acțiune (cum ar fi colectarea datelor) cu o înțelegere completă a faptelor relevante, inclusiv scopul, riscurile potențiale și alternativele.