You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
267 lines
29 KiB
267 lines
29 KiB
<!--
|
|
CO_OP_TRANSLATOR_METADATA:
|
|
{
|
|
"original_hash": "8796f41f566a0a8ebb72863a83d558ed",
|
|
"translation_date": "2025-08-28T19:03:48+00:00",
|
|
"source_file": "1-Introduction/02-ethics/README.md",
|
|
"language_code": "ms"
|
|
}
|
|
-->
|
|
# Pengenalan kepada Etika Data
|
|
|
|
| ](../../sketchnotes/02-Ethics.png)|
|
|
|:---:|
|
|
| Etika Sains Data - _Sketchnote oleh [@nitya](https://twitter.com/nitya)_ |
|
|
|
|
---
|
|
|
|
Kita semua adalah warganegara data yang hidup dalam dunia yang dipenuhi data.
|
|
|
|
Trend pasaran menunjukkan bahawa menjelang 2022, 1-dalam-3 organisasi besar akan membeli dan menjual data mereka melalui [Pasaran dan Pertukaran](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) dalam talian. Sebagai **Pembangun Aplikasi**, kita akan mendapati lebih mudah dan murah untuk mengintegrasikan pandangan berasaskan data dan automasi berasaskan algoritma ke dalam pengalaman pengguna harian. Tetapi apabila AI menjadi semakin meluas, kita juga perlu memahami potensi bahaya yang disebabkan oleh [penggunaan algoritma secara salah](https://www.youtube.com/watch?v=TQHs8SA1qpk) pada skala besar.
|
|
|
|
Trend juga menunjukkan bahawa kita akan mencipta dan menggunakan lebih daripada [180 zettabait](https://www.statista.com/statistics/871513/worldwide-data-created/) data menjelang 2025. Sebagai **Saintis Data**, ini memberikan kita tahap akses yang belum pernah terjadi sebelumnya kepada data peribadi. Ini bermakna kita boleh membina profil tingkah laku pengguna dan mempengaruhi pengambilan keputusan dengan cara yang mencipta [ilusi pilihan bebas](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) sambil berpotensi mendorong pengguna ke arah hasil yang kita kehendaki. Ia juga menimbulkan persoalan yang lebih luas mengenai privasi data dan perlindungan pengguna.
|
|
|
|
Etika data kini menjadi _pengawal selia yang diperlukan_ untuk sains data dan kejuruteraan, membantu kita meminimumkan potensi bahaya dan akibat yang tidak diingini daripada tindakan berasaskan data kita. [Gartner Hype Cycle untuk AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) mengenal pasti trend berkaitan dalam etika digital, AI yang bertanggungjawab, dan tadbir urus AI sebagai pemacu utama untuk megatrend yang lebih besar seperti _pendemokrasian_ dan _perindustrian_ AI.
|
|
|
|

|
|
|
|
Dalam pelajaran ini, kita akan meneroka bidang etika data yang menarik - daripada konsep asas dan cabaran, kepada kajian kes dan konsep AI yang diterapkan seperti tadbir urus - yang membantu mewujudkan budaya etika dalam pasukan dan organisasi yang bekerja dengan data dan AI.
|
|
|
|
## [Kuiz Pra-Kuliah](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
|
|
|
|
## Definisi Asas
|
|
|
|
Mari kita mulakan dengan memahami istilah asas.
|
|
|
|
Perkataan "etika" berasal daripada [perkataan Yunani "ethikos"](https://en.wikipedia.org/wiki/Ethics) (dan akarnya "ethos") yang bermaksud _sifat watak atau moral_.
|
|
|
|
**Etika** adalah tentang nilai bersama dan prinsip moral yang mengawal tingkah laku kita dalam masyarakat. Etika tidak berdasarkan undang-undang tetapi pada norma yang diterima secara meluas tentang apa yang "betul vs. salah". Walau bagaimanapun, pertimbangan etika boleh mempengaruhi inisiatif tadbir urus korporat dan peraturan kerajaan yang mencipta lebih banyak insentif untuk pematuhan.
|
|
|
|
**Etika Data** adalah [cabang baru etika](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) yang "mengkaji dan menilai masalah moral yang berkaitan dengan _data, algoritma dan amalan yang berkaitan_". Di sini, **"data"** memberi tumpuan kepada tindakan yang berkaitan dengan penjanaan, rakaman, kurasi, pemprosesan, penyebaran, perkongsian, dan penggunaan, **"algoritma"** memberi tumpuan kepada AI, agen, pembelajaran mesin, dan robot, dan **"amalan"** memberi tumpuan kepada topik seperti inovasi yang bertanggungjawab, pengaturcaraan, penggodaman, dan kod etika.
|
|
|
|
**Etika Terapan** adalah [aplikasi praktikal pertimbangan moral](https://en.wikipedia.org/wiki/Applied_ethics). Ia adalah proses menyiasat secara aktif isu etika dalam konteks _tindakan, produk, dan proses dunia nyata_, dan mengambil langkah pembetulan untuk memastikan bahawa ini kekal selaras dengan nilai etika yang telah ditentukan.
|
|
|
|
**Budaya Etika** adalah tentang [_mengoperasikan_ etika terapan](https://hbr.org/2019/05/how-to-design-an-ethical-organization) untuk memastikan bahawa prinsip dan amalan etika kita diterima pakai secara konsisten dan boleh diskalakan di seluruh organisasi. Budaya etika yang berjaya mentakrifkan prinsip etika di seluruh organisasi, menyediakan insentif yang bermakna untuk pematuhan, dan mengukuhkan norma etika dengan menggalakkan dan memperkuat tingkah laku yang diingini di setiap peringkat organisasi.
|
|
|
|
## Konsep Etika
|
|
|
|
Dalam bahagian ini, kita akan membincangkan konsep seperti **nilai bersama** (prinsip) dan **cabaran etika** (masalah) untuk etika data - dan meneroka **kajian kes** yang membantu anda memahami konsep ini dalam konteks dunia nyata.
|
|
|
|
### 1. Prinsip Etika
|
|
|
|
Setiap strategi etika data bermula dengan mentakrifkan _prinsip etika_ - "nilai bersama" yang menerangkan tingkah laku yang boleh diterima, dan membimbing tindakan yang mematuhi, dalam projek data & AI kita. Anda boleh mentakrifkan ini di peringkat individu atau pasukan. Walau bagaimanapun, kebanyakan organisasi besar menggariskan ini dalam pernyataan misi atau rangka kerja _AI yang beretika_ yang ditakrifkan di peringkat korporat dan dikuatkuasakan secara konsisten di semua pasukan.
|
|
|
|
**Contoh:** Pernyataan misi [AI Bertanggungjawab](https://www.microsoft.com/en-us/ai/responsible-ai) Microsoft berbunyi: _"Kami komited kepada kemajuan AI yang didorong oleh prinsip etika yang meletakkan manusia di tempat pertama"_ - mengenal pasti 6 prinsip etika dalam rangka kerja di bawah:
|
|
|
|

|
|
|
|
Mari kita terokai prinsip-prinsip ini secara ringkas. _Ketelusan_ dan _akauntabiliti_ adalah nilai asas yang menjadi asas kepada prinsip lain - jadi mari kita mulakan di sana:
|
|
|
|
* [**Akauntabiliti**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) menjadikan pengamal _bertanggungjawab_ untuk operasi data & AI mereka, dan pematuhan kepada prinsip etika ini.
|
|
* [**Ketelusan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) memastikan bahawa tindakan data dan AI _difahami_ (boleh ditafsirkan) oleh pengguna, menjelaskan apa dan mengapa di sebalik keputusan.
|
|
* [**Keadilan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - memberi tumpuan kepada memastikan AI melayan _semua orang_ secara adil, menangani sebarang bias sosio-teknikal sistemik atau tersirat dalam data dan sistem.
|
|
* [**Kebolehpercayaan & Keselamatan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - memastikan bahawa AI berkelakuan _konsisten_ dengan nilai yang ditentukan, meminimumkan potensi bahaya atau akibat yang tidak diingini.
|
|
* [**Privasi & Keselamatan**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - adalah tentang memahami asal-usul data, dan menyediakan _privasi data dan perlindungan berkaitan_ kepada pengguna.
|
|
* [**Keterangkuman**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - adalah tentang mereka bentuk penyelesaian AI dengan niat, menyesuaikannya untuk memenuhi _pelbagai keperluan_ dan keupayaan manusia.
|
|
|
|
> 🚨 Fikirkan tentang apa yang boleh menjadi pernyataan misi etika data anda. Terokai rangka kerja AI beretika daripada organisasi lain - berikut adalah contoh daripada [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), dan [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Apakah nilai bersama yang mereka miliki? Bagaimana prinsip-prinsip ini berkaitan dengan produk AI atau industri yang mereka ceburi?
|
|
|
|
### 2. Cabaran Etika
|
|
|
|
Setelah kita mentakrifkan prinsip etika, langkah seterusnya adalah menilai tindakan data dan AI kita untuk melihat sama ada ia selaras dengan nilai bersama tersebut. Fikirkan tentang tindakan anda dalam dua kategori: _pengumpulan data_ dan _reka bentuk algoritma_.
|
|
|
|
Dalam pengumpulan data, tindakan mungkin melibatkan **data peribadi** atau maklumat peribadi yang boleh dikenal pasti (PII) untuk individu yang boleh dikenal pasti. Ini termasuk [pelbagai item data bukan peribadi](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) yang _secara kolektif_ mengenal pasti individu. Cabaran etika boleh berkaitan dengan _privasi data_, _pemilikan data_, dan topik berkaitan seperti _persetujuan yang dimaklumkan_ dan _hak harta intelek_ untuk pengguna.
|
|
|
|
Dalam reka bentuk algoritma, tindakan akan melibatkan pengumpulan & kurasi **set data**, kemudian menggunakannya untuk melatih & menggunakan **model data** yang meramalkan hasil atau mengautomasikan keputusan dalam konteks dunia nyata. Cabaran etika boleh timbul daripada _bias set data_, isu _kualiti data_, _ketidakadilan_, dan _salah tafsir_ dalam algoritma - termasuk beberapa isu yang bersifat sistemik.
|
|
|
|
Dalam kedua-dua kes, cabaran etika menyerlahkan kawasan di mana tindakan kita mungkin bertentangan dengan nilai bersama kita. Untuk mengesan, mengurangkan, meminimumkan, atau menghapuskan kebimbangan ini - kita perlu bertanya soalan moral "ya/tidak" berkaitan dengan tindakan kita, kemudian mengambil tindakan pembetulan yang diperlukan. Mari kita lihat beberapa cabaran etika dan soalan moral yang mereka timbulkan:
|
|
|
|
#### 2.1 Pemilikan Data
|
|
|
|
Pengumpulan data sering melibatkan data peribadi yang boleh mengenal pasti subjek data. [Pemilikan data](https://permission.io/blog/data-ownership) adalah tentang _kawalan_ dan [_hak pengguna_](https://permission.io/blog/data-ownership) berkaitan dengan penciptaan, pemprosesan, dan penyebaran data.
|
|
|
|
Soalan moral yang perlu kita tanya ialah:
|
|
* Siapa yang memiliki data? (pengguna atau organisasi)
|
|
* Hak apa yang dimiliki oleh subjek data? (contoh: akses, pemadaman, kebolehangkutan)
|
|
* Hak apa yang dimiliki oleh organisasi? (contoh: membetulkan ulasan pengguna yang berniat jahat)
|
|
|
|
#### 2.2 Persetujuan yang Dimaklumkan
|
|
|
|
[Persetujuan yang dimaklumkan](https://legaldictionary.net/informed-consent/) mentakrifkan tindakan pengguna bersetuju dengan tindakan (seperti pengumpulan data) dengan _pemahaman penuh_ tentang fakta yang relevan termasuk tujuan, risiko yang berpotensi, dan alternatif.
|
|
|
|
Soalan untuk diterokai di sini ialah:
|
|
* Adakah pengguna (subjek data) memberikan kebenaran untuk pengambilan dan penggunaan data?
|
|
* Adakah pengguna memahami tujuan data itu dikumpulkan?
|
|
* Adakah pengguna memahami risiko yang berpotensi daripada penyertaan mereka?
|
|
|
|
#### 2.3 Harta Intelek
|
|
|
|
[Harta intelek](https://en.wikipedia.org/wiki/Intellectual_property) merujuk kepada ciptaan tidak ketara yang terhasil daripada inisiatif manusia, yang mungkin _mempunyai nilai ekonomi_ kepada individu atau perniagaan.
|
|
|
|
Soalan untuk diterokai di sini ialah:
|
|
* Adakah data yang dikumpulkan mempunyai nilai ekonomi kepada pengguna atau perniagaan?
|
|
* Adakah **pengguna** mempunyai harta intelek di sini?
|
|
* Adakah **organisasi** mempunyai harta intelek di sini?
|
|
* Jika hak ini wujud, bagaimana kita melindunginya?
|
|
|
|
#### 2.4 Privasi Data
|
|
|
|
[Privasi data](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) atau privasi maklumat merujuk kepada pemeliharaan privasi pengguna dan perlindungan identiti pengguna berkaitan dengan maklumat yang boleh dikenal pasti secara peribadi.
|
|
|
|
Soalan untuk diterokai di sini ialah:
|
|
* Adakah data (peribadi) pengguna dilindungi daripada penggodaman dan kebocoran?
|
|
* Adakah data pengguna hanya boleh diakses oleh pengguna dan konteks yang dibenarkan?
|
|
* Adakah anonimiti pengguna dipelihara apabila data dikongsi atau disebarkan?
|
|
* Bolehkah pengguna dinyahkenal pasti daripada set data yang dianonimkan?
|
|
|
|
#### 2.5 Hak Untuk Dilupakan
|
|
|
|
[Hak Untuk Dilupakan](https://en.wikipedia.org/wiki/Right_to_be_forgotten) atau [Hak untuk Pemadaman](https://www.gdpreu.org/right-to-be-forgotten/) memberikan perlindungan tambahan kepada data peribadi pengguna. Secara khusus, ia memberikan hak kepada pengguna untuk meminta pemadaman atau penghapusan data peribadi daripada carian Internet dan lokasi lain, _dalam keadaan tertentu_ - membolehkan mereka memulakan semula dalam talian tanpa tindakan masa lalu dipegang terhadap mereka.
|
|
|
|
Soalan untuk diterokai di sini ialah:
|
|
* Adakah sistem membenarkan subjek data meminta pemadaman?
|
|
* Adakah penarikan balik persetujuan pengguna mencetuskan pemadaman automatik?
|
|
* Adakah data dikumpulkan tanpa persetujuan atau dengan cara yang tidak sah?
|
|
* Adakah kita mematuhi peraturan kerajaan untuk privasi data?
|
|
|
|
#### 2.6 Bias Set Data
|
|
|
|
Bias set data atau [Bias Pengumpulan](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) adalah tentang memilih subset data yang _tidak mewakili_ untuk pembangunan algoritma, mencipta potensi ketidakadilan dalam hasil keputusan untuk kumpulan yang pelbagai. Jenis bias termasuk bias pemilihan atau pensampelan, bias sukarela, dan bias instrumen.
|
|
|
|
Soalan untuk diterokai di sini ialah:
|
|
* Adakah kita merekrut set subjek data yang mewakili?
|
|
* Adakah kita menguji set data yang dikumpulkan atau dikurasi untuk pelbagai bias?
|
|
* Bolehkah kita mengurangkan atau menghapuskan sebarang bias yang ditemui?
|
|
|
|
#### 2.7 Kualiti Data
|
|
|
|
[Kualiti Data](https://lakefs.io/data-quality-testing/) melihat kesahihan set data yang dikurasi yang digunakan untuk membangunkan algoritma kita, memeriksa untuk melihat sama ada ciri dan rekod memenuhi keperluan untuk tahap ketepatan dan konsistensi yang diperlukan untuk tujuan AI kita.
|
|
|
|
Soalan untuk diterokai di sini ialah:
|
|
* Adakah kita menangkap ciri _sah_ untuk kes penggunaan kita?
|
|
* Adakah data ditangkap _secara konsisten_ merentasi pelbagai sumber data?
|
|
* Adakah set data _lengkap_ untuk pelbagai keadaan atau senario?
|
|
* Adakah maklumat yang ditangkap _tepat_ dalam mencerminkan realiti?
|
|
|
|
#### 2.8 Keadilan Algoritma
|
|
[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) memeriksa sama ada reka bentuk algoritma secara sistematik mendiskriminasi kumpulan subjek data tertentu, yang membawa kepada [kemungkinan bahaya](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) dalam _pengagihan_ (di mana sumber dinafikan atau ditahan daripada kumpulan tersebut) dan _kualiti perkhidmatan_ (di mana AI kurang tepat untuk beberapa kumpulan berbanding yang lain).
|
|
|
|
Soalan untuk diterokai di sini adalah:
|
|
* Adakah kita menilai ketepatan model untuk pelbagai kumpulan dan keadaan?
|
|
* Adakah kita menyemak sistem untuk kemungkinan bahaya (contohnya, stereotaip)?
|
|
* Bolehkah kita menyemak semula data atau melatih semula model untuk mengurangkan bahaya yang dikenal pasti?
|
|
|
|
Terokai sumber seperti [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) untuk mengetahui lebih lanjut.
|
|
|
|
#### 2.9 Salah Representasi
|
|
|
|
[Salah Representasi Data](https://www.sciencedirect.com/topics/computer-science/misrepresentation) adalah tentang bertanya sama ada kita menyampaikan pandangan daripada data yang dilaporkan dengan jujur secara menipu untuk menyokong naratif yang diingini.
|
|
|
|
Soalan untuk diterokai di sini adalah:
|
|
* Adakah kita melaporkan data yang tidak lengkap atau tidak tepat?
|
|
* Adakah kita menggambarkan data dengan cara yang membawa kepada kesimpulan yang mengelirukan?
|
|
* Adakah kita menggunakan teknik statistik terpilih untuk memanipulasi hasil?
|
|
* Adakah terdapat penjelasan alternatif yang mungkin menawarkan kesimpulan yang berbeza?
|
|
|
|
#### 2.10 Pilihan Bebas
|
|
[Ilusi Pilihan Bebas](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) berlaku apabila "senibina pilihan" sistem menggunakan algoritma membuat keputusan untuk mendorong orang ke arah hasil yang diingini sambil kelihatan memberi mereka pilihan dan kawalan. [Corak gelap](https://www.darkpatterns.org/) ini boleh menyebabkan bahaya sosial dan ekonomi kepada pengguna. Oleh kerana keputusan pengguna mempengaruhi profil tingkah laku, tindakan ini berpotensi mendorong pilihan masa depan yang boleh memperkuat atau memperluaskan kesan bahaya ini.
|
|
|
|
Soalan untuk diterokai di sini adalah:
|
|
* Adakah pengguna memahami implikasi membuat pilihan itu?
|
|
* Adakah pengguna sedar tentang pilihan (alternatif) dan kebaikan & keburukan setiap satu?
|
|
* Bolehkah pengguna membatalkan pilihan automatik atau yang dipengaruhi kemudian?
|
|
|
|
### 3. Kajian Kes
|
|
|
|
Untuk meletakkan cabaran etika ini dalam konteks dunia sebenar, ia membantu untuk melihat kajian kes yang menonjolkan potensi bahaya dan akibat kepada individu dan masyarakat apabila pelanggaran etika ini diabaikan.
|
|
|
|
Berikut adalah beberapa contoh:
|
|
|
|
| Cabaran Etika | Kajian Kes |
|
|
|--- |--- |
|
|
| **Persetujuan Maklum** | 1972 - [Kajian Sifilis Tuskegee](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Lelaki Afrika-Amerika yang menyertai kajian ini dijanjikan rawatan perubatan percuma _tetapi ditipu_ oleh penyelidik yang gagal memaklumkan subjek tentang diagnosis mereka atau tentang ketersediaan rawatan. Ramai subjek meninggal dunia & pasangan atau anak-anak mereka terjejas; kajian ini berlangsung selama 40 tahun. |
|
|
| **Privasi Data** | 2007 - [Hadiah data Netflix](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) memberikan penyelidik _10 juta penilaian filem tanpa nama daripada 50 ribu pelanggan_ untuk membantu meningkatkan algoritma cadangan. Walau bagaimanapun, penyelidik dapat mengaitkan data tanpa nama dengan data yang boleh dikenal pasti secara peribadi dalam _set data luaran_ (contohnya, komen IMDb) - secara efektif "membatalkan tanpa nama" beberapa pelanggan Netflix.|
|
|
| **Bias Pengumpulan** | 2013 - Bandar Boston [membangunkan Street Bump](https://www.boston.gov/transportation/street-bump), sebuah aplikasi yang membolehkan warga melaporkan lubang jalan, memberikan data jalan raya yang lebih baik kepada bandar untuk mencari dan membaiki isu. Walau bagaimanapun, [orang dalam kumpulan berpendapatan rendah mempunyai akses yang kurang kepada kereta dan telefon](https://hbr.org/2013/04/the-hidden-biases-in-big-data), menjadikan isu jalan raya mereka tidak kelihatan dalam aplikasi ini. Pembangun bekerjasama dengan ahli akademik untuk menangani isu _akses saksama dan jurang digital_ demi keadilan. |
|
|
| **Keadilan Algoritma** | 2018 - Kajian MIT [Gender Shades](http://gendershades.org/overview.html) menilai ketepatan produk AI klasifikasi jantina, mendedahkan jurang ketepatan untuk wanita dan orang berwarna. [Kad Apple 2019](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) kelihatan menawarkan kredit yang lebih rendah kepada wanita berbanding lelaki. Kedua-duanya menggambarkan isu bias algoritma yang membawa kepada bahaya sosio-ekonomi.|
|
|
| **Salah Representasi Data** | 2020 - [Jabatan Kesihatan Awam Georgia mengeluarkan carta COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) yang kelihatan mengelirukan warga tentang trend kes yang disahkan dengan susunan tidak kronologi pada paksi-x. Ini menggambarkan salah representasi melalui helah visualisasi. |
|
|
| **Ilusi pilihan bebas** | 2020 - Aplikasi pembelajaran [ABCmouse membayar $10 juta untuk menyelesaikan aduan FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) di mana ibu bapa terperangkap membayar langganan yang mereka tidak dapat batalkan. Ini menggambarkan corak gelap dalam senibina pilihan, di mana pengguna didorong ke arah pilihan yang berpotensi berbahaya. |
|
|
| **Privasi Data & Hak Pengguna** | 2021 - [Kebocoran Data Facebook](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) mendedahkan data daripada 530 juta pengguna, mengakibatkan penyelesaian $5 bilion kepada FTC. Walau bagaimanapun, ia enggan memberitahu pengguna tentang kebocoran tersebut, melanggar hak pengguna berkaitan ketelusan data dan akses. |
|
|
|
|
Ingin meneroka lebih banyak kajian kes? Lihat sumber ini:
|
|
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - dilema etika merentasi pelbagai industri.
|
|
* [Kursus Etika Data Sains](https://www.coursera.org/learn/data-science-ethics#syllabus) - kajian kes penting diterokai.
|
|
* [Di mana perkara menjadi salah](https://deon.drivendata.org/examples/) - senarai semak deon dengan contoh.
|
|
|
|
> 🚨 Fikirkan tentang kajian kes yang anda lihat - adakah anda pernah mengalami, atau terjejas oleh, cabaran etika yang serupa dalam hidup anda? Bolehkah anda memikirkan sekurang-kurangnya satu lagi kajian kes yang menggambarkan salah satu cabaran etika yang telah kita bincangkan dalam bahagian ini?
|
|
|
|
## Etika Terapan
|
|
|
|
Kita telah bercakap tentang konsep etika, cabaran, dan kajian kes dalam konteks dunia sebenar. Tetapi bagaimana kita memulakan _menerapkan_ prinsip dan amalan etika dalam projek kita? Dan bagaimana kita _mengoperasikan_ amalan ini untuk tadbir urus yang lebih baik? Mari kita terokai beberapa penyelesaian dunia sebenar:
|
|
|
|
### 1. Kod Profesional
|
|
|
|
Kod Profesional menawarkan satu pilihan untuk organisasi "mendorong" ahli untuk menyokong prinsip etika dan pernyataan misi mereka. Kod adalah _panduan moral_ untuk tingkah laku profesional, membantu pekerja atau ahli membuat keputusan yang selaras dengan prinsip organisasi mereka. Ia hanya sebaik pematuhan sukarela daripada ahli; walau bagaimanapun, banyak organisasi menawarkan ganjaran dan penalti tambahan untuk memotivasi pematuhan daripada ahli.
|
|
|
|
Contoh termasuk:
|
|
|
|
* [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Kod Etika
|
|
* [Persatuan Data Sains](http://datascienceassn.org/code-of-conduct.html) Kod Tingkah Laku (dicipta 2013)
|
|
* [Kod Etika dan Tingkah Laku Profesional ACM](https://www.acm.org/code-of-ethics) (sejak 1993)
|
|
|
|
> 🚨 Adakah anda tergolong dalam organisasi kejuruteraan atau data sains profesional? Terokai laman web mereka untuk melihat sama ada mereka mentakrifkan kod etika profesional. Apa yang dikatakan tentang prinsip etika mereka? Bagaimana mereka "mendorong" ahli untuk mengikuti kod tersebut?
|
|
|
|
### 2. Senarai Semak Etika
|
|
|
|
Walaupun kod profesional mentakrifkan _tingkah laku etika_ yang diperlukan daripada pengamal, ia [mempunyai batasan yang diketahui](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) dalam penguatkuasaan, terutamanya dalam projek berskala besar. Sebaliknya, ramai pakar data sains [menganjurkan senarai semak](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), yang boleh **menghubungkan prinsip kepada amalan** dengan cara yang lebih deterministik dan boleh diambil tindakan.
|
|
|
|
Senarai semak menukar soalan kepada tugas "ya/tidak" yang boleh dioperasikan, membolehkan ia dijejaki sebagai sebahagian daripada aliran kerja pelepasan produk standard.
|
|
|
|
Contoh termasuk:
|
|
* [Deon](https://deon.drivendata.org/) - senarai semak etika data tujuan umum yang dicipta daripada [cadangan industri](https://deon.drivendata.org/#checklist-citations) dengan alat baris arahan untuk integrasi mudah.
|
|
* [Senarai Semak Audit Privasi](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - memberikan panduan umum untuk amalan pengendalian maklumat dari perspektif pendedahan undang-undang dan sosial.
|
|
* [Senarai Semak Keadilan AI](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - dicipta oleh pengamal AI untuk menyokong penerapan dan integrasi pemeriksaan keadilan ke dalam kitaran pembangunan AI.
|
|
* [22 soalan untuk etika dalam data dan AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - rangka kerja yang lebih terbuka, berstruktur untuk penerokaan awal isu etika dalam reka bentuk, pelaksanaan, dan konteks organisasi.
|
|
|
|
### 3. Peraturan Etika
|
|
|
|
Etika adalah tentang mentakrifkan nilai bersama dan melakukan perkara yang betul secara _sukarela_. **Pematuhan** adalah tentang _mengikuti undang-undang_ jika dan di mana ia ditakrifkan. **Tadbir urus** secara amnya merangkumi semua cara organisasi beroperasi untuk menguatkuasakan prinsip etika dan mematuhi undang-undang yang ditetapkan.
|
|
|
|
Hari ini, tadbir urus mengambil dua bentuk dalam organisasi. Pertama, ia adalah tentang mentakrifkan prinsip **AI etika** dan mewujudkan amalan untuk mengoperasikan penerapan merentasi semua projek berkaitan AI dalam organisasi. Kedua, ia adalah tentang mematuhi semua peraturan perlindungan data yang diwajibkan oleh kerajaan untuk wilayah yang ia beroperasi.
|
|
|
|
Contoh peraturan perlindungan dan privasi data:
|
|
|
|
* `1974`, [Akta Privasi AS](https://www.justice.gov/opcl/privacy-act-1974) - mengawal selia pengumpulan, penggunaan, dan pendedahan maklumat peribadi oleh _kerajaan persekutuan_.
|
|
* `1996`, [Akta Kebolehpasaran dan Akauntabiliti Insurans Kesihatan AS (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - melindungi data kesihatan peribadi.
|
|
* `1998`, [Akta Perlindungan Privasi Dalam Talian Kanak-kanak AS (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - melindungi privasi data kanak-kanak di bawah umur 13 tahun.
|
|
* `2018`, [Peraturan Perlindungan Data Umum (GDPR)](https://gdpr-info.eu/) - menyediakan hak pengguna, perlindungan data, dan privasi.
|
|
* `2018`, [Akta Privasi Pengguna California (CCPA)](https://www.oag.ca.gov/privacy/ccpa) memberikan pengguna lebih banyak _hak_ ke atas data (peribadi) mereka.
|
|
* `2021`, [Undang-undang Perlindungan Maklumat Peribadi China](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) baru sahaja diluluskan, mewujudkan salah satu peraturan privasi data dalam talian terkuat di dunia.
|
|
|
|
> 🚨 Kesatuan Eropah mentakrifkan GDPR (Peraturan Perlindungan Data Umum) kekal sebagai salah satu peraturan privasi data yang paling berpengaruh hari ini. Adakah anda tahu ia juga mentakrifkan [8 hak pengguna](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) untuk melindungi privasi digital dan data peribadi warganegara? Ketahui tentang apa hak ini, dan mengapa ia penting.
|
|
|
|
### 4. Budaya Etika
|
|
|
|
Perhatikan bahawa masih terdapat jurang tidak ketara antara _pematuhan_ (melakukan cukup untuk memenuhi "huruf undang-undang") dan menangani [isu sistemik](https://www.coursera.org/learn/data-science-ethics/home/week/4) (seperti pengukuhan, asimetri maklumat, dan ketidakadilan pengagihan) yang boleh mempercepatkan penggunaan AI untuk tujuan yang salah.
|
|
|
|
Yang terakhir memerlukan [pendekatan kolaboratif untuk mentakrifkan budaya etika](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) yang membina hubungan emosi dan nilai bersama yang konsisten _merentasi organisasi_ dalam industri. Ini memerlukan lebih banyak [budaya etika data yang diformalkan](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) dalam organisasi - membolehkan _sesiapa sahaja_ untuk [menarik tali Andon](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (untuk membangkitkan kebimbangan etika lebih awal dalam proses) dan menjadikan _penilaian etika_ (contohnya, dalam pengambilan pekerja) sebagai kriteria teras pembentukan pasukan dalam projek AI.
|
|
|
|
---
|
|
## [Kuiz selepas kuliah](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
|
|
## Ulasan & Kajian Kendiri
|
|
|
|
Kursus dan buku membantu memahami konsep dan cabaran etika teras, manakala kajian kes dan alat membantu dengan amalan etika terapan dalam konteks dunia sebenar. Berikut adalah beberapa sumber untuk bermula.
|
|
|
|
* [Pembelajaran Mesin Untuk Pemula](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - pelajaran tentang Keadilan, daripada Microsoft.
|
|
* [Prinsip AI Bertanggungjawab](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - laluan pembelajaran percuma dari Microsoft Learn.
|
|
* [Etika dan Sains Data](https://resources.oreilly.com/examples/0636920203964) - EBook O'Reilly (M. Loukides, H. Mason et. al)
|
|
* [Etika Sains Data](https://www.coursera.org/learn/data-science-ethics#syllabus) - kursus dalam talian dari Universiti Michigan.
|
|
* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - kajian kes dari Universiti Texas.
|
|
|
|
# Tugasan
|
|
|
|
[Tulis Kajian Kes Etika Data](assignment.md)
|
|
|
|
---
|
|
|
|
**Penafian**:
|
|
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Walaupun kami berusaha untuk memastikan ketepatan, sila ambil perhatian bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang berwibawa. Untuk maklumat yang kritikal, terjemahan manusia profesional adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini. |