You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/id/6-Data-Science-In-Wild/20-Real-World-Examples
leestott 0f1def896e
🌐 Update translations via Co-op Translator
2 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

Ilmu Data di Dunia Nyata

 Sketchnote oleh (@sketchthedocs)
Ilmu Data di Dunia Nyata - Sketchnote oleh @nitya

Kita hampir sampai di akhir perjalanan pembelajaran ini!

Kita mulai dengan definisi ilmu data dan etika, mengeksplorasi berbagai alat & teknik untuk analisis dan visualisasi data, meninjau siklus hidup ilmu data, dan melihat bagaimana skalabilitas dan otomatisasi alur kerja ilmu data dapat dilakukan dengan layanan komputasi awan. Jadi, Anda mungkin bertanya: "Bagaimana tepatnya saya dapat menerapkan semua pembelajaran ini ke dalam konteks dunia nyata?"

Dalam pelajaran ini, kita akan mengeksplorasi aplikasi ilmu data di dunia nyata di berbagai industri dan menyelami contoh spesifik dalam konteks penelitian, humaniora digital, dan keberlanjutan. Kita juga akan melihat peluang proyek mahasiswa dan menyimpulkan dengan sumber daya yang berguna untuk membantu Anda melanjutkan perjalanan pembelajaran Anda!

Kuis Pra-Kuliah

Kuis pra-kuliah

Ilmu Data + Industri

Berkat demokratisasi AI, pengembang kini lebih mudah merancang dan mengintegrasikan pengambilan keputusan berbasis AI serta wawasan berbasis data ke dalam pengalaman pengguna dan alur kerja pengembangan. Berikut beberapa contoh bagaimana ilmu data "diterapkan" dalam aplikasi dunia nyata di berbagai industri:

  • Google Flu Trends menggunakan ilmu data untuk menghubungkan istilah pencarian dengan tren flu. Meskipun pendekatan ini memiliki kekurangan, hal ini meningkatkan kesadaran akan kemungkinan (dan tantangan) prediksi kesehatan berbasis data.

  • Prediksi Rute UPS - menjelaskan bagaimana UPS menggunakan ilmu data dan pembelajaran mesin untuk memprediksi rute optimal untuk pengiriman, dengan mempertimbangkan kondisi cuaca, pola lalu lintas, tenggat waktu pengiriman, dan lainnya.

  • Visualisasi Rute Taksi NYC - data yang dikumpulkan menggunakan Freedom Of Information Laws membantu memvisualisasikan satu hari dalam kehidupan taksi NYC, membantu kita memahami bagaimana mereka menavigasi kota yang sibuk, pendapatan yang mereka hasilkan, dan durasi perjalanan selama periode 24 jam.

  • Uber Data Science Workbench - menggunakan data (lokasi penjemputan & pengantaran, durasi perjalanan, rute yang disukai, dll.) yang dikumpulkan dari jutaan perjalanan Uber setiap hari untuk membangun alat analitik data yang membantu dalam penentuan harga, keselamatan, deteksi penipuan, dan keputusan navigasi.

  • Analitik Olahraga - berfokus pada analitik prediktif (analisis tim dan pemain - seperti Moneyball - dan manajemen penggemar) dan visualisasi data (dasbor tim & penggemar, permainan, dll.) dengan aplikasi seperti pencarian bakat, perjudian olahraga, dan manajemen inventaris/venue.

  • Ilmu Data di Perbankan - menyoroti nilai ilmu data di industri keuangan dengan aplikasi mulai dari pemodelan risiko dan deteksi penipuan, hingga segmentasi pelanggan, prediksi waktu nyata, dan sistem rekomendasi. Analitik prediktif juga mendorong langkah-langkah penting seperti skor kredit.

  • Ilmu Data di Kesehatan - menyoroti aplikasi seperti pencitraan medis (misalnya, MRI, X-Ray, CT-Scan), genomik (sekuensing DNA), pengembangan obat (penilaian risiko, prediksi keberhasilan), analitik prediktif (perawatan pasien & logistik pasokan), pelacakan & pencegahan penyakit, dll.

Aplikasi Ilmu Data di Dunia Nyata Kredit Gambar: Data Flair: 6 Amazing Data Science Applications

Gambar tersebut menunjukkan domain lain dan contoh penerapan teknik ilmu data. Ingin mengeksplorasi aplikasi lainnya? Lihat bagian Review & Self Study di bawah ini.

Ilmu Data + Penelitian

 Sketchnote oleh (@sketchthedocs)
Ilmu Data & Penelitian - Sketchnote oleh @nitya

Sementara aplikasi dunia nyata sering kali berfokus pada kasus penggunaan industri dalam skala besar, aplikasi dan proyek penelitian dapat berguna dari dua perspektif:

  • peluang inovasi - mengeksplorasi prototipe cepat konsep lanjutan dan pengujian pengalaman pengguna untuk aplikasi generasi berikutnya.
  • tantangan penerapan - menyelidiki potensi bahaya atau konsekuensi yang tidak diinginkan dari teknologi ilmu data dalam konteks dunia nyata.

Bagi mahasiswa, proyek penelitian ini dapat memberikan peluang pembelajaran dan kolaborasi yang dapat meningkatkan pemahaman Anda tentang topik tersebut, serta memperluas kesadaran dan keterlibatan Anda dengan orang atau tim yang relevan yang bekerja di bidang yang diminati. Jadi, seperti apa proyek penelitian itu dan bagaimana mereka dapat memberikan dampak?

Mari kita lihat satu contoh - MIT Gender Shades Study dari Joy Buolamwini (MIT Media Labs) dengan makalah penelitian utama yang ditulis bersama dengan Timnit Gebru (saat itu di Microsoft Research) yang berfokus pada:

  • Apa: Tujuan proyek penelitian adalah mengevaluasi bias yang ada dalam algoritma analisis wajah otomatis dan dataset berdasarkan jenis kelamin dan warna kulit.
  • Mengapa: Analisis wajah digunakan di area seperti penegakan hukum, keamanan bandara, sistem perekrutan, dan lainnya - konteks di mana klasifikasi yang tidak akurat (misalnya, karena bias) dapat menyebabkan potensi kerugian ekonomi dan sosial bagi individu atau kelompok yang terkena dampak. Memahami (dan menghilangkan atau mengurangi) bias adalah kunci untuk keadilan dalam penggunaan.
  • Bagaimana: Peneliti menyadari bahwa tolok ukur yang ada sebagian besar menggunakan subjek berkulit terang, dan mengkurasi dataset baru (1000+ gambar) yang lebih seimbang berdasarkan jenis kelamin dan warna kulit. Dataset ini digunakan untuk mengevaluasi akurasi tiga produk klasifikasi gender (dari Microsoft, IBM & Face++).

Hasil menunjukkan bahwa meskipun akurasi klasifikasi keseluruhan baik, terdapat perbedaan yang mencolok dalam tingkat kesalahan antara berbagai subkelompok - dengan kesalahan penggolongan gender lebih tinggi pada perempuan atau orang dengan warna kulit lebih gelap, yang menunjukkan adanya bias.

Hasil Utama: Meningkatkan kesadaran bahwa ilmu data membutuhkan lebih banyak dataset yang representatif (subkelompok yang seimbang) dan lebih banyak tim yang inklusif (latar belakang yang beragam) untuk mengenali dan menghilangkan atau mengurangi bias seperti ini lebih awal dalam solusi AI. Upaya penelitian seperti ini juga berperan penting dalam banyak organisasi dalam mendefinisikan prinsip dan praktik untuk AI yang bertanggung jawab guna meningkatkan keadilan di seluruh produk dan proses AI mereka.

Ingin mempelajari upaya penelitian yang relevan di Microsoft?

Ilmu Data + Humaniora

 Sketchnote oleh (@sketchthedocs)
Ilmu Data & Humaniora Digital - Sketchnote oleh @nitya

Humaniora Digital didefinisikan sebagai "sebuah kumpulan praktik dan pendekatan yang menggabungkan metode komputasi dengan penyelidikan humanistik". Proyek Stanford seperti "rebooting history" dan "poetic thinking" menggambarkan hubungan antara Humaniora Digital dan Ilmu Data - menekankan teknik seperti analisis jaringan, visualisasi informasi, analisis spasial dan teks yang dapat membantu kita meninjau kembali dataset sejarah dan sastra untuk mendapatkan wawasan dan perspektif baru.

Ingin mengeksplorasi dan memperluas proyek di bidang ini?

Lihat "Emily Dickinson and the Meter of Mood" - contoh hebat dari Jen Looper yang bertanya bagaimana kita dapat menggunakan ilmu data untuk meninjau kembali puisi yang sudah dikenal dan mengevaluasi ulang maknanya serta kontribusi penulisnya dalam konteks baru. Misalnya, bisakah kita memprediksi musim di mana sebuah puisi ditulis dengan menganalisis nada atau sentimennya - dan apa yang hal ini katakan tentang keadaan pikiran penulis selama periode tersebut?

Untuk menjawab pertanyaan itu, kita mengikuti langkah-langkah siklus hidup ilmu data:

  • Akuisisi Data - untuk mengumpulkan dataset yang relevan untuk analisis. Pilihan termasuk menggunakan API (misalnya, Poetry DB API) atau scraping halaman web (misalnya, Project Gutenberg) menggunakan alat seperti Scrapy.
  • Pembersihan Data - menjelaskan bagaimana teks dapat diformat, disanitasi, dan disederhanakan menggunakan alat dasar seperti Visual Studio Code dan Microsoft Excel.
  • Analisis Data - menjelaskan bagaimana kita dapat mengimpor dataset ke dalam "Notebook" untuk analisis menggunakan paket Python (seperti pandas, numpy, dan matplotlib) untuk mengorganisasi dan memvisualisasikan data.
  • Analisis Sentimen - menjelaskan bagaimana kita dapat mengintegrasikan layanan cloud seperti Text Analytics, menggunakan alat low-code seperti Power Automate untuk alur kerja pemrosesan data otomatis.

Menggunakan alur kerja ini, kita dapat mengeksplorasi dampak musiman pada sentimen puisi, dan membantu kita membentuk perspektif kita sendiri tentang penulisnya. Cobalah sendiri - lalu perluas notebook untuk mengajukan pertanyaan lain atau memvisualisasikan data dengan cara baru!

Anda dapat menggunakan beberapa alat dalam Digital Humanities toolkit untuk mengejar jalur penyelidikan ini.

Ilmu Data + Keberlanjutan

 Sketchnote oleh (@sketchthedocs)
Ilmu Data & Keberlanjutan - Sketchnote oleh @nitya

Agenda 2030 untuk Pembangunan Berkelanjutan - yang diadopsi oleh semua anggota Perserikatan Bangsa-Bangsa pada tahun 2015 - mengidentifikasi 17 tujuan termasuk yang berfokus pada Melindungi Planet dari degradasi dan dampak perubahan iklim. Inisiatif Keberlanjutan Microsoft mendukung tujuan-tujuan ini dengan mengeksplorasi cara-cara di mana solusi teknologi dapat mendukung dan membangun masa depan yang lebih berkelanjutan dengan fokus pada 4 tujuan - menjadi karbon negatif, air positif, nol limbah, dan bio-diversitas pada tahun 2030.

Mengatasi tantangan ini secara skala besar dan tepat waktu membutuhkan pemikiran skala cloud - dan data dalam jumlah besar. Inisiatif Planetary Computer menyediakan 4 komponen untuk membantu ilmuwan data dan pengembang dalam upaya ini:

  • Katalog Data - dengan petabyte data Sistem Bumi (gratis & di-host di Azure).

  • Planetary API - untuk membantu pengguna mencari data yang relevan di berbagai ruang dan waktu.

  • Hub - lingkungan terkelola untuk ilmuwan memproses dataset geospasial besar.

  • Aplikasi - menampilkan kasus penggunaan & alat untuk wawasan keberlanjutan. Proyek Planetary Computer saat ini dalam tahap pratinjau (per September 2021) - berikut cara Anda dapat mulai berkontribusi pada solusi keberlanjutan menggunakan ilmu data.

  • Ajukan akses untuk memulai eksplorasi dan terhubung dengan rekan-rekan.

  • Jelajahi dokumentasi untuk memahami dataset dan API yang didukung.

  • Jelajahi aplikasi seperti Pemantauan Ekosistem untuk mendapatkan inspirasi ide aplikasi.

Pikirkan bagaimana Anda dapat menggunakan visualisasi data untuk mengungkapkan atau memperkuat wawasan yang relevan dalam bidang seperti perubahan iklim dan deforestasi. Atau pikirkan bagaimana wawasan tersebut dapat digunakan untuk menciptakan pengalaman pengguna baru yang memotivasi perubahan perilaku menuju gaya hidup yang lebih berkelanjutan.

Ilmu Data + Mahasiswa

Kami telah membahas aplikasi dunia nyata di industri dan penelitian, serta mengeksplorasi contoh aplikasi ilmu data dalam humaniora digital dan keberlanjutan. Jadi, bagaimana Anda dapat membangun keterampilan Anda dan berbagi keahlian sebagai pemula dalam ilmu data?

Berikut beberapa contoh proyek ilmu data mahasiswa untuk menginspirasi Anda.

🚀 Tantangan

Cari artikel yang merekomendasikan proyek ilmu data yang ramah pemula - seperti 50 topik ini atau 21 ide proyek ini atau 16 proyek ini dengan kode sumber yang dapat Anda analisis dan modifikasi. Jangan lupa untuk menulis blog tentang perjalanan belajar Anda dan berbagi wawasan dengan kami semua.

Kuis Pasca-Kuliah

Kuis pasca-kuliah

Tinjauan & Studi Mandiri

Ingin mengeksplorasi lebih banyak kasus penggunaan? Berikut beberapa artikel yang relevan:

Tugas

Eksplorasi Dataset Planetary Computer


Penafian:
Dokumen ini telah diterjemahkan menggunakan layanan terjemahan AI Co-op Translator. Meskipun kami berupaya untuk memberikan hasil yang akurat, harap diperhatikan bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang berwenang. Untuk informasi yang bersifat kritis, disarankan menggunakan jasa terjemahan manusia profesional. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang keliru yang timbul dari penggunaan terjemahan ini.