You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/ms/2-Working-With-Data/06-non-relational/README.md

14 KiB

Bekerja dengan Data: Data Tidak Relasional

 Sketchnote oleh (@sketchthedocs)
Bekerja dengan Data NoSQL - Sketchnote oleh @nitya

Kuiz Pra-Kuliah

Data tidak terhad kepada pangkalan data relasional. Pelajaran ini memberi tumpuan kepada data tidak relasional dan akan merangkumi asas-asas spreadsheet dan NoSQL.

Spreadsheet

Spreadsheet adalah cara yang popular untuk menyimpan dan meneroka data kerana ia memerlukan persediaan yang lebih mudah dan cepat untuk dimulakan. Dalam pelajaran ini, anda akan mempelajari komponen asas spreadsheet, serta formula dan fungsi. Contoh-contoh akan ditunjukkan menggunakan Microsoft Excel, tetapi kebanyakan bahagian dan topik akan mempunyai nama dan langkah yang serupa jika dibandingkan dengan perisian spreadsheet lain.

Sebuah buku kerja Microsoft Excel kosong dengan dua helaian kerja

Spreadsheet adalah fail yang boleh diakses dalam sistem fail komputer, peranti, atau sistem fail berasaskan awan. Perisian itu sendiri mungkin berasaskan pelayar atau aplikasi yang perlu dipasang pada komputer atau dimuat turun sebagai aplikasi. Dalam Excel, fail-fail ini juga dikenali sebagai workbook, dan istilah ini akan digunakan sepanjang pelajaran ini.

Sebuah workbook mengandungi satu atau lebih worksheet, di mana setiap worksheet dilabelkan dengan tab. Dalam sebuah worksheet terdapat segi empat tepat yang dipanggil cell, yang mengandungi data sebenar. Sebuah cell adalah persilangan antara baris dan lajur, di mana lajur dilabelkan dengan huruf abjad dan baris dilabelkan secara numerik. Beberapa spreadsheet akan mengandungi header pada beberapa baris pertama untuk menerangkan data dalam cell.

Dengan elemen asas workbook Excel ini, kita akan menggunakan contoh daripada Microsoft Templates yang berfokus pada inventori untuk meneroka beberapa bahagian tambahan dalam spreadsheet.

Menguruskan Inventori

Fail spreadsheet bernama "InventoryExample" adalah spreadsheet yang diformatkan untuk item dalam inventori yang mengandungi tiga worksheet, di mana tab-tabnya dilabelkan "Inventory List", "Inventory Pick List" dan "Bin Lookup". Baris 4 dalam worksheet Inventory List adalah header, yang menerangkan nilai setiap cell dalam lajur header.

Formula yang disorot daripada senarai inventori contoh dalam Microsoft Excel

Terdapat situasi di mana sebuah cell bergantung pada nilai cell lain untuk menghasilkan nilainya. Spreadsheet Inventory List menjejaki kos setiap item dalam inventori, tetapi bagaimana jika kita perlu mengetahui nilai keseluruhan inventori? Formula melaksanakan tindakan pada data cell dan digunakan untuk mengira kos inventori dalam contoh ini. Spreadsheet ini menggunakan formula dalam lajur Inventory Value untuk mengira nilai setiap item dengan mendarabkan kuantiti di bawah header QTY dan kosnya di bawah header COST. Dengan mengklik dua kali atau menyorot sebuah cell, anda akan melihat formula. Anda akan perasan bahawa formula bermula dengan tanda sama dengan, diikuti oleh pengiraan atau operasi.

Fungsi yang disorot daripada senarai inventori contoh dalam Microsoft Excel

Kita boleh menggunakan formula lain untuk menambah semua nilai dalam Inventory Value untuk mendapatkan jumlah keseluruhannya. Ini boleh dikira dengan menambah setiap cell untuk menghasilkan jumlah, tetapi itu boleh menjadi tugas yang membosankan. Excel mempunyai fungsi, atau formula yang telah ditetapkan untuk melaksanakan pengiraan pada nilai cell. Fungsi memerlukan argumen, iaitu nilai yang diperlukan untuk melaksanakan pengiraan ini. Apabila fungsi memerlukan lebih daripada satu argumen, ia perlu disenaraikan dalam susunan tertentu atau fungsi mungkin tidak mengira nilai yang betul. Contoh ini menggunakan fungsi SUM, dan menggunakan nilai dalam Inventory Value sebagai argumen untuk menambah dan menghasilkan jumlah yang disenaraikan di bawah baris 3, lajur B (juga dirujuk sebagai B3).

NoSQL

NoSQL adalah istilah umum untuk pelbagai cara menyimpan data tidak relasional dan boleh ditafsirkan sebagai "non-SQL", "tidak relasional" atau "bukan hanya SQL". Jenis sistem pangkalan data ini boleh dikategorikan kepada 4 jenis.

Perwakilan grafik pangkalan data key-value yang menunjukkan 4 kunci unik yang dikaitkan dengan 4 nilai yang berbeza

Sumber daripada Blog Michał Białecki

Pangkalan data Key-value memadankan kunci unik, yang merupakan pengenal pasti unik yang dikaitkan dengan nilai. Pasangan ini disimpan menggunakan hash table dengan fungsi hashing yang sesuai.

Perwakilan grafik pangkalan data graph yang menunjukkan hubungan antara orang, minat mereka dan lokasi

Sumber daripada Microsoft

Pangkalan data Graph menerangkan hubungan dalam data dan diwakili sebagai koleksi nod dan tepi. Sebuah nod mewakili entiti, sesuatu yang wujud di dunia nyata seperti pelajar atau penyata bank. Tepi mewakili hubungan antara dua entiti. Setiap nod dan tepi mempunyai sifat yang memberikan maklumat tambahan tentang setiap nod dan tepi.

Perwakilan grafik pangkalan data columnar yang menunjukkan pangkalan data pelanggan dengan dua keluarga lajur bernama Identity dan Contact Info

Pangkalan data Columnar menyusun data ke dalam lajur dan baris seperti struktur data relasional tetapi setiap lajur dibahagikan kepada kumpulan yang dipanggil keluarga lajur, di mana semua data di bawah satu lajur berkaitan dan boleh diambil dan diubah dalam satu unit.

Pangkalan Data Dokumen dengan Azure Cosmos DB

Pangkalan data Dokumen dibina berdasarkan konsep pangkalan data key-value dan terdiri daripada siri medan dan objek. Bahagian ini akan meneroka pangkalan data dokumen dengan emulator Cosmos DB.

Pangkalan data Cosmos DB memenuhi definisi "Bukan Hanya SQL", di mana pangkalan data dokumen Cosmos DB bergantung pada SQL untuk menyoal data. Pelajaran sebelumnya mengenai SQL merangkumi asas-asas bahasa ini, dan kita akan dapat menggunakan beberapa pertanyaan yang sama pada pangkalan data dokumen di sini. Kita akan menggunakan Emulator Cosmos DB, yang membolehkan kita mencipta dan meneroka pangkalan data dokumen secara tempatan pada komputer. Baca lebih lanjut tentang Emulator di sini.

Sebuah dokumen adalah koleksi medan dan nilai objek, di mana medan menerangkan apa yang diwakili oleh nilai objek. Di bawah adalah contoh dokumen.

{
    "firstname": "Eva",
    "age": 44,
    "id": "8c74a315-aebf-4a16-bb38-2430a9896ce5",
    "_rid": "bHwDAPQz8s0BAAAAAAAAAA==",
    "_self": "dbs/bHwDAA==/colls/bHwDAPQz8s0=/docs/bHwDAPQz8s0BAAAAAAAAAA==/",
    "_etag": "\"00000000-0000-0000-9f95-010a691e01d7\"",
    "_attachments": "attachments/",
    "_ts": 1630544034
}

Medan yang menarik dalam dokumen ini adalah: firstname, id, dan age. Medan lain dengan garis bawah dihasilkan oleh Cosmos DB.

Meneroka Data dengan Emulator Cosmos DB

Anda boleh memuat turun dan memasang emulator untuk Windows di sini. Rujuk dokumentasi ini untuk pilihan cara menjalankan Emulator untuk macOS dan Linux.

Emulator melancarkan tetingkap pelayar, di mana paparan Explorer membolehkan anda meneroka dokumen.

Paparan Explorer Emulator Cosmos DB

Jika anda mengikuti langkah ini, klik pada "Start with Sample" untuk menjana pangkalan data contoh bernama SampleDB. Jika anda mengembangkan SampleDB dengan mengklik anak panah, anda akan menemui bekas bernama Persons, di mana bekas ini memegang koleksi item, iaitu dokumen dalam bekas tersebut. Anda boleh meneroka empat dokumen individu di bawah Items.

Meneroka data contoh dalam Emulator Cosmos DB

Menyoal Data Dokumen dengan Emulator Cosmos DB

Kita juga boleh menyoal data contoh dengan mengklik butang SQL Query baru (butang kedua dari kiri).

SELECT * FROM c mengembalikan semua dokumen dalam bekas. Mari tambahkan klausa where dan cari semua orang yang berumur di bawah 40 tahun.

SELECT * FROM c where c.age < 40

Menjalankan pertanyaan SELECT pada data contoh dalam Emulator Cosmos DB untuk mencari dokumen yang mempunyai nilai medan umur kurang daripada 40

Pertanyaan ini mengembalikan dua dokumen, perhatikan nilai umur untuk setiap dokumen adalah kurang daripada 40.

JSON dan Dokumen

Jika anda biasa dengan JavaScript Object Notation (JSON), anda akan perasan bahawa dokumen kelihatan serupa dengan JSON. Terdapat fail PersonsData.json dalam direktori ini dengan lebih banyak data yang boleh anda muat naik ke bekas Persons dalam Emulator melalui butang Upload Item.

Dalam kebanyakan kes, API yang mengembalikan data JSON boleh dipindahkan dan disimpan secara langsung dalam pangkalan data dokumen. Di bawah adalah dokumen lain, ia mewakili tweet daripada akaun Twitter Microsoft yang diperoleh menggunakan API Twitter, kemudian dimasukkan ke dalam Cosmos DB.

{
    "created_at": "2021-08-31T19:03:01.000Z",
    "id": "1432780985872142341",
    "text": "Blank slate. Like this tweet if youve ever painted in Microsoft Paint before. https://t.co/cFeEs8eOPK",
    "_rid": "dhAmAIUsA4oHAAAAAAAAAA==",
    "_self": "dbs/dhAmAA==/colls/dhAmAIUsA4o=/docs/dhAmAIUsA4oHAAAAAAAAAA==/",
    "_etag": "\"00000000-0000-0000-9f84-a0958ad901d7\"",
    "_attachments": "attachments/",
    "_ts": 1630537000

Medan yang menarik dalam dokumen ini adalah: created_at, id, dan text.

🚀 Cabaran

Terdapat fail TwitterData.json yang boleh anda muat naik ke pangkalan data SampleDB. Disarankan agar anda menambahkannya ke bekas yang berasingan. Ini boleh dilakukan dengan:

  1. Mengklik butang bekas baru di bahagian atas kanan
  2. Memilih pangkalan data sedia ada (SampleDB) dan mencipta id bekas untuk bekas tersebut
  3. Menetapkan partition key kepada /id
  4. Mengklik OK (anda boleh mengabaikan maklumat lain dalam paparan ini kerana ini adalah set data kecil yang dijalankan secara tempatan pada mesin anda)
  5. Membuka bekas baru anda dan memuat naik fail Twitter Data dengan butang Upload Item

Cuba jalankan beberapa pertanyaan SELECT untuk mencari dokumen yang mempunyai perkataan Microsoft dalam medan teks. Petunjuk: cuba gunakan kata kunci LIKE

Kuiz Pasca-Kuliah

Ulasan & Kajian Kendiri

  • Terdapat beberapa pemformatan dan ciri tambahan yang ditambah pada spreadsheet ini yang tidak diliputi dalam pelajaran ini. Microsoft mempunyai perpustakaan dokumentasi dan video yang besar tentang Excel jika anda berminat untuk belajar lebih lanjut.

  • Dokumentasi seni bina ini memperincikan ciri-ciri dalam pelbagai jenis data tidak relasional: Data Tidak Relasional dan NoSQL

  • Cosmos DB adalah pangkalan data tidak relasional berasaskan awan yang juga boleh menyimpan pelbagai jenis NoSQL yang disebutkan dalam pelajaran ini. Ketahui lebih lanjut tentang jenis-jenis ini dalam Modul Pembelajaran Microsoft Cosmos DB

Tugasan

Soda Profits


Penafian:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator. Walaupun kami berusaha untuk memastikan ketepatan, sila ambil maklum bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang berwibawa. Untuk maklumat penting, terjemahan manusia profesional adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.