You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/ms/2-Working-With-Data/06-non-relational
leestott 264ebcc9fd
🌐 Update translations via Co-op Translator
2 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

Bekerja dengan Data: Data Tidak Relasional

 Sketchnote oleh (@sketchthedocs)
Bekerja dengan Data NoSQL - Sketchnote oleh @nitya

Kuiz Pra-Kuliah

Data tidak terhad kepada pangkalan data relasional. Pelajaran ini memberi tumpuan kepada data tidak relasional dan akan merangkumi asas-asas hamparan dan NoSQL.

Hamparan

Hamparan adalah cara yang popular untuk menyimpan dan meneroka data kerana ia memerlukan persediaan yang lebih mudah dan cepat untuk bermula. Dalam pelajaran ini, anda akan mempelajari komponen asas hamparan, serta formula dan fungsi. Contoh-contoh akan ditunjukkan menggunakan Microsoft Excel, tetapi kebanyakan bahagian dan topik akan mempunyai nama dan langkah yang serupa jika dibandingkan dengan perisian hamparan lain.

Buku kerja Microsoft Excel kosong dengan dua helaian kerja

Hamparan adalah fail dan boleh diakses dalam sistem fail komputer, peranti, atau sistem fail berasaskan awan. Perisian itu sendiri mungkin berasaskan pelayar atau aplikasi yang perlu dipasang pada komputer atau dimuat turun sebagai aplikasi. Dalam Excel, fail-fail ini juga dikenali sebagai buku kerja dan istilah ini akan digunakan sepanjang pelajaran ini.

Sebuah buku kerja mengandungi satu atau lebih helaian kerja, di mana setiap helaian kerja dilabelkan dengan tab. Dalam helaian kerja terdapat segi empat tepat yang dipanggil sel, yang mengandungi data sebenar. Sel adalah persilangan antara baris dan lajur, di mana lajur dilabelkan dengan huruf abjad dan baris dilabelkan secara numerik. Beberapa hamparan akan mengandungi tajuk di beberapa baris pertama untuk menerangkan data dalam sel.

Dengan elemen asas buku kerja Excel ini, kita akan menggunakan contoh daripada Microsoft Templates yang memberi tumpuan kepada inventori untuk meneroka beberapa bahagian tambahan dalam hamparan.

Menguruskan Inventori

Fail hamparan bernama "InventoryExample" adalah hamparan yang diformatkan bagi item-item dalam inventori yang mengandungi tiga helaian kerja, di mana tab-tab dilabelkan "Inventory List", "Inventory Pick List" dan "Bin Lookup". Baris 4 dalam helaian kerja Inventory List adalah tajuk, yang menerangkan nilai setiap sel dalam lajur tajuk.

Formula yang diserlahkan daripada senarai inventori contoh dalam Microsoft Excel

Terdapat keadaan di mana nilai dalam sel bergantung pada nilai sel lain untuk menghasilkan nilainya. Hamparan Inventory List menjejaki kos setiap item dalam inventori, tetapi bagaimana jika kita perlu mengetahui nilai keseluruhan inventori? Formula melaksanakan tindakan pada data sel dan digunakan untuk mengira kos inventori dalam contoh ini. Hamparan ini menggunakan formula dalam lajur Inventory Value untuk mengira nilai setiap item dengan mendarabkan kuantiti di bawah tajuk QTY dan kosnya di bawah tajuk COST. Klik dua kali atau serlahkan sel untuk melihat formula. Anda akan perasan bahawa formula bermula dengan tanda sama dengan, diikuti oleh pengiraan atau operasi.

Fungsi yang diserlahkan daripada senarai inventori contoh dalam Microsoft Excel

Kita boleh menggunakan formula lain untuk menambah semua nilai dalam Inventory Value untuk mendapatkan jumlah keseluruhannya. Ini boleh dikira dengan menambah setiap sel untuk menghasilkan jumlah, tetapi itu boleh menjadi tugas yang membosankan. Excel mempunyai fungsi, atau formula yang telah ditetapkan untuk melaksanakan pengiraan pada nilai sel. Fungsi memerlukan argumen, iaitu nilai yang diperlukan untuk melaksanakan pengiraan ini. Apabila fungsi memerlukan lebih daripada satu argumen, ia perlu disenaraikan dalam susunan tertentu atau fungsi mungkin tidak mengira nilai yang betul. Contoh ini menggunakan fungsi SUM, dan menggunakan nilai dalam Inventory Value sebagai argumen untuk menambah dan menghasilkan jumlah yang disenaraikan di bawah baris 3, lajur B (juga dirujuk sebagai B3).

NoSQL

NoSQL adalah istilah umum untuk pelbagai cara menyimpan data tidak relasional dan boleh ditafsirkan sebagai "non-SQL", "tidak relasional" atau "bukan hanya SQL". Jenis sistem pangkalan data ini boleh dikategorikan kepada 4 jenis.

Perwakilan grafik pangkalan data key-value yang menunjukkan 4 kunci unik yang dikaitkan dengan 4 nilai berbeza

Sumber daripada Blog Michał Białecki

Pangkalan data Key-value memadankan kunci unik, yang merupakan pengecam unik yang dikaitkan dengan nilai. Pasangan ini disimpan menggunakan jadual hash dengan fungsi hash yang sesuai.

Perwakilan grafik pangkalan data graf yang menunjukkan hubungan antara orang, minat mereka dan lokasi

Sumber daripada Microsoft

Pangkalan data Graf menerangkan hubungan dalam data dan diwakili sebagai koleksi nod dan tepi. Nod mewakili entiti, sesuatu yang wujud di dunia nyata seperti pelajar atau penyata bank. Tepi mewakili hubungan antara dua entiti. Setiap nod dan tepi mempunyai sifat yang memberikan maklumat tambahan tentang setiap nod dan tepi.

Perwakilan grafik pangkalan data kolumnar yang menunjukkan pangkalan data pelanggan dengan dua keluarga lajur bernama Identity dan Contact Info

Pangkalan data Kolumnar menyusun data ke dalam lajur dan baris seperti struktur data relasional tetapi setiap lajur dibahagikan kepada kumpulan yang dipanggil keluarga lajur, di mana semua data di bawah satu lajur berkaitan dan boleh diambil dan diubah dalam satu unit.

Pangkalan Data Dokumen dengan Azure Cosmos DB

Pangkalan data Dokumen dibina berdasarkan konsep pangkalan data key-value dan terdiri daripada siri medan dan objek. Bahagian ini akan meneroka pangkalan data dokumen dengan emulator Cosmos DB.

Pangkalan data Cosmos DB memenuhi definisi "Bukan Hanya SQL", di mana pangkalan data dokumen Cosmos DB bergantung pada SQL untuk menyoal data. Pelajaran sebelumnya mengenai SQL merangkumi asas-asas bahasa ini, dan kita akan dapat menggunakan beberapa pertanyaan yang sama pada pangkalan data dokumen di sini. Kita akan menggunakan Emulator Cosmos DB, yang membolehkan kita mencipta dan meneroka pangkalan data dokumen secara tempatan pada komputer. Baca lebih lanjut tentang Emulator di sini.

Dokumen adalah koleksi medan dan nilai objek, di mana medan menerangkan apa yang diwakili oleh nilai objek. Di bawah adalah contoh dokumen.

{
    "firstname": "Eva",
    "age": 44,
    "id": "8c74a315-aebf-4a16-bb38-2430a9896ce5",
    "_rid": "bHwDAPQz8s0BAAAAAAAAAA==",
    "_self": "dbs/bHwDAA==/colls/bHwDAPQz8s0=/docs/bHwDAPQz8s0BAAAAAAAAAA==/",
    "_etag": "\"00000000-0000-0000-9f95-010a691e01d7\"",
    "_attachments": "attachments/",
    "_ts": 1630544034
}

Medan yang menarik dalam dokumen ini adalah: firstname, id, dan age. Medan lain dengan garis bawah dihasilkan oleh Cosmos DB.

Meneroka Data dengan Emulator Cosmos DB

Anda boleh memuat turun dan memasang emulator untuk Windows di sini. Rujuk dokumentasi ini untuk pilihan cara menjalankan Emulator untuk macOS dan Linux.

Emulator melancarkan tetingkap pelayar, di mana paparan Explorer membolehkan anda meneroka dokumen.

Paparan Explorer Emulator Cosmos DB

Jika anda mengikuti langkah ini, klik pada "Start with Sample" untuk menjana pangkalan data contoh bernama SampleDB. Jika anda mengembangkan SampleDB dengan mengklik anak panah, anda akan menemui bekas bernama Persons, bekas ini memegang koleksi item, yang merupakan dokumen dalam bekas tersebut. Anda boleh meneroka empat dokumen individu di bawah Items.

Meneroka data contoh dalam Emulator Cosmos DB

Menyoal Data Dokumen dengan Emulator Cosmos DB

Kita juga boleh menyoal data contoh dengan mengklik butang New SQL Query (butang kedua dari kiri).

SELECT * FROM c mengembalikan semua dokumen dalam bekas. Mari tambahkan klausa where dan cari semua orang yang berumur di bawah 40 tahun.

SELECT * FROM c where c.age < 40

Menjalankan pertanyaan SELECT pada data contoh dalam Emulator Cosmos DB untuk mencari dokumen yang mempunyai nilai medan umur kurang daripada 40

Pertanyaan ini mengembalikan dua dokumen, perhatikan nilai umur untuk setiap dokumen adalah kurang daripada 40.

JSON dan Dokumen

Jika anda biasa dengan JavaScript Object Notation (JSON), anda akan perasan bahawa dokumen kelihatan serupa dengan JSON. Terdapat fail PersonsData.json dalam direktori ini dengan lebih banyak data yang boleh anda muat naik ke bekas Persons dalam Emulator melalui butang Upload Item.

Dalam kebanyakan kes, API yang mengembalikan data JSON boleh dipindahkan dan disimpan secara langsung dalam pangkalan data dokumen. Di bawah adalah dokumen lain, ia mewakili tweet daripada akaun Twitter Microsoft yang diperoleh menggunakan API Twitter, kemudian dimasukkan ke dalam Cosmos DB.

{
    "created_at": "2021-08-31T19:03:01.000Z",
    "id": "1432780985872142341",
    "text": "Blank slate. Like this tweet if youve ever painted in Microsoft Paint before. https://t.co/cFeEs8eOPK",
    "_rid": "dhAmAIUsA4oHAAAAAAAAAA==",
    "_self": "dbs/dhAmAA==/colls/dhAmAIUsA4o=/docs/dhAmAIUsA4oHAAAAAAAAAA==/",
    "_etag": "\"00000000-0000-0000-9f84-a0958ad901d7\"",
    "_attachments": "attachments/",
    "_ts": 1630537000

Medan yang menarik dalam dokumen ini adalah: created_at, id, dan text.

🚀 Cabaran

Terdapat fail TwitterData.json yang boleh anda muat naik ke pangkalan data SampleDB. Adalah disyorkan agar anda menambahkannya ke bekas yang berasingan. Ini boleh dilakukan dengan:

  1. Mengklik butang bekas baru di bahagian atas kanan
  2. Memilih pangkalan data sedia ada (SampleDB) dan mencipta ID bekas untuk bekas tersebut
  3. Menetapkan kunci partisi kepada /id
  4. Mengklik OK (anda boleh mengabaikan maklumat lain dalam paparan ini kerana ini adalah set data kecil yang dijalankan secara tempatan pada mesin anda)
  5. Membuka bekas baru anda dan memuat naik fail Twitter Data dengan butang Upload Item

Cuba jalankan beberapa pertanyaan SELECT untuk mencari dokumen yang mempunyai perkataan Microsoft dalam medan teks. Petunjuk: cuba gunakan kata kunci LIKE

Kuiz Pasca-Kuliah

Ulasan & Kajian Kendiri

  • Terdapat beberapa pemformatan dan ciri tambahan yang ditambah kepada hamparan ini yang tidak diliputi dalam pelajaran ini. Microsoft mempunyai perpustakaan dokumentasi dan video yang besar tentang Excel jika anda berminat untuk belajar lebih lanjut.

  • Dokumentasi seni bina ini memperincikan ciri-ciri dalam pelbagai jenis data tidak relasional: Data Tidak Relasional dan NoSQL

  • Cosmos DB adalah pangkalan data tidak relasional berasaskan awan yang juga boleh menyimpan pelbagai jenis NoSQL yang disebutkan dalam pelajaran ini. Ketahui lebih lanjut tentang jenis-jenis ini dalam Modul Pembelajaran Microsoft Cosmos DB

Tugasan

Soda Profits


Penafian:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator. Walaupun kami berusaha untuk memastikan ketepatan, sila ambil maklum bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang berwibawa. Untuk maklumat penting, terjemahan manusia profesional adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.