You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/ja/2-Working-With-Data/06-non-relational/README.md

158 lines
16 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "c182e87f9f80be7e7cdffc7b40bbfccf",
"translation_date": "2025-09-05T12:38:33+00:00",
"source_file": "2-Working-With-Data/06-non-relational/README.md",
"language_code": "ja"
}
-->
# データの操作: 非リレーショナルデータ
|![ スケッチノート by [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/06-NoSQL.png)|
|:---:|
|NoSQLデータの操作 - _スケッチート by [@nitya](https://twitter.com/nitya)_ |
## [講義前クイズ](https://ff-quizzes.netlify.app/en/ds/quiz/10)
データはリレーショナルデータベースに限定されません。このレッスンでは、非リレーショナルデータに焦点を当て、スプレッドシートとNoSQLの基本について学びます。
## スプレッドシート
スプレッドシートは、セットアップや開始に手間がかからないため、データを保存・探索するための一般的な方法です。このレッスンでは、スプレッドシートの基本的な構成要素、数式や関数について学びます。例はMicrosoft Excelを使用して説明しますが、他のスプレッドシートソフトウェアでも似たような名称や手順が多くあります。
![空のMicrosoft Excelワークブックと2つのワークシート](../../../../2-Working-With-Data/06-non-relational/images/parts-of-spreadsheet.png)
スプレッドシートはファイルであり、コンピュータ、デバイス、またはクラウドベースのファイルシステムでアクセス可能です。ソフトウェア自体はブラウザベースの場合もあれば、コンピュータにインストールするアプリケーションやアプリとしてダウンロードする必要がある場合もあります。Excelでは、これらのファイルは**ワークブック**と定義されており、このレッスンではこの用語を使用します。
ワークブックには1つ以上の**ワークシート**が含まれ、それぞれのワークシートはタブでラベル付けされています。ワークシート内には**セル**と呼ばれる長方形があり、実際のデータが含まれます。セルは行と列の交差点であり、列はアルファベットで、行は数字でラベル付けされています。一部のスプレッドシートでは、最初の数行にヘッダーが含まれ、セル内のデータを説明します。
Excelワークブックのこれらの基本要素を使用して、[Microsoft Templates](https://templates.office.com/)の在庫管理に焦点を当てた例を使い、スプレッドシートの追加部分を見ていきます。
### 在庫管理
"InventoryExample"という名前のスプレッドシートファイルは、在庫内のアイテムをフォーマットしたスプレッドシートで、3つのワークシートが含まれています。タブには「Inventory List」、「Inventory Pick List」、「Bin Lookup」とラベル付けされています。Inventory Listワークシートの4行目はヘッダーで、ヘッダー列内の各セルの値を説明しています。
![Microsoft Excelの在庫リスト例からの数式のハイライト](../../../../2-Working-With-Data/06-non-relational/images/formula-excel.png)
セルが他のセルの値に依存して値を生成する場合があります。この在庫リストスプレッドシートでは、在庫内の各アイテムのコストを追跡していますが、在庫全体の価値を知りたい場合はどうすればよいでしょうか。[**数式**](https://support.microsoft.com/en-us/office/overview-of-formulas-34519a4e-1e8d-4f4b-84d4-d642c4f63263)はセルデータに対して操作を行い、この例では在庫の価値を計算するために使用されます。このスプレッドシートでは、Inventory Value列に数式を使用して、QTYヘッダーの下の数量とCOSTヘッダーの下のコストを掛け合わせて各アイテムの価値を計算しています。セルをダブルクリックまたはハイライトすると数式が表示されます。数式は等号=)で始まり、その後に計算や操作が続きます。
![Microsoft Excelの在庫リスト例からの関数のハイライト](../../../../2-Working-With-Data/06-non-relational/images/function-excel.png)
在庫価値のすべての値を合計して総価値を求める別の数式を使用することもできます。各セルを加算して合計を生成することもできますが、それは手間のかかる作業です。Excelには[**関数**](https://support.microsoft.com/en-us/office/sum-function-043e1c7d-7726-4e80-8f32-07b23e057f89)と呼ばれる、セル値に対して計算を行うための事前定義された数式があります。関数には引数が必要で、これは計算を行うために必要な値です。複数の引数が必要な場合、それらは特定の順序でリストされる必要があり、そうでないと関数が正しい値を計算できない場合があります。この例ではSUM関数を使用し、Inventory Valueの値を引数として使用して合計を生成し、B33行目、列Bにリストされています。
## NoSQL
NoSQLは、非リレーショナルデータを保存するさまざまな方法を指す包括的な用語であり、「非SQL」、「非リレーショナル」、または「SQLだけではない」と解釈されることがあります。このタイプのデータベースシステムは、4つのタイプに分類されます。
![キーと値のデータストアのグラフィカル表現。4つの一意の数値キーが4つの異なる値に関連付けられている](../../../../2-Working-With-Data/06-non-relational/images/kv-db.png)
> 出典: [Michał Białecki Blog](https://www.michalbialecki.com/2018/03/18/azure-cosmos-db-key-value-database-cloud/)
[キーと値](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#keyvalue-data-stores)のデータベースは、一意の識別子であるキーと値をペアにして保存します。これらのペアは、適切なハッシュ関数を使用した[ハッシュテーブル](https://www.hackerearth.com/practice/data-structures/hash-tables/basics-of-hash-tables/tutorial/)を使用して保存されます。
![グラフデータストアのグラフィカル表現。人々、興味、場所の関係を示している](../../../../2-Working-With-Data/06-non-relational/images/graph-db.png)
> 出典: [Microsoft](https://docs.microsoft.com/en-us/azure/cosmos-db/graph/graph-introduction#graph-database-by-example)
[グラフ](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#graph-data-stores)データベースはデータの関係を記述し、ードとエッジの集合として表されます。ードは、学生や銀行明細書など、現実世界に存在するエンティティを表します。エッジは2つのエンティティ間の関係を表します。各ードとエッジには、それぞれの追加情報を提供するプロパティがあります。
![カラム型データストアのグラフィカル表現。顧客データベースに「Identity」と「Contact Info」という2つのカラムファミリーがある](../../../../2-Working-With-Data/06-non-relational/images/columnar-db.png)
[カラム型](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#columnar-data-stores)データストアは、リレーショナルデータ構造のようにデータを列と行に整理しますが、各列はカラムファミリーと呼ばれるグループに分けられます。同じ列内のすべてのデータは関連しており、一つの単位として取得および変更することができます。
### Azure Cosmos DBを使ったドキュメントデータストア
[ドキュメント](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#document-data-stores)データストアは、キーと値のデータストアの概念を基に構築され、フィールドとオブジェクトの一連で構成されています。このセクションでは、Cosmos DBエミュレーターを使用してドキュメントデータベースを探ります。
Cosmos DBデータベースは「SQLだけではない」という定義に当てはまり、Cosmos DBのドキュメントデータベースはデータをクエリするためにSQLを使用します。[前回のレッスン](../05-relational-databases/README.md)ではSQLの基本を学びましたが、ここではドキュメントデータベースに同じクエリを適用することができます。Cosmos DBエミュレーターを使用すると、ローカルコンピュータ上でドキュメントデータベースを作成し、探索することができます。エミュレーターについての詳細は[こちら](https://docs.microsoft.com/en-us/azure/cosmos-db/local-emulator?tabs=ssl-netstd21)をご覧ください。
ドキュメントはフィールドとオブジェクト値の集合であり、フィールドはオブジェクト値が何を表しているかを説明します。以下はドキュメントの例です。
```json
{
"firstname": "Eva",
"age": 44,
"id": "8c74a315-aebf-4a16-bb38-2430a9896ce5",
"_rid": "bHwDAPQz8s0BAAAAAAAAAA==",
"_self": "dbs/bHwDAA==/colls/bHwDAPQz8s0=/docs/bHwDAPQz8s0BAAAAAAAAAA==/",
"_etag": "\"00000000-0000-0000-9f95-010a691e01d7\"",
"_attachments": "attachments/",
"_ts": 1630544034
}
```
このドキュメントで注目すべきフィールドは、`firstname`、`id`、`age`です。アンダースコア付きの他のフィールドはCosmos DBによって生成されました。
#### Cosmos DBエミュレーターを使ったデータの探索
エミュレーターは[Windows用はこちら](https://aka.ms/cosmosdb-emulator)からダウンロードしてインストールできます。macOSやLinuxでエミュレーターを実行する方法については、この[ドキュメント](https://docs.microsoft.com/en-us/azure/cosmos-db/local-emulator?tabs=ssl-netstd21#run-on-linux-macos)を参照してください。
エミュレーターを起動するとブラウザウィンドウが開き、Explorerビューでドキュメントを探索できます。
![Cosmos DBエミュレーターのExplorerビュー](../../../../2-Working-With-Data/06-non-relational/images/cosmosdb-emulator-explorer.png)
もし一緒に進めている場合は、「Start with Sample」をクリックしてSampleDBというサンプルデータベースを生成してください。SampleDBを展開すると、`Persons`というコンテナーが見つかります。コンテナーはアイテムのコレクションを保持しており、これがコンテナー内のドキュメントです。`Items`の下にある4つの個別のドキュメントを探索できます。
![Cosmos DBエミュレーターでサンプルデータを探索](../../../../2-Working-With-Data/06-non-relational/images/cosmosdb-emulator-persons.png)
#### Cosmos DBエミュレーターを使ったドキュメントデータのクエリ
新しいSQLクエリボタン左から2番目のボタンをクリックすると、サンプルデータにクエリを実行できます。
`SELECT * FROM c` はコンテナー内のすべてのドキュメントを返します。where句を追加して、40歳未満の人を見つけてみましょう。
`SELECT * FROM c where c.age < 40`
![Cosmos DBエミュレーターで40歳未満のドキュメントを見つけるためのSELECTクエリを実行](../../../../2-Working-With-Data/06-non-relational/images/cosmosdb-emulator-persons-query.png)
このクエリは2つのドキュメントを返します。それぞれのドキュメントのage値が40未満であることに注目してください。
#### JSONとドキュメント
JavaScript Object Notation (JSON) に詳しい方は、ドキュメントがJSONに似ていることに気付くでしょう。このディレクトリには`PersonsData.json`というファイルがあり、エミュレーターのPersonsコンテナーに`Upload Item`ボタンを使ってアップロードできます。
ほとんどの場合、JSONデータを返すAPIは、ドキュメントデータベースに直接転送して保存することができます。以下は別のドキュメントで、MicrosoftのTwitterアカウントから取得したツイートを表しています。このデータはTwitter APIを使用して取得され、その後Cosmos DBに挿入されました。
```json
{
"created_at": "2021-08-31T19:03:01.000Z",
"id": "1432780985872142341",
"text": "Blank slate. Like this tweet if youve ever painted in Microsoft Paint before. https://t.co/cFeEs8eOPK",
"_rid": "dhAmAIUsA4oHAAAAAAAAAA==",
"_self": "dbs/dhAmAA==/colls/dhAmAIUsA4o=/docs/dhAmAIUsA4oHAAAAAAAAAA==/",
"_etag": "\"00000000-0000-0000-9f84-a0958ad901d7\"",
"_attachments": "attachments/",
"_ts": 1630537000
```
このドキュメントで注目すべきフィールドは、`created_at`、`id`、`text`です。
## 🚀 チャレンジ
`TwitterData.json`というファイルをSampleDBデータベースにアップロードできます。これを別のコンテナーに追加することをお勧めします。以下の手順で行えます
1. 右上の新しいコンテナーボタンをクリック
1. 既存のデータベースSampleDBを選択し、コンテナーIDを作成
1. パーティションキーを`/id`に設定
1. OKをクリックこのビューの他の情報は無視して構いません。これはローカルマシンで実行される小さなデータセットです
1. 新しいコンテナーを開き、`Upload Item`ボタンでTwitter Dataファイルをアップロード
いくつかのSELECTクエリを実行して、textフィールドにMicrosoftが含まれているドキュメントを見つけてみてください。ヒント[LIKEキーワード](https://docs.microsoft.com/en-us/azure/cosmos-db/sql/sql-query-keywords#using-like-with-the--wildcard-character)を使用してみてください。
## [講義後クイズ](https://ff-quizzes.netlify.app/en/ds/quiz/11)
## 復習と自己学習
- このレッスンではカバーしていないスプレッドシートの追加のフォーマットや機能があります。MicrosoftはExcelに関する[豊富なドキュメントとビデオライブラリ](https://support.microsoft.com/excel)を提供していますので、さらに学びたい方はぜひご覧ください。
- 非リレーショナルデータの特性についての詳細は、このアーキテクチャドキュメントをご覧ください:[非リレーショナルデータとNoSQL](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data)
- Cosmos DBは、レッスンで紹介したさまざまなNoSQLタイプを保存できるクラウドベースの非リレーショナルデータベースです。この[Cosmos DB Microsoft Learnモジュール](https://docs.microsoft.com/en-us/learn/paths/work-with-nosql-data-in-azure-cosmos-db/)でこれらのタイプについてさらに学ぶことができます。
## 課題
[Soda Profits](assignment.md)
---
**免責事項**:
この文書は、AI翻訳サービス [Co-op Translator](https://github.com/Azure/co-op-translator) を使用して翻訳されています。正確性を期すよう努めておりますが、自動翻訳には誤りや不正確な表現が含まれる可能性があります。元の言語で記載された原文が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の利用に起因する誤解や誤認について、当方は一切の責任を負いません。