|
|
4 months ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 6 months ago | |
| 2-Working-With-Data | 4 months ago | |
| 3-Data-Visualization | 5 months ago | |
| 4-Data-Science-Lifecycle | 8 months ago | |
| 5-Data-Science-In-Cloud | 8 months ago | |
| 6-Data-Science-In-Wild | 8 months ago | |
| docs | 8 months ago | |
| examples | 7 months ago | |
| quiz-app | 8 months ago | |
| sketchnotes | 8 months ago | |
| AGENTS.md | 7 months ago | |
| CODE_OF_CONDUCT.md | 8 months ago | |
| CONTRIBUTING.md | 7 months ago | |
| INSTALLATION.md | 7 months ago | |
| README.md | 4 months ago | |
| SECURITY.md | 8 months ago | |
| SUPPORT.md | 8 months ago | |
| TROUBLESHOOTING.md | 7 months ago | |
| USAGE.md | 7 months ago | |
| for-teachers.md | 8 months ago | |
README.md
初心者のためのデータサイエンス - カリキュラム
MicrosoftのAzure Cloud Advocatesは、データサイエンスに関する10週間、20レッスンのカリキュラムを提供できることを嬉しく思います。各レッスンには、事前および事後のクイズ、レッスンを完了するための書面による指示、解答例、課題が含まれています。プロジェクトベースの教育法により、構築しながら学ぶことができ、新しいスキルが定着することが証明されています。
著者の皆様に心から感謝します: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 特別な感謝 🙏 をMicrosoft Student Ambassadorの著者、レビュアー、コンテンツ貢献者の皆様に、 特にAaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| 初心者のためのデータサイエンス - スケッチノート by @nitya |
🌐 多言語サポート
GitHub Actionによるサポート(自動かつ常に最新)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
追加の翻訳言語をご希望の場合は、こちらにリストされています。
コミュニティに参加しよう
DiscordでAIと学ぶシリーズを開催中です。詳細と参加はLearn with AI Seriesから、2025年9月18日~30日まで。GitHub Copilotを使ったデータサイエンスのヒントやコツが得られます。
学生ですか?
以下のリソースから始めましょう:
- Student Hubページ このページでは、初心者向けリソース、学生パック、無料認定バウチャーの取得方法などが見つかります。コンテンツは少なくとも月に一度更新されるので、ブックマークして時々チェックすることをお勧めします。
- Microsoft Learn Student Ambassadors グローバルな学生アンバサダーコミュニティに参加しましょう。これがMicrosoftへの道になるかもしれません。
はじめに
📚 ドキュメント
- インストールガイド - 初心者向けのステップバイステップセットアップ手順
- 使用ガイド - 例と一般的なワークフロー
- トラブルシューティング - よくある問題の解決策
- 貢献ガイド - このプロジェクトへの貢献方法
- 教師向け - 教育指導と教室用リソース
👨🎓 学生向け
完全な初心者: データサイエンスが初めてですか?初心者向けの例から始めましょう!これらのシンプルでコメント付きの例は、カリキュラム全体に入る前に基本を理解するのに役立ちます。 学生: このカリキュラムを自分で使うには、リポジトリ全体をフォークし、事前講義クイズから始めて演習を自分で完了してください。その後、講義を読み、残りの活動を完了します。解答コードをコピーするのではなく、レッスンを理解してプロジェクトを作成することを試みてください。ただし、そのコードは各プロジェクト指向のレッスンの/solutionsフォルダーにあります。別の方法として、友達と勉強グループを作り、一緒に内容を進めるのも良いでしょう。さらなる学習にはMicrosoft Learnをお勧めします。
クイックスタート:
- 環境設定のためにインストールガイドを確認
- カリキュラムの使い方を学ぶために使用ガイドを確認
- レッスン1から順に進める
- サポートのためにDiscordコミュニティに参加
👩🏫 教師向け
教師の皆様: このカリキュラムの使い方についていくつかの提案を含めています。ぜひディスカッションフォーラムでフィードバックをお寄せください!
チーム紹介
Gif提供 Mohit Jaisal
🎥 上の画像をクリックすると、このプロジェクトとそれを作成した人々に関するビデオをご覧いただけます!
教育方針
このカリキュラムを構築するにあたり、私たちは2つの教育的信条を選びました:プロジェクトベースであること、そして頻繁なクイズを含むことです。このシリーズの終わりまでに、学生は倫理的概念、データ準備、データのさまざまな扱い方、データ可視化、データ分析、データサイエンスの実世界のユースケースなど、データサイエンスの基本原則を学びます。
さらに、授業前の低リスクなクイズは学生の学習意欲を高め、授業後の2回目のクイズは理解の定着を促します。このカリキュラムは柔軟で楽しく、全体または一部だけを受講することができます。プロジェクトは小さく始まり、10週間のサイクルの終わりには徐々に複雑になります。
各レッスンには以下が含まれます:
- 任意のスケッチノート
- 任意の補足ビデオ
- 授業前ウォームアップクイズ
- 書かれたレッスン
- プロジェクトベースのレッスンには、プロジェクトの作成手順ガイド
- 知識チェック
- チャレンジ
- 補足読書
- 課題
- 授業後クイズ
クイズについての注意:すべてのクイズはQuiz-Appフォルダーにあり、合計40回のクイズがそれぞれ3問ずつ含まれています。レッスン内からリンクされていますが、クイズアプリはローカルで実行したりAzureにデプロイしたりできます。
quiz-appフォルダーの指示に従ってください。徐々にローカライズされています。
🎓 初心者向けの例
データサイエンスが初めてですか? 簡単でコメント付きのコードを集めた特別なexamplesディレクトリを作成しました:
- 🌟 Hello World - あなたの最初のデータサイエンスプログラム
- 📂 データの読み込み - データセットの読み込みと探索を学ぶ
- 📊 簡単な分析 - 統計を計算しパターンを見つける
- 📈 基本的な可視化 - チャートやグラフを作成する
- 🔬 実世界のプロジェクト - 最初から最後までの完全なワークフロー
各例にはすべてのステップを説明する詳細なコメントが含まれており、完全な初心者に最適です!
👉 例から始める 👈
レッスン
![]() |
|---|
| 初心者のためのデータサイエンス:ロードマップ - @nityaによるスケッチノート |
| レッスン番号 | トピック | レッスングループ | 学習目標 | リンクされたレッスン | 著者 |
|---|---|---|---|---|---|
| 01 | データサイエンスの定義 | イントロダクション | データサイエンスの基本概念と、それが人工知能、機械学習、ビッグデータとどのように関連しているかを学ぶ。 | レッスン ビデオ | Dmitry |
| 02 | データサイエンス倫理 | イントロダクション | データ倫理の概念、課題、フレームワーク。 | レッスン | Nitya |
| 03 | データの定義 | イントロダクション | データの分類方法と一般的なソース。 | レッスン | Jasmine |
| 04 | 統計学と確率の入門 | イントロダクション | データを理解するための確率と統計の数学的手法。 | レッスン ビデオ | Dmitry |
| 05 | リレーショナルデータの扱い方 | データの扱い方 | リレーショナルデータの紹介と、構造化クエリ言語(SQL)を使ったリレーショナルデータの探索と分析の基本。 | レッスン | Christopher |
| 06 | NoSQLデータの扱い方 | データの扱い方 | 非リレーショナルデータの紹介、その種類、ドキュメントデータベースの探索と分析の基本。 | レッスン | Jasmine |
| 07 | Pythonの扱い方 | データの扱い方 | Pandasなどのライブラリを使ったデータ探索のPythonの基本。Pythonプログラミングの基礎知識が推奨されます。 | レッスン ビデオ | Dmitry |
| 08 | データ準備 | データの扱い方 | 欠損、不正確、または不完全なデータの課題に対処するためのデータのクリーニングと変換の技術。 | レッスン | Jasmine |
| 09 | 量の可視化 | データ可視化 | Matplotlibを使って鳥のデータを可視化する方法を学ぶ 🦆 | レッスン | Jen |
| 10 | データ分布の可視化 | データ可視化 | 観測値と傾向を区間内で可視化する。 | レッスン | Jen |
| 11 | 割合の可視化 | データ可視化 | 離散的およびグループ化されたパーセンテージの可視化。 | レッスン | Jen |
| 12 | 関係性の可視化 | データ可視化 | データセットとその変数間の接続や相関の可視化。 | レッスン | Jen |
| 13 | 意味のある可視化 | データ可視化 | 効果的な問題解決と洞察のために可視化を価値あるものにする技術と指針。 | レッスン | Jen |
| 14 | データサイエンスライフサイクルの紹介 | ライフサイクル | データサイエンスライフサイクルの紹介と、最初のステップであるデータの取得と抽出。 | レッスン | Jasmine |
| 15 | 分析 | ライフサイクル | データサイエンスライフサイクルのこの段階は、データを分析する技術に焦点を当てる。 | レッスン | Jasmine |
| 16 | コミュニケーション | ライフサイクル | データサイエンスライフサイクルのこの段階は、意思決定者が理解しやすい形でデータからの洞察を提示することに焦点を当てる。 | レッスン | Jalen |
| 17 | クラウドにおけるデータサイエンス | クラウドデータ | クラウドにおけるデータサイエンスとその利点を紹介する一連のレッスン。 | レッスン | Tiffany と Maud |
| 18 | クラウドにおけるデータサイエンス | クラウドデータ | ローコードツールを使ったモデルのトレーニング。 | レッスン | Tiffany と Maud |
| 19 | クラウドにおけるデータサイエンス | クラウドデータ | Azure Machine Learning Studioを使ったモデルのデプロイ。 | レッスン | Tiffany と Maud |
| 20 | 実世界のデータサイエンス | 実世界 | 実世界でのデータサイエンス駆動プロジェクト。 | レッスン | Nitya |
GitHub Codespaces
このサンプルをCodespaceで開くには、以下の手順に従ってください:
- Codeのドロップダウンメニューをクリックし、「Open with Codespaces」オプションを選択します。
- ペインの下部で「+ New codespace」を選択します。 詳細はGitHubドキュメントをご覧ください。
VSCode Remote - Containers
ローカルマシンとVSCodeのVS Code Remote - Containers拡張機能を使って、このリポジトリをコンテナ内で開くには、以下の手順に従ってください:
- 開発コンテナを初めて使う場合は、はじめにのドキュメントでシステム要件(Dockerのインストールなど)を満たしていることを確認してください。
このリポジトリを使うには、リポジトリを隔離されたDockerボリューム内で開くか:
注意:内部的には、Remote-Containersの「Clone Repository in Container Volume...」コマンドを使い、ソースコードをローカルファイルシステムではなくDockerボリュームにクローンします。ボリュームはコンテナデータの永続化に推奨される方法です。
または、ローカルにクローンまたはダウンロードしたリポジトリを開くこともできます:
- このリポジトリをローカルファイルシステムにクローンします。
- F1キーを押して「Remote-Containers: Open Folder in Container...」コマンドを選択します。
- このフォルダーのクローンコピーを選択し、コンテナの起動を待ってから試してください。
オフラインアクセス
Docsifyを使って、このドキュメントをオフラインで実行できます。このリポジトリをフォークし、ローカルマシンにDocsifyをインストールしてから、このリポジトリのルートフォルダーで docsify serve と入力してください。ウェブサイトはローカルホストのポート3000で提供されます:localhost:3000。
注意:ノートブックはDocsifyではレンダリングされないため、ノートブックを実行する必要がある場合は、Pythonカーネルを実行しているVS Codeで別途行ってください。
その他のカリキュラム
私たちのチームは他のカリキュラムも制作しています!ぜひご覧ください:
LangChain
Azure / Edge / MCP / Agents
ジェネレーティブAIシリーズ
コアラーニング
コパイロットシリーズ
ヘルプを得る
問題が発生しましたか? よくある問題の解決策については、トラブルシューティングガイドをご覧ください。
AIアプリの構築で行き詰まったり質問がある場合は、MCPに関する議論に参加してください。質問が歓迎され、知識が自由に共有されるサポートコミュニティです。
製品のフィードバックや構築中のエラーがある場合は、以下をご利用ください:
免責事項:
本書類はAI翻訳サービス「Co-op Translator」(https://github.com/Azure/co-op-translator)を使用して翻訳されました。正確性の向上に努めておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があります。原文の言語によるオリジナル文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。本翻訳の利用により生じた誤解や誤訳について、当方は一切の責任を負いかねます。



