|
|
5 days ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 5 days ago | |
| 2-Working-With-Data | 5 days ago | |
| 3-Data-Visualization | 5 days ago | |
| 4-Data-Science-Lifecycle | 5 days ago | |
| 5-Data-Science-In-Cloud | 5 days ago | |
| 6-Data-Science-In-Wild | 5 days ago | |
| docs | 1 month ago | |
| examples | 1 month ago | |
| quiz-app | 1 month ago | |
| sketchnotes | 5 days ago | |
| .co-op-translator.json | 5 days ago | |
| AGENTS.md | 1 month ago | |
| CODE_OF_CONDUCT.md | 1 month ago | |
| CONTRIBUTING.md | 1 month ago | |
| INSTALLATION.md | 1 month ago | |
| README.md | 5 days ago | |
| SECURITY.md | 1 month ago | |
| SUPPORT.md | 1 month ago | |
| TROUBLESHOOTING.md | 1 month ago | |
| USAGE.md | 1 month ago | |
| for-teachers.md | 1 month ago | |
README.md
初心者のためのデータサイエンス - カリキュラム
MicrosoftのAzure Cloud Advocatesは、データサイエンスに関する全20レッスン・10週間のカリキュラムを提供できることを嬉しく思います。各レッスンには、事前テストおよび事後テスト、レッスンを完了するための書面による指示、ソリューション、および課題が含まれています。プロジェクトベースの教育法により、実際に作りながら学ぶことで、新しいスキルが定着することが証明されています。
執筆者の皆様に心から感謝いたします: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 特別感謝 🙏 Microsoft Student Ambassador の著者、レビュアー、コンテンツ寄稿者の皆様へ、 特に Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| 初心者のためのデータサイエンス - @nityaによるスケッチノート |
🌐 多言語サポート
GitHub Actionsによるサポート(自動&常に最新)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
ローカルにクローンしたい場合は?
このリポジトリには50以上の言語翻訳が含まれているため、ダウンロードサイズが大幅に増加します。翻訳なしでクローンするにはスパースチェックアウトを使用してください:
Bash / macOS / Linux:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'CMD(Windows):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"これでコースを完了するために必要なものをすべて、より高速にダウンロードできます。
追加の翻訳言語のサポートをご希望の場合は、こちらをご覧ください。
コミュニティに参加しましょう
DiscordにてAIシリーズの学習を継続中です。2025年9月18日~30日に Learn with AI Series に参加して詳細を学び、GitHub Copilotをデータサイエンスで使うヒントやコツを取得しましょう。
学生ですか?
以下のリソースから始めましょう:
- Student Hubページ このページでは、初心者向けリソース、学生パック、無料認定バウチャー獲得方法などを見つけることができます。コンテンツは少なくとも月に一度更新されるので、ぜひブックマークして時々チェックしてください。
- Microsoft Learn Student Ambassadors 学生アンバサダーのグローバルコミュニティに参加できます。これがMicrosoftへの道になるかもしれません。
はじめに
📚 ドキュメント
- インストールガイド - 初心者向けのステップバイステップセットアップ手順
- 使用方法ガイド - 例と一般的なワークフロー
- トラブルシューティング - よくある問題の解決法
- 貢献ガイド - このプロジェクトへの貢献方法
- 教師向け - 指導ガイダンスと教室用リソース
👨🎓 学生向け
完全な初心者の方へ: データサイエンスが初めてですか?初心者向けの例から始めましょう!これらのシンプルでよくコメントされた例は、カリキュラムに入る前に基本を理解するのに役立ちます。 学生の方へ: このカリキュラムを自分で使うには、リポジトリ全体をフォークして演習を自分で進めてください。事前講義のクイズから始め、講義を読み、残りのアクティビティを完了します。ソリューションコードをコピーするよりも、レッスンを理解しながらプロジェクトを作成することをお勧めします。ただし、各プロジェクト指向レッスンの /solutions フォルダーにはそのコードが用意されています。また、友達と勉強グループを作り、一緒に内容を学ぶのも良いでしょう。より詳しく学びたい場合は、Microsoft Learnをお勧めします。
クイックスタート:
- 環境設定のためにインストールガイドを確認
- カリキュラムの使い方を学ぶために使用方法ガイドをレビュー
- レッスン1から順に進める
- サポートが必要ならDiscordコミュニティに参加
👩🏫 教師向け
先生方へ: このカリキュラムの使い方についていくつかの提案を含めています。ぜひ私たちのディスカッションフォーラムでフィードバックをお寄せください!
チーム紹介
Gif作成 Mohit Jaisal
🎥 プロジェクトと作成者に関する動画は上の画像をクリックしてください!
教育方針
このカリキュラムを構築する際に、私たちは2つの教育原則を選びました:プロジェクトベースであることと、頻繁なクイズを含むことです。このシリーズを終える頃には、学生は倫理的な概念、データ準備、さまざまなデータ操作方法、データ可視化、データ分析、データサイエンスの現実世界のユースケースなど、データサイエンスの基本原則を学んでいます。
加えて、授業前の低負荷クイズは学生のトピック学習への意欲を高め、授業後の二回目のクイズが記憶の定着を保証します。このカリキュラムは柔軟で楽しく取り組めるよう設計されており、全てまたは一部だけを学ぶことも可能です。プロジェクトは小さく始まり、10週間のサイクル終盤には次第に複雑になります。
各レッスンには以下が含まれます:
- 任意のスケッチノート
- 任意の補足動画
- 授業前のウォームアップクイズ
- 書かれたレッスン
- プロジェクトベースのレッスンには、プロジェクト構築のステップバイステップガイド
- 知識チェック
- チャレンジ
- 補足読書
- 課題
- 授業後のクイズ
クイズについての注意: 全てのクイズはQuiz-Appフォルダーにあり、各クイズは3問で合計40個あります。レッスン内からリンクされていますが、クイズアプリはローカルで実行したりAzureにデプロイ可能です。
quiz-appフォルダーの指示に従ってください。現在、徐々に多言語化が進んでいます。
🎓 初心者向けの例
データサイエンスが初めてですか? シンプルでよくコメントされたコードを備えた特別なexamplesディレクトリを用意しています:
- 🌟 Hello World - 最初のデータサイエンスプログラム
- 📂 データの読み込み - データセットの読み取りと探索を学ぶ
- 📊 簡単な分析 - 統計を計算しパターンを見つける
- 📈 基本的な可視化 - チャートやグラフを作成
- 🔬 現実世界のプロジェクト - はじめから終わりまでの完全なワークフロー
各例には詳細なコメントが含まれており、初学者に適しています!
👉 例から始める 👈
レッスン
![]() |
|---|
| データサイエンス入門: ロードマップ - スケッチノート @nityaによる |
| レッスン番号 | トピック | レッスングループ | 学習目標 | リンクされたレッスン | 著者 |
|---|---|---|---|---|---|
| 01 | データサイエンスの定義 | イントロダクション | データサイエンスの基本概念、その人工知能、機械学習、ビッグデータとの関係を学ぶ。 | レッスン 動画 | Dmitry |
| 02 | データサイエンス倫理 | イントロダクション | データ倫理の概念、課題とフレームワーク。 | レッスン | Nitya |
| 03 | データの定義 | イントロダクション | データの分類と一般的なソース。 | レッスン | Jasmine |
| 04 | 統計と確率の紹介 | イントロダクション | データ理解のための確率論と統計学の数学的手法。 | レッスン 動画 | Dmitry |
| 05 | リレーショナルデータの取り扱い | データ操作 | リレーショナルデータ入門と、SQL(シークエル)の基本的な探索・分析方法。 | レッスン | Christopher |
| 06 | NoSQLデータの取り扱い | データ操作 | 非リレーショナルデータの種類とドキュメントデータベースの探索・分析入門。 | レッスン | Jasmine |
| 07 | Pythonの利用 | データ操作 | Pandasなどのライブラリを使ったPythonでのデータ探索の基礎。Pythonプログラミングの基礎理解を推奨。 | レッスン 動画 | Dmitry |
| 08 | データ準備 | データ操作 | 欠損、不正確、未完成のデータの課題に対処するためのデータクリーニングや変換技術。 | レッスン | Jasmine |
| 09 | 量の可視化 | データ可視化 | Matplotlibを使って鳥のデータを可視化する方法 🦆 | レッスン | Jen |
| 10 | データの分布の可視化 | データ可視化 | 観察や傾向を区間内で可視化する方法。 | レッスン | Jen |
| 11 | 比率の可視化 | データ可視化 | 離散的およびグループ化されたパーセンテージの可視化。 | レッスン | Jen |
| 12 | 関係性の可視化 | データ可視化 | データセットと変数間の接続や相関の可視化。 | レッスン | Jen |
| 13 | 意味のある可視化 | データ可視化 | 効果的な問題解決と洞察のために可視化を価値あるものにする技術と指針。 | レッスン | Jen |
| 14 | データサイエンスライフサイクルの紹介 | ライフサイクル | データサイエンスライフサイクルの紹介と最初のステップであるデータの取得と抽出。 | レッスン | Jasmine |
| 15 | 分析 | ライフサイクル | データサイエンスライフサイクルにおけるデータ分析の技法に焦点を当てるフェーズ。 | レッスン | Jasmine |
| 16 | コミュニケーション | ライフサイクル | データサイエンスライフサイクルにおけるデータの洞察を意思決定者が理解しやすく伝えるフェーズ。 | レッスン | Jalen |
| 17 | クラウド上のデータサイエンス | クラウドデータ | クラウド上のデータサイエンスとその利点を紹介するシリーズ。 | レッスン | Tiffany と Maud |
| 18 | クラウド上のデータサイエンス | クラウドデータ | ローコードツールによるモデル学習。 | レッスン | Tiffany と Maud |
| 19 | クラウド上のデータサイエンス | クラウドデータ | Azure Machine Learning Studioによるモデルのデプロイ。 | レッスン | Tiffany と Maud |
| 20 | 実地のデータサイエンス | 現場 | 現実世界でのデータサイエンス駆動型プロジェクト。 | レッスン | Nitya |
GitHub Codespaces
このサンプルをCodespaceで開くには、以下の手順に従ってください:
- Codeドロップダウンメニューをクリックし、Open with Codespacesオプションを選択します。
- ペインの下部で+ New codespaceを選択します。 詳細はGitHubドキュメントを参照してください。
VSCode Remote - コンテナ
ローカルマシンでVSCodeのRemote - Containers拡張機能を使い、このリポジトリをコンテナ内で開く手順:
- 開発用コンテナを初めて使う場合は、はじめにのドキュメントでシステム要件(Dockerのインストールなど)を確認してください。
このリポジトリを使うには、リポジトリを分離されたDockerボリューム内に開けます:
注記: 内部的には、Remote-Containersの Clone Repository in Container Volume... コマンドを使い、ローカルファイルシステムの代わりにDockerボリュームにソースコードをクローンします。データ永続化にはボリュームが推奨されています。
または、ローカルにクローンまたはダウンロードしたリポジトリを開く:
- このリポジトリをローカルファイルシステムにクローンする。
- F1を押して Remote-Containers: Open Folder in Container... コマンドを選択。
- このフォルダーのクローンコピーを選択し、コンテナ起動を待って試してください。
オフラインアクセス
Docsifyを使ってこのドキュメントをオフラインで実行できます。このリポジトリをフォークし、ローカルマシンにDocsifyをインストール後、このリポジトリのルートフォルダでdocsify serveを実行してください。Webサイトはローカルホストのポート3000、すなわち localhost:3000 で提供されます。
ノートブックはDocsifyではレンダリングされませんので、ノートブックを実行する必要がある場合は別途VS CodeでPythonカーネルを使って実行してください。
その他のカリキュラム
当チームは他のカリキュラムも制作しています!ぜひご覧ください:
LangChain
Azure / Edge / MCP / エージェント
生成AIシリーズ
コア学習
コパイロットシリーズ
ヘルプを得る
問題が発生しましたか? よくある問題の解決策については、トラブルシューティングガイドを確認してください。
AIアプリの構築で行き詰まったり質問がある場合は、仲間の学習者や経験豊富な開発者とMCPについての議論に参加しましょう。質問が歓迎され、知識が自由に共有されるサポートコミュニティです。
製品のフィードバックや構築中のエラーについては、以下をご利用ください:
免責事項:
本書類はAI翻訳サービス「Co-op Translator」(https://github.com/Azure/co-op-translator)を使用して翻訳されています。正確性の向上に努めておりますが、自動翻訳には誤りや不正確な箇所が含まれる可能性があります。原文の言語による原本を正式な情報源としてご参照ください。重要な情報については、専門の翻訳者による翻訳を推奨いたします。本翻訳の利用により生じた誤解や誤訳について、当方は一切の責任を負いかねます。



