|
|
3 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 1 month ago | |
| 2-Working-With-Data | 1 month ago | |
| 3-Data-Visualization | 1 month ago | |
| 4-Data-Science-Lifecycle | 1 month ago | |
| 5-Data-Science-In-Cloud | 1 month ago | |
| 6-Data-Science-In-Wild | 1 month ago | |
| docs | 1 month ago | |
| examples | 1 month ago | |
| quiz-app | 1 month ago | |
| sketchnotes | 1 month ago | |
| .co-op-translator.json | 3 weeks ago | |
| AGENTS.md | 1 month ago | |
| CODE_OF_CONDUCT.md | 1 month ago | |
| CONTRIBUTING.md | 1 month ago | |
| INSTALLATION.md | 1 month ago | |
| README.md | 3 weeks ago | |
| SECURITY.md | 1 month ago | |
| SUPPORT.md | 1 month ago | |
| TROUBLESHOOTING.md | 1 month ago | |
| USAGE.md | 1 month ago | |
| for-teachers.md | 1 month ago | |
README.md
初心者のためのデータサイエンス - カリキュラム
MicrosoftのAzure Cloud Advocatesは、データサイエンスに関する10週間、20レッスンのカリキュラムを提供できることを嬉しく思います。各レッスンには、事前および事後のクイズ、レッスンを完了するための書面による指示、解答例、そして課題が含まれています。私たちのプロジェクトベースの教育法により、構築しながら学ぶことができ、新しいスキルが定着することが証明されています。
心から感謝を込めて、我々の著者たちへ: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 特別な感謝 🙏 をMicrosoft Student Ambassadorの著者、レビュアー、コンテンツ貢献者の皆様に。 特にAaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar 、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| 初心者のためのデータサイエンス - スケッチノート by @nitya |
🌐 多言語サポート
GitHub Actionを通じてサポート(自動&常に最新)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
ローカルでクローンしたいですか?
このリポジトリには50以上の言語訳が含まれており、ダウンロードサイズが大幅に大きくなります。翻訳なしでクローンするにはスパースチェックアウトを使用してください:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'これにより、コースの完了に必要なすべてを、ずっと速いダウンロードで入手できます。
追加の翻訳言語のサポートを希望される場合は、こちらをご覧ください。
コミュニティに参加しよう
Discordで現在進行中の「Learn with AI」シリーズをぜひご覧ください。2025年9月18日〜30日にLearn with AI Seriesで詳細を確認し、ご参加ください。GitHub Copilotを使ったデータサイエンスのヒントやコツを得られます。
あなたは学生ですか?
以下のリソースで始めましょう:
- 学生ハブページ このページでは初心者向けのリソース、学生向けパック、無料認定バウチャーの入手方法などを見つけられます。コンテンツは月に一度以上更新されるため、ブックマークして定期的にチェックすることをお勧めします。
- Microsoft Learn Student Ambassadors 学生アンバサダーのグローバルコミュニティに参加し、Microsoftへの道を開きましょう。
はじめに
📚 ドキュメント
- インストールガイド - 初心者向けの段階的セットアップ手順
- 使い方ガイド - 例と一般的なワークフロー
- トラブルシューティング - よくある問題の解決策
- コントリビューションガイド - このプロジェクトへの貢献方法
- 教師向け - 教授の指針と教室用リソース
👨🎓 学生の皆さんへ
完全初心者:データサイエンスに初めてですか?まずは初心者向けの例から始めましょう!わかりやすくコメントされたシンプルな例で、カリキュラム全体に入る前に基礎を理解できます。 学生向け:カリキュラムを自分で使う場合は、リポジトリをフォークし、講義前クイズから始めて自分で演習を完了してください。その後、講義を読み進めて残りの活動をやり遂げましょう。解答コードをコピーするのではなく、レッスン内容を理解してプロジェクトを作成することを目指してください。ただし、各プロジェクト指向のレッスンには/solutionsフォルダーにそのコードも用意されています。また、友達と勉強会を作って一緒に進めるのも良い方法です。さらに学びたい場合はMicrosoft Learnをお勧めします。
クイックスタート:
- 環境構築のためにインストールガイドを確認する
- カリキュラムの使い方を学ぶために使い方ガイドを読む
- レッスン1から順に進める
- サポートのためにDiscordコミュニティに参加する
👩🏫 教師の皆様へ
教師の方へ:このカリキュラムの活用法についていくつか提案を用意しています。ディスカッションフォーラムでフィードバックをお待ちしています!
チーム紹介
Gif提供 Mohit Jaisal
🎥 上の画像をクリックすると、このプロジェクトとそれを作った人たちについてのビデオをご覧いただけます!
教育方針
このカリキュラムを構築するにあたり、2つの教育理念を選択しました:プロジェクトベースであること、頻繁なクイズを含むことです。このシリーズの終わりまでに、学生はデータサイエンスの基本原則を学びます。これには倫理的概念、データ準備、データのいろいろな扱い方、データ可視化、データ分析、データサイエンスの実世界のユースケースなどが含まれます。
さらに、授業前の低負荷クイズは学生の学習意欲を高め、授業後のクイズは記憶の定着を確実にします。このカリキュラムは柔軟かつ楽しく設計されており、全てまたは一部を受講できます。プロジェクトは小さく始まり、10週間のサイクルの最後には徐々に複雑になります。
各レッスンには以下が含まれます:
- 任意のスケッチノート
- 任意の補足ビデオ
- 授業前ウォームアップクイズ
- テキストレッスン
- プロジェクトベースのレッスンの場合、プロジェクト作成のステップバイステップガイド
- 知識チェック
- チャレンジ
- 補足読書
- 課題
- 授業後クイズ
クイズについての注意:すべてのクイズはQuiz-Appフォルダー内にあり、合計40回の3問ずつのクイズがあります。レッスン内からリンクされていますが、クイズアプリはローカルで実行するかAzureに展開可能です。
quiz-appフォルダー内の指示に従ってください。順次ローカライズが進行中です。
🎓 初心者向け例
データサイエンスが初めてですか? 簡単でよくコメントが付いたコードのexamplesディレクトリを特別に作成しました:
- 🌟 Hello World - 最初のデータサイエンスプログラム
- 📂 データの読み込み - データセットを読み込み、探る方法を学ぶ
- 📊 簡単な分析 - 統計を計算しパターンを見つける
- 📈 基本的な可視化 - グラフやチャートを作成
- 🔬 実世界プロジェクト - 最初から最後までのワークフローを完遂
各例にはあらゆるステップを説明する詳細なコメントがあり、完全な初心者にも最適です!
👉 例から始める 👈
レッスン
![]() |
|---|
| Data Science For Beginners: ロードマップ - スケッチノート提供 @nitya |
| レッスン番号 | トピック | レッスングループ | 学習目標 | リンクされたレッスン | 著者 |
|---|---|---|---|---|---|
| 01 | データサイエンスの定義 | 紹介 | データサイエンスの基本概念とそれが人工知能、機械学習、ビッグデータにどう関連するかを学ぶ。 | レッスン 動画 | Dmitry |
| 02 | データサイエンスの倫理 | 紹介 | データ倫理の概念、課題、フレームワーク。 | レッスン | Nitya |
| 03 | データの定義 | 紹介 | データの分類方法と一般的なデータソース。 | レッスン | Jasmine |
| 04 | 統計学と確率の導入 | 紹介 | データ理解に用いる確率と統計の数学的手法。 | レッスン 動画 | Dmitry |
| 05 | リレーショナルデータの扱い | データの扱い | リレーショナルデータの紹介と、SQL(エスキューエルとも発音)を用いた探索と分析の基本。 | レッスン | Christopher |
| 06 | NoSQLデータの扱い | データの扱い | 非リレーショナルデータの紹介、様々なタイプとドキュメントデータベースの探索・分析の基本。 | レッスン | Jasmine |
| 07 | Pythonの扱い | データの扱い | Pandasなどのライブラリを用いたPythonによるデータ探索の基礎。Pythonプログラミングの基礎理解が推奨されます。 | レッスン 動画 | Dmitry |
| 08 | データ準備 | データの扱い | 欠損値、不正確または不完全なデータを処理するためのデータクレンジングおよび変換技術。 | レッスン | Jasmine |
| 09 | 量の可視化 | データ可視化 | Matplotlibを使って鳥のデータを可視化する方法を学ぶ 🦆 | レッスン | Jen |
| 10 | データの分布の可視化 | データ可視化 | 観測値と傾向を区間内で可視化する。 | レッスン | Jen |
| 11 | 比率の可視化 | データ可視化 | 離散およびグループ化されたパーセンテージを可視化する。 | レッスン | Jen |
| 12 | 関係の可視化 | データ可視化 | データセットや変数間のつながりや相関を可視化する。 | レッスン | Jen |
| 13 | 意味のある可視化 | データ可視化 | 効果的な問題解決と洞察のためにビジュアライゼーションを価値あるものにする技術と指針。 | レッスン | Jen |
| 14 | データサイエンスライフサイクル入門 | ライフサイクル | データサイエンスのライフサイクルと最初のステップであるデータ取得・抽出の紹介。 | レッスン | Jasmine |
| 15 | 分析 | ライフサイクル | データサイエンスライフサイクルのこのフェーズはデータ分析の技法に焦点を当てる。 | レッスン | Jasmine |
| 16 | コミュニケーション | ライフサイクル | データサイエンスライフサイクルのこのフェーズは、意思決定者が理解しやすいようにデータから得られた知見を提示することに注力する。 | レッスン | Jalen |
| 17 | クラウドにおけるデータサイエンス | クラウドデータ | クラウド上のデータサイエンスとその利点を紹介する一連のレッスン。 | レッスン | Tiffany と Maud |
| 18 | クラウドにおけるデータサイエンス | クラウドデータ | ローコードツールを用いたモデルのトレーニング。 | レッスン | Tiffany と Maud |
| 19 | クラウドにおけるデータサイエンス | クラウドデータ | Azure Machine Learning Studioによるモデルのデプロイ。 | レッスン | Tiffany と Maud |
| 20 | 現実世界でのデータサイエンス | 現実世界 | 現実世界でのデータサイエンス駆動のプロジェクト。 | レッスン | Nitya |
GitHub Codespaces
このサンプルをCodespaceで開く手順:
- Codeドロップダウンメニューをクリックし、「Open with Codespaces」を選択。
- パネル下部で「+ New codespace」を選択。 詳細はGitHubドキュメントをご参照ください。
VSCode Remote - Containers
VS Code Remote - Containers拡張機能を使い、ローカルマシンでこのリポジトリをコンテナ内で開く手順:
- 開発コンテナを初めて使う場合は、開始ドキュメントでシステム要件(Dockerインストールなど)を満たしていることを確認してください。
このリポジトリを使うには、隔離されたDockerボリューム内でリポジトリを開く方法があります:
注意:内部的にはRemote-Containersの「Clone Repository in Container Volume...」コマンドを使ってソースコードをローカルファイルシステムではなくDockerボリュームにクローンします。ボリュームはコンテナデータ保持に推奨される方法です。
またはローカルでクローンまたはダウンロードしたリポジトリを開く方法:
- このリポジトリをローカルにクローンする。
- F1キーを押し、「Remote-Containers: Open Folder in Container...」コマンドを選択。
- クローンしたフォルダーを選択し、コンテナ起動を待って操作を試みる。
オフラインアクセス
Docsifyを使い、このドキュメントをオフラインで閲覧可能です。このリポジトリをフォークし、ローカルマシンにDocsifyをインストールし、このリポジトリのルートフォルダーで docsify serve と入力してください。ウェブサイトはローカルホストの3000番ポートで提供されます:localhost:3000。
なお、ノートブックはDocsify経由では表示されません。ノートブック実行が必要な場合は、Pythonカーネルを動かしているVS Codeで別途実行してください。
その他のカリキュラム
私たちのチームは他のカリキュラムも作成しています!ぜひご覧ください:
LangChain
Azure / Edge / MCP / エージェント
生成AIシリーズ
コアラーニング
コパイロットシリーズ
ヘルプを得る
問題が発生していますか? 一般的な問題の解決策については、トラブルシューティングガイドを確認してください。
AIアプリの構築で行き詰まったり質問がある場合は、学習者や経験豊富な開発者と一緒にMCPに関するディスカッションに参加しましょう。質問が歓迎され、知識が自由に共有されるサポートコミュニティです。
製品のフィードバックや構築中のエラーがある場合は、以下をご利用ください。
免責事項:
本書類はAI翻訳サービス「Co-op Translator」(https://github.com/Azure/co-op-translator)を使用して翻訳されました。正確性には努めておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があります。原文が正式な情報源として優先されるべきです。重要な情報については、専門の人間による翻訳を推奨します。本翻訳の使用により生じたいかなる誤解や誤訳についても、一切の責任を負いかねますのでご了承ください。



