21 KiB
初心者のためのデータサイエンス - カリキュラム
Azure Cloud Advocates at Microsoftは、データサイエンスに関する10週間、20レッスンのカリキュラムを提供しています。各レッスンには、事前・事後のクイズ、レッスンを完了するための手順書、解答例、課題が含まれています。このプロジェクトベースの教育法により、学びながら構築することで、新しいスキルを効果的に身につけることができます。
著者の皆さんに感謝します: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 特別な感謝 🙏 を以下のMicrosoft Student Ambassadorの著者、レビューアー、コンテンツ貢献者の皆さんに: 特に Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar, Vidushi Gupta, Jasleen Sondhi
![]() |
---|
初心者のためのデータサイエンス - @nityaによるスケッチノート |
🌐 多言語対応
GitHub Actionによるサポート (自動化 & 常に最新)
フランス語 | スペイン語 | ドイツ語 | ロシア語 | アラビア語 | ペルシャ語 (ファルシ) | ウルドゥー語 | 中国語 (簡体字) | 中国語 (繁体字, マカオ) | 中国語 (繁体字, 香港) | 中国語 (繁体字, 台湾) | 日本語 | 韓国語 | ヒンディー語 | ベンガル語 | マラーティー語 | ネパール語 | パンジャブ語 (グルムキー) | ポルトガル語 (ポルトガル) | ポルトガル語 (ブラジル) | イタリア語 | ポーランド語 | トルコ語 | ギリシャ語 | タイ語 | スウェーデン語 | デンマーク語 | ノルウェー語 | フィンランド語 | オランダ語 | ヘブライ語 | ベトナム語 | インドネシア語 | マレー語 | タガログ語 (フィリピン語) | スワヒリ語 | ハンガリー語 | チェコ語 | スロバキア語 | ルーマニア語 | ブルガリア語 | セルビア語 (キリル文字) | クロアチア語 | スロベニア語 | ウクライナ語 | ビルマ語 (ミャンマー)
追加の翻訳を希望する場合は、こちらにサポートされている言語が記載されています。
コミュニティに参加する
学生の皆さんへ
以下のリソースから始めてください:
- Student Hubページ このページでは、初心者向けリソース、学生向けパック、さらには無料の認定試験バウチャーを取得する方法が見つかります。このページはブックマークして、月ごとに更新されるコンテンツをチェックしてください。
- Microsoft Learn Student Ambassadors グローバルな学生アンバサダーコミュニティに参加しましょう。これがMicrosoftへの道になるかもしれません。
始めましょう
教師の皆さん: このカリキュラムの使用方法についていくつかの提案を含めています。ぜひディスカッションフォーラムでフィードバックをお寄せください!
学生の皆さん: このカリキュラムを自分で使用するには、リポジトリ全体をフォークして、事前クイズから始めて演習を完了してください。その後、講義を読み、残りのアクティビティを完了します。解答コードをコピーするのではなく、レッスンを理解しながらプロジェクトを作成するようにしてください。ただし、解答コードは各プロジェクト指向のレッスンの/solutionsフォルダーにあります。また、友達と勉強グループを作り、一緒にコンテンツを進めるのも良いアイデアです。さらに学びたい場合は、Microsoft Learnをお勧めします。
チーム紹介
Gif作成者: Mohit Jaisal
🎥 上の画像をクリックして、このプロジェクトとそれを作成した人々についてのビデオをご覧ください!
教育方針
このカリキュラムを構築する際、私たちは2つの教育的信条を選びました。それは、プロジェクトベースであることと、頻繁にクイズを含むことです。このシリーズの終わりまでに、学生はデータサイエンスの基本原則(倫理的概念、データ準備、データの操作方法、データの可視化、データ分析、データサイエンスの実世界での使用例など)を学ぶことができます。
さらに、授業前の低リスクなクイズは、学生がトピックを学ぶ意図を設定し、授業後のクイズはさらなる記憶定着を確保します。このカリキュラムは柔軟で楽しいものとして設計されており、全体または部分的に受講することができます。プロジェクトは小さなものから始まり、10週間のサイクルの終わりには徐々に複雑になっていきます。
私たちの行動規範、貢献ガイドライン、翻訳ガイドラインをご覧ください。皆様からの建設的なフィードバックをお待ちしています!
各レッスンに含まれる内容:
- スケッチノート(任意)
- 補足動画(任意)
- レッスン前のウォームアップクイズ
- 書き起こしレッスン
- プロジェクトベースのレッスンでは、プロジェクト構築のステップバイステップガイド
- 知識チェック
- チャレンジ
- 補足読書
- 課題
- レッスン後のクイズ
クイズについての注意: すべてのクイズはQuiz-Appフォルダーに含まれており、合計40個のクイズがあり、それぞれ3つの質問が含まれています。これらはレッスン内からリンクされていますが、クイズアプリはローカルで実行することもAzureにデプロイすることもできます。
quiz-app
フォルダー内の指示に従ってください。現在、段階的にローカライズが進められています。
レッスン
![]() |
---|
初心者向けデータサイエンス: ロードマップ - スケッチノート by @nitya |
レッスン番号 | トピック | レッスングループ | 学習目標 | リンクされたレッスン | 著者 |
---|---|---|---|---|---|
01 | データサイエンスの定義 | イントロダクション | データサイエンスの基本概念と、それが人工知能、機械学習、ビッグデータとどのように関連しているかを学ぶ。 | レッスン 動画 | Dmitry |
02 | データサイエンス倫理 | イントロダクション | データ倫理の概念、課題、フレームワーク。 | レッスン | Nitya |
03 | データの定義 | イントロダクション | データの分類方法とその一般的なソース。 | レッスン | Jasmine |
04 | 統計と確率のイントロダクション | イントロダクション | データを理解するための確率と統計の数学的手法。 | レッスン 動画 | Dmitry |
05 | リレーショナルデータの操作 | データ操作 | リレーショナルデータの紹介と、SQL(「シークエル」と発音される)として知られる構造化クエリ言語を使用したリレーショナルデータの探索と分析の基本。 | レッスン | Christopher |
06 | NoSQLデータの操作 | データ操作 | 非リレーショナルデータの紹介、そのさまざまな種類、およびドキュメントデータベースの探索と分析の基本。 | レッスン | Jasmine |
07 | Pythonの操作 | データ操作 | Pandasなどのライブラリを使用したデータ探索のためのPythonの基本。Pythonプログラミングの基礎的な理解が推奨されます。 | レッスン 動画 | Dmitry |
08 | データ準備 | データ操作 | 欠損、不正確、不完全なデータの課題に対処するためのデータクリーニングと変換技術に関するトピック。 | レッスン | Jasmine |
09 | 数量の可視化 | データ可視化 | Matplotlibを使用して鳥のデータを可視化する方法を学ぶ 🦆 | レッスン | Jen |
10 | データ分布の可視化 | データ可視化 | 区間内の観察と傾向を可視化する。 | レッスン | Jen |
11 | 比率の可視化 | データ可視化 | 離散的およびグループ化された割合を可視化する。 | レッスン | Jen |
12 | 関係性の可視化 | データ可視化 | データセットとその変数間の接続と相関を可視化する。 | レッスン | Jen |
13 | 意味のある可視化 | データ可視化 | 問題解決と洞察を効果的にするための価値ある可視化を作成するための技術とガイダンス。 | レッスン | Jen |
14 | データサイエンスライフサイクルのイントロダクション | ライフサイクル | データサイエンスライフサイクルの紹介とその最初のステップであるデータの取得と抽出。 | レッスン | Jasmine |
15 | 分析 | ライフサイクル | データサイエンスライフサイクルのこのフェーズでは、データを分析するための技術に焦点を当てる。 | レッスン | Jasmine |
16 | コミュニケーション | ライフサイクル | データサイエンスライフサイクルのこのフェーズでは、意思決定者が理解しやすい形でデータから得られた洞察を提示することに焦点を当てる。 | レッスン | Jalen |
17 | クラウドでのデータサイエンス | クラウドデータ | クラウドでのデータサイエンスとその利点を紹介する一連のレッスン。 | レッスン | Tiffany and Maud |
18 | クラウドでのデータサイエンス | クラウドデータ | ローコードツールを使用したモデルのトレーニング。 | レッスン | Tiffany and Maud |
19 | クラウドでのデータサイエンス | クラウドデータ | Azure Machine Learning Studioを使用したモデルのデプロイ。 | レッスン | Tiffany and Maud |
20 | 実世界でのデータサイエンス | 実世界 | 実世界でのデータサイエンス駆動型プロジェクト。 | レッスン | Nitya |
GitHub Codespaces
Codespaceでこのサンプルを開く手順:
- Codeドロップダウンメニューをクリックし、Open with Codespacesオプションを選択します。
- ペインの下部にある+ New codespaceを選択します。 詳細については、GitHubのドキュメントをご覧ください。
VSCode Remote - Containers
VSCodeのRemote - Containers拡張機能を使用して、ローカルマシンでこのリポジトリをコンテナ内で開く手順:
- 開発コンテナを初めて使用する場合は、開始ガイドでシステムが必要条件を満たしていることを確認してください(例: Dockerがインストールされていること)。
このリポジトリを使用するには、以下のいずれかの方法を選択してください:
注意: 内部的には、Remote-Containers: Clone Repository in Container Volume... コマンドを使用して、ソースコードをローカルファイルシステムではなくDockerボリュームにクローンします。ボリュームはコンテナデータを永続化するための推奨メカニズムです。
または、ローカルにクローンまたはダウンロードしたリポジトリを開く:
- このリポジトリをローカルファイルシステムにクローンします。
- F1キーを押して、Remote-Containers: Open Folder in Container... コマンドを選択します。
- クローンしたフォルダーを選択し、コンテナが起動するのを待って試してみてください。
オフラインアクセス
Docsifyを使用して、このドキュメントをオフラインで実行できます。このリポジトリをフォークし、Docsifyをインストールしてローカルマシンにセットアップした後、このリポジトリのルートフォルダーでdocsify serve
と入力してください。ウェブサイトはローカルホストのポート3000で提供されます: localhost:3000
。
注意: ノートブックはDocsifyではレンダリングされないため、ノートブックを実行する必要がある場合は、Pythonカーネルを使用してVS Codeで別途実行してください。
その他のカリキュラム
私たちのチームは他のカリキュラムも制作しています!以下をご覧ください:
- 初心者向け生成AI
- 初心者向け生成AI .NET
- JavaScriptでの生成AI
- Javaでの生成AI
- 初心者向けAI
- 初心者向けデータサイエンス
- 初心者向け機械学習
- 初心者向けサイバーセキュリティ
- 初心者向けウェブ開発
- 初心者向けIoT
- 初心者向けXR開発
- ペアプログラミングのためのGitHub Copilotマスター
- C#/.NET開発者向けGitHub Copilotマスター
- GitHub Copilotアドベンチャーを選ぼう
免責事項:
この文書は、AI翻訳サービス Co-op Translator を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があることをご承知ください。元の言語で記載された文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤解釈について、当方は責任を負いません。