19 KiB
初心者のためのデータサイエンス - カリキュラム
Azure Cloud Advocates at Microsoftは、データサイエンスに関する10週間、20レッスンのカリキュラムを提供します。各レッスンには、事前・事後のクイズ、レッスンを完了するための手順書、解答例、課題が含まれています。このプロジェクトベースの学習方法により、新しいスキルを実践的に学ぶことができます。
著者の皆さんに感謝します: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 特別な感謝 🙏 を以下のMicrosoft Student Ambassadorの著者、レビュアー、コンテンツ貢献者の皆さんに: Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar, Vidushi Gupta, Jasleen Sondhi
![]() |
---|
初心者のためのデータサイエンス - @nitya によるスケッチノート |
お知らせ - 新しい生成AIカリキュラムがリリースされました!
生成AIに関する12レッスンのカリキュラムをリリースしました。以下の内容を学べます:
- プロンプトとプロンプトエンジニアリング
- テキストと画像アプリの生成
- 検索アプリ
いつものように、レッスン、課題、知識チェック、チャレンジが含まれています。
ぜひご覧ください:
学生の皆さんへ
以下のリソースから始めましょう:
- Student Hubページ このページでは、初心者向けリソース、学生向けパック、さらには無料の認定試験バウチャーを取得する方法が見つかります。このページをブックマークして、定期的にチェックしてください。コンテンツは少なくとも月に一度更新されます。
- Microsoft Learn Student Ambassadors グローバルな学生アンバサダーコミュニティに参加しましょう。これがMicrosoftへの道になるかもしれません。
始めに
教師の皆さん: このカリキュラムの使用方法についていくつかの提案を含めています。フィードバックはディスカッションフォーラムでお待ちしています!
学生の皆さん: このカリキュラムを自分で使用するには、リポジトリ全体をフォークし、事前クイズから始めて演習を完了してください。その後、レクチャーを読み、残りの活動を完了します。解答コードをコピーするのではなく、レッスンを理解しながらプロジェクトを作成することをお勧めします。ただし、解答コードは各プロジェクト指向のレッスンの/solutionsフォルダーにあります。また、友達と勉強グループを作り、一緒にコンテンツを進めるのも良いアイデアです。さらに学びたい場合は、Microsoft Learnをお勧めします。
チーム紹介
Gif作成者 Mohit Jaisal
🎥 上の画像をクリックして、このプロジェクトと作成者についてのビデオをご覧ください!
教育方針
このカリキュラムを構築する際、プロジェクトベースであることと頻繁なクイズを含むことの2つの教育方針を採用しました。このシリーズの終わりまでに、学生はデータサイエンスの基本原則(倫理的概念、データ準備、データの操作方法、データ可視化、データ分析、データサイエンスの実際の使用例など)を学びます。
さらに、授業前の低リスクなクイズは、学生がトピックを学ぶ意図を設定し、授業後のクイズはさらなる記憶定着を確保します。このカリキュラムは柔軟で楽しいものとして設計されており、全体または一部を受講することができます。プロジェクトは小規模なものから始まり、10週間のサイクルの終わりには徐々に複雑になります。
各レッスンには以下が含まれます:
- オプションのスケッチノート
- オプションの補足ビデオ
- レッスン前のウォームアップクイズ
- 書面によるレッスン
- プロジェクトベースのレッスンの場合、プロジェクトの構築方法に関するステップバイステップガイド
- 知識チェック
- チャレンジ
- 補足資料
- 課題
- レッスン後のクイズ
クイズについての注意: すべてのクイズはQuiz-Appフォルダーに含まれており、合計40個の3問クイズがあります。レッスン内からリンクされていますが、クイズアプリはローカルで実行するか、Azureにデプロイすることができます。
quiz-app
フォルダーの指示に従ってください。クイズは徐々にローカライズされています。
レッスン一覧
![]() |
---|
初心者のためのデータサイエンス: ロードマップ - @nitya によるスケッチノート |
レッスン番号 | トピック | レッスングループ | 学習目標 | リンクされたレッスン | 著者 |
---|---|---|---|---|---|
01 | データサイエンスの定義 | イントロダクション | データサイエンスの基本概念と、それが人工知能、機械学習、大規模データとどのように関連しているかを学ぶ。 | レッスン ビデオ | Dmitry |
02 | データサイエンスの倫理 | イントロダクション | データ倫理の概念、課題、フレームワーク。 | レッスン | Nitya |
03 | データの定義 | イントロダクション | データの分類方法とその一般的なソース。 | レッスン | Jasmine |
04 | 統計と確率の入門 | イントロダクション | データを理解するための確率と統計の数学的手法。 | レッスン ビデオ | Dmitry |
05 | リレーショナルデータの操作 | データの操作 | リレーショナルデータの概要と、SQL(Structured Query Language)を使用したリレーショナルデータの探索と分析の基本。 | レッスン | Christopher |
06 | NoSQLデータの操作 | データの操作 | 非リレーショナルデータの概要、そのさまざまな種類、およびドキュメントデータベースの探索と分析の基本。 | レッスン | Jasmine |
07 | Pythonの操作 | データの操作 | Pandasなどのライブラリを使用したデータ探索のためのPythonの基本。Pythonプログラミングの基礎的な理解が推奨されます。 | レッスン ビデオ | Dmitry |
08 | データ準備 | データの取り扱い | 欠損、不正確、不完全なデータの課題に対処するためのデータのクリーニングと変換技術に関するトピック。 | レッスン | Jasmine |
09 | 数量の可視化 | データ可視化 | Matplotlibを使用して鳥のデータを可視化する方法を学ぶ 🦆 | レッスン | Jen |
10 | データ分布の可視化 | データ可視化 | 区間内の観測値や傾向を可視化する。 | レッスン | Jen |
11 | 比率の可視化 | データ可視化 | 離散的およびグループ化された割合を可視化する。 | レッスン | Jen |
12 | 関係性の可視化 | データ可視化 | データセット間やその変数間の接続や相関を可視化する。 | レッスン | Jen |
13 | 意味のある可視化 | データ可視化 | 問題解決や洞察を効果的にするための価値ある可視化を作成する技術とガイド。 | レッスン | Jen |
14 | データサイエンスライフサイクルの概要 | ライフサイクル | データサイエンスライフサイクルとその最初のステップであるデータの取得と抽出の概要。 | レッスン | Jasmine |
15 | 分析 | ライフサイクル | データサイエンスライフサイクルのこのフェーズでは、データを分析する技術に焦点を当てる。 | レッスン | Jasmine |
16 | コミュニケーション | ライフサイクル | データサイエンスライフサイクルのこのフェーズでは、意思決定者が理解しやすい形でデータから得られた洞察を提示することに焦点を当てる。 | レッスン | Jalen |
17 | クラウドでのデータサイエンス | クラウドデータ | クラウドでのデータサイエンスとその利点を紹介する一連のレッスン。 | レッスン | Tiffany と Maud |
18 | クラウドでのデータサイエンス | クラウドデータ | ローコードツールを使用したモデルのトレーニング。 | レッスン | Tiffany と Maud |
19 | クラウドでのデータサイエンス | クラウドデータ | Azure Machine Learning Studioを使用したモデルのデプロイ。 | レッスン | Tiffany と Maud |
20 | 実世界でのデータサイエンス | 実世界 | 実世界でのデータサイエンス主導のプロジェクト。 | レッスン | Nitya |
GitHub Codespaces
このサンプルをCodespaceで開く手順は以下の通りです:
- Codeドロップダウンメニューをクリックし、Open with Codespacesオプションを選択します。
- ペインの下部にある+ New codespaceを選択します。 詳細については、GitHubのドキュメントをご覧ください。
VSCode Remote - Containers
VSCodeのRemote - Containers拡張機能を使用して、ローカルマシンでこのリポジトリをコンテナ内で開く手順は以下の通りです:
- 開発コンテナを初めて使用する場合は、開始ガイドで必要条件(例:Dockerのインストール)を確認してください。
このリポジトリを使用するには、以下のいずれかの方法を選択できます:
注意: 内部的には、Remote-Containers: Clone Repository in Container Volume... コマンドを使用して、ソースコードをローカルファイルシステムではなくDockerボリュームにクローンします。ボリュームはコンテナデータを永続化するための推奨メカニズムです。
または、ローカルにクローンまたはダウンロードしたリポジトリを開く:
- このリポジトリをローカルファイルシステムにクローンします。
- F1キーを押して、Remote-Containers: Open Folder in Container... コマンドを選択します。
- クローンしたフォルダを選択し、コンテナが起動するのを待って試してみてください。
オフラインアクセス
Docsifyを使用して、このドキュメントをオフラインで実行できます。このリポジトリをフォークし、Docsifyをインストールしてから、このリポジトリのルートフォルダでdocsify serve
と入力してください。ウェブサイトはローカルホストのポート3000で提供されます:localhost:3000
。
注意:Docsifyではノートブックはレンダリングされません。そのため、ノートブックを実行する必要がある場合は、Pythonカーネルを使用してVS Codeで別途実行してください。
ヘルプ募集中!
カリキュラムの全部または一部を翻訳したい場合は、翻訳ガイドをご覧ください。
その他のカリキュラム
私たちのチームは他にもカリキュラムを制作しています!以下をご覧ください:
- Generative AI for Beginners
- Generative AI for Beginners .NET
- Generative AI with JavaScript
- Generative AI with Java
- AI for Beginners
- Data Science for Beginners
- ML for Beginners
- Cybersecurity for Beginners
- Web Dev for Beginners
- IoT for Beginners
- XR Development for Beginners
- Mastering GitHub Copilot for Paired Programming
- Mastering GitHub Copilot for C#/.NET Developers
- Choose Your Own Copilot Adventure
免責事項:
この文書は、AI翻訳サービス Co-op Translator を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があることをご承知ください。元の言語で記載された文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤解釈について、当社は責任を負いません。