You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
4 months ago | |
|---|---|---|
| .. | ||
| README.md | 4 months ago | |
README.md
初学者友好的数据科学示例
欢迎来到示例目录!这套简单且注释清晰的示例旨在帮助您开始学习数据科学,即使您是完全的初学者。
📚 您将在这里找到什么
每个示例都是独立的,并包括:
- 清晰的注释,解释每一步操作
- 简单易读的代码,每次只展示一个概念
- 真实世界的背景,帮助您理解这些技术的使用场景和原因
- 预期输出,让您知道应该关注什么
🚀 开始使用
前置条件
在运行这些示例之前,请确保您已经:
- 安装了 Python 3.7 或更高版本
- 对如何运行 Python 脚本有基本了解
安装所需库
pip install pandas numpy matplotlib
📖 示例概览
1. Hello World - 数据科学风格
文件名: 01_hello_world_data_science.py
您的第一个数据科学程序!学习如何:
- 加载一个简单的数据集
- 显示数据的基本信息
- 打印您的第一个数据科学输出
非常适合希望看到第一个数据科学程序运行效果的绝对初学者。
2. 加载和探索数据
文件名: 02_loading_data.py
学习处理数据的基础知识:
- 从 CSV 文件读取数据
- 查看数据集的前几行
- 获取数据的基本统计信息
- 理解数据类型
这是任何数据科学项目的第一步!
3. 简单数据分析
文件名: 03_simple_analysis.py
进行您的第一次数据分析:
- 计算基本统计数据(均值、中位数、众数)
- 找到最大值和最小值
- 统计值的出现次数
- 根据条件过滤数据
了解如何回答关于数据的简单问题。
4. 数据可视化基础
文件名: 04_basic_visualization.py
创建您的第一个可视化:
- 制作简单的柱状图
- 创建折线图
- 生成饼图
- 将可视化保存为图片
学习如何通过可视化传达您的发现!
5. 使用真实数据
文件名: 05_real_world_example.py
通过完整示例将所有内容结合起来:
- 从存储库加载真实数据
- 清理和准备数据
- 进行分析
- 创建有意义的可视化
- 得出结论
此示例展示了从头到尾的完整工作流程。
🎯 如何使用这些示例
- 从头开始:示例按难度排序编号。从
01_hello_world_data_science.py开始,逐步学习。 - 阅读注释:每个文件都有详细的注释,解释代码的功能和原因。仔细阅读!
- 尝试实验:尝试修改代码。如果更改一个值会发生什么?打破代码并修复它——这是学习的方式!
- 运行代码:执行每个示例并观察输出。与您的预期结果进行比较。
- 扩展它:一旦理解了一个示例,尝试用自己的想法扩展它。
💡 初学者提示
- 不要着急:在进入下一个示例之前,花时间理解每个示例
- 自己输入代码:不要只是复制粘贴。输入代码有助于学习和记忆
- 查找不熟悉的概念:如果看到不理解的内容,请在线搜索或参考主课程
- 提出问题:如果需要帮助,请加入 讨论论坛
- 定期练习:每天尝试编写一点代码,而不是每周进行一次长时间的学习
🔗 下一步
完成这些示例后,您可以:
- 学习主课程的内容
- 尝试每个课程文件夹中的作业
- 探索 Jupyter 笔记本以进行更深入的学习
- 创建自己的数据科学项目
📚 其他资源
- 主课程 - 完整的20课课程
- 教师指南 - 在课堂中使用此课程
- Microsoft Learn - 免费在线学习资源
- Python 文档 - 官方 Python 参考
🤝 贡献
发现了错误或有新示例的想法?我们欢迎您的贡献!请参阅我们的 贡献指南。
祝学习愉快!🎉
记住:每个专家都曾是初学者。一步一步来,不要害怕犯错——它们是学习过程的一部分!
免责声明:
本文档使用AI翻译服务 Co-op Translator 进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于关键信息,建议使用专业人工翻译。我们对因使用此翻译而产生的任何误解或误读不承担责任。