You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
140 lines
5.7 KiB
140 lines
5.7 KiB
# 초보자를 위한 데이터 과학 예제
|
|
|
|
예제 디렉토리에 오신 것을 환영합니다! 이 간단하고 잘 주석 처리된 예제 모음은 데이터 과학을 처음 접하는 분들도 쉽게 시작할 수 있도록 설계되었습니다.
|
|
|
|
## 📚 여기서 찾을 수 있는 것들
|
|
|
|
각 예제는 독립적으로 구성되어 있으며 다음을 포함합니다:
|
|
- **명확한 주석**: 모든 단계에 대한 설명
|
|
- **간단하고 읽기 쉬운 코드**: 한 번에 하나의 개념을 보여줌
|
|
- **실제 사례**: 언제, 왜 이러한 기술을 사용하는지 이해를 돕는 맥락 제공
|
|
- **예상 출력**: 결과를 확인할 수 있도록 제공
|
|
|
|
## 🚀 시작하기
|
|
|
|
### 사전 준비
|
|
이 예제를 실행하기 전에 다음을 준비하세요:
|
|
- Python 3.7 이상 설치
|
|
- Python 스크립트를 실행하는 기본적인 방법 이해
|
|
|
|
### 필요한 라이브러리 설치
|
|
```bash
|
|
pip install pandas numpy matplotlib
|
|
```
|
|
|
|
## 📖 예제 개요
|
|
|
|
### 1. Hello World - 데이터 과학 스타일
|
|
**파일:** `01_hello_world_data_science.py`
|
|
|
|
첫 번째 데이터 과학 프로그램! 다음을 배웁니다:
|
|
- 간단한 데이터셋 로드
|
|
- 데이터에 대한 기본 정보 표시
|
|
- 첫 번째 데이터 과학 결과 출력
|
|
|
|
데이터 과학을 처음 접하는 분들이 첫 프로그램을 실행해볼 수 있는 완벽한 시작점입니다.
|
|
|
|
---
|
|
|
|
### 2. 데이터 로드 및 탐색
|
|
**파일:** `02_loading_data.py`
|
|
|
|
데이터 작업의 기본을 배웁니다:
|
|
- CSV 파일에서 데이터 읽기
|
|
- 데이터셋의 첫 몇 줄 보기
|
|
- 데이터에 대한 기본 통계 확인
|
|
- 데이터 유형 이해
|
|
|
|
데이터 과학 프로젝트의 첫 번째 단계로 자주 사용됩니다!
|
|
|
|
---
|
|
|
|
### 3. 간단한 데이터 분석
|
|
**파일:** `03_simple_analysis.py`
|
|
|
|
첫 데이터 분석 수행:
|
|
- 기본 통계 계산 (평균, 중앙값, 최빈값)
|
|
- 최대값 및 최소값 찾기
|
|
- 값의 발생 횟수 계산
|
|
- 조건에 따라 데이터 필터링
|
|
|
|
데이터에 대한 간단한 질문에 답하는 방법을 배웁니다.
|
|
|
|
---
|
|
|
|
### 4. 데이터 시각화 기본
|
|
**파일:** `04_basic_visualization.py`
|
|
|
|
첫 번째 시각화 생성:
|
|
- 간단한 막대 그래프 만들기
|
|
- 선 그래프 생성
|
|
- 원형 차트 생성
|
|
- 시각화를 이미지로 저장
|
|
|
|
결과를 시각적으로 전달하는 방법을 배웁니다!
|
|
|
|
---
|
|
|
|
### 5. 실제 데이터 작업
|
|
**파일:** `05_real_world_example.py`
|
|
|
|
전체 예제를 통해 모든 것을 종합적으로 학습:
|
|
- 저장소에서 실제 데이터 로드
|
|
- 데이터 정리 및 준비
|
|
- 분석 수행
|
|
- 의미 있는 시각화 생성
|
|
- 결론 도출
|
|
|
|
처음부터 끝까지 완전한 워크플로를 보여주는 예제입니다.
|
|
|
|
---
|
|
|
|
## 🎯 예제 활용 방법
|
|
|
|
1. **처음부터 시작**: 예제는 난이도 순으로 번호가 매겨져 있습니다. `01_hello_world_data_science.py`부터 시작하여 순서대로 진행하세요.
|
|
|
|
2. **주석 읽기**: 각 파일에는 코드가 무엇을 하고 왜 그렇게 하는지 설명하는 자세한 주석이 포함되어 있습니다. 주석을 꼼꼼히 읽으세요!
|
|
|
|
3. **실험하기**: 코드를 수정해보세요. 값을 변경하면 어떤 일이 일어나는지 확인하세요. 실수하고 고치는 과정에서 배울 수 있습니다.
|
|
|
|
4. **코드 실행**: 각 예제를 실행하고 출력 결과를 관찰하세요. 예상한 결과와 비교해보세요.
|
|
|
|
5. **확장하기**: 예제를 이해한 후, 자신의 아이디어로 확장해보세요.
|
|
|
|
## 💡 초보자를 위한 팁
|
|
|
|
- **서두르지 마세요**: 각 예제를 충분히 이해한 후 다음 단계로 넘어가세요.
|
|
- **직접 코드를 입력하세요**: 복사-붙여넣기만 하지 마세요. 직접 입력하면 학습과 기억에 도움이 됩니다.
|
|
- **모르는 개념 찾아보기**: 이해되지 않는 것이 있다면 온라인이나 주요 강의에서 검색하세요.
|
|
- **질문하기**: 도움이 필요하면 [토론 포럼](https://github.com/microsoft/Data-Science-For-Beginners/discussions)에 참여하세요.
|
|
- **규칙적으로 연습하기**: 일주일에 한 번 긴 시간 동안 공부하기보다는 매일 조금씩 코딩하세요.
|
|
|
|
## 🔗 다음 단계
|
|
|
|
이 예제를 완료한 후에는 다음을 할 준비가 됩니다:
|
|
- 주요 커리큘럼 강의를 진행
|
|
- 각 강의 폴더의 과제 시도
|
|
- Jupyter 노트북을 탐색하여 더 깊이 있는 학습
|
|
- 자신만의 데이터 과학 프로젝트 생성
|
|
|
|
## 📚 추가 자료
|
|
|
|
- [주요 커리큘럼](../README.md) - 전체 20강 과정
|
|
- [교사를 위한 자료](../for-teachers.md) - 교실에서 이 커리큘럼을 활용하는 방법
|
|
- [Microsoft Learn](https://docs.microsoft.com/learn/) - 무료 온라인 학습 자료
|
|
- [Python 문서](https://docs.python.org/3/) - 공식 Python 참고 자료
|
|
|
|
## 🤝 기여하기
|
|
|
|
버그를 발견했거나 새로운 예제에 대한 아이디어가 있나요? 기여를 환영합니다! [기여 가이드](../CONTRIBUTING.md)를 확인하세요.
|
|
|
|
---
|
|
|
|
**즐거운 학습 되세요! 🎉**
|
|
|
|
기억하세요: 모든 전문가도 한때는 초보자였습니다. 한 단계씩 천천히 진행하며 실수를 두려워하지 마세요 - 실수는 학습 과정의 일부입니다!
|
|
|
|
---
|
|
|
|
**면책 조항**:
|
|
이 문서는 AI 번역 서비스 [Co-op Translator](https://github.com/Azure/co-op-translator)를 사용하여 번역되었습니다. 정확성을 위해 최선을 다하고 있으나, 자동 번역에는 오류나 부정확성이 포함될 수 있습니다. 원본 문서의 원어 버전을 권위 있는 자료로 간주해야 합니다. 중요한 정보의 경우, 전문적인 인간 번역을 권장합니다. 이 번역 사용으로 인해 발생하는 오해나 잘못된 해석에 대해 당사는 책임을 지지 않습니다. |