History

localizeflow[bot] 810a53be1d chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes)		1 month ago
..
solution	chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes)	1 month ago
README.md	chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes)	1 month ago
assignment.md	chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes)	1 month ago
notebook.ipynb	chore(i18n): sync translations with latest source changes (chunk 7/10, 100 files)	3 months ago

README.md

ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವುದು


ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವುದು - @nitya ಅವರಿಂದ ಸ್ಕೆಚ್ ನೋಟ್

ಪೂರ್ವ-ಲೇಕ್ಚರ್ ಕ್ವಿಜ್

ಡೇಟಾ ಎಂದರೆ ಏನು?

ನಮ್ಮ ದೈನಂದಿನ ಜೀವನದಲ್ಲಿ, ನಾವು ನಿರಂತರವಾಗಿ ಡೇಟಾದಿಂದ ಸುತ್ತುವರಿದಿದ್ದೇವೆ. ನೀವು ಈಗ ಓದುತ್ತಿರುವ ಪಠ್ಯವು ಡೇಟಾಗೆ ಸೇರಿದೆ. ನಿಮ್ಮ ಸ್ನೇಹಿತರ ಫೋನ್ ಸಂಖ್ಯೆಗಳ ಪಟ್ಟಿ ನಿಮ್ಮ ಸ್ಮಾರ್ಟ್‌ಫೋನಿನಲ್ಲಿ ಡೇಟಾಗೆ ಸೇರಿದೆ, ಹಾಗೆಯೇ ನಿಮ್ಮ ಗಡಿಯಾರದಲ್ಲಿ ತೋರಿಸಲಾಗುತ್ತಿರುವ ಪ್ರಸ್ತುತ ಸಮಯವೂ ಡೇಟಾಗೆ ಸೇರಿದೆ. ಮಾನವರಾಗಿ, ನಾವು ಸಹಜವಾಗಿ ಹಣ ಎಣಿಸುವ ಮೂಲಕ ಅಥವಾ ಸ್ನೇಹಿತರಿಗೆ ಪತ್ರ ಬರೆಯುವ ಮೂಲಕ ಡೇಟಾ ಜೊತೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತೇವೆ.

ಆದರೆ, ಕಂಪ್ಯೂಟರ್‌ಗಳ ಸೃಷ್ಟಿಯೊಂದಿಗೆ ಡೇಟಾ ಬಹಳ ಮುಖ್ಯವಾಗಿತು. ಕಂಪ್ಯೂಟರ್‌ಗಳ ಪ್ರಮುಖ ಪಾತ್ರ ಗಣನೆಗಳನ್ನು ನಿರ್ವಹಿಸುವುದು, ಆದರೆ ಅವು ಕಾರ್ಯನಿರ್ವಹಿಸಲು ಡೇಟಾ ಬೇಕಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ, ನಾವು ಕಂಪ್ಯೂಟರ್‌ಗಳು ಡೇಟಾವನ್ನು ಹೇಗೆ ಸಂಗ್ರಹಿಸುತ್ತವೆ ಮತ್ತು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುತ್ತವೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬೇಕಾಗಿದೆ.

ಇಂಟರ್ನೆಟ್ ಉದಯದೊಂದಿಗೆ, ಕಂಪ್ಯೂಟರ್‌ಗಳ ಡೇಟಾ ನಿರ್ವಹಣಾ ಸಾಧನಗಳಾಗಿ ಪಾತ್ರ ಹೆಚ್ಚಾಯಿತು. ನೀವು ಯೋಚಿಸಿದರೆ, ನಾವು ಈಗ ಗಣನೆಗಳಿಗಿಂತ ಹೆಚ್ಚು ಡೇಟಾ ಪ್ರಕ್ರಿಯೆ ಮತ್ತು ಸಂವಹನಕ್ಕಾಗಿ ಕಂಪ್ಯೂಟರ್‌ಗಳನ್ನು ಬಳಸುತ್ತಿದ್ದೇವೆ. ನಾವು ಸ್ನೇಹಿತರಿಗೆ ಇ-ಮೇಲ್ ಬರೆಯುವಾಗ ಅಥವಾ ಇಂಟರ್ನೆಟ್‌ನಲ್ಲಿ ಮಾಹಿತಿ ಹುಡುಕುವಾಗ - ನಾವು ಮೂಲತಃ ಡೇಟಾವನ್ನು ರಚಿಸುತ್ತೇವೆ, ಸಂಗ್ರಹಿಸುತ್ತೇವೆ, ಪ್ರಸಾರ ಮಾಡುತ್ತೇವೆ ಮತ್ತು ಪರಿಷ್ಕರಿಸುತ್ತೇವೆ.

ನೀವು ಕೊನೆಯ ಬಾರಿ ಕಂಪ್ಯೂಟರ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನಿಜವಾಗಿಯೂ ಏನಾದರೂ ಗಣನೆ ಮಾಡಿದ ಸಮಯವನ್ನು ನೆನಪಿಸಿಕೊಳ್ಳಬಹುದೇ?

ಡೇಟಾ ಸೈನ್ಸ್ ಎಂದರೆ ಏನು?

ವಿಕಿಪೀಡಿಯಾ ಪ್ರಕಾರ, ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ನು ಸಂರಚಿತ ಮತ್ತು ಅಸಂರಚಿತ ಡೇಟಾದಿಂದ ಜ್ಞಾನ ಮತ್ತು ಒಳನೋಟಗಳನ್ನು ಹೊರತೆಗೆಯಲು ವೈಜ್ಞಾನಿಕ ವಿಧಾನಗಳನ್ನು ಬಳಸುವ ವೈಜ್ಞಾನಿಕ ಕ್ಷೇತ್ರ ಮತ್ತು ಡೇಟಾದಿಂದ ಜ್ಞಾನ ಮತ್ತು ಕಾರ್ಯನಿರ್ವಹಣೀಯ ಒಳನೋಟಗಳನ್ನು ವ್ಯಾಪಕ ಅನ್ವಯ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಅನ್ವಯಿಸುವುದು ಎಂದು ವ್ಯಾಖ್ಯಾನಿಸಲಾಗಿದೆ.

ಈ ವ್ಯಾಖ್ಯಾನವು ಡೇಟಾ ಸೈನ್ಸ್‌ನ ಪ್ರಮುಖ ಅಂಶಗಳನ್ನು ಹೈಲೈಟ್ ಮಾಡುತ್ತದೆ:

ಡೇಟಾ ಸೈನ್ಸ್‌ನ ಮುಖ್ಯ ಗುರಿ ಡೇಟಾದಿಂದ ಜ್ಞಾನವನ್ನು ಹೊರತೆಗೆಯುವುದು, ಅಂದರೆ - ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು, ಕೆಲವು ಅಡಗಿದ ಸಂಬಂಧಗಳನ್ನು ಕಂಡುಹಿಡಿದು ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸುವುದು.
ಡೇಟಾ ಸೈನ್ಸ್ ವೈಜ್ಞಾನಿಕ ವಿಧಾನಗಳನ್ನು ಬಳಸುತ್ತದೆ, ಉದಾಹರಣೆಗೆ ಸಾಧ್ಯತೆ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರ. ವಾಸ್ತವದಲ್ಲಿ, ಡೇಟಾ ಸೈನ್ಸ್ ಪದವನ್ನು ಮೊದಲ ಬಾರಿಗೆ ಪರಿಚಯಿಸಿದಾಗ, ಕೆಲವರು ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ನು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಹೊಸ ಫ್ಯಾನ್ಸಿ ಹೆಸರು ಎಂದು ವಾದಿಸಿದ್ದರು. ಇಂದಿನ ದಿನಗಳಲ್ಲಿ ಈ ಕ್ಷೇತ್ರವು ಬಹಳ ವಿಶಾಲವಾಗಿದೆ ಎಂಬುದು ಸ್ಪಷ್ಟವಾಗಿದೆ.
ಪಡೆದ ಜ್ಞಾನವನ್ನು ಕೆಲವು ಕಾರ್ಯನಿರ್ವಹಣೀಯ ಒಳನೋಟಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ಅನ್ವಯಿಸಬೇಕು, ಅಂದರೆ ನೈಜ ವ್ಯವಹಾರ ಪರಿಸ್ಥಿತಿಗಳಿಗೆ ಅನ್ವಯಿಸಬಹುದಾದ ಪ್ರಾಯೋಗಿಕ ಒಳನೋಟಗಳು.
ನಾವು ಸಂರಚಿತ ಮತ್ತು ಅಸಂರಚಿತ ಡೇಟಾ ಎರಡರ ಮೇಲೂ ಕಾರ್ಯನಿರ್ವಹಿಸಲು ಸಾಧ್ಯವಾಗಬೇಕು. ನಾವು ಕೋರ್ಸ್‌ನಲ್ಲಿ ನಂತರ ಡೇಟಾ ವಿವಿಧ ಪ್ರಕಾರಗಳನ್ನು ಚರ್ಚಿಸುವೆವು.
ಅನ್ವಯ ಕ್ಷೇತ್ರ ಒಂದು ಪ್ರಮುಖ ಕಲ್ಪನೆ, ಮತ್ತು ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಸಮಸ್ಯಾ ಕ್ಷೇತ್ರದಲ್ಲಿ ಕನಿಷ್ಠ ಕೆಲವು ಪರಿಣಿತಿಯನ್ನು ಹೊಂದಿರಬೇಕು, ಉದಾಹರಣೆಗೆ: ಹಣಕಾಸು, ವೈದ್ಯಕೀಯ, ಮಾರ್ಕೆಟಿಂಗ್ ಇತ್ಯಾದಿ.

ಡೇಟಾ ಸೈನ್ಸ್‌ನ ಮತ್ತೊಂದು ಪ್ರಮುಖ ಅಂಶವೆಂದರೆ, ಅದು ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವುದು, ಸಂಗ್ರಹಿಸುವುದು ಮತ್ತು ಕಂಪ್ಯೂಟರ್‌ಗಳ ಬಳಕೆ ಮೂಲಕ ಕಾರ್ಯನಿರ್ವಹಿಸುವುದನ್ನು ಅಧ್ಯಯನ ಮಾಡುತ್ತದೆ. ಸಂಖ್ಯಾಶಾಸ್ತ್ರವು ಗಣಿತೀಯ ಆಧಾರಗಳನ್ನು ನೀಡುತ್ತದೆ, ಆದರೆ ಡೇಟಾ ಸೈನ್ಸ್ ಗಣಿತೀಯ ಕಲ್ಪನೆಗಳನ್ನು ಡೇಟಾದಿಂದ ಒಳನೋಟಗಳನ್ನು ಪಡೆಯಲು ಅನ್ವಯಿಸುತ್ತದೆ.

ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ನು ನೋಡಲು ಒಂದು ವಿಧಾನ (ಜಿಮ್ ಗ್ರೇ ಅವರಿಗೆ ನಂಬಿಕೆ) ಒಂದು ವಿಭಿನ್ನ ವೈಜ್ಞಾನಿಕ ಪರಿಕಲ್ಪನೆಯಾಗಿ ಪರಿಗಣಿಸುವುದು:

ಪ್ರಾಯೋಗಿಕ, ಇಲ್ಲಿ ನಾವು ಮುಖ್ಯವಾಗಿ ವೀಕ್ಷಣೆಗಳು ಮತ್ತು ಪ್ರಯೋಗಗಳ ಫಲಿತಾಂಶಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದ್ದೇವೆ
ಸಿದ್ಧಾಂತಾತ್ಮಕ, ಇಲ್ಲಿ ಹೊಸ ಕಲ್ಪನೆಗಳು ಇತ್ತೀಚಿನ ವೈಜ್ಞಾನಿಕ ಜ್ಞಾನದಿಂದ ಉದ್ಭವಿಸುತ್ತವೆ
ಗಣನಾತ್ಮಕ, ಇಲ್ಲಿ ನಾವು ಕೆಲವು ಗಣನಾತ್ಮಕ ಪ್ರಯೋಗಗಳ ಆಧಾರದ ಮೇಲೆ ಹೊಸ ಸಿದ್ಧಾಂತಗಳನ್ನು ಕಂಡುಹಿಡಿಯುತ್ತೇವೆ
ಡೇಟಾ ಚಾಲಿತ, ಡೇಟಾದಲ್ಲಿನ ಸಂಬಂಧಗಳು ಮತ್ತು ಮಾದರಿಗಳನ್ನು ಕಂಡುಹಿಡಿಯುವ ಆಧಾರದ ಮೇಲೆ

ಇತರ ಸಂಬಂಧಿತ ಕ್ಷೇತ್ರಗಳು

ಡೇಟಾ ಎಲ್ಲೆಡೆ ಇರುವುದರಿಂದ, ಡೇಟಾ ಸೈನ್ಸ್ ಕೂಡ ಒಂದು ವಿಶಾಲ ಕ್ಷೇತ್ರವಾಗಿದ್ದು, ಅನೇಕ ಇತರ ಶಾಖೆಗಳನ್ನು ಸ್ಪರ್ಶಿಸುತ್ತದೆ.

ಡೇಟಾಬೇಸ್‌ಗಳು: ಮುಖ್ಯವಾದ ವಿಚಾರವೆಂದರೆ ಡೇಟಾವನ್ನು ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದು, ಅಂದರೆ ಅದನ್ನು ವೇಗವಾಗಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ಅನುಕೂಲವಾಗುವ ರೀತಿಯಲ್ಲಿ ಹೇಗೆ ರಚಿಸುವುದು. ಸಂರಚಿತ ಮತ್ತು ಅಸಂರಚಿತ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವ ವಿವಿಧ ರೀತಿಯ ಡೇಟಾಬೇಸ್‌ಗಳಿವೆ, ಅವುಗಳನ್ನು ನಮ್ಮ ಕೋರ್ಸ್‌ನಲ್ಲಿ ಪರಿಗಣಿಸುವೆವು.
ಬಿಗ್ ಡೇಟಾ: ಬಹುಮಾನವಾಗಿ ಸರಳ ರಚನೆಯೊಂದಿಗೆ ಬಹಳ ದೊಡ್ಡ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವ ಅಗತ್ಯವಿರುತ್ತದೆ. ಕಂಪ್ಯೂಟರ್ ಕ್ಲಸ್ಟರ್‌ನಲ್ಲಿ ವಿತರಿತ ರೀತಿಯಲ್ಲಿ ಆ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲು ಮತ್ತು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ವಿಶೇಷ ವಿಧಾನಗಳು ಮತ್ತು ಸಾಧನಗಳಿವೆ.
ಮಷೀನ್ ಲರ್ನಿಂಗ್: ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಒಂದು ವಿಧಾನವೆಂದರೆ ಬಯಸಿದ ಫಲಿತಾಂಶವನ್ನು ಭವಿಷ್ಯವಾಣಿ ಮಾಡಲು ಸಾಧ್ಯವಾಗುವ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸುವುದು. ಡೇಟಾದಿಂದ ಮಾದರಿಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವುದನ್ನು ಮಷೀನ್ ಲರ್ನಿಂಗ್ ಎಂದು ಕರೆಯುತ್ತಾರೆ. ಇದರ ಬಗ್ಗೆ ಹೆಚ್ಚು ತಿಳಿಯಲು ನಮ್ಮ ಮಷೀನ್ ಲರ್ನಿಂಗ್ ಫಾರ್ ಬಿಗಿನರ್ಸ್ ಪಠ್ಯಕ್ರಮವನ್ನು ನೋಡಬಹುದು.
ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ: ಮಷೀನ್ ಲರ್ನಿಂಗ್‌ನ ಒಂದು ಕ್ಷೇತ್ರವಾದ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ (AI) ಕೂಡ ಡೇಟಾವನ್ನು ಅವಲಂಬಿಸಿದೆ ಮತ್ತು ಮಾನವ ಚಿಂತನೆ ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ಅನುಕರಿಸುವ ಉನ್ನತ ಸಂಕೀರ್ಣ ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸುವುದನ್ನು ಒಳಗೊಂಡಿದೆ. AI ವಿಧಾನಗಳು ಅಸಂರಚಿತ ಡೇಟಾವನ್ನು (ಉದಾ: ನೈಸರ್ಗಿಕ ಭಾಷೆ) ಸಂರಚಿತ ಒಳನೋಟಗಳಾಗಿ ಪರಿವರ್ತಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ.
ದೃಶ್ಯೀಕರಣ: ಬಹಳ ಪ್ರಮಾಣದ ಡೇಟಾ ಮಾನವರಿಗೆ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಕಷ್ಟಕರವಾಗಿರುತ್ತದೆ, ಆದರೆ ನಾವು ಆ ಡೇಟಾವನ್ನು ಉಪಯುಕ್ತ ದೃಶ್ಯೀಕರಣಗಳಾಗಿ ರೂಪಿಸಿದಾಗ, ನಾವು ಡೇಟಾದ ಅರ್ಥವನ್ನು ಹೆಚ್ಚು ಚೆನ್ನಾಗಿ ಗ್ರಹಿಸಬಹುದು ಮತ್ತು ಕೆಲವು ನಿರ್ಣಯಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ಆದ್ದರಿಂದ, ಮಾಹಿತಿಯನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಅನೇಕ ವಿಧಾನಗಳನ್ನು ತಿಳಿದುಕೊಳ್ಳುವುದು ಮುಖ್ಯ, ಇದು ನಮ್ಮ ಕೋರ್ಸ್‌ನ ಭಾಗ 3ರಲ್ಲಿ ಒಳಗೊಂಡಿದೆ. ಸಂಬಂಧಿತ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಇನ್ಫೋಗ್ರಾಫಿಕ್ಸ್ ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ಮಾನವ-ಕಂಪ್ಯೂಟರ್ ಸಂವಹನ ಕೂಡ ಸೇರಿವೆ.

ಡೇಟಾ ಪ್ರಕಾರಗಳು

ನಾವು ಈಗಾಗಲೇ ಉಲ್ಲೇಖಿಸಿದಂತೆ, ಡೇಟಾ ಎಲ್ಲೆಡೆ ಇದೆ. ಅದನ್ನು ಸರಿಯಾದ ರೀತಿಯಲ್ಲಿ ಹಿಡಿಯಬೇಕಾಗುತ್ತದೆ! ಸಂರಚಿತ ಮತ್ತು ಅಸಂರಚಿತ ಡೇಟಾ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ತಿಳಿದುಕೊಳ್ಳುವುದು ಉಪಯುಕ್ತ. ಮೊದಲನೆಯದು ಸಾಮಾನ್ಯವಾಗಿ ಚೆನ್ನಾಗಿ ರಚಿಸಲಾದ ರೂಪದಲ್ಲಿ, ಬಹುಮಾನವಾಗಿ ಟೇಬಲ್ ಅಥವಾ ಟೇಬಲ್ಗಳಾಗಿ ಪ್ರತಿನಿಧಿಸಲಾಗುತ್ತದೆ, ಆದರೆ ಎರಡನೆಯದು ಫೈಲ್‌ಗಳ ಸಂಗ್ರಹವಾಗಿದೆ. ಕೆಲವೊಮ್ಮೆ ನಾವು ಅರ್ಧ-ಸಂರಚಿತ ಡೇಟಾ ಬಗ್ಗೆ ಕೂಡ ಮಾತನಾಡಬಹುದು, ಅದರಲ್ಲಿ ಕೆಲವು ರೀತಿಯ ರಚನೆ ಇರುತ್ತದೆ ಆದರೆ ಅದು ಬಹಳ ಬದಲಾಗಬಹುದು.

ಸಂರಚಿತ	ಅರ್ಧ-ಸಂರಚಿತ	ಅಸಂರಚಿತ
ಜನರ ಫೋನ್ ಸಂಖ್ಯೆಗಳ ಪಟ್ಟಿ	ಲಿಂಕ್‌ಗಳೊಂದಿಗೆ ವಿಕಿಪೀಡಿಯಾ ಪುಟಗಳು	ಎನ್ಸೈಕ್ಲೋಪೀಡಿಯಾ ಬ್ರಿಟಾನಿಕಾದ ಪಠ್ಯ
ಕಳೆದ 20 ವರ್ಷಗಳ ಕಾಲ ಪ್ರತಿಯೊಂದು ನಿಮಿಷಕ್ಕೂ ಕಟ್ಟಡದ ಎಲ್ಲಾ ಕೊಠಡಿಗಳ ತಾಪಮಾನ	ಲೇಖಕರ, ಪ್ರಕಟಣೆಯ ದಿನಾಂಕ ಮತ್ತು ಸಾರಾಂಶದೊಂದಿಗೆ JSON ಸ್ವರೂಪದ ವೈಜ್ಞಾನಿಕ ಪತ್ರಗಳ ಸಂಗ್ರಹ	ಕಾರ್ಪೊರೇಟ್ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳ ಫೈಲ್ ಹಂಚಿಕೆ
ಕಟ್ಟಡಕ್ಕೆ ಪ್ರವೇಶಿಸುವ ಎಲ್ಲಾ ಜನರ ವಯಸ್ಸು ಮತ್ತು ಲಿಂಗದ ಡೇಟಾ	ಇಂಟರ್ನೆಟ್ ಪುಟಗಳು	ನಿಗಾ ಕ್ಯಾಮೆರಾದಿಂದ ಕಚ್ಚಾ ವೀಡಿಯೊ ಫೀಡ್

ಡೇಟಾ ಪಡೆಯಲು ಎಲ್ಲಿ

ಡೇಟಾ ಪಡೆಯಲು ಅನೇಕ ಸಾಧ್ಯವಾದ ಮೂಲಗಳಿವೆ, ಮತ್ತು ಅವುಗಳೆಲ್ಲವನ್ನು ಪಟ್ಟಿ ಮಾಡುವುದು ಅಸಾಧ್ಯ! ಆದಾಗ್ಯೂ, ನೀವು ಡೇಟಾ ಪಡೆಯಬಹುದಾದ ಕೆಲವು ಸಾಮಾನ್ಯ ಸ್ಥಳಗಳನ್ನು ಇಲ್ಲಿ ಉಲ್ಲೇಖಿಸೋಣ:

ಸಂರಚಿತ
- ಇಂಟರ್ನೆಟ್ ಆಫ್ ಥಿಂಗ್ಸ್ (IoT), ವಿವಿಧ ಸೆನ್ಸಾರ್‌ಗಳಿಂದ, ಉದಾಹರಣೆಗೆ ತಾಪಮಾನ ಅಥವಾ ಒತ್ತಡ ಸೆನ್ಸಾರ್‌ಗಳಿಂದ ಡೇಟಾ ಒದಗಿಸುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ಒಂದು ಕಚೇರಿ ಕಟ್ಟಡವು IoT ಸೆನ್ಸಾರ್‌ಗಳಿಂದ ಸಜ್ಜಾಗಿದ್ದರೆ, ನಾವು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಬಿಸಿಲು ಮತ್ತು ಬೆಳಕನ್ನು ನಿಯಂತ್ರಿಸಿ ವೆಚ್ಚವನ್ನು ಕಡಿಮೆ ಮಾಡಬಹುದು.
- ಸರ್ವೇಗಳು ನಾವು ಬಳಕೆದಾರರಿಗೆ ಖರೀದಿಯ ನಂತರ ಅಥವಾ ವೆಬ್‌ಸೈಟ್ ಭೇಟಿ ಮಾಡಿದ ನಂತರ ಪೂರ್ಣಗೊಳಿಸಲು ಕೇಳುತ್ತೇವೆ.
- ನಡವಳಿಕೆಯ ವಿಶ್ಲೇಷಣೆ ಉದಾಹರಣೆಗೆ, ಬಳಕೆದಾರನು ಒಂದು ಸೈಟ್‌ನಲ್ಲಿ ಎಷ್ಟು ಆಳವಾಗಿ ಹೋಗುತ್ತಾನೆ ಮತ್ತು ಸೈಟ್ ಬಿಟ್ಟುಹೋಗುವ ಸಾಮಾನ್ಯ ಕಾರಣವೇನು ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡಬಹುದು.
ಅಸಂರಚಿತ
- ಪಠ್ಯಗಳು ಒಳನೋಟಗಳ ಶ್ರೀಮಂತ ಮೂಲವಾಗಬಹುದು, ಉದಾಹರಣೆಗೆ ಒಟ್ಟು ಭಾವನಾತ್ಮಕ ಅಂಕೆ ಅಥವಾ ಪ್ರಮುಖ ಪದಗಳು ಮತ್ತು ಅರ್ಥವನ್ನು ಹೊರತೆಗೆಯುವುದು.
- ಚಿತ್ರಗಳು ಅಥವಾ ವೀಡಿಯೊ. ನಿಗಾ ಕ್ಯಾಮೆರಾದ ವೀಡಿಯೊ ರಸ್ತೆ上的 ಟ್ರಾಫಿಕ್ ಅಂದಾಜಿಸಲು ಮತ್ತು ಜನರಿಗೆ ಸಂಭಾವ್ಯ ಟ್ರಾಫಿಕ್ ಜಾಮ್‌ಗಳ ಬಗ್ಗೆ ಮಾಹಿತಿ ನೀಡಲು ಬಳಸಬಹುದು.
- ವೆಬ್ ಸರ್ವರ್ ಲಾಗ್‌ಗಳು ನಮ್ಮ ಸೈಟ್‌ನ ಯಾವ ಪುಟಗಳು ಹೆಚ್ಚು ಭೇಟಿ ನೀಡಲ್ಪಡುತ್ತವೆ ಮತ್ತು ಎಷ್ಟು ಸಮಯಕ್ಕೆಂದು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಬಳಸಬಹುದು.
ಅರ್ಧ-ಸಂರಚಿತ
- ಸಾಮಾಜಿಕ ಜಾಲತಾಣ ಗ್ರಾಫ್‌ಗಳು ಬಳಕೆದಾರರ ವ್ಯಕ್ತಿತ್ವಗಳು ಮತ್ತು ಮಾಹಿತಿ ಹರಡುವ ಪರಿಣಾಮಕಾರಿತ್ವದ ಬಗ್ಗೆ ಉತ್ತಮ ಮೂಲಗಳಾಗಬಹುದು.
- ನಾವು ಒಂದು ಪಾರ್ಟಿಯಿಂದ ಫೋಟೋಗಳ ಗುಂಪು ಹೊಂದಿದ್ದಾಗ, ನಾವು ಪರಸ್ಪರ ಫೋಟೋ ತೆಗೆದುಕೊಳ್ಳುತ್ತಿರುವ ಜನರ ಗ್ರಾಫ್ ನಿರ್ಮಿಸುವ ಮೂಲಕ ಗುಂಪು ಗತಿಶೀಲತೆ ಡೇಟಾವನ್ನು ಹೊರತೆಗೆಯಬಹುದು.

ವಿವಿಧ ಸಾಧ್ಯವಾದ ಡೇಟಾ ಮೂಲಗಳನ್ನು ತಿಳಿದುಕೊಂಡು, ನೀವು ಡೇಟಾ ಸೈನ್ಸ್ ತಂತ್ರಗಳನ್ನು ಅನ್ವಯಿಸಲು ವಿವಿಧ ಸಂದರ್ಭಗಳನ್ನು ಯೋಚಿಸಬಹುದು, ಪರಿಸ್ಥಿತಿಯನ್ನು ಉತ್ತಮವಾಗಿ ತಿಳಿದುಕೊಳ್ಳಲು ಮತ್ತು ವ್ಯವಹಾರ ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ಸುಧಾರಿಸಲು.

ಡೇಟಾ ಜೊತೆ ನೀವು ಏನು ಮಾಡಬಹುದು

ಡೇಟಾ ಸೈನ್ಸ್‌ನಲ್ಲಿ, ನಾವು ಡೇಟಾ ಪ್ರಯಾಣದ ಕೆಳಗಿನ ಹಂತಗಳ ಮೇಲೆ ಗಮನಹರಿಸುತ್ತೇವೆ:

1) ಡೇಟಾ ಸಂಗ್ರಹಣೆ

ಮೊದಲ ಹಂತ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವುದು. ಬಹುಮಾನವಾಗಿ ಇದು ಸರಳ ಪ್ರಕ್ರಿಯೆಯಾಗಿರಬಹುದು, ಉದಾಹರಣೆಗೆ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್‌ನಿಂದ ಡೇಟಾ ಡೇಟಾಬೇಸ್‌ಗೆ ಬರುತ್ತದೆ, ಆದರೆ ಕೆಲವೊಮ್ಮೆ ವಿಶೇಷ ತಂತ್ರಗಳನ್ನು ಬಳಸಬೇಕಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, IoT ಸೆನ್ಸಾರ್‌ಗಳಿಂದ ಡೇಟಾ ತುಂಬಾ ಪ್ರಮಾಣದಲ್ಲಿ ಬರುತ್ತದೆ, ಮತ್ತು ಮುಂದಿನ ಪ್ರಕ್ರಿಯೆಗೆ ಮೊದಲು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲು IoT ಹಬ್ ಮುಂತಾದ ಬಫರಿಂಗ್ ಎಂಡ್‌ಪಾಯಿಂಟ್‌ಗಳನ್ನು ಬಳಸುವುದು ಉತ್ತಮ ಅಭ್ಯಾಸ.

2) ಡೇಟಾ ಸಂಗ್ರಹಣೆ

ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವುದು ಸವಾಲಾಗಬಹುದು, ವಿಶೇಷವಾಗಿ ಬಿಗ್ ಡೇಟಾ ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತಿದ್ದಾಗ. ಡೇಟಾವನ್ನು ಹೇಗೆ ಸಂಗ್ರಹಿಸುವುದನ್ನು ನಿರ್ಧರಿಸುವಾಗ, ಭವಿಷ್ಯದಲ್ಲಿ ನೀವು ಡೇಟಾವನ್ನು ಹೇಗೆ ಪ್ರಶ್ನಿಸುವಿರಿ ಎಂಬುದನ್ನು ಊಹಿಸುವುದು ಸೂಕ್ತ. ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವ ಹಲವು ವಿಧಾನಗಳಿವೆ:

ಒಂದು ಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್ ಟೇಬಲ್ಗಳ ಸಂಗ್ರಹವನ್ನು ಸಂಗ್ರಹಿಸುತ್ತದೆ ಮತ್ತು ಅವುಗಳನ್ನು ಪ್ರಶ್ನಿಸಲು SQL ಎಂಬ ವಿಶೇಷ ಭಾಷೆಯನ್ನು ಬಳಸುತ್ತದೆ. ಸಾಮಾನ್ಯವಾಗಿ, ಟೇಬಲ್ಗಳು ವಿಭಿನ್ನ ಗುಂಪುಗಳಾಗಿ (ಸ್ಕೀಮಾಗಳಾಗಿ) ಸಂಘಟಿತವಾಗಿರುತ್ತವೆ. ಬಹುಮಾನವಾಗಿ, ಮೂಲ ರೂಪದಿಂದ ಡೇಟಾವನ್ನು ಸ್ಕೀಮೆಗೆ ಹೊಂದಿಸಲು ಪರಿವರ್ತನೆ ಮಾಡಬೇಕಾಗುತ್ತದೆ.
ನೋSQL ಡೇಟಾಬೇಸ್, ಉದಾಹರಣೆಗೆ CosmosDB, ಡೇಟಾದ ಮೇಲೆ ಸ್ಕೀಮಾಗಳನ್ನು ಜಾರಿಗೊಳಿಸುವುದಿಲ್ಲ ಮತ್ತು ಹೆಚ್ಚು ಸಂಕೀರ್ಣ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲು ಅನುಮತಿಸುತ್ತದೆ, ಉದಾಹರಣೆಗೆ ಹೈರಾರ್ಕಿಕಲ್ JSON ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳು ಅಥವಾ ಗ್ರಾಫ್‌ಗಳು. ಆದಾಗ್ಯೂ, ನೋSQL ಡೇಟಾಬೇಸ್‌ಗಳಿಗೆ SQL ರಿಚ್ ಪ್ರಶ್ನಿಸುವ ಸಾಮರ್ಥ್ಯವಿಲ್ಲ ಮತ್ತು ರೆಫರೆನ್ಷಿಯಲ್ ಇಂಟಿಗ್ರಿಟಿಯನ್ನು ಜಾರಿಗೊಳಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ, ಅಂದರೆ ಟೇಬಲ್ಗಳಲ್ಲಿ ಡೇಟಾ ಹೇಗೆ ರಚಿಸಲಾಗಿದೆ ಮತ್ತು ಟೇಬಲ್ಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ನಿಯಂತ್ರಿಸುವ ನಿಯಮಗಳು.
ಡೇಟಾ ಲೇಕ್ ಸಂಗ್ರಹಣೆ ಕಚ್ಚಾ, ಅಸಂರಚಿತ ರೂಪದಲ್ಲಿ ದೊಡ್ಡ ಡೇಟಾ ಸಂಗ್ರಹಗಳಿಗೆ ಬಳಸಲಾಗುತ್ತದೆ. ಡೇಟಾ ಲೇಕ್‌ಗಳು ಬಹುಮಾನವಾಗಿ ಬಿಗ್ ಡೇಟಾ ಜೊತೆಗೆ ಬಳಸಲಾಗುತ್ತವೆ, ಎಲ್ಲ ಡೇಟಾ ಒಂದು ಯಂತ್ರದಲ್ಲಿ ಹೊಂದಲು ಸಾಧ್ಯವಿಲ್ಲ ಮತ್ತು ಸರ್ವರ್ ಕ್ಲಸ್ಟರ್ ಮೂಲಕ ಸಂಗ್ರಹಿಸಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಬೇಕಾಗುತ್ತದೆ. ಪಾರ್ಕೆಟ್ ಬಿಗ್ ಡೇಟಾ ಜೊತೆಗೆ ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ಡೇಟಾ ಸ್ವರೂಪವಾಗಿದೆ.

3) ಡೇಟಾ ಪ್ರಕ್ರಿಯೆ

ಇದು ಡೇಟಾ ಪ್ರಯಾಣದ ಅತ್ಯಂತ ರೋಚಕ ಭಾಗ, ಇದು ಮೂಲ ರೂಪದಿಂದ ದೃಶ್ಯೀಕರಣ/ಮಾದರಿ ತರಬೇತಿಗೆ ಬಳಸಬಹುದಾದ ರೂಪಕ್ಕೆ ಡೇಟಾವನ್ನು ಪರಿವರ್ತಿಸುವುದನ್ನು ಒಳಗೊಂಡಿದೆ. ಪಠ್ಯ ಅಥವಾ ಚಿತ್ರಗಳಂತಹ ಅಸಂರಚಿತ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವಾಗ, ನಾವು ಡೇಟಾದಿಂದ ಲಕ್ಷಣಗಳನ್ನು ಹೊರತೆಗೆಯಲು ಕೆಲವು AI ತಂತ್ರಗಳನ್ನು ಬಳಸಬೇಕಾಗಬಹುದು, ಹೀಗಾಗಿ ಅದನ್ನು ಸಂರಚಿತ ರೂಪಕ್ಕೆ ಪರಿವರ್ತಿಸಲಾಗುತ್ತದೆ.

4) ದೃಶ್ಯೀಕರಣ / ಮಾನವ ಒಳನೋಟಗಳು

ಬಹುಮಾನವಾಗಿ, ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು, ಅದನ್ನು ದೃಶ್ಯೀಕರಿಸುವ ಅಗತ್ಯವಿರುತ್ತದೆ. ನಮ್ಮ ಸಾಧನಸಂಚಯದಲ್ಲಿ ಅನೇಕ ವಿಭಿನ್ನ ದೃಶ್ಯೀಕರಣ ತಂತ್ರಗಳು ಇದ್ದಾಗ, ನಾವು ಒಳನೋಟ ಪಡೆಯಲು ಸರಿಯಾದ ದೃಶ್ಯವನ್ನು ಕಂಡುಹಿಡಿಯಬಹುದು. ಬಹುಮಾನವಾಗಿ, ಡೇಟಾ ವಿಜ್ಞಾನಿ "ಡೇಟಾ ಜೊತೆ ಆಟವಾಡಬೇಕು", ಅದನ್ನು ಹಲವಾರು ಬಾರಿ ದೃಶ್ಯೀಕರಿಸಿ ಕೆಲವು ಸಂಬಂಧಗಳನ್ನು ಹುಡುಕುತ್ತಾನೆ. ಜೊತೆಗೆ, ನಾವು ಅಂದಾಜುಗಳನ್ನು ಪರೀಕ್ಷಿಸಲು ಅಥವಾ ಡೇಟಾದ ವಿಭಿನ್ನ ತುಂಡುಗಳ ನಡುವೆ ಸಂಬಂಧವನ್ನು ಸಾಬೀತುಪಡಿಸಲು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ತಂತ್ರಗಳನ್ನು ಬಳಸಬಹುದು.

5) ಭವಿಷ್ಯವಾಣಿ ಮಾದರಿಯನ್ನು ತರಬೇತುಗೊಳಿಸುವುದು

ಡೇಟಾ ಸೈನ್ಸ್‌ನ ಅಂತಿಮ ಗುರಿ ಡೇಟಾದ ಆಧಾರದ ಮೇಲೆ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಗುವುದು, ಆದ್ದರಿಂದ ನಾವು ಮಷೀನ್ ಲರ್ನಿಂಗ್ ತಂತ್ರಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಭವಿಷ್ಯವಾಣಿ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಬಹುದು. ನಂತರ ನಾವು ಇದನ್ನು ಹೊಸ, ಸಮಾನ ರಚನೆಯ ಡೇಟಾ ಸೆಟ್‌ಗಳೊಂದಿಗೆ ಭವಿಷ್ಯವಾಣಿಗಳನ್ನು ಮಾಡಲು ಬಳಸಬಹುದು.

ನಿಜವಾದ ಡೇಟಾದ ಮೇಲೆ ಅವಲಂಬಿಸಿ, ಕೆಲವು ಹಂತಗಳು ಇಲ್ಲದಿರಬಹುದು (ಉದಾ: ನಾವು ಈಗಾಗಲೇ ಡೇಟಾಬೇಸ್‌ನಲ್ಲಿ ಡೇಟಾ ಹೊಂದಿದ್ದಾಗ, ಅಥವಾ ಮಾದರಿ ತರಬೇತಿಗೆ ಅಗತ್ಯವಿಲ್ಲದಿದ್ದಾಗ), ಅಥವಾ ಕೆಲವು ಹಂತಗಳು ಹಲವಾರು ಬಾರಿ ಪುನರಾವರ್ತಿತವಾಗಬಹುದು (ಉದಾ: ಡೇಟಾ ಪ್ರಕ್ರಿಯೆ).

ಡಿಜಿಟಲೀಕರಣ ಮತ್ತು ಡಿಜಿಟಲ್ ಪರಿವರ್ತನೆ

ಕಳೆದ ದಶಕದಲ್ಲಿ, ಅನೇಕ ವ್ಯವಹಾರಗಳು ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವಾಗ ಡೇಟಾದ ಮಹತ್ವವನ್ನು ಅರ್ಥಮಾಡಿಕೊಂಡಿವೆ. ವ್ಯವಹಾರವನ್ನು ನಡೆಸಲು ಡೇಟಾ ಸೈನ್ಸ್ ತತ್ವಗಳನ್ನು ಅನ್ವಯಿಸಲು, ಮೊದಲು ಕೆಲವು ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಬೇಕು, ಅಂದರೆ ವ್ಯವಹಾರ ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ಡಿಜಿಟಲ್ ರೂಪಕ್ಕೆ ಅನುವಾದಿಸಬೇಕು. ಇದನ್ನು ಡಿಜಿಟಲೀಕರಣ ಎಂದು ಕರೆಯುತ್ತಾರೆ. ಈ ಡೇಟಾದ ಮೇಲೆ ಡೇಟಾ ಸೈನ್ಸ್ ತಂತ್ರಗಳನ್ನು ಅನ್ವಯಿಸಿ ನಿರ್ಧಾರಗಳನ್ನು ಮಾರ್ಗದರ್ಶನ ಮಾಡುವುದು ಡಿಜಿಟಲ್ ಪರಿವರ್ತನೆ ಎಂದು ಕರೆಯಲ್ಪಡುತ್ತದೆ, ಇದು ಉತ್ಪಾದಕತೆಯಲ್ಲಿ ಮಹತ್ವದ ಏರಿಕೆಗೆ (ಅಥವಾ ವ್ಯವಹಾರದ ತಿರುವಿಗೆ) ಕಾರಣವಾಗಬಹುದು.

ಒಂದು ಉದಾಹರಣೆಯನ್ನು ಪರಿಗಣಿಸೋಣ. ನಾವು ಒಂದು ಡೇಟಾ ಸೈನ್ಸ್ ಕೋರ್ಸ್ (ಇಂತಹದು) ಹೊಂದಿದ್ದೇವೆ, ಅದನ್ನು ಆನ್‌ಲೈನ್‌ನಲ್ಲಿ ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ನೀಡುತ್ತೇವೆ, ಮತ್ತು ಅದನ್ನು ಸುಧಾರಿಸಲು ಡೇಟಾ ಸೈನ್ಸ್ ಅನ್ನು ಬಳಸಲು ಬಯಸುತ್ತೇವೆ. ನಾವು ಇದನ್ನು ಹೇಗೆ ಮಾಡಬಹುದು?

ನಾವು "ಏನು ಡಿಜಿಟ್ ಆಗಬಹುದು?" ಎಂದು ಕೇಳುವುದರಿಂದ ಪ್ರಾರಂಭಿಸಬಹುದು. ಸರಳ ವಿಧಾನವೆಂದರೆ ಪ್ರತಿ ವಿದ್ಯಾರ್ಥಿ ಪ್ರತಿ ಘಟಕವನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು ತೆಗೆದುಕೊಳ್ಳುವ ಸಮಯವನ್ನು ಅಳೆಯುವುದು ಮತ್ತು ಪ್ರತಿ ಘಟಕದ ಕೊನೆಯಲ್ಲಿ ಬಹು ಆಯ್ಕೆ ಪ್ರಶ್ನೋತ್ತರ ಪರೀಕ್ಷೆಯನ್ನು ನೀಡಿ ಪಡೆದ ಜ್ಞಾನವನ್ನು ಅಳೆಯುವುದು. ಎಲ್ಲಾ ವಿದ್ಯಾರ್ಥಿಗಳ ಸಮಯ-ಪೂರ್ಣಗೊಳಿಸುವ ಸರಾಸರಿಯನ್ನು ಲೆಕ್ಕಹಾಕಿ, ಯಾವ ಘಟಕಗಳು ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ಹೆಚ್ಚು ಕಷ್ಟವನ್ನು ಉಂಟುಮಾಡುತ್ತವೆ ಎಂದು ಕಂಡುಹಿಡಿದು ಅವುಗಳನ್ನು ಸರಳಗೊಳಿಸುವುದಾಗಿ ಕೆಲಸ ಮಾಡಬಹುದು.

ನೀವು ಈ ವಿಧಾನವು ಆದರ್ಶವಲ್ಲ ಎಂದು ವಾದಿಸಬಹುದು, ಏಕೆಂದರೆ ಮಡ್ಯೂಲುಗಳು ವಿಭಿನ್ನ ಉದ್ದಗಳಾಗಿರಬಹುದು. ಮಡ್ಯೂಲಿನ ಉದ್ದ (ಅಕ್ಷರಗಳ ಸಂಖ್ಯೆಯಲ್ಲಿ) ಮೂಲಕ ಸಮಯವನ್ನು ಹಂಚುವುದು ಹೆಚ್ಚು ನ್ಯಾಯಸಮ್ಮತವಾಗಿರಬಹುದು, ಮತ್ತು ಆ ಮೌಲ್ಯಗಳನ್ನು ಹೋಲಿಸಬಹುದು.

ನಾವು ಬಹು ಆಯ್ಕೆ ಪರೀಕ್ಷೆಗಳ ಫಲಿತಾಂಶಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಲು ಪ್ರಾರಂಭಿಸಿದಾಗ, ವಿದ್ಯಾರ್ಥಿಗಳು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಕಷ್ಟಪಡುವ ತತ್ವಗಳನ್ನು ನಿರ್ಧರಿಸಲು ಪ್ರಯತ್ನಿಸಬಹುದು, ಮತ್ತು ಆ ಮಾಹಿತಿಯನ್ನು ವಿಷಯವನ್ನು ಸುಧಾರಿಸಲು ಬಳಸಬಹುದು. ಅದನ್ನು ಮಾಡಲು, ನಾವು ಪರೀಕ್ಷೆಗಳನ್ನು ಇಂತಹ ರೀತಿಯಲ್ಲಿ ವಿನ್ಯಾಸಗೊಳಿಸಬೇಕು, ಪ್ರತಿಯೊಂದು ಪ್ರಶ್ನೆ ಒಂದು ನಿರ್ದಿಷ್ಟ ತತ್ವ ಅಥವಾ ಜ್ಞಾನದ ತುಂಡಿಗೆ ನಕ್ಷೆ ಮಾಡುತ್ತದೆ.

ನಾವು ಇನ್ನಷ್ಟು ಸಂಕೀರ್ಣಗೊಳ್ಳಲು ಬಯಸಿದರೆ, ನಾವು ಪ್ರತಿ ಮಡ್ಯೂಲಿಗೆ ತೆಗೆದುಕೊಂಡ ಸಮಯವನ್ನು ವಿದ್ಯಾರ್ಥಿಗಳ ವಯೋ ವರ್ಗದ ವಿರುದ್ಧ ಚಿತ್ರಿಸಬಹುದು. ಕೆಲವು ವಯೋ ವರ್ಗಗಳಿಗೆ ಮಡ್ಯೂಲನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು ಅತಿಯಾದ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ ಅಥವಾ ವಿದ್ಯಾರ್ಥಿಗಳು ಪೂರ್ಣಗೊಳಿಸುವ ಮೊದಲು ಬಿಟ್ಟುಹೋಗುತ್ತಾರೆ ಎಂದು ನಾವು ಕಂಡುಹಿಡಿಯಬಹುದು. ಇದು ನಮಗೆ ಮಡ್ಯೂಲಿಗೆ ವಯೋ ಶಿಫಾರಸುಗಳನ್ನು ನೀಡಲು ಸಹಾಯ ಮಾಡಬಹುದು, ಮತ್ತು ತಪ್ಪಾದ ನಿರೀಕ್ಷೆಗಳಿಂದ ಜನರ ಅಸಮಾಧಾನವನ್ನು ಕಡಿಮೆ ಮಾಡಬಹುದು.

🚀 ಸವಾಲು

ಈ ಸವಾಲಿನಲ್ಲಿ, ನಾವು ಪಠ್ಯಗಳನ್ನು ನೋಡಿ ಡೇಟಾ ಸೈನ್ಸ್ ಕ್ಷೇತ್ರಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ತತ್ವಗಳನ್ನು ಹುಡುಕಲು ಪ್ರಯತ್ನಿಸುವೆವು. ನಾವು ಡೇಟಾ ಸೈನ್ಸ್ ಕುರಿತು ವಿಕಿಪೀಡಿಯ ಲೇಖನವನ್ನು ತೆಗೆದು, ಪಠ್ಯವನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಿ, ನಂತರ ಈ ರೀತಿಯ ಪದ ಮೋಡವನ್ನು ನಿರ್ಮಿಸುವೆವು:

ಕೋಡ್ ಓದಲು notebook.ipynb ಗೆ ಭೇಟಿ ನೀಡಿ. ನೀವು ಕೋಡ್ ಅನ್ನು ಚಲಾಯಿಸಬಹುದು ಮತ್ತು ಅದು ಎಲ್ಲಾ ಡೇಟಾ ಪರಿವರ್ತನೆಗಳನ್ನು ನೈಜ ಸಮಯದಲ್ಲಿ ಹೇಗೆ ನಿರ್ವಹಿಸುತ್ತದೆ ಎಂದು ನೋಡಬಹುದು.

ನೀವು ಜುಪೈಟರ್ ನೋಟ್ಬುಕ್‌ನಲ್ಲಿ ಕೋಡ್ ಅನ್ನು ಹೇಗೆ ಚಲಾಯಿಸುವುದು ಎಂದು ತಿಳಿಯದಿದ್ದರೆ, ಈ ಲೇಖನ ಅನ್ನು ನೋಡಿ.

ಪಾಠದ ನಂತರದ ಪ್ರಶ್ನೋತ್ತರ

ನಿಯೋಜನೆಗಳು

ಕಾರ್ಯ 1: ಮೇಲಿನ ಕೋಡ್ ಅನ್ನು ಬದಲಾಯಿಸಿ ಮತ್ತು ಬಿಗ್ ಡೇಟಾ ಮತ್ತು ಮಷೀನ್ ಲರ್ನಿಂಗ್ ಕ್ಷೇತ್ರಗಳಿಗೆ ಸಂಬಂಧಿಸಿದ ತತ್ವಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ
ಕಾರ್ಯ 2: ಡೇಟಾ ಸೈನ್ಸ್ ದೃಶ್ಯಾವಳಿಗಳನ್ನು ಕುರಿತು ಯೋಚಿಸಿ

ಕ್ರೆಡಿಟ್ಸ್

ಈ ಪಾಠವನ್ನು ♥️ ಸಹಿತ ಡ್ಮಿತ್ರಿ ಸೋಶ್ನಿಕೋವ್ ರವರು ರಚಿಸಿದ್ದಾರೆ

ಅಸ್ವೀಕರಣ:
ಈ ದಸ್ತಾವೇಜು Co-op Translator ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂದು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.