|
|
1 month ago | |
|---|---|---|
| .. | ||
| README.md | 1 month ago | |
| assignment.md | 1 month ago | |
README.md
ಡೇಟಾ ವ್ಯಾಖ್ಯಾನ
![]() |
|---|
| ಡೇಟಾ ವ್ಯಾಖ್ಯಾನ - @nitya ಅವರ ಸ್ಕೆಚ್ ನೋಟ್ |
ಡೇಟಾ ಎಂದರೆ ಅನ್ವೇಷಣೆ ಮಾಡಲು ಮತ್ತು ತಿಳಿವಳಿಕೆ ಹೊಂದಿದ ನಿರ್ಧಾರಗಳನ್ನು ಬೆಂಬಲಿಸಲು ಬಳಸುವ ವಾಸ್ತವಗಳು, ಮಾಹಿತಿ, ಅವಲೋಕನಗಳು ಮತ್ತು ಅಳತೆಗಳು. ಡೇಟಾ ಪಾಯಿಂಟ್ ಎಂದರೆ ಡೇಟಾ ಪಾಯಿಂಟ್ಗಳ ಸಂಗ್ರಹವಾದ ಡೇಟಾಸೆಟ್ನೊಳಗಿನ ಒಂದು ಏಕಕ ಡೇಟಾ. ಡೇಟಾಸೆಟ್ಗಳು ವಿಭಿನ್ನ ಸ್ವರೂಪಗಳು ಮತ್ತು ರಚನೆಗಳಲ್ಲಿ ಇರಬಹುದು ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ಅದರ ಮೂಲ ಅಥವಾ ಡೇಟಾ ಎಲ್ಲಿ ಬಂದಿತು ಎಂಬುದರ ಆಧಾರದ ಮೇಲೆ ಇರುತ್ತವೆ. ಉದಾಹರಣೆಗೆ, ಒಂದು ಕಂಪನಿಯ ಮಾಸಿಕ ಆದಾಯವು ಸ್ಪ್ರೆಡ್ಶೀಟ್ನಲ್ಲಿ ಇರಬಹುದು ಆದರೆ ಸ್ಮಾರ್ಟ್ ವಾಚ್ನಿಂದ ಗಂಟೆಗಟ್ಟಲೆ ಹೃದಯದ ದರದ ಡೇಟಾ JSON ಸ್ವರೂಪದಲ್ಲಿ ಇರಬಹುದು. ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಡೇಟಾಸೆಟ್ನೊಳಗಿನ ವಿಭಿನ್ನ ರೀತಿಯ ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುತ್ತಾರೆ.
ಈ ಪಾಠವು ಡೇಟಾವನ್ನು ಅದರ ಲಕ್ಷಣಗಳು ಮತ್ತು ಮೂಲಗಳ ಮೂಲಕ ಗುರುತಿಸುವುದು ಮತ್ತು ವರ್ಗೀಕರಿಸುವುದರ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದೆ.
ಪೂರ್ವ-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ
ಡೇಟಾ ಹೇಗೆ ವರ್ಣಿಸಲಾಗಿದೆ
ಕಚ್ಚಾ ಡೇಟಾ
ಕಚ್ಚಾ ಡೇಟಾ ಎಂದರೆ ಮೂಲದಿಂದ ಅದರ ಪ್ರಾಥಮಿಕ ಸ್ಥಿತಿಯಲ್ಲಿ ಬಂದಿರುವ ಮತ್ತು ವಿಶ್ಲೇಷಣೆ ಅಥವಾ ಸಂಘಟನೆಯಾಗದಿರುವ ಡೇಟಾ. ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಏನಾಗುತ್ತಿದೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು, ಅದನ್ನು ಮಾನವರು ಮತ್ತು ತಂತ್ರಜ್ಞಾನವು ಮುಂದುವರೆಸಿ ವಿಶ್ಲೇಷಿಸಲು ಬಳಸಬಹುದಾದ ಸ್ವರೂಪದಲ್ಲಿ ಸಂಘಟಿಸಬೇಕಾಗುತ್ತದೆ. ಡೇಟಾಸೆಟ್ನ ರಚನೆ ಅದನ್ನು ಹೇಗೆ ಸಂಘಟಿಸಲಾಗಿದೆ ಎಂಬುದನ್ನು ವಿವರಿಸುತ್ತದೆ ಮತ್ತು ಇದನ್ನು ರಚಿತ, ಅಸಂರಚಿತ ಮತ್ತು ಅರ್ಧ-ರಚಿತ ಎಂದು ವರ್ಗೀಕರಿಸಬಹುದು. ಈ ರಚನೆಗಳ ಪ್ರಕಾರ ಮೂಲದ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ ಆದರೆ ಕೊನೆಗೆ ಈ ಮೂರು ವರ್ಗಗಳಲ್ಲಿ ಸೇರಿಕೊಳ್ಳುತ್ತದೆ.
ಪ್ರಮಾಣಾತ್ಮಕ ಡೇಟಾ
ಪ್ರಮಾಣಾತ್ಮಕ ಡೇಟಾ ಎಂದರೆ ಡೇಟಾಸೆಟ್ನೊಳಗಿನ ಸಂಖ್ಯಾತ್ಮಕ ಅವಲೋಕನಗಳು ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ವಿಶ್ಲೇಷಣೆ, ಅಳತೆ ಮತ್ತು ಗಣಿತೀಯವಾಗಿ ಬಳಸಬಹುದು. ಪ್ರಮಾಣಾತ್ಮಕ ಡೇಟಾದ ಕೆಲವು ಉದಾಹರಣೆಗಳು: ಒಂದು ದೇಶದ ಜನಸಂಖ್ಯೆ, ವ್ಯಕ್ತಿಯ ಎತ್ತರ ಅಥವಾ ಕಂಪನಿಯ ತ್ರೈಮಾಸಿಕ ಆದಾಯ. ಕೆಲವು ಹೆಚ್ಚುವರಿ ವಿಶ್ಲೇಷಣೆಯೊಂದಿಗೆ, ಪ್ರಮಾಣಾತ್ಮಕ ಡೇಟಾವನ್ನು ವಾಯು ಗುಣಮಟ್ಟ ಸೂಚ್ಯಂಕ (AQI) ನ ಋತುವಿನ ಪ್ರವೃತ್ತಿಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಅಥವಾ ಸಾಮಾನ್ಯ ಕೆಲಸದ ದಿನದ ರಶ್ ಹವರ್ ಟ್ರಾಫಿಕ್ ಸಂಭವನೀಯತೆಯನ್ನು ಅಂದಾಜಿಸಲು ಬಳಸಬಹುದು.
ಗುಣಾತ್ಮಕ ಡೇಟಾ
ಗುಣಾತ್ಮಕ ಡೇಟಾ, ಅಥವಾ ವರ್ಗೀಕೃತ ಡೇಟಾ ಎಂದೂ ಕರೆಯಲ್ಪಡುವುದು, ಪ್ರಮಾಣಾತ್ಮಕ ಡೇಟಾದಂತಹ ವಸ್ತುನಿಷ್ಠವಾಗಿ ಅಳತೆಯಾಗದ ಡೇಟಾ. ಇದು ಸಾಮಾನ್ಯವಾಗಿ ಉತ್ಪನ್ನ ಅಥವಾ ಪ್ರಕ್ರಿಯೆಯ ಗುಣಮಟ್ಟವನ್ನು ಹಿಡಿದಿಡುವ ವಿಭಿನ್ನ ಸ್ವರೂಪದ ವಿಷಯಾತ್ಮಕ ಡೇಟಾಗಳಾಗಿರುತ್ತದೆ. ಕೆಲವೊಮ್ಮೆ, ಗುಣಾತ್ಮಕ ಡೇಟಾ ಸಂಖ್ಯಾತ್ಮಕವಾಗಿರಬಹುದು ಆದರೆ ಸಾಮಾನ್ಯವಾಗಿ ಗಣಿತೀಯವಾಗಿ ಬಳಸಲಾಗುವುದಿಲ್ಲ, ಉದಾಹರಣೆಗೆ ಫೋನ್ ಸಂಖ್ಯೆಗಳು ಅಥವಾ ಟೈಮ್ಸ್ಟ್ಯಾಂಪ್ಗಳು. ಗುಣಾತ್ಮಕ ಡೇಟಾದ ಕೆಲವು ಉದಾಹರಣೆಗಳು: ವೀಡಿಯೋ ಕಾಮೆಂಟ್ಗಳು, ಕಾರಿನ ತಯಾರಿಕೆ ಮತ್ತು ಮಾದರಿ ಅಥವಾ ನಿಮ್ಮ ಹತ್ತಿರದ ಸ್ನೇಹಿತರ ಪ್ರಿಯ ಬಣ್ಣ. ಗುಣಾತ್ಮಕ ಡೇಟಾವನ್ನು ಗ್ರಾಹಕರು ಯಾವ ಉತ್ಪನ್ನಗಳನ್ನು ಹೆಚ್ಚು ಇಷ್ಟಪಡುತ್ತಾರೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಅಥವಾ ಉದ್ಯೋಗ ಅರ್ಜಿ ರೆಸ್ಯೂಮೆಗಳಲ್ಲಿ ಜನಪ್ರಿಯ ಕೀವರ್ಡ್ಗಳನ್ನು ಗುರುತಿಸಲು ಬಳಸಬಹುದು.
ರಚಿತ ಡೇಟಾ
ರಚಿತ ಡೇಟಾ ಎಂದರೆ ಸಾಲುಗಳು ಮತ್ತು ಕಾಲಮ್ಗಳಾಗಿ ಸಂಘಟಿತವಾಗಿರುವ ಡೇಟಾ, ಇಲ್ಲಿ ಪ್ರತಿ ಸಾಲು ಒಂದೇ ರೀತಿಯ ಕಾಲಮ್ಗಳ ಸಮೂಹವನ್ನು ಹೊಂದಿರುತ್ತದೆ. ಕಾಲಮ್ಗಳು ನಿರ್ದಿಷ್ಟ ಪ್ರಕಾರದ ಮೌಲ್ಯವನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತವೆ ಮತ್ತು ಆ ಮೌಲ್ಯ ಏನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ವಿವರಿಸುವ ಹೆಸರಿನಿಂದ ಗುರುತಿಸಲಾಗುತ್ತದೆ, ಆದರೆ ಸಾಲುಗಳು ನಿಜವಾದ ಮೌಲ್ಯಗಳನ್ನು ಹೊಂದಿರುತ್ತವೆ. ಕಾಲಮ್ಗಳಿಗೆ ಸಾಮಾನ್ಯವಾಗಿ ಮೌಲ್ಯಗಳ ಮೇಲೆ ನಿಯಮಗಳು ಅಥವಾ ನಿರ್ಬಂಧಗಳು ಇರುತ್ತವೆ, ಮೌಲ್ಯಗಳು ಕಾಲಮ್ ಅನ್ನು ಸರಿಯಾಗಿ ಪ್ರತಿನಿಧಿಸುವುದನ್ನು ಖಚಿತಪಡಿಸಲು. ಉದಾಹರಣೆಗೆ, ಗ್ರಾಹಕರ ಸ್ಪ್ರೆಡ್ಶೀಟ್ ಅನ್ನು ಕಲ್ಪಿಸಿ, ಪ್ರತಿ ಸಾಲು ಫೋನ್ ಸಂಖ್ಯೆಯನ್ನು ಹೊಂದಿರಬೇಕು ಮತ್ತು ಫೋನ್ ಸಂಖ್ಯೆಗಳು ಎಂದಿಗೂ ಅಕ್ಷರಗಳನ್ನು ಹೊಂದಿರಬಾರದು. ಫೋನ್ ಸಂಖ್ಯೆ ಕಾಲಮ್ನಲ್ಲಿ ಖಾಲಿ ಇರಬಾರದು ಮತ್ತು ಸಂಖ್ಯೆಗಳನ್ನಷ್ಟೇ ಹೊಂದಿರಬೇಕು ಎಂಬ ನಿಯಮಗಳು ಇರಬಹುದು.
ರಚಿತ ಡೇಟಾದ ಲಾಭವೆಂದರೆ ಅದನ್ನು ಇತರ ರಚಿತ ಡೇಟಾಗಳೊಂದಿಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ಸಂಘಟಿಸಬಹುದು. ಆದರೆ, ಡೇಟಾ ನಿರ್ದಿಷ್ಟ ರೀತಿಯಲ್ಲಿ ಸಂಘಟಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿರುವುದರಿಂದ, ಅದರ ಒಟ್ಟು ರಚನೆಯಲ್ಲಿ ಬದಲಾವಣೆಗಳನ್ನು ಮಾಡುವುದು ಬಹಳ ಪ್ರಯತ್ನದ ಕೆಲಸವಾಗಬಹುದು. ಉದಾಹರಣೆಗೆ, ಗ್ರಾಹಕರ ಸ್ಪ್ರೆಡ್ಶೀಟ್ಗೆ ಖಾಲಿ ಇರಬಾರದ ಇಮೇಲ್ ಕಾಲಮ್ ಸೇರಿಸುವುದು ಎಂದರೆ ಈ ಮೌಲ್ಯಗಳನ್ನು ಡೇಟಾಸೆಟ್ನಲ್ಲಿನ ಇತ್ತೀಚಿನ ಗ್ರಾಹಕರ ಸಾಲುಗಳಿಗೆ ಹೇಗೆ ಸೇರಿಸುವುದು ಎಂದು ನೀವು ಕಂಡುಹಿಡಿಯಬೇಕಾಗುತ್ತದೆ.
ರಚಿತ ಡೇಟಾದ ಉದಾಹರಣೆಗಳು: ಸ್ಪ್ರೆಡ್ಶೀಟ್ಗಳು, ಸಂಬಂಧಿತ ಡೇಟಾಬೇಸ್ಗಳು, ಫೋನ್ ಸಂಖ್ಯೆಗಳು, ಬ್ಯಾಂಕ್ ಸ್ಟೇಟ್ಮೆಂಟ್ಗಳು
ಅಸಂರಚಿತ ಡೇಟಾ
ಅಸಂರಚಿತ ಡೇಟಾವನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಸಾಲುಗಳು ಅಥವಾ ಕಾಲಮ್ಗಳಾಗಿ ವರ್ಗೀಕರಿಸಲಾಗುವುದಿಲ್ಲ ಮತ್ತು ಅನುಸರಿಸಬೇಕಾದ ಸ್ವರೂಪ ಅಥವಾ ನಿಯಮಗಳ ಸಮೂಹವಿಲ್ಲ. ಅಸಂರಚಿತ ಡೇಟಾ ರಚನೆ ಮೇಲೆ ಕಡಿಮೆ ನಿರ್ಬಂಧಗಳಿರುವುದರಿಂದ, ರಚಿತ ಡೇಟಾಸೆಟ್ಗಿಂತ ಹೊಸ ಮಾಹಿತಿಯನ್ನು ಸೇರಿಸುವುದು ಸುಲಭ. ಉದಾಹರಣೆಗೆ, ಪ್ರತಿಯೊಂದು 2 ನಿಮಿಷಗಳಿಗೊಮ್ಮೆ ಬಾರೋಮೆಟ್ರಿಕ್ ಒತ್ತಡವನ್ನು ಸೆನ್ಸರ್ ಹಿಡಿಯುತ್ತಿದ್ದರೆ, ಈಗ ಅದು ತಾಪಮಾನವನ್ನು ಅಳತೆಮಾಡಲು ಮತ್ತು ದಾಖಲಿಸಲು ಸಾಧ್ಯವಾಗುವ ಅಪ್ಡೇಟ್ ಪಡೆದಿದ್ದರೆ, ಅಸಂರಚಿತ ಡೇಟಾದಲ್ಲಿ ಇದರಿಂದ ಇತ್ತೀಚಿನ ಡೇಟಾವನ್ನು ಬದಲಾಯಿಸುವ ಅಗತ್ಯವಿಲ್ಲ. ಆದರೆ, ಈ ರೀತಿಯ ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುವುದು ಅಥವಾ ಪರಿಶೀಲಿಸುವುದು ಹೆಚ್ಚು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ಉದಾಹರಣೆಗೆ, ಸೆನ್ಸರ್ ಡೇಟಾದಿಂದ ಹಿಂದಿನ ತಿಂಗಳ ಸರಾಸರಿ ತಾಪಮಾನವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಬಯಸುವ ವಿಜ್ಞಾನಿ, ಕೆಲವು ದಾಖಲೆಗಳಲ್ಲಿ "e" ಎಂಬ ಅಕ್ಷರವನ್ನು ಕಂಡುಹಿಡಿದಿದ್ದಾನೆ, ಇದು ಸೆನ್ಸರ್ ಕೆಡವಿದೆಯೆಂದು ಸೂಚಿಸುವುದಕ್ಕಾಗಿ, ಸಾಮಾನ್ಯ ಸಂಖ್ಯೆಯ ಬದಲು, ಅಂದರೆ ಡೇಟಾ ಅಪೂರ್ಣವಾಗಿದೆ.
ಅಸಂರಚಿತ ಡೇಟಾದ ಉದಾಹರಣೆಗಳು: ಪಠ್ಯ ಕಡತಗಳು, ಪಠ್ಯ ಸಂದೇಶಗಳು, ವೀಡಿಯೋ ಕಡತಗಳು
ಅರ್ಧ-ರಚಿತ
ಅರ್ಧ-ರಚಿತ ಡೇಟಾ ರಚಿತ ಮತ್ತು ಅಸಂರಚಿತ ಡೇಟಾದ ಸಂಯೋಜನೆಯಾಗಿರುವ ಲಕ್ಷಣಗಳನ್ನು ಹೊಂದಿದೆ. ಇದು ಸಾಮಾನ್ಯವಾಗಿ ಸಾಲುಗಳು ಮತ್ತು ಕಾಲಮ್ಗಳ ಸ್ವರೂಪಕ್ಕೆ ಅನುಗುಣವಾಗಿರದು, ಆದರೆ ರಚಿತ ಎಂದು ಪರಿಗಣಿಸಲ್ಪಡುವ ರೀತಿಯಲ್ಲಿ ಸಂಘಟಿತವಾಗಿರುತ್ತದೆ ಮತ್ತು ನಿಶ್ಚಿತ ಸ್ವರೂಪ ಅಥವಾ ನಿಯಮಗಳ ಸಮೂಹವನ್ನು ಅನುಸರಿಸಬಹುದು. ರಚನೆ ಮೂಲಗಳ ಪ್ರಕಾರ ಬದಲಾಗುತ್ತದೆ, ಉದಾಹರಣೆಗೆ ಚೆನ್ನಾಗಿ ವ್ಯಾಖ್ಯಾನಗೊಂಡ ಹೈರಾರ್ಕಿಯಿಂದ ಹಿಡಿದು ಹೊಸ ಮಾಹಿತಿಯನ್ನು ಸುಲಭವಾಗಿ ಸಂಯೋಜಿಸಲು ಅನುಕೂಲಕರವಾದ ಹೆಚ್ಚು ಲವಚಿಕ ಸ್ವರೂಪದವರೆಗೆ. ಮೆಟಾಡೇಟಾ ಎಂದರೆ ಡೇಟಾ ಹೇಗೆ ಸಂಘಟಿತವಾಗಿದೆ ಮತ್ತು ಸಂಗ್ರಹಿಸಲಾಗಿದೆ ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸಲು ಸಹಾಯ ಮಾಡುವ ಸೂಚಕಗಳು ಮತ್ತು ಡೇಟಾ ಪ್ರಕಾರದ ಆಧಾರದ ಮೇಲೆ ವಿವಿಧ ಹೆಸರಿನಿರುತ್ತವೆ. ಮೆಟಾಡೇಟಾದ ಕೆಲವು ಸಾಮಾನ್ಯ ಹೆಸರುಗಳು ಟ್ಯಾಗ್ಗಳು, ಅಂಶಗಳು, ಘಟಕಗಳು ಮತ್ತು ಗುಣಲಕ್ಷಣಗಳು. ಉದಾಹರಣೆಗೆ, ಸಾಮಾನ್ಯ ಇಮೇಲ್ ಸಂದೇಶವು ವಿಷಯ, ದೇಹ ಮತ್ತು ಸ್ವೀಕರಿಸುವವರ ಸಮೂಹವನ್ನು ಹೊಂದಿರುತ್ತದೆ ಮತ್ತು ಯಾರಿಂದ ಅಥವಾ ಯಾವಾಗ ಕಳುಹಿಸಲಾಯಿತು ಎಂಬುದರ ಮೂಲಕ ಸಂಘಟಿಸಲಾಗಬಹುದು.
ಅರ್ಧ-ರಚಿತ ಡೇಟಾದ ಉದಾಹರಣೆಗಳು: HTML, CSV ಕಡತಗಳು, ಜಾವಾಸ್ಕ್ರಿಪ್ಟ್ ಆಬ್ಜೆಕ್ಟ್ ನೋಟೇಶನ್ (JSON)
ಡೇಟಾ ಮೂಲಗಳು
ಡೇಟಾ ಮೂಲ ಎಂದರೆ ಡೇಟಾ ಉತ್ಪತ್ತಿಯಾದ ಪ್ರಾಥಮಿಕ ಸ್ಥಳ ಅಥವಾ ಅದು "ನಿವಾಸ" ಹೊಂದಿರುವ ಸ್ಥಳ ಮತ್ತು ಅದು ಹೇಗೆ ಮತ್ತು ಯಾವಾಗ ಸಂಗ್ರಹಿಸಲ್ಪಟ್ಟಿತು ಎಂಬುದರ ಆಧಾರದ ಮೇಲೆ ಬದಲಾಗುತ್ತದೆ. ಬಳಕೆದಾರರಿಂದ ಉತ್ಪತ್ತಿಯಾದ ಡೇಟಾವನ್ನು ಪ್ರಾಥಮಿಕ ಡೇಟಾ ಎಂದು ಕರೆಯುತ್ತಾರೆ, ಮತ್ತು ಸಾಮಾನ್ಯ ಬಳಕೆಗೆ ಸಂಗ್ರಹಿಸಿದ ಮೂಲದಿಂದ ಬಂದ ಡೇಟಾವನ್ನು ದ್ವಿತೀಯ ಡೇಟಾ ಎಂದು ಕರೆಯುತ್ತಾರೆ. ಉದಾಹರಣೆಗೆ, ಒಂದು ಗುಂಪು ವಿಜ್ಞಾನಿಗಳು ಮಳೆಕಾಡಿನಲ್ಲಿ ಅವಲೋಕನಗಳನ್ನು ಸಂಗ್ರಹಿಸುತ್ತಿದ್ದರೆ ಅವರು ಪ್ರಾಥಮಿಕ ಎಂದು ಪರಿಗಣಿಸಲ್ಪಡುತ್ತಾರೆ ಮತ್ತು ಅವರು ಅದನ್ನು ಇತರ ವಿಜ್ಞಾನಿಗಳೊಂದಿಗೆ ಹಂಚಿಕೊಳ್ಳಲು ನಿರ್ಧರಿಸಿದರೆ, ಅದನ್ನು ಬಳಸುವವರಿಗೆ ದ್ವಿತೀಯ ಎಂದು ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ.
ಡೇಟಾಬೇಸ್ಗಳು ಸಾಮಾನ್ಯ ಮೂಲವಾಗಿದ್ದು, ಡೇಟಾಬೇಸ್ ನಿರ್ವಹಣಾ ವ್ಯವಸ್ಥೆಯ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿವೆ, ಬಳಕೆದಾರರು ಡೇಟಾವನ್ನು ಅನ್ವೇಷಿಸಲು ಕ್ವೆರಿಗಳು ಎಂದು ಕರೆಯುವ ಆಜ್ಞೆಗಳನ್ನು ಬಳಸುತ್ತಾರೆ. ಫೈಲ್ಗಳು ಡೇಟಾ ಮೂಲಗಳಾಗಿ ಧ್ವನಿ, ಚಿತ್ರ ಮತ್ತು ವೀಡಿಯೋ ಕಡತಗಳಾಗಿರಬಹುದು ಮತ್ತು ಎಕ್ಸೆಲ್ನಂತಹ ಸ್ಪ್ರೆಡ್ಶೀಟ್ಗಳಾಗಿರಬಹುದು. ಇಂಟರ್ನೆಟ್ ಮೂಲಗಳು ಡೇಟಾ ಹೋಸ್ಟ್ ಮಾಡುವ ಸಾಮಾನ್ಯ ಸ್ಥಳವಾಗಿದ್ದು, ಅಲ್ಲಿ ಡೇಟಾಬೇಸ್ಗಳು ಮತ್ತು ಫೈಲ್ಗಳು ದೊರೆಯಬಹುದು. ಅಪ್ಲಿಕೇಶನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಇಂಟರ್ಫೇಸ್ಗಳು, ಅಥವಾ APIಗಳು, ಪ್ರೋಗ್ರಾಮರ್ಗಳಿಗೆ ಇಂಟರ್ನೆಟ್ ಮೂಲಕ ಬಾಹ್ಯ ಬಳಕೆದಾರರೊಂದಿಗೆ ಡೇಟಾ ಹಂಚಿಕೊಳ್ಳಲು ಮಾರ್ಗಗಳನ್ನು ಸೃಷ್ಟಿಸಲು ಅನುಮತಿಸುತ್ತವೆ, ಮತ್ತು ವೆಬ್ ಸ್ಕ್ರೇಪಿಂಗ್ ಪ್ರಕ್ರಿಯೆ ವೆಬ್ ಪುಟದಿಂದ ಡೇಟಾವನ್ನು ಹೊರತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ. ಡೇಟಾ ಜೊತೆ ಕೆಲಸ ಮಾಡುವ ಪಾಠಗಳು ವಿವಿಧ ಡೇಟಾ ಮೂಲಗಳನ್ನು ಹೇಗೆ ಬಳಸುವುದು ಎಂಬುದರ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತವೆ.
ಸಾರಾಂಶ
ಈ ಪಾಠದಲ್ಲಿ ನಾವು ಕಲಿತದ್ದು:
- ಡೇಟಾ ಎಂದರೇನು
- ಡೇಟಾವನ್ನು ಹೇಗೆ ವರ್ಣಿಸಲಾಗುತ್ತದೆ
- ಡೇಟಾವನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ
- ಡೇಟಾವನ್ನು ಎಲ್ಲಿಂದ ಕಂಡುಹಿಡಿಯಬಹುದು
🚀 ಸವಾಲು
ಕಾಗಲ್ ಒಂದು ಉತ್ತಮ ಮುಕ್ತ ಡೇಟಾಸೆಟ್ ಮೂಲವಾಗಿದೆ. ಡೇಟಾಸೆಟ್ ಹುಡುಕಾಟ ಸಾಧನ ಬಳಸಿ ಕೆಲವು ಆಸಕ್ತಿದಾಯಕ ಡೇಟಾಸೆಟ್ಗಳನ್ನು ಹುಡುಕಿ ಮತ್ತು ಈ ಮಾನದಂಡಗಳೊಂದಿಗೆ 3-5 ಡೇಟಾಸೆಟ್ಗಳನ್ನು ವರ್ಗೀಕರಿಸಿ:
- ಡೇಟಾ ಪ್ರಮಾಣಾತ್ಮಕ ಅಥವಾ ಗುಣಾತ್ಮಕವೇ?
- ಡೇಟಾ ರಚಿತ, ಅಸಂರಚಿತ ಅಥವಾ ಅರ್ಧ-ರಚಿತವೇ?
ಪೋಸ್ಟ್-ಪಾಠ ಪ್ರಶ್ನೋತ್ತರ
ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂ ಅಧ್ಯಯನ
- ಈ ಮೈಕ್ರೋಸಾಫ್ಟ್ ಲರ್ನ್ ಘಟಕ, ನಿಮ್ಮ ಡೇಟಾವನ್ನು ವರ್ಗೀಕರಿಸಿ ಎಂಬ ಶೀರ್ಷಿಕೆಯೊಂದಿಗೆ, ರಚಿತ, ಅರ್ಧ-ರಚಿತ ಮತ್ತು ಅಸಂರಚಿತ ಡೇಟಾದ ವಿವರವಾದ ವಿವರಣೆಯನ್ನು ಹೊಂದಿದೆ.
ಹುದ್ದೆ
ಡೇಟಾಸೆಟ್ಗಳನ್ನು ವರ್ಗೀಕರಿಸುವುದು
ಅಸ್ವೀಕರಣ:
ಈ ದಸ್ತಾವೇಜು Co-op Translator ಎಂಬ AI ಅನುವಾದ ಸೇವೆಯನ್ನು ಬಳಸಿ ಅನುವಾದಿಸಲಾಗಿದೆ. ನಾವು ಶುದ್ಧತೆಯತ್ತ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಸ್ವಯಂಚಾಲಿತ ಅನುವಾದಗಳಲ್ಲಿ ತಪ್ಪುಗಳು ಅಥವಾ ಅಸತ್ಯತೆಗಳು ಇರಬಹುದು ಎಂಬುದನ್ನು ದಯವಿಟ್ಟು ಗಮನಿಸಿ. ಮೂಲ ಭಾಷೆಯಲ್ಲಿರುವ ಮೂಲ ದಸ್ತಾವೇಜನ್ನು ಅಧಿಕೃತ ಮೂಲವೆಂದು ಪರಿಗಣಿಸಬೇಕು. ಮಹತ್ವದ ಮಾಹಿತಿಗಾಗಿ, ವೃತ್ತಿಪರ ಮಾನವ ಅನುವಾದವನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗುತ್ತದೆ. ಈ ಅನುವಾದ ಬಳಕೆಯಿಂದ ಉಂಟಾಗುವ ಯಾವುದೇ ತಪ್ಪು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಿಕೆ ಅಥವಾ ತಪ್ಪು ವಿವರಣೆಗಳಿಗೆ ನಾವು ಹೊಣೆಗಾರರಾಗುವುದಿಲ್ಲ.
