You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

114 lines
18 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "5f8e7cdefa096664ae86f795be571580",
"translation_date": "2025-09-05T21:02:05+00:00",
"source_file": "5-Data-Science-In-Cloud/17-Introduction/README.md",
"language_code": "el"
}
-->
# Εισαγωγή στην Επιστήμη Δεδομένων στο Cloud
|![ Σκίτσο από [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/17-DataScience-Cloud.png)|
|:---:|
| Επιστήμη Δεδομένων στο Cloud: Εισαγωγή - _Σκίτσο από [@nitya](https://twitter.com/nitya)_ |
Σε αυτό το μάθημα, θα μάθετε τις βασικές αρχές του Cloud, θα δείτε γιατί μπορεί να είναι ενδιαφέρον να χρησιμοποιήσετε υπηρεσίες Cloud για να εκτελέσετε τα έργα επιστήμης δεδομένων σας και θα εξετάσουμε μερικά παραδείγματα έργων επιστήμης δεδομένων που εκτελούνται στο Cloud.
## [Προ-Διάλεξης Κουίζ](https://ff-quizzes.netlify.app/en/ds/quiz/32)
## Τι είναι το Cloud;
Το Cloud, ή Υπολογιστική στο Cloud, είναι η παροχή μιας ευρείας γκάμας υπηρεσιών υπολογιστικής με πληρωμή ανά χρήση, που φιλοξενούνται σε μια υποδομή μέσω του διαδικτύου. Οι υπηρεσίες περιλαμβάνουν λύσεις όπως αποθήκευση, βάσεις δεδομένων, δικτύωση, λογισμικό, αναλυτικά δεδομένα και έξυπνες υπηρεσίες.
Συνήθως διακρίνουμε το Δημόσιο, Ιδιωτικό και Υβριδικό Cloud ως εξής:
* Δημόσιο Cloud: ένα δημόσιο Cloud ανήκει και λειτουργεί από έναν τρίτο πάροχο υπηρεσιών Cloud, ο οποίος παρέχει τους υπολογιστικούς του πόρους μέσω του διαδικτύου στο κοινό.
* Ιδιωτικό Cloud: αναφέρεται σε υπολογιστικούς πόρους Cloud που χρησιμοποιούνται αποκλειστικά από μια επιχείρηση ή οργανισμό, με υπηρεσίες και υποδομή που διατηρούνται σε ιδιωτικό δίκτυο.
* Υβριδικό Cloud: το υβριδικό Cloud είναι ένα σύστημα που συνδυάζει δημόσια και ιδιωτικά Clouds. Οι χρήστες επιλέγουν ένα κέντρο δεδομένων εντός της επιχείρησης, ενώ επιτρέπουν στα δεδομένα και τις εφαρμογές να εκτελούνται σε ένα ή περισσότερα δημόσια Clouds.
Οι περισσότερες υπηρεσίες υπολογιστικής στο Cloud εμπίπτουν σε τρεις κατηγορίες: Υποδομή ως Υπηρεσία (IaaS), Πλατφόρμα ως Υπηρεσία (PaaS) και Λογισμικό ως Υπηρεσία (SaaS).
* Υποδομή ως Υπηρεσία (IaaS): οι χρήστες νοικιάζουν μια υποδομή IT όπως διακομιστές και εικονικές μηχανές (VMs), αποθήκευση, δίκτυα, λειτουργικά συστήματα.
* Πλατφόρμα ως Υπηρεσία (PaaS): οι χρήστες νοικιάζουν ένα περιβάλλον για ανάπτυξη, δοκιμή, παράδοση και διαχείριση εφαρμογών λογισμικού. Οι χρήστες δεν χρειάζεται να ανησυχούν για τη ρύθμιση ή τη διαχείριση της υποδομής των διακομιστών, της αποθήκευσης, του δικτύου και των βάσεων δεδομένων που απαιτούνται για την ανάπτυξη.
* Λογισμικό ως Υπηρεσία (SaaS): οι χρήστες αποκτούν πρόσβαση σε εφαρμογές λογισμικού μέσω του διαδικτύου, κατά παραγγελία και συνήθως με βάση συνδρομή. Οι χρήστες δεν χρειάζεται να ανησυχούν για τη φιλοξενία και τη διαχείριση της εφαρμογής λογισμικού, της υποκείμενης υποδομής ή της συντήρησης, όπως αναβαθμίσεις λογισμικού και επιδιορθώσεις ασφαλείας.
Μερικοί από τους μεγαλύτερους παρόχους Cloud είναι το Amazon Web Services, το Google Cloud Platform και το Microsoft Azure.
## Γιατί να επιλέξετε το Cloud για Επιστήμη Δεδομένων;
Οι προγραμματιστές και οι επαγγελματίες IT επιλέγουν να δουλέψουν με το Cloud για πολλούς λόγους, όπως οι εξής:
* Καινοτομία: μπορείτε να ενισχύσετε τις εφαρμογές σας ενσωματώνοντας καινοτόμες υπηρεσίες που δημιουργούνται από τους παρόχους Cloud απευθείας στις εφαρμογές σας.
* Ευελιξία: πληρώνετε μόνο για τις υπηρεσίες που χρειάζεστε και μπορείτε να επιλέξετε από μια ευρεία γκάμα υπηρεσιών. Συνήθως πληρώνετε ανά χρήση και προσαρμόζετε τις υπηρεσίες σας σύμφωνα με τις εξελισσόμενες ανάγκες σας.
* Προϋπολογισμός: δεν χρειάζεται να κάνετε αρχικές επενδύσεις για την αγορά υλικού και λογισμικού, τη ρύθμιση και τη λειτουργία κέντρων δεδομένων εντός της επιχείρησης, και μπορείτε απλά να πληρώνετε για ό,τι χρησιμοποιείτε.
* Κλιμάκωση: οι πόροι σας μπορούν να κλιμακωθούν σύμφωνα με τις ανάγκες του έργου σας, που σημαίνει ότι οι εφαρμογές σας μπορούν να χρησιμοποιούν περισσότερη ή λιγότερη υπολογιστική ισχύ, αποθήκευση και εύρος ζώνης, προσαρμοζόμενες σε εξωτερικούς παράγοντες οποιαδήποτε στιγμή.
* Παραγωγικότητα: μπορείτε να εστιάσετε στην επιχείρησή σας αντί να ξοδεύετε χρόνο σε εργασίες που μπορούν να διαχειριστούν άλλοι, όπως η διαχείριση κέντρων δεδομένων.
* Αξιοπιστία: η Υπολογιστική στο Cloud προσφέρει διάφορους τρόπους για συνεχή δημιουργία αντιγράφων ασφαλείας των δεδομένων σας και μπορείτε να δημιουργήσετε σχέδια ανάκαμψης από καταστροφές για να διατηρήσετε την επιχείρηση και τις υπηρεσίες σας σε λειτουργία, ακόμα και σε περιόδους κρίσης.
* Ασφάλεια: μπορείτε να επωφεληθείτε από πολιτικές, τεχνολογίες και ελέγχους που ενισχύουν την ασφάλεια του έργου σας.
Αυτοί είναι μερικοί από τους πιο συνηθισμένους λόγους για τους οποίους οι άνθρωποι επιλέγουν να χρησιμοποιούν υπηρεσίες Cloud. Τώρα που έχουμε μια καλύτερη κατανόηση του τι είναι το Cloud και ποια είναι τα κύρια οφέλη του, ας δούμε πιο συγκεκριμένα τις δουλειές των επιστημόνων δεδομένων και των προγραμματιστών που δουλεύουν με δεδομένα, και πώς το Cloud μπορεί να τους βοηθήσει με διάφορες προκλήσεις που μπορεί να αντιμετωπίσουν:
* Αποθήκευση μεγάλων ποσοτήτων δεδομένων: αντί να αγοράζετε, να διαχειρίζεστε και να προστατεύετε μεγάλους διακομιστές, μπορείτε να αποθηκεύετε τα δεδομένα σας απευθείας στο Cloud, με λύσεις όπως το Azure Cosmos DB, το Azure SQL Database και το Azure Data Lake Storage.
* Ενσωμάτωση δεδομένων: η ενσωμάτωση δεδομένων είναι ένα βασικό μέρος της Επιστήμης Δεδομένων, που σας επιτρέπει να κάνετε τη μετάβαση από τη συλλογή δεδομένων στη λήψη δράσεων. Με τις υπηρεσίες ενσωμάτωσης δεδομένων που προσφέρονται στο Cloud, μπορείτε να συλλέγετε, να μετασχηματίζετε και να ενσωματώνετε δεδομένα από διάφορες πηγές σε μια ενιαία αποθήκη δεδομένων, με το Data Factory.
* Επεξεργασία δεδομένων: η επεξεργασία μεγάλων ποσοτήτων δεδομένων απαιτεί πολλή υπολογιστική ισχύ, και δεν έχουν όλοι πρόσβαση σε μηχανές αρκετά ισχυρές για αυτό, γι' αυτό πολλοί επιλέγουν να αξιοποιήσουν απευθείας την τεράστια υπολογιστική ισχύ του Cloud για να εκτελέσουν και να αναπτύξουν τις λύσεις τους.
* Χρήση υπηρεσιών ανάλυσης δεδομένων: υπηρεσίες Cloud όπως το Azure Synapse Analytics, το Azure Stream Analytics και το Azure Databricks σας βοηθούν να μετατρέψετε τα δεδομένα σας σε χρήσιμες πληροφορίες.
* Χρήση υπηρεσιών Μηχανικής Μάθησης και ευφυΐας δεδομένων: αντί να ξεκινήσετε από το μηδέν, μπορείτε να χρησιμοποιήσετε αλγόριθμους μηχανικής μάθησης που προσφέρονται από τον πάροχο Cloud, με υπηρεσίες όπως το AzureML. Μπορείτε επίσης να χρησιμοποιήσετε γνωστικές υπηρεσίες όπως μετατροπή ομιλίας σε κείμενο, κείμενο σε ομιλία, υπολογιστική όραση και άλλα.
## Παραδείγματα Επιστήμης Δεδομένων στο Cloud
Ας κάνουμε αυτό πιο απτό εξετάζοντας μερικά σενάρια.
### Ανάλυση συναισθημάτων στα μέσα κοινωνικής δικτύωσης σε πραγματικό χρόνο
Θα ξεκινήσουμε με ένα σενάριο που μελετάται συχνά από άτομα που ξεκινούν με τη μηχανική μάθηση: ανάλυση συναισθημάτων στα μέσα κοινωνικής δικτύωσης σε πραγματικό χρόνο.
Ας πούμε ότι διαχειρίζεστε έναν ιστότοπο ειδήσεων και θέλετε να αξιοποιήσετε ζωντανά δεδομένα για να κατανοήσετε ποιο περιεχόμενο θα μπορούσε να ενδιαφέρει τους αναγνώστες σας. Για να μάθετε περισσότερα σχετικά με αυτό, μπορείτε να δημιουργήσετε ένα πρόγραμμα που εκτελεί ανάλυση συναισθημάτων σε πραγματικό χρόνο από δημοσιεύσεις στο Twitter, σε θέματα που είναι σχετικά με τους αναγνώστες σας.
Οι βασικοί δείκτες που θα εξετάσετε είναι ο όγκος των tweets σε συγκεκριμένα θέματα (hashtags) και τα συναισθήματα, που καθορίζονται χρησιμοποιώντας εργαλεία ανάλυσης που εκτελούν ανάλυση συναισθημάτων γύρω από τα καθορισμένα θέματα.
Τα βήματα που απαιτούνται για τη δημιουργία αυτού του έργου είναι τα εξής:
* Δημιουργία ενός κέντρου συμβάντων για τη ροή εισόδου, που θα συλλέγει δεδομένα από το Twitter.
* Ρύθμιση και εκκίνηση μιας εφαρμογής πελάτη Twitter, που θα καλεί τα APIs ροής του Twitter.
* Δημιουργία μιας εργασίας Stream Analytics.
* Καθορισμός της εισόδου και του ερωτήματος της εργασίας.
* Δημιουργία ενός σημείου εξόδου και καθορισμός της εξόδου της εργασίας.
* Εκκίνηση της εργασίας.
Για να δείτε τη διαδικασία πλήρως, επισκεφθείτε την [τεκμηρίωση](https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?WT.mc_id=academic-77958-bethanycheum&ocid=AID30411099).
### Ανάλυση επιστημονικών άρθρων
Ας πάρουμε ένα άλλο παράδειγμα ενός έργου που δημιουργήθηκε από τον [Dmitry Soshnikov](http://soshnikov.com), έναν από τους συγγραφείς αυτού του προγράμματος σπουδών.
Ο Dmitry δημιούργησε ένα εργαλείο που αναλύει άρθρα σχετικά με τον COVID. Εξετάζοντας αυτό το έργο, θα δείτε πώς μπορείτε να δημιουργήσετε ένα εργαλείο που εξάγει γνώση από επιστημονικά άρθρα, αποκτά πληροφορίες και βοηθά τους ερευνητές να περιηγηθούν σε μεγάλες συλλογές άρθρων με αποτελεσματικό τρόπο.
Ας δούμε τα διάφορα βήματα που χρησιμοποιήθηκαν για αυτό:
* Εξαγωγή και προεπεξεργασία πληροφοριών με [Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
* Χρήση του [Azure ML](https://azure.microsoft.com/services/machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) για παράλληλη επεξεργασία.
* Αποθήκευση και ερώτηση πληροφοριών με [Cosmos DB](https://azure.microsoft.com/services/cosmos-db?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
* Δημιουργία ενός διαδραστικού πίνακα ελέγχου για εξερεύνηση και οπτικοποίηση δεδομένων χρησιμοποιώντας το Power BI.
Για να δείτε τη διαδικασία πλήρως, επισκεφθείτε το [blog του Dmitry](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/).
Όπως βλέπετε, μπορούμε να αξιοποιήσουμε τις υπηρεσίες Cloud με πολλούς τρόπους για να εκτελέσουμε Επιστήμη Δεδομένων.
## Υποσημείωση
Πηγές:
* https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109
* https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?ocid=AID3041109
* https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/
## Μετα-Διάλεξης Κουίζ
## [Μετα-Διάλεξης Κουίζ](https://ff-quizzes.netlify.app/en/ds/quiz/33)
## Εργασία
[Έρευνα Αγοράς](assignment.md)
---
**Αποποίηση ευθύνης**:
Αυτό το έγγραφο έχει μεταφραστεί χρησιμοποιώντας την υπηρεσία αυτόματης μετάφρασης [Co-op Translator](https://github.com/Azure/co-op-translator). Παρόλο που καταβάλλουμε προσπάθειες για ακρίβεια, παρακαλούμε να έχετε υπόψη ότι οι αυτόματες μεταφράσεις ενδέχεται να περιέχουν σφάλματα ή ανακρίβειες. Το πρωτότυπο έγγραφο στη μητρική του γλώσσα θα πρέπει να θεωρείται η αυθεντική πηγή. Για κρίσιμες πληροφορίες, συνιστάται επαγγελματική ανθρώπινη μετάφραση. Δεν φέρουμε ευθύνη για τυχόν παρεξηγήσεις ή εσφαλμένες ερμηνείες που προκύπτουν από τη χρήση αυτής της μετάφρασης.