Big Data and Data Science: μεταβείτε στο επόμενο επίπεδο - δωρεάν μάθημα από το Stepik, εκπαίδευση 11 μαθημάτων, Ημερομηνία 28 Νοεμβρίου 2023.
μικροαντικείμενα / / November 29, 2023
Εάν γνωρίζετε ήδη λίγα πράγματα για την Επιστήμη των Δεδομένων και θέλετε να συνεχίσετε να μαθαίνετε, να συμπληρώσετε κενά και να εξασκηθείτε περισσότερο, αυτό το μάθημα είναι για εσάς. Ως μέρος του προγράμματος, θα εμβαθύνετε στον τομέα της Επιστήμης Δεδομένων - γνωριστείτε με την αρχιτεκτονική MapReduce και το οικοσύστημα Apache Hadoop, κατανοήστε τη σχεδίαση του Apache Spark και του Apache Parquet και μάθετε τα βασικά των νευρωνικών δικτύων και τις αρχιτεκτονικές τους. Θα μάθετε επίσης πώς να διεξάγετε επιχειρηματικές αναλύσεις με το Power BI και τι soft skills χρειάζεται ένας διαχειριστής έργου.
Ο σκοπός του μαθήματος είναι να επιστήσει την προσοχή σας στα Big Data και Data Science, επομένως όλο το υλικό του μαθήματος προορίζεται για ενημερωτικούς σκοπούς χωρίς να εμβαθύνει σε όλες τις περιπλοκές. Εάν ενδιαφέρεστε για μια βαθιά κατάδυση, χρησιμοποιήστε τα πρόσθετα υλικά της ενότητας.
Το μάθημα αποτελείται από πέντε ενότητες που θα σας βοηθήσουν να αναπτυχθείτε συστηματικά στον τομέα της Επιστήμης Δεδομένων και να εκπαιδεύσετε έγκαιρα την αποκτηθείσα θεωρία στην πράξη:
1. Βουτήξτε στην επιστήμη των δεδομένων.
Θυμηθείτε ποιες διαδικασίες περιλαμβάνει η ανάλυση δεδομένων. Μάθετε τα βασικά για το πώς λειτουργεί η μακροπρόθεσμη αποθήκευση. Θα εργαστείτε με την SQL χρησιμοποιώντας το Oracle DBMS ως παράδειγμα και θα δημιουργήσετε την πρώτη σας βάση δεδομένων. Εξοικειωθείτε με την αρχιτεκτονική MapReduce και το οικοσύστημα Apache Hadoop.
2. Εργαλεία επεξεργασίας, ανάλυσης και οπτικοποίησης δεδομένων.
Μάθετε τι είναι το Power BI και ποια προβλήματα μπορούν να λυθούν με τη βοήθειά του. Μάθετε να αποκτάτε, να μοντελοποιείτε, να αναλύετε δεδομένα και να δημιουργείτε οπτικοποιήσεις.
3. Εργαλεία για εργασία με μεγάλα δεδομένα.
Θα καταλάβετε πώς λειτουργεί το Apache Spark, ένα εργαλείο για εργασία με μεγάλα δεδομένα. Μάθετε τη μορφή αποθήκευσης δεδομένων Apache Parquet και τις δυνατότητές της. Επίσης, δείτε παραδείγματα εργασίας με το Pyspark στο σημειωματάριο Jupyter.
4. Συστήματα μηχανικής μάθησης.
Θα μάθετε τι είναι η τιμή p, γιατί χρειάζονται τα απαραίτητα στατιστικά κριτήρια και σε ποιες εργασίες βοηθούν. Μάθετε την έννοια των νευρωνικών δικτύων, τα χαρακτηριστικά τους και τις βασικές αρχιτεκτονικές τους. Θα καταλάβετε επίσης πώς να αναπτύξετε μια λιτή και ρεαλιστική προσέγγιση στη χρήση μεγάλων δεδομένων.
5. Soft Skills και Project Management.
Μάθετε τις αρχές και τις τεχνικές διαχείρισης έργου. Σκεφτείτε πώς λειτουργεί ο κύκλος ζωής ενός έργου που διαχειρίζεται στο παράδειγμα Agile. Θα μάθετε επίσης ποιες βασικές μαλακές δεξιότητες χρειάζεται ένας ειδικός για να αναπτύξει δεξιότητες ηγεσίας και διαχείρισης έργου.
Σε ποιους απευθύνεται αυτό το μάθημα;
Το μάθημα απευθύνεται σε όλους όσους έχουν βασικές γνώσεις της Επιστήμης Δεδομένων και θέλουν να μελετήσουν περαιτέρω το πεδίο. Το μάθημα είναι επίσης κατάλληλο για ειδικούς στην πληροφορική και σε συναφείς τομείς που ενδιαφέρονται για τη χρήση της μηχανικής μάθησης επιχειρήσεων και απόφοιτοι του μαθήματος «Big Data and Data Science: ξεκινήστε την κατάδυση από το μηδέν» που επιθυμούν να συνεχίσουν την εκπαίδευσή τους.
Αρχικές απαιτήσεις
Για να κάνετε το μάθημα σαφές και χρήσιμο, πρέπει να έχετε προηγμένες δεξιότητες παιδείας υπολογιστών και βασικές γνώσεις προγραμματισμού και SQL. Μπορείτε να τα αποκτήσετε στο προηγούμενο μάθημα του έργου μας - «Big Data and Data Science: ξεκινήστε την κατάδυσή σας από το μηδέν».
3
σειρά μαθημάτωνΕπιστήμονας Δεδομένων, ερευνητής ML/DL, δάσκαλος
Εμπειρία στην ανάλυση - 5 χρόνια. Εργάστηκε ως Data Scientist στην PJSC Megafon. Πραγματοποιεί μαθήματα σε Skillbox, Netology, Yandex. Εργαστήριο και άλλα εκπαιδευτικά έργα. Ομιλητής στο συνέδριο Big Data Days 2021.
Data Scientist ελεύθερος επαγγελματίας, δάσκαλος και ερευνητής ML/DL, συγγραφέας μαθημάτων. Εργάστηκε ως ερευνητής στον τομέα της «Θεωρίας Αποφάσεων» στη στρατιωτική θητεία. Στη συνέχεια συνεργάστηκε με μεγάλες και μικρές εταιρείες. Πρώην DataScientist PJSC Megafon.
1
ΚαλάΣυμβάλλουμε στην ανάπτυξη μαθητών και μαθητών από ρωσικές περιοχές και αναπτυσσόμενες πόλεις γειτονικές χώρες, τους μεταφέρουμε την εμπειρία και την τεχνογνωσία μητροπολιτικών πανεπιστημίων, εταιρειών και μεγάλων διεθνών Κόμβοι πληροφορικής
Η Ρωσική Σχολή Προγραμματισμού, με συντομογραφία RSP, δραστηριοποιείται στον τομέα της εκπαίδευσης παιδιών και ενηλίκων στους τομείς της πληροφορικής και της ανάπτυξης soft skills σε μορφές εκπαιδευτικών στρατοπέδων, κυκλικών κινήσεων, master classes, διαδικτυακών σεμιναρίων, εργαστηρίων, διαδικτυακών μαθημάτων και συνέδρια. Οι εκπαιδευτικές μας δραστηριότητες βασίζονται στην ένταση και τη βαθιά εμβάθυνση στο θέμα, τη μεταφορά εμπειρίας από ηλικιωμένους και έμπειρους σε αρχάριους, την καθοδήγηση και τον εθελοντισμό. Υπηρετούμε τις ιδέες της προσβάσιμης πρακτικής εκπαίδευσης και την καλλιέργεια μιας νέας γενιάς προσωπικού για την ψηφιακή οικονομία της χώρας. Η αποστολή μας είναι να βοηθήσουμε τους νέους να γίνουν ηγέτες της τεχνολογικής αλλαγής.
Γνωριμία
1. Χαιρετίσματα
Κατάδυση
1. Εισαγωγή στην Επιστήμη Δεδομένων
2. Βουτήξτε στην SQL
3. Μεγάλα δεδομένα. Εισαγωγή στο MapReduce. Εισαγωγή στο οικοσύστημα Hadoop
Εργαλεία επεξεργασίας, ανάλυσης και οπτικοποίησης δεδομένων
1. Αναλύστε δεδομένα στο Power BI
Big Data Tools
1. Πλαίσιο Apache Spark
Συστήματα μηχανικής μάθησης
1. Στατιστικά στοιχεία για αρχάριους
2. Μηχανική μάθηση στις επιχειρήσεις
3. Βασικά Νευρωνικά Δίκτυα
Soft Skills και Project Management
1. Διαχείριση Έργων Δεδομένων
Ολοκλήρωση
1. Περίληψη και Αποτελέσματα Μαθήματος