Μάθημα "Data Analyst" - μάθημα 96.000 τρίψιμο. από το Yandex Workshop, εκπαίδευση 7 μηνών, ημερομηνία 7 Δεκεμβρίου 2023.
μικροαντικείμενα / / December 02, 2023
Ένας αναλυτής δεδομένων εξάγει νόημα από αριθμούς και αξίες: βλέπει τάσεις, προβλέπει γεγονότα και βοηθά μια εταιρεία να κατανοήσει τους πελάτες, να βελτιστοποιήσει τις διαδικασίες και να αναπτυχθεί.
Η αγορά χρειάζεται ειδικούς που μπορούν να χρησιμοποιήσουν τα δεδομένα χρήσιμα. Μια μελέτη της εταιρείας προσωπικού Ancor για τον Σεπτέμβριο του 2022 έδειξε ότι το 45% των ρωσικών εταιρειών αναζητούν αναλυτές για να ενταχθούν στην ομάδα τους.
Δεξιότητες που θα μάθετε στο μάθημα
Τίτλος εργασίας
Αναλυτής, Αναλυτής Δεδομένων, Αναλυτής Δεδομένων
Ευκαιρίες ανάπτυξης: Product Analyst, Marketing Analyst, BI Analyst, Data Science Specialist
Ακολουθούν οι τεχνολογίες και τα εργαλεία που θα χρησιμοποιήσετε:
Πύθων
Σημειωματάριο Jupyter
SQL
PostgreSQL
Ζώσα σκηνική εικών
Α/Β τεστ
Ξεκινήστε να βγάζετε χρήματα αναλύοντας
Θα ξεκινήσετε από μια νεώτερη θέση και μετά θα προχωρήσετε μόνο μπροστά. Θα ανεβείτε τη σκάλα της καριέρας σας και θα αυξήσετε την αξία σας. Και μια μέρα δεν θα υπάρχει τιμή για εσάς.
Ολοκληρωμένο πρόγραμμα μαθημάτων Data Analytics
Το ενημερώνουμε τακτικά για να διασφαλίσουμε ότι ανταποκρίνεται στις ανάγκες του κλάδου και των εργοδοτών.
Με άλλα λόγια, μαθαίνεις μόνο αυτά που σίγουρα θα σου φανούν χρήσιμα στη δουλειά σου.
Δωρεάν μέρος - 1 εβδομάδα
Δωρεάν Εισαγωγή: Βασικά στοιχεία Python και Ανάλυση Δεδομένων
Μάθετε τις βασικές έννοιες της ανάλυσης δεδομένων και κατανοήστε τι κάνουν οι αναλυτές δεδομένων και οι επιστήμονες δεδομένων.
• Μόσχα Catnamycs. Εμφάνιση δεδομένων στην οθόνη. Αρχεία CSV. Εργασία με τραπέζια. Χάρτες θερμότητας. Πολλαπλασιασμός μιας στήλης με έναν ακέραιο.
• Σφάλματα στον κωδικό. Συντακτικά λάθη. Σφάλματα ονομασίας. Σφάλματα κατά τη διαίρεση με το μηδέν. Σφάλματα κατά την εισαγωγή μιας μονάδας.
• Μεταβλητές και τύποι δεδομένων. Μεταβλητές. Τύποι δεδομένων. Αριθμητικές πράξεις με αριθμούς και συμβολοσειρές.
• Πώς να κάνετε υποθέσεις. Υποθέσεις. Κύκλοι HADI. Αναλυτική σκέψη. Ανάγνωση γραφημάτων.
• Τι κάνουν οι επιστήμονες δεδομένων. Καθήκοντα αναλυτή. Αποσαφήνιση εργασιών. Αποσύνθεση. Στάδια έργου.
• Έλεγχος μετατροπών. Μετατροπή. Εξερεύνηση δεδομένων. Σχηματισμός συμπερασμάτων.
• Απόσβεση διαφημιστικών καμπανιών. Γράφημα στήλης. Διαφορά στοιχείων. Ευρετηρίαση σε στήλες.
• Μηχανική μάθηση και Επιστήμη Δεδομένων. Εκπαίδευση στη μηχανική μάθηση. Εύρεση μοναδικών τιμών σε στήλες. Λογική ευρετηρίαση. Ομαδοποίηση τιμών σε πίνακα. Λάθη πρόβλεψης.
• Τελικό έργο. Τμηματοποίηση χρηστών.
PythonPandasErrorsSeabornHypothesesConversionVariablesTidsData TypesHeatmaps
1 σπριντ 3 εβδομάδες
Βασική Python
Βουτήξτε βαθύτερα στη γλώσσα προγραμματισμού Python και στη βιβλιοθήκη Pandas.
• Μεταβλητές και τύποι δεδομένων. Γλώσσα Python. Μεταβλητές. Εμφάνιση δεδομένων στην οθόνη. Εμφάνιση αντικειμένων στην οθόνη. Αντιμετώπιση σφαλμάτων, δοκιμάστε...εκτός χειριστή. Τύποι δεδομένων. Μετατροπές τύπων δεδομένων.
• Γραμμές. Ευρετήρια σε σειρές. Περικοπές γραμμών. Λειτουργίες σε χορδές. Μέθοδοι χορδών. Μορφοποίηση συμβολοσειρών, μέθοδος format(), συμβολοσειρές f.
• Λίστες. Ευρετήρια σε λίστες. Λίστα φέτες. Προσθήκη στοιχείων σε μια λίστα. Αφαίρεση στοιχείων λίστας. Πρόσθεση και πολλαπλασιασμός λιστών. • Ταξινόμηση λιστών. Αναζήτηση στοιχείων σε μια λίστα. Διαίρεση μιας συμβολοσειράς σε μια λίστα συμβολοσειρών, συνένωση μιας λίστας συμβολοσειρών σε μια συμβολοσειρά.
• Για βρόχο. Κύκλοι. Αριθμός στοιχείων. Επανάληψη σε δείκτες στοιχείων. Επεξεργασία στοιχείων λίστας με χρήση βρόχων: εύρεση του αθροίσματος και του γινομένου των στοιχείων.
• Ένθετες λίστες. Περιήγηση σε ένθετες λίστες με τιμές μέτρησης. Προσθήκη στοιχείων σε ένθετες λίστες. Ταξινόμηση ένθετων λιστών.
• Υπό όρους χειριστή. Ενώ βρόχος. Τύπος δεδομένων Boolean. Boolean τιμές. Λογικές εκφράσεις. Σύνθετες λογικές εκφράσεις. Δήλωση υπό όρους αν...ελιφ...άλλο. Διακλάδωση. Φιλτράρισμα λιστών με χρήση τελεστή υπό όρους. Ενώ βρόχος.
• Λειτουργίες. Ανάθεση λειτουργιών. Παράμετροι και ορίσματα. Παράμετροι με προεπιλεγμένες τιμές. Επιχειρήματα θέσης και ονομασίας. Επιστροφή αποτελέσματος από συνάρτηση.
• Λεξικά. Κλειδιά και αξίες. Αναζήτηση τιμής με κλειδί. Προσθήκη στοιχείων στο λεξικό. Κατάλογος λεξικών. Όμορφη παραγωγή λεξικών.
• Βιβλιοθήκη Pandas. Ανάγνωση αρχείων csv. Πλαίσιο δεδομένων. Κατασκευαστής πλαισίου δεδομένων. Εκτύπωση της πρώτης και της τελευταίας σειράς ενός πλαισίου δεδομένων. Ευρετηρίαση σε πλαίσια δεδομένων. Ευρετηρίαση σε στήλες σειράς.
• Προεπεξεργασία δεδομένων. Η αρχή GIGO. Μετονομασία στηλών πλαισίου δεδομένων. Χειρισμός τιμών που λείπουν. Χειρισμός ρητών και σιωπηρών διπλότυπων.
• Ανάλυση δεδομένων και παρουσίαση αποτελεσμάτων. Ομαδοποίηση δεδομένων. Ταξινόμηση δεδομένων. Βασικά στοιχεία της περιγραφικής στατιστικής.
• Σημειωματάριο Jupyter - ένα σημειωματάριο σε ένα κελί. Διεπαφή φορητού υπολογιστή Jupyter. Συντομεύσεις σημειωματάριου Jupyter.
LoopsPythonPandasStringsListsFunctionsDictionariesDataFrameVariablesDataTypesΔήλωση υπό όρους
Εργο
Συγκρίνετε δεδομένα χρήστη Yandex Music ανά πόλη και ημέρα της εβδομάδας.
2 σπριντ 2 εβδομάδες
Προεπεξεργασία δεδομένων
Μάθετε να καθαρίζετε δεδομένα από ακραίες τιμές, παραλείψεις και διπλότυπα, καθώς και να μετατρέπετε διαφορετικές μορφές δεδομένων.
• Εργασία με πάσες. Μετατροπή. Μπισκότα. Κατηγορικές και ποσοτικές μεταβλητές. Χειρισμός κενών σε κατηγορικές μεταβλητές. Αντιμετώπιση κενών σε ποσοτικές μεταβλητές. Χειρισμός κενών σε ποσοτικές μεταβλητές ανά κατηγορία.
• Αλλαγή τύπων δεδομένων. Ανάγνωση αρχείων Excel. Μετατροπή σειράς σε αριθμητικό τύπο. Αριθμητική ενότητα, μέθοδος abs(). Εργασία με ημερομηνία και ώρα. Αντιμετώπιση σφαλμάτων, δοκιμάστε...εκτός χειριστή. Συγχώνευση πλαισίων δεδομένων, μέθοδος merge(). Συγκεντρωτικοί πίνακες.
• Αναζήτηση για διπλότυπα. Αναζήτηση για διπλότυπα, διάκριση πεζών-κεφαλαίων.
• Κατηγοριοποίηση δεδομένων. Αποσύνθεση πινάκων. Κατηγοριοποίηση κατά αριθμητικά εύρη. Κατηγοριοποίηση με βάση πολλαπλές τιμές ανά σειρά.
• Συστηματική και κριτική σκέψη στο έργο ενός αναλυτή. Συστημική σκέψη. Αιτίες σφαλμάτων δεδομένων. Κριτική σκέψη.
PythonPandasGap handlingData processingΔιπλότυπο επεξεργασία Κατηγοριοποίηση δεδομένων
Εργο
Αναλύστε δεδομένα για πελάτες τραπεζών και προσδιορίστε το μερίδιο των φερέγγυων πελατών.
3 σπριντ 2 εβδομάδες
Διερευνητική ανάλυση δεδομένων
Μάθετε τα βασικά των πιθανοτήτων και των στατιστικών. Χρησιμοποιήστε τα για να εξερευνήσετε τις βασικές ιδιότητες των δεδομένων, αναζητώντας μοτίβα, κατανομές και ανωμαλίες. Γνωρίστε τη βιβλιοθήκη Matplotlib. Σχεδιάστε διαγράμματα και εξασκηθείτε στην ανάλυση γραφημάτων.
• Πρώτα γραφήματα και συμπεράσματα. Χρήση συγκεντρωτικών πινάκων. Ραβδόγραμμα. Διανομές. Διάγραμμα εύρους.
• Μελέτη τμημάτων δεδομένων. Η μέθοδος query(). Εργασία με ημερομηνία και ώρα. Σχεδίαση γραφημάτων χρησιμοποιώντας τη μέθοδο plot(). Το ξυράφι του Όκαμ.
• Εργασία με πολλαπλές πηγές δεδομένων. Τμήμα δεδομένων με βάση εξωτερικά αντικείμενα. Προσθήκη νέων στηλών σε ένα πλαίσιο δεδομένων. Προσθήκη δεδομένων από άλλα πλαίσια δεδομένων. Μετονομασία στηλών. Συνδυασμός πινάκων χρησιμοποιώντας τις μεθόδους merge() και join().
• Σχέσεις δεδομένων. Διάγραμμα διασποράς. Συσχέτιση μεταβλητών. Πίνακας Scatterplot.
• Επικύρωση αποτελεσμάτων. Ενοποίηση ομάδων. Διαχωρισμός δεδομένων σε ομάδες.
PythonPandasMatplotlibIstogramsData Slices AnalysisDataScatterplotScatterplotΟπτικοποίησηδεδομένωνΠεριγραφικά στατιστικά στοιχεία
Εργο
Εξερευνήστε το αρχείο αγγελιών για την πώληση ακινήτων στην Αγία Πετρούπολη και την περιοχή του Λένινγκραντ.
4 σπριντ 3 εβδομάδες
Στατιστική ανάλυση δεδομένων
Μάθετε να αναλύετε σχέσεις σε δεδομένα χρησιμοποιώντας στατιστικές μεθόδους. Μάθετε ποια είναι η στατιστική σημασία και οι υποθέσεις.
• Συνδυαστική. Συνδυασμοί. Κανόνας πολλαπλασιασμού. Ανακατατάξεις. Αριθμός μεταθέσεων. Τοποθετήσεις. Αριθμός τοποθετήσεων. Συνδυασμοί. Αριθμός συνδυασμών.
• Θεωρία πιθανοτήτων. Πείραμα. Χώρος πιθανοτήτων. Εκδηλώσεις. Πιθανότητα. Διασταυρούμενα και αμοιβαία αποκλειόμενα γεγονότα. Διάγραμμα Euler-Venn. Νόμος των μεγάλων αριθμών.
• Περιγραφικά στατιστικά. Κατηγορικές και ποσοτικές μεταβλητές. Λειτουργία και διάμεσος. Μέση αξία. Διασπορά. Τυπική απόκλιση. τεταρτημόρια και εκατοστημόρια. Διάγραμμα εύρους. Γράφημα στήλης. Πυκνότητα συχνότητας. Ραβδόγραμμα.
• Τυχαίες μεταβλητές. Διακριτή τυχαία μεταβλητή. Κατανομή πιθανοτήτων για μια διακριτή τυχαία μεταβλητή. Αθροιστική συνάρτηση (συνάρτηση κατανομής) μιας διακριτής τυχαίας μεταβλητής. Μαθηματική προσδοκία μιας διακριτής τυχαίας μεταβλητής. Διασπορά μιας διακριτής τυχαίας μεταβλητής.
• Διανομές. Το πείραμα του Μπερνούλι. Διωνυμικό πείραμα. Διωνυμική κατανομή. Συνεχής ομοιόμορφη κατανομή. Κανονική κατανομή. Τυπική κανονική κατανομή. CDF και PPF για κανονική διανομή. Κατανομή Poisson. Προσέγγιση μιας κατανομής από μια άλλη.
• Έλεγχος υποθέσεων. Γενικός πληθυσμός. Δείγμα. Κατανομή δειγμάτων. Κεντρικό οριακό θεώρημα. Μονόπλευρες και αμφίπλευρες υποθέσεις. P-τιμή. Έλεγχος μονόπλευρων και αμφίπλευρων υποθέσεων για ένα δείγμα. Έλεγχος της υπόθεσης για την ισότητα των μέσων δύο γενικών πληθυσμών. Έλεγχος της υπόθεσης της ισότητας των μέσων για εξαρτημένα δείγματα.
ScipyNumpyPythonPandasMatplotlibCombinatoricsDistributionsΔοκιμή υποθέσεων Θεωρία πιθανοτήτων
Εργο
Δοκιμάστε τις υποθέσεις της υπηρεσίας ενοικίασης σκούτερ για να βοηθήσετε στην ανάπτυξη της επιχείρησής σας.
Extra Sprint
Θεωρία πιθανοτήτων
Θυμηθείτε ή αναγνωρίστε τους βασικούς όρους στη θεωρία πιθανοτήτων: ανεξάρτητα, αντίθετα, ασύμβατα γεγονότα κ.λπ. Χρησιμοποιώντας απλά παραδείγματα και διασκεδαστικά προβλήματα, θα εξασκηθείτε στην εργασία με αριθμούς και θα χτίσετε τη λογική των λύσεων.
Αυτό είναι ένα προαιρετικό σπριντ. Αυτό σημαίνει ότι κάθε μαθητής επιλέγει ο ίδιος μία από τις επιλογές:
• Κατακτήστε ένα επιπλέον σπριντ 10 σύντομων μαθημάτων, εξερευνήστε τη θεωρία και λύστε προβλήματα.
• Ανοίξτε μόνο το μπλοκ με εργασίες συνέντευξης, ανάκληση πρακτικής χωρίς θεωρία.
• Παραλείψτε εντελώς το μάθημα ή επιστρέψτε σε αυτό όταν υπάρχει χρόνος και ανάγκη.
PythonEventsProbability TheoremBayes'Random VariablesΘεωρία πιθανοτήτωνΣτατιστική ανάλυση δεδομένων
5 σπριντ 1 εβδομάδα
Τελικό έργο της πρώτης ενότητας
Μάθετε πώς να διεξάγετε προκαταρκτική έρευνα δεδομένων και να διατυπώνετε και να δοκιμάζετε υποθέσεις.
ScipyNumpyPythonPandasMatplotlib Ανάλυση δεδομένων Δοκιμή υποθέσεων Επεξεργασία δεδομένων
Εργο
Βρείτε μοτίβα στα δεδομένα πωλήσεων παιχνιδιών.
6 σπριντ 2 εβδομάδες
Βασική SQL
Μάθετε τα βασικά της γλώσσας δομημένου ερωτήματος SQL και της σχεσιακής άλγεβρας για εργασία με βάσεις δεδομένων. Εξοικειωθείτε με τις δυνατότητες εργασίας στο PostgreSQL, ένα δημοφιλές σύστημα διαχείρισης βάσεων δεδομένων (DBMS). Μάθετε να γράφετε ερωτήματα διαφορετικών επιπέδων πολυπλοκότητας και να μεταφράζετε επιχειρηματικά προβλήματα σε SQL. Θα συνεργαστείτε με μια βάση δεδομένων ενός ηλεκτρονικού καταστήματος που ειδικεύεται σε ταινίες και μουσική.
• Εισαγωγή στις βάσεις δεδομένων. Συστήματα διαχείρισης βάσεων δεδομένων (DBMS). Γλώσσα SQL. Ερωτήματα SQL. Μορφοποίηση ερωτημάτων SQL.
• Φέτες δεδομένων σε SQL. Τύποι δεδομένων στο PostgreSQL. Μετατροπή τύπου δεδομένων. ρήτρα WHERE. Λογικοί τελεστές. Φέτες δεδομένων. Χειριστές IN, LIKE, BETWEEN. Εργασία με ημερομηνία και ώρα. Χειρισμός τιμών που λείπουν. Κατασκευή CASE υπό όρους.
• Συναρτήσεις συγκέντρωσης. Ομαδοποίηση και ταξινόμηση δεδομένων. Μαθηματικές πράξεις. Συναρτήσεις συγκέντρωσης. Ομαδοποίηση δεδομένων. Ταξινόμηση δεδομένων. Φιλτράρισμα κατά συγκεντρωτικά δεδομένα, ΕΧΕΙ χειριστή.
• Σχέσεις μεταξύ πινάκων. Τύποι ενώσεων τραπεζιών. Διαγράμματα ER. Μετονομασία πεδίων και πινάκων. Ψευδώνυμα. Συγχώνευση πινάκων. Τύποι ενώσεων: ΕΣΩΤΕΡΙΚΗ ΣΥΝΔΕΣΗ, ΑΡΙΣΤΕΡΗ ΣΥΝΔΕΣΗ, ΔΕΞΙΑ ΕΝΩΣΗ, ΠΛΗΡΗΣ ΕΞΩΤΕΡΙΚΗ ΣΥΝΔΕΣΗ. Εναλλακτικοί τύποι σωματείων ΕΝΩΣΗ και ΕΝΩΣΗ ΟΛΟΙ.
• Υποερωτήματα και κοινές εκφράσεις πίνακα. Υποερωτήματα. Υποερωτήματα στο FROM. Υποερωτήματα στο WHERE. Ένας συνδυασμός συνδέσεων και υποερωτημάτων. Κοινές εκφράσεις πίνακα (CTE). Μεταβλητότητα αιτημάτων.
SQLDBMSPostgreSQLSυποερωτήματα Βάσεις δεδομένωνSQL ερωτήματα Φιλτράρισμα δεδομένων Ταξινόμηση δεδομένων Ομαδοποίηση δεδομένων Συμμετοχή σε πίνακες Κοινές εκφράσεις πίνακα
Εργο
Θα γράψετε μια σειρά ερωτημάτων ποικίλης πολυπλοκότητας σε μια βάση δεδομένων που αποθηκεύει δεδομένα για επενδυτές επιχειρηματικών συμμετοχών, νεοφυείς επιχειρήσεις και επενδύσεις σε αυτές.
7 σπριντ 3 εβδομάδες
Ανάλυση επιχειρηματικών δεικτών
Μάθετε ποιες είναι οι μετρήσεις στην επιχείρηση. Μάθετε να χρησιμοποιείτε εργαλεία για την ανάλυση δεδομένων στις επιχειρήσεις: ανάλυση κοόρτης, διοχέτευση πωλήσεων και οικονομικές μονάδες.
• Μετρήσεις και διοχετεύσεις. Μετατροπή. Χωνάρια. Διοχέτευση μάρκετινγκ. Εντυπώσεις. Κλικ. CTR. Χωνί προϊόντος.
• Ανάλυση κοόρτης. Προφίλ χρήστη. ποσοστό παρακράτησης. Ρυθμός ανατροπής. Ορίζοντας ανάλυσης. Οπτικοποίηση ανάλυσης κοόρτης. Ανάλυση διατήρησης τυχαίων κοορτών. Μετατροπή σε ανάλυση κοόρτης. Υπολογισμός μετρήσεων σε Python.
• Οικονομικά μονάδων. Μετρήσεις LTV, CAC, ROI. ARPU, ARPPU. Υπολογισμός μετρήσεων σε Python. Προηγμένη οπτικοποίηση μετρήσεων. Παράμετρος Sharey. Κινητός μέσος όρος.
• Προσαρμοσμένες μετρήσεις. Αξιολόγηση δραστηριότητας χρήστη. Συνεδρία χρήστη. Έρευνα ανωμαλίας.
MetricsFunnelsConversionUnit Economics Ανάλυση κοόρτηςΜετρικές προϊόντων Μετρήσεις μάρκετινγκ
Εργο
Με βάση τα δεδομένα, κατανοήστε τη συμπεριφορά των χρηστών, καθώς και αναλύστε την κερδοφορία των πελατών και την απόδοση επένδυσης (ROI) διαφήμισης για να κάνετε συστάσεις για το τμήμα μάρκετινγκ.
8 σπριντ 2 εβδομάδες
Προηγμένη SQL
Θα παρακολουθήσετε ένα επιπλέον μάθημα για την εργασία με βάσεις δεδομένων και θα γίνετε ακόμα πιο κοντά στην επιχείρηση. Χρησιμοποιώντας τη γλώσσα SQL, θα αναλύσετε τον υπολογισμό των κύριων επιχειρηματικών μετρήσεων με τις οποίες εξοικειωθείτε στο "Business Indicators Analysis" sprint. Εξετάστε το ενδεχόμενο να εργαστείτε με ένα πολύπλοκο εργαλείο όπως οι λειτουργίες παραθύρου. Μάθετε να αλλάζετε τα περιεχόμενα των βάσεων δεδομένων τοπικά, χωρίς προσομοιωτή, χρησιμοποιώντας ειδικά προγράμματα-πελάτες και βιβλιοθήκες για την Python.
• Υπολογισμός επιχειρηματικών δεικτών. Σχήμα δεδομένων. Μετατροπή. LTV. ARPU. ARPPU. ROI. Υπολογισμός με χρήση SQL.
• Συνάθροιση συναρτήσεων παραθύρου. ΠΑΝΩ έκφραση. Παράμετρος PARTITION BY window.
• Λειτουργίες κατάταξης παραθύρων. Λειτουργίες κατάταξης. Παράθυρο ΠΑΡΑΓΓΕΛΙΑ ΑΝΑ χειριστή. ROW_NUMBER(). ΤΑΞΗ(). DENSE_RANK(). NTILE(). Χειριστές παραθύρων μαζί με συναρτήσεις κατάταξης.
• Λειτουργίες μετατόπισης παραθύρου. Σωρευτικές τιμές. Λειτουργίες μετατόπισης. ΟΔΗΓΩ(). ΚΑΘΥΣΤΕΡΗΣΗ(). Λειτουργίες παραθύρου και ψευδώνυμα.
• Ανάλυση κοόρτης. Ποσοστό Διατήρησης, Ποσοστό Churn. LTV.
• Εγκατάσταση και διαμόρφωση της βάσης δεδομένων και του πελάτη βάσης δεδομένων. Πελάτης βάσης δεδομένων. Εγκατάσταση PostgreSQL. Εγκατάσταση του DBeaver. Διεπαφή DBeaver. Δημιουργία βάσης δεδομένων. Ανάπτυξη μιας απόθεσης βάσης δεδομένων. Μεταφόρτωση αποτελεσμάτων ερωτήματος. Παρουσίαση αποτελεσμάτων ερωτήματος.
SQLDBMSMetricsPostgreSQLDbasesSQL queries Συναρτήσεις παραθύρου Ανάλυση κοόρτης
Εργο
Χρησιμοποιώντας Python και SQL, συνδεθείτε σε μια βάση δεδομένων, υπολογίστε και οπτικοποιήστε βασικές μετρήσεις σε ένα σύστημα υπηρεσίας προγραμματισμού Q&A.
9 σπριντ 2 εβδομάδες
Λήψη αποφάσεων στην επιχείρηση
Θα μάθετε τι είναι το A/B testing και θα καταλάβετε σε ποιες περιπτώσεις χρησιμοποιείται. Μάθετε να σχεδιάζετε τη δοκιμή A/B και να αξιολογείτε τα αποτελέσματά της.
• Βασικές αρχές ελέγχου υποθέσεων στην επιχείρηση. Κορυφαίες μετρήσεις. Βάσεις πειραμάτων. Δημιουργία υποθέσεων. Προτεραιοποίηση μετρήσεων. Επιλογή μεθόδου για τη διεξαγωγή ενός πειράματος. Ποιοτικές μέθοδοι ελέγχου υποθέσεων. Ποσοτικές μέθοδοι ελέγχου υποθέσεων. Πλεονεκτήματα και μειονεκτήματα των Α/Β τεστ.
• Προτεραιοποίηση υποθέσεων. πλαίσιο RICE. Παράμετρος προσέγγισης χρηστών. Παράμετρος κρούσης. Παράμετρος εμπιστοσύνης. Παράμετρος προσπαθειών.
• Προετοιμασία για τη διεξαγωγή ενός τεστ A/B. Α/Α τεστ. Σφάλματα τύπου I και II. Δύναμη της στατιστικής δοκιμής. Σημασία του στατιστικού τεστ. Πολλαπλές συγκρίσεις, μέθοδοι μείωσης της πιθανότητας λάθους. Υπολογισμός μεγέθους δείγματος και διάρκεια δοκιμής Α/Β. Γραφική ανάλυση μετρήσεων.
• Ανάλυση αποτελεσμάτων Α/Β τεστ. Έλεγχος της υπόθεσης της ισότητας των μετοχών. Δοκιμή Shapiro-Wilk για τον έλεγχο της κανονικότητας των δεδομένων. Μη παραμετρικές στατιστικές δοκιμές. Τεστ Mann-Whitney. Σταθερότητα αθροιστικών μετρήσεων. Ανάλυση ακραίων τιμών και εκρήξεων.
• Αλγόριθμοι συμπεριφοράς. Γεγονότα, συναισθήματα, εκτιμήσεις. Εξηγήστε την άποψή σας.
Δοκιμές A/B Προτεραιότητα των υποθέσεων Προετοιμασία για δοκιμές A/BΑνάλυση αποτελεσμάτων δοκιμών A/BΑνάλυση αποτελεσμάτων δοκιμών A/B
Εργο
Αναλύστε τα αποτελέσματα των δοκιμών A/B σε ένα μεγάλο ηλεκτρονικό κατάστημα.
10 σπριντ 1 εβδομάδα
Τελικό έργο της δεύτερης ενότητας
Μάθετε να δοκιμάζετε στατιστικές υποθέσεις χρησιμοποιώντας τη δοκιμή A/B και να προετοιμάζετε συμπεράσματα και συστάσεις σε μορφή αναλυτικής έκθεσης.
Διοχέτευση πωλήσεωνA/B testing Επεξεργασία δεδομένωνΑνάλυση δεδομένων έρευνας
Εργο
Εξερευνήστε τη διοχέτευση πωλήσεων και αναλύστε τα αποτελέσματα των δοκιμών A/B στην εφαρμογή για κινητά.
11 σπριντ 2 εβδομάδες
Πώς να πείτε μια ιστορία με δεδομένα
Θα μάθετε πώς να παρουσιάζετε σωστά τα αποτελέσματα της έρευνάς σας χρησιμοποιώντας γραφήματα, τα πιο σημαντικά σχήματα και τη σωστή ερμηνεία τους. Γνωρίστε τις βιβλιοθήκες Seaborn και Plotly.
• Σε ποιον, πώς, τι και γιατί να το πω. Παρουσίαση του αποτελέσματος της έρευνας. Το κοινό-στόχο του αφηγητή. Τι και γιατί να πείτε σε έναν αναλυτή δεδομένων.
• Seaborn Library. Η βιβλιοθήκη Seaborn ως επέκταση της βιβλιοθήκης Matplotlib. μέθοδος jointplot(). Σειρές χρωμάτων. Στυλ γραφημάτων. Οπτικοποίηση διανομών.
• Βιβλιοθήκη Plotly. Διαδραστικά γραφήματα. Γραμμικό γράφημα. Γράφημα στήλης. Διάγραμμα πίτας. Διάγραμμα διοχέτευσης.
• Οπτικοποίηση δεδομένων στη γεωαναλυτική. Γεωαναλυτική. Βιβλιοθήκη Folium. Εμφάνιση χάρτη. Ρύθμιση δεικτών με καθορισμένες συντεταγμένες. Δημιουργία συστάδων σημείων. Προσαρμοσμένα εικονίδια για δείκτες. Horoplet.
• Προετοιμασία παρουσίασης. Συμπεράσματα με βάση τη μελέτη. Εποχικότητα και εξωτερικοί παράγοντες. Απόλυτες και σχετικές αξίες. Το παράδοξο του Simpson. Αρχές κατασκευής παρουσιάσεων. Αναφορές στο Σημειωματάριο Jupyter.
PlotlyFoliumSeabornMatplotlibPresentationGeoanalytics Οπτικοποίηση δεδομένων
Εργο
Προετοιμάστε μια μελέτη αγοράς με βάση ανοιχτά δεδομένα σχετικά με τις δημόσιες εγκαταστάσεις εστίασης στη Μόσχα, οπτικοποιήστε τα δεδομένα που ελήφθησαν.
12 σπριντ 2 εβδομάδες
Κατασκευή ταμπλό στο Tableau
Σε αυτό το σπριντ θα εργαστείτε με το σύστημα Tableau BI. Μάθετε να συνδέεστε με δεδομένα και να τα τροποποιείτε, να δημιουργείτε διαφορετικούς τύπους γραφημάτων, να συναρμολογείτε πίνακες εργαλείων και παρουσιάσεις.
• Βασικά στοιχεία εργασίας με το Tableau. Συστήματα BI. Ζώσα σκηνική εικών. Δημιουργία εγγράφου. Αποθήκευση του εγγράφου. Δημοσίευση του εγγράφου.
• Εργασία με πηγές δεδομένων. Πηγές δεδομένων. Συγχώνευση δεδομένων. Μέθοδος σχέσης. Μέθοδος σύνδεσης. Μέθοδος ανάμειξης. Μέθοδος ένωσης. Αλλαγή της μορφής του πίνακα.
• Τύποι δεδομένων. Βασικοί τύποι δεδομένων. Μετρήσεις. Μέτρα. Εργασία με ημερομηνία και ώρα. Σκηνικά. Ομάδες. Επιλογές. Αλλαγή της μορφής των μεταβλητών. Μεταβλητές Ονόματα μετρήσεων, Τιμές μέτρησης, Καταμέτρηση.
• Πίνακες και υπολογισμοί. Διεπαφή επεξεργασίας φύλλων. Συγκεντρωτικοί πίνακες. Υπολογισμένα πεδία. εκφράσεις LOD.
• Φίλτρα και ταξινόμηση. Μέτρα ταξινόμησης. Ταξινόμηση διαστάσεων. Ένθετα είδη. Ταξινόμηση με χρήση παραμέτρου. Φίλτρα.
• Οπτικοποιήσεις. Έλεγχοι οπτικοποίησης. Χάρτες θερμότητας. Διαγράμματα πίτας. Διαγράμματα στηλών. Ιστογράμματα. Διαγράμματα εύρους. Διάγραμμα διασποράς. Γραμμικά γραφήματα. Συνδυασμένα γραφήματα. Διαγράμματα περιοχών.
• Ειδικές απεικονίσεις και συμβουλές εργαλείων. Καρτέλλες. Χάρτης χαρακτήρων. Γράφημα φυσαλίδων. Χάρτης δέντρου. Διαγράμματα προβολών κύκλων. Διαγράμματα κουκκίδων. Διαγράμματα Gantt. Μετρήστε ονόματα και μετρήστε τις τιμές στις απεικονίσεις. Αντίστροφη μηχανική. Συμβουλές εργαλείων. Συμβουλές εργαλείων με απεικονίσεις. Τιμές κατωφλίου σε γραφήματα. Αναλυτικά εργαλεία στο Custom.
• Παρουσιάσεις. Επιπλέον επιλογές. Μελέτη τυπικών παραμέτρων. Δημιουργία παρουσίασης.
• Πίνακες εργαλείων. Φόρτωση και προετοιμασία δεδομένων. Προετοιμασία οπτικοποιήσεων. Συναρμολόγηση ταμπλό. Ενέργειες. Επίδειξη ταμπλό. Δημοσίευση πίνακα ελέγχου.
TableauDashboardsBI-toolsBI-toolsΟπτικοποίηση δεδομένων
Εργο
Ερευνήστε την ιστορία των συνεδρίων TED και δημιουργήστε έναν πίνακα ελέγχου στο Tableau με βάση τα δεδομένα που ελήφθησαν.
Extra Sprint
Βασικά στοιχεία μηχανικής μάθησης
Εξοικειωθείτε με τα βασικά της μηχανικής μάθησης και μάθετε για τις κύριες εργασίες της μηχανικής μάθησης στις επιχειρήσεις.
PythonPandasSklearnΜηχανική εκμάθηση Εργασίες μηχανικής εκμάθησης Αλγόριθμοι μηχανικής εκμάθησης
Extra Sprint
Εξασκηθείτε στην Python
Θα παρακολουθήσετε πολλά εργαστηριακά μαθήματα με πρόσθετες εργασίες στη γλώσσα προγραμματισμού Python. Θα μάθετε επίσης πώς να εξάγετε δεδομένα από πόρους Ιστού.
Εσύ θα:
• στη δομή των σελίδων HTML και στη λειτουργία των αιτημάτων GET,
• μάθουν να γράφουν απλές κανονικές εκφράσεις,
• να γνωρίσετε το API και το JSON,
• Υποβάλετε πολλά αιτήματα σε ιστότοπους και συλλέξτε δεδομένα.
JSONPythonREST APIWeb scraping
13 σπριντ 3 εβδομάδες
Εργασία αποφοίτησης
Στο τελευταίο έργο, επιβεβαιώστε ότι έχετε κατακτήσει ένα νέο επάγγελμα. Αποσαφηνίστε την εργασία του πελάτη και περάστε από όλα τα στάδια ανάλυσης δεδομένων. Τώρα δεν υπάρχουν μαθήματα ή εργασίες - όλα είναι σαν μια πραγματική δουλειά.
Το τελικό σπριντ περιλαμβάνει εργασίες έργου, δοκιμές A/B και εργασίες SQL και μια πρόσθετη εργασία. Το έργο περιέχει μια δήλωση του προβλήματος, το αναμενόμενο αποτέλεσμα, ένα σύνολο δεδομένων και την περιγραφή τους.
Η εργασία σχετίζεται με έναν από τους πέντε επιχειρηματικούς τομείς:
• τράπεζες,
• λιανεμποριο,
• Παιχνίδια,
• εφαρμογές για κινητά,
• ΗΛΕΚΤΡΟΝΙΚΟ ΕΜΠΟΡΙΟ.
Δεν θα υπάρχει συνήθης περιγραφή των βημάτων στο έργο. Θα τα επεξεργαστείτε μόνοι σας.
SQ LPython PandasTableau Dashboards Postgre SQL Decomposition A/B testing