Μηχανική μάθηση στην πράξη - μάθημα 41.500 τρίψιμο. από το IBS Training Center, εκπαίδευση 24 ώρες, Ημερομηνία 26 Νοεμβρίου 2023.
μικροαντικείμενα / / December 02, 2023
Το μάθημα βασίζεται σε πολλές πρακτικές περιπτώσεις που περιέχουν πίνακες με αρχικά δεδομένα.
Για κάθε περίπτωση, περνάμε από τον πλήρη κύκλο ζωής ενός έργου μηχανικής μάθησης:
έρευνα, καθαρισμός και προετοιμασία δεδομένων,
επιλογή μιας μεθόδου εκπαίδευσης κατάλληλης για την εργασία (γραμμική παλινδρόμηση για παλινδρόμηση, τυχαίο δάσος για ταξινόμηση, K-means και DBSCAN για ομαδοποίηση),
εκπαίδευση με την επιλεγμένη μέθοδο,
αξιολόγηση αποτελεσμάτων,
βελτιστοποίηση μοντέλου,
παρουσίαση του αποτελέσματος στον πελάτη.
Κατά τη διάρκεια του τμήματος συζήτησης του μαθήματος, συζητάμε πρακτικά προβλήματα που αντιμετωπίζουν οι φοιτητές και τα οποία μπορούν να λυθούν χρησιμοποιώντας τις μεθόδους που συζητήθηκαν.
Θέματα που καλύπτονται:
1. Ανασκόπηση της εργασίας (θεωρία – 1 ώρα)
Ποια προβλήματα επιλύονται καλά με τη μηχανική μάθηση και ποια προβλήματα προσπαθούν να λύσουν;
Τι θα συμβεί εάν, αντί για Επιστήμονα Δεδομένων, προσλάβετε έναν μη ειδικό στον τομέα (απλώς έναν προγραμματιστή/αναλυτή/διαχειριστή) με την προσδοκία ότι θα μάθουν στη διαδικασία.
2. Προετοιμασία, καθαρισμός, έρευνα δεδομένων (θεωρία – 1 ώρα, πρακτική – 1 ώρα)
Πώς να κατανοήσετε τα δεδομένα προέλευσης της επιχείρησης (και γενικά να εντοπίσετε οποιαδήποτε παραγγελία σε αυτά).
Ακολουθία επεξεργασίας.
Τι μπορεί και πρέπει να ανατεθεί στους αναλυτές τομέα και τι γίνεται καλύτερα από τον ίδιο τον Επιστήμονα Δεδομένων.
Προτεραιότητες για την επίλυση συγκεκριμένου προβλήματος.
3. Ταξινομητές και οπισθοδρομικοί (θεωρία – 2 ώρες, πρακτική – 2 ώρες)
Πρακτική ενότητα - καλά επισημοποιημένες εργασίες με έτοιμα δεδομένα.
Διαφορά μεταξύ εργασιών (δυαδική/μη δυαδική/πιθανολογική ταξινόμηση, παλινδρόμηση), ανακατανομή εργασιών μεταξύ τάξεων.
Παραδείγματα ταξινόμησης πρακτικών προβλημάτων.
4. Ομαδοποίηση (θεωρία – 1 ώρα, πρακτική – 2 ώρες)
Πού και πώς να πραγματοποιηθεί η ομαδοποίηση: έρευνα δεδομένων, έλεγχος της δήλωσης προβλήματος, έλεγχος των αποτελεσμάτων.
Ποιες περιπτώσεις μπορούν να περιοριστούν σε ομαδοποίηση.
5. Αξιολόγηση μοντέλου (θεωρία – 1 ώρα, πρακτική – 1 ώρα)
Επιχειρηματικές μετρήσεις και τεχνικές μετρήσεις.
Μετρικές για προβλήματα ταξινόμησης και παλινδρόμησης, πίνακας σφαλμάτων.
Εσωτερικές και εξωτερικές μετρήσεις ποιότητας ομαδοποίησης.
Διασταυρωμένη επικύρωση.
Αξιολόγηση της επανεκπαίδευσης.
6. Βελτιστοποίηση (θεωρία – 5 ώρες, πρακτική – 3 ώρες)
Τι κάνει ένα μοντέλο καλύτερο από ένα άλλο: παράμετροι, χαρακτηριστικά, σύνολα.
Διαχείριση ρυθμίσεων.
Πρακτική επιλογής χαρακτηριστικών.
Ανασκόπηση εργαλείων για την εύρεση των καλύτερων παραμέτρων, χαρακτηριστικών και μεθόδων.
7. Διαγράμματα, αναφορές, εργασία με ζωντανές εργασίες (θεωρία – 2 ώρες, πρακτική – 2 ώρες)
Πώς να εξηγήσετε ξεκάθαρα τι συμβαίνει: στον εαυτό σας, στην ομάδα, στον πελάτη.
Πιο όμορφες απαντήσεις σε ανούσιες ερωτήσεις.
Πώς να παρουσιάσετε τρία terabyte αποτελεσμάτων σε μία διαφάνεια.
Ημιαυτόματες δοκιμές, οι οποίες χρειάζονται πραγματικά σημεία ελέγχου της διαδικασίας.
Από ζωντανές εργασίες σε πλήρη διαδικασία Ε&Α («Ε&Α στην πράξη») - ανάλυση και ανάλυση εργασιών από το κοινό.