Γενικευμένα γραμμικά μοντέλα - πορεία 3600 τρίψτε. από Ανοιχτή εκπαίδευση, εκπαίδευση 3 εβδομάδες, περίπου 6 ώρες την εβδομάδα, Ημερομηνία 29 Νοεμβρίου 2023.
μικροαντικείμενα / / December 01, 2023
Μία από τις προϋποθέσεις για την εφαρμογή των συμβατικών γραμμικών μοντέλων είναι η ανεξαρτησία των παρατηρήσεων μεταξύ τους, βάσει της οποίας επιλέγεται το μοντέλο. Ωστόσο, στην πράξη υπάρχουν συχνά καταστάσεις όπου ο σχεδιασμός της συλλογής υλικού είναι τέτοιος ώστε η παραβίαση αυτής της προϋπόθεσης είναι αναπόφευκτη. Φανταστείτε ότι αποφασίσατε να δημιουργήσετε ένα μοντέλο που περιγράφει τη σχέση μεταξύ της απόδοσης φυσικής αγωγής και των βαθμολογιών του τεστ IQ μεταξύ των μαθητών. Για να λύσετε αυτό το πρόβλημα, κάνατε πολλά δείγματα σε πολλά ιδρύματα. Είναι δυνατός ο συνδυασμός τέτοιων δεδομένων σε μία ανάλυση, χτισμένη σύμφωνα με το παραδοσιακό σχήμα; Φυσικά και όχι. Οι φοιτητές σε κάθε πανεπιστήμιο μπορεί να μοιάζουν μεταξύ τους κατά κάποιο τρόπο. Ακόμη και η φύση της σχέσης μεταξύ των ποσοτήτων που μελετώνται μπορεί να είναι κάπως διαφορετική. Αυτός ο τύπος δεδομένων, στα οποία υπάρχουν ενδοομαδικές συσχετίσεις, θα πρέπει να αναλυθεί χρησιμοποιώντας γραμμικά μικτά μοντέλα. Θα δείξουμε ότι ορισμένοι προγνωστικοί παράγοντες θα πρέπει να περιλαμβάνονται στο μοντέλο ως οι λεγόμενοι «τυχαίοι παράγοντες». Θα μάθετε ότι οι τυχαίοι παράγοντες μπορούν να υποταχθούν ιεραρχικά. Θα συζητήσουμε πώς μπορούν να κατασκευαστούν τέτοια μικτά μοντέλα για εξαρτημένες μεταβλητές που ακολουθούν διαφορετικούς τύπους κατανομών. Επιπλέον, θα δείξουμε ότι το τυχαίο μέρος του μοντέλου μπορεί να είναι ακόμα πιο περίπλοκο - μπορεί να έχει μια συνιστώσα που μοντελοποιεί τη συμπεριφορά της διακύμανσης ως απόκριση στην επιρροή μιας συμμεταβλητής. Στο τέλος του μαθήματος, θα βρείτε ένα έργο στο οποίο μπορείτε να εξασκηθείτε στη δημιουργία μικτών μοντέλων επιλέγοντας ένα από τα πολλά σύνολα δεδομένων. Με βάση την ανάλυση αυτών των δεδομένων, μπορείτε να δημιουργήσετε μια αναφορά στην παράδοση της αναπαραγώγιμης έρευνας.
Αναπληρωτής Καθηγητής, Τμήμα Ζωολογίας Ασπόνδυλων, Βιολογική Σχολή, Κρατικό Πανεπιστήμιο της Αγίας Πετρούπολης, Ph.D.
Επιστημονικά ενδιαφέροντα: δομή και δυναμική θαλάσσιων κοινοτήτων βένθου, χωρικές κλίμακες, διαδοχή, μεσοειδικές και ενδοειδικές βιοτικές αλληλεπιδράσεις, ανάπτυξη και αναπαραγωγή θαλάσσιων ασπόνδυλων, δημογραφική δομή πληθυσμών, μικροεξέλιξη, βιοστατιστική.
Το μάθημα αποτελείται από 4 ενότητες:
1) Εισαγωγή στα γενικευμένα γραμμικά μοντέλα
Τα γενικευμένα γραμμικά μοντέλα (GLM) σάς επιτρέπουν να μοντελοποιείτε τη συμπεριφορά μεγεθών που δεν ακολουθούν μια κανονική κατανομή. Για να κάνουμε τα πρώτα σας βήματα στον κόσμο του GLM ευκολότερα, θα αναλύσουμε τη δομή τους χρησιμοποιώντας το παράδειγμα του GLM για κανονικά κατανεμημένες ποσότητες - με αυτόν τον τρόπο μπορείτε να κάνετε παραλληλισμούς με απλά γραμμικά μοντέλα. Θα μάθετε τι είναι μια συνάρτηση σύνδεσης, πώς λειτουργεί η μέγιστη πιθανότητα και πώς να ελέγχετε υποθέσεις GLM χρησιμοποιώντας δοκιμές Wald και δοκιμές αναλογίας πιθανότητας.
2) Πρόβλημα επιλογής μοντέλου
Σε αυτή την ενότητα θα μιλήσουμε για μεθοδολογικά ζητήματα που σχετίζονται με τα μοντέλα κατασκευής. Ένα μοντέλο είναι μια απλοποιημένη αναπαράσταση της πραγματικότητας και η επιλογή μεταξύ διαφορετικών ανταγωνιστικών μεθόδων τέτοιας απλοποίησης είναι μια συχνή εργασία για τον αναλυτή. Σε αυτήν την ενότητα, θα μάθετε να συγκρίνετε μοντέλα χρησιμοποιώντας κριτήρια πληροφοριών. Θα συζητήσουμε τις κύριες επιλογές για την ανάλυση κατά την επιλογή μοντέλων και θα μιλήσουμε για τις δυσκολίες που προκύπτουν σε σχέση με την κρυμμένη πολλαπλότητα των μοντέλων. Τέλος, θα σας μάθουμε να αναγνωρίζετε τους κύριους τύπους καταχρήσεων επιλογής μοντέλων (data-fishing, p-hacking).
3) Γενικευμένα γραμμικά μοντέλα μέτρησης δεδομένων
Σε αυτή την ενότητα θα συζητήσουμε βασικές μεθόδους για τη μοντελοποίηση μετρήσιμων ποσοτήτων. Αρχικά, θα συζητήσουμε γιατί τα συμβατικά γραμμικά μοντέλα δεν είναι κατάλληλα για μέτρηση δεδομένων. Οι ιδιότητες των μετρήσιμων κατανομών θα σας βοηθήσουν να κατανοήσετε τις διαφορές μεταξύ των τύπων GLM για μετρήσιμα δεδομένα και των χαρακτηριστικών των διαγνωστικών τους. Θα δείτε τη συνάρτηση σύνδεσης σε λειτουργία όταν απεικονίσετε προβλέψεις GLM στην κλίμακα συνάρτησης συνδέσμου και στην κλίμακα μεταβλητής απόκρισης.
4) Γενικευμένα γραμμικά μοντέλα με δυαδική απόκριση
Μερικές φορές υπάρχει ανάγκη να προσομοιωθεί εάν κάποιο γεγονός έχει συμβεί ή όχι, αν το ποδοσφαιρική ομάδα ή έχασε, είτε ο ασθενής ανάρρωσε μετά τη θεραπεία είτε όχι, είτε ο πελάτης δεσμεύτηκε αγορά ή όχι. Τα συμβατικά γραμμικά μοντέλα δεν είναι κατάλληλα για τη μοντελοποίηση τέτοιων δυαδικών δεδομένων (γεγονότα με δύο αποτελέσματα), αλλά αυτό μπορεί να γίνει εύκολα χρησιμοποιώντας γενικευμένα γραμμικά μοντέλα. Σε αυτήν την ενότητα, θα μάθετε να μοντελοποιείτε τις πιθανότητες συμβάντων που συμβαίνουν αναπαριστάνοντάς τις ως πιθανότητες. Θα εξετάσουμε πώς λειτουργεί η συνάρτηση σύνδεσης logit και πώς ερμηνεύονται οι συντελεστές GLM όταν χρησιμοποιείται. Τέλος, θα μπορείτε να εξασκηθείτε στην ανάλυση γενικευμένων γραμμικών μοντέλων με διαφορετικές κατανομές ολοκληρώνοντας ένα έργο ανάλυσης δεδομένων. Τα αποτελέσματα αυτής της ανάλυσης θα πρέπει να παρουσιαστούν ως έκθεση σε μορφή html, γραμμένη με χρήση rmarkdown/knitr.
• Μάθετε ποιες δεξιότητες χρειάζονται για να ξεκινήσετε στην ανάλυση και την επιστήμη δεδομένων• Μάθετε να χρησιμοποιείτε τα Excel, SQL, Power BI, Google Data Studio για εργασία με δεδομένα και γράψτε τον πρώτο σας κώδικα στην Python• Λάβετε έναν οδηγό βήμα προς βήμα και μάθετε πώς να εισέλθετε στο πεδίο της επιστήμης δεδομένων και να επιλέξετε έναν ρόλο στο Data Science
4,4
1 490 ₽