Γραμμική παλινδρόμηση - πορεία 4900 τρίψτε. από Ανοιχτή εκπαίδευση, εκπαίδευση 5 εβδομάδες, περίπου 2 ώρες την εβδομάδα, Ημερομηνία 29 Νοεμβρίου 2023.
μικροαντικείμενα / / November 29, 2023
Εάν η ανάλυση συσχέτισης καθιστά δυνατό τον ποσοτικό προσδιορισμό της ισχύος και της κατεύθυνσης της σχέσης μεταξύ δύο μεγεθών, τότε η κατασκευή μοντέλων παλινδρόμησης παρέχει μεγαλύτερες ευκαιρίες. Χρησιμοποιώντας την ανάλυση παλινδρόμησης, είναι δυνατό να περιγραφεί ποσοτικά η συμπεριφορά των μεγεθών που μελετήθηκαν ανάλογα με τις μεταβλητές πρόβλεψης και να ληφθούν προβλέψεις για νέα δεδομένα. Θα μάθετε πώς να δημιουργείτε απλά και πολλαπλά γραμμικά μοντέλα χρησιμοποιώντας τη γλώσσα R. Κάθε μέθοδος έχει τους περιορισμούς της, επομένως θα σας βοηθήσουμε να καταλάβετε σε ποιες καταστάσεις Η γραμμική παλινδρόμηση μπορεί και δεν μπορεί να χρησιμοποιηθεί και θα σας διδάξουμε μεθόδους διάγνωσης επιλεγμένων μοντέλα. Ιδιαίτερη θέση στο μάθημα έχει η εις βάθος ανατομία της ανάλυσης παλινδρόμησης: θα κατακτήσετε πράξεις με πίνακες που αποτελούν τη βάση της γραμμικής παλινδρόμησης για να μπορέσουμε να κατανοήσουμε πιο σύνθετες ποικιλίες γραμμικών μοντέλα.
Εάν αντιμετωπίζετε την ανάγκη να αναζητήσετε και να περιγράψετε τις σχέσεις μεταξύ ορισμένων φαινομένων που μπορούν να μετρηθούν ποσοτικά, τότε αυτό το μάθημα είναι μια καλή ευκαιρία να κατανοήσετε πώς λειτουργεί η απλή και πολλαπλή γραμμική παλινδρόμηση, να μάθετε για τις δυνατότητες και τους περιορισμούς αυτών μεθόδους.
Το μάθημα έχει σχεδιαστεί για όσους είναι ήδη εξοικειωμένοι με τις βασικές τεχνικές ανάλυσης δεδομένων χρησιμοποιώντας τη γλώσσα R και με τη δημιουργία απλών εγγράφων .html με χρήση rmarkdown και knitr.
Επιστημονικά ενδιαφέροντα: δομή και δυναμική θαλάσσιων κοινοτήτων βένθου, χωρικές κλίμακες, διαδοχή, μεσοειδικές και ενδοειδικές βιοτικές αλληλεπιδράσεις, ανάπτυξη και αναπαραγωγή θαλάσσιων ασπόνδυλων, δημογραφική δομή πληθυσμών, μικροεξέλιξη, βιοστατιστική.
Το μάθημα αποτελείται από 5 ενότητες:
1. Ανάλυση συσχέτισης. Απλή Γραμμική Παλινδρόμηση
Θα ξεκινήσουμε τη συζήτησή μας σχετικά με τις μεθόδους για την αριθμητική περιγραφή των σχέσεων μεταξύ ποσοτικών μεγεθών με συντελεστές συνδιακύμανσης και συσχέτισης, που μας επιτρέπουν να εκτιμήσουμε τη δύναμη και την κατεύθυνση της σχέσης. Στη συνέχεια θα μάθετε ποιες πρόσθετες πληροφορίες σχετικά με τις σχέσεις μπορούν να ληφθούν κατασκευάζοντας ένα γραμμικό μοντέλο της σχέσης μεταξύ των ποσοτήτων. Θα μάθετε να ερμηνεύετε τους συντελεστές παλινδρόμησης και θα μάθετε πότε και πώς μπορούν να χρησιμοποιηθούν γραμμικά μοντέλα για να κάνετε προβλέψεις για νέα δεδομένα. Στο τέλος αυτής της ενότητας, θα μάθετε πώς να προσαρμόζετε μια γραμμική εξίσωση μοντέλου και να την σχεδιάζετε με μια περιοχή εμπιστοσύνης.
2. Έλεγχος της σημασίας και της εγκυρότητας γραμμικών μοντέλων
Η κατασκευή ενός γραμμικού μοντέλου και η καταγραφή της εξίσωσής του είναι μόνο η αρχή της ανάλυσης. Σε αυτήν την ενότητα, θα μάθετε πώς να περιγράφετε τα αποτελέσματα της ανάλυσης παλινδρόμησης: πώς να ελέγχετε τη στατιστική σημασία του συνολικού μοντέλου ή τους συντελεστές του και να αξιολογείτε την ποιότητα της προσαρμογής. Τα γραμμικά μοντέλα (ή μάλλον οι στατιστικές δοκιμές που χρησιμοποιούνται για αυτά), όπως κάθε μέθοδος, έχουν τους περιορισμούς τους. Θα μάθετε ποιοι είναι αυτοί οι περιορισμοί και από πού προέρχονται. Οι γραφικές διαγνωστικές μέθοδοι που θα χρησιμοποιήσουμε είναι καθολικές για διαφορετικά γραμμικά μοντέλα - η περισσότερη εξάσκηση θα σας βοηθήσει να λαμβάνετε αποφάσεις με μεγαλύτερη αυτοπεποίθηση. Μόλις καταλάβετε όλα αυτά, μπορείτε να γράψετε ένα πλήρες σενάριο σε R για να ταιριάζει, να διαγνώσετε και να παρουσιάσετε τα αποτελέσματα μιας απλής γραμμικής παλινδρόμησης.
3. Μια σύντομη εισαγωγή στον κόσμο της Γραμμικής Άλγεβρας
Σε αυτήν την ενότητα, θα βουτήξουμε στην καρδιά των γραμμικών μοντέλων. Για να το κάνετε αυτό, θα πρέπει να μάθετε ή να θυμάστε τα βασικά της γραμμικής άλγεβρας. Θα συζητήσουμε τους διαφορετικούς τύπους πινάκων, τον τρόπο δημιουργίας τους στο R και τις βασικές λειτουργίες με αυτούς. Θα χρειαστούμε όλα αυτά για να καταλάβουμε πώς λειτουργεί η γραμμική παλινδρόμηση εκ των έσω. Θα μάθετε τι είναι ένας πίνακας μοντέλου, θα μάθετε πώς να γράφετε μια εξίσωση γραμμικής παλινδρόμησης με τη μορφή πινάκων και θα βρείτε τους συντελεστές της. Θα δείτε με τα μάτια σας τη μήτρα καπέλων, η οποία σας επιτρέπει να λαμβάνετε προβλεπόμενες τιμές και θα μπορείτε ακόμη και να την υπολογίσετε χειροκίνητα. Τέλος, θα μάθετε να υπολογίζετε την υπολειπόμενη διακύμανση, τον πίνακα διακύμανσης-συνδιακύμανσης και να χρησιμοποιείτε όλα αυτά για να δημιουργήσετε μια ζώνη εμπιστοσύνης παλινδρόμησης. Τότε αυτή η γνώση θα σας βοηθήσει να κατανοήσετε τη δομή πιο πολύπλοκων μοντέλων: με διακριτούς προγνωστικούς παράγοντες, με διαφορετικές κατανομές υπολειμμάτων, με διαφορετική δομή του πίνακα παραλλαγής-συνδιακύμανσης.
4. Πολλαπλή Γραμμική Παλινδρόμηση
Τις περισσότερες φορές, οι σχέσεις μεταξύ των ποσοτήτων είναι πιο περίπλοκες από ό, τι μπορεί να περιγραφεί χρησιμοποιώντας απλή γραμμική παλινδρόμηση. Η πολλαπλή γραμμική παλινδρόμηση χρησιμοποιείται για να περιγράψει πώς μια μεταβλητή απόκρισης εξαρτάται από πολλαπλούς προγνωστικούς παράγοντες. Με την εμφάνιση πολλαπλών προβλέψεων στο μοντέλο, η γραμμική παλινδρόμηση έχει μια νέα προϋπόθεση εφαρμογής - την απαίτηση της απουσίας πολυσυγγραμμικότητας. Σε αυτή την ενότητα, θα μάθετε πώς να αναγνωρίζετε και να αποφεύγετε την πολυσυγγραμμικότητα. Τέλος, υπάρχουν συχνά περισσότερες μεταβλητές σε πολλά μοντέλα από όσες μπορούν να απεικονιστούν σε ένα επίπεδο, Γι' αυτό θα σας διδάξουμε απλές τεχνικές που θα σας βοηθήσουν να δημιουργήσετε ενημερωτικά γραφικά ακόμα και σε αυτό υπόθεση.
5. Σύγκριση γραμμικών μοντέλων
Τα πολλαπλά γραμμικά μοντέλα είναι σαν ένα σύνολο κατασκευής: πιο περίπλοκα μοντέλα μπορούν να αποσυναρμολογηθούν και να απλοποιηθούν. Θα μάθετε πώς χρησιμοποιούνται οι συγκρίσεις ένθετων μοντέλων χρησιμοποιώντας τη μερική δοκιμή F για να ελέγξετε τη σημασία μεμονωμένων προγνωστικών ή ομάδων πρόβλεψης. Πιο πολύπλοκα μοντέλα περιγράφουν καλύτερα τα αρχικά δεδομένα, αλλά η υπερβολική περιπλοκή είναι επικίνδυνη, γιατί τέτοια μοντέλα αρχίζουν να κάνουν κακές προβλέψεις για νέα δεδομένα. Χρησιμοποιώντας μερικές δοκιμές F, μπορείτε να απλοποιήσετε τα μοντέλα εξαλείφοντας σταδιακά μη σημαντικούς προγνωστικούς παράγοντες. Τα απλοποιημένα μοντέλα είναι ευκολότερα στη χρήση για την ερμηνεία και την παρουσίαση αποτελεσμάτων. Όλα όσα έχετε μάθει μέχρι τώρα σχετικά με τη γραμμική παλινδρόμηση μπορούν να εφαρμοστούν ολοκληρώνοντας ένα έργο ανάλυσης δεδομένων όπου πρέπει να να κατασκευάσει σωστά ένα βέλτιστο πολλαπλό γραμμικό μοντέλο και να παρουσιάσει τα αποτελέσματά του σε μια αναφορά γραμμένη χρησιμοποιώντας rmarkdown και knitr.