Αντιμετωπίσαμε κάποιο πρόβλημα με ορισμένα άρθρα που είναι κατεστραμμένα ή δυσπρόσιτα στο ιστολόγιο Win Vector. Εγώ (ο John Mount) θέλω να ζητήσω συγγνώμη για αυτό.
Ειδικότερα, τα γραφήματα λείπουν για την υπέροχη σειρά παλινδρόμησης Pricipal Components της Dr. Nina Zumel. Το πλήρες R
.md
και .Rmd
Τα αρχεία που δημιούργησαν τα άρθρα είναι εύκολο να φτάσετε και να διορθώσετε αυτό το πρόβλημα. Οπότε δημοσιεύω τους συνδέσμους εδώ.
Δεν βλέπω αυτά τα άρθρα ως κάτι που θα μας κάνει δημοφιλείς, αλλά ως εξάλειψη κάποιου χρέους τεκμηρίωσης προς τους πελάτες και τους συνεργάτες μας που έχουν επωφεληθεί από τις μεθόδους. Επίσης, είναι ευκαιρία για μένα να αποδώσω σωστά τα εύσημα στη Δρ. Nina Zumel, καθώς είναι η πιο θορυβώδης συνεργάτης του Win Vector που τείνω να μου πιστώνονται πολλά πράγματα που αποδεικνύεται ότι ήταν δουλειά της.
Το Y-aware PCA είναι μια τεχνική που χρησιμοποιήσαμε με μεγάλη επιτυχία για πολλούς πελάτες. Οι πλησιέστερες μέθοδοι θα ήταν η ρυθμιζόμενη με L2 παλινδρόμηση και οι μέθοδοι PCA/PCR. Το Y-aware PCA διαφέρει πολύ στον τρόπο με τον οποίο αντιμετωπίζονται οι μεταβλητές θορύβου από την ρυθμιζόμενη με L2 παλινδρόμηση, καθώς είναι πολύ πιο ανθεκτικό στην υπερβολική προσαρμογή. Το Y-aware PCA διαφέρει πολύ από το τυπικό PCA/PCR κλιμάκωσης, καθώς είναι επιθετικό στο φιλτράρισμα άσχετων μεταβλητών.
Χωρίς περαιτέρω καθυστέρηση, εδώ είναι η σειρά άρθρων με άθικτες φιγούρες!
Είχα επίσης μια διαφήμιση για τα πρώτα 3 μέρη της σειράς εδώ: Γιατί πρέπει να διαβάσετε τη σειρά 3 μερών της Nina Zumel σχετικά με την ανάλυση και την παλινδρόμηση των κύριων στοιχείων. να γνωρίζετε ότι συνδέεται με τα κατεστραμμένα αντικείμενα και όχι με τα άθικτα αντικείμενα που αναφέρονται παραπάνω.
Εκτός από τις παραπάνω αποδείξεις της αποτελεσματικότητας της μεθόδου, έχουμε ορισμένες αποδείξεις αποτελεσματικότητας σε εξειδικευμένες καταστάσεις, αλλά δεν τις έχουμε γράψει ακόμη σε μορφή κοινής χρήσης.
Κατηγορίες: Administrativia Opinion Tutorials
