Πώς να υπολογίσετε τον συντελεστή συσχέτισης χρησιμοποιώντας ένα παράδειγμα. Συντελεστής συσχέτισης και σχέση αιτίου-αποτελέσματος: τύποι και ερμηνεία τους. Τύποι συντελεστών συσχέτισης

Πώς να υπολογίσετε τον συντελεστή συσχέτισης χρησιμοποιώντας ένα παράδειγμα.  Συντελεστής συσχέτισης και σχέση αιτίου-αποτελέσματος: τύποι και ερμηνεία τους.  Τύποι συντελεστών συσχέτισης

Συντελεστής συσχέτισης

Συσχέτιση- στατιστική σχέση μεταξύ δύο ή περισσότερων τυχαίων μεταβλητών (ή μεταβλητών που μπορούν να θεωρηθούν ως τέτοιες με κάποιο αποδεκτό βαθμό ακρίβειας). Επιπλέον, οι αλλαγές σε μία ή περισσότερες από αυτές τις ποσότητες οδηγούν σε συστηματική αλλαγή σε άλλες ή άλλες ποσότητες. Ένα μαθηματικό μέτρο της συσχέτισης μεταξύ δύο τυχαίων μεταβλητών είναι ο συντελεστής συσχέτισης.

Η συσχέτιση μπορεί να είναι θετική και αρνητική (είναι επίσης πιθανό να μην υπάρχει στατιστική σχέση - για παράδειγμα, για ανεξάρτητες τυχαίες μεταβλητές). Αρνητική συσχέτιση - συσχέτιση, στην οποία μια αύξηση σε μια μεταβλητή σχετίζεται με μείωση σε μια άλλη μεταβλητή και ο συντελεστής συσχέτισης είναι αρνητικός. Θετική συσχέτιση - συσχέτιση, στην οποία μια αύξηση σε μια μεταβλητή συνδέεται με αύξηση σε μια άλλη μεταβλητή και ο συντελεστής συσχέτισης είναι θετικός.

Αυτοσυσχέτιση - στατιστική σχέση μεταξύ τυχαίων μεταβλητών από την ίδια σειρά, αλλά λαμβάνονται με μετατόπιση, για παράδειγμα, για μια τυχαία διαδικασία - με χρονική μετατόπιση.

Αφήνω Χ,Υ- δύο τυχαίες μεταβλητές που ορίζονται σε ένα χώρο πιθανοτήτων. Τότε ο συντελεστής συσχέτισής τους δίνεται από τον τύπο:

,

όπου το cov δηλώνει συνδιακύμανση και το D είναι διακύμανση ή ισοδύναμα,

,

όπου το σύμβολο υποδηλώνει τη μαθηματική προσδοκία.

Για να αναπαραστήσετε γραφικά μια τέτοια σχέση, μπορείτε να χρησιμοποιήσετε ένα ορθογώνιο σύστημα συντεταγμένων με άξονες που αντιστοιχούν και στις δύο μεταβλητές. Κάθε ζεύγος τιμών σημειώνεται με ένα συγκεκριμένο σύμβολο. Αυτό το γράφημα ονομάζεται «σκέδαση».

Η μέθοδος για τον υπολογισμό του συντελεστή συσχέτισης εξαρτάται από τον τύπο της κλίμακας στην οποία ανήκουν οι μεταβλητές. Έτσι, για τη μέτρηση μεταβλητών με διαστημικές και ποσοτικές κλίμακες, είναι απαραίτητο να χρησιμοποιηθεί ο συντελεστής συσχέτισης Pearson (συσχέτιση ροπής προϊόντος). Εάν τουλάχιστον μία από τις δύο μεταβλητές είναι σε τακτική κλίμακα ή δεν είναι κανονικά κατανεμημένη, πρέπει να χρησιμοποιηθεί η συσχέτιση κατάταξης του Spearman ή η τ (tau) του Kendal. Στην περίπτωση που μία από τις δύο μεταβλητές είναι διχοτόμηση, χρησιμοποιείται συσχέτιση σημείου-δις και αν και οι δύο μεταβλητές είναι διχοτομικές: συσχέτιση τεσσάρων πεδίων. Ο υπολογισμός του συντελεστή συσχέτισης μεταξύ δύο μη διχοτόμων μεταβλητών έχει νόημα μόνο όταν η σχέση μεταξύ τους είναι γραμμική (μονοκατευθυντική).

Συντελεστής συσχέτισης Kendell

Χρησιμοποιείται για τη μέτρηση της αμοιβαίας διαταραχής.

Συντελεστής συσχέτισης Spearman

Ιδιότητες του συντελεστή συσχέτισης

αν πάρουμε τη συνδιακύμανση ως το βαθμωτό γινόμενο δύο τυχαίων μεταβλητών, τότε ο κανόνας της τυχαίας μεταβλητής θα είναι ίσος με , και η συνέπεια της ανισότητας Cauchy-Bunyakovsky θα είναι: . , Οπου . Επιπλέον, σε αυτή την περίπτωση τα σημάδια και κταιριάξει: .

Ανάλυση συσχέτισης

Ανάλυση συσχέτισης- μέθοδος επεξεργασίας στατιστικών δεδομένων, η οποία συνίσταται στη μελέτη συντελεστών ( συσχετίσεις) μεταξύ μεταβλητών. Σε αυτή την περίπτωση, οι συντελεστές συσχέτισης μεταξύ ενός ζεύγους ή πολλών ζευγών χαρακτηριστικών συγκρίνονται για τη δημιουργία στατιστικών σχέσεων μεταξύ τους.

Στόχος ανάλυση συσχέτισης- παρέχετε κάποιες πληροφορίες για μια μεταβλητή χρησιμοποιώντας μια άλλη μεταβλητή. Σε περιπτώσεις όπου είναι δυνατό να επιτευχθεί ένας στόχος, οι μεταβλητές λέγονται ότι είναι συσχετίζω. Στην πιο γενική της μορφή, η αποδοχή της υπόθεσης μιας συσχέτισης σημαίνει ότι μια αλλαγή στην τιμή της μεταβλητής Α θα συμβεί ταυτόχρονα με μια αναλογική αλλαγή στην τιμή της Β: αν αυξηθούν και οι δύο μεταβλητές, τότε η συσχέτιση είναι θετική, εάν η μία μεταβλητή αυξάνεται και η άλλη μειώνεται, η συσχέτιση είναι αρνητική.

Η συσχέτιση αντικατοπτρίζει μόνο τη γραμμική εξάρτηση των τιμών, αλλά δεν αντικατοπτρίζει τη λειτουργική τους συνδεσιμότητα. Για παράδειγμα, αν υπολογίσετε τον συντελεστή συσχέτισης μεταξύ των μεγεθών ΕΝΑ = μικρόΕγώn(Χ) Και σι = ντοομικρό(Χ) , τότε θα είναι κοντά στο μηδέν, δηλαδή δεν υπάρχει εξάρτηση μεταξύ των ποσοτήτων. Εν τω μεταξύ, οι ποσότητες Α και Β σχετίζονται προφανώς λειτουργικά σύμφωνα με το νόμο μικρόΕγώn 2 (Χ) + ντοομικρό 2 (Χ) = 1 .

Περιορισμοί Ανάλυσης Συσχέτισης

Γραφήματα κατανομών ζευγών (x,y) με τους αντίστοιχους συντελεστές συσχέτισης x και y για καθένα από αυτά. Σημειώστε ότι ο συντελεστής συσχέτισης αντικατοπτρίζει μια γραμμική σχέση (πάνω γραμμή), αλλά δεν περιγράφει μια καμπύλη σχέσης (μεσαία γραμμή) και δεν είναι καθόλου κατάλληλος για την περιγραφή πολύπλοκων, μη γραμμικών σχέσεων (κάτω γραμμή).

  1. Η εφαρμογή είναι δυνατή εάν υπάρχει επαρκής αριθμός περιπτώσεων για μελέτη: για έναν συγκεκριμένο τύπο, ο συντελεστής συσχέτισης κυμαίνεται από 25 έως 100 ζεύγη παρατηρήσεων.
  2. Ο δεύτερος περιορισμός προκύπτει από την υπόθεση της ανάλυσης συσχέτισης, η οποία περιλαμβάνει γραμμική εξάρτηση μεταβλητών. Σε πολλές περιπτώσεις, όταν είναι αξιόπιστα γνωστό ότι υπάρχει μια σχέση, η ανάλυση συσχέτισης μπορεί να μην αποφέρει αποτελέσματα απλώς και μόνο επειδή η σχέση είναι μη γραμμική (εκφρασμένη, για παράδειγμα, ως παραβολή).
  3. Το απλό γεγονός της συσχέτισης δεν παρέχει λόγους για να υποστηριχθεί ποια από τις μεταβλητές προηγείται ή προκαλεί αλλαγές, ή ότι οι μεταβλητές σχετίζονται γενικά αιτιώδη μεταξύ τους, για παράδειγμα, λόγω της δράσης ενός τρίτου παράγοντα.

Περιοχή εφαρμογής

Αυτή η μέθοδος επεξεργασίας στατιστικών δεδομένων είναι πολύ δημοφιλής στις οικονομικές και κοινωνικές επιστήμες (ιδίως στην ψυχολογία και την κοινωνιολογία), αν και το πεδίο εφαρμογής των συντελεστών συσχέτισης είναι εκτεταμένο: ποιοτικός έλεγχος βιομηχανικών προϊόντων, μεταλλουργία, αγροχημεία, υδροβιολογία, βιομετρία και άλλα.

Η δημοτικότητα της μεθόδου οφείλεται σε δύο παράγοντες: οι συντελεστές συσχέτισης είναι σχετικά εύκολο να υπολογιστούν και η χρήση τους δεν απαιτεί ειδική μαθηματική εκπαίδευση. Σε συνδυασμό με την ευκολία στην ερμηνεία του, η ευκολία εφαρμογής του συντελεστή έχει οδηγήσει στην ευρεία χρήση του στον τομέα της ανάλυσης στατιστικών δεδομένων.

Εσφαλμένη συσχέτιση

Συχνά, η δελεαστική απλότητα της έρευνας συσχέτισης ενθαρρύνει τον ερευνητή να κάνει ψευδή διαισθητικά συμπεράσματα σχετικά με την παρουσία μιας σχέσης αιτίου-αποτελέσματος μεταξύ ζευγών χαρακτηριστικών, ενώ οι συντελεστές συσχέτισης καθορίζουν μόνο στατιστικές σχέσεις.

Στη σύγχρονη ποσοτική μεθοδολογία των κοινωνικών επιστημών, στην πραγματικότητα, έχουν εγκαταλειφθεί οι προσπάθειες για τη δημιουργία σχέσεων αιτίου-αποτελέσματος μεταξύ των παρατηρούμενων μεταβλητών χρησιμοποιώντας εμπειρικές μεθόδους. Επομένως, όταν οι ερευνητές στις κοινωνικές επιστήμες μιλούν για τη δημιουργία σχέσεων μεταξύ των μεταβλητών που μελετώνται, υπονοείται είτε μια γενική θεωρητική υπόθεση είτε μια στατιστική εξάρτηση.

δείτε επίσης

Ίδρυμα Wikimedia. 2010.

Δείτε τι είναι ο "Συντελεστής συσχέτισης" σε άλλα λεξικά:

    Συντελεστής συσχέτισης- Μια μαθηματική αναπαράσταση του βαθμού σύνδεσης μεταξύ δύο σειρών μετρήσεων. Ένας συντελεστής +1 υποδηλώνει μια σαφή θετική συσχέτιση: οι υψηλές βαθμολογίες σε μια παράμετρο (για παράδειγμα, ύψος) συσχετίζονται ακριβώς με υψηλές βαθμολογίες σε μια άλλη... ... Μεγάλη ψυχολογική εγκυκλοπαίδεια

    - ρ μ μέτρο της ισχύος της γραμμικής σύνδεσης μεταξύ των τυχαίων μεταβλητών X και Y: , όπου EX είναι η μαθηματική προσδοκία του X. DX διακύμανση X, EY μαθηματική προσδοκία Y; DY διακύμανση Y; 1 ≤ ρ ≤ 1. Εάν τα X, Y σχετίζονται γραμμικά, τότε ρ = ± 1. Για... ... Γεωλογική εγκυκλοπαίδεια

    Αγγλικά συντελεστής, συσχέτιση; Γερμανός Συσχετισμός αποτελεσματικός. Ένα μέτρο της εγγύτητας της σχέσης μεταξύ δύο ή περισσότερων μεταβλητών. Αντιναζί. Εγκυκλοπαίδεια Κοινωνιολογίας, 2009 ... Εγκυκλοπαίδεια Κοινωνιολογίας

    συντελεστής συσχέτισης- - Θέματα βιοτεχνολογίας EN συντελεστής συσχέτισης ... Οδηγός Τεχνικού Μεταφραστή

    Συντελεστής συσχέτισης- (Συντελεστής συσχέτισης) Ο συντελεστής συσχέτισης είναι ένας στατιστικός δείκτης της εξάρτησης δύο τυχαίων μεταβλητών Ορισμός του συντελεστή συσχέτισης, τύποι συντελεστών συσχέτισης, ιδιότητες του συντελεστή συσχέτισης, υπολογισμός και εφαρμογή... Εγκυκλοπαίδεια Επενδυτών

    συντελεστής συσχέτισης- 1,33. συντελεστής συσχέτισης Ο λόγος της συνδιακύμανσης δύο τυχαίων μεταβλητών προς το γινόμενο των τυπικών αποκλίσεων τους: Σημειώσεις 1. Αυτή η ποσότητα θα παίρνει πάντα τιμές από μείον 1 έως συν 1, συμπεριλαμβανομένων των ακραίων τιμών. 2. Αν δύο είναι τυχαία... ... Λεξικό-βιβλίο αναφοράς όρων κανονιστικής και τεχνικής τεκμηρίωσης

    ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ- (συντελεστής συσχέτισης) μέτρο συσχέτισης μιας μεταβλητής με μια άλλη. Βλέπε Συσχέτιση; Συντελεστής συσχέτισης παραγώγου Pearson; Συντελεστής συσχέτισης βαθμού Spearman... Μεγάλο επεξηγηματικό κοινωνιολογικό λεξικό

    Συντελεστής συσχέτισης- ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Ένας δείκτης του βαθμού γραμμικής εξάρτησης μεταξύ δύο μεταβλητών μεγεθών: Ο συντελεστής συσχέτισης μπορεί να κυμαίνεται από 1 έως 1. Εάν μεγάλες τιμές μιας ποσότητας αντιστοιχούν σε μεγάλες τιμές μιας άλλης (και ... ... Λεξικό-βιβλίο αναφοράς για την οικονομία

06.06.2018 16 235 0 Ιγκόρ

Ψυχολογία και Κοινωνία

Τα πάντα στον κόσμο είναι αλληλένδετα. Κάθε άτομο, στο επίπεδο της διαίσθησης, προσπαθεί να βρει σχέσεις μεταξύ φαινομένων για να μπορέσει να τα επηρεάσει και να τα ελέγξει. Η έννοια που αντικατοπτρίζει αυτή τη σχέση ονομάζεται συσχέτιση. Τι σημαίνει με απλά λόγια;

Περιεχόμενο:

Έννοια της συσχέτισης

Συσχέτιση (από το λατινικό "correlation" - αναλογία, σχέση)– ένας μαθηματικός όρος που σημαίνει μέτρο στατιστικής πιθανολογικής εξάρτησης μεταξύ τυχαίων μεγεθών (μεταβλητών).



Παράδειγμα:Ας πάρουμε δύο τύπους σχέσεων:

  1. Πρώτα- ένα στυλό στο χέρι ενός ατόμου. Προς ποια κατεύθυνση κινείται το χέρι, προς αυτήν την κατεύθυνση πηγαίνει το στυλό. Εάν το χέρι είναι σε ηρεμία, τότε το στυλό δεν θα γράψει. Αν κάποιος το πιέσει λίγο πιο δυνατά, το σημάδι στο χαρτί θα είναι πιο πλούσιο. Αυτός ο τύπος σχέσης αντανακλά μια αυστηρή εξάρτηση και δεν είναι συσχετιστική. Αυτή η σχέση είναι λειτουργική.
  2. Δεύτερος τύπος– η σχέση μεταξύ του επιπέδου εκπαίδευσης ενός ατόμου και της ανάγνωσης λογοτεχνίας. Δεν είναι γνωστό εκ των προτέρων ποιοι άνθρωποι διαβάζουν περισσότερα: εκείνοι με ή χωρίς τριτοβάθμια εκπαίδευση. Αυτή η σύνδεση είναι τυχαία ή στοχαστική, μελετάται από τη στατιστική επιστήμη, η οποία ασχολείται αποκλειστικά με μαζικά φαινόμενα. Εάν ένας στατιστικός υπολογισμός καθιστά δυνατή την απόδειξη της συσχέτισης μεταξύ του επιπέδου εκπαίδευσης και της ανάγνωσης λογοτεχνίας, τότε αυτό θα καταστήσει δυνατή την πραγματοποίηση οποιωνδήποτε προβλέψεων και την πρόβλεψη της πιθανολογικής εμφάνισης γεγονότων. Σε αυτό το παράδειγμα, με υψηλό βαθμό πιθανότητας, μπορεί να υποστηριχθεί ότι τα άτομα με ανώτερη εκπαίδευση, όσοι είναι πιο μορφωμένα, διαβάζουν περισσότερα βιβλία. Αλλά επειδή η σύνδεση μεταξύ αυτών των παραμέτρων δεν είναι λειτουργική, μπορεί να κάνουμε λάθος. Μπορείτε πάντα να υπολογίσετε την πιθανότητα ενός τέτοιου σφάλματος, η οποία θα είναι σαφώς μικρή και ονομάζεται επίπεδο στατιστικής σημασίας (p).

Παραδείγματα σχέσεων μεταξύ φυσικών φαινομένων είναι:η τροφική αλυσίδα στη φύση, το ανθρώπινο σώμα, που αποτελείται από συστήματα οργάνων που συνδέονται μεταξύ τους και λειτουργούν ως ενιαίο σύνολο.

Καθημερινά συναντάμε συσχετισμούς στην καθημερινότητα: μεταξύ καιρού και καλής διάθεσης, σωστής διαμόρφωσης στόχων και επίτευξής τους, θετική στάση και τύχη, αίσθημα ευτυχίας και οικονομικής ευημερίας. Αλλά αναζητούμε συνδέσεις, βασιζόμενοι όχι σε μαθηματικούς υπολογισμούς, αλλά σε μύθους, διαίσθηση, δεισιδαιμονίες και άσκοπες εικασίες. Αυτά τα φαινόμενα είναι πολύ δύσκολο να μεταφραστούν σε μαθηματική γλώσσα, να εκφραστούν με αριθμούς και να μετρηθούν. Είναι άλλο θέμα όταν αναλύουμε φαινόμενα που μπορούν να υπολογιστούν και να παρουσιαστούν με τη μορφή αριθμών. Σε αυτή την περίπτωση, μπορούμε να ορίσουμε τη συσχέτιση χρησιμοποιώντας τον συντελεστή συσχέτισης (r), ο οποίος αντανακλά την ισχύ, τον βαθμό, την εγγύτητα και την κατεύθυνση της συσχέτισης μεταξύ τυχαίων μεταβλητών.

Ισχυρή συσχέτιση μεταξύ τυχαίων μεταβλητών- στοιχεία για την παρουσία κάποιας στατιστικής σύνδεσης ειδικά μεταξύ αυτών των φαινομένων, αλλά αυτή η σύνδεση δεν μπορεί να μεταφερθεί στα ίδια φαινόμενα, αλλά για διαφορετική κατάσταση. Συχνά, οι ερευνητές, έχοντας αποκτήσει σημαντική συσχέτιση μεταξύ δύο μεταβλητών στους υπολογισμούς τους, με βάση την απλότητα της ανάλυσης συσχέτισης, κάνουν εσφαλμένες διαισθητικές υποθέσεις σχετικά με την ύπαρξη σχέσεων αιτίου-αποτελέσματος μεταξύ των χαρακτηριστικών, ξεχνώντας ότι ο συντελεστής συσχέτισης είναι πιθανολογικός. .

Παράδειγμα:ο αριθμός των ατόμων που τραυματίστηκαν σε συνθήκες παγετού και ο αριθμός των τροχαίων ατυχημάτων μεταξύ μηχανοκίνητων οχημάτων. Αυτές οι ποσότητες θα συσχετίζονται μεταξύ τους, αν και δεν είναι απολύτως αλληλένδετες, αλλά έχουν μόνο μια σύνδεση με την κοινή αιτία αυτών των τυχαίων γεγονότων - τον μαύρο πάγο. Εάν η ανάλυση δεν αποκαλύψει συσχέτιση μεταξύ των φαινομένων, αυτό δεν αποτελεί ακόμη απόδειξη της απουσίας εξάρτησης μεταξύ τους, η οποία μπορεί να είναι πολύπλοκη μη γραμμική και να μην αποκαλύπτεται από υπολογισμούς συσχέτισης.




Οι πρώτοι που εισήγαγαν την έννοια της συσχέτισης στην επιστημονική χρήση ήταν οι Γάλλοι παλαιοντολόγος Georges Cuvier. Τον 18ο αιώνα, συνήγαγε το νόμο της συσχέτισης των μερών και των οργάνων των ζωντανών οργανισμών, χάρη στον οποίο κατέστη δυνατή η αποκατάσταση της εμφάνισης ενός ολόκληρου απολιθωμένου πλάσματος, ζώου, από τα ευρεθέντα μέρη του σώματος (υπολείμματα). Στη στατιστική, ο όρος συσχέτιση χρησιμοποιήθηκε για πρώτη φορά το 1886 από έναν Άγγλο επιστήμονα Φράνσις Γκάλτον. Αλλά δεν μπορούσε να εξαγάγει τον ακριβή τύπο για τον υπολογισμό του συντελεστή συσχέτισης, αλλά ο μαθητής του το έκανε - διάσημος μαθηματικός και βιολόγος Karl Pearson.

Τύποι συσχέτισης

Κατά σημασία– εξαιρετικά σημαντικό, σημαντικό και ασήμαντο.

Είδη

τι ισούται με το r

Εξαιρετικά σημαντικό

Το r αντιστοιχεί στο επίπεδο στατιστικής σημαντικότητας p<=0,01

Σημαντικός

Το r αντιστοιχεί στο p<=0,05

Ασήμαντος

Το r δεν φτάνει το p>0,1

Αρνητικός(η μείωση της τιμής μιας μεταβλητής οδηγεί σε αύξηση του επιπέδου μιας άλλης: όσο περισσότερες φοβίες έχει ένα άτομο, τόσο λιγότερες πιθανότητες έχει να καταλάβει ηγετική θέση) και θετικό (αν η αύξηση μιας μεταβλητής οδηγεί σε αύξηση στο επίπεδο του άλλου: όσο πιο νευρικός είσαι, τόσο πιο πιθανό είναι να αρρωστήσεις). Εάν δεν υπάρχει σύνδεση μεταξύ των μεταβλητών, τότε μια τέτοια συσχέτιση ονομάζεται μηδέν.

Γραμμικός(όταν μια τιμή αυξάνεται ή μειώνεται, η δεύτερη επίσης αυξάνεται ή μειώνεται) και μη γραμμική (όταν όταν μια τιμή αλλάζει, η φύση της αλλαγής στη δεύτερη δεν μπορεί να περιγραφεί χρησιμοποιώντας μια γραμμική σχέση, τότε εφαρμόζονται άλλοι μαθηματικοί νόμοι - πολυωνυμικός, υπερβολικός σχέσεις).

Με δύναμη.

Πιθανότητα




Ανάλογα με την κλίμακα στην οποία ανήκουν οι υπό μελέτη μεταβλητές, υπολογίζονται διαφορετικοί τύποι συντελεστών συσχέτισης:

  1. Ο συντελεστής συσχέτισης Pearson, ο συντελεστής γραμμικής συσχέτισης κατά ζεύγη ή ο συσχετισμός ροπής προϊόντος υπολογίζεται για μεταβλητές με κλίμακες μέτρησης διαστήματος και κλίμακας.
  2. Συντελεστής συσχέτισης κατάταξης Spearman ή Kendall - όταν τουλάχιστον μία από τις ποσότητες έχει τακτική κλίμακα ή δεν κατανέμεται κανονικά.
  3. Συντελεστής διπλής συσχέτισης σημείου (συντελεστής συσχέτισης πρόσημου Fechner) – εάν ένα από τα δύο μεγέθη είναι διχοτόμο.
  4. Συντελεστής συσχέτισης τεσσάρων πεδίων (συντελεστής συσχέτισης πολλαπλών βαθμίδων (συμφωνία) – εάν δύο μεταβλητές είναι διχοτόμες.

Ο συντελεστής Pearson αναφέρεται σε παραμετρικούς δείκτες συσχέτισης, όλοι οι άλλοι είναι μη παραμετρικοί.

Η τιμή του συντελεστή συσχέτισης κυμαίνεται από -1 έως +1. Με πλήρη θετική συσχέτιση, r = +1, με πλήρη αρνητική συσχέτιση, r = -1.

Τύπος και υπολογισμός





Παραδείγματα

Είναι απαραίτητο να προσδιοριστεί η σχέση μεταξύ δύο μεταβλητών: του επιπέδου πνευματικής ανάπτυξης (σύμφωνα με το τεστ) και του αριθμού των καθυστερήσεων ανά μήνα (σύμφωνα με καταχωρήσεις στο εκπαιδευτικό περιοδικό) μεταξύ των μαθητών.

Τα αρχικά δεδομένα παρουσιάζονται στον πίνακα:

Δεδομένα IQ (x)

Δεδομένα για τον αριθμό των καθυστερήσεων (y)

Αθροισμα

1122

Μέση τιμή

112,2


Για να δοθεί μια σωστή ερμηνεία του ληφθέντος δείκτη, είναι απαραίτητο να αναλυθεί το πρόσημο του συντελεστή συσχέτισης (+ ή -) και η απόλυτη τιμή του (modulo).

Σύμφωνα με τον πίνακα ταξινόμησης του συντελεστή συσχέτισης κατά ισχύ, συμπεραίνουμε ότι rxy = -0,827 είναι ισχυρή αρνητική συσχέτιση. Έτσι, ο αριθμός των μαθητών που καθυστερούν εξαρτάται πολύ έντονα από το επίπεδο πνευματικής τους ανάπτυξης. Μπορούμε να πούμε ότι οι μαθητές με υψηλό επίπεδο IQ καθυστερούν στα μαθήματα λιγότερο συχνά από τους μαθητές με χαμηλό επίπεδο IQ.



Ο συντελεστής συσχέτισης μπορεί να χρησιμοποιηθεί τόσο από επιστήμονες για να επιβεβαιώσουν ή να αντικρούσουν την υπόθεση της εξάρτησης δύο μεγεθών ή φαινομένων και να μετρήσουν τη δύναμη και τη σημασία τους, όσο και από τους μαθητές για τη διεξαγωγή εμπειρικής και στατιστικής έρευνας σε διάφορα θέματα. Πρέπει να θυμόμαστε ότι αυτός ο δείκτης δεν είναι ιδανικό εργαλείο, υπολογίζεται μόνο για τη μέτρηση της ισχύος μιας γραμμικής σχέσης και θα είναι πάντα μια πιθανολογική τιμή που έχει ένα ορισμένο σφάλμα.

Η ανάλυση συσχέτισης χρησιμοποιείται στους ακόλουθους τομείς:

  • οικονομική επιστήμη?
  • αστροφυσική;
  • κοινωνικές επιστήμες (κοινωνιολογία, ψυχολογία, παιδαγωγική).
  • αγροχημεία?
  • μεταλλουργία;
  • βιομηχανία (για ποιοτικό έλεγχο).
  • υδροβιολογία;
  • βιομετρικά κλπ.

Λόγοι για τη δημοτικότητα της μεθόδου ανάλυσης συσχέτισης:

  1. Η σχετική απλότητα του υπολογισμού των συντελεστών συσχέτισης δεν απαιτεί ειδική μαθηματική εκπαίδευση.
  2. Σας επιτρέπει να υπολογίσετε τις σχέσεις μεταξύ τυχαίων μεταβλητών μάζας, οι οποίες αποτελούν αντικείμενο ανάλυσης στη στατιστική επιστήμη. Από αυτή την άποψη, αυτή η μέθοδος έχει γίνει ευρέως διαδεδομένη στο πεδίο της στατιστικής έρευνας.

Ελπίζω ότι τώρα θα μπορέσετε να διακρίνετε μια λειτουργική σχέση από μια σχέση συσχέτισης και θα ξέρετε ότι όταν ακούτε στην τηλεόραση ή διαβάζετε στον Τύπο για συσχέτιση, σημαίνει μια θετική και αρκετά σημαντική αλληλεξάρτηση μεταξύ δύο φαινομένων.

Κατά τη μελέτη διαφόρων κοινωνικοοικονομικών φαινομένων, διακρίνεται η λειτουργική σύνδεση και η στοχαστική εξάρτηση. Μια λειτουργική σύνδεση είναι ένας τύπος σύνδεσης στον οποίο μόνο μία τιμή του προκύπτοντος δείκτη αντιστοιχεί σε μια δεδομένη τιμή ενός δείκτη παράγοντα. Η λειτουργική σύνδεση εκδηλώνεται σε όλες τις περιπτώσεις έρευνας και για κάθε συγκεκριμένη μονάδα του αναλυόμενου πληθυσμού.

Δημοσιεύτηκε στο www.site

Στην περίπτωση που μια αιτιολογική εξάρτηση δεν λειτουργεί σε κάθε συγκεκριμένη περίπτωση, αλλά γενικά για ολόκληρο τον παρατηρούμενο πληθυσμό, κατά μέσο όρο για σημαντικό αριθμό παρατηρήσεων, τότε μια τέτοια εξάρτηση είναι στοχαστική. Μια ειδική περίπτωση στοχαστικής εξάρτησης είναι μια σχέση συσχέτισης, στην οποία μια αλλαγή στη μέση τιμή ενός δείκτη απόδοσης προκαλείται από μια αλλαγή στις τιμές των δεικτών παραγόντων. Ο υπολογισμός του βαθμού εγγύτητας και της κατεύθυνσης της επικοινωνίας είναι ένα σημαντικό έργο στη μελέτη και την ποσοτική αξιολόγηση της σχέσης μεταξύ διαφόρων κοινωνικοοικονομικών φαινομένων. Ο προσδιορισμός του βαθμού εγγύτητας της σχέσης μεταξύ διαφόρων δεικτών απαιτεί τον προσδιορισμό του επιπέδου συσχέτισης μεταξύ της αλλαγής του προκύπτοντος χαρακτηριστικού από μια αλλαγή σε μία (στην περίπτωση μελέτης ζευγαρωμένων εξαρτήσεων) ή από διακύμανση σε πολλές (στην περίπτωση μελέτης πολλαπλών εξαρτήσεων ) χαρακτηριστικοί παράγοντες. Για τον προσδιορισμό αυτού του επιπέδου, χρησιμοποιείται ο συντελεστής συσχέτισης.

Ο συντελεστής γραμμικής συσχέτισης εισήχθη για πρώτη φορά στις αρχές της δεκαετίας του '90. XIX αιώνα Pearson και δείχνει τον βαθμό εγγύτητας και την κατεύθυνση της σχέσης μεταξύ δύο συσχετισμένων παραγόντων εάν υπάρχει γραμμική σχέση μεταξύ τους. Κατά την ερμηνεία της προκύπτουσας τιμής του συντελεστή γραμμικής συσχέτισης, ο βαθμός εγγύτητας της σχέσης μεταξύ των χαρακτηριστικών αξιολογείται χρησιμοποιώντας την κλίμακα Chaddock, μια από τις παραλλαγές αυτής της κλίμακας φαίνεται στον παρακάτω πίνακα:

Κλίμακα Chaddock για ποσοτική εκτίμηση του βαθμού εγγύτητας σύνδεσης

Η τιμή της ένδειξης εγγύτητας σύνδεσης

Φύση επικοινωνίας

Ουσιαστικά απών

Μέτριος

Κατά την ερμηνεία της τιμής του συντελεστή γραμμικής συσχέτισης προς την κατεύθυνση της σύνδεσης, διακρίνονται η άμεση και η αντίστροφη. Εάν υπάρχει άμεση σύνδεση με αύξηση ή μείωση της τιμής ενός χαρακτηριστικού παράγοντα, εμφανίζεται αύξηση ή μείωση των δεικτών του προκύπτοντος χαρακτηριστικού, δηλ. η μεταβολή του συντελεστή και το αποτέλεσμα συμβαίνει προς την ίδια κατεύθυνση. Για παράδειγμα, η αύξηση των περιθωρίων κέρδους συμβάλλει στην αύξηση των δεικτών κερδοφορίας. Με την παρουσία ανατροφοδότησης, οι τιμές του προκύπτοντος χαρακτηριστικού αλλάζουν υπό την επίδραση του χαρακτηριστικού παράγοντα, αλλά προς την αντίθετη κατεύθυνση σε σύγκριση με τη δυναμική του χαρακτηριστικού παράγοντα. Για παράδειγμα, με την αύξηση της παραγωγικότητας της εργασίας, το κόστος ανά μονάδα παραγωγής μειώνεται κ.λπ.

Συντελεστής συσχέτισηςείναι μια τιμή που μπορεί να ποικίλλει από +1 έως –1. Στην περίπτωση πλήρους θετικής συσχέτισης, αυτός ο συντελεστής είναι ίσος με συν 1 (λένε ότι όταν η τιμή μιας μεταβλητής αυξάνεται, η τιμή μιας άλλης μεταβλητής αυξάνεται) και στην περίπτωση μιας εντελώς αρνητικής συσχέτισης, είναι μείον 1 (υποδεικνύει ανατροφοδότηση, δηλ. όταν οι τιμές μιας μεταβλητής αυξάνονται, οι τιμές της άλλης μειώνονται).

Παράδειγμα 1:

Γράφημα της σχέσης ντροπαλότητας και κατάθλιψης. Όπως μπορούμε να δούμε, τα σημεία (θέματα) δεν βρίσκονται χαοτικά, αλλά ευθυγραμμίζονται γύρω από μια γραμμή και, κοιτάζοντας αυτή τη γραμμή, μπορούμε να πούμε ότι όσο υψηλότερη είναι η ντροπαλότητα ενός ατόμου, τόσο μεγαλύτερη είναι η κατάθλιψη, δηλαδή αυτά τα φαινόμενα αλληλοσυνδέονται.

Παράδειγμα 2: Διάγραμμα για τη ντροπαλότητα και την κοινωνικότητα. Βλέπουμε ότι όσο αυξάνεται η ντροπαλότητα, τόσο μειώνεται η κοινωνικότητα. Ο συντελεστής συσχέτισής τους είναι -0,43. Έτσι, ένας συντελεστής συσχέτισης μεγαλύτερος από 0 προς 1 υποδηλώνει μια ευθέως ανάλογη σχέση (όσο περισσότερα... τόσο περισσότερα...) και ένας συντελεστής από -1 έως 0 δείχνει αντιστρόφως ανάλογη σχέση (όσο περισσότερα... τόσο λιγότερο. ..)

Εάν ο συντελεστής συσχέτισης είναι 0, και οι δύο μεταβλητές είναι εντελώς ανεξάρτητες η μία από την άλλη.

Συσχέτιση- αυτή είναι μια σχέση όπου η επίδραση μεμονωμένων παραγόντων εμφανίζεται μόνο ως τάση (κατά μέσο όρο) κατά τη μαζική παρατήρηση πραγματικών δεδομένων. Παραδείγματα εξαρτήσεων συσχέτισης μπορεί να είναι οι εξαρτήσεις μεταξύ του μεγέθους των περιουσιακών στοιχείων της τράπεζας και του ποσού του κέρδους της τράπεζας, η αύξηση της παραγωγικότητας της εργασίας και η διάρκεια υπηρεσίας των εργαζομένων.

Δύο συστήματα χρησιμοποιούνται για την ταξινόμηση των συσχετισμών ανάλογα με την ισχύ τους: γενικό και ειδικό.

Γενική ταξινόμηση των συσχετίσεων: 1) ισχυρή ή κλειστή με συντελεστή συσχέτισης r>0,70 2) μέσος όρος στο 0,500,70, και όχι απλώς μια συσχέτιση υψηλού επιπέδου σημασίας.

Ο παρακάτω πίνακας δείχνει τα ονόματα των συντελεστών συσχέτισης για διάφορους τύπους κλίμακες.

Διχοτομική κλίμακα (1/0) Βαθμολογική (τακτική) κλίμακα
Διχοτομική κλίμακα (1/0) Συντελεστής συσχέτισης Pearson, συντελεστής έκτακτης ανάγκης τεσσάρων κυττάρων Pearson. Δισειριακή συσχέτιση
Βαθμολογική (τακτική) κλίμακα Κατάταξη-δισειριακή συσχέτιση. Συντελεστής συσχέτισης κατάταξης Spearman ή Kendall.
Διαστήματα και απόλυτη κλίμακα Δισειριακή συσχέτιση Οι τιμές της κλίμακας διαστήματος μετατρέπονται σε βαθμίδες και χρησιμοποιείται ο συντελεστής κατάταξης Συντελεστής συσχέτισης Pearson (συντελεστής γραμμικής συσχέτισης)

Στο r=0 Δεν υπάρχει γραμμική συσχέτιση. Σε αυτήν την περίπτωση, οι μέσοι όροι της ομάδας των μεταβλητών συμπίπτουν με τους συνολικούς μέσους όρους τους και οι γραμμές παλινδρόμησης είναι παράλληλες με τους άξονες συντεταγμένων.

Ισότητα r=0 μιλάει μόνο για την απουσία εξάρτησης γραμμικής συσχέτισης (μη συσχετισμένες μεταβλητές), αλλά όχι γενικά για την απουσία συσχέτισης, και ακόμη περισσότερο, για στατιστική εξάρτηση.

Μερικές φορές η διαπίστωση μη συσχέτισης είναι πιο σημαντική από την παρουσία μιας ισχυρής συσχέτισης. Μια μηδενική συσχέτιση μεταξύ δύο μεταβλητών μπορεί να υποδεικνύει ότι δεν υπάρχει επίδραση της μιας μεταβλητής στην άλλη, υπό την προϋπόθεση ότι εμπιστευόμαστε τα αποτελέσματα της μέτρησης.

Στο SPSS: 11.3.2 Συντελεστές συσχέτισης

Μέχρι τώρα, διευκρινίσαμε μόνο το γεγονός της ύπαρξης στατιστικής σχέσης μεταξύ δύο χαρακτηριστικών. Στη συνέχεια, θα προσπαθήσουμε να μάθουμε ποια συμπεράσματα μπορούν να εξαχθούν σχετικά με τη δύναμη ή την αδυναμία αυτής της εξάρτησης, καθώς και για το είδος και την κατεύθυνση της. Τα κριτήρια για την ποσοτικοποίηση της σχέσης μεταξύ των μεταβλητών ονομάζονται συντελεστές συσχέτισης ή μέτρα συνδεσιμότητας. Δύο μεταβλητές συσχετίζονται θετικά εάν υπάρχει μια άμεση, μονόδρομη σχέση μεταξύ τους. Σε μια σχέση μονής κατεύθυνσης, οι μικρές τιμές μιας μεταβλητής αντιστοιχούν σε μικρές τιμές μιας άλλης μεταβλητής και οι μεγάλες τιμές αντιστοιχούν σε μεγάλες τιμές. Δύο μεταβλητές συσχετίζονται αρνητικά μεταξύ τους εάν υπάρχει μια αντίστροφη, πολυκατευθυντική σχέση μεταξύ τους. Με μια σχέση πολλαπλών κατευθύνσεων, οι μικρές τιμές μιας μεταβλητής αντιστοιχούν σε μεγάλες τιμές μιας άλλης μεταβλητής και αντίστροφα. Οι τιμές των συντελεστών συσχέτισης βρίσκονται πάντα στην περιοχή από -1 έως +1.

Ο συντελεστής Spearman χρησιμοποιείται ως συντελεστής συσχέτισης μεταξύ μεταβλητών που ανήκουν σε μια τακτική κλίμακα και ο συντελεστής συσχέτισης Pearson (στιγμή προϊόντων) χρησιμοποιείται για μεταβλητές που ανήκουν σε μια κλίμακα διαστήματος. Θα πρέπει να ληφθεί υπόψη ότι κάθε διχοτομική μεταβλητή, δηλαδή μια μεταβλητή που ανήκει σε μια ονομαστική κλίμακα και έχει δύο κατηγορίες, μπορεί να θεωρηθεί ως τακτική.

Αρχικά, θα ελέγξουμε αν υπάρχει συσχέτιση μεταξύ των μεταβλητών φύλου και ψυχής από το αρχείο studium.sav. Ταυτόχρονα θα λάβουμε υπόψη ότι η διχοτομική μεταβλητή φύλο μπορεί να θεωρηθεί τακτική. Ακολουθήστε αυτά τα βήματα:

· Επιλέξτε από το μενού εντολών Analyze Descriptive Statistics Crosstabs...

· Μετακινήστε τη μεταβλητή φύλο στη λίστα των γραμμών και τη μεταβλητή ψυχή στη λίστα στηλών.

· Κάντε κλικ στο κουμπί Στατιστικά... Στο παράθυρο διαλόγου Crosstabs: Statistics, επιλέξτε το πλαίσιο ελέγχου Συσχετίσεις. Επιβεβαιώστε την επιλογή σας με το κουμπί Συνέχεια.

· Στο παράθυρο διαλόγου Crosstabs, απενεργοποιήστε την εμφάνιση πινάκων επιλέγοντας το πλαίσιο ελέγχου Supress tables. Κάντε κλικ στο OK.

Οι συντελεστές συσχέτισης Spearman και Pearson θα υπολογιστούν και θα ελεγχθεί η σημασία τους:

/ SPSS 10

Εργασία Νο. 10 Ανάλυση συσχέτισης

Έννοια της συσχέτισης

Η συσχέτιση ή ο συντελεστής συσχέτισης είναι ένας στατιστικός δείκτης πιθανολογικόςσχέσεις μεταξύ δύο μεταβλητών που μετρώνται σε ποσοτικές κλίμακες. Σε αντίθεση με μια συναρτησιακή σχέση, στην οποία αντιστοιχεί κάθε τιμή μιας μεταβλητής αυστηρά καθορισμένοτην τιμή μιας άλλης μεταβλητής, πιθανολογική σύνδεσηχαρακτηρίζεται από το γεγονός ότι κάθε τιμή μιας μεταβλητής αντιστοιχεί πολλαπλές έννοιεςΜια άλλη μεταβλητή Ένα παράδειγμα πιθανολογικής σχέσης είναι η σχέση μεταξύ του ύψους και του βάρους των ανθρώπων. Είναι σαφές ότι άτομα διαφορετικού βάρους μπορούν να έχουν το ίδιο ύψος και το αντίστροφο.

Η συσχέτιση είναι μια τιμή που κυμαίνεται από -1 έως + 1 και συμβολίζεται με το γράμμα r. Επιπλέον, εάν η τιμή είναι πιο κοντά στο 1, τότε αυτό σημαίνει την παρουσία ισχυρής σύνδεσης και εάν είναι πιο κοντά στο 0, τότε είναι αδύναμη. Μια τιμή συσχέτισης μικρότερη από 0,2 θεωρείται ασθενής συσχέτιση και μια τιμή πάνω από 0,5 θεωρείται υψηλή συσχέτιση. Εάν ο συντελεστής συσχέτισης είναι αρνητικός, αυτό σημαίνει ότι υπάρχει ανάδραση: όσο μεγαλύτερη είναι η τιμή μιας μεταβλητής, τόσο μικρότερη είναι η τιμή της άλλης.

Ανάλογα με τις αποδεκτές τιμές του συντελεστή r, μπορούν να διακριθούν διάφοροι τύποι συσχέτισης:

Αυστηρή θετική συσχέτισηκαθορίζεται από την τιμή r=1. Ο όρος "αυστηρή" σημαίνει ότι η τιμή μιας μεταβλητής καθορίζεται μοναδικά από τις τιμές μιας άλλης μεταβλητής και ο όρος " θετικός" -ότι καθώς αυξάνονται οι τιμές μιας μεταβλητής, αυξάνονται και οι τιμές μιας άλλης μεταβλητής.

Η αυστηρή συσχέτιση είναι μια μαθηματική αφαίρεση και πρακτικά δεν συμβαίνει ποτέ στην πραγματική έρευνα.

Θετική συσχέτισηαντιστοιχεί σε τιμές 0

Καμία συσχέτισηκαθορίζεται από την τιμή r=0. Ένας μηδενικός συντελεστής συσχέτισης δείχνει ότι οι τιμές των μεταβλητών δεν σχετίζονται με κανέναν τρόπο μεταξύ τους.

Καμία συσχέτιση H ο : 0 r xy =0 διατυπώνεται ως αντανάκλαση μηδενικόυποθέσεις στην ανάλυση συσχέτισης.

Αρνητική συσχέτιση: -1

Αυστηρή αρνητική συσχέτισηκαθορίζεται από την τιμή r= -1. Είναι, όπως μια αυστηρή θετική συσχέτιση, είναι μια αφαίρεση και δεν βρίσκει έκφραση στην πρακτική έρευνα.

Τραπέζι 1

Είδη συσχέτισης και ορισμοί τους

Η μέθοδος για τον υπολογισμό του συντελεστή συσχέτισης εξαρτάται από τον τύπο της κλίμακας στην οποία μετρώνται οι μεταβλητές τιμές.

Συντελεστής συσχέτισης rPearsonείναι βασική και μπορεί να χρησιμοποιηθεί για μεταβλητές με ονομαστικές και μερικώς διατεταγμένες κλίμακες διαστήματος, η κατανομή των τιμών για τις οποίες αντιστοιχεί σε κανονική (συσχέτιση ροπής προϊόντος). Ο συντελεστής συσχέτισης Pearson δίνει αρκετά ακριβή αποτελέσματα σε περιπτώσεις μη φυσιολογικών κατανομών.

Για κατανομές που δεν είναι κανονικές, είναι προτιμότερο να χρησιμοποιείτε συντελεστές συσχέτισης κατάταξης Spearman και Kendall. Κατατάσσονται επειδή το πρόγραμμα προκατατάσσει τις συσχετισμένες μεταβλητές.

Το πρόγραμμα SPSS υπολογίζει τη συσχέτιση του Spearman ως εξής: πρώτα, οι μεταβλητές μετατρέπονται σε τάξεις και μετά ο τύπος του Pearson εφαρμόζεται στις τάξεις.

Η βάση του συσχετισμού που προτείνει ο M. Kendall είναι η ιδέα ότι η κατεύθυνση της σύνδεσης μπορεί να κριθεί συγκρίνοντας τα θέματα σε ζεύγη. Εάν για ένα ζεύγος θεμάτων η αλλαγή στο X συμπίπτει ως προς την κατεύθυνση με την αλλαγή στο Y, τότε αυτό δείχνει μια θετική σύνδεση. Εάν δεν ταιριάζει, τότε υπάρχει αρνητική σύνδεση. Αυτός ο συντελεστής χρησιμοποιείται κυρίως από ψυχολόγους που εργάζονται με μικρά δείγματα. Δεδομένου ότι οι κοινωνιολόγοι εργάζονται με μεγάλους όγκους δεδομένων, η απαρίθμηση ζευγών και ο εντοπισμός της διαφοράς στις σχετικές συχνότητες και οι αντιστροφές όλων των ζευγών υποκειμένων του δείγματος είναι δύσκολη. Ο πιο συνηθισμένος είναι ο συντελεστής. Pearson.

Δεδομένου ότι ο συντελεστής συσχέτισης Pearson r είναι βασικός και μπορεί να χρησιμοποιηθεί (με κάποιο σφάλμα ανάλογα με τον τύπο της κλίμακας και το επίπεδο ανωμαλίας στην κατανομή) για όλες τις μεταβλητές που μετρώνται σε ποσοτικές κλίμακες, θα εξετάσουμε παραδείγματα χρήσης του και θα συγκρίνουμε τα αποτελέσματα που λαμβάνονται με τα αποτελέσματα των μετρήσεων χρησιμοποιώντας άλλους συντελεστές συσχέτισης.

Τύπος για τον υπολογισμό του συντελεστή r- Pearson:

r xy = ∑ (Xi-Xavg)∙(Yi-Yavg) / (N-1)∙σ x ∙σ y ∙

Όπου: Xi, Yi - Τιμές δύο μεταβλητών.

Xavg, Yavg - μέσες τιμές δύο μεταβλητών.

σ x, σ y – τυπικές αποκλίσεις,

N είναι ο αριθμός των παρατηρήσεων.

Συσχετισμοί κατά ζεύγη

Για παράδειγμα, θα θέλαμε να μάθουμε πώς συσχετίζονται οι απαντήσεις μεταξύ διαφορετικών τύπων παραδοσιακών αξιών στις ιδέες των μαθητών σχετικά με ένα ιδανικό μέρος εργασίας (μεταβλητές: a9.1, a9.3, a9.5, a9.7) , και στη συνέχεια σχετικά με τη συσχέτιση μεταξύ φιλελεύθερων αξιών (a9 .2, a9.4. a9.6, a9.8). Αυτές οι μεταβλητές μετρώνται σε διατεταγμένες κλίμακες 5 στοιχείων.

Χρησιμοποιούμε τη διαδικασία: «Ανάλυση»,  «Συσχετίσεις»,  «Ζευγάρι». Προεπιλεγμένος συντελεστής Το Pearson έχει οριστεί στο πλαίσιο διαλόγου. Χρησιμοποιούμε τον συντελεστή. Pearson

Οι δοκιμασμένες μεταβλητές μεταφέρονται στο παράθυρο επιλογής: a9.1, a9.3, a9.5, a9.7

Κάνοντας κλικ στο OK παίρνουμε τον υπολογισμό:

Συσχετισμοί

α9.1.τ. Πόσο σημαντικό είναι να υπάρχει αρκετός χρόνος για την οικογενειακή και προσωπική ζωή;

Συσχέτιση Pearson

Τιμή (2 πλευρές)

α9.3.τ. Πόσο σημαντικό είναι να μην φοβάσαι μήπως χάσεις τη δουλειά σου;

Συσχέτιση Pearson

Τιμή (2 πλευρές)

α9.5.τ. Πόσο σημαντικό είναι να έχετε ένα αφεντικό που θα σας συμβουλεύεται όταν παίρνετε αυτή ή εκείνη την απόφαση;

Συσχέτιση Pearson

Τιμή (2 πλευρές)

α9.7.τ. Πόσο σημαντικό είναι να δουλεύεις σε μια καλά συντονισμένη ομάδα και να νιώθεις μέρος αυτής;

Συσχέτιση Pearson

Τιμή (2 πλευρές)

** Η συσχέτιση είναι σημαντική στο επίπεδο 0,01 (2-sided).

Πίνακας ποσοτικών τιμών του κατασκευασμένου πίνακα συσχέτισης

Μερικές συσχετίσεις:

Αρχικά, ας δημιουργήσουμε μια συσχέτιση ανά ζεύγη μεταξύ αυτών των δύο μεταβλητών:

Συσχετισμοί

s8. Νιώσε κοντά σε αυτούς που μένουν δίπλα σου, γείτονες

Συσχέτιση Pearson

Τιμή (2 πλευρές)

s12. Νιώθουν κοντά στην οικογένειά τους

Συσχέτιση Pearson

Τιμή (2 πλευρές)

**. Η συσχέτιση είναι σημαντική στο επίπεδο 0,01 (2-sided).

Στη συνέχεια χρησιμοποιούμε τη διαδικασία κατασκευής μερικής συσχέτισης: «Ανάλυση»,  «Συσχετισμοί»,  «Μερική».

Ας υποθέσουμε ότι η τιμή "Είναι σημαντικό να προσδιορίσετε ανεξάρτητα και να αλλάξετε τη σειρά της εργασίας σας" σε σχέση με τις καθορισμένες μεταβλητές αποδεικνύεται ότι είναι ο αποφασιστικός παράγοντας υπό την επίδραση του οποίου η σχέση που προσδιορίστηκε προηγουμένως θα εξαφανιστεί ή θα αποδειχθεί ότι είναι ασήμαντος.

Συσχετισμοί

Εξαιρούμενες μεταβλητές

s8. Νιώσε κοντά σε αυτούς που μένουν δίπλα σου, γείτονες

s12. Νιώθουν κοντά στην οικογένειά τους

σελ 16. Νιώστε κοντά με άτομα που έχουν το ίδιο εισόδημα με εσάς

s8. Νιώσε κοντά σε αυτούς που μένουν δίπλα σου, γείτονες

Συσχέτιση

Σημασία (2 όψεων)

s12. Νιώθουν κοντά στην οικογένειά τους

Συσχέτιση

Σημασία (2 όψεων)

Όπως φαίνεται από τον πίνακα, υπό την επίδραση της μεταβλητής ελέγχου, η σχέση μειώθηκε ελαφρά: από 0,120 σε 0,102, ωστόσο, αυτή η ελαφρά μείωση δεν μας επιτρέπει να δηλώσουμε ότι η σχέση που προσδιορίστηκε προηγουμένως είναι αντανάκλαση μιας ψευδούς συσχέτισης. επειδή παραμένει αρκετά υψηλό και μας επιτρέπει να απορρίψουμε τη μηδενική υπόθεση με μηδενικό σφάλμα.

Συντελεστής συσχέτισης

Ο πιο ακριβής τρόπος για να προσδιοριστεί η εγγύτητα και η φύση της συσχέτισης είναι να βρεθεί ο συντελεστής συσχέτισης. Ο συντελεστής συσχέτισης είναι ένας αριθμός που καθορίζεται από τον τύπο:


όπου r xy είναι ο συντελεστής συσχέτισης.

x i - τιμές του πρώτου χαρακτηριστικού.

y i είναι οι τιμές του δεύτερου χαρακτηριστικού.

Αριθμητικός μέσος όρος των τιμών του πρώτου χαρακτηριστικού

Αριθμητικός μέσος όρος των τιμών του δεύτερου χαρακτηριστικού

Για να χρησιμοποιήσουμε τον τύπο (32), θα δημιουργήσουμε έναν πίνακα που θα παρέχει την απαραίτητη συνέπεια στην προετοιμασία των αριθμών για να βρούμε τον αριθμητή και τον παρονομαστή του συντελεστή συσχέτισης.

Όπως φαίνεται από τον τύπο (32), η ακολουθία των ενεργειών είναι η εξής: βρίσκουμε τους αριθμητικούς μέσους όρους και των δύο χαρακτηριστικών x και y, βρίσκουμε τη διαφορά μεταξύ των τιμών του χαρακτηριστικού και του μέσου όρου του (x i - ) και y i - ), τότε βρίσκουμε το γινόμενο τους (x i - ) ( y i - ) – το άθροισμα του τελευταίου δίνει τον αριθμητή του συντελεστή συσχέτισης. Για να βρεθεί ο παρονομαστής του, οι διαφορές (x i - ) και (y i - ) πρέπει να τετραγωνιστούν, να βρεθούν τα αθροίσματά τους και να ληφθεί η τετραγωνική ρίζα του γινόμενου τους.

Έτσι, για το παράδειγμα 31, η εύρεση του συντελεστή συσχέτισης σύμφωνα με τον τύπο (32) μπορεί να αναπαρασταθεί ως εξής (Πίνακας 50).

Ο προκύπτων αριθμός του συντελεστή συσχέτισης καθιστά δυνατό τον προσδιορισμό της παρουσίας, της εγγύτητας και της φύσης της σύνδεσης.

1. Εάν ο συντελεστής συσχέτισης είναι μηδέν, δεν υπάρχει σύνδεση μεταξύ των χαρακτηριστικών.

2. Αν ο συντελεστής συσχέτισης είναι ίσος με ένα, η σύνδεση μεταξύ των χαρακτηριστικών είναι τόσο μεγάλη που μετατρέπεται σε λειτουργική.

3. Η απόλυτη τιμή του συντελεστή συσχέτισης δεν υπερβαίνει το διάστημα από το μηδέν έως το ένα:

Αυτό καθιστά δυνατή την εστίαση στην εγγύτητα της σύνδεσης: όσο πιο κοντά είναι ο συντελεστής στο μηδέν, τόσο πιο αδύναμη είναι η σύνδεση και όσο πιο κοντά στην ενότητα, τόσο πιο κοντά είναι η σύνδεση.

4. Το πρόσημο «συν» του συντελεστή συσχέτισης σημαίνει άμεση συσχέτιση, το πρόσημο «πλην» σημαίνει αντίστροφη συσχέτιση.

Τραπέζι 50

x i u i (x i - ) (υ i - ) (x i - )(y i - ) (x i - )2 (у i - )2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


Έτσι, ο συντελεστής συσχέτισης που υπολογίστηκε στο παράδειγμα 31 είναι r xy = +0,9. μας επιτρέπει να βγάλουμε τα ακόλουθα συμπεράσματα: υπάρχει συσχέτιση μεταξύ του μεγέθους της μυϊκής δύναμης του δεξιού και του αριστερού χεριού στους μαθητές που μελετήθηκαν (ο συντελεστής r xy =+0,9 είναι διαφορετικός από το μηδέν), η σχέση είναι πολύ στενή (ο συντελεστής r xy =+0,9 είναι κοντά στο ένα) , η συσχέτιση είναι άμεση (ο συντελεστής r xy = +0,9 είναι θετικός), δηλ., με την αύξηση της μυϊκής δύναμης του ενός χεριού, η δύναμη του άλλου χεριού αυξάνεται.

Κατά τον υπολογισμό του συντελεστή συσχέτισης και τη χρήση των ιδιοτήτων του, θα πρέπει να λαμβάνεται υπόψη ότι τα συμπεράσματα δίνουν σωστά αποτελέσματα όταν τα χαρακτηριστικά κατανέμονται κανονικά και όταν λαμβάνεται υπόψη η σχέση μεταξύ μεγάλου αριθμού τιμών και των δύο χαρακτηριστικών.

Στο εξεταζόμενο παράδειγμα 31, αναλύθηκαν μόνο 7 τιμές και των δύο χαρακτηριστικών, κάτι που, φυσικά, δεν αρκεί για τέτοιες μελέτες. Σας υπενθυμίζουμε εδώ για άλλη μια φορά ότι τα παραδείγματα σε αυτό το βιβλίο γενικά και σε αυτό το κεφάλαιο ειδικότερα έχουν χαρακτήρα επεξηγηματικών μεθόδων και όχι λεπτομερή παρουσίαση οποιωνδήποτε επιστημονικών πειραμάτων. Ως αποτέλεσμα, ελήφθη υπόψη ένας μικρός αριθμός τιμών χαρακτηριστικών, οι μετρήσεις στρογγυλοποιήθηκαν - όλα αυτά έγιναν έτσι ώστε οι περίπλοκοι υπολογισμοί να μην συγκαλύπτουν την ιδέα της μεθόδου.

Ιδιαίτερη προσοχή πρέπει να δοθεί στην ουσία της υπό εξέταση σχέσης. Ο συντελεστής συσχέτισης δεν μπορεί να οδηγήσει σε σωστά αποτελέσματα έρευνας εάν η σχέση μεταξύ των χαρακτηριστικών αναλυθεί επίσημα. Ας επιστρέψουμε για άλλη μια φορά στο παράδειγμα 31. Και τα δύο θεωρούμενα σημάδια ήταν οι τιμές της μυϊκής δύναμης του δεξιού και του αριστερού χεριού. Ας φανταστούμε ότι με το σύμβολο x i στο παράδειγμα 31 (14.0; 14.2; 14.9... ...18.1) εννοούμε το μήκος του ψαριού που αλιεύτηκε κατά λάθος σε εκατοστά και με το σύμβολο y i (12.1 ; 13.8; 14.2... ... 17.4) - βάρος οργάνων στο εργαστήριο σε κιλά. Έχοντας χρησιμοποιήσει επίσημα τη συσκευή υπολογισμού για να βρούμε τον συντελεστή συσχέτισης και σε αυτή την περίπτωση λάβαμε επίσης r xy =+0>9, έπρεπε να συμπεράνουμε ότι υπάρχει στενή άμεση σχέση μεταξύ του μήκους του ψαριού και του βάρους των οργάνων. Το ανούσιο ενός τέτοιου συμπεράσματος είναι προφανές.

Για να αποφευχθεί μια επίσημη προσέγγιση στη χρήση του συντελεστή συσχέτισης, θα πρέπει να χρησιμοποιηθεί οποιαδήποτε άλλη μέθοδος - μαθηματική, λογική, πειραματική, θεωρητική - για να εντοπιστεί η πιθανότητα ύπαρξης συσχέτισης μεταξύ των χαρακτηριστικών, δηλαδή να ανακαλυφθεί η οργανική ενότητα των χαρακτηριστικών. Μόνο μετά από αυτό μπορεί κανείς να αρχίσει να χρησιμοποιεί την ανάλυση συσχέτισης και να καθορίσει το μέγεθος και τη φύση της σχέσης.

Στη μαθηματική στατιστική υπάρχει και η έννοια πολλαπλή συσχέτιση- σχέσεις μεταξύ τριών ή περισσότερων χαρακτηριστικών. Σε αυτές τις περιπτώσεις, χρησιμοποιείται ένας πολλαπλός συντελεστής συσχέτισης, ο οποίος αποτελείται από τους ζευγαρωμένους συντελεστές συσχέτισης που περιγράφονται παραπάνω.

Για παράδειγμα, ο συντελεστής συσχέτισης τριών χαρακτηριστικών - x i, y i, z i - είναι:

όπου R xyz είναι ο πολλαπλός συντελεστής συσχέτισης, που εκφράζει πώς το χαρακτηριστικό x i εξαρτάται από τα χαρακτηριστικά y i και z i.

r xy - συντελεστής συσχέτισης μεταξύ των χαρακτηριστικών x i και y i;

r xz - συντελεστής συσχέτισης μεταξύ των χαρακτηριστικών Xi και Zi.

r yz - συντελεστής συσχέτισης μεταξύ των χαρακτηριστικών y i , z i

Η ανάλυση συσχέτισης είναι:

Ανάλυση συσχέτισης

Συσχέτιση- στατιστική σχέση μεταξύ δύο ή περισσότερων τυχαίων μεταβλητών (ή μεταβλητών που μπορούν να θεωρηθούν ως τέτοιες με κάποιο αποδεκτό βαθμό ακρίβειας). Επιπλέον, οι αλλαγές σε μία ή περισσότερες από αυτές τις ποσότητες οδηγούν σε συστηματική αλλαγή σε άλλες ή άλλες ποσότητες. Ένα μαθηματικό μέτρο της συσχέτισης μεταξύ δύο τυχαίων μεταβλητών είναι ο συντελεστής συσχέτισης.

Η συσχέτιση μπορεί να είναι θετική και αρνητική (είναι επίσης πιθανό να μην υπάρχει στατιστική σχέση - για παράδειγμα, για ανεξάρτητες τυχαίες μεταβλητές). Αρνητική συσχέτιση - συσχέτιση, στην οποία μια αύξηση σε μια μεταβλητή σχετίζεται με μείωση σε μια άλλη μεταβλητή και ο συντελεστής συσχέτισης είναι αρνητικός. Θετική συσχέτιση - συσχέτιση, στην οποία μια αύξηση σε μια μεταβλητή συνδέεται με αύξηση σε μια άλλη μεταβλητή και ο συντελεστής συσχέτισης είναι θετικός.

Αυτοσυσχέτιση - στατιστική σχέση μεταξύ τυχαίων μεταβλητών από την ίδια σειρά, αλλά λαμβάνονται με μετατόπιση, για παράδειγμα, για μια τυχαία διαδικασία - με χρονική μετατόπιση.

Η μέθοδος επεξεργασίας στατιστικών δεδομένων, η οποία συνίσταται στη μελέτη των συντελεστών (συσχέτισης) μεταξύ των μεταβλητών, ονομάζεται ανάλυση συσχέτισης.

Συντελεστής συσχέτισης

Συντελεστής συσχέτισηςή συντελεστής συσχέτισης ζεύγουςστη θεωρία πιθανοτήτων και τη στατιστική, είναι ένας δείκτης της φύσης της αλλαγής σε δύο τυχαίες μεταβλητές. Ο συντελεστής συσχέτισης συμβολίζεται με το λατινικό γράμμα R και μπορεί να πάρει τιμές μεταξύ -1 και +1. Εάν η απόλυτη τιμή είναι πιο κοντά στο 1, τότε αυτό σημαίνει την παρουσία ισχυρής σύνδεσης (αν ο συντελεστής συσχέτισης είναι ίσος με ένα μιλάμε για συναρτητική σύνδεση), και αν είναι πιο κοντά στο 0, τότε είναι ασθενής.

Συντελεστής συσχέτισης Pearson

Για τα μετρικά μεγέθη, χρησιμοποιείται ο συντελεστής συσχέτισης Pearson, ο ακριβής τύπος του οποίου εισήχθη από τον Francis Galton:

Αφήνω Χ,Υ- δύο τυχαίες μεταβλητές που ορίζονται στον ίδιο χώρο πιθανοτήτων. Τότε ο συντελεστής συσχέτισής τους δίνεται από τον τύπο:

,

όπου το cov δηλώνει συνδιακύμανση και το D είναι διακύμανση, ή ισοδύναμα,

,

όπου το σύμβολο υποδηλώνει τη μαθηματική προσδοκία.

Για να αναπαραστήσετε γραφικά μια τέτοια σχέση, μπορείτε να χρησιμοποιήσετε ένα ορθογώνιο σύστημα συντεταγμένων με άξονες που αντιστοιχούν και στις δύο μεταβλητές. Κάθε ζεύγος τιμών σημειώνεται με ένα συγκεκριμένο σύμβολο. Αυτό το γράφημα ονομάζεται «σκέδαση».

Η μέθοδος για τον υπολογισμό του συντελεστή συσχέτισης εξαρτάται από τον τύπο της κλίμακας στην οποία ανήκουν οι μεταβλητές. Έτσι, για τη μέτρηση μεταβλητών με διαστημικές και ποσοτικές κλίμακες, είναι απαραίτητο να χρησιμοποιηθεί ο συντελεστής συσχέτισης Pearson (συσχέτιση ροπής προϊόντος). Εάν τουλάχιστον μία από τις δύο μεταβλητές είναι σε τακτική κλίμακα ή δεν είναι κανονικά κατανεμημένη, πρέπει να χρησιμοποιηθεί η συσχέτιση κατάταξης του Spearman ή η τ (tau) του Kendal. Στην περίπτωση που μία από τις δύο μεταβλητές είναι διχοτόμηση, χρησιμοποιείται συσχέτιση σημείου-δις και αν και οι δύο μεταβλητές είναι διχοτομικές: συσχέτιση τεσσάρων πεδίων. Ο υπολογισμός του συντελεστή συσχέτισης μεταξύ δύο μη διχοτόμων μεταβλητών έχει νόημα μόνο όταν η σχέση μεταξύ τους είναι γραμμική (μονοκατευθυντική).

Συντελεστής συσχέτισης Kendell

Χρησιμοποιείται για τη μέτρηση της αμοιβαίας διαταραχής.

Συντελεστής συσχέτισης Spearman

Ιδιότητες του συντελεστή συσχέτισης

  • Ανισότητα Cauchy-Bunyakovsky:
αν πάρουμε τη συνδιακύμανση ως το βαθμωτό γινόμενο δύο τυχαίων μεταβλητών, τότε ο κανόνας της τυχαίας μεταβλητής θα είναι ίσος με , και η συνέπεια της ανισότητας Cauchy-Bunyakovsky θα είναι: . , Οπου . Επιπλέον, σε αυτή την περίπτωση τα σημάδια και κταιριάξει: .

Ανάλυση συσχέτισης

Ανάλυση συσχέτισης- μέθοδος επεξεργασίας στατιστικών δεδομένων, η οποία συνίσταται στη μελέτη συντελεστών ( συσχετίσεις) μεταξύ μεταβλητών. Σε αυτή την περίπτωση, οι συντελεστές συσχέτισης μεταξύ ενός ζεύγους ή πολλών ζευγών χαρακτηριστικών συγκρίνονται για τη δημιουργία στατιστικών σχέσεων μεταξύ τους.

Στόχος ανάλυση συσχέτισης- παρέχετε κάποιες πληροφορίες για μια μεταβλητή χρησιμοποιώντας μια άλλη μεταβλητή. Σε περιπτώσεις όπου είναι δυνατό να επιτευχθεί ένας στόχος, οι μεταβλητές λέγονται ότι είναι συσχετίζω. Στην πιο γενική της μορφή, η αποδοχή της υπόθεσης μιας συσχέτισης σημαίνει ότι μια αλλαγή στην τιμή της μεταβλητής Α θα συμβεί ταυτόχρονα με μια αναλογική αλλαγή στην τιμή της Β: αν αυξηθούν και οι δύο μεταβλητές, τότε η συσχέτιση είναι θετική, εάν η μία μεταβλητή αυξάνεται και η άλλη μειώνεται, η συσχέτιση είναι αρνητική.

Η συσχέτιση αντικατοπτρίζει μόνο τη γραμμική εξάρτηση των τιμών, αλλά δεν αντικατοπτρίζει τη λειτουργική τους συνδεσιμότητα. Για παράδειγμα, αν υπολογίσετε τον συντελεστή συσχέτισης μεταξύ των μεγεθών ΕΝΑ = μικρόΕγώn(Χ) Και σι = ντοομικρό(Χ), τότε θα είναι κοντά στο μηδέν, δηλαδή δεν υπάρχει εξάρτηση μεταξύ των ποσοτήτων. Εν τω μεταξύ, οι ποσότητες Α και Β σχετίζονται προφανώς λειτουργικά σύμφωνα με το νόμο μικρόΕγώn 2(Χ) + ντοομικρό 2(Χ) = 1.

Περιορισμοί Ανάλυσης Συσχέτισης



Γραφήματα κατανομών ζευγών (x,y) με τους αντίστοιχους συντελεστές συσχέτισης x και y για καθένα από αυτά. Σημειώστε ότι ο συντελεστής συσχέτισης αντικατοπτρίζει μια γραμμική σχέση (πάνω γραμμή), αλλά δεν περιγράφει μια καμπύλη σχέσης (μεσαία γραμμή) και δεν είναι καθόλου κατάλληλος για την περιγραφή πολύπλοκων, μη γραμμικών σχέσεων (κάτω γραμμή).
  1. Η εφαρμογή είναι δυνατή εάν υπάρχει επαρκής αριθμός περιπτώσεων για μελέτη: για έναν συγκεκριμένο τύπο, ο συντελεστής συσχέτισης κυμαίνεται από 25 έως 100 ζεύγη παρατηρήσεων.
  2. Ο δεύτερος περιορισμός προκύπτει από την υπόθεση της ανάλυσης συσχέτισης, η οποία περιλαμβάνει γραμμική εξάρτηση μεταβλητών. Σε πολλές περιπτώσεις, όταν είναι αξιόπιστα γνωστό ότι υπάρχει μια σχέση, η ανάλυση συσχέτισης μπορεί να μην αποφέρει αποτελέσματα απλώς και μόνο επειδή η σχέση είναι μη γραμμική (εκφρασμένη, για παράδειγμα, ως παραβολή).
  3. Το απλό γεγονός της συσχέτισης δεν παρέχει λόγους για να υποστηριχθεί ποια από τις μεταβλητές προηγείται ή προκαλεί αλλαγές, ή ότι οι μεταβλητές σχετίζονται γενικά αιτιώδη μεταξύ τους, για παράδειγμα, λόγω της δράσης ενός τρίτου παράγοντα.

Περιοχή εφαρμογής

Αυτή η μέθοδος επεξεργασίας στατιστικών δεδομένων είναι πολύ δημοφιλής στις οικονομικές και κοινωνικές επιστήμες (ιδίως στην ψυχολογία και την κοινωνιολογία), αν και το πεδίο εφαρμογής των συντελεστών συσχέτισης είναι εκτεταμένο: ποιοτικός έλεγχος βιομηχανικών προϊόντων, μεταλλουργία, αγροχημεία, υδροβιολογία, βιομετρία και άλλα.

Η δημοτικότητα της μεθόδου οφείλεται σε δύο παράγοντες: οι συντελεστές συσχέτισης είναι σχετικά εύκολο να υπολογιστούν και η χρήση τους δεν απαιτεί ειδική μαθηματική εκπαίδευση. Σε συνδυασμό με την ευκολία στην ερμηνεία του, η ευκολία εφαρμογής του συντελεστή έχει οδηγήσει στην ευρεία χρήση του στον τομέα της ανάλυσης στατιστικών δεδομένων.

Εσφαλμένη συσχέτιση

Συχνά, η δελεαστική απλότητα της έρευνας συσχέτισης ενθαρρύνει τον ερευνητή να κάνει ψευδή διαισθητικά συμπεράσματα σχετικά με την παρουσία μιας σχέσης αιτίου-αποτελέσματος μεταξύ ζευγών χαρακτηριστικών, ενώ οι συντελεστές συσχέτισης καθορίζουν μόνο στατιστικές σχέσεις.

Η σύγχρονη ποσοτική μεθοδολογία των κοινωνικών επιστημών έχει, στην πραγματικότητα, εγκαταλείψει τις προσπάθειες να δημιουργηθούν σχέσεις αιτίου-αποτελέσματος μεταξύ των παρατηρούμενων μεταβλητών χρησιμοποιώντας εμπειρικές μεθόδους. Επομένως, όταν οι ερευνητές στις κοινωνικές επιστήμες μιλούν για τη δημιουργία σχέσεων μεταξύ των μεταβλητών που μελετώνται, υπονοείται είτε μια γενική θεωρητική υπόθεση είτε μια στατιστική εξάρτηση.

δείτε επίσης

  • Συνάρτηση αυτοσυσχέτισης
  • Συνάρτηση διασυσχέτισης
  • Συνδιακύμανση
  • Συντελεστής προσδιορισμού
  • Ανάλυση παλινδρόμησης

Ίδρυμα Wikimedia. 2010.

Το τεστ συσχέτισης Pearson είναι μια μέθοδος παραμετρικών στατιστικών που σας επιτρέπει να προσδιορίσετε την παρουσία ή την απουσία μιας γραμμικής σχέσης μεταξύ δύο ποσοτικών δεικτών, καθώς και να αξιολογήσετε την εγγύτητα και τη στατιστική σημασία της. Με άλλα λόγια, το τεστ συσχέτισης Pearson σάς επιτρέπει να προσδιορίσετε εάν υπάρχει γραμμική σχέση μεταξύ των αλλαγών στις τιμές δύο μεταβλητών. Σε στατιστικούς υπολογισμούς και συμπεράσματα, ο συντελεστής συσχέτισης συνήθως συμβολίζεται ως r xyή Rxy.

1. Ιστορικό ανάπτυξης του κριτηρίου συσχέτισης

Το τεστ συσχέτισης Pearson αναπτύχθηκε από μια ομάδα Βρετανών επιστημόνων με επικεφαλής τον Καρλ Πίρσον(1857-1936) στη δεκαετία του '90 του 19ου αιώνα, για να απλοποιηθεί η ανάλυση της συνδιακύμανσης δύο τυχαίων μεταβλητών. Εκτός από τον Karl Pearson, οι άνθρωποι εργάστηκαν επίσης στο κριτήριο συσχέτισης Pearson Φράνσις ΈτζγουορθΚαι Ραφαέλ Ουέλντον.

2. Σε τι χρησιμεύει το τεστ συσχέτισης Pearson;

Η δοκιμή συσχέτισης Pearson σάς επιτρέπει να προσδιορίσετε την εγγύτητα (ή την ισχύ) της συσχέτισης μεταξύ δύο δεικτών που μετρώνται σε ποσοτική κλίμακα. Χρησιμοποιώντας πρόσθετους υπολογισμούς, μπορείτε επίσης να προσδιορίσετε πόσο στατιστικά σημαντική είναι η προσδιορισμένη σχέση.

Για παράδειγμα, χρησιμοποιώντας το κριτήριο συσχέτισης Pearson, μπορείτε να απαντήσετε στο ερώτημα εάν υπάρχει σχέση μεταξύ της θερμοκρασίας του σώματος και της περιεκτικότητας σε λευκοκύτταρα στο αίμα κατά τις οξείες αναπνευστικές λοιμώξεις, μεταξύ του ύψους και του βάρους του ασθενούς, μεταξύ της περιεκτικότητας σε φθόριο σε πόσιμο νερό και η συχνότητα εμφάνισης οδοντικής τερηδόνας στον πληθυσμό.

3. Προϋποθέσεις και περιορισμοί για τη χρήση του Pearson chi-square test

  1. Συγκρίσιμοι δείκτες πρέπει να μετρώνται σε ποσοτική κλίμακα(για παράδειγμα, καρδιακός ρυθμός, θερμοκρασία σώματος, αριθμός λευκών αιμοσφαιρίων ανά 1 ml αίματος, συστολική αρτηριακή πίεση).
  2. Χρησιμοποιώντας το τεστ συσχέτισης Pearson, μπορούμε μόνο να προσδιορίσουμε παρουσία και δύναμη γραμμικής σχέσηςμεταξύ των ποσοτήτων. Άλλα χαρακτηριστικά της σχέσης, συμπεριλαμβανομένης της κατεύθυνσης (άμεση ή αντίστροφη), η φύση των αλλαγών (ευθύγραμμες ή καμπυλόγραμμες), καθώς και η παρουσία εξάρτησης μιας μεταβλητής από μια άλλη, προσδιορίζονται χρησιμοποιώντας ανάλυση παλινδρόμησης.
  3. Ο αριθμός των συγκριτικών ποσοτήτων πρέπει να είναι ίσος με δύο. Στην περίπτωση ανάλυσης της σχέσης τριών ή περισσότερων παραμέτρων, θα πρέπει να χρησιμοποιήσετε τη μέθοδο παραγοντική ανάλυση.
  4. Το τεστ συσχέτισης Pearson είναι παραμετρική, και επομένως η προϋπόθεση για τη χρήση του είναι κανονική κατανομήσύγκριση μεταβλητών. Εάν είναι απαραίτητο να πραγματοποιηθεί μια ανάλυση συσχέτισης δεικτών των οποίων η κατανομή διαφέρει από την κανονική, συμπεριλαμβανομένων εκείνων που μετρώνται σε τακτική κλίμακα, θα πρέπει να χρησιμοποιηθεί ο συντελεστής συσχέτισης κατάταξης του Spearman.
  5. Οι έννοιες της εξάρτησης και της συσχέτισης πρέπει να διακρίνονται σαφώς. Η εξάρτηση των ποσοτήτων καθορίζει την ύπαρξη συσχέτισης μεταξύ τους, αλλά όχι το αντίστροφο.

Για παράδειγμα, το ύψος ενός παιδιού εξαρτάται από την ηλικία του, δηλαδή όσο μεγαλύτερο είναι το παιδί τόσο πιο ψηλό είναι. Αν πάρουμε δύο παιδιά διαφορετικών ηλικιών, τότε με μεγάλο βαθμό πιθανότητας η ανάπτυξη του μεγαλύτερου παιδιού θα είναι μεγαλύτερη από αυτή του μικρότερου. Αυτό το φαινόμενο ονομάζεται εθισμός, υπονοώντας μια σχέση αιτίου-αποτελέσματος μεταξύ των δεικτών. Φυσικά, μεταξύ τους υπάρχει και σύνδεση συσχέτισης, που σημαίνει ότι οι αλλαγές σε έναν δείκτη συνοδεύονται από αλλαγές σε έναν άλλο δείκτη.

Σε μια άλλη περίπτωση, εξετάστε τη σχέση μεταξύ του ύψους ενός παιδιού και του καρδιακού παλμού (HR). Όπως είναι γνωστό, και οι δύο αυτές τιμές εξαρτώνται άμεσα από την ηλικία, έτσι στις περισσότερες περιπτώσεις, τα παιδιά μεγαλύτερου ύψους (και επομένως μεγαλύτερης ηλικίας) θα έχουν χαμηλότερες τιμές καρδιακών παλμών. Αυτό είναι, σύνδεση συσχέτισηςθα παρατηρηθεί και ενδέχεται να έχει αρκετά μεγάλο συνωστισμό. Ωστόσο, αν πάρουμε τα παιδιά η ιδια ηλικια, Αλλά διαφορετικά ύψη, τότε, πιθανότατα, ο καρδιακός τους ρυθμός θα διαφέρει ασήμαντα, και επομένως μπορούμε να συμπεράνουμε ότι ανεξαρτησίαΚαρδιακός ρυθμός από ύψος.

Το παραπάνω παράδειγμα δείχνει πόσο σημαντικό είναι να γίνεται διάκριση μεταξύ θεμελιωδών εννοιών στη στατιστική. διαβιβάσειςΚαι εξαρτήσειςδείκτες για την εξαγωγή ορθών συμπερασμάτων.

4. Πώς υπολογίζεται ο συντελεστής συσχέτισης Pearson;

Ο συντελεστής συσχέτισης Pearson υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

5. Πώς ερμηνεύεται η τιμή του συντελεστή συσχέτισης Pearson;

Οι τιμές των συντελεστών συσχέτισης Pearson ερμηνεύονται με βάση τις απόλυτες τιμές τους. Οι πιθανές τιμές του συντελεστή συσχέτισης ποικίλλουν από 0 έως ±1. Όσο μεγαλύτερη είναι η απόλυτη τιμή του r xy, τόσο μεγαλύτερη είναι η εγγύτητα της σχέσης μεταξύ των δύο μεγεθών. r xy = 0 υποδηλώνει πλήρη έλλειψη επικοινωνίας. r xy = 1 – υποδηλώνει την παρουσία απόλυτης (λειτουργικής) σύνδεσης. Εάν η τιμή του κριτηρίου συσχέτισης Pearson αποδειχθεί ότι είναι μεγαλύτερη από 1 ή μικρότερη από -1, έγινε σφάλμα στους υπολογισμούς.

Για την αξιολόγηση της στεγανότητας ή της αντοχής μιας συσχέτισης, χρησιμοποιούνται συνήθως γενικά αποδεκτά κριτήρια, σύμφωνα με τα οποία οι απόλυτες τιμές του r xy< 0.3 свидетельствуют о αδύναμοςσύνδεση, τιμές r xy από 0,3 έως 0,7 - σχετικά με τη σύνδεση μέση τιμήστεγανότητα, τιμές r xy > 0,7 - o ισχυρόςδιαβιβάσεις.

Μια πιο ακριβής εκτίμηση της ισχύος της συσχέτισης μπορεί να ληφθεί εάν χρησιμοποιήσετε Τραπέζι Chaddock:

Βαθμός στατιστική σημασίαΟ συντελεστής συσχέτισης r xy πραγματοποιείται χρησιμοποιώντας το τεστ t, που υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

Η λαμβανόμενη τιμή t r συγκρίνεται με την κρίσιμη τιμή σε ένα ορισμένο επίπεδο σημαντικότητας και τον αριθμό των βαθμών ελευθερίας n-2. Εάν το t r υπερβαίνει το t crit, τότε εξάγεται ένα συμπέρασμα σχετικά με τη στατιστική σημασία της ταυτοποιημένης συσχέτισης.

6. Παράδειγμα υπολογισμού του συντελεστή συσχέτισης Pearson

Σκοπός της μελέτης ήταν να εντοπιστεί, να προσδιοριστεί η εγγύτητα και η στατιστική σημασία της συσχέτισης μεταξύ δύο ποσοτικών δεικτών: του επιπέδου τεστοστερόνης στο αίμα (Χ) και του ποσοστού μυϊκής μάζας στο σώμα (Υ). Τα αρχικά δεδομένα για ένα δείγμα που αποτελείται από 5 άτομα (n = 5) συνοψίζονται στον πίνακα.


Οι περισσότεροι συζητήθηκαν
Πώς να υπολογίσετε τον χρόνο σύμφωνα με τη μέση ώρα του Γκρίνουιτς Πώς να υπολογίσετε τον χρόνο σύμφωνα με τη μέση ώρα του Γκρίνουιτς
Γρίφοι για παραμύθια και χαρακτήρες παραμυθιού Διαγωνισμοί και αινίγματα για παραμύθια Γρίφοι για παραμύθια και χαρακτήρες παραμυθιού Διαγωνισμοί και αινίγματα για παραμύθια
Πώς να ράψετε ένα κουμπί για καλή τύχη και υγεία Πώς να ράψετε κουμπιά για να προσελκύσετε χρήματα Πώς να ράψετε ένα κουμπί για καλή τύχη και υγεία Πώς να ράψετε κουμπιά για να προσελκύσετε χρήματα


μπλουζα