Κατ’αρχάς μια συγγνώμη για όποιον ήρθε σ’αυτή τη σελίδα αναζητώντας πληροφορίες για τον καρκίνο του μαστού. Η σελίδα έχει σχέση με μαθηματικά και πιθανότητες και τα νούμερα που αναφέρονται για το θέμα είναι όλα κατά πάσα πιθανότατα πλασματικά, οπότε μπορείτε να κλείσετε τη σελίδα τώρα και να συνεχίσετε την αναζήτησή σας. Δυστυχώς το Google δεν είναι ακόμα σε θέση να ξεχωρίσει τα σχετικά με τα εντελώς άσχετα αποτελέσματα.
Επιπλέον κάποιοι μπορεί να θεωρήσουν άκομψη τη χρήση παραδειγμάτων με μαστογραφίες και καρκίνο του μαστού, αλλά πιθανότατα ο αρχικός συγγραφέας το επέλεξε για να δείξει ότι οι πιθανότητες δεν είναι απλά μαθηματικά για τρελούς επιστήμονες, αλλά ζήτημα με καθημερινές εφαρμογές (ακόμα και ζήτημα ζωής και θανάτου).
Το άρθρο γράφτηκε από τον Luke Muehlhauser του ιστολογίου “Common Sense Atheism” και βασίστηκε σε ένα παλιότερο άρθρο του 2003 του ερευνητή σε θέματα τεχνητής νοημοσύνης Eliezer Yudkowsky. Αποφάσισα να το μεταφράσω γιατί είναι από τις λίγες ολοκληρωμένες παρουσιάσεις του Θεωρήματος Μπέυζ και των Πιθανοτήτων γενικότερα που υπάρχουν στο διαδίκτυο και απευθύνονται στο ευρύ κοινό (ή όπως λέει ο Luke, απευθύνεται σε εκείνους που έχουν να ασχοληθούν με τα μαθηματικά απ’το σχολείο). Το άρθρο διατίθεται και σε PDF (στα Ελληνικά και στο πρωτότυπο αγγλικό) για πιο άνετη ανάγνωση.
Αν αναρωτιέστε τι θέση έχει ένα άρθρο περί μαθηματικών και πιθανοτήτων σε ένα ιστολόγιο κυρίως αθεϊστικού ενδιαφέροντος, να θυμίσω ότι συχνά διάφοροι απολογητές αναφέρονται σε μπεϋζιανές αποδείξεις περί Θεού ή περί του μύθου της ανάστασης, οπότε είναι χρήσιμο να ξέρετε τι ακριβώς είναι το Θεώρημα Μπέυζ και η μπεϋζιανή λογική και πως χρησιμοποιείται ορθά και όχι ως ρητορικό μέσο εντυπωσιασμού.
Και μια τελευταία συμβουλή: μην προσπαθήσετε να τα βγάλετε πέρα με όλο το άρθρο μονοκοπανιά. Αν και ο Luke έκανε πολύ καλή δουλειά στην απλοποίηση, το αντικείμενο παραμένει απαιτητικό. Βεβαιωθείτε ότι έχετε κατανοήσει ένα κεφάλαιο πριν προχωρήσετε στο επόμενο.
Καλή ανάγνωση!
ΜΙΑ
ΑΠΛΗ ΕΞΗΓΗΣΗ
ΤΟΥ ΘΕΩΡΗΜΑΤΟΣ ΜΠΕΫΖ
Ένα κείμενο του Eliezer Yudkowsky ©2003
διασκευασμένο από τον Luke Muehlhauser (cc)2010
Ο Richard Feynman είπε κάποτε πως αν ένας πυρηνικός πόλεμος έκανε το ανθρώπινο είδος να χάσει όλη τη γνώση και να ξεκινήσει από την αρχή, αλλά μπορούσαμε κάπως να τους μεταδώσουμε μόνο μία πληροφορία, θα τους λέγαμε το εξής:
Όλα τα πράγματα είναι φτιαγμένα από άτομα· μικρά σωματίδια που κινούνται αέναα, έλκουν το ένα το άλλο όταν απέχουν λίγο, αλλά απωθούνται όταν συμπιέζονται.
Για τον Feynman αυτή ήταν η πιο χρήσιμη και σημαντική πληροφορία που θα έπρεπε να μεταδώσουμε σε μια ανθρωπότητα που είχε χάσει όλη την υπόλοιπη γνώση.
Εξαιρετική επιλογή, ειδικά δεδομένου ότι χρησιμοποιεί την έννοια της απλούστευσης.
Σκεπτόμενος λιγάκι, νομίζω πως ίσως η δεύτερη πληροφορία που θα μετέδιδα στη νέα κοινωνία θα ήταν το Θεώρημα του Μπέυζ.
Το να βλέπεις τον κόσμο μέσα από τον φακό του Θεωρήματος του Μπέυς, είναι σα να βλέπει το Μάτριξ. Τίποτα δεν είναι το ίδιο μετά τον Μπέυζ.
Αλλά δεν πρόκειται να σας δώσω την εξίσωση και μετά να εξηγήσω τα μέρη της, επειδή αν δεν καταλαβαίνετε την λογική πίσω από την εξίσωση, δε θα μπορείτε να την εφαρμόσετε σωστά. Ο στόχος αυτού του κειμένου δεν είναι να σας διδάξει πώς να δίνετε την απάντηση που θέλει ο δάσκαλος και να απαντάτε σωστά σε ένα τεστ. Όχι, ο στόχος αυτού του κειμένου είναι κατανοήσετε πραγματικά το Θεώρημα του Μπέυς, ώστε να μπορείται να το εφαρμόσετε σωστά στην πραγματική ζωή και σε πράγματα που δεν βρίσκονται σε μια κόλλα εξετάσεων. Στο τέλος αυτού του κειμένου δε μπορείτε απλά να παπαγαλίζετε το Θεώρημα του Μπέυζ· θα το έχετε κάνει κτήμα σας.
Η πιο δημοφιλής εξήγηση του Θεωρήματος του Μπέυζ ονόματι “Μια διαισθητική εξήγηση του Θεωρήματος του Μπέυζ” του Eliezer Yudkowsky ξεκινά ως εξής:
Οι φίλοι σου και οι συνάδελφοί σου συζητάνε για κάτι που λέγεται “Θεώρημα Μπέυζ” ή “Κανόνας του Μπέυζ” ή κάτι που λέγεται μπεϋζιανός λογισμός. Φαίνονται ενθουσιασμένοι, οπότε το γκουγκλάρεις και βρίσκεις μια σελίδα για το Θεώρημα του Μπέυζ και…
Είναι μια εξίσωση. Αυτό είναι όλο. Απλά μια εξίσωση. Η σελίδα που βρήκες περιέχει έναν ορισμό, αλλά δε λέει τι είναι ή γιατί είναι τόσο χρήσιμο ή γιατί οι φίλοι σου δείχνουν τόσο ενδιαφέρον. Μοιάζει να είναι απλά κάτι που έχει σχέση με στατιστική.
Έτσι βρέθηκες εδώ. Μπορεί να μην καταλαβαίνεις τι λέει η εξίσωση. Μπορεί να καταλαβαίνεις τη θεωρία, αλλά κάθε φορά που προσπαθείς να την εφαρμόσεις μπερδεύεσαι να θυμηθείς τη διαφορά μεταξύ p(a|x) και p(x|a) και αν το p(a)·p(x|a) ανήκει στον αριθμητή ή τον παρανομαστή. Μπορεί να βλέπεις το θεώρημα και να καταλαβαίνεις το θεώρημα και να ξέρεις να χρησιμοποιείς το θεώρημα, αλλά δεν καταλαβαίνεις γιατί οι φίλοι ή/και οι συνεργάτες σου νομίζουν πως είναι το σημαντικότερο μυστικό του σύμπαντος. Μπορεί όλοι οι φίλοι σου να φοράνε μπλουζάκια με το Θεώρημα και να νιώθεις στην από’ξω. Μπορεί να είσαι ένα κορίτσι που ψάχνει για γκόμενο, αλλά το αγόρι που σε ενδιαφέρει αρνείται να τα φτιάξε με “μη μπεϋζιανό”. Το σημαντικό είναι ότι ο Μπέυζ είναι κουλ και αν δεν κατανοείς τον Μπέυζ, τότε δεν είσαι κουλ.
Γιατί μια μαθηματική έννοια δημιουργεί τόσο ενθουσιασμό στους γνώστες της; Για ποιο λόγο αυτή η Επανάσταση του Μπέυζ σαρώνει την επιστημονική κοινότητα και ισχυρίζεται πως ακόμα και η πειραματική μέθοδος είναι ειδική περίπτωσή της; Ποιο είναι το μυστικό που γνωρίζουν οι ακόλουθοι του Μπέυζ; Τι είναι αυτό το φως που έχουν δει;
Σύντομα θα γνωρίζεις κι εσύ. Σύντομα θα είσαι ένας από εμάς.
Η εξήγηση του Ελιέζερ γι’αυτόν τον σημαντικό νόμο των πιθανοτήτων είναι πιθανότατα η καλύτερη στο διαδίκτυο, αλλά φοβάμαι πως είναι πολύ απαιτητική για άτομα που δεν έχουν ασχοληθεί ούτε με απλή άλγεβρα μετά το λύκειο. Ο Ελιέζερ την αποκαλεί “απελπιστικά απλή”, αλλά πρέπει να μετράει την απλότητα σε μια κλίμακα για άτομα που διαβάζανε Feynman στα 9 και κάνανε διαφορικό λογισμό στα 13, όπως ο ίδιος.
Αποφάσισα, λοιπόν, να γράψω μια ακόμα πιο απλή εισαγωγή στο Θεώρημα του Μπέυζ. Μια που να είναι απλή ακόμα και για φυσιολογικά άτομα.
Υπάρχουν στιγμές που ο Yudkowsky εισάγει νέους όρους χωρίς να τους ορίζει ή να τους εξηγεί (“μέση αναθεωρημένη πιθανότητα”, για παράδειγμα). Άλλες φορές μας αφήνει με δύσκολα προβλήματα χωρίς τα απαραίτητα εφόδια για να το λύσουμε (για παράδειγμα, το πρόβλημα πριν αναφέρει τη φράση “μέση αναθεωρημένη πιθανότητα”). Σ’αυτό το σημείο, υποθέτω, πολλοί μη μαθηματικοί απλά τα παρατάνε και δεν ξανασχολούνται. Αν παρατήσατε στη μέση την εισαγωγή του Yudkowsky στο Θεώρημα του Μπέυζ, ελπίζω να δοκιμάσετε τη δική μου. Είναι πολύ πιο απλή.
Και αν κολλήσετε πουθενά στο άρθρο, παρακαλώ να αφήσετε σχόλιο ή να στείλετε ένα email εξηγώντας ακριβώς πού κολλήσατε. Αυτό θα είναι σημάδι πως πρέπει να κάνω εκείνο το σημείο ακόμα πιο απλό.
Επειδή το άρθρο είναι πιο απλό από του Yudkowsky, είναι μεγαλύτερο. Σας συμβουλεύω να διαβάζετε ένα κομμάτι τη μέρα. Ο πίνακας περιεχομένων είναι παρακάτω.
Αυτή η εισαγωγή έχει επίσης αντικαταστήσει τα διαδραστικά τμήματα της εισαγωγής του Yudkowsky με πολλές εικόνες, ώστε να μπορείτε να το διαβάσετε σε φορητές συσκευές όπως ένα Kindle. Εδώ μπορείτε να το κατεβάσετε σε PDF είτε στα Ελληνικά, είτε στο πρωτότυπο αγγλικό. (το ελληνικό PDF είναι φτιαγμένο για να μπορεί και να εκτυπωθεί σε σελίδες Α5)
Ελπίζω να το βρείτε χρήσιμο!
ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ
- Ο Μπεϋζιανός μέσα σου
- Κι οι γιατροί το κάνουν λάθος
- Που στραβώνει το πράμα;
- Μερικοί ορισμοί και σύμβολα
- Οπτικοποίηση πιθανοτήτων
- Βλάκες χωρίς τον Μπέυζ
- Θετικά και αρνητικά αποτελέσματα
- Πώς σχετίζονται τα διάφορα μεγέθη
- Λόγοι πιθανοφανειών
- Ηχηρές αποδείξεις
- Ιδού το Θεώρημα του Μπέυζ!
- Και γιατί να εντυπωσιαστούμε;
Πιθανότατα ήδη χρησιμοποιείτε μπεϋζιανή λογική χωρίς να το ξέρετε.
Αναλογιστείτε το παράδειγμα που προσάρμοσα από τον Neil Manson:
Είσαι ένας στρατιώτης στη μάχη μέσα σε ένα χαράκωμα. Ξέρεις ότι υπάρχει ένας μόνο εχθρικός στρατιώτης στο πεδίο της μάχης, γύρω στα 400 μέτρα μακριά. Επίσης ξέρεις πως αν ο στρατιώτης είναι απλός φαντάρος έχει μικρή πιθανότητα να σε πετύχει από τέτοια απόσταση. Αλλά αν ο στρατιώτης είναι ελεύθερος σκοπευτής υπάρχει καλή πιθανότητα να σε πετύχει. Αλλά οι ελεύθεροι σκοπευτές είναι σπάνιοι, οπότε πρόκειται για απλό φαντάρο.
Βγάζεις λίγο το κεφάλι να ρίξεις μια ματιά έξω από το χαράκωμα.
Μπάμ! Μια σφαίρα εξοστρακίζεται στο κράνος σου και χώνεσαι πάλι στο χαράκωμα.
Εντάξει, σκέφτεσαι.Ξέρω πως οι ελεύθεροι σκοπευτές είναι σπάνιοι, αλλά αυτός ο τύπος μόλις με πέτυχε από τα 400 μέτρα. Υποθέτω πως ίσως να είναι απλός φαντάρος, αλλά υπάρχει καλή πιθανότητα να είναι ελεύθερος σκοπευτής, μιας και με πέτυχε από τόσο μακριά.
Λίγα λεπτά αργότερα τολμάς να ρίξεις άλλη μια ματιά και βγάζεις το κεφάλι σου λίγο πάνω από το χαράκωμα.
Μπαμ! Άλλη μια σφαίρα εξοστρακίζεται στο κράνος σου! Πέφτεις πάλι κάτω!
Γαμώτο, σκέφτεσαι. Σίγουρα είναι ελεύθερος σκοπευτής. Όσο σπάνιοι και να είναι, δεν υπάρχει περίπτωση ο τύπος να με πέτυχε δυο φορές σερί από τα 400 μέτρα και να είναι απλός φαντάρος. Πρέπει να είναι ελεύθερος σκοπευτής. Καλύτερα να καλέσω ενισχύσεις.
Αν θα σκεφτόσουνα μ’αυτόν περίπου τον τρόπο σε μια τέτοια περίπτωση, τότε συγχαρητήρια! Ήδη σκέφτεσαι σαν Μπεϋζιανός· τουλάχιστον μερικές φορές.
Αλλά φυσικά είναι χρήσιμο να είμαστε πιο ακριβείς από αυτό και είναι χρήσιμο να ξέρουμε πότε η λογική μας ξεστρατίζει από την ορθή μπεϋζιανή λογική. Για την ακρίβεια, στην επιστημονική μελέτη των λογικών πλανών, μια προκατάληψη ορίζεται ως η συστηματική απομάκρυνση από την ιδανική μπεϋζιανή λογική.
Ας μην είμαστε πια Περιστασιακοί Μπεϋζιανοί. Ας είμαστε συνεπείς Μπεϋζιανοί.
Ξεκινάμε με ένα πρόβλημα, όπως αυτά στο σχολείο. Αλλά σας υπόσχομαι πως το Θεώρημα του Μπέυζ είναι πολύ πιο χρήσιμο από οτιδήποτε μάθατε στο σχολείο.
Να το πρόβλημα:
Μόνο το 1% των 40χρονων γυναικών που κάνουν ετήσια μαστογραφία έχουν καρκίνο του μαστού. Το 80% των γυναικών που έχουν καρκίνο του μαστού έχουν θετικές μαστογραφίες, αλλά και το 9,6% των γυναικών που δεν έχουν καρκίνο του μαστού έχουν επίσης θετική μαστογραφία. Μια γυναίκα αυτής της ηλικίας είχε θετική μαστογραφία. Ποια είναι η πιθανότητα να έχει πράγματι καρκίνο του μαστού;
Αν δυσκολεύεστε να βρείτε την απάντηση, ίσως ανακουφιστείτε με το ότι μόνο το 15% των γιατρών δίνουν τη σωστή απάντηση.
Και όχι, το νούμερο δεν είναι ψεύτικο. Δείτε και Casscells et. al. (1978), Eddy (1982), Gigerenzer & Hoffrage (1995).
Αλλά πάρτε ένα κομπιουτεράκι και δείτε αν μπορείτε εσείς να βρείτε τη σωστή απάντηση. Τα μαθηματικά είναι απλά, αλλά το πρόβλημα είναι πονηρό.
Εμπρός. Δοκιμάστε.
Εδώ θά’μαι, δε φεύγω.
Τι απάντηση βρήκατε; Οι περισσότεροι γιατροί υπολογίζουν μεταξύ 70% και 80%, αλλά αυτό είναι εντελώς λάθος.
Ας δοκιμάσουμε μια πιο εύκολη εκδοχή του προβλήματος. Αυτή τη φορά σχεδόν οι μισοί γιατροί απαντάνε σωστά.
Οι 100 στις 10.000 γυναίκες 40 ετών που κάνουν ετήσια μαστογραφία έχουν καρκίνο του μαστού. . Οι 80 από τις 100 γυναίκες με καρκίνο του μαστού έχουν θετική μαστογραφία. Οι 950 από τις 9.900 γυναίκες χωρίς καρκίνο έχουν θετική μαστογραφία. Αν 10.000 αυτής της ηλικίας κάνουν μαστογραφία, τι κλάσμα των γυναικών έχουν πράγματι καρκίνο του μαστού;
Κάντε μια προσπάθεια. Ποια είναι η απάντηση;
Η απάντηση είναι 7,8%. Μόλις 7,8% των γυναικών με θετική μαστογραφία έχουν καρκίνο του μαστού!
Δείτε τη λογική με την οποία λύνουμε το πρόβλημα:
Πάντα να ξεκινάτε βρίσκοντας τι ψάχνετε να βρείτε. Σ’αυτή την περίπτωση θέλουμε να βρούμε τι κλάσμα (ή ποσοστό) των γυναικών με θετικές μαστογραφίες πράγματι έχουν καρκίνο του μαστού.
Πρώτα ας βρούμε πόσες γυναίκες έχουν θετικές μαστογραφίες. Αυτός θα είναι ο παρονομαστής του κλάσματος.
Το πρόβλημα λέει πως οι 950 από τις 9,900 που δεν έχουν έχουν καρκίνο του μαστού έχουν θετική μαστογραφία. Άρα έχουμε κατ’ευθείαν 950 γυναίκες με θετικό αποτέλεσμα.
Το πρόβλημα λέει επίσης πως 80 στις 100 γυναίκες που έχουν καρκίνο του μαστού έχουν θετική μαστογραφία. Άρα έχουμε άλλες 80 γυναίκες και 950 + 80 = 1.030 γυναίκες με θετική μαστογραφία.
Ωραία. Έχουμε το μισό μας κλάσμα. Τώρα πώς θα βρούμε τον αριθμητή; Πόσες από αυτές τις 1.030 γυναίκες όντως έχουν καρκίνο του μαστού;
Το πρόβλημα λέει πως 80 στις 100 γυναίκες που έχουν καρκίνο έχουν θετική μαστογραφία, οπότε ο αριθμητής είναι 80.
‘Αρα το κλάσμα των γυναικών με θετική μαστογραφία που έχουν καρκίνο του μαστού είναι 80/1.030 που είναι μια πιθανότητα της τάξης του 0,078 ή 7,8%.
Επομένως αν μια από αυτές τις 40χρονες γυναίκες είχε θετική μαστογραφία και ο γιατρός ήξερε τις παραπάνω στατιστικές, τότε θα έπρεπε να της πει πως έχει μόνο 7,8% πιθανότητα να έχει πράγματι καρκίνο του στήθους, παρά τη θετική μαστογραφία. Προφανώς πολύ λιγότερο αγχωτικό από το να της έλεγε ο γιατρός ότι έχει 70%-80% πιθανότητα να έχει καρκίνο, όπως φαίνεται πως θα έλεγαν οι περισσότεροι γιατροί!
Ήδη βλέπουμε πως αυτού του είδους η αριθμητική έχει επιπτώσεις στον πραγματικό κόσμο. Δεν πρόκειται για “απλά μαθηματικά”.
Γιατί ακόμα και γιατροί κάνουν τέτοιο λάθος σε τέτοιου είδους πρόβλημα; Οι πράξεις δεν είναι δύσκολες, οπότε τι πάει στραβά;
Το πρώτο συνηθισμένο λάθος είναι να εστιάσουμε μόνο στις γυναίκες με καρκίνο που έχουν θετική μαστογραφία, αγνοώντας την άλλη σημαντική πληροφορία, όπως το αρχικό κλάσμα γυναικών που έχουν καρκίνο και εκείνες που έχουν θετική μαστογραφία χωρίς καρκίνο.
Αλλά πάντα χρειάζονται και τα τρία στοιχεία για τη σωστή απάντηση.
Για να κατανοήσετε γιατί χρειάζονται και οι τρεις πληροφορίες, φανταστείτε ένα εναλλακτικό σύμπαν όπου μόνο μία γυναίκα στο εκατομμύριο έχει καρκίνο και έστω πως η μαστογραφία ανιχνεύει καρκίνο 8 στις 10 φορές, με ψευδές θετικό αποτέλεσμα μόνο στο 10% των περιπτώσεων.
Νομίζω πως βλέπετε τώρα πως σ’αυτό το σύμπαν η αρχική πιθανότητα μια γυναίκα να έχει καρκίνο είναι τόσο απίστευτα χαμηλή, ώστε ακόμα κι αν μια γυναίκα έχει θετική μαστογραφία, είναι σχεδόν σίγουρο πως δεν έχει καρκίνο του μαστού.
Γιατί; Επειδή υπάρχουν πάρα πολλές γυναίκες με ψευδώς θετικές μαστογραφίες (10% του 99,9999% των γυναικών). Άρα αν μια γυναίκα έχει θετική μαστογραφία, είναι σχεδόν σίγουρα ψευδές θετικό και όχι κανονικό θετικό.
Ένα τέτοιο ακραίο παράδειγμα δείχνει καθαρά πως τα νέα στοιχεία από τη μαστογραφία δεν αντικαθιστούν τα στοιχεία που είχαμε στην αρχή για το πόσο αβέβαιο ήταν μια γυναίκα να έχει καρκίνο του μαστού. Αντίθετα, φανταστείτε πως ξεκινάτε με την αρχική πιθανότητα ότι μια γυναίκα μπορεί να έχει καρκίνο και μετά με τα νέα στοιχεία της μαστογραφίας μετακινείτε την πιθανότητα προς τη μία ή την άλλη κατεύθυνση από το αρχικό σημείο, ανάλογα με αν το τεστ είναι θετικό ή αρνητικό. Η μαστογραφία μετακινεί την πιθανότητα μιας γυναίκας να έχει καρκίνο του μαστού προς την κατεύθυνση του αποτελέσματος του τεστ.
Για να το ξεκαθαρίσουμε περισσότερο, σκεφτείτε πάλι το αρχικό πρόβλημα. Σε εκείνο το σενάριο το 1% των 40χρονων γυναικών (100 στις 10.000) έχουν καρκίνο του μαστού. Το 80% των γυναικών που έχουν καρκίνο (80 στις 100) έχουν θετικό τεστ και το 9,6% των γυναικών χωρίς καρκίνο (950 στις 9.900) επίσης έχουν θετικό τεστ. Όταν κάναμε τις πράξεις βρήκαμε πως το θετικό τεστ μετακινεί την πιθανότητα μιας γυναίκας να έχει καρκίνο από το 1% στο 7,6%.
Δεν μπορείτε να αντικαταστήσετε την αρχική πιθανότητα με τη νέα πληροφορία. Μπορείτε μόνο να την ενημερώσετε με τις νέες πληροφορίες μετακινώντας την προς κάποια κατεύθυνση. Η αρχική πιθανότητα εξακολουθεί να έχει σημασία, ένα προφανές γεγονός όταν η αρχική πιθανότητα είναι πραγματικά ακραία· για παράδειγμα στο σύμπαν όπου μόνο μία γυναίκα στο εκατομμύριο έχει καρκίνο του μαστού.
Θυμηθείτε πως χρειαζόμαστε και τις τρεις πληροφορίες. Πρέπει να ξέρουμε το αρχικό ποσοστό των γυναικών με καρκίνο, το ποσοστό των γυναικών με καρκίνο που έχουν θετική μαστογραφία και το ποσοστό των γυναικών χωρίς καρκίνο με θετική μαστογραφία.
Για να καταλάβετε για ποιο λόγο η τελευταία πληροφορία είναι σημαντική (το ποσοστό των γυναικών χωρίς καρκίνο με θετική μαστογραφία) φανταστείτε ένα νέο τεστ: μαστογραφία*. Η μαστογραφία* έχει το ίδιο ποσοστό ψευδών αρνητικών όπως πριν· 20%, αλλά ένα πολύ υψηλό ποσοστό ψευδών θετικών· 80%!
Να το πρόβλημα:
Το 1% των γυναικών έχει καρκίνο. Το 80% των γυναικών με καρκίνο έχει θετική μαστογραφία*. Αλλά παράλληλα το 80% των γυναικών χωρίς καρκίνο έχουν θετική μαστογραφία*. Αν μια γυναίκα έχει θετική μαστογραφία*, ποια είναι η πιθανότητα να έχει καρκίνο του μαστού;
Εμπρός. Υπολογίστε την απάντηση.
Τη βρήκατε την απάντηση;
Ωραία, ας υπολογίσουμε το ποσοστό των γυναικών με θετικό αποτέλεσμα. 80% του 1% των γυναικών που έχουν καρκίνο θα έχουν θετικό αποτέλεσμα, οπότε έχουμε ένα 0,8% όλων των γυναικών. Επίσης το 80% του 99% των γυναικών χωρίς καρκίνο θα έχουν θετικό αποτέλεσμα, οπότε έχουμε άλλο ένα 79,2%. Και μιας και 0,8% + 79,2% = 80%, αυτό σημαίνει ότι το 80% όλων των γυναικών θα έχουν θετική μαστογραφία*.
Παρότι μόνο το 1% των γυναικών έχουν πράγματι καρκίνο του μαστού!
Ήδη είναι προφανές ότι η τρίτη πληροφορία κάνει τεράστια διαφορά.
Αλλά ας τελειώσουμε τους υπολογισμούς. Τι ποσοστό των γυναικών με θετική μαστογραφία* έχει πράγματι καρκίνο;
Για αρχή, πόσες γυναίκες θα έχουν θετικό αποτέλεσμα; Αυτός είναι ο παρονομαστής.
Έχουμε δύο ομάδες γυναικών με θετική μαστογραφία*: εκείνες που έχουν καρκίνο (0,8%) και εκείνες που δεν έχουν (79,2%). Τα προσθέτουμε και ο παρονομαστής είναι 80%.
Ώρα να υπολογίσουμε τον αριθμητή. Από αυτό το 80% που έχουν θετικό αποτέλεσμα, πόσες έχουν όντως καρκινο; Ήδη ξέρουμε την απάντηση, γιατί ξέρουμε τι ποσοστό έχει και καρκίνο και θετική μαστογραφία*· 0,8%. Το ποσοστό των γυναικών με θετική μαστογραφία* που έχουν όντως καρκίνο είναι 0,8%/80%, το οποίο είναι 1%.
Η γυναίκα ξεκίνησε με 1% πιθανότητα να έχει καρκίνο του μαστού και μετά το τεστ έχει πάλι 1% πιθανότητα να έχει καρκίνο του μαστού.
Πώς έγινε αυτό; Δε μας είπε απολύτως τίποτα το τεστ;
Ακριβώς.
Γιατί δε μας είπε τίποτα; Θυμηθείτε πως η μαστογραφία* έχει τόσο μεγάλο ποσοστό ψευδών θετικών που μια γυναίκα είναι το ίδιο πιθανό να έχει θετικό αποτέλεσμα είτε έχει, είτε δεν έχει καρκίνο!
Αν έχει καρκίνο, έχει 80% πιθανότητα θετικού τεστ. Αν δεν έχει καρκίνο, έχει πάλι 80% πιθανότητα θετικού τεστ.
Και γι’αυτό το λόγο το τεστ δε μας είπε απολύτως τίποτα. Ανανεώσαμε την πιθανότητα καρκίνου κατά 0%. Η πιθανότητα για οποιοδήποτε αποτέλεσμα ήταν το ίδιο, οπότε το τεστ δε μας είπε ποια πιθανότητα ήταν πιο σωστή.
Σ’αυτή την περίπτωση η μαστογραφία* είναι εντελώς άσχετη με τον καρκίνο επειδή δίνει ακριβώς τα ίδια αποτελέσματα και στις δύο περιπτώσεις. Για την ακρίβεια, δεν έχει καν νόημα να λέμε ότι το τεστ έχει “θετικά” ή “αρνητικά” αποτελέσματα, αφού κανένα αποτέλεσμα δε μετακινεί την πιθανότητα σε κάποια κατεύθυνση.
Το οποίο σημαίνει ότι θα μπορούσαμε να είχαμε στρίψει και κέρμα ως “τεστ” για τον καρκίνο του μαστού. Το στρίψιμο ενός κέρματος θα ήταν εξίσου άσχετο με τον καρκίνο του μαστού. Αν μια γυναίκα είχε καρκίνο, θα υπήρχε 50% πιθανότητα το κέρμα να έρθει κορώνα. Αν δεν είχε καρκίνο, θα είχε και πάλι 50% πιθανότητα να έρθει κορώνα.
Ή θα μπορούσαμε να χρησιμοποιήσουμε ως τεστ κάτι που δίνει πάντα το ίδιο αποτέλεσμα. Ας πούμε ότι το τεστ ήταν το να προσθέσουμε δύο συν δύο. Αν μια γυναίκα είχε καρκίνο, το αποτέλεσμα του δύο συν δύο θα ήταν τέσσερα. Αν δεν είχε καρκίνο, θα ήταν και πάλι τέσσερα.
Όλα αυτά τα τεστ είναι εξίσου άχρηστα, αφού δίνουν το ίδιο αποτέλεσμα με ή χωρίς καρκίνο. Για να μας δώσει ένα τεστ πληροφορίες που μπορούμε να χρησιμοποιήσουμε για να ανανεώσουμε την πιθανότητα ύπαρξης καρκίνου, το τεστ πρέπει να σχετίζεται με τον καρκίνο με κάποιο τρόπο. Το τεστ πρέπει να είναι πιο πιθανό να έχει ένα συγκεκριμένο αποτέλεσμα αν μια γυναίκα έχει καρκίνο απ’ό,τι αν δεν έχει.
Αυτό σημαίνει ότι κάτι είναι “τεστ” για τον καρκίνο.
Αλλά θυμηθείτε: οι πιθανότητες υπάρχουν μόνο στο μυαλό και όχι στην πραγματικότητα. Ακόμα και μια χρήσιμη μαστογραφία δεν αλλάζει το αν μια γυναίκα έχει ή όχι καρκίνο. Είτε έχει καρκίνο, είτε όχι. Η πραγματικότητα δεν έχει αβεβαιότητα για το αν μια γυναίκα έχει καρκίνο. Εμείς είμαστε αβέβαιοι για το αν έχει καρκίνο. Οι πληροφορίες μας, η κρίση μας είναι αβέβαια, όχι η πραγματικότητα.
Το αρχικό ποσοστό γυναικών με καρκίνο είναι γνωστό ως πρότερη πιθανότητα. Είναι η πιθανότητα μια γυναίκα να έχει καρκίνο προτού βρούμε κάποιο νέο στοιχείο.
Και το ποσοστό των γυναικών με καρκίνο που έχουν θετική μαστογραφία και το ποσοστό των γυναικών χωρίς καρκίνο που έχουν θετική μαστογραφία; Αυτές είναι οι συνθήκες στο πρόβλημα, οπότε οι πιθανότητες αυτές είναι οι πιθανότητες υπό συνθήκη ή δεσμευμένες πιθανότητες.
Όλες μαζί οι δεσμευμένες πιθανότητες και η πρότερη πιθανότητα ονομάζονται “πρότερα”. Είναι οι πληροφορίες που γνωρίζουμε πριν υπολογίσουμε το αποτέλεσμα, που ονομάζεται αναθεωρημένη πιθανότητα ή εκ των υστέρων πιθανότητα.
Αυτό που δείξαμε παραπάνω είναι ότι αν οι δύο δεσμευμένες πιθανότητες είναι οι ίδιες (αν ένα θετικό τεστ καθιστά μια γυναίκα 80% πιθανό να έχει καρκίνο και ταυτόχρονα 80% πιθανότητα να μην έχει καρκίνο) τότε η αναθεωρημένη πιθανότητα ισούται με την πρότερη πιθανότητα.
Πού βρίσκουμε τα πρότερα; Πώς ξέρουμε ποια είναι η πρότερη πιθανότητα και ποιες οι δεσμευμένες πιθανότητες;
Τα βρίσκουμε εξετάζοντας την πραγματικότητα, όπως πάντα. Για παράδειγμα, αν νομίζετε πως 100 στις 10.000 γυναίκες έχουν καρκίνο του μαστού, αλλά ο πραγματικός αριθμός είναι 500 στις 10.000, τότε κάποια από τα πρότερα είναι λάθος και πρέπει να κάνετε περισσότερη έρευνα.
Υπάρχουν και μερικά εύκολα σύμβολα που θα πρέπει να μάθετε, επειδή χρειάζονται στην επίλυση τέτοιου είδους προβλημάτων.
Ως επίδειξη θα χρησιμοποιήσουμε ένα πρόβλημα του Ελιέζερ με πλαστικά αυγά:
Υποθέστε πως σε ένα βαρέλι υπάρχουν πολλά μικρά πλαστικά αυγά. Μερικά αυγά είναι βαμμένα κόκκινα και μερικά μπλε. Το 40% των αυγών στο βαρέλι περιέχουν μία πέρλα και το 60% τίποτα. Το 30% των αυγών που έχουν πέρλες είναι μπλε και το 10% των αυγών που δεν έχουν τίποτα είναι μπλε. Ποια είναι η πιθανότητα ένα μπλε αυγό να περιέχει πέρλα;
Πριν ξεκινήσετε να λύνετε το πρόβλημα, να σας παρουσιάσω μερικά από τα σύμβολα που προανέφερα. Για να γράφουμε ότι “η πιθανότητα ότι κάποιο αυγό περιέχει πέρλα είναι 0,4” γράφουμε:
p(πέρλα) = 0,4
Ένα ακόμα σύμβολο:
p(μπλε|πέρλα) = 0,3
Τι είναι η κάθετη γραμμή μεταξύ μπλε και πέρλας; Σημαίνει “δεδομένου ότι”. Και εδώ η λέξη μπλε σημαίνει “είναι μπλε”. Άρα η παραπάνω εξίσωση διαβάζεται: “Η πιθανότητα ότι κάποιο αυγό είναι μπλε, δεδομένου ότι περιέχει πέρλα είναι 0,3″.
Άλλο ένα σύμβολο είναι η ισπανική περισπωμένη: ~
Σημαίνει “δεν”, όπως εδώ:
p(μπλε|~πέρλα) = 0,1
Αυτό διαβάζεται: “Η πιθανότητα ότι ένα αυγό είναι μπλε, δεδομένου ότι δεν περιέχει πέρλα είναι 0,1″.
Τώρα είμαστε έτοιμοι να εκφράσουμε συμβολικά τις παραπάνω τρεις πληροφορίες του προβλήματος:
p(πέρλα) = 0,4
p(μπλε|πέρλα) = 0,3
p(μπλε|~πέρλα) = 0,1
Και φυσικά αυτό που ψάχνουμε να βρούμε είναι:
p(πέρλα|μπλε) = ?
Τώρα θα πρέπει να είστε σε θέση να διαβάσετε αυτές τις τέσσερις προτάσεις:
Η πιθανότητα ότι ένα αυγό περιέχει πέρλα είναι 0,4.
Η πιθανότητα ότι ένα αυγό είναι μπλε, δεδομένου ότι περιέχει πέρλα είναι 0,3.
Η πιθανότητα ότι ένα αυγό είναι μπλε, δεδομένου ότι δεν περιέχει πέρλα είναι 0,1.
Η πιθανότητα ότι ένα αυγό περιέχει πέρλα, δεδομένου ότι είναι μπλε είναι: πόση;
Αυτό είναι το πρόβλημά μας. Τώρα σταματήστε το διάβασμα και προσπαθήστε να το λύσετε χωρίς να κρυφοκοιτάξετε παρακάτω.
Ποια είναι η λύση; Ψάχνουμε την πιθανότητα ότι ένα αυγό περιέχει πέρλα δεδομένου ότι είναι μπλε (αυτό είναι παρόμοιο με το να ψάχνουμε την πιθανότητα μια γυναίκα να έχει καρκίνο του μαστού δεδομένου ότι έχει θετική μαστογραφία).
Το 40% των αυγών περιέχουν πέρλες και το 30% αυτών είναι μπλε, οπότε το 12% όλων των αυγών είναι μπλε και έχουν πέρλες.
Το 60% όλων των αυγών δεν έχουν πέρλες και το 10% από αυτά είναι μπλε, οπότε το 6% όλων των αυγών δεν περιέχουν πέρλες.
12% + 6% = 18%, οπότε έχουμε ένα 18% όλων των αυγών είναι μπλε.
Ήδη ξέρουμε ότι το 12% των αυγών είναι μπλε και έχουν πέρλες, άρα η πιθανότητα ένα μπλε αυγό να έχει πέρλα είναι 12/18 ή περίπου 67%.
Μια διάσημη περίπτωση αποτυχίας της εφαρμογής του Θεωρήματος Μπέυζ αφορά μια Βρετανίδα ονόματι Sally Clark. Αφού πεθάνανε δύο παιδιά της από σύνδρομο αιφνιδίου θανάτου, συνελήφθη και κατηγορήθηκε για το φόνο των παιδιών της. Ο παιδίατρος Roy Meadow κατέθεσε πως οι πιθανότητα να πεθάνουν δύο παιδιά από αιφνίδιο θάνατο είναι 1 στα 73 εκατομμύρια. Έβγαλε το νούμερο τετραγωνίζοντας την πιθανότητα να πεθάνει ένα παιδί από αιφνίδιο θάνατο σε παρόμοιες περιστάσεις (1 στις 8500).
Λόγω της κατάθεσης η Sally Clark καταδικάστηκε. Η Βασιλική Στατιστική Υπηρεσία εξέδωσε μια ανακοίνωση καταδικάζοντας αυτή την “κατάχρηση της στατιστικής στο δικαστήριο”. Αποφυλακίστηκε μετά από 4 χρόνια σε γυναικεία φυλακή όπου όλοι νομίζανε πως είχε σκοτώσει τα παιδιά της. Ποτέ δε συνήλθε από την εμπειρία της, έγινε αλκοολική και πέθανε από υπερβολική κατανάλωση αλκοόλ το 2007.
Το στατιστικό λάθος που έκανε ο Roy Meadow περιελάμβανε μεταξύ άλλων το ότι δε σκέφτηκε την πρότερη πιθανότητα ότι η Sally Clark είχε δολοφονήσει τα παιδιά της. Αν και δύο αιφνίδιοι θάνατοι είναι όντως πολύ σπάνιο φαινόμενο, το να δολοφονήσει μια μητέρα τα παιδιά της είναι ακόμα πιο σπάνιο.
Μπορεί να βοηθήσει να οπτικοποιήσουμε το τι συμβαίνει εδώ. Στη σελίδα του Yudkowsky για το Θεώρημα Μπέυζ, υπάρχει ένα διαδραστικό εργαλείο που επιτρέπει να ρυθμιστούν και οι τρεις τιμές ανεξάρτητα και παρουσιάζει το αποτέλεσμα, αλλά δουλεύει μόνο αν έχετε Java και δε δουλεύει σε Macintosh (τουλάχιστον όχι στο δικό μου) ή σε φορητή συσκευή, όπως το Kindle, οπότε εγώ θα χρησιμοποιήσω εικόνες. [ΣτΜ: Το αρχικό κείμενο του Luke περιείχε screenshot από τη σελίδα του Yudkowsky, που εδώ έχουν αντικατασταθεί με καλύτερης ποιότητας εικόνες].
Πρώτα ας ξαναδούμε το αρχικό πρόβλημα:
Υποθέστε πως σε ένα βαρέλι υπάρχουν πολλά μικρά πλαστικά αυγά. Μερικά αυγά είναι βαμμένα κόκκινα και μερικά μπλε. Το 40% των αυγών στο βαρέλι περιέχουν μία πέρλα και το 60% τίποτα. Το 30% των αυγών που έχουν πέρλες είναι μπλε και το 10% των αυγών που δεν έχουν τίποτα είναι μπλε. Ποια είναι η πιθανότητα ένα μπλε αυγό να περιέχει πέρλα;
Πρότερη Πιθανότητα | ||
p(πέρλα): | 40% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 30% | |
p(μπλε|~πέρλα): | 10% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 66,7% | |
Η μπάρα στην κορυφή, χωρισμένη μεταξύ πέρλας και άδειου, δείχνει την πρότερη πιθανότητα ένα αυγό να περιέχει πέρλα. Η πιθανότητα είναι 40%, οπότε το διαχωριστικό είναι λίγο πιο αριστερά από το κέντρο. (Το κέντρο είναι το 50%)
Η πρώτη δεσμευμένη πιθανότητα είναι η p(μπλε|πέρλα) ή “η πιθανότητα ένα αυγό να είναι μπλε δεδομένου ότι περιέχει πέρλα”. Το μέγεθος του βέλους που βλέπει δεξιά δείχνει την μέγεθος αυτής της πιθανότητας.
Η δεύτερη δεσμευμένη πιθανότητα είναι “η πιθανότητα ένα αυγό να είναι μπλε δεδομένου ότι δεν περιέχει πέρλα.” Η κάτω μπάρα δείχνει τις πιθανότητες ένα αυγό να έχει ή όχι πέρλα, δεδομένου ότι είναι μπλε.
Κάτι που μπορεί να σας μπερδέψει είναι ότι οι μπάρες στην κορυφή και τον πάτο έχουν το ίδιο μέγεθος, αν και δε μετράνε το ίδιο σύνολο αυγών. Η πάνω μπάρα μετράει όλα τα αυγά, μπλε και κόκκινα, ενώ η κάτω μπάρα μόνο τα μπλε. Μη σας μπερδεύει αυτό. Με το να τα σχεδιάζουμε έτσι μας επιτρέπει να δείξουμε εύκολα τα αποτελέσματα των τριών προτέρων: της πρότερης πιθανότητας, της πρώτης δεσμευμένης πιθανότητας και της δεύτερης δεσμευμένης πιθανότητας. Και επάνω και κάτω βλέπουμε τις πιθανότητες ένα αυγό να έχει πέρλα. Απλά ενδιάμεσα κάνουμε ένα “τεστ” και ανακαλύπτουμε ότι το αυγό που πήραμε από το βαρέλι ήταν μπλε, οπότε αφαιρούμε όλα τα κόκκινα αυγά από την ιστορία.
Η πλαγιαστή γραμμή στη μέση μας δείχνει πώς να ενημερώσουμε την πιθανότητα ότι ένα αυγό περιέχει πέρλα μετά το πρώτο τεστ (αν ένα αυγό είναι ή όχι μπλε). Στην αρχή το μόνο που ξέρουμε είναι ότι αν πάρουμε ένα αυγό από το βαρέλι έχει 40% πιθανότητα να έχει πέρλα. Αλλά έστω ότι παίρνουμε το αυγό και βλέπουμε ότι είναι μπλε. Δεδομένου ότι ξέρουμε πως ένα μπλε αυγό με πέρλα είναι πιο πιθανό από ένα μπλε αυγό χωρίς πέρλα, ξέρουμε πως το αυγό τώρα έχει μεγαλύτερη πιθανότητα να έχει πέρλα απ’ότι πριν. Οπότε μετακινούμε την πιθανότητα το αυγό να έχει πέρλα προς τα πάνω. Γι’αυτό η γραμμή στη μέση γέρνει προς τα δεξιά· ανεβάσαμε την πιθανότητα. Βέβαια, για να μάθουμε πόσο να μετακινήσουμε την πιθανότητα πρέπει να κάνουμε τις πράξεις.
Ας δούμε τώρα τα αποτέλεσμα στην αναθεωρημένη πιθανότητα, αν η πρότερη πιθανότητα είναι διαφορετική. Τι θα γινόταν αν μόνο ένα 10% των αυγών είχαν πέρλα; Το διάγραμμα τώρα θα γινόταν έτσι:
Πρότερη Πιθανότητα | ||
p(πέρλα): | 10% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 30% | |
p(μπλε|~πέρλα): | 10% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 25% | |
Οι δεσμευμένες πιθανότητες δεν άλλαξαν, οπότε η σχετική κλίση της γραμμής στη μέση δεν άλλαξε. Δηλαδή δεν άλλαξε ο βαθμός κατά τον οποίο πρέπει να ενημερώσουμε την πιθανότητα ότι ένα αυγό περιέχει πέρλα, αφού ανακαλύψουμε πως είναι μπλε. (Ο βαθμός της απαραίτητης ανανέωσης δεν άλλαξε, ωστόσο η πρότερη πιθανότητα είναι τώρα πολύ χαμηλή, οπότε η αναθεωρημένη πιθανότητα είναι αντίστοιχα χαμηλότερη).
Θυμάστε τι συνέβη στην ιστορία με τη γυναίκα με καρκίνο του μαστού, όταν είπαμε πως μόνο μία γυναίκα στο εκατομμύριο έχει καρκίνο; Αν το δείχναμε αυτό σε ένα διάγραμμα σαν το παραπάνω, η πλαγιαστή γραμμή θα ήτανε κολλημένη στο αριστερό άκρο του διαγράμματος και η αναθεωρημένη πιθανότητα να έχει μια γυναίκα καρκίνο θα ήταν πάρα πολύ μικρή ανεξαρτήτως του αποτελέσματος του τεστ και με οτιδήποτε νούμερα στις δεσμευμένες πιθανότητες. (Θα χρειαζόταν μια πάρα πολύ πλαγιαστή γραμμή δεσμευμένων πιθανοτήτων, ώστε η ανανέωση να καταλήξει αρκετά μακριά από την αριστερή άκρη του διαγράμματος.)
Και τι γίνεται αν κλειδώσουμε τις δεσμευμένες πιθανότητες, αλλά αυξήσουμε την πρότερη πιθανότητα στο 80%;
Πρότερη Πιθανότητα | ||
p(πέρλα): | 80% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 30% | |
p(μπλε|~πέρλα): | 10% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 92,3% | |
Όπως είναι φυσικό, τώρα η πρότερη πιθανότητα είναι πολύ μεγαλύτερη, οπότε η αναθεωρημένη πιθανότητα είναι επίσης πολύ μεγαλύτερη.
Και πάλι ο βαθμός ανανέωσης που χρειάζεται είναι ο ίδιος, οπότε η γραμμή παραμένει γερμένη ελαφρά προς τα δεξιά. Παρατηρήστε όμως πως το ακριβές ποσό ενημέρωσης δεν είναι το ίδιο. Η γραμμή δεν είναι τόσο κεκλιμένη όπως όταν είχαμε 40% πρότερη πιθανότητα, ούτε τόσο όταν είχαμε 10% πρότερη πιθανότητα. Γιατί συμβαίνει αυτό;
Αυτό συμβαίνει επειδή το πόσο θα ενημερώσουμε την πρότερη πιθανότητα, αφού ανακαλύψουμε πως το αυγό είναι μπλε, δεν εξαρτάται μόνο από τις δεσμευμένες πιθανότητες (σ’αυτή την περίπτωση 30% και 10%) αλλά και από την αρχική πιθανότητα. Αυτό το αποτέλεσμα το βλέπουμε καθαρά στις πράξεις. Και άμα το καλοσκεφτείτε, είναι λογικό. Τι θα γινόταν αν η πιθανότητα να υπάρχει πέρλα ήταν 99,999% και οι δεσμευμένες πιθανότητες ήταν οι ίδιες; Αν ενημερώναμε κατά το ίδιο ποσό όπως πριν, τότε η πιθανότητα ένα μπλε αυγό να περιέχει πέρλα θα ήταν μεγαλύτερη από 100%. Η πλαγιαστή γραμμή θα έβγαινε εκτός διαγράμματος!
Αν συνέβαινε αυτό, θα σήμαινε πως κάνατε τις πράξεις λάθος. Αν ανεβάζαμε την πρότερη πιθανότητα στο 99%, αυτό θα έκανε το ποσό ανανέωσης πολύ μικρό σε απόλυτα μεγέθη. Θα χρειαζόταν να μετακινήσουμε τη γραμμή πάλι προς τα δεξιά, αλλά η πιθανότητα ένα αυγό να περιέχει πέρλα δε θα αυξανόταν και πολύ περισσότερο:
Πρότερη Πιθανότητα | ||
p(πέρλα): | 99% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 30% | |
p(μπλε|~πέρλα): | 10% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 99,7% | |
Τι θα γινόταν όμως αν επιστρέφαμε την πρότερη πιθανότητα στο αρχικό 40%, αλλά αλλάζαμε την πρώτη δεσμευμένη πιθανότητα;
Πρότερη Πιθανότητα | ||
p(πέρλα): | 40% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 70% | |
p(μπλε|~πέρλα): | 10% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 82,4% | |
Τώρα η πρώτη δεσμευμένη πιθανότητα ασκεί πολύ μεγαλύτερη πίεση στην αναθεωρημένη πιθανότητα και η γραμμή γέρνει περισσότερο στα δεξιά. Αυτό σημαίνει πως πρέπει να ενημερώσουμε πολύ περισσότερο την αρχική πιθανότητα ότι ένα αυγό περιέχει πέρλα, αφού ανακαλύψουμε πως είναι μπλε.
Γιατί συμβαίνει αυτό; Η πρώτη δεσμευμένη πιθανότητα είναι p(μπλε|πέρλα) ή “η πιθανότητα ένα αυγό να είναι μπλε, δεδομένου ότι περιέχει πέρλα”. Τι συμβαίνει αν αυτή η πιθανότητα είναι κατά πολύ μεγαλύτερη από την άλλη δεσμευμένη πιθανότητα, την “πιθανότητα ότι ένα αυγό είναι μπλε, δεδομένου ότι είναι άδειο“; Αν συμβαίνει αυτό, τότε σημαίνει πως υπάρχουν πολύ περισσότερα μπλε αυγά με πέρλα, απ’ότι μπλε και άδεια. Οπότε αν ανακαλύψουμε πως το αυγό που πήραμε είναι μπλε, ξέρουμε πως είναι πιο πιθανό να έχει πέρλα, αφού υπάρχουν περισσότερα μπλε αυγά με πέρλα απ’ότι άδεια.
Και πάλι, η διαφορά μεταξύ των δύο δεσμευμένων πιθανοτήτων καθορίζει κατά πόσο θα πρέπει να ανανεώσουμε την αρχική πιθανότητα ως αποτέλεσμα του ελέγχου. Αν η διαφορά μεταξύ των δύο δεσμευμένων πιθανοτήτων είναι μικρή, δε θα χρειαστεί να ανανεώσουμε την πρότερη πιθανότητα κατά πολύ. Αν η διαφορά είναι μεγάλη, θα χρειαστεί να μετακινηθούμε αρκετά από την πρότερη πιθανότητα.
Για να γίνει εμφανές ότι η διαφορά μεταξύ των δύο δεσμευμένων πιθανοτήτων είναι που καθορίζει το βαθμό ανανέωσης της πιθανότητας και όχι οι απόλυτες τιμές τους, ας δούμε τι γίνεται αν και οι δύο οι δεσμευμένες πιθανότητες είναι πολύ υψηλές, αλλά όχι και πολύ διαφορετικές:
Πρότερη Πιθανότητα | ||
p(πέρλα): | 40% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 100% | |
p(μπλε|~πέρλα): | 80% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 45,5% | |
Η ιστορία τώρα είναι πως αν ένα αυγό έχει πέρλα, τότε είναι σίγουρα μπλε. Όλα τα κόκκινα αυγά είναι άδεια. Αλλά υπάρχει και μεγάλος αριθμός “ψευδών θετικών” στο “τεστ” γιατί είναι πολύ πιθανό πλέον ένα άδειο αυγό να είναι μπλε. Επειδή ένα αυγό είναι πολύ πιθανό να είναι μπλε είτε έχει, είτε δεν έχει πέρλα, το γεγονός ότι ένα αυγό είναι μπλε δε μας λέει και πολλά για το αν έχει πέρλα, οπότε το να βρούμε ένα μπλε αυγό δε μας επιτρέπει να αναθεωρήσουμε την πιθανότητα και πάρα πολύ. Η διαφορά μεταξύ των δεσμευμένων πιθανοτήτων είναι που μας λέει πόσο να ανανεώσουμε την πρότερη πιθανότητα.
Τι θα γινόταν όμως, αν η δεύτερη δεσμευμένη πιθανότητα ήταν μεγαλύτερη από την πρώτη;
Πρότερη Πιθανότητα | ||
p(πέρλα): | 40% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 30% | |
p(μπλε|~πέρλα): | 70% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 22,2% | |
Τώρα η δεύτερη δεσμευμένη πιθανότητα είναι μεγαλύτερη από την πρώτη, οπότε η στραβή γραμμή κλίνει προς τα αριστερά και πρέπει να αναθεωρήσουμε την πιθανότητα προς την αντίθετη κατεύθυνση. Και πάλι, αυτό είναι απολύτως λογικό. Η ιστορία τώρα λέει πως “η πιθανότητα ένα αυγό να είναι μπλε, δεδομένου ότι είναι άδειο” είναι μεγαλύτερη από “την πιθανότητα ένα αυγό να είναι μπλε, δεδομένου ότι περιέχει πέρλα, οπότε σ’αυτή την ιστορία υπάρχουν περισσότερα μπλε και άδεια αυγά, παρά μπλε με πέρλα. Άρα αν βγάλουμε ένα μπλε αυγό από το βαρέλι, είναι πιο πιθανό να είναι άδειο, παρά να έχει πέρλα και η πιθανότητα να έχει πέρλα είναι μικρότερη τώρα από όταν δεν ξέραμε το χρώμα του αυγού (η πρότερη πιθανότητα). Επομένως πρέπει να υποβιβάσουμε την πιθανότητα το αυγό να έχει πέρλα, ασχέτως της πρότερης πιθανότητας.
Τι γίνεται όμως αν οι δύο δεσμευμένες πιθανότητες είναι οι ίδιες;
Πρότερη Πιθανότητα | ||
p(πέρλα): | 40% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 20% | |
p(μπλε|~πέρλα): | 20% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 40% | |
Αν οι δυο δεσμευμένες πιθανότητες είναι οι ίδιες, τότε ασκούν την ίδια ακριβώς πίεση στην ανανέωση της τελικής πιθανότητας, το οποίο σημαίνει ότι δεν την πειράζουμε καθόλου. Αν είναι εξίσου πιθανό ένα αυγό να έχει πέρλα και να είναι άδειο, τότε το ότι βγάλαμε μπλε αυγό από το βαρέλι δε μας λέει τίποτα καινούριο, αφού ο αριθμός των γεμάτων μπλε αυγών είναι ο ίδιος με τον αριθμό των άδειων μπλε αυγών. Οπότε δεν έχουν νέα πληροφορία και δεν μπορούμε να αναθεωρήσουμε την πρότερη πιθανότητα.
Αυτό ισχύει ανεξάρτητα με το μέγεθος των δεσμευμένων πιθανοτήτων, εφ’όσον είναι ίδιες:
Πρότερη Πιθανότητα | ||
p(πέρλα): | 40% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 80% | |
p(μπλε|~πέρλα): | 80% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 40% | |
Το πιο συνηθισμένο σφάλμα σ’αυτού του είδους τα προβλήματα είναι να αγνοήσει κανείς την πρότερη πιθανότητα και να επικεντρωθεί στις δύο δεσμευμένες πιθανότητες. Αλλά τώρα μπορείτε να καταλάβετε για ποιο λόγο χρειάζονται και οι τρεις πληροφορίες για να υπολογιστεί σωστά η αναθεωρημένη πιθανότητα.
Μελέτες για τη λογική με την οποία λειτουργούν οι γιατροί έχουν δείξει πως οι περισσότεροι γιατροί όταν κάνουν τέτοιου είδους υπολογισμούς νοερά, αντικαθιστούν την αρχική πιθανότητα του 1% με την 80% πιθανότητα μια γυναίκα με καρκίνο να έχει θετική μαστογραφία. Ομοίως, στο πρόβλημα με τα αυγά, οι περισσότεροι που δεν κατέχουν την μπεϋζιανή λογική θα πουν ότι η πιθανότητα ένα μπλε αυγό να έχει πέρλα είναι 30% ή ίσως 20% (που βγαίνει από το 20% αληθούς θετικού μείον το 10% του ψευδούς θετικού). Ακόμα κι αν αυτή η λογική διεργασία μοιάζει σωστή, είναι τελείως λανθασμένη σε σχέση με το ζητούμενο
Είναι σαν το πείραμα όπου ρωτάς ένα μαθητή της δευτέρας δημοτικού: “Αν 18 άτομα ανέβουν σε ένα λεωφορείο και ανέβουν άλλα 7 αργότερα, τι ηλικία έχει ο οδηγός;”. Τα περισσότερα παιδιά θα απαντήσουν “25”. Καταλαβαίνουν ότι τους ζητείται να εκτελέσουν κάποια νοητική διεργασία, αλλά δεν την έχουν συνδέσει με την πραγματικότητα. Παρομοίως, αν ψάχνεις να βρεις την πιθανότητα να έχει μια γυναίκα με θετική μαστογραφία καρκίνο του μαστού, δεν έχει κανένα νόημα να αντικαταστήσεις την αρχική πιθανότητα να έχει μια γυναίκα καρκίνο με την πιθανότητα που έχει μια καρκινοπαθής να έχει θετική μαστογραφία. Ούτε μπορείς να αφαιρέσεις την πιθανότητα ενός ψευδούς θετικού από την πιθανότητα ενός αληθούς θετικού. Αυτές οι πράξεις έχουν τόση σχέση με το ζητούμενο, όσο και το να χρησιμοποιήσεις τον αριθμό των επιβατών ενός λεωφορείου για να βρεις την ηλικία του οδηγού.
Ένας άνθρωπος που ξέρει πως έχει γενετική προδιάθεση στον αλκοολισμό μπορεί να χρησιμοποιήσει αυτή τη γνώση για να αποφύγει το οινόπνευμα με μεγαλύτερη αποφασιστικότητα. Ομοίως, αν μπορέσουμε να καταλάβουμε για ποιο λόγο το μυαλό μας δε χειρίζεται καλά τις πιθανότητες, μπορούμε να προετοιμαστούμε, ώστε στο μέλλον να αναγνωρίσουμε και να αποφύγουμε τα πιθανά σφάλματα.
Γιατί λοιπόν ο ανθρώπινος εγκέφαλος (ακόμα κι ο εκπαιδευμένος εγκέφαλος ενός γιατρού) συνήθως κάνει λάθος σε τέτοιου είδους προβλήματα; Ευτυχώς, πρόσφατες μελέτες ρίχνουν κάποιο φως στην υπόθεση. Απ’ό,τι φαίνεται βρίσκουμε την απάντηση σωστά συχνότερα, ανάλογα με το πώς είναι διατυπωμένο το πρόβλημα.
Κάνουμε πιο συχνά λάθος όταν το πρόβλημα είναι διατυπωμένο με ποσοστά: “1% των γυναικών” κ.ο.κ.
Αλλά τα πάμε καλύτερα αν το πρόβλημα είναι διατυπωμένο υπό μορφή φυσικών συχνοτήτων: “1 στις 100 γυναίκες έχουν καρκίνο του μαστού” και “80 στις 100 με καρκίνο έχουν θετική μαστογραφία”. Προφανώς αυτή η διατύπωση μας βοηθά να φανταστούμε μία γυναίκα σε ένα δωμάτιο με χώρο για 100 γυναίκες ή 80 γυναίκες σχεδόν να γεμίζουν ένα δωμάτιο φτιαγμένο για 100 άτομα.
Τα πάμε καλύτερα όταν ένα πρόβλημα είναι διατυπωμένο σε απόλυτους αριθμούς, που ονομάζονται φυσικές συχνότητες: “τα 400 στα 1000 αυγά περιέχουν πέρλες” και “τα 50 στα 400 αυγά που έχουν πέρλα είναι μπλε”. Είναι η διατύπωση πιο κοντά στο να κάνει κανείς ο ίδιος το πείραμα, να βιώσει πόσο συχνά βγαίνει μπλε αυγό και να βιώσει πόσο συχνά ένα μπλε αυγό περιέχει πέρλα.
O Yudkowsky σχολιάζει:
Μπορεί να μοιάζει πως παρουσιάζοντας το πρόβλημα έτσι είναι σα να “κλέβουμε” και πράγματι, αν ένα πρόβλημα ήταν γραμμένο έτσι σε βιβλίο μαθηματικών θα ήταν σφάλμα. Ωστόσο, όταν μιλάμε για πραγματικούς γιατρούς, θέλουμε να κλέψουμε, θέλουμε οι γιατροί να βγάζουν τα σωστά συμπεράσματα όσο το δυνατόν ευκολότερα. Η προφανής επόμενη κίνηση θα ήταν να παρουσιάζουμε όλες τις ιατρικές στατιστικές με φυσικές συχνότητες. Δυστυχώς, αν και η χρήση φυσικών συχνοτήτων θα ήταν ένα βήμα στη σωστή κατεύθυνση, μάλλον δε θα είναι αρκετό. Όταν τα προβλήματα διατυπώνονται με φυσικές συχνότητες το ποσοστό των ανθρώπων που χρησιμοποιούν μπεϋζιανή λογική ανεβαίνει στο 50%. Μεγάλη βελτίωση, αλλά όχι αρκετά μεγάλη όταν μιλάμε για πραγματικούς γιατρούς και πραγματικούς ασθενείς.
Μια οπτικοποίηση του προβλήματος των αυγών και των μαργαριταριών σε φυσικές συχνότητες θα έμοιαζε κάπως έτσι.
Πρότερη Πιθανότητα | ||
p(πέρλα): | 40% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 30% | |
p(μπλε|~πέρλα): | 10% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 66,7% | |
Επειδή τώρα έχουμε απόλυτους αριθμούς αντί για ποσοστά, η μπάρα στην κορυφή είναι μεγαλύτερη από την μπάρα στον πάτο, επειδή το σύνολο των αυγών είναι μεγαλύτερο από το σύνολο των μπλε αυγών.
Η μπάρα στην κορυφή είναι η ίδια με πριν και η γραμμή στη μέση έχει την ίδια κλίση, αλλά τώρα η κάτω μπάρα είναι πολύ μικρότερη επειδή συμβολίζει μόνο τα μπλε αυγά. (Η κάτω μπάρα είναι κεντραρισμένη με την πάνω, όπως βλέπετε).
Σε αυτό το διάγραμμα δε βλέπουμε το πόσο αναθεωρούμε την πιθανότητα βάσει της κλίσης της γραμμής, αλλά με τη διαφορά στις αναλογίες ανάμεσα στις δύο μπάρες. Στο παραπάνω παράδειγμα μπορείτε να δείτε το τμήμα πέρλα καταλαμβάνει πολύ μεγαλύτερο κομμάτι της κάτω μπάρας, απ’ότι της κάτω, το οποίο σημαίνει πως ενημερώνουμε την πιθανότητα προς τα πάνω.
Με τι μοιάζει το σχεδιάγραμμα αν οι δεσμευμένες πιθανότητες είναι ίδιες;
Πρότερη Πιθανότητα | ||
p(πέρλα): | 40% | |
Δεσμευμένες Πιθανότητες | ||
p(μπλε|πέρλα): | 30% | |
p(μπλε|~πέρλα): | 30% | |
Αναθεωρημένη Πιθανότητα | ||
p(πέρλα|μπλε): | 40% | |
Σ’αυτή την περίπτωση βλέπουμε πως οι αναλογίες στην πάνω και την κάτω μπάρα είναι οι ίδιες, οπότε δεν ενημερώνουμε την πιθανότητα, αν και η γραμμή δεν είναι κάθετη σ’αυτού του είδους το διάγραμμα.
Αλλά το διάγραμμα με τις φυσικές συχνότητες δείχνει κάτι που το προηγούμενο διάγραμμα με τις πιθανότητες δεν έδειχνε. Οι φυσικές συχνότητες δείχνουν ότι όταν μειώνουμε δύο μεγέθη με τον ίδιο τρόπο, οι αναλογίες που προκύπτουν είναι οι ίδιες. Όταν ανακαλύπτουμε ότι το αυγό είναι μπλε, μειώνουμε τον αριθμό των μαργαριτοφόρων αυγών που ελέγχουμε, αλλά ταυτόχρονα μειώνουμε και τον αριθμό των άδειων αυγών που μας ενδιαφέρουν αντίστοιχα, γι’αυτό και η πιθανότητα το αυγό να έχει πέρλα παραμένει η ίδια, όπως και πριν ανακαλύψουμε πως είναι μπλε.
Ας δούμε τώρα τις φυσικές συχνότητες για το αρχικό πρόβλημα με τον καρκίνο του μαστού. Το 1% των γυναικών έχουν καρκίνο, το 80% αυτών των γυναικών έχουν θετική μαστογραφία και το 9,6% των γυναικών χωρίς καρκίνο έχουν επίσης θετική μαστογραφία.
Πρότερη Πιθανότητα | ||
p(καρκίνος): | 1% | |
Δεσμευμένες Πιθανότητες | ||
p(θετικό|καρκίνος): | 80% | |
p(θετικό|~καρκίνος): | 9,6% | |
Αναθεωρημένη Πιθανότητα | ||
p(καρκίνος|θετικό): | 7,8% | |
|
||
Σύνολο ασθενών: | 10.000 | |
Καρκίνος: | 100 | |
Υγιείς: | 9.900 | |
καρκίνος & θετικό: | 80 | |
καρκίνος & αρνητικό: | 20 | |
υγιείς & θετικό: | 950 | |
υγιείς & αρνητικό: | 8.950 |
Η πρότερη πιθανότητα του 1% μετά βίας φαίνεται γιατί είναι πολύ μικρή. Και αν και η μαστογραφία είναι αρκετά ακριβής (μόνο 20% ψευδή αρνητικά και 9,6% ψευδή θετικά) εξακολουθούμε να μην έχουμε λόγο να νομίζουμε πως μια γυναίκα έχει καρκίνο μετά από θετική μαστογραφία, επειδή η πρότερη πιθανότητα είναι πολύ μικρή. Ακόμα και ενημερώνοντας την πιθανότητα προς τα πάνω λόγω της θετικής μαστογραφίας, η αναθεωρημένη πιθανότητα καρκίνου είναι μόλις 7,6%.
Τότε πώς μας δίνει αυτό το τεστ χρήσιμες πληροφορίες; Όπως μας δείχνει και το διάγραμμα, το τεστ αφαιρεί περισσότερες γυναίκες χωρίς καρκίνο απ’οτι γυναίκες με καρκίνο. Το κομμάτι στην πάνω μπάρα που αντιπροσωπεύει τις γυναίκες με καρκίνο είναι μικρό, αλλά το τεστ μεταφέρει το μεγαλύτερο τμήμα του στην κάτω μπάρα, στην αναθεωρημένη πιθανότητα. Αντίθετα, το κομμάτι των γυναικών χωρίς καρκίνο δεν μεταφέρθηκε στην κάτω μπάρα. Είναι αυτή η διαφορά ανάμεσα στις δεσμευμένες πιθανότητες που μας δίνει κάποιες πληροφορίες με τις οποίες μετατρέπουμε την πρότερη πιθανότητα στην αναθεωρημένη. Τα στοιχεία της θετικής μαστογραφίες μετέτρεψαν την πρότερη πιθανότητα του 1% στην αναθεωρημένη του 7,8%.
Έπειτα ο Yudkowsky μας ζητάει να φανταστούμε ένα νέο είδος τεστ για τον καρκίνο του μαστού:
Υποθέστε πως υπάρχει άλλη μια μορφή μαστογραφίας, ας την πούμε “μαστογραφία@” η οποία συμπεριφέρεται ως εξής: Το 1% των γυναικών σε μια δημογραφική ομάδα έχει καρκίνο του μαστού. Όπως και η συνηθισμένη μαστογραφία, η μαστογραφία@ είναι θετική στο 9,6% των γυναικών χωρίς καρκίνο. Ωστόσο η μαστογραφία@ είναι θετική 0% (ας πούμε μία στο δισεκατομμύριο) για γυναίκες που έχουν καρκίνο.
Να και το διάγραμμα:
Πρότερη Πιθανότητα | ||
p(καρκίνος): | 1% | |
Δεσμευμένες Πιθανότητες | ||
p(θετικό|καρκίνος): | 0% | |
p(θετικό|~καρκίνος): | 9,6% | |
Αναθεωρημένη Πιθανότητα | ||
p(καρκίνος|θετικό): | 0% | |
|
||
Σύνολο ασθενών: | 10.000 | |
Καρκίνος: | 100 | |
Υγιείς: | 9.900 | |
καρκίνος & θετικό: | 0 | |
καρκίνος & αρνητικό: | 100 | |
υγιείς & θετικό: | 950 | |
υγιείς & αρνητικό: | 8.950 |
Εντάξει, μια εύκολη ερώτηση: Αν μια γυναίκα έχει θετική μαστογραφία@, τι της λέτε;
Αν μια γυναίκα έχει θετική μαστογραφία@, της λέτε: “Συγχαρητήρια! Σίγουρα δεν έχετε καρκίνο”.
Η μαστογραφία@ δεν είναι τεστ για τον καρκίνο. Είναι τεστ υγείας! Όπως δείχνει και το γράφημα, ελάχιστες γυναίκες έχουν θετική μαστογραφία@, αλλά καμία γυναίκα που έχει καρκίνο δεν έχει θετικό αποτέλεσμα. Οπότε αν μια γυναίκα έχει θετική μαστογραφία@, σίγουρα δεν έχει καρκίνο!
Αυτό μας δείχνει πως αυτό που κάνει μια τυπική μαστογραφία ουσιαστικό τεστ για τον καρκίνο δεν είναι ότι κάποιος απλά το ονόμασε “θετικό τεστ για τον καρκίνο”, αλλά επειδή έχει ουσιώδη σχέση με τον καρκίνο του μαστού. Η κανονική μαστογραφία είναι ένα “θετικό” τεστ για τον καρκίνο, επειδή ένα “θετικό” αποτέλεσμα στο τεστ αυξάνει την πιθανότητα μια γυναίκα να έχει καρκίνο του μαστού. Αλλά στην περίπτωση της μαστογραφίας@ ένα “θετικό” αποτέλεσμα μειώνει τις πιθανότητες να έχει καρκίνο. Οπότε η μαστογραφία@ δεν είναι ένα θετικό τεστ για τον καρκίνο, αλλά θετικό τεστ για το να μην έχει κανείς καρκίνο.
Ο Yudkowsky καταλήγει:
Θα μπορούσαμε να ονομάσουμε το αποτέλεσμα “θετικό” ή “αρνητικό” ή “μπλε” ή “κόκκινο” ή “James Rutherford” ή θα μπορούσαμε να μην του είχαμε δώσει καθόλου όνομα και το τεστ πάλι θα μετακινούσε την πιθανότητα με ακριβώς τον ίδιο τρόπο. Για να μη μπερδευόμαστε, ένα τεστ για τον καρκίνο που αυξάνει την πιθανότητα προς τα πάνω είναι σωστό να λέγεται “θετικό” και ένα που μειώνει την πιθανότητα καρκίνου “αρνητικό”. Αν το αποτέλεσμα του τεστ δε σχετίζεται στατιστικά με την παρουσία ή απουσία καρκίνου (αν οι δεσμευμένες πιθανότητες είναι οι ίδιες) δε θα πρέπει καν να ονομάζεται “τεστ για τον καρκίνο”! Το αποτέλεσμα του τεστ καθορίζεται από τις δύο δεσμευμένες πιθανότητες. Οποιοδήποτε άλλο όνομα κολλάμε στα αποτελέσματα είναι απλά βολικές ταμπέλες.
Σημειώστε βέβαια πως η μαστογραφία@ σπανίως είναι χρήσιμη. Συνήθως δίνει αρνητικό αποτέλεσμα, το οποίο είναι ένα πολύ αδύναμο στοιχείο και δε μας επιτρέπει να μετακινήσουμε την πιθανότητα (ότι μια γυναίκα έχει καρκίνο) και πολύ μακριά από την πρότερη πιθανότητα. Πολύ σπάνια (σε περίπτωση θετικού αποτελέσματος) το αποτέλεσμα είναι ισχυρό. Αλλά όταν μας δίνει ισχυρά στοιχεία, είναι πάρα πολύ ισχυρά στοιχεία, αφού μας επιτρέπει να συμπεράνουμε με βεβαιότητα ότι η εξεταζόμενη δεν έχει καρκίνο του μαστού.
Ας επιστρέψουμε στην αρχική ιστορία με τη μαστογραφία:
Μόνο το 1% των 40χρονων γυναικών που κάνουν ετήσια μαστογραφία έχουν καρκίνο του μαστού. Το 80% των γυναικών που έχουν καρκίνο του μαστού έχουν θετικές μαστογραφίες, αλλά και το 9,6% των γυναικών που δεν έχουν καρκίνο του μαστού έχουν επίσης θετική μαστογραφία. Μια γυναίκα αυτής της ηλικίας είχε θετική μαστογραφία. Ποια είναι η πιθανότητα να έχει πράγματι καρκίνο του μαστού;
Πρότερη Πιθανότητα | ||
p(καρκίνος): | 1% | |
Δεσμευμένες Πιθανότητες | ||
p(θετικό|καρκίνος): | 80% | |
p(θετικό|~καρκίνος): | 9,6% | |
Αναθεωρημένη Πιθανότητα | ||
p(καρκίνος|θετικό): | 7,8% | |
|
||
Σύνολο ασθενών: | 10.000 | |
Καρκίνος: | 100 | |
Υγιείς: | 9.900 | |
καρκίνος & θετικό: | 80 | |
καρκίνος & αρνητικό: | 20 | |
υγιείς & θετικό: | 950 | |
υγιείς & αρνητικό: | 8.950 |
Ας δούμε τα διάφορα μεγέθη που προκύπτουν (από τη σελίδα του Yudkowsky):
p(καρκίνος) | 0,01 | Ομάδα 1: 100 γυναίκες με καρκίνο του μαστού | |
p(~καρκίνος) | 0,99 | Ομάδα 2: 9.900 γυναίκες με καρκίνο του μαστού | |
p(θετικό|καρκίνος) | 80,0% | Το 80% των γυναικών με καρκίνο έχουν θετικές μαστογραφίες | |
p(~θετικό|καρκίνος) | 20,0% | Το 20% των γυναικών με καρκίνο έχουν αρνητικές μαστογραφίες | |
p(θετικό|~καρκίνος) | 9,6% | Το 9,6% των γυναικών χωρίς καρκίνο έχουν θετικές μαστογραφίες | |
p(~θετικό|~καρκίνος) | 90,4% | Το 90,4% των γυναικών χωρίς καρκίνο έχουν αρνητικές μαστογραφίες | |
p(καρκίνος & θετικό) | 0,008 | Ομάδα A: 80 γυναίκες με καρκίνο και θετικές μαστογραφίες | |
p(καρκίνος & ~θετικό) | 0,002 | Ομάδα B: 20 γυναίκες με καρκίνο και αρνητικές μαστογραφίες | |
p(~καρκίνος & θετικό) | 0,095 | Ομάδα Γ: 950 χωρίς καρκίνο και θετικές μαστογραφίες | |
p(~καρκίνος & ~θετικό) | 0,895 | Ομάδα Δ: 8.950 γυναίκες χωρίς καρκίνο και αρνητικές μαστογραφίες | |
p(θετικό) | 0,103 | 1.030 γυναίκες με θετικές μαστογραφία | |
p(~θετικό) | 0,897 | 8.970 γυναίκες με αρνητικές μαστογραφίες | |
p(καρκίνος|θετικό) | 7,80% | Πιθανότητα μια γυναίκα να έχει καρκίνο, αν η μαστογραφία είναι θετική: 7,8% | |
p(~καρκίνος|θετικό) | 92,20% | Πιθανότητα μια γυναίκα να είναι υγιής με θετική μαστογραφία: 92,2% | |
p(καρκίνος|~θετικό) | 0,22% | Πιθανότητα μια γυναίκα να έχει καρκίνο, αν έχει αρνητική μαστογραφία: 0,22% | |
p(~καρκίνος|~θετικό) | 99,78% | Πιθανότητα μια γυναίκα να είναι υγιής, αν η μαστογραφία είναι αρνητική: 99,78% |
Όπως μπορείτε να φανταστείτε, είναι εύκολο να μπερδέψει κανείς τα μεγέθη. Το p(καρκίνος&θετικό) είναι ακριβώς το ίδιο με το p(θετικό&καρκίνος), αλλά το p(καρκίνος|θετικό) σίγουρα δεν είναι το ίδιο όπως το p(θετικό|καρκίνος). Η πιθανότητα μια γυναίκα να έχει καρκίνο δεδομένου ότι έχει θετική μαστογραφία δεν είναι το ίδιο με την πιθανότητα να έχει θετική μαστογραφία δεδομένου ότι έχει καρκίνο. Αν τα μπερδέψετε, θα βγάλετε λάθος αποτέλεσμα! Και φυσικά το p(καρκίνος&θετικό) είναι τελείως διαφορετικό από το p(καρκίνος|θετικό). Η πιθανότητα μια γυναίκα να έχει καρκίνο και να έχει και θετική μαστογραφία είναι εντελώς διαφορετική από την πιθανότητα μια γυναίκα να έχει καρκίνο δεδομένου ότι έχει θετική μαστογραφία.
Αργότερα θα παρουσιάσω το Θεώρημα Μπέυζ και αν μείνετε πιστοί στον τύπο, δε θα τα μπερδέψετε. Αλλά βοηθά να ξέρετε τι σημαίνουν και πώς σχετίζονται μεταξύ τους.
Για να καταλάβετε πως σχετίζονται τα μεγέθη, σκεφτείτε τους “βαθμούς ελευθερίας” μεταξύ τους. Τι διάολο είναι “βαθμοί ελευθερίας”; Λέγει ἡ Βικιπαίδεια ἡμῖν:
Στη στατιστική, ο αριθμός των βαθμών ελευθερίας είναι ο αριθμός των μεταβλητών στον τελικό υπολογισμό που μπορούν να μεταβάλλονται.
Τι σημαίνει αυτό; Ας δούμε ένα παράδειγμα. Μεταξύ p(καρκίνος) και p(~καρκίνος) υπάρχει μόνο ένας βαθμός ελευθερίας, αφού αν ξέρουμε το ένα, ξέρουμε και το άλλο. Όταν ξέρουμε τον ένα αριθμό, ο άλλος μπορεί να έχει μόνο μία τιμή· έχει ένα βαθμό ελευθερίας. Αν η p(καρκίνος) είναι 90% τότε η p(~καρκίνος) είναι 10%. Αν η p(καρκίνος) είναι 45% τότε η p(~καρκίνος) είναι 55%. Δεν μπορεί να αλλάξει αλλιώς η τιμή γιατί:
p(καρκίνος) + p(~καρκίνος) = 100%
Το ίδιο ισχύει για το θετικό και αρνητικό τεστ:
p(θετικό) + p(~θετικό) = 100%
Ένα άλλο ζευγάρι που έχει μόνο ένα βαθμό ελευθερίας είναι το p(θετικό|καρκίνος) και p(~θετικό|καρκίνος). Δεδομένου ότι μια γυναίκα έχει καρκίνο (που είναι αληθές και στις δύο τιμές) είτε θα έχει θετική μαστογραφία είτε δε θα έχει θετική μαστογραφία. Δεν υπάρχει τρίτη εναλλακτική δεδομένου ότι έκανε το τεστ (όπως λέει το πρόβλημα). Οπότε αν ξέρετε τη μία τιμή, ξέρετε και την άλλη. Αν το p(θετικό|καρκίνος) = 20%, τότε το p(~θετικό|καρκίνος) πρέπει να είναι 80%. Γιατί; Επειδή:
p(θετικό|καρκίνος) + p(~θετικό|καρκίνος) = 100%
Να θυμάστε πως βοηθάει να διαβάζεται αυτές τις προτάσεις φωναχτά. Η παραπάνω εξίσωση λέει: “Η πιθανότητα ότι μια γυναίκα θα έχει θετική μαστογραφία δεδομένου ότι έχει καρκίνο συν την πιθανότητα ότι μια γυναίκα θα έχει αρνητική μαστογραφία δεδομένου ότι έχει καρκίνο ισούται με 100%”.
Φυσικά το ίδιο ισχύει με το καρκίνος και όχι καρκίνος δεδομένης θετικής μαστογραφίας:
p(καρκίνος|θετικό) + p(~καρκίνος|θετικό) = 100%
Αυτό διαβάζεται: “Η πιθανότητα ότι μια γυναίκα έχει καρκίνο δεδομένου ότι έχει θετική μαστογραφία συν την πιθανότητα ότι μια γυναίκα δεν έχει καρκίνο δεδομένου ότι έχει θετική μαστογραφία ισούται με 100%”. Αν το διαβάσετε φωναχτά, είναι προφανές ότι η εξίσωση είναι σωστή.
Ομοίως:
p(θετικό|καρκίνος) + p(~θετικό|καρκίνος) = 100%
p(καρκίνος|~θετικό) + p(~καρκίνος|~θετικό) = 100%
Ωστόσο, σκεφτείτε τη σχέση μεταξύ του p(θετικό|καρκίνος) και του p(θετικό|~καρκίνος). Όπως και στο αρχικό πρόβλημα μπορεί το p(θετικό|καρκίνος) να ισούται με 80%, ενώ το p(θετικό|~καρκίνος) με 9,6%. Με άλλα λόγια, μπορεί η πιθανότητα μια γυναίκα να έχει θετική μαστογραφία δεδομένου ότι έχει καρκίνο να είναι 80%, ενώ η πιθανότητα να έχει θετική μαστογραφία δεδομένου ότι δεν έχει καρκίνο να είναι 9,6%. Αυτές οι δύο τιμές, p(θετικό|καρκίνος) και p(θετικό|~καρκίνος) λέγεται ότι έχουν δύο βαθμούς ελευθερίας. Και ο δύο αριθμοί μπορούν να μεταβάλλονται ανεξάρτητα.
Ας πάρουμε τώρα μια τριάδα μεγεθών και ας εξετάσουμε αν τους βαθμούς ελευθερίας μεταξύ τους. Τα μεγέθη μας είναι p(θετικό&καρκίνος), p(θετικό|καρκίνος) και p(καρκίνος). Πόσοι βαθμοί ελευθερίας υπάρχουν μεταξύ τους; Αφού είναι τρία, το μέγιστο είναι τρεις βαθμοί ελευθερίας. Αλλά ας το τσεκάρουμε.
Σ’αυτή την περίπτωση μπορούμε να υπολογίσουμε το ένα μέγεθος κοιτώντας τα άλλα δύο. Συγκεκριμένα:
p(θετικό&καρκίνος) = p(θετικό|καρκίνος) × p(καρκίνος)
Γιατί ισχύει αυτό; Αν ξέρουμε την πιθανότητα να έχει μια γυναίκα καρκίνο και ξέρουμε το ποσοστό αυτών των γυναικών που θα έχουν θετική μαστογραφία, τότε το γινόμενο μας λέει την πιθανότητα και να έχει καρκίνο και να έχει θετική μαστογραφία.
Επειδή μπορούμε να χρησιμοποιήσουμε τα δύο μεγέθη για να βρούμε το τρίτο, μεταξύ των τριών τιμών [p(θετικό&καρκίνος), p(θετικό|καρκίνος), and p(καρκίνος)] υπάρχουν μόνο δύο βαθμοί ελευθερίας.
Το ίδιο ισχύει και για τα ακόλουθα μεγέθη:
p(~θετικό&καρκίνος) = p(~θετικό|καρκίνος) × p(καρκίνος)
Αν ξέρουμε την πιθανότητα μια γυναίκα να έχει καρκίνο και ξέρουμε πόσες από αυτές θα έχουν αρνητική μαστογραφία, τότε το γινόμενο είναι η πιθανότητα να έχει και καρκίνο και αρνητική μαστογραφία.
Ας δούμε μια άλλη τριάδα μεγεθών: p(θετικό), p(θετικό&καρκίνος) και p(θετικό&~καρκίνος). Πόσοι είναι οι βαθμοί ελευθερίας μεταξύ τους; Θα έπρεπε να είναι προφανές ότι:
p(θετικό&καρκίνος) + p(θετικό&~καρκίνος) = p(θετικό)
Κάθε γυναίκα που έχει θετική μαστογραφία είτε θα έχει καρκίνο και θετικό τεστ ή δε θα έχει καρκίνο και θα έχει θετικό τεστ. Αυτές οι δύο πιθανότητες καλύπτουν όλες τις περιπτώσεις γυναικών που έχουν θετικό τεστ, οπότε μπορούν να χρησιμοποιηθούν για να υπολογιστούν οι γυναίκες με καρκίνο του μαστού. Οπότε υπάρχουν δύο βαθμοί ελευθερίας για τα μεγέθη p(θετικό), p(θετικό&καρκίνος) και p(θετικό&~καρκίνος).
Τώρα δείτε αυτά τα μεγέθη: p(θετικό&καρκίνος), p(θετικό&~καρκίνος), p(~θετικό&καρκίνος) και p(~θετικό&~καρκίνος). Με πρώτη ματιά μπορεί να σας φανεί ότι υπάρχουν μόνο δύο βαθμοί ελευθερίας, επειδή μπορούν να υπολογιστούν όλες οι τιμές γνωρίζοντας μόνο τις δύο: p(θετικό) και p(καρκίνος). Για παράδειγμα: p(θετικό&~καρκίνος) = p(θετικό) × p(~καρκίνος).
Αλλά αυτό είναι λάθος! Παρατηρήστε πως στην παραπάνω εξίσωση αυτό ισχύει μόνο αν τα p(θετικό) και p(~καρκίνος) είναι στατιστικά ανεξάρτητα. Αλλά αυτό δεν ισχύει! Σύμφωνα με το πρόβλημα, έχει μεγαλύτερη πιθανότητα για θετικό τεστ, αν πράγματι έχει καρκίνο, απ’ότι αν δεν έχει.
Αλλά ένας πιο απλός τρόπος για να δείτε γιατί αυτό είναι λάθος είναι αν παρατηρήσετε πως τα τέσσερα μεγέθη αντιπροσωπεύουν τέσσερις ομάδες διαφορετικών γυναικών με πιθανώς διαφορετικό αριθμό μελών η κάθε μία. Θα μπορούσαμε να έχουμε 500 γυναίκες στην ομάδα που έχει καρκίνο και θετικό τεστ (ας την πούμε Ομάδα Α), 150 γυναίκες στην ομάδα με καρκίνο και αρνητικό τεστ (Ομάδα Β), 50 γυναίκες στην ομάδα χωρίς καρκίνο και θετικό τεστ (Ομάδα Γ) και 900 γυναίκες στην ομάδα χωρίς καρκίνο και αρνητικό τεστ (Ομάδα Δ). Καθένα από αυτά τα μεγέθη θα μπορούσε να είναι διαφορετικό ανεξαρτήτως των άλλων.
Οπότε μπορεί να νομίζετε πως αυτά τα τέσσερα μεγέθη έχουν τέσσερις βαθμούς ελευθερίας και θα είχατε δίκιο, αν το άθροισμα και των τεσσάρων δεν ήταν 100%. Και οι τέσσερις πιθανότητες πρέπει να έχουν άθροισμα 100%. Για παράδειγμα, στην παραπάνω παράγραφο έβαλα 500 γυναίκες στην Ομάδα Α, 150 στη Β, 50 στη Γ και 900 στη Δ. Σύνολο 1.600 γυναίκες. Οπότε η πιθανότητα μια γυναίκα να ανήκει στην Ομάδα Α είναι 31,25%. Δηλαδή p(A) = 31,25%. Συνεχίζουμε και έχουμε p(B) = 9,375%, p(Γ) = 3,125%, and p(Δ) = 56,25%. Όπως είναι αναμενόμενο, το σύνολο μας κάνει 100%.
Βάσει αυτού μπορούμε να χρησιμοποιήσουμε τα τρία μεγέθη για να βρούμε το τέταρτο, επειδή ξέρουμε πως το σύνολο μας κάνει 100% και αυτό μας αφαιρεί ένα βαθμό ελευθερίας:
p(θετικό&καρκίνος) + p(θετικό&~καρκίνος) +
+ p(~θετικό&καρκίνος) + p(~θετικό&~καρκίνος) = 100%
Για την ακρίβεια, αν έχετε τις τιμές για όλες τις ομάδες (A = καρκίνος και θετικό τεστ, B = καρκίνος και αρνητικό τεστ, Γ = υγιής και θετικό τεστ και Δ = υγιής και αρνητικό τεστ), μπορείτε εύκολα να υπολογίσετε όλες τις άλλες. Για παράδειγμα:
p(καρκίνος|θετικό) = A / (A + Γ)
Η πιθανότητα ότι μια γυναίκα έχει καρκίνο δεδομένης θετικής μαστογραφίας ισούται, όπως είναι λογικό, με την πιθανότητα να έχει καρκίνο και θετικό τεστ (Ομάδα Α) διά την πιθανότητα να έχει θετικό τεστ (Α+Γ):
p(θετικό) = A + Γ
Και η πιθανότητα ότι μια γυναίκα έχει καρκίνο δεδομένης αρνητικής μαστογραφίας ισούται με την πιθανότητα να έχει καρκίνο και αρνητικό τεστ (Ομάδα Β) διά την πιθανότητα να έχει αρνητικό τεστ (Β+Δ):
p(καρκίνος|~θετικό) = B / (B + Δ)
p(~θετικό) = Β + Δ
Τέλος, η πιθανότητα ότι μια γυναίκα έχει καρκίνο ισούται με την πιθανότητα να έχει καρκίνο και θετικό τεστ (Ομάδα Α) συν την πιθανότητα να έχει καρκίνο και αρνητικό τεστ (Ομάδα Β)
p(καρκίνος) = A + B
Ομοίως, η πιθανότητα ότι μια γυναίκα δεν έχει καρκίνο ισούται με την πιθανότητα να μην έχει καρκίνο και θετικό τεστ (Ομάδα Γ) συν την πιθανότητα να μην έχει καρκίνο και αρνητικό τεστ (Ομάδα Δ):
p(~καρκίνος) = Γ + Δ
Αν τα μεταφράσουμε όλα αυτά με σύμβολα πιθανοτήτων, ουσιαστικά μόλις εξηγήσαμε τις παρακάτω εξισώσεις:
p(καρκίνος|θετικό) = p(καρκίνος&θετικό) p(καρκίνος&θετικό) + p(~καρκίνος&θετικό) p(θετικό) = p(καρκίνος&θετικό) + p(~καρκίνος&θετικό)
p(καρκίνος|~θετικό) = p(καρκίνος&~θετικό) p(καρκίνος&~θετικό) + p(~καρκίνος&~θετικό) p(~θετικό) = p(καρκίνος&~θετικό) + p(~καρκίνος&~θετικό)
p(καρκίνος) = p(καρκίνος&θετικό) + p(καρκίνος&~θετικό)
p(~καρκίνος) = p(~καρκίνος&θετικό) + p(~καρκίνος&~θετικό)
Δεδομένου πως μπορούμε να υπολογίσουμε όλα τα μεγέθη που θέλουμε βάσει των Α, Β, Γ και Δ (και δεδομένου πως τα Α, Β, Γ και Δ έχουν τρεις βαθμούς ελευθερίας) το λογικό συμπέρασμα είναι πως και τα 16 μεγέθη του προβλήματος (βλ. τον παραπάνω έγχρωμο πίνακα) έχουν τρεις βαθμούς ελευθερίας.
Αυτό δε θα έπρεπε να σας κάνει εντύπωση, βέβαια, αφού ήδη ξέραμε πως μπορούμε να λύσουμε τέτοιου είδους προβλήματα με μόνο τρεις πληροφορίες: την πρότερη πιθανότητα και τις δύο δεσμευμένες πιθανότητες.
Τώρα που κατανοείτε τις σχέσεις μεταξύ των 16 αυτών διαφορετικών μεγεθών, ας δοκιμάσουμε ένα άλλο πρόβλημα που μας παρουσιάζει ο Yudkowsky:
Υποθέστε πως έχετε ένα μεγάλο βαρέλι με πλαστικά αυγά. Μερικά περιέχουν πέρλες, ενώ τα υπόλοιπα είναι άδεια. Κάποια αυγά είναι βαμμένα κόκκινα και τα άλλα κόκκινα. Υποθέστε πως το 40% των αυγών είναι μπλε, τα 5/13 των αυγών που περιέχουν πέρλες είναι μπλε και το 20% των αυγών είναι και άδεια και βαμμένα κόκκινα. Ποια είναι η πιθανότητα ένα μπλε αυγό να περιέχει πέρλα;
Προσπαθήστε να το λύσετε όπως κάναμε παραπάνω.
Τι στοιχεία έχουμε; Ξέρουμε πως το 40% των αυγών είναι μπλε:
p(μπλε) = 40%
Επίσης ξέρουμε πως τα 5/13 των αυγών με πέρλες είναι μπλε:
p(μπλε|πέρλα) = 5/13
Τέλος ξέρουμε πως το 20% των αυγών είναι κόκκινα και άδεια:
p(~μπλε&~πέρλα) = 20%
Αυτό που θέλουμε να βρούμε είναι αυτό:
p(πέρλα|μπλε) = ?
Ωραία, πώς βρίσκουμε την πρότερη πιθανότητα; Μιας και είστε νέοι στο Θεώρημα Μπέυζ, μάλλον δεν είστε σίγουροι ποιος είναι ο πιο γρήγορος τρόπος για να βρείτε την απάντηση, οπότε ας αρχίσουμε να συμπληρώνουμε τα πιο προφανή από τα 16 μεγέθη του προβλήματος:
- p(μπλε) = 40% :δεδομένο του προβλήματος
- p(~μπλε) =
- p(πέρλα) =
- p(~πέρλα) =
- p(πέρλα&μπλε) =
- p(πέρλα&~μπλε) =
- p(~πέρλα&μπλε) =
- p(~πέρλα&~μπλε) = 20% :δεδομένο του προβλήματος
- p(μπλε|πέρλα) = 5/13 :δεδομένο του προβλήματος
- p(~μπλε|πέρλα) =
- p(μπλε|~πέρλα) =
- p(~μπλε|~πέρλα) =
- p(πέρλα|μπλε) = ???
- p(~πέρλα|μπλε) =
- p(πέρλα|~μπλε) =
- p(~πέρλα|~μπλε) =
Πώς συμπληρώνουμε περισσότερες τιμές; Πρώτα ας κοιτάξουμε τις σχέσεις μεταξύ των μεγεθών και να δούμε τι μπορούμε να βρούμε. Αυτές είναι οι σχέσεις που βρήκαμε για το πρόβλημα με τον καρκίνο του μαστού:
- p(καρκίνος) + p(~καρκίνος) = 100%
- p(θετικό) + p(~θετικό) = 100%
- p(θετικό|καρκίνος) + p(~θετικό|καρκίνος) = 100%
- p(καρκίνος|θετικό) + p(~καρκίνος|θετικό) = 100%
- p(θετικό|καρκίνος) + p(~θετικό|καρκίνος) = 100%
- p(καρκίνος|~θετικό) + p(~καρκίνος|~θετικό) = 100%
- p(θετικό&καρκίνος) = p(θετικό|καρκίνος) × p(καρκίνος)
- p(~θετικό&καρκίνος) = p(~θετικό|καρκίνος) × p(καρκίνος)
- p(θετικό&καρκίνος) + p(θετικό&~καρκίνος) = p(θετικό)
- p(θετικό&καρκίνος) + p(θετικό&~καρκίνος) + p(~θετικό&καρκίνος) + p(~θετικό&~καρκίνος) = 100%
- p(θετικό) = p(καρκίνος&θετικό) + p(~καρκίνος&θετικό)
- p(~θετικό) = p(καρκίνος&~θετικό) + p(~καρκίνος&~θετικό)
- p(καρκίνος) = p(καρκίνος&θετικό) + p(καρκίνος&~θετικό)
- p(~καρκίνος) = p(~καρκίνος&θετικό) + p(~καρκίνος&~θετικό)
• p(καρκίνος|θετικό) = | p(καρκίνος&θετικό) |
p(καρκίνος&θετικό) + p(~καρκίνος&θετικό) |
• p(καρκίνος|~θετικό) = | p(καρκίνος&~θετικό) |
p(καρκίνος&~θετικό) + p(~καρκίνος&~θετικό) |
Τώρα ας μετατρέψουμε αυτές τις εξισώσεις για το πρόβλημα με το μπλε και τις πέρλες, αντικαθιστώντας τον καρκίνο (αυτό που προσπαθούσαμε να βρούμε) με πέρλα (αυτό που προσπαθούμε να βρούμε τώρα), και το θετικό (το προηγούμενο τεστ) με το μπλε (το τρέχον τεστ):
- p(πέρλα) + p(~πέρλα) = 100%
- p(μπλε) + p(~μπλε) = 100%
- p(μπλε|πέρλα) + p(~μπλε|πέρλα) = 100%
- p(πέρλα|μπλε) + p(~πέρλα|μπλε) = 100%
- p(μπλε|πέρλα) + p(~μπλε|πέρλα) = 100%
- p(πέρλα|~μπλε) + p(~πέρλα|~μπλε) = 100%
- p(μπλε&πέρλα) = p(μπλε|πέρλα) × p(πέρλα)
- p(~μπλε&πέρλα) = p(~μπλε|πέρλα) × p(πέρλα)
- p(μπλε&πέρλα) + p(μπλε&~πέρλα) = p(μπλε)
- p(μπλε&πέρλα) + p(μπλε&~πέρλα) + p(~μπλε&πέρλα) + p(~μπλε&~πέρλα) = 100%
- p(μπλε) = p(πέρλα&μπλε) + p(~πέρλα&μπλε)
- p(~μπλε) = p(πέρλα&~μπλε) + p(~πέρλα&~μπλε)
- p(πέρλα) = p(πέρλα&μπλε) + p(πέρλα&~μπλε)
- p(~πέρλα) = p(~πέρλα&μπλε) + p(~πέρλα&~μπλε)
• p(πέρλα|μπλε) = | p(πέρλα&μπλε) |
p(πέρλα&μπλε) + p(~πέρλα&μπλε) |
• p(πέρλα|~μπλε) = | p(πέρλα&~μπλε) |
p(πέρλα&~μπλε) + p(~πέρλα&~μπλε) |
Ωραία. Ποιες εξισώσεις μπορούμε να χρησιμοποιήσουμε με τα μεγέθη που ξέρουμε ήδη;
Οι πιο προφανείς που μπορούμε να χρησιμοποιήσουμε είναι αυτή:
p(μπλε) + p(~μπλε) = 100%
και αυτή:
p(μπλε|πέρλα) + p(~μπλε|πέρλα) = 100%
Βγάζουμε 60% για την p(~μπλε) και 8/13 για την p(~μπλε|πέρλα).
Να άλλη μία. Θα θυμάστε ότι:
p(~μπλε) = p(πέρλα&~μπλε) + p(~πέρλα&~μπλε)
Ξέρουμε τις δύο τιμές, οπότε:
60% = 20% + p(πέρλα&~μπλε)
Το οποίο σημαίνει:
p(πέρλα&~μπλε) = 60% – 20% = 40%
Ας τα βάλουμε όλα αυτά στον πίνακα:
- p(μπλε) = 40%
- p(~μπλε) = 60% [επειδή p(μπλε) + p(~μπλε) = 100%]
- p(πέρλα) =
- p(~πέρλα) =
- p(πέρλα&μπλε) =
- p(πέρλα&~μπλε) = 40%
[επειδή p(~μπλε) = p(πέρλα&~μπλε) + p(~πέρλα&~μπλε)]
- p(~πέρλα&μπλε) =
- p(~πέρλα&~μπλε) = 20%
- p(μπλε|πέρλα) = 5/13
- p(~μπλε|πέρλα) = 8/13 [επειδή p(μπλε|πέρλα) + p(~μπλε|πέρλα) = 100%]
- p(μπλε|~πέρλα) =
- p(~μπλε|~πέρλα) =
- p(πέρλα|μπλε) = ???
- p(~πέρλα|μπλε) =
- p(πέρλα|~μπλε) =
- p(~πέρλα|~μπλε) =
Τι άλλο μπορούμε να κάνουμε; Ρίξτε μια ματιά στις παραπάνω εξισώσεις και δείτε τι μπορούμε να βρούμε με τα στοιχεία που έχουμε.
Να μία:
p(πέρλα|~μπλε) = p(πέρλα&~μπλε) p(πέρλα&~μπλε) + p(~πέρλα&~μπλε)
Συμπληρώνοντας τις τιμές που έχουμε, βγάζουμε:
p(πέρλα|~μπλε) = 40% 40% + 20%
Άρα:
p(πέρλα|~μπλε) = 2/3
Αυτό σημαίνει πως μπορούμε να βρούμε και το p(~πέρλα|~μπλε) επειδή:
p(πέρλα|~μπλε) + p(~πέρλα|~μπλε) = 100%
Συνεπώς:
p(~πέρλα|~μπλε) = 1/3
Τώρα ο πίνακας γίνεται έτσι:
- p(μπλε) = 40%
- p(~μπλε) = 60%
- p(πέρλα) =
- p(~πέρλα) =
- p(πέρλα&μπλε) =
- p(πέρλα&~μπλε) = 40%
- p(~πέρλα&μπλε) =
- p(~πέρλα&~μπλε) = 20%
- p(μπλε|πέρλα) = 5/13
- p(~μπλε|πέρλα) = 8/13
- p(μπλε|~πέρλα) =
- p(~μπλε|~πέρλα) =
- p(πέρλα|μπλε) = ???
- p(~πέρλα|μπλε) =
- p(~πέρλα|~μπλε) = 1/3
επειδή p(πέρλα|~μπλε) + p(~πέρλα|~μπλε) = 100%
• p(πέρλα|~μπλε) = 2/3 :επειδή p(πέρλα|~μπλε) = | p(πέρλα&~μπλε) |
p(πέρλα&~μπλε) + + p(~πέρλα&~μπλε) |
Προχωράει το πράμα! Να άλλη μια εξίσωση που μπορούμε να λύσουμε:
p(~μπλε&πέρλα) = p(~μπλε|πέρλα) × p(πέρλα)
Άρα:
40% = (8/13) × p(πέρλα)
Συνεπώς:
p(πέρλα|~μπλε) = 40% = 2/5 = 13/20 = 65% 8/13 8/13
Τώρα που ξέρουμε το p(πέρλα) μπορούμε να λύσουμε και αυτή την εξίσωση από τη λίστα μας:
p(μπλε&πέρλα) = p(μπλε|πέρλα) × p(πέρλα)
Άρα:
p(μπλε&πέρλα) = 5 × 13 = 1/4 = 25% 13 20
Ανανεώνοντας τον πίνακα έχουμε:
- p(μπλε) = 40%
- p(~μπλε) = 60%
- p(πέρλα) = 65% επειδή p(~μπλε&πέρλα) = p(~μπλε|πέρλα) × p(πέρλα)
- p(~πέρλα) =
- p(πέρλα&μπλε) = 25% επειδή p(μπλε&πέρλα) = p(μπλε|πέρλα) × p(πέρλα)
- p(πέρλα&~μπλε) = 40%
- p(~πέρλα&μπλε) =
- p(~πέρλα&~μπλε) = 20%
- p(μπλε|πέρλα) = 5/13
- p(~μπλε|πέρλα) = 8/13
- p(μπλε|~πέρλα) =
- p(~μπλε|~πέρλα) =
- p(πέρλα|μπλε) = ???
- p(~πέρλα|μπλε) =
- p(πέρλα|~μπλε) = 2/3
- p(~πέρλα|~μπλε) = 1/3
Το έβδομο είναι εύκολο επειδή:
p(μπλε) = p(πέρλα&μπλε) + p(~πέρλα&μπλε)
Το οποίο μας δίνει:
40% = 25% + p(~πέρλα&μπλε)
Συνεπώς:
p(~πέρλα&μπλε) = 40% – 25% = 15%
Επιτέλους μπορούμε να λύσουμε την εξίσωση για να βρούμε το p(πέρλα|μπλε) επειδή:
p(πέρλα|μπλε) = p(πέρλα&μπλε) p(πέρλα&μπλε) + p(~πέρλα&μπλε)
Το οποίο μας δίνει:
p(πέρλα|μπλε) = 25% 25% + 15%
Συνεπώς:
p(πέρλα|μπλε) = 25% / 40%
Οπότε καταλήγουμε:
p(πέρλα|μπλε) = 62,5%
Για την ακρίβεια δε χρειαζόταν να υπολογίσουμε όλες τις τιμές. Αλλά ήταν καλό για εξάσκηση. 🙂
Αλλά ας ελέγξουμε τους υπολογισμούς μας. Είναι λογικά τα αποτελέσματα; Να το αρχικό πρόβλημα:
Υποθέστε πως έχετε ένα μεγάλο βαρέλι με πλαστικά αυγά. Μερικά περιέχουν πέρλες, ενώ τα υπόλοιπα είναι άδεια. Κάποια αυγά είναι βαμμένα κόκκινα και τα άλλα κόκκινα. Υποθέστε πως το 40% των αυγών είναι μπλε, τα 5/13 των αυγών που περιέχουν πέρλες είναι μπλε και το 20% των αυγών είναι και άδεια και βαμμένα κόκκινα. Ποια είναι η πιθανότητα ένα μπλε αυγό να περιέχει πέρλα;
Θυμηθειτε πως η p(πέρλα) είναι 13/20. Αυτή είναι η πρότερη πιθανότητά μας: 65%. Υπάρχει 65% πιθανότητα ένα αυγό να έχει πέρλα, πριν δούμε ακόμα τι χρώμα έχει.
Ποιες είναι οι δεσμευμένες μας πιθανότητες; Τη μία μας τη δίνει το πρόβλημα. Η πιθανότητα ένα μπλε αυγό να περιέχει πέρλα, p(μπλε|πέρλα), είναι 5/13 – το οποίο δε μετατρέπεται σε ωραία στο δεκαδικό σύστημα. Η άλλη δεσμευμένη πιθανότητα, η πιθανότητα ένα κόκκινο αυγό να περιέχει πέρλα είναι p(~μπλε|πέρλα) = 8/13.
Οπότε αν ένα συγκεκριμένο αυγό περιέχει πέρλα, είναι ελαφρώς πιθανότερο να είναι κόκκινο, παρά μπλε. Οπότε όταν ανακαλύπτουμε ότι το αυγό που βγάλαμε από το βαρέλι είναι μπλε, αυτό καθιστά ελαφρώς λιγότερο πιθανό να περιέχει πέρλα τώρα που ξέρουμε το χρώμα του. Μετά το χρωματικό τεστ λοιπόν, αφού ανακαλύψαμε πως το αυγό είναι μπλε, η πιθανότητα να περιέχει πέρλα κατεβαίνει λιγάκι.
Και κοίτα να δεις! Αυτό βρήκαμε! Η πρότερη πιθανότητα να περιέχει ένα αυγό πέρλα ήταν 65%, ενώ η αναθεωρημένη πιθανότητα ότι το μπλε αυγό που διαλέξαμε περιέχει πέρλα είναι ελαφρώς χαμηλότερη· 62,5%.
Οπότε οι πράξεις που κάναμε ταιριάζουν με αυτό που θα περιμέναμε, βάσει αυτών που μάθαμε γι’αυτού του είδους τα προβλήματα.
Έχοντας ασχοληθεί με μερικά προβλήματα, μπορεί να παρατηρήσατε πως ισχυρά, αλλά σπάνια στοιχεία που πιέζουν την πιθανότητα από τη μία μεριά εξισορροπούνται από ασθενή, αλλά πιο συνήθη στοιχεία από την άλλη μεριά. Θα χρησιμοποιήσω το παράδειγμα με τον καρκίνο του μαστού για να σας δείξω γιατί συμβαίνει αυτό:
p(καρκίνος) = p(καρκίνος|~θετικό) × p(~θετικό) +
+ p(καρκίνος|θετικό) × p(θετικό)
Αυτό διαβάζεται: “Η πιθανότητα μια γυναίκα να έχει καρκίνο ισούται με [την πιθανότητα να έχει καρκίνο δεδομένης αρνητικής μαστογραφίας επί την πιθανότητα αρνητικής μαστογραφίας] συν [την πιθανότητα μια γυναίκα να έχει καρκίνο δεδομένης θετικής μαστογραφίας επί την πιθανότητα θετικής μαστογραφίας].”
Συνεπώς, αν υπάρχουν σπάνια, αλλά ισχυρά στοιχεία από τη μία δεσμευμένη πιθανότητα, αυτά πρέπει να εξισορροπούνται από πιο κοινά, αλλά αδύναμα στοιχεία από την άλλη δεσμευμένη πιθανότητα, αφού το άθροισμά τους πρέπει να ισούται με (σ’αυτή την περίπτωση) την p(καρκίνος). Ο Yudkowsky ονομάζει αυτή την αρχή “Διατήρηση της Πιθανότητας”.
Ώρα για άλλον έναν όρο: λόγος πιθανοφανειών. Ο λόγος πιθανοφανειών είναι η σχέση ενός αληθούς θετικού αποτελέσματος και ενός ψευδούς θετικού αποτελέσματος. Για την ακρίβεια είναι το κλάσμα της πιθανότητας αληθούς θετικού διά την πιθανότητα ψευδούς θετικού. Όμως ο λόγος πιθανοφανειών δε μας λέει και πολλά στην περίπτωση αρνητικού αποτελέσματος.
Για παράδειγμα, η (πέρλα|μπλε) είναι ανεξάρτητη της p(πέρλα|~μπλε). Ακόμα κι αν γνωρίζουμε το λόγο πιθανοφανειών και κατ’επέκταση ξέρουμε τι να κάνουμε στην περίπτωση θετικού αποτελέσματος στο τεστ, δε μας λέει τι να κάνουμε με ένα αρνητικό αποτέλεσμα στο τεστ μας.
Για να γίνει αυτό πιο σαφές, αναλογιστείτε το ακόλουθο παράδειγμα, πάλι από τη σελίδα του Ελιέζερ:
Υποθέστε πως έχουμε δύο βαρέλια γεμάτα με πλαστικά αυγά. Και στα δύο βαρέλια, το 40% των αυγών έχουν πέρλες, ενώ τα υπόλοιπα είναι άδεια. Στο πρώτο βαρέλι το 30% των γεμάτων αυγών είναι μπλε, ενώ το 10% των μπλε αυγών είναι άδεια. Στο δεύτερο βαρέλι το 90% των γεμάτων αυγών είναι μπλε και το 30% των άδειων αυγών είναι μπλε. (Υποθέτοντας πως σας αρέσουν οι πέρλες) θα προτιμούσατε ένα μπλε αυγό από το πρώτο ή το δεύτερο βαρέλι; Θα προτιμούσατε μήπως ένα κόκκινο αυγό από το πρώτο ή το δεύτερο βαρέλι;
Αυτή τη φορά πρέπει να υπολογίσουμε την πιθανότητα ένα μπλε αυγό από το πρώτο βαρέλι να έχει πέρλα και να τη συγκρίνουμε με την αντίστοιχη πιθανότητα από το δεύτερο βαρέλι. Για τη δεύτερη ερώτηση πρέπει να υπολογίσουμε την πιθανότητα ένα κόκκινο αυγό από το πρώτο βαρέλι να έχει πέρλα και να τη συγκρίνουμε με την πιθανότητα ένα κόκκινο αυγό στο δεύτερο βαρέλι να έχει πέρλα.
Και στα δυο βαρέλια, το 40% των αυγών περιέχουν πέρλες. Άρα η πρότερη πιθανότητα p(πέρλα) είναι 40% και για τα δύο βαρέλια.
Και αν προσέχατε μέχρι τώρα, θα έχετε ήδη καταλάβει διαισθητικά ότι δεν έχει σημασία από ποιο βαρέλι προέρχεται ένα μπλε αυγό γιατί…
Στο πρώτο βαρέλι p(μπλε|πέρλα) / p(μπλε|~πέρλα) = 30/10
Στο δεύτερο βαρέλι p(μπλε|πέρλα) / p(μπλε|~πέρλα) = 90/30
…που είναι η ίδια αναλογία. Και οι δύο ισούνται με ακριβώς τρία. Και αφού η πρότερη πιθανότητα – δηλαδή η p(πέρλα) – είναι η ίδια και για τα δύο βαρέλια και ο λόγος μεταξύ των δεσμευμένων πιθανοτήτων είναι ο ίδιος και για τα δύο βαρέλια, αυτό σημαίνει πως η p(πέρλα|μπλε) θα είναι ίδια και για τα δύο βαρέλια. Επομένως… θα προτιμούσατε ένα μπλε αυγό από το πρώτο ή το δεύτερο βαρέλι; Δε μας νοιάζει! Η p(πέρλα|μπλε) είναι η ίδια και στις δυο περιπτώσεις.
Αλλά τι γίνεται με τα κόκκινα αυγα; Προτιμάμε ένα κόκκινο από το πρώτο ή το δεύτερο βαρέλι; Δηλαδή, για ποιο βαρέλι η p(πέρλα|~μπλε) είναι μεγαλύτερη;
Στο πρώτο βαρέλι το 70% των αυγών με πέρλα είναι κόκκινα και το 90% των άδειων αυγών είναι κόκκινα. Αλλά στο δεύτερο βαρέλι το 10% των αυγών με πέρλα είναι κόκκινα, ενώ το 70% των άδειων αυγών είναι κόκκινα. Εδώ η αναλογία των δεσμευμένων πιθανοτήτων είναι διαφορετική μεταξύ των βαρελιών. Συγκεκριμένα:
Στο πρώτο βαρέλι, p(~μπλε|πέρλα) / p(~μπλε|~πέρλα) = 70/90
Στο δεύτερο βαρέλι, p(~μπλε|πέρλα) / p(~μπλε|~πέρλα) = 10/70
Αφού ο λόγος των δεσμευμένων πιθανοτήτων για το βαρέλι #1 είναι διαφορετική απ’ότι για το βαρέλι #2, είναι σίγουρο ότι θα προτιμήσουμε ένα από τα δύο βαρέλια. Και χωρίς να κάνουμε τις πράξεις μπορούμε να δούμε ότι η p(πέρλα|~μπλε) είναι μεγαλύτερη για το βαρέλι #1, οπότε θα ήταν καλύτερο να επιλέξουμε ένα κόκκινο αυγό από το βαρέλι #1, παρά από το βαρέλι #2. Ο λόγος p(~μπλε|πέρλα) προς p(~μπλε|~πέρλα) είναι μεγαλύτερη για το βαρέλι #1 απ’ότι για το βαρέλι #2.
Μην ξεχνάτε να τα διαβάζετε αυτά φωναχτά: “Η αναλογία της πιθανότητας να πάρουμε ένα κόκκινο αυγό δεδομένου ότι έχει πέρλα προς την πιθανότητα να πάρουμε ένα κόκκινο αυγό δεδομένου ότι είναι άδειο είναι υψηλότερη για το βαρέλι #1 απ’ότι για το βαρέλι #2, οπότε προτιμούμε να πάρουμε ένα κόκκινο αυγό από το βαρέλι #1 απ’ότι από το βαρέλι #2 (αν υποθέσουμε πως θέλουμε μια πέρλα).”
Το πρόβλημα αυτό δείχνει ξεκάθαρα το γεγονός ότι η p(πέρλα|μπλε) και η p(πέρλα|~μπλε) έχουν δύο βαθμούς ελευθερίας ακόμα και όταν η p(πέρλα) είναι σταθερή. Και για τα δύο βαρέλια η p(πέρλα) ήταν η ίδια, αλλά αυτό δεν σημαίνει πως ήταν η ίδια η αναλογία της p(πέρλα|μπλε) προς την p(πέρλα|~μπλε) και για τα δύο βαρέλια, αφού η p(μπλε) ήταν διαφορετική. Όπως λέει ο Yudkowsky:
Στο δεύτερο βαρέλι η αναλογία των μπλε αυγών με πέρλα ήταν η ίδια με το πρώτο βαρέλι, αλλά ένα πολύ μεγαλύτερο ποσοστό αυγών είναι βαμμένα μπλε! Αυτό αλλάζει το σύνολο των κόκκινων αυγών με τέτοιο τρόπο που οι αναλογίες [μεταξύ των δεσμευμένων πιθανοτήτων] όντως αλλάζουν.
Πίσω στο παράδειγμα με τον καρκίνο του μαστού:
Ο λόγος πιθανοφανειών σε ένα ιατρικό τεστ -ο αριθμός των αληθών θετικών δια τον αριθμό των ψευδών θετικών- μας λέει ό,τι χρειάζεται να ξέρουμε για τη σημασία ενός θετικού αποτελέσματος. Αλλά δε μας λέει για το νόημα ενός αρνητικού αποτελέσματος, ούτε και το πόσο συχνά είναι χρήσιμο αυτό το τεστ. Για παράδειγμα, μια μαστογραφία με ποσοστό επιτυχίας 80% για καρκινοπαθείς και 9,6% πιθανότητας ψευδούς θετικού αποτελέσματος για υγιείς ασθενείς έχει τον ίδιο λόγο πιθανοφανειών με ένα τεστ με 8% αληθή θετικά και 0,96% ψευδή θετικά αποτελέσματα. Αν και αυτά τα δύο τεστ έχουν τον ίδιο λόγο πιθανοφανειών, το πρώτο τεστ είναι χρησιμότερο από κάθε άποψη -ανιχνεύει την ασθένεια συχνότερα και ένα αρνητικό αποτέλεσμα είναι ισχυρότερο στοιχείο υγείας.
Ο λόγος πιθανοφανειών για ένα θετικό αποτέλεσμα μας λέει περιληπτικά την ισχύ των πιέσεων των δύο δεσμευμένων πιθανοτήτων και μας δείχνει πόσο να θετικό αποτέλεσμα θα επηρεάσει την πρότερη πιθανότητα.
Φυσικά, ο λόγος πιθανοφανειών δεν αρκεί για να πάρουμε σωστή απάντηση· ο λόγος πιθανοφανειών και η πρότερη πιθανότητα είναι δύο νούμερα, ενώ το πρόβλημα έχεις τρεις βαθμούς ελευθερίας.
Ο μάστερ του μπεϋζιανού λογισμού E.T. Jaynes (νεκρός πλέον) κάποτε είπε πως τα αποδεικτικά στοιχεία θα έπρεπε να μετρώνται σε ντεσιμπέλ.
Γιατί σε ντεσιμπέλ;
Τα ντεσιμπέλ μετρούν εκθετικά τις διαφορές σε ηχητική ενέργεια, όπως η κλίμακα Ρίχτερ μετρά εκθετικά τις διαφορές στην εκλυόμενη σεισμική ενέργεια. Στην κλίμακα Ρίχτερ, ένας σεισμός μεγέθους 7 δεν απελευθερώνει απλά λιγουλάκι περισσότερη ενέργεια από έναν σεισμό μεγέθους 6, αλλά δέκα φορές περισσότερη ενέργεια. Ομοίως ένας σεισμός μεγέθους 8 απελευθερώνει 100 φορές περισσότερη ενέργεια από ένα σεισμό μεγέθους 6.
Παρομοίως, αν η απόλυτη ησυχία είναι 0 ντεσιμπέλ, τότε ένας ψίθυρος είναι στα 20 ντεσιμπέλ και μια κανονική συζήτηση στα 60. Η κανονική συζήτηση δεν απελευθερώνει τρεις φορές περισσότερη ενέργεια από έναν ψίθυρο, αλλά 10.000 φορές περισσότερη ενέργεια, επειδή η διαφορά είναι 40 ντεσιμπέλ.
Για να βρούμε τα ντεσιμπέλ ενός ήχου:
Ντεσιμπέλ = 10 × log10(ένταση)
Επιτρέψτε μου μια μικρή παρένθεση για να βεβαιωθώ πως όλοι θυμάστε πως δουλεύουν οι λογάριθμοι.
Είμαι σίγουρος πως όλοι θυμάστε πως δουλεύουν οι εκθέτες. Αν έχουμε βάση 5 και εκθέτη 3, τότε το γράφουμε έτσι: 53. Αυτός είναι ένας γρήγορος τρόπος για να γράψουμε 5 × 5 × 5. Αυτό λέγεται ύψωση σε δύναμη. Ο λογάριθμος είναι η αντίστροφη διαδικασία. Το 53 ρωτάει “Πόσο κάνει το 5 υψωμένο στην 3η δύναμη;” ενώ το log525 ρωτάει “σε ποια δύναμη πρέπει να υψώσουμε το για να βρούμε 25;” Αφού το 5 στη 2η δύναμη ισούται με 25, ο log525 = 2. Η απάντηση στην έκφραση log525 (“λογάριθμος με βάση 5 του 25”) είναι η δύναμη στην οποία πρέπει να υψωθεί η βάση (5 στην προκειμένη περίπτωση) για να βρούμε τον δεδομένο αριθμό.
Όποτε βλέπω την έκφραση logαβ, πάντα διαβάζω “το α σε ποια δύναμη κάνει β;” Για παράδειγμα, το log464 το διαβάζω “το 4 σε ποια δύναμη κάνει 64;” Η απάντηση, προφανώς, είναι 3 γιατί το 4 εις την 3η ισούται με 64.
Αν δεν έχω γίνει σαφής, δείτε αυτό το σύντομο βίντεο στα ελληνικά (ή αυτό στα αγγλικά).
Εν πάσι περιπτώσει:
Ντεσιμπέλ = 10 × log10(ένταση)
Αυτό διαβάζεται “Τα ντεσιμπέλ ενός ήχου είναι 10 φορές ο λογάριθμος με βάση 10 της έντασης”.
Το να κατανοήσουμε τους λογάριθμους θα μας δώσουν να καταλάβουμε τι σημαίνει να αναλογιζόμαστε τα αποδεικτικά στοιχεία ως ντεσιμπέλ (ως εκθέτες, δηλαδή).
Ας επιστρέψουμε στο ιατρικό μας παράδειγμα. Ας υποθέσουμε πως μια γυναίκα ξεκινά με 1% πρότερη πιθανότητα να έχει καρκίνο του μαστού. Της κάνουμε τρεις διαφορετικές μαστογραφίες και το κάθε τεστ έχει διαφορετικό λόγο πιθανοφανειών. Έστω ότι είναι 25:3, 18:1, και 7:2.
Αν πάρουμε τοις μετρητοίς τη συμβουλή του Jaynes και μετρήσουμε την πρότερη πιθανότητα σε ντεσιμπέλ, έχουμε:
10 × log10(1/99) = -20 ντεσιμπέλ ότι η γυναίκα έχει καρκίνο.
Δε με νοιάζει αν μπορείτε να το υπολογίσετε αυτό (ούτως ή άλλως κι εγώ κομπιουτεράκι χρησιμοποιώ για τέτοιους υπολογισμούς). Θέλω απλά να νιώσετε πως είναι να δουλεύουμε με ντεσιμπέλ αποδείξεων.
Τώρα ας πούμε πως κάνουμε το πρώτο τεστ με λόγο πιθανοφανειών 25¨:3 και βγαίνει θετικό. Αυτό μας δίνει συν 9 ντεσιμπέλ αποδείξεων πως η γυναίκα έχει καρκίνο, επειδή:
10 × log10(25/3) = +9 ντεσιμπέλ πως η γυναίκα έχει καρκίνο.
Έπειτα κάνουμε και το δεύτερο τεστ και βγαίνει πάλι θετικό!
10 × log10(18/1) = +13 ντεσιμπέλ πως η γυναίκα έχει καρκίνο.
Θετικό βγαίνει και το τρίτο τεστ:
10 × log10(7/2) = +5 ντεσιμπέλ πως η γυναίκα έχει καρκίνο.
Η καημένη η γυναίκα ξεκίνησε με πολύ χαμηλή πιθανότητα να έχει καρκίνο, αλλά τώρα έχει τρία θετικά τεστ στη σειρά. Καθόλου καλά τα πράγματα! Ξεκίνησε με -20 ντεσιμπέλ αποδείξεων, αλλά τα τρία τεστ προσέθεσαν 27 ντεσιμπέλ (9+13+5) υπέρ της πιθανότητας να έχει καρκίνο, οπότε τώρα έχουμε +7 ντεσιμπέλ αποδείξεων ότι έχει καρκίνο. Σε μια γραμμική κλίματα, το +7 είναι λίγο, αλλά σε μια εκθετική κλίμακα αυτό το +7 ντεσιμπέλ σημαίνει πως έχει 83% πιθανότητα να έχει πράγματι καρκίνο!
Παρατηρήστε πως τα +7 ντεσιμπέλ αποδείξεων δεν είναι τόσο μεγάλο μέγεθος, όσο μικρό είναι το -20. Το αρχικό -20 σήμαινε πιθανότητα 99% πως η γυναίκα δεν είχε καρκίνο του μαστού, αλλά τα 7 ντεσιμπέλ σημαίνουν 83% πιθανότητα να έχει. Φυσικά τα 20 ντεσιμπέλ θα σήμαιναν 99% πιθανότητα να έχει καρκίνο.
Τώρα που κατανοείτε τη σχέση που έχουν οι λογάριθμοι και οι εκθέτες με τις πιθανότητες, προσπαθείστε να απαντήσετε σ’αυτό το πρόβλημα που μεταφέρω παραλλαγμένο από τη σελίδα του Yudkowsky χωρίς να γράψετε όλες τις πράξεις:
Μπροστά σας υπάρχει ένα σακούλι με 1000 μάρκες. Στην αρχή είχα δύο τέτοια σακούλια, ένα με 700 κόκκινες και 300 μπλε μάρκες και ένα με 300 κόκκινες και 700 μπλε μάρκες. Έστριψα ένα κέρμα για να διαλέξω σακούλι, οπότε η πρότερη πιθανότητα να έχετε μπροστά σας το σακούλι με τις πολλές κόκκινες μάρκες είναι 50%. Τώρα κλείνετε τα μάτια σας και βγάζετε μια τυχαία μάρκα. Βλέπετε το χρώμα, το σημειώνετε, ρίχνετε τη μάρκα στο σακούλι, τις ανακατεύετε και τραβάτε μια νέα μάρκα. Το κάνετε αυτό 12 φορές και από τα 12 αυτά “δείγματα” οι 8 μάρκες είναι κόκκινες και οι 4 είναι μπλε. Ποια είναι η πιθανότητα αυτή να είναι η τσάντα με τις περισσότερες κόκκινες μάρκες;
Σταματήστε και σκεφτείτε για λίγο και κάντε μια εκτίμηση για τη λύση του προβληματος.
Σύμφωνα με μια μελέτη του Ward Edwards και Lawrence Phillips, οι περισσότεροι άνθρωποι σ’αυτό το πρόβλημα δίνουν μια απάντηση μεταξύ 70% και 80%. Η δική σας εκτίμηση ήταν μεγαλύτερη; Αν ναι, τότε συγχαρητήρια! Η σωστή απάντηση είναι γύρω στο 97%.
Χωρίς να κάνετε πράξεις, να πως θα μπορούσατε να είχατε καταλήξει περίπου στο ίδιο αποτέλεσμα. Όπως λέει και το πρόλημα, ο λόγος πιθανοφανειών για την τυχαία επιλογή μιας κόκκινης μάρκας είναι 7/3, ενώ για την τυχαία επιλογή μιας μπλε μάρκας είναι 3/7. Έτσι, ένα θετικό αποτέλεσμα και για τα δύο τεστ έχει τον ίδιο βαθμό να γύρει την τελική πιθανότητα προς και τις δύο κατευθύνσεις. Φυσικά η επιλογή μιας κόκκινης μάρκας γέρνει την πιθανότητα p(κυρίως κόκκινο σακί) προς την αντίθετη κατεύθυνση απ’ότι η επιλογή μιας μπλε μάρκας.
Αν τραβήξουμε μια κόκκινη μάρκα, τη βάλουμε πίσω και μετά τραβήξουμε μια μπλε, αυτά τα δύο στοιχεία ακυρώνουν το ένα το άλλο, αλλά μόνο επειδή οι λόγοι πιθανοφανειών είναι ίσες και αντίθετες. Αν τραβήξουμε μια κόκκινη μάρκα, τη βάλουμε πίσω και μετά τραβήξουμε μια μπλε και αυτά είναι τα μόνα στοιχεία που έχουμε, τότε η πιθανότητα το σακούλι να είναι κυρίως κόκκινο παραμένει στο 50%.
Τράβηξες 12 μάρκες και βρήκες 4 περισσότερες απ’ότι μπλε. Αυτό είναι αρκετά “ντεσιμπέλ” στοιχείων υπέρ της πιθανότητας το σακούλι να είναι κυρίως κόκκινο· μιλάμε για υπεραρκετά στοιχεία. Αν αγνοήσουμε τις μπλε και κόκκινες μάρκες που αλληλοακυρώνονται, κάθε επιπλέον κόκκινη μάρκα σπρώχνει την πιθανότητα με την ισχύ του λόγου πιθανοφανειών 7/3! Ακόμα και χωρίς να κάνουμε τις πράξεις, είναι φανερό ότι η τελική πιθανότητα να έχουμε μπροστά μας το κυρίως κόκκινο σακούλι θα είναι πολύ μεγάλη.
Αν ο λόγος πιθανοφανειών του τεστ είναι 7/3 και έχετε 4 περισσότερα θετικά αποτελέσματα, τότε μπορείτε να υπολογίσετε τις πιθανότητες ως εξής:
(7/3)4 = 74:34 = 2401:81
Το οποίο είναι σχεδόν 30:1, δηλαδή σχεδόν 97%.
Ωραία. Νομίζω πως έχετε αρχίσει να καταλαβαίνετε πώς δουλεύουν οι πιθανότητες. Ας δούμε τώρα ένα τελευταίο πρόβλημα:
Είσαι ένας μηχανικός που επισκευάζει μαραφέτια. Όταν ένα μαραφέτι σταματήσει να δουλεύει, στο 30% των περιπτώσεων φταίει ένας βουλωμένος σωλήνας και στο 45% των περιπτώσεων ένα χαλασμένο μαραφέτι παράγει σπίθες. Αν ο σωλήνας δεν είναι βουλωμένος, το μαραφέτι έχει μόνο 5% πιθανότητα να παράξει σπίθες. Ένας πελάτης σου φέρνει ένα χαλασμένο μαραφέτι και αφού το πασπατέψεις για λίγο ανακαλύπτεις πως παράγει σπίθες. Ποια είναι η πιθανότητα ένα μαραφέτι που παράγει σπίθες να έχει βουλωμένο σωλήνα;
Θέλουμε να βρούμε λοιπόν το p(βουλωμένο|σπίθες) και ήδη ξέρουμε πως:
p(βουλωμένο) = 30%
p(~βουλωμένο) = 70%
p(σπίθες|βουλωμένο) = 45%
p(σπίθες|~βουλωμένο) = 5%
Θυμηθείτε πως:
p(σπίθες|βουλωμένο) × p(βουλωμένο) = p(σπίθες&βουλωμένο)
Άρα:
p(σπίθες&βουλωμένο) = 45% × 30% = 13.5%
Επίσης θυμηθείτε ότι:
p(σπίθες|~βουλωμένο) × p(~βουλωμένο) = p(σπίθες&~βουλωμένο)
Άρα:
p(σπίθες&~βουλωμένο) = 5% × 70% = 3.5%
Τέλος, θυμηθείτε ότι:
p(βουλωμένο|σπίθες) = p(σπίθες&βουλωμένο) p(σπίθες&βουλωμένο) + p(σπίθες&~βουλωμένο)
Συνεπώς:
p(βουλωμένο|σπίθες) = 13,5% 13,5% + 3,5%
Και η απάντηση είναι:
p(βουλωμένο|σπίθες) = 79,4%
Άμα μαζέψουμε τις πράξεις που κάναμε γι’αυτό το πρόβλημα, αυτό που ουσιαστικά κάναμε είναι αυτό:
p(βουλωμένο|σπίθες) = | p(σπίθες|βουλωμένο) x p(βουλωμένο) |
p(σπίθες|βουλωμένο) x p(βουλωμένο) + + p(σπίθες|~βουλωμένο) x p(~βουλωμένο) |
Η γενική μορφή είναι η εξής:
p(H|E) = | p(E|H) x p(H) |
p(E|H) x p(H) + p(E|~H) x p(~H) |
Αυτό είναι το Θεώρημα Μπέυζ.
Και επειδή:
p(E) = p(E|H ) × p(H) + p(E|~H) × p(~H)
Μπορούμε να συμπτύξουμε το Θεώρημα Μπέυζ στην εξής μορφή:
p(H|E) = | p(E|H) x p(H) |
p(E) |
Αυτή η μορφή είναι απλούστερη, οπότε εμφανίζεται συχνότερα, αλλά συχνά δεν αρκεί για να γίνει κατανοητό το τι ακριβώς κάνειτο Θεώρημα Μπέυζ, σε σύγκριση με τον πρώτο τύπο. Αλλά και οι δυο τύπο είναι σωστοί.
Δεδομένης μιας υπόθεσης H που ερευνούμε και μιας παρατήρησης Ε που αποτελεί αποδεικτικό στοιχείο για την υπόθεση Η, το Θεώρημα Μπέυζ μας λέει κατά πόσο πρέπει να αλλάξουμε την πιθανότητα η υπόθεση Η να είναι αληθής, δεδομένου του στοιχείου Ε.
Στο ιατρικό παράδειγμα, Η είναι “η γυναίκα έχει καρκίνο του μαστού” και Ε είναι μια θετική μαστογραφία. Το Θεώρημα Μπέυζ μας λέει ποια είναι η τελική πιθανότητα η γυναίκα να έχει καρκίνο (Η) δεδομένης της θετικής μαστογραφίας (E).
Ο Yudkowsky καταλήγει:
Τώρα πλέον το Θεώρημα Μπέυζ πρέπει να μοιάζει πασιφανές (ίσως και ταυτολογικό) παρά φοβερά ενδιαφέρον και καινοτόμο. Σ’αυτή την περίπτωση, αυτή η εισαγωγή εκπλήρωσε το σκοπό της.
Ορίστε λοιπόν. Τώρα κατανοείτε το διάσημο θεώρημα του αιδεσιμότατου Thomas Bayes. Είναι πολύ περήφανος για σας.
Γιατί να μας νοιάξει όμως όλο αυτό; Γιατί είναι σημαντικό το Θεώρημα Μπέυζ;
Ο Yudkowsky δίνει ένα παράδειγμα με κάποιον που θεωρεί πως η ανθρωπότητα θα αποφύγει έναν πυρηνικό πόλεμο για τουλάχιστον άλλα 100 χρόνια. Όταν τον ρωτάει γιατί, εκείνος απαντά “Όλοι εκείνοι που συμμετέχουν στη λήψη αποφάσεων δεν ενδιαφέρονται για πόλεμο αυτή τη στιγμή”. Αλλά γιατί να επεκτείνει την πρόβλεψη για 100 χρόνια; “Γιατί είμαι αισιόδοξος”. απαντά.
Τι ακριβώς καθιστά αυτό τον τρόπο σκέψης παράλογο; Τι περιέχει η φράση “Επειδή είμαι αισιόδοξος” που μας κάνει να τη θεωρούμε παντελώς λανθασμένη; (Ίσως ο ισχυρισμός είναι αληθής, αλλά δε θα τον πιστεύαμε μόνο και μόνο επειδή κάποιος λέει πως είναι αισιόδοξος.)
Ο Yudkowsky εξηγεί:
Άλλα επιχειρήματα θα μπορούσαν να είναι “Είτε είσαι αισιόδοξος, είτε όχι, αυτό είναι άσχετο με το αν η ανθρωπότητα θα εξαφανιστεί από πυρηνικό πόλεμο” ή “Η ελπίδα δεν έχει σχέση με τον πυρηνικό πόλεμο, επειδή δεν αποτελεί παρατήρηση για τον πόλεμο”.
Υπάρχει και μια μαθηματική απάντηση που είναι ακριβής και περιλαμβάνει όλα τα παραπάνω επιχειρήματα ως ειδικές περιπτώσεις. Αυτή η μαθηματική απάντηση είναι το Θεώρημα Μπέυζ.
Για παράδειγμα, η απάντηση “Είτε είσαι αισιόδοξος, είτε όχι, αυτό είναι άσχετο με το αν η ανθρωπότητα θα εξαφανιστεί από πυρηνικό πόλεμο” μπορεί να μεταφραστεί ως:
p(είσαι αισιόδοξος | η ανθρωπότητα θα αποφύγει τον πυρηνικό πόλεμο για άλλο ένα αιώνα) = p(είσαι αισιόδοξος | η ανθρωπότητα δε θα αποφύγει τον πυρηνικό πόλεμο για άλλο ένα αιώνα)
Ο Yudkowsky συνεχίζει (χρησιμοποιώντας “Α” για την υπόθεση και “Χ” για την απόδειξη, αντί για τα Η και Ε που χρησιμοποίησα εγώ παραπάνω):
Αφού οι πιθανότητες p(X|A) και p(X|~A) είναι ίσες, το Θεώρημα Μπέυζ λέει πως p(A|X) = p(A) και όπως έχουμε δει ήδη, όταν οι δύο δεσμευμένες πιθανότητες είναι ίσες, η τελική πιθανότητα ισούται με την αρχική πιθανότητα. Αν τα Χ και Α είναι ασύνδετα (στατιστικά ανεξάρτητα) τότε το να βρούμε ότι το Χ είναι αληθές δεν αποτελεί στοιχείο ότι το Α είναι αληθές. Η παρατήρηση του Χ δεν ενημερώνει την πιθανότητα για το Α. Το “Χ” δεν αποτελεί επιχείρημα για το “Α”.
Σ’αυτή την περίπτωση, το στοιχείο Χ (ότι είστε αισιόδοξος) δεν ενημερώνει την πιθανότητα για το Α (ότι η ανθρωπότητα θα καταστραφεί από πυρηνικό πόλεμο τα επόμενα 100 χρόνια).
Αλλά ας υποθέσουμε πως ο αισιόδοξος λέει: “Μα επειδή είμαι αισιόδοξος, θα έχω νέα ελπίδα για το αύριο, θα δουλέψω λίγο καλύτερα στην ανούσια δουλειά μου, θα βάλω λίγο περισσότερα λεφτά στην παγκόσμια οικονομία και στο τέλος-τέλος, θα φτάσουν λίγα δολάρια παραπάνω στην τσέπη του ερευνητή που θα βρει τρόπο να σταματήσει τους πυρηνικούς πολέμους. Οπότε βλέπεις πως τα δύο γεγονότα συνδέονται και μπορώ να χρησιμοποιήσω το ένα ως αποδεικτικό στοιχείο για το άλλο”.
Μη βιάζεσαι τόσο!
Υπό μία έννοια αυτό είναι σωστό. Κάθε συσχετισμός, ασχέτως πόσο αδύναμος, μπορεί να αξιολογηθεί με το Θεώρημα Μπέυζ, αλλά το Θεώρημα Μπέυζ μπορεί να διακρίνει μεταξύ αδύναμων και ισχυρών στοιχείων. Δηλαδή, το Θεώρημα Μπέυζ όχι μόνο μας λέει τι αποτελεί και τι όχι αποδεικτικό στοιχείο, αλλά περιγράφει και πόσο ισχυρό είναι ως στοιχείο. Δε μας λέει μόνο πότε να αναθεωρήσουμε τις πιθανότητες, αλλά και πόσο. Μπορεί να υπάρχει κάποιος συσχετισμός μεταξύ ελπίδας και πυρηνικού πολέμου, αλλά είναι πολύ πιο αδύναμος απ’ότι θα επιθυμούσε ο ομιλητής. Αναθεωρεί τις πιθανότητες πάρα πολύ.
Τα στατιστικά μοντέλα κρίνονται βάσει της μπεϋζιανής μεθόδου επειδή είναι η καλύτερη που διαθέτουμε: “η μπεϋζιανή μέθοδος ορίζει το μέγιστο που μπορεί να αποδώσει ένα συγκεκριμένο στοιχείο, όπως η θερμοδυναμική ορίζει το μέγιστο ποσό έργου που μπορεί να αποδώσει μια διαφορά θερμοκρασίας”. Θα ακούσετε μέχρι και επιστήμονες που ασχολούνται με τις νοητικές λειτουργίες να κρίνουν τη λήψη αποφάσεων βάσει της ιδανικής μπεϋζιανής λογικής, δεδομένου ότι οι γνωστικές προκαταλήψεις ορίζονται ως απομάκρυνση από αυτή.
Ο Yudkowsky καταλήγει:
Η Μπεϋζιανή Επανάσταση στις επιστήμες τροφοδοτείται όχι μόνο από τέτοιους επιστήμονες που ξαφνικά ανακαλύπτουν ότι τα νοητικά φαινόμενα έχουν μπεϋζιανή δομή, ούτε μόνο από επιστήμονες σε κάθε πεδίο που κρίνουν τα στατιστικά τους μοντέλα βάσει της μπεϋζιανής μεθόδου, αλλά από την άποψη ότι η ίδια η επιστήμη αποτελεί ειδική περίπτωση του Θεωρήματος Μπέυζ· οι πειραματικές αποδείξεις είναι στην ουσία μπεϋζιανές αποδείξεις. Οι μπεϋζιανοί επαναστάτες λένε πως όταν κάνεις ένα πείραμα και βρίσκεις στοιχεία που “επιβεβαιώνουν” ή “δεν επιβεβαιώνουν” τη θεωρία σου, αυτή η επιβεβαίωση ή μη ελέγχεται από τους μπεϋζιανούς κανόνες. Για παράδειγμα, δεν αρκεί να ελέγξεις αν το φαινόμενο προβλέπεται από τη θεωρία σου, αλλά και αν υπάρχουν και επιπλέον ερμηνείες για το φαινόμενο.
Η προηγούμενη δημοφιλής φιλοσοφία της επιστήμης είναι πιθανότατα αυτή της διαψευσιμότητας του Karl Popper. Η ιδέα του Popper ήταν πως οι θεωρίες μπορούν σίγουρα να διαψευστούν, αλλά ποτέ να επιβεβαιωθούν εκατό τοις εκατό, είναι ουσιαστικά μια ειδική περίπτωση των μπεϋζιανών κανόνων: αν p(X|A) ~ 1 – αν μια θεωρία κάνει μια βέβαιη πρόβλεψη- τότε αν κάνουμε μια παρατήρηση όπου ισχύει ~Χ αυτό αποτελεί ισχυρότατο στοιχείο ότι η θεωρία Α είναι λανθασμένη. Από την άλλη, αν p(X|A) ~ 1 και παρατηρήσουμε Χ, αυτό δεν επιβεβαιώνει σίγουρα τη θεωρία γιατί μπορεί να υπάρχει κάποια κατάσταση Β όπου p(X|B) ~ 1 και σ’αυτή την περίπτωση η παρατήρηση του Χ δεν ενισχύει περισσότερο κάποια από τις θεωρίες Α και Β. Για την παρατήρηση Χ να επιβεβαιώνει σίγουρα την θεωρία Α, θα έπρεπε να γνωρίζουμε όχι ότι p(X|A) ~ 1, αλλά p(X|~A) ~ 0, το οποίο είναι αδύνατο αφού δε γίνεται να προβλέψουμε όλες τις πιθανές εναλλακτικές ερμηνείες. Για παράδειγμα, όταν η Γενική Σχετικότητα του Αϊνστάιν κατέρριψε την επανειλημμένως επιβεβαιωμένη θεωρία της βαρύτητας του Νεύτωνα, αποκαλύφθηκε ότι όλες οι προβλέψεις του Νεύτωνα ήταν απλά μια ειδική περίπτωση των προβλέψεων του Αϊνστάιν.
Η φιλοσοφία του Popper μπορεί να αποδοθεί και μαθηματικά. Ο λόγος πιθανοφανειών για το Χ, δηλαδή p(X|A)/p(X|~A) καθορίζει κατά πόσο η παρατήρηση του Χ αλλάζει την πιθανότητα για το Α. Ο λόγος πιθανοφανειών αυτός μας λέει πόσο ισχυρό είναι το Χ ως αποδεικτικό στοιχείο. Μπορεί σε μια θεωρία σας Α να μπορείτε να προβλέψετε το Χ με πιθανότητα 1, αν θέλετε, αλλά δεν μπορείτε να ελέγξετε τον παρονομαστή του λόγου πιθανοφάνειας p(X|~A) -πάντα θα υπάρχει κάποια εναλλακτική θεωρία που επίσης θα προβλέπει το Χ και παρόλο που συνήθως επιλέγουμε την απλούστερη θεωρία που ταιριάζει με τις τρέχουσες παρατηρήσεις, ίσως κάποια μέρα εμφανιστούν στοιχεία που προβλέπει η εναλλακτική θεωρία και όχι η δικιά σας. Αυτή ήταν η κρυμμένη παγίδα που κατέρριψε τη θεωρία της βαρύτητας του Νεύτωνα. Υπάρχει ένα όριο για το πόσο μπορείτε να εκμεταλλευτείτε τις επιτυχημένες προβλέψεις· υπάρχει όριο στο πόσο ψηλά μπορεί να ανέβει ο λόγος πιθανοφανειών για επιβεβαιωτικά στοιχεία.
Από την άλλη, αν βρείτε κάποιο στοιχείο Y που σίγουρα δεν προβλέπεται από τη θεωρία σας, αυτό είναι τερατωδώς ισχυρό στοιχείο κατά της θεωρίας σας. Αν η p(Y|Α) είναι μικροσκοπική, τότε εξίσου μικροσκοπικός θα είναι και ο λόγος πιθανοφανειών. Για παράδειγμα, αν p(Y|Α) = 0,0001% και p(Y|~Α) = 1%, τότε ο λόγος πιθανοφανειών θα είναι p(Y|A)/p(Y|~A) = 1:10000. Αυτό είναι -40 ντεσιμπέλ! Ή αντιστρέφοντας το λόγο πιθανοφανειών, αν η p(Y|A) είναι πολύ μικρή, τότε ο p(Y|~A)/p(Y|A) θα είναι πολύ μεγάλος, το οποίο σημαίνει ότι η παρατήρηση του Y ενισχύει την ~Α και όχι την Α. Η διάψευση είναι πολύ πιο ισχυρή από την επιβεβαίωση. Αυτό είναι αποτέλεσμα ενός προηγούμενο σημείου στο οποίο αναφερθήκαμε, όπου τα πολύ ισχυρά στοιχεία δεν είναι αποτέλεσμα μιας υψηλής πιθανότητας ότι το Α οδηγεί στο Χ, αλλά μιας πολύ μικρής πιθανότητα ότι το όχι-Α οδηγεί στο Χ. Αυτός ήταν ο ακριβής μπεϋζιανός κανόνας που βρίσκεται πίσω από την αξία της διαψευσιμότητας του Popper.
Παράλληλα, το δόγμα του Popper ότι μια ιδέα πρέπει να είναι δυνατόν να αποδειχθεί ότι είναι λανθασμένη μπορεί να ερμηνευθεί ως εμφάνιση του μπεϋζιανού κανόνα της διατήρησης των πιθανοτήτων. Αν ένα αποτέλεσμα Χ είναι ευνοϊκό για μια θεωρία, τότε το ~Χ είναι εν μέρει δυσοίωνο. Αν προσπαθήσεις να ερμηνεύσεις και το Χ και το ~Χ ως επιβεβαιωτικά στοιχεία για τη θεωρία, οι μπεϋζιανοί κανόνες λένε πως αυτό είναι αδύνατο! Για να αυξήσεις την πιθανότητα μια θεωρία να είναι σωστή, πρέπει να την εκθέσεις σε δοκιμασίες που ενδεχομένως να μειώσουν την πιθανότητα της ορθότητάς της. Αυτό δεν είναι απλά ένας κανόνας για να βρίσκουμε τους απατεώνες στην κοινωνική διαδικασία της επιστήμης, αλλά αποτέλεσμα της μπεϋζιανής θεωρίας των πιθανοτήτων. Από την άλλη, η ιδέα του Popper ότι μια θεωρία μόνο απορρίπτεται, αλλά ποτέ δεν επιβεβαιώνεται πλήρως αποδεικνύεται λανθασμένη. Το Θεώρημα Μπέυζ δείχνει ότι τα αρνητικά στοιχεία είναι πολύ πιο ισχυρά από τα θετικά, αλλά εξακολουθούν να εδράζονται στις πιθανότητες. Δεν ελέγχονται από θεμελιωδώς διαφορετικούς κανόνες, όπως έλεγε ο Popper.
Βρίσκουμε λοιπόν πως πολλά φαινόμενα στις επιστήμες των νοητικών λειτουργιών και οι στατιστικές μέθοδοι που χρησιμοποιούν οι επιστήμονες, αλλά και η ίδια η επιστημονική μέθοδος είναι εν τέλει ειδικές περιπτώσεις του Θεωρήματος Μπέυζ. Εξ ου και “Μπεϋζιανή Επανάσταση”.
Καλωσήλθατε στη Συνωμοσία του Μπέυζ!
Συνοδευτικοί Σύνδεσμοι
- Το αρχικό άρθρο του Luke Muehlhauser από το οποίο μεταφράστηκε η παρούσα εξήγηση του Θεωρήματος Μπέυζ: An Intuitive Explanation of Eliezer Yudkowsky’s Intuitive Explanation of Bayes’ Theorem
- Το αρχικό άρθρο του Eliezer Yudkowsky: An Intuitive Explanation of Bayes’ Theorem
- Συντομότερη εξήγηση από τη σελίδα “BetterExplained”: An Intuitive (and Short) Explanation of Bayes’ Theorem
- Άρθρο του komponisto: Bayes’ Theorem Illustrated (My Way)
- Άρθρο του Tim Mcgrew’s annotated bibliography of Bayesian reasoning
- Άλλοι σύνδεσμοι για το Θεώρημα Μπέυζ
Μπόνους Πρόβλημα
(μια προσφορά του Beelzebub)
Το αριστερό χέρι του Μορφέα έχει 7 μπλε χάπια και 3 κόκκινα. Το δεξί του χέρι έχει 5 μπλε και 8 κόκκινα. Κλείνεις τα μάτια και διαλέγεις ένα χάπι στην τύχη. Είναι κόκκινο, αλλά δεν ξέρεις από ποιο χέρι το πήρες. Ποια είναι η πιθανότητα να το πήρες από το δεξί χέρι;
Η λύση βρίσκεται παρακάτω με λευκά γράμματα. Επιλέξτε το κείμενο για να μπορέσετε να το διαβάσετε.
Το Θεώρημα Μπέυζ απαιτεί να ξέρουμε ποια είναι η υπόθεση και ποιο το δεδομένο. Στο πρόβλημα η υπόθεση Η είναι το δεξί χέρι. Το δεδομένο μας, το στοιχείο μας, είναι ότι τραβήξαμε κόκκινο χάπι. Εμείς ψάχνουμε να βρούμε την p(H|E) = p(δεξί|κόκκινο). Για να το βρούμε χρειαζόμαστε το p(E|H) = p(κόκκινο|δεξί), το p(H) = p(δεξί) και το p(E) = p(κόκκινο).
Η πιθανότητα να διαλέξουμε το δεξί ή το αριστερό χέρι είναι 50-50. Οπότε p(δεξί) = 0,5
Η πιθανότητα να διαλέξουμε κόκκινο χάπι από το δεξί χέρι είναι p(κόκκινο|δεξί) = 8/13 (8 κόκκινα χάπια σε σύνολο 13)
Η πιθανότητα να διαλέξουμε απλά ένα κόκκινο χάπι από οποιοδήποτε χέρι είναι p(κόκκινο) = 0,5 x 8/13 (δεξί χέρι) + 0,5 x 3/10 (αριστερό χέρι) = 8/26 + 3/20 = 0,457
Τα βάζουμε τώρα όλα στον τύπο:
p(δεξί|κόκκινο)=p(κόκκινο|δεξί) x p(δεξί) / p(κόκκινο) = 8/13 x 0,5 / 0,457 = 0,307 / 0,457 = 67,1%
Άρα η πιθανότητα να πήραμε το κόκκινο χάπι από το δεξί χέρι του Μορφέα είναι 67,1%
[…] Greek translation of the Bayes Theorem tutorial. […]
Μια απλή εξήγηση του Θεωρήματος Μπέυζ. Και μετά διαβάζεις για δέκα μέρες. Και κάνεις να το καταλάβεις ένα μήνα επιπλέον. λολ.
Συμπεράσματα. Ούτε η εξήγηση είναι απλή. χαχα, έβαν 4έβα!
Ε, είναι μεγάλο άρθρο… και το θέμα δεν είναι ακριβώς απλό. Δεν γίνεται να γίνουν και όλα κατανοητά χωρίς λίγο κόπο. Και πού να διαβάσεις το original του Yudkowsky…
Άσε, το πάλεψα. Μου αρέσει πολύ ο Yudkowsky και γενικά ξεψάχνισα και το Overcomingbias, έχει καλές συνεισφορές από άρθρα! Έπαθα πλάκα που διάβασα πως είναι αυτοδίδακτος!
Αλλά πρέπει να κατανοήσω τι σημαίνει μπευζιανή λογική και γιατί είναι σημαντικό να σκέφτομαι έτσι. Βλέπεις στην κοινωνία μας μαθαίνουμε οτιδήποτε άλλο συνήθως παρά να σκεφτόμαστε με μπευζιανό τρόπο.
Το Θεώρημα Μπέυζ είναι “απλή” λογική, δεν καταλαβαίνω γιατί τόσος “θόρυβος” για κάτι τόσο στοιχειώδες όσο η μαθηματική προσέγγιση της πραγματικότητας.
Πολύ απλά γιατί το Θεώρημα Μπέυζ παράγει αντιδιαισθητικά αποτελέσματα. Χωρίς τις πράξεις οι περισσότεροι απλά υπολογίζουμε πιθανότητες “άλλ’αντ’άλλα κουτρουβάλα, της Παρασκευής το γάλα”.