il teorema di Bayes*

Per introdurre il teorema di Bayes, sono utili alcune premesse:

differenza tra Statistica e Probabilità

Statistics vs. Probability : Based on N. Gilbert, Statistics, W. B. Saunders, 1976

differenza probabilià e statistica

C'è una differenza fra probabilità e frequenza statistica:

Il teorema di Bayes permette di correlare questi due dati qualora siano entrambi disponibili. In pratica il teorema di B. fornisce la probabilità che un dato evento sia effettivamente quella calcolata dal test... la probabilità di una probabilità (frequenza statistica)! Per esempio, con questo teorema si possono:

controlliamo un test*

Supponiamo di aver a che fare con questa situazione:

raccogliendo i dati in una tabella si ottiene questo quadro riassuntivo:

test positivi e negativi

la tabella indica che:

misuriamo l'accuratezza del test*

Ora supponiamo di essere risultati positivi ad un test di cancerogenicità. Quali probabilità abbiamo di avere un cancro: 80?, 99?, 1%?

Ecco come si deve procedere:

Posto che, come premesso, siamo in presenza di un risultato positivo, questo significa che ci troviamo da qualche parte della prima riga della nostra tabella: abbiamo un cancro, oppure no. Non possiamo fare assunzioni: potrebbe essere un vero positivo oppure un falso positivo.

raccogliendo i dati in una tabella si ottiene questo quadro riassuntivo:

dati raccolti

Ed ecco che si ripropone la questione: qual è la probabilità di avere un cancro se l'esito di un test è positivo?

La probabilità di un evento nel linguaggio corrente ha un significato incerto... per esempio. "è probabile che domani incontri il portalettere", è in effetti una possibiltà. D'altra parte, possiamo definire la probabilità in termini operativi (cioé in modo da renderne applicativo il concetto): "la probabilità è il rapporto tra l'evento atteso e tutti quelli che possono verificarsi". Così, per esempio, lanciando un dado, la probabilità che esca un 6 è 1:6 (il numero 6, quello atteso, diviso il numero di eventi possibili, le sei facce del dado). Nel caso del portalettere, la probabilità di incontrarlo è 1/(casi possibili) e poché il portalettere si sposta casualmente a seconda della corrispondenza da recapitare, non è possibile calcolare la probabilità: c'è solo la possibilità di incontrarlo.

Probabilità = Evento atteso / tutti gli eventi possibili

Probabilità = vero positivo/ (vero positivo + falso positivo)

La probabilità di ottenere un reale risultato positivo è 0.008. La probabilità di prendere un qualsiasi risultato positivo è la probabilità di un vero positivo addizionata alla probabilità di un falso positivo (0.008 + 0.095 = 0.103). Così, la nostra probabilità di avere un cancro è 0.008/0.103 = 0,078, cioé 7.8%

Dunque una mammografia positiva comporta che avete solo una probabilità del 7.8% di avere un cancro, piuttosto che l'80% (la supposta accuratezza del test). Inizialmente questo può sembrare strano, ma ha un senso: il test dà un falso positivo il 10% delle volte, così c'è un elevato numero di falsi positivi in una data popolazione. Se prendete 100 persone, solo 1 persona ha il cancro. Altre 10 non hanno il cancro, però sono dei falsi positivi. Come risultato positivo, voi avete approssimativamente (1/11 = 0.078) la probabilità del 7.8% di essere la persona che ha veramente il cancro.

*Adattato e ampliato da: betterexplained.com/articles/an-intuitive-and-short-explanation-of-bayes-theorem/

ESEMPI APPLICATIVI

Dopo aver seguito l'introduzione, si tratta di applicare quanto discusso a casi pratici, dove si ha a che fare con problemi la cui soluzione è ridotta all'uso di una formula; però, occorre capire come utilizzare i dati. Per questo fine, inizieremo a familiarizzarci con esempi semplici.

esempio 1: un'azienda acquista un principio attivo presso tre produttori: A, B, C nelle percentuali rispettivamente del 20, 30 e 50% in modo da soddisfare le proprie esigenze. Le percentuali di polimorfi nel principo attivo variano a seconda del produttore e sono A = 4%; B = 3%; C = 2%.
Sebbene si sia acquistato il principio attivo in quantità legate alla qualità offerta, si chiede di calcolare la probabilità che nel principo attivo fornito da C siano presenti polimorfi.

Per prima cosa consideriamo le probabilità di trovare polimorfi nelle forniture delle tre aziende:

P(A) = 0.04 ; P(B) = 0.03; P(C) = 0.02 (questi sono dati statistici)

Ora indicando con M la presenza di un lotto con polimorfi (4% per la fornitura da A), quindi la qualità del principio attivo è da controllare, la probabilità che provenga da A, B, e C, sono rispettivamente:

P(M|A) = P(A) × 20/100 = 0.04 × 0.2 = 0,008

P(M|B) = P(B) × 30/100 = 0.03 × 0.3 = 0,009

P(M|C) = P(C) × 50/100 = 0.02 × 0.5 = 0,01

la probabilità di trovare un lotto con polimorfi è data dalla somma:

P(M|A) + P(M|B) + P(M|C) = 0.027

in definitiva, applicando la formula di Bayes, la probabilità cercata è:

P(C|M)= 0.01/0.027 = 0.37 = 37 %

esempio 2: la carnagione dei bagnanti presenti in uno stabilimento balneare, è per il 65% scura, S, e per il 35% chiara, C. Posto che l'uso errato di filtri solari comporta una probabilità del 10% di scottarsi se di carnagione scura e del 60% se chiara, qual è la probabilità per un bagnante di carnagione scura di ustionarsi al Sole?

Per prima cosa consideriamo le probabilità di trovare ustionati per le due carnagioni: P(C) = 0.6 ; P(S) = 0.1

le probabilità di ustionarsi per i soggetti delle due carnagioni sono rispettivamente: P(U|C) = 0.35 × 0.6 = 0.21 ;

P(U|S) = 0.1 × 0.65 = 0.065

la probabilità di ustionarsi per entrambe le carnagioni è data dalla somma:

P(U|C) + P(U|S) = 0.065 + 0.21 = 0,275

La probabilità di scottarsi per un bagnante di carnagione scura è:

P(S|U) = 0.065/0.275 = 0.236 cioé circa il 24%

per un bagnante di carnagione chiara la probabilità è : 0.21/0.275 = 0.76 (sebbene si tratti di dati inventati, è bene dare un'occhiata a questo link).

esempio 3: Un medico è chiamato per visitare un bambino malato. Il medico è informato a priori che il 90% dei bambini malati in quella zona hanno l'influenza, mentre per l'altro 10% sono malati di morbillo. Poniamo che F indichi un bambino con influenza, M con il morbillo. Supponiamo per semplicità che non ci siano altre malattie in quel quartiere. Posto che la probabilità di avere un'eruzione cutanea (rash, R) sia P(R|M) = 0,95 per il morbillo e P(R|F) = 0,08 per l'influenza, qual è la probabilità che un bambino con rash sia affetto da morbillo?

dati disponibili: P(R|M) = 0,95 ; P(R|F) = 0,08; P(F) = 0,90 ; P(M) = 0,10

la probabilità richiesta è:

P(M|R) = 0,95 · 0,10/(0,95 · 0,10 + 0,08 · 0,90) = 0,57

esempio 4: Un medico deve fare una immediata valutazione del rischio di colera sulla base dell'osservazione di un ragazzo che presenta una riduzione della temperatura corporea. La probabilità dell'abbassamento di temperature per il colera è P(C) = 0.9; per il tifo P(T) = 0,1; per altre patologie P(A) = 0. L'endemicità di queste patologie è: E(C) = 0,05; E(T) = 0,005; E(A) = 0,95

La probabilità di avere il colera in base all'endemicità è: P(E|C) = 0,9 · 0,05; = 0,045

la probabilità di avere il tifo in base all'endemicità è: P(E|T) = 0,1 · 0,005; = 0,0005

la probabilità di avere un'altra patologia in base all'endemicità è: P(E|A) = 0 · 0,95 = 0

Le probabilità complessive per tutte le patologie sono : 0,045 + 0,0005 + 0 = 0,0455

La probabilità di avere il colera è: P(C|E) = 0,045/0,0455 = 0,98 = 98%

il teorema di Bayes

Quanto discusso, ci ha permesso di esaminare alcuni esempi in cui le probabilità si intrecciano in modo semplice con i dati statistici. Ora esamineremo le applicazioni del teorema di Bayes in una forma più completa: dove sono compresi anche risultati derivanti da falsi positivi e falsi negativi.

inferenza bayesiana

dove la simbologia ha questo significato:
P(H) = probabilità che sia vera l'ipotesi da testare;
P(-H) = probabilità che l'ipotesi H sia falsa;
P(O|H) = probabilità che l'osservazione O sia riscontrata se l'ipotesi H è vera;
P(O|-H) = probabilità che l'osservazione O sia riscontrata se l'ipotesi H è falsa;
P(H|O) = probabilità a posteriori che l'ipotesi H sia vera se l'osservazione O è positiva;

prevalenza: della malattia il numero dei soggetti malati presenti nella popolazione: una prevalenza dello 0.5% significa che 5 persone su mille sono affette dalla malattia, ecc.

specificità: la capacità di un test di individuare i soggetti che presentano la malattia. La sensibilità è importante quando è necessario massimizzare i veri positivi, come nel caso di malattie gravi, a decorso rapido, in cui un intervento tempestivo può essere cruciale. Se un test molto specifico risulta positivo, si può ragionevolmente ritenere che la malattia è presente e si può generalmente procedere con i trattamenti previsti. Viceversa, se un test è poco specifico, si rischia di ottenere un falso positivo (viene segnalata una patologia inesistente).

sensibilità: la capacità di un test di individuare i soggetti che non presentano la malattia. La specificità è importante quando è necessario essere sicuri della diagnosi fatta, come nel caso di una diagnosi alla quale segue un intervento di chirurgia demolitiva. Se un test molto sensibile risulta negativo, si può ragionevolmente ritenere che la malattia non c'è e non occorre generalmente procedere con ulteriori esami. Viceversa, se un test è poco sensibile, si rischa di ottenere un falso negativo (la patologia c'è ma non viene individuata).

specificità sensibilità prevalenza

dalle definizioni di prevalenza, sensibilità e specificità, ne deriva che:

osservazione

P(H) = prevalenza; P(O|H) = sensibilità; P(O|-H) = 1 - specificità

poiché la specificità (alta) indica la probabilità che il test sia positivo per i soggetti malati, per ottenere la probabilità in cui il test è negativo nei soggetti malati, occorre calcolare il complemento a 1.

un aiuto per ricordare
Pico de Paperis

In un boschetto vicino ad un lago ci sono cigni e oche. Un naturalista miope riconoscerà i cigni e le oche, però alcuni cigni sfuggiranno al suo conteggio. Questo è un esempio di elevata specificità (distinguere i cigni dalle oche) accompagnato da scarsa sensibilità.

Un cacciatore di frodo può vedere tutte le oche, però sparerà anche a qualche cigno di piccola taglia. Questo è un esempio di elevata sensibilità accompagnato da scarsa specificità.

esempio 5: La probabilità che una donna abbia un cancro alla mammella è dell'1% ; il test basato sulla secrezione mammaria ha una sensibilità dell'80% ed una specificità del 90,4% Si chiede di quantificare la probabilità che un test positivo sia realmente indice di cancro al seno.

Dai dati risulta che:
P(H) = 1% = 0,01 = 1 donna malata ogni 100;
P(-H) = 1 - P(H) = 1 - 0,01 = 0,99 = 99 donne sane ogni 100;
P(O|H) = 80% = probabilità di riscontrare O se l'ipotesi è vera (sensibilità);
P(O|-H) = 1 - 0,904 = 0,096 probabilità di riscontrare O se l'ipotesi è falsa (specificità)

applicando la formula di Bayes, risulta:

P(H|O) = 0.008/(0,008 + 0,99 · 0,96) = 0,008/0,103 = 0,078 = 7,8%

Questo significa che su 100 donne che si sottopongono al test con le caratteristiche indicate, solo 8 donne su 100 hanno realmente il cancro e non 80 su 100.

esempio 6: La probabilità che una persona con più di cinquant'anni senza sintomi abbia un cancro colorettale è dello 0,3%. Se una persona ha un cancro colorettale, c'è una probabilità del 50% che il test del sangue occulto nelle feci risulti positivo (sensibilità = 50%). La specificità del test è del 97%; questo significa che c'è una probabilità del 3% che il test del sangue occulto nelle feci risulti comunque positivo anche in assenza di un cancro colorettale. Considerando una persona untracinquentenne, senza sintomi, che risulti positiva al test del sangue occulto nelle feci, qual è la probabilità che abbia veramente un cancro colorettale?

Dai dati risulta che:
P(H) = 0,3% = 0,003 = 3 persone malate ogni 1000;
P(-H) = 1 - P(H) = 1 - 0,003 = 0,997 = 997 persone sane ogni 1000;
P(O|H) = 50% = probabilità di riscontrare O se l'ipotesi è vera ;
P(O|-H) = 1 - specificità = 1 - 0,97 = 0,03 probabilità di riscontrare O se l'ipotesi è falsa

applicando la formula di Bayes, risulta:

P(H|O) = 0.0015/0,0314 = 0,048 = 4.8%

Questo significa che su un campione di 100 persone, la probabilità di un vero positivo è circa 5 casi, mentre i falsi positivi sono 95.

esempio 7: L'incidenza del cancro è di 5 persone su 1000. Un dato marcatore tumorale ha una sensibilità del 95% ed una specificità del 95% . Quante persone sottoposte al marcatore hanno realmente un cancro?

Dai dati risulta che:
P(H) = 0,5% = 0,005 = 5 persone malate ogni 1000;
P(-H) = 1 - P(H) = 1 - 0,005 = 0,995 = 995 persone sane ogni 1000;
P(O|H) = 95% = probabilità a priori di riscontrare O se l'ipotesi è vera;
P(O|-H)= 1- specificità = 1 - 95% = 5% = probabilità a priori di riscontrare O se l'ipotesi è falsa

applicando la formula di Bayes, risulta:

P(H|O) = 0.00475/0,05225 = 0,09 = 9%

Questo significa che un risultato positivo del test comporta una probabilità di essere malato del 9%; quindi su 1000 persone con il test positivo saranno 90 i veri positivi e 910 i falsi positivi. Però, c'è la possibilità di essere malati e tuttavia risultare negativi al test.

L'importanza della sensibilità di un test diagnostico

test diagnostici: sensibilità
I tre grafici riportano in ordinate il numero di persone, N(m), in cui è presente una certa concentrazione di marcatore tumorale, m; in ascisse sono indicate le concentrazioni del marcatore. Il grafico (a) schematizza il test ideale in cui la differenza di concentrazione del marcatore è netta e permette di distinguere tra malato e non malato; il grafico (b) si riferisce ad un test inutile perché il marcatore è inadatto; il grafico (c) si riferisce alla tipica situazione reale dove c'è una zona di sovrapposizione fra malato e non malato.

esempio 8: Un test, T, per individuare anticorpi anti-HIv ha una sensibilità del 100% ed una specificità del 99,7%. Posto che la prevalenza dell'infezione da HIV è del 3 per mille, si chiede il valore diagnostico per un test positivo.

Dai dati risulta che:
P(H) = 0,3% = 0,003 = 3 persone malate ogni 1000;
P(-H) = 1 - P(H) = 1 - 0,003 = 0,997 = 997 persone sane ogni 1000;
P(O|H) = 100% = probabilità a priori di riscontrare O se l'ipotesi è vera;
P(O|-H)= 1 - 0,997 = 0,003 = probabilità a priori di riscontrare O se l'ipotesi è falsa

applicando la formula di Bayes, risulta:

P(H|O) = 0.003/0,0059 = 0,50

Questo significa che un risultato positivo del test comporta una probabilità di essere malato del 50%; quindi su 100 persone con il test positivo saranno 50 i veri positivi e 50 i falsi positivi.

osservazione Questo risultato è abbastanza sorprendente in quanto abbiamo la masssima sensibilità. D'altra parte, con una prevalenza del 0,3% è facile che si abbia un elevato numero di falsi positivi (se la prevalenza fosse maggiore, per es. 1%, i veri positivi sarebbero il 77%). Un test ad elevata sensibilità è utile quando è necessario fugare ogni dubbio. in una trasfusione è imperativo che il sangue non sia affetto da HIV, pertanto se un prelievo risulta positivo, viene comunque distrutto a precindere dalla possibilità che sia un falso positivo. Nel caso della ricerca di altre patologie, il risultato positivo viene sottoposto ad un ulteriore esame (con maggior specificità) di conferma.

esempio 9: Il 20% degli uomini di età compresa fra 50 e 60 anni presenta disturbi cardiaci. Il 25% degli uomini di età compresa fra 50 e 60 anni hanno avuto parenti maschi deceduti per infarto. L'8% degli uomini di età compresa fra 50 e 60 anni che non soffre di disturbi cardiaci ha avuto parenti morti per infarto (si faccia attenzione: l'8% non è la specificità, bensì il valore diretto dei falsi positivi, quindi non si deve calcolare il complemento a 1)

Dai dati risulta che:
P(H) = 20% = 0,2 = 2 persone ogni 10 soffrono di disturbi cardiaci;
P(-H) = 1 - P(H) = 1 - 0,2 = 0,8 = 8 persone sane ogni 10 ;
P(O|H) = 25% = probabilità a priori di riscontrare O se l'ipotesi è vera (specificità);
P(O|-H) = 8% = probabilità a priori di riscontrare O se l'ipotesi è falsa (falsi negativi, sensibilità)

applicando la formula di Bayes, risulta:

P(H|O) = 0.05/0,114 = 0,438 = 44%

Questo significa che un maschio di età compresa fra 50 e 60 anni e sofferente di problemi cardiaci, ha il 44 per cento di probabilità di avere un infarto.

Si può osservare che la prevalenza del 20% ha un valore statistico, però i dati basati sulla relazione di parentela sono aleatori: la relazione di parentela può avere una certa rilevanza fra fratelli, genitori e nonni; tuttavia è meno corretta per parentele oltre il 2° grado.

come calcolare la sensibilità e la specificità di un test

patologia non patologia totali
Pap Test + 125 86 211
Pap Test - 126 644 770
totali 251 730 981
Per mostrare come viene calcolata la sensibilità e la specificità di un test, faremo riferimento ad uno studio* condotto in Brasile. Per la diagnosi di lesioni della cervice uterina, è stato eseguito il Pap test in un campione di 981 donne. I risultati del Pap test sono stati confrontati con la diagnosi istologica dopo biopsia (cfr. tabella a destra).

Il rapporto fra risultati positivi al Pap test e risultati complessivi, porge: 125/251 = 0,49 (sensibilità);
Dunque, il 49% delle donne con cervice alterata darà un Pap test anomalo: la sensibilità del test è del 49%, sicché in caso di Pap test negativo, la probabilità che si tratti di un falso negativo è elevata (circa il 51%): prima di escludere la presenza di una lesione cervicale è prudente fare altri test di conferma,

Il rapporto fra risultati negativi al Pap test e risultati complessivi, porge: 644/730 = 0,88 (specificità)
Dunque, l'88% delle donne con cervice normale darà un Pap test normale: la specificità del test è dell'88%, sicché in caso di Pap test positivo, la probabilità che si tratti di un falso positivo è contenuta (circa il 12%).

* Longatto Filho A, Pereira SMM, Di Loreto C, et al. DCS liquid-based system is more effective than conventional smears to diagnosis of cervical lesions: study in high-risk population with biopsy-based confirmation. Gynecol Oncol 2005;97:497-500 [Medline]

una questione di risorse

osservazioneUn elemento critico del terorema di Bayes applicato ai test diagnostici consiste nel fatto che chi si sottopone ad un test lo fa per qualche ragione e non è quindi un campione rappresentativo della popolazione. Così, il prodotto (probabilità di essere positivi ad un test) x (prevalenza dell'elemento individubile dal test) potrebbe portare a sottostimare il rischio.

esempio 10 : da uno studio condotto in Brasile su un campione di 981 donne, è risultato che un Pap Test ha una sensibilità del 49% ed una specificità dell'88%. Se ripetesimo l'esperimento - che ha mostrato una sensibilità pari a 125/251 su altri 100 campioni analoghi, quali valori di sensibilità , se, e specificità, sp, potremmo trovare?

la risposta si ottiene calcolando i limiti fiduciali 95%: se ± SQR[se/(1-se)/N] = 0,498 ± 2· SQR[0,498(1-0,498)/251] = 0,498 ± 2· 0,498
questo significa che la sensibilità del test 95 volte su 100 sarebbe compresa fra il 44% e 56%. Analogo calcolo si può fare per la specificità.

Il normale atteggiamento di chi si sottopone ad un test ottenendo una risposta incerta o inattesa, è ripetere il test, effettuarne uno diverso, consultare un altro medico, ecc. , senza preoccuparsi se il problema abbia una elevata prevalenza o meno. Tuttavia poiché le risorse del SSN sono limitate, devono necessariamente conformarsi a linee guida basate sulla minimizzazione del rischio, non sulla sua eliminazione. Per esempio, istituire una campagna preventiva anticancro sottoponendo ad un test tutta la popolazione ultracinquantenne avrebbe certamente una corretta validità statistica, però comporterebbe una quantità enorme di falsi positivi ed un uso inappropriato delle risorse.

esempio 11 : Dai dati storici risulta che il 2% delle donne che effettuano il test è in gravidanza. Un test, T, è in grado di individuare con una probabilità del 90% se una donna è realmente incinta e d'altra parte, può risultare una falsa gravidanza per lo 0.5% dei casi. Si chiede il valore predittivo per un test positivo.

Dai dati risulta che:
P(H) = 2% = 0,02 = 2 donne in gravidanza ogni 100 che effettuano il test;
P(-H) = 1 - P(H) = 1 - 0,02 = 0,98 = 98 donne non in gravidanza ogni 100;
P(O|H) = 90% = probabilità a priori di riscontrare O se l'ipotesi è vera (specificità);
P(O|-H)= 0,5% = probabilità a priori di riscontrare O se l'ipotesi è falsa

applicando la formula di Bayes, risulta:

P(H|O) = 0.018/0,0229 = 0,786 = 79%

Questo significa che un risultato positivo del test comporta una probabilità di essere incinta del 79%


osservazioneUn test diagnostico ideale dovrebbe essere altamente sensibile e altamente specifico, però un simile test non esiste. Può doversi scagliere tra privilegiare la sensibilità o la specificità. Un test poco sensibile è pericoloso quando non individuare la malattia (falso negativo) ha conseguenze pericolose per la tempestività del trattamento; un test poco specifico è critico in quanto il falso positivo preoccupa il paziente e costituisce una fonte di spesa inutile per il SSN. Dunque, l'optimum si avrebbe con un test molto sensibile, che però associato ad una minor specificità porta a costi elevati per il SSN.


scopi del campionamento1 metodi di campionamento2 errori di campionamento3 variabilità di una stima4 test di significatrività5 6 metanalisi7
home page HOME PAGE

Marcello Guidotti, copyright 2012 - 2013
Le fotografie sono tratte da siti web e sono, o possono ritenersi, di pubblico dominio purché utilizzate senza fini di lucro. Le immagini di prodotti presenti nel sito hanno unicamente valenza esemplificativa oltre che, eventualmente, illustrare messaggi fuorvianti e non vi è alcun richiamo diretto o indiretto alla loro qualità e/o efficacia il cui controllo è affidato alle autorità regolamentatorie.