scopi del campionamento

In uno studio statistico-epidemiologico, indipendentemente dagli obiettivi proposti, è raramente possibile esaminare ogni singolo individuo dell'intera popolazione. Infatti, spesso si è limitati dalle risorse disponibili (economiche, di personale, di laboratori ecc.); d'altra parte, anche supponendo di disporre di risorse illimitate, l'intera popolazione da studiare non è fisicamente raggiungibile o addirittura può non essere del tutto nota.

L'esame di un campione piuttosto che dell'intera popolazione, consente di superare questi problemi. Scegliere un campione da una popolazione significa effettuare un "campionamento". Esaminare ogni singolo individuo della popolazione significa effettuare un censimento; esaminare gli individui di un campione significa effettuare una indagine (o inchiesta o sondaggio, in inglese survey).

Il principale obiettivo di un campionamento è quello di raccogliere dati che consentiranno di generalizzare all'intera popolazione i risultati ottenuti dal campione. Questo processo di generalizzazione è detto inferenza.

campionamento
Da una popolazione viene estratto un campione e, con adatti test, ne viene controllata la validità: se è positiva, si può inferire che il campione rappresenta con un certo errore la popolazione da cui è stato estratto; se il test è negativo, occorre procedere ad un nuovo campionamento.

In qualsiasi studio basato su un campione, si deve tener presente che non si otterranno mai risultati completamente certi. Per valutare la validità di uno studio campionario è indispensabile tener conto di vari fattori, principalmente: i criteri di scelta della popolazione in studio, il metodo con cui si è selezionato il campione, il periodo di osservazione, i metodi adottati per identificare i casi di malattia, le tecniche di analisi, la precisione delle misure effettuate.

Supponiamo di aver eseguito un'indagine campionaria; esaminando i dati forniti dal campione al fine di trarne delle conclusioni, occorre formulare due domande fondamentali:

La risposta a queste due domande deriva dai concetti di validità interna e di validità esterna di uno studio statistico.

flow chart campionamento Per semplicità, supponiamo che un certo studio sia provvisto di eccellente validità interna: conosciamo con accuratezza le caratteristiche del campione che abbiamo esaminato. Questo significa che le conclusioni che ne abbiamo derivate sono certamente valide per gli individui del campione, ma non possiamo dire se e quanto tali conclusioni siano generalizzabili alla popolazione da cui il campione è stato estratto (la soluzione a questo problema verrà discussa avanti).

Per ora limitiamoci a due considerazioni intuitive:


esempio 1: si vuole conoscere l'età media di un gruppo di 600 persone che frequentano un villaggio vacanze. Poiché non abbiamo la possibilità di accedere ai documenti di tutti gli ospiti, estraiamo un campione di 6 soggetti e offrendogli un omaggio per la disponibilità gli poniamo la domanda e calcoliamo la loro media. É evidente che, con questo metodo, avremo un valore che si potrà scostare anche di parecchi anni dalla media della popolazione da cui essi provengono (cioè il gruppo di 600). Ma se intervistiamo altre persone e le aggiungiamo alle prime, la nuova media ottenuta sarà più vicina a quella vera; cioè, l'accuratezza della nostra stima aumenterà con il numero di persone intervistate, però non otterremo una misura perfetta finché non avremo intervistato tutti gli ospiti.

esempio 2: si vuole effettuare un'indagine sui rapporti fra allergia e polline. Nel territorio d'indagine è presente un paese che conta 20.000 abitanti e 180 ville abitate da 500 persone. La popolazione di interesse è costituita da tutte le persone presenti nel territorio; l'unità di analisi è il singolo individuo. Se il campione fosse selezionate tra i soli abitanti del paese, non sarebbe rappresentativo; lo stesso si avrebbe se considerassimo tutti gli abitanti esterni al paese. Un campione più rappresentativo, composto da 100 persone, sarà invece rappresentato dalle singole frazioni di popolazione:

frazione abitanti di paese = 100 · 20.000/(20.000 + 500) = 97 persone

frazione esterna al paese = 100 · 500/(20.000 + 500)= 3 persone

E' evidente che un campione di 100 persone è piuttosto ridotto; tuttavia, anche se esaminassimo il più ampio campione possibile, per esempio costituito dal 90% degli individui, questo non sarebbe perfettamente rappresentativo della popolazione, in quanto tra le circa 19.900 persone non esaminate potrebbero riscontrarsi le più evidenti manifestazioni allergiche.

In sostanza, con qualunque metodo si effettui il campionamento, si otterranno dal campione dei risultati che quasi certamente si discostano (poco o tanto) dalla "vera" misura della popolazione. Questo perché non possiamo mai essere sicuri che il campione rappresenti perfettamente la popolazione da cui è stato estratto.

osservazioneL'errore di campionamento è rappresentato dalla differenza tra i risultati ottenuti dal campione e la vera caratteristica della popolazione che vogliamo stimare.
L'errore di campionamento non può mai essere determinato con esattezza, in quanto la "vera" caratteristica della popolazione è (per definizione) ignota. Esso tuttavia può essere contenuto entro limiti più o meno ristretti adottando appropriati metodi di campionamento; inoltre, esso può essere stimato: ciò significa che, con adatti metodi statistici, si possono determinare i limiti probabili della sua entità.


1 metodi di campionamento2 errori di campionamento3 variabilità di una stima4 test di significatività5 teorema di Bayes6 meta-analisi7
home page HOME PAGE

Marcello Guidotti, copyright 2003
questa pagina può essere riprodotta su qualsiasi supporto o rivista purché sia citata la fonte e l'indirizzo di questo sito (ai sensi degli artt. 2575 e 2576 cc. Legislazione sul diritto d'autore). Le fotografie sono tratte da siti web e sono, o possono ritenersi, di pubblico dominio purché utilizzate senza fini di lucro. Le immagini di prodotti presenti nel sito hanno unicamente valenza esemplificativa oltre che, eventualmente, illustrare messaggi fuorvianti e non vi è alcun richiamo diretto o indiretto alla loro qualità e/o efficacia il cui controllo è affidato alle autorità regolamentatorie.