Sondaggio (statistica)

Il sondaggio è un metodo statistico, volto a valutare le proporzioni di diverse caratteristiche di una popolazione a partire dallo studio di una parte della popolazione, chiamata campione. Le proporzioni sono determinate con dei margini di errore, soggetti ad attenti studi per verificarne la veridicità.

Teoria

Sia un campione aleatorio di grandezza n {\displaystyle n} e   x ¯ {\displaystyle {\bar {x}}}   la media. Il teorema del limite centrale dice che se n {\displaystyle n} è grande allora x ¯ {\displaystyle {\bar {x}}} segue approssimativamente una distribuzione normale con media μ {\displaystyle \mu } (la media della popolazione) e varianza   σ 2 n {\displaystyle {\frac {\sigma ^{2}}{n}}}   dove   σ 2 {\displaystyle \sigma ^{2}}   è la varianza degli elementi della popolazione[1] (e σ {\displaystyle \sigma } la sua deviazione standard). L'intervallo di confidenza al 95%[2] è   x ¯ ± 1.96 σ n {\displaystyle {\bar {x}}\pm 1.96\;{\frac {\sigma }{\sqrt {n}}}}  . Questo intervallo può essere calcolato se si conosce σ 2 {\displaystyle \sigma ^{2}} . Lo stimatore senza bias è   σ ^ 2 = n s 2 n 1 {\displaystyle {\hat {\sigma }}^{2}={\frac {ns^{2}}{n-1}}}   dove s 2 {\displaystyle s^{2}} è la varianza degli elementi del campione e s {\displaystyle s} la sua deviazione standard[3] . L'intervallo di confidenza diventa allora   x ¯ ± 1.96 s n 1 {\displaystyle {\bar {x}}\pm 1.96\;{\frac {s}{\sqrt {n-1}}}}  .

Si n {\displaystyle n} è piccolo e la popolazione segue una legge normale allora l'intervallo di confidenza si ottiene utilizzando la distribuzione di Student.

Esempio

Si desidera calcolare il contenuto medio di vitamina C nelle arance rosse. L'analisi di un campione aleatorio di 100 arance rivela un contenuto medio di 60 mg (per 100 g di frutto) con una deviazione standard di 5 mg. L'intervallo di confidenza al 95% è allora:

60 ± 1.96 5 99 = { 60 + 1.96 5 99 = 60.98 60 1.96 5 99 = 59.02 {\displaystyle 60\pm 1.96\;{\frac {5}{\sqrt {99}}}=\left\{{\begin{matrix}60+1.96\;{\frac {5}{\sqrt {99}}}=60.98\\60-1.96\;{\frac {5}{\sqrt {99}}}=59.02\end{matrix}}\right.}

Si può concludere che, con una confidenza del 95%, il contenuto medio di vitamina C si trova tra 59.02 mg e 60.98 mg.

Un'analisi di 100 arance può costare troppo cara. Se si prendono solo 10 arance e si suppone che la distribuzione della vitamina C segue una legge di Student allora l'intervallo di confidenza è:

60 ± 2.228 5 9 = { 60 + 2.228 5 9 = 63.71 60 2.228 5 9 = 56.29 {\displaystyle 60\pm 2.228\;{\frac {5}{\sqrt {9}}}=\left\{{\begin{matrix}60+2.228\;{\frac {5}{\sqrt {9}}}=63.71\\60-2.228\;{\frac {5}{\sqrt {9}}}=56.29\end{matrix}}\right.}

Note

  1. ^ In statistica la popolazione è la totalità degli elementi che si desiderano conoscere.
  2. ^ Un intervallo di confidenza al 95% è da interpretare nel seguente modo. Se si effettuano simultaneamente 100 sondaggi sul medesimo tema si possono calcolare 100 intervalli di confidenza. La proporzione della popolazione si trova in 95 di questi intervalli e in 5 è all'esterno. La fiducia è del 95%.
  3. ^ s 2 {\displaystyle s^{2}} potrebbe anche designare la varianza campionaria, cioè lo stimatore senza bias della varianza della popolazione. Se s c 2 {\displaystyle s_{c}^{2}}   è la varianza campionaria, si ha:   s c 2 = n s 2 n 1 {\displaystyle s_{c}^{2}={\frac {ns^{2}}{n-1}}}   .

Bibliografia

  • A.M. Mood, F.A. Graybill, D.C. Boes, Introduzione alla statistica, Mc Graw-Hill Italia, 1991

Voci correlate

  • Piano di campionamento
  • Campionamento statistico
  • Test parametrico
  • Sondaggio d'opinione

Altri progetti

Altri progetti

  • Wikiquote
  • Wikizionario
  • Wikimedia Commons
  • Collabora a Wikiquote Wikiquote contiene citazioni sul sondaggio
  • Collabora a Wikizionario Wikizionario contiene il lemma di dizionario «sondaggio»
  • Collabora a Wikimedia Commons Wikimedia Commons contiene immagini o altri file sul sondaggio
Controllo di autoritàLCCN (EN) sh99001768 · GND (DE) 4005227-8 · J9U (ENHE) 987007563882905171
  Portale Matematica
  Portale Sociologia