Intervalul de încredere pentru estimarea mediei (varianța este cunoscută) în MS Excel - compatibil cu Microsoft

MS EXCEL construi un interval de încredere pentru estimarea valorilor medii ale distribuției în cazul valorii cunoscute a dispersiei.

Articolul Statistică, estimările de eșantionare de distribuție și un punct în MS Excel oferă o definiție a punctului estimarea parametrului de distribuție (punctul estimatorul). Cu toate acestea, din cauza aleatorie punct de eșantionare estimare nu coincide cu parametrul evaluat și mai rezonabile pentru a indica intervalul în care parametrul poate fi necunoscut la x1 probă observată. x2. xn. Prin urmare, scopul utilizării intervalelor de încredere este posibil pentru a scăpa de incertitudine și de a face posibilă o inferență statistică mai util.







Notă. Procesul rezumarea mostră de date. ceea ce conduce la o declarație probabilistic despre întreaga populație. numitul terminal de statistică (inferență statistică).

TIP. Pentru a construi intervalul de încredere, trebuie să știm următoarele concepte:

Din păcate, intervalul în care parametrul necunoscut poate fi coincide cu cel mai mare număr posibil de variație a acestui parametru, deoarece selecția corespunzătoare. și, prin urmare, parametrul de evaluare. Puteți fi preparat cu o probabilitate nenulă. Prin urmare, găsirea de limite este necesară limitarea modificărilor unui parametru necunoscut, cu o probabilitate predeterminată în avans.

Definiție: interval de încredere este numit un interval de aleatoriu kotoryys schimbare variabilă probabilitate dată, va acoperi valoarea reală a parametrului de distribuție estimat.

Aceasta se numește probabilitatea unui anumit nivel de încredere (sau probabilitate de încredere).

Valoarea utilizată în mod obișnuit la nivel de încredere de 90%; 95%; 99%, cel puțin 99,9%, etc. De exemplu, urovendoveriya 95% înseamnă că un eveniment a cărui probabilitate 1-0,95 = 5%, cercetătorul consideră că este improbabil sau imposibil.

Notă: Probabilitatea acestui eveniment este numit un nivel suplimentar de semnificație sau o eroare de primul tip. Pentru detalii, a se vedea. Articolul Nivelul de semnificație și fiabilitate în MS Excel.

Desigur, alegerea nivelului de încredere depinde în întregime de sarcina la îndemână. Astfel, gradul de încredere și escortarea la fiabilitatea aeronavei, desigur, trebuie să fie mai mare decât gradul de încredere în cumpărător fiabilitatea becului electric.

Declarația problemei

Să presupunem că de la o populație având o distribuție normală derivată mărimea eșantionului n. Se presupune că abaterea standard a acestei distribuții este cunoscută. Este necesar, pe baza acestui eșantion pentru a estima valoarea medie necunoscută a distribuției (μ, așteptarea) și construi un dvuhstoronniydoveritelny interval corespunzător.

estimare punctuală

După cum știm din teorema limită centrală. statistică

Intervalul de încredere pentru estimarea mediei (varianța este cunoscută) în MS Excel - compatibil cu Microsoft
(Denotat HSR) este o estimare imparțială a mediei populației și are N distribuție (μ; σ 2 / n).

Notă: Ce trebuie să faceți dacă doriți să construiască un interval de încredere, în cazul distribuției, care nu este yavlyaetsyanormalnym? În acest caz, vine pentru a ajuta la teorema limită centrală. care prevede că pentru o suficient de mare a dimensiunii eșantionului n din distribuția nu yavlyayuschemsyanormalnym. distribuția selectivă a statistic HSR va corespunde aproximativ cu o distribuție normală cu parametrii N (μ; σ 2 / n).

Deci, punctul de distribuție otsenkasrednegoznacheniya avem - aceasta este valoarea medie a eșantionului. și anume XCP. Acum, pentru intervalul de încredere.

interval de încredere constructii

De obicei, noi știm distribuția și parametrii săi, putem calcula probabilitatea ca o variabilă aleatoare va lua valoarea ne intervalul specificat. Acum facem contrariul: vom găsi intervalul în care o variabilă aleatoare va cădea cu o anumită probabilitate. De exemplu, proprietățile distribuției normale este cunoscut faptul că, cu o probabilitate de 95%, o variabilă aleatoare normal distribuită. se încadrează în intervalul de aproximativ +/- 2 abateri standard ale mediei (a se vedea. articol despre o distribuție normală). Acest interval, va servi ca un prototip pentru intervalul de încredere.

Acum vom înțelege dacă știm de distribuție, pentru a calcula acest interval? Pentru a răspunde la întrebarea trebuie să specifice forma de distribuție și parametrii săi.

Formularul de distribuție noi știm - aceasta este o distribuție normală (amintiți-vă că vorbim despre raspredeleniistatistikiHsr selectivă).

Parametrul μ este necunoscut (aceasta trebuie doar să fie estimată folosind un interval de încredere), dar avem XCP sa scor calculat pe baza unui eșantion care poate fi folosit.







Al doilea parametru - deviația standard a srednegobudem de eșantionare presupuse cunoscute. este egal cu sigma / √n.

pentru că noi nu știm μ, atunci vom construi o serie de +/- 2 abateri standard de la medie nu este. așa cum se cunoaște din evaluarea HSR. Ie la un calcul interval de încredere nu presupunem că HSR se încadrează într-un interval de +/- 2 abateri standard de la μ cu o probabilitate de 95%, și presupunem că intervalul +/- 2 abateri standard de la HSR, cu o probabilitate de 95% va acoperi μ - media generală populația din care a fost luată proba. Aceste două afirmații sunt echivalente, dar a doua declarație ne permite să construim intervale de încredere.

În plus, introduceți o valoare: o variabilă aleatoare distribuită în mod normal. cu o probabilitate de 95% în intervalul 1,960 +/- deviații standard, mai degrabă decât +/- 2 abateri standard. Acest lucru poate fi calculat folosind formula NORM.ST.OBR = ((1 + 0,95) / 2). cm. Exemplu Fișier interval foaie.

Intervalul de încredere pentru estimarea mediei (varianța este cunoscută) în MS Excel - compatibil cu Microsoft

Acum putem formula o declarație probabilistic care ne va servi pentru formarea intervalului de încredere:
„Posibilitatea ca medie a populației este media eșantionului în termen de 1.960“, a probei medie deviație standard“. egală cu 95%. "

Valoarea de probabilitate, a declarat aprobare, numele are un nivel special de încredere, care este asociat cu un nivel de semnificație α (alfa), prin nivelul de expresie simpla de încredere 1 = -α. În acest caz, nivelul de semnificație a = 1-0,95 = 0,05.

Acum, pe baza acestei afirmații probabiliste scrie expresia pentru calcularea intervalului de încredere:

Intervalul de încredere pentru estimarea mediei (varianța este cunoscută) în MS Excel - compatibil cu Microsoft

Notă. Upper α / 2 cuantila determină lățimea intervalului de încredere în mediu otkloneniyahvyborochnogo standardul. superioară Distribuția α / 2-kvantilstandartnogonormalnogo este întotdeauna mai mare decât 0, care este foarte convenabil.

În acest caz, α = 0,05, superior α / 2-este 1,960 din fracții. Pentru alte niveluri de semnificație α (10%, 1%) mai mare α / 2 kvantilZα / 2 poate fi calculată folosind formula NORM.ST.OBR = (1-α / 2), sau în cazul în care nivelul de încredere este cunoscut. NORM.ST.OBR = ((1 + ur.doveriya) / 2).

De obicei, în construcția de intervale de încredere pentru estimările media utilizează numai subunitatea superioară / 2-cuantila și nu utilizează inferioară α / 2 quantile. Acest lucru este posibil deoarece distribuția standartnoenormalnoe este simetrică față de axa x (distribuția sa de densitate este simetrică față de valoarea medie, adică, 0). Prin urmare, nu este necesar să se calculeze inferioară α / 2-cuantila (denumit pur și simplu a / 2 quantile) ca este egal cu superior α / 2-cuantila cu semnul minus.

Să ne amintim că, în ciuda formei distribuției x HSR valoare aleatoare corespunzătoare este alocat priblizitelnonormalno N (μ; σ 2 / n) (. Vezi articolul despre CLT). Prin urmare, în general, expresia de mai sus pentru intervalul de încredere este doar o aproximare. Dacă valoarea lui x este o distribuție normală N (μ; σ 2 / n), atunci expresia pentru intervalul de încredere este corectă.

Calcularea intervalului de încredere în MS Excel

Noi rezolva problema.
timpul de răspuns electronic componentă la semnalul de intrare este o caracteristică importantă a dispozitivului. Inginerul vrea să construiască un interval de încredere pentru timpul mediu de răspuns la nivel de încredere de 95%. inginer știe din experiența anterioară că abaterea standard a timpului de răspuns este de 8 ms. Este cunoscut faptul că timpul de răspuns pentru evaluarea inginer a făcut 25 de măsurători, valoarea medie a 78 msec.

Decizie. Inginerul vrea să știe timpul de răspuns al dispozitivului electronic, dar el își dă seama că timpul de răspuns nu este fix, ca o variabilă aleatoare, care are propria distribuție. Deci, cel mai bun pe care el poate spera este de a determina parametrii și forma acestei distribuții.

Din păcate, starea distribuției timpului de răspuns sarcina unei forme noi nu știm (aceasta nu trebuie să fie normală). Secundar, adică așteptare. Această distribuție este de asemenea necunoscut. Este cunoscut doar de ei σ deviația standard = 8. Prin urmare, în timp ce noi nu putem calcula probabilitatea și de a construi un interval de încredere.

Cu toate acestea, în ciuda faptului că noi nu știm vremeniotdelnogo de distribuție de răspuns. Știm că, în conformitate cu CLT. raspredeleniesrednego timp de răspuns selectiv este aproximativ normal (presupunem că condițiile PTC sunt îndeplinite, deoarece dimensiunea eșantionului este suficient de mare (n = 25)).

Mai mult, media acestei distribuții este o valoare medie a răspunsului unității de distribuție, adică μ. O deviație standard a acestei distribuții (σ / √n) poate fi calculat prin formula = 8 / SQRT (25).

Este de asemenea cunoscut faptul că un punct de estimare inginer al parametrului μ este egal cu 78 msec (HSR) a fost obținut. Prin urmare, putem calcula acum probabilitatea, deoarece cunoaștem forma distribuției (normale) și parametrii săi (XCP și σ / √n).

Inginerul vrea să cunoască așteptările μ distribuția timpilor de răspuns. După cum sa menționat mai sus, este μ egal cu media distribuției de eșantionare a timpului mediu de răspuns. Dacă folosim o grupare N distribuție normală (HSR; σ / √n), atunci va fi dorită receptorii p în intervalul +/- 2 * σ / √n cu o probabilitate de aproximativ 95%.

Nivelul de semnificație egala 1-0,95 = 0,05.

În cele din urmă, constatăm că limita din stânga și din dreapta a intervalului de încredere.
limita de stânga = 78 NORM.ST.OBR (1-0,05 / 2) * 8 / SQRT (25) = 74.864
Limită Dreapta = 78 + NORM.ST.OBR (1-0,05 / 2) * 8 / SQRT (25) = 81.136

limita de stânga = NORM.OBR (0,05 / 2; 78; 8 / SQRT (25))
Limită Dreapta = NORM.OBR (1-0,05 / 2; 78; 8 / SQRT (25))

Răspuns. interval de încredere la nivel de încredere de 95%, iar σ = 8 msec este de 78 msec +/- 3136.

Exemplul de fișier de pe o formă foaie creată Sigma cunoscută pentru calcularea și construcția dvuhstoronnegodoveritelnogo interval pentru probele arbitrare cu σ și specifică nivelul de semnificație.

Intervalul de încredere pentru estimarea mediei (varianța este cunoscută) în MS Excel - compatibil cu Microsoft

Funcția DOVERIT.NORM ()

În cazul în care valorile de probă se află în intervalul B20: B79. iar nivelul de semnificație egală cu 0,05; formula MS EXCEL:
= AVERAGE (B20: B79) -DOVERIT.NORM (0,05; σ; COUNT (B20: B79))
a reveni limita din stânga a intervalului de încredere.

Aceeași delimitare poate fi calculată cu ajutorul formulei:
= AVERAGE (B20: B79) -NORM.ST.OBR (1-0,05 / 2) * σ / SQRT (COUNT (B20: B79))