90 luottamusväli. Luottamusväli MS EXCELin keskiarvon (varianssi tunnetaan) arvioimiseksi. Luottamusvälin muodostaminen

Matemaattisen odotuksen luottamusväli - Tämä on aikaväli, joka on laskettu tiedoista, jotka tunnetulla todennäköisyydellä sisältävät yleisen väestön matemaattisen odotuksen. Matemaattisen odotuksen luonnollinen arvio on sen havaittujen arvojen aritmeettinen keskiarvo. Siksi koko oppitunnin ajan käytämme termejä "keskiarvo" ja "keskiarvo". Luottamusvälin laskentaon liittyvissä ongelmissa vaaditaan useimmiten jotain tällaista: "Keskiarvon [arvo tietyssä ongelmassa] luottamusväli on [pienempi arvo] - [suurempi arvo]." Luottamusvälin avulla voit arvioida paitsi keskiarvoja myös tietyn ominaisuuden osuuden yleisestä populaatiosta. Oppitunnilla käsitellään keskiarvoja, hajontaa, keskihajontaa ja virhettä, joiden kautta päästään uusiin määritelmiin ja kaavoihin Otoksen ja perusjoukon ominaisuudet .

Keskiarvon piste- ja intervalliestimaatit

Jos perusjoukon keskiarvo on arvioitu luvulla (pisteellä), niin populaation tuntemattoman keskiarvon estimaatiksi otetaan havaintojen otoksesta laskettu tietty keskiarvo. Tässä tapauksessa otoskeskiarvon - satunnaismuuttujan - arvo ei ole sama kuin yleisen perusjoukon keskiarvo. Siksi näytteen keskiarvoa ilmoitettaessa on samanaikaisesti ilmoitettava näytteenottovirhe. Näytteenottovirheen mitta on keskivirhe, joka ilmaistaan ​​samoissa yksiköissä kuin keskiarvo. Siksi seuraavaa merkintää käytetään usein: .

Jos keskiarvon estimaatti on liitettävä tiettyyn todennäköisyyteen, niin perusjoukon kiinnostavaa parametria ei tule arvioida yhdellä numerolla, vaan välillä. Luottamusväli on aikaväli, jossa tietyllä todennäköisyydellä P arvioitu väestöindikaattorin arvo löytyy. Luottamusväli, jossa se on todennäköistä P = 1 - α satunnaismuuttuja löytyy, lasketaan seuraavasti:

,

α = 1 - P, joka löytyy melkein minkä tahansa tilastokirjan liitteestä.

Käytännössä perusjoukon keskiarvoa ja varianssia ei tunneta, joten populaation varianssi korvataan otosvarianssilla ja perusjoukon keskiarvo otoksen keskiarvolla. Näin ollen luottamusväli lasketaan useimmissa tapauksissa seuraavasti:

.

Luottamusvälikaavaa voidaan käyttää populaation keskiarvon arvioimiseen jos

  • perusjoukon keskihajonnan tunnetaan;
  • tai perusjoukon keskihajontaa ei tunneta, mutta otoskoko on suurempi kuin 30.

Otoskeskiarvo on puolueeton arvio populaation keskiarvosta. Otosvarianssi puolestaan ei ole puolueeton arvio populaatiovarianssista. Saadaksesi puolueettoman arvion populaation varianssista otosvarianssikaavassa, ota otoskoko n tulisi korvata n-1.

Esimerkki 1. Tietyn kaupungin sadasta satunnaisesti valitusta kahvilasta kerättiin tiedot, että niissä on keskimäärin 10,5 työntekijää keskihajonnan ollessa 4,6. Määritä 95 %:n luottamusväli kahvilan työntekijöiden lukumäärälle.

missä on standardin normaalijakauman kriittinen arvo merkitsevyystasolle α = 0,05 .

Näin ollen kahvilatyöntekijöiden keskimääräisen 95 %:n luottamusväli vaihteli välillä 9,6-11,4.

Esimerkki 2. Satunnaisotokselle 64 havainnon populaatiosta laskettiin seuraavat kokonaisarvot:

havaintojen arvojen summa,

arvojen keskiarvosta poikkeamien neliösumma .

Laske 95 %:n luottamusväli matemaattiselle odotukselle.

Lasketaan keskihajonta:

,

Lasketaan keskiarvo:

.

Korvaamme arvot luottamusvälin lausekkeeseen:

missä on standardin normaalijakauman kriittinen arvo merkitsevyystasolle α = 0,05 .

Saamme:

Näin ollen tämän otoksen matemaattisen odotuksen 95 %:n luottamusväli vaihteli välillä 7,484-11,266.

Esimerkki 3. 100 havainnon satunnaispopulaatiootoksen laskettu keskiarvo on 15,2 ja keskihajonta on 3,2. Laske odotusarvon 95 % luottamusväli ja sitten 99 % luottamusväli. Jos näyteteho ja sen vaihtelu pysyvät ennallaan ja luottamuskerroin kasvaa, kapeneeko vai leveneekö luottamusväli?

Korvaamme nämä arvot luottamusvälin lausekkeeseen:

missä on standardin normaalijakauman kriittinen arvo merkitsevyystasolle α = 0,05 .

Saamme:

.

Siten tämän näytteen keskiarvon 95 %:n luottamusväli vaihteli välillä 14,57-15,82.

Korvaamme jälleen nämä arvot luottamusvälin lausekkeeseen:

missä on standardin normaalijakauman kriittinen arvo merkitsevyystasolle α = 0,01 .

Saamme:

.

Siten tämän näytteen keskiarvon 99 %:n luottamusväli vaihteli välillä 14,37 - 16,02.

Kuten näemme, luottamuskertoimen kasvaessa myös normaalin normaalijakauman kriittinen arvo kasvaa ja sen seurauksena intervallin aloitus- ja loppupisteet sijaitsevat kauempana keskiarvosta ja siten matemaattisen odotuksen luottamusväli kasvaa. .

Ominaispainon piste- ja intervalliestimaatit

Jonkin otosattribuutin osuus voidaan tulkita osuuden pisteestimaatiksi s sama ominaisuus koko väestössä. Jos tämä arvo on liitettävä todennäköisyyteen, on ominaispainon luottamusväli laskettava s populaatiolle ominaista todennäköisyydellä P = 1 - α :

.

Esimerkki 4. Jossain kaupungissa on kaksi ehdokasta A Ja B ovat ehdokkaana kaupunginjohtajaksi. Satunnaiskyselyyn osallistui 200 kaupunkilaista, joista 46 % vastasi äänestävänsä ehdokasta A, 26 % - ehdokkaalle B ja 28 % ei tiedä ketä äänestää. Määritä 95 %:n luottamusväli ehdokasta kannattavien kaupunkilaisten osuudelle A.

Oletetaan, että meillä on suuri määrä tavaroita joidenkin ominaisuuksien normaalijakaumassa (esimerkiksi täysi varasto samantyyppisiä vihanneksia, joiden koko ja paino vaihtelee). Haluat tietää koko tavaraerän keskimääräiset ominaisuudet, mutta sinulla ei ole aikaa eikä halua mitata ja punnita jokaista vihannesta. Ymmärrät, että tämä ei ole välttämätöntä. Mutta kuinka monta kappaletta pitäisi ottaa pistokokeisiin? Ennen kuin annamme useita tähän tilanteeseen hyödyllisiä kaavoja, muistakaamme joitakin merkintöjä. Ensinnäkin, jos mittaamme koko vihannesvaraston (tätä elementtijoukkoa kutsutaan yleiseksi populaatioksi), tietäisimme kaikella käytettävissä olevalla tarkkuudella koko erän keskimääräisen painon. Kutsutaan tätä keskiarvoksi X avg.gen. - yleinen keskiarvo. Tiedämme jo, mikä on täysin määritetty, jos sen keskiarvo ja poikkeama s tunnetaan. Totta, toistaiseksi emme tiedä yleisen väestön X-keskiarvogeeniä tai s-geeniä. Voimme ottaa vain tietyn näytteen, mitata tarvitsemamme arvot ja laskea tälle näytteelle sekä keskiarvon X avg.selection että keskihajonnan Ssev. Tiedetään, että jos näytetestissämme on suuri määrä elementtejä (yleensä n on suurempi kuin 30) ja ne otetaan todella satunnaisesti, niin populaation s tuskin eroaa S-näytteestä. Lisäksi tapauksessa a normaalijakauma, voimme käyttää seuraavia kaavoja:

95 % todennäköisyydellä

99 % todennäköisyydellä

.

Yleensä todennäköisyydellä P(t)

T:n arvon ja todennäköisyysarvon P(t) välinen suhde, jolla haluamme tietää luottamusvälin, voidaan ottaa seuraavasta taulukosta:

P(t) 0,683 0,950 0,954 0,990 0,997
t 1,00 1,96 2,00 2,58 3,00

Näin ollen olemme määrittäneet, millä alueella populaation keskiarvo on (tietyllä todennäköisyydellä).

Ellei meillä ole riittävän suurta otosta, emme voi sanoa, että populaatiolla on s = S valintoja. Lisäksi tässä tapauksessa näytteen läheisyys normaalijakaumaan on ongelmallista. Tässä tapauksessa he käyttävät myös kaavassa S select:tä s:n sijaan:

mutta t-arvo on kiinteälle todennäköisyydelle P(t) riippuu alkioiden lukumäärästä näytteessä n. Mitä suurempi n, sitä lähempänä tuloksena oleva luottamusväli on kaavan (1) antamaa arvoa. Tässä tapauksessa t-arvot on otettu toisesta taulukosta (opiskelijan t-testi), jonka esitämme alla:

Studentin t-testin arvot todennäköisyyksille 0,95 ja 0,99 

n P n P
0.95 0.99 0.95 0.99
2 12.71 63.66 18 2.11 2.90
3 4.30 9.93 19 2.10 2.88
4 3.18 5.84 20 2.093 2.861
5 2.78 4.60 25 2.064 2.797
6 2.57 4.03 30 2.045 2.756
7 2.45 3.71 35 2.032 2.720
8 2.37 3.50 40 2.022 2.708
9 2.31 3.36 45 2.016 2.692
10 2.26 3.25 50 2.009 2.679
11 2.23 3.17 60 2.001 2.662
12 2.20 3.11 70 1.996 2.649
13 2.18 3.06 80 1.991 2.640
14 2.16 3.01 90 1.987 2.633
15 2.15 2.98 100 1.984 2.627
16 2.13 2.95 120 1.980 2.617
17 2.12 2.92 >120 1.960 2.576

Esimerkki 3. Yrityksen työntekijöistä valittiin satunnaisesti 30 henkilöä. Otoksen mukaan kävi ilmi, että keskipalkka (kuukaudessa) on 10 tuhatta ruplaa keskihajonnan ollessa 3 tuhatta ruplaa. Määritä yrityksen keskipalkka todennäköisyydellä 0,99. Ratkaisu: Ehdolla meillä on n = 30, X keskim. = 10 000, S = 3 000, P = 0,99. Luottamusvälin löytämiseksi käytämme Studentin t-testiä vastaavaa kaavaa. Taulukon mukaan n = 30 ja P = 0,99 saamme t = 2,756, joten

nuo. vaadittu luottamusväli 27484< Х ср.ген < 32516.

Joten todennäköisyydellä 0,99 voidaan sanoa, että väli (27484; 32516) sisältää sisällään yrityksen keskipalkan.
Toivomme, että käytät tätä menetelmää, eikä sinun tarvitse olla pöytää mukanasi joka kerta. Laskut voidaan suorittaa automaattisesti Excelissä. Napsauta Excel-tiedostossa ylävalikon fx-painiketta. Valitse sitten funktioiden joukosta "tilastollinen" tyyppi ja ikkunan ehdotetusta luettelosta - STUDAR DISCOVER. Syötä sitten kehotteeseen käänteisen todennäköisyyden arvo asettamalla kohdistin "todennäköisyys"-kenttään (eli meidän tapauksessamme todennäköisyyden 0,95 sijasta sinun on kirjoitettava todennäköisyys 0,05). Ilmeisesti laskentataulukko on suunniteltu siten, että tulos vastaa kysymykseen, kuinka todennäköisesti olemme väärässä. Syötä vastaavasti Degree of Freedom -kenttään arvo (n-1) näytteellesi.

Tilastoissa on kahdenlaisia ​​arvioita: piste- ja intervalli. Piste-arvio on yksiotostilasto, jota käytetään populaatioparametrin arvioimiseen. Esimerkiksi otoskeskiarvo on pisteestimaatti perusjoukon matemaattisista odotuksista ja otosvarianssista S 2- väestön varianssin pisteestimaatti σ 2. on osoitettu, että otoksen keskiarvo on puolueeton arvio perusjoukon matemaattisista odotuksista. Otoskeskiarvoa kutsutaan puolueettomaksi, koska kaikkien otoskeskiarvojen keskiarvo (samalla otoskoolla) n) on yhtä suuri kuin väestön matemaattinen odotus.

Otosvarianssin vuoksi S 2 siitä tuli puolueeton arvio populaatiovarianssista σ 2, otosvarianssin nimittäjä tulee asettaa yhtä suureksi kuin n – 1 , mutta ei n. Toisin sanoen populaation varianssi on kaikkien mahdollisten otosvarianssien keskiarvo.

Populaatioparametreja arvioitaessa tulee pitää mielessä, että otantatilastot, kuten , riippuvat tietyistä näytteistä. Ottaakseen tämän tosiasian huomioon, saadakseen intervalliarvio yleisen populaation matemaattinen odotus, analysoi otoskeskiarvojen jakautuminen (katso lisätietoja). Muodostetulle intervallille on ominaista tietty luottamustaso, joka edustaa todennäköisyyttä, että todellinen populaatioparametri on arvioitu oikein. Samanlaisia ​​luottamusväliä voidaan käyttää ominaisuuden osuuden arvioimiseen R ja väestön pääasiallinen jakautunut massa.

Lataa muistiinpano muodossa tai muodossa, esimerkit muodossa

Luottamusvälin muodostaminen tunnetun keskihajonnan omaavan perusjoukon matemaattiselle odotukselle

Luottamusvälin muodostaminen ominaisuuden osuudelle perusjoukossa

Tämä osio laajentaa luottamusvälin käsitteen kategorisiin tietoihin. Näin voimme arvioida ominaisuuden osuutta väestöstä R käyttämällä näyteosuutta RS= X/n. Kuten ilmoitettu, jos määrät nR Ja n(1 – p) ylittää luvun 5, binomijakauma voidaan arvioida normaaliksi. Siksi arvioida ominaisuuden osuus väestöstä R on mahdollista rakentaa intervalli, jonka luottamustaso on yhtä suuri (1 – α)х100 %.


Missä sS- ominaisuuden otososuus, yhtä suuri kuin X/n, eli onnistumisten määrä jaettuna otoskoolla, R- ominaisuuden osuus väestöstä, Z- standardoidun normaalijakauman kriittinen arvo, n- otoskoko.

Esimerkki 3. Oletetaan, että tietojärjestelmästä poimitaan näyte, joka koostuu 100 viimeisen kuukauden aikana täytetystä laskusta. Oletetaan, että 10 näistä laskuista on koottu virheellisesti. Täten, R= 10/100 = 0,1. 95 %:n luottamustaso vastaa kriittistä arvoa Z = 1,96.

Näin ollen todennäköisyys, että 4,12–15,88 % laskuista sisältää virheitä, on 95 %.

Tietylle otoskoolle ominaisen osuuden sisältävä luottamusväli näyttää laajemmalta kuin jatkuvalla satunnaismuuttujalla. Tämä johtuu siitä, että jatkuvan satunnaismuuttujan mittaukset sisältävät enemmän tietoa kuin kategorisen datan mittaukset. Toisin sanoen kategorinen data, joka ottaa vain kaksi arvoa, ei sisällä riittävästi tietoa niiden jakautumisen parametrien arvioimiseksi.

SISÄÄNlaskemalla rajallisesta populaatiosta poimittuja arvioita

Matemaattisen odotuksen estimointi. Lopullisen populaation korjauskerroin ( fpc) käytettiin vähentämään standardivirhettä kertoimella. Populaatioparametrien arvioiden luottamusväliä laskettaessa käytetään korjauskerrointa tilanteissa, joissa otoksia otetaan palauttamatta. Siten matemaattisen odotuksen luottamusväli, jonka luottamustaso on yhtä suuri kuin (1 – α)х100 %, lasketaan kaavalla:

Esimerkki 4. Havainnollistaaksemme korjauskertoimen käyttöä rajallisessa perusjoukossa, palataan laskujen keskimääräisen määrän luottamusvälin laskemisen ongelmaan, jota käsiteltiin edellä esimerkissä 3. Oletetaan, että yritys laatii 5 000 laskua kuukaudessa, ja = 110,27 dollaria, S= 28,95 dollaria N = 5000, n = 100, α = 0,05, t 99 = 1,9842. Kaavan (6) avulla saamme:

Arvio ominaisuuden osuudesta. Kun valitaan ilman palautusta, sen attribuutin osuuden luottamusväli, jonka luottamustaso on yhtä suuri (1 – α)х100 %, lasketaan kaavalla:

Luottamusvälit ja eettiset ongelmat

Populaatiota otettaessa ja tilastollisia johtopäätöksiä tehtäessä syntyy usein eettisiä kysymyksiä. Pääasia on, miten otostilastojen luottamusvälit ja pisteestimaatit sopivat yhteen. Pisteestimaattien julkaiseminen ilman niihin liittyvien luottamusvälien (yleensä 95 %:n luottamustasolla) ja otoskoon, josta ne on johdettu, määrittelyä voi aiheuttaa sekaannusta. Tämä voi antaa käyttäjälle vaikutelman, että pisteestimaatti on juuri se, mitä hän tarvitsee ennustaakseen koko populaation ominaisuuksia. On siis ymmärrettävä, että kaikessa tutkimuksessa ei tulisi keskittyä pisteestimaateihin, vaan intervalliestimaateihin. Lisäksi on kiinnitettävä erityistä huomiota otoskokojen oikeaan valintaan.

Useimmiten tilastollisen manipuloinnin kohteena ovat tiettyjä poliittisia kysymyksiä koskevien väestön sosiologisten tutkimusten tulokset. Samaan aikaan kyselyn tulokset julkaistaan ​​sanomalehtien etusivuilla ja otosvirhe ja tilastollisen analyysin metodologia jossain välissä. Saatujen pisteestimaattien paikkansapitävyyden osoittamiseksi on tarpeen ilmoittaa otoskoko, jonka perusteella ne on saatu, luottamusvälin rajat ja sen merkitsevyystaso.

Seuraava huomautus

Materiaalit kirjasta Levin et al., Statistics for Managers. – M.: Williams, 2004. – s. 448–462

Keskirajalause toteaa, että riittävän suurella otoskoolla keskiarvojen otosjakauma voidaan approksimoida normaalijakaumalla. Tämä ominaisuus ei riipu populaation jakautumisesta.

Esimerkki intervallien arvioinnista on luottamusväli. Luottamusväli on segmentti, jonka keskipiste on numeerisen ominaisuuden pisteestimaatti, mukaan lukien tietyn numeerisen ominaisuuden todellinen arvo tietyllä todennäköisyydellä. Tätä todennäköisyyttä kutsutaan luottamustodennäköisyys. Luottamusväli on siis estimaatin tarkkuuden mitta, ja luottamustodennäköisyys kuvaa sen luotettavuutta. Luottamusvälin koko riippuu siitä, minkä luotettavuustodennäköisyysarvon kokeilija on asettanut. Mitä suurempi luottamustodennäköisyys on, sitä leveämpi intervallin on oltava, jotta se sisältää numeerisen ominaisuuden todellisen arvon annetulla todennäköisyydellä. Usein valitaan luottamusarvo P d = 0,95, jolloin uskotaan, että tämä arvo on tarpeeksi suuri katsoakseen, että luottamusväli "melkein aina" kattaa todellisen arvon. Vain joskus, vastuullisten ja erittäin vastuullisten tutkimusten tapauksessa, he olettavat P d = 0,99 ja 0,999.

Luottamusvälin muodostamismenettely sisältää kaksi vaihetta:

Tallentaa todennäköisyyslaskennan jostain satunnaisfunktiosta, mukaan lukien arvion ja numeerisen ominaisuuden ero tai suhde. Tällainen funktio kuljettaa tietoa mainittujen suureiden läheisyysasteesta. On välttämätöntä, että funktion jakautumislaki tunnetaan;

Todennäköisyyslauseke muunnetaan muotoon, jossa numeerisen ominaisuuden luottamusvälin rajat esitetään eksplisiittisesti.

Esimerkkejä funktioista, joilla on tunnettu jakauma ja jotka täyttävät tarvittavat vaatimukset, ovat seuraavat:

jolla on normaalijakauma, jos arvo X on normaalijakautunut ja arvo s[X] tunnetaan;

2) (3.25)

jolla on Studentin jakauma m = N-1, jos arvo X on normaalijakautunut ja arvoa s[X] ei tiedetä etukäteen, mutta sen estimaatti voidaan saada kokeellisista tiedoista kaavan (3.23) avulla;

3) (3.26)

jolla on Pearson-jakauma m = N-1, jos arvo X on normaalijakautuma.

Muista, että jakaumaparametrit m ovat vapausasteiden lukuja. Lisäksi käytetään seuraavia merkintöjä: - aritmeettinen keskiarvo, - keskineliöarvo, joka on yhtä suuri kuin varianssin neliöjuuri, [X] - arvio keskineliöarvosta, joka määritellään varianssin puolueettoman estimaatin neliöjuurena. , N - näytekoko.

Z- ja t-funktioita voidaan käyttää luomaan luottamusväli odotukselle, kun taas funktio c 2 rakentaa luottamusvälin varianssille.


Muodostetaan matemaattiselle odotukselle luottamusväli, kunhan meillä on N:n havainnon tulokset, joilla on normaalijakautuma arvo X, ja keskineliöarvo tiedetään etukäteen riippumattomista havainnoista. Koska funktio Z on normaalijakautunut, voit määrittää z a:n arvon sopivan taulukon avulla siten, että -z a:n ja + z a:n jälkeen jää osa jakautumiskäyrän alla olevasta alueesta, joka on yhteensä yhtä suuri kuin a, kun taas sisällä [- z a ,+ z a ] alueesta on osa , joka on yhtä suuri kuin 1 - a. Juuri sanottu vastaa seuraavaa todennäköisyyslausuntoa:

Р(- z a £ £+za)= 1-a. (3,27)

(Todennäköisyys, että aaltosulkeiden sisällä oleva epäyhtälö toteutuu, on 1-a.). Muunnetaan suluissa oleva lauseke:

Р(- z a )= 1 - a

Kutsutaan arvoksi 1-a = P d luottamustodennäköisyys P d (3.28) mukaan tällä luottamustodennäköisyydellä M[X]:n luottamusväli on annettu rajoilla:

. (3.29)

Kommentti: Valitettavasti normaalijakaumataulukot on rakennettu eri tavalla eri kirjoissa. Joskus todennäköisyysintegraali annetaan

Ф(z) =

Konstantin Kravchik selittää selkeästi, mitä luottamusväli on lääketieteellisessä tutkimuksessa ja miten sitä käytetään

"Katren-Style" jatkaa Konstantin Kravchikin lääketieteellisten tilastojen sarjan julkaisemista. Kahdessa aiemmassa artikkelissa kirjoittaja käsitteli käsitteiden, kuten ja, selittämistä.

Konstantin Kravchik

Matemaatikko-analyytikko. Lääketieteen ja humanististen tieteiden tilastollisen tutkimuksen asiantuntija

Moskovan kaupunki

Hyvin usein kliinisiä tutkimuksia koskevista artikkeleista löytyy mystinen lause: "luottamusväli" (95 % CI tai 95 % CI - luottamusväli). Esimerkiksi artikkelissa saatetaan kirjoittaa: "Erojen merkityksen arvioimiseksi Studentin t-testiä käytettiin laskemaan 95 % luottamusväli."

Mikä on "95 % luottamusvälin" arvo ja miksi se lasketaan?

Mikä on luottamusväli? - Tämä on alue, jolla todellinen väestö tarkoittaa. Onko olemassa "epätosia" keskiarvoja? Tietyssä mielessä kyllä. Selitimme, että kiinnostavaa parametria on mahdotonta mitata koko populaatiossa, joten tutkijat ovat tyytyväisiä rajoitettuun otokseen. Tässä otoksessa (esimerkiksi ruumiinpainon mukaan) on yksi keskiarvo (tiety paino), jonka perusteella arvioimme keskiarvon koko populaatiossa. On kuitenkin epätodennäköistä, että otoksen (etenkin pienen) keskimääräinen paino vastaa yleisen populaation keskimääräistä painoa. Siksi on oikeampaa laskea ja käyttää väestön keskiarvojen vaihteluväliä.

Kuvittele esimerkiksi, että hemoglobiinin 95 %:n luottamusväli (95 % CI) on 110-122 g/l. Tämä tarkoittaa, että on 95 %:n todennäköisyys, että todellinen keskimääräinen hemoglobiiniarvo populaatiossa on välillä 110-122 g/l. Toisin sanoen emme tiedä väestön keskimääräistä hemoglobiiniarvoa, mutta voimme 95 % todennäköisyydellä osoittaa tälle ominaisuudelle arvoalueen.

Luottamusvälit ovat erityisen tärkeitä eroille ryhmien välisissä keskiarvoissa tai efektikokoissa, kuten niitä kutsutaan.

Oletetaan, että vertailimme kahden rautavalmisteen tehokkuutta: yhden, joka on ollut markkinoilla pitkään ja toisen, joka on juuri rekisteröity. Hoidon jälkeen arvioimme hemoglobiinipitoisuuden tutkimusryhmissä potilasryhmissä ja tilastoohjelmassa laskettiin, että ero kahden ryhmän keskiarvojen välillä oli 95 % todennäköisyydellä välillä 1,72-14,36 g. /l (taulukko 1).

Pöytä 1. Testaa riippumattomia näytteitä
(ryhmiä verrataan hemoglobiinitason mukaan)

Tämä tulee tulkita seuraavasti: joillakin uutta lääkettä käyttävillä yleisväestön potilailla hemoglobiini on keskimäärin 1,72–14,36 g/l korkeampi kuin niillä, jotka ottivat jo tunnettua lääkettä.

Toisin sanoen yleisväestössä keskimääräisten hemoglobiiniarvojen ero ryhmien välillä on näissä rajoissa 95 %:n todennäköisyydellä. Tutkijan tehtävänä on arvioida, onko tämä paljon vai vähän. Kaiken tämän pointti on, että emme työskentele yhdellä keskiarvolla, vaan arvoalueella, joten arvioimme luotettavammin parametrin eron ryhmien välillä.

Tilastopaketeissa voit tutkijan harkinnan mukaan itsenäisesti kaventaa tai laajentaa luottamusvälin rajoja. Pienentämällä luottamusvälin todennäköisyyksiä kavennetaan keskiarvoja. Esimerkiksi 90 % CI:llä keskiarvoalue (tai ero keskiarvoissa) on kapeampi kuin 95 %.

Päinvastoin, todennäköisyyden lisääminen 99 %:iin laajentaa arvoaluetta. Ryhmiä verrattaessa CI:n alaraja voi ylittää nollamerkin. Jos esimerkiksi laajensimme luottamusvälin rajoja arvoon 99 %, niin intervallin rajat vaihtelivat välillä –1 ja 16 g/l. Tämä tarkoittaa, että yleisessä populaatiossa on ryhmiä, joiden keskiarvojen ero tutkittavan ominaisuuden osalta on 0 (M = 0).

Luottamusvälin avulla voit testata tilastollisia hypoteeseja. Jos luottamusväli ylittää nolla-arvon, niin nollahypoteesi, joka olettaa, että ryhmät eivät eroa tutkittavasta parametrista, on totta. Yllä on kuvattu esimerkki, jossa laajensimme rajoja 99 %. Jossain väestössä löysimme ryhmiä, jotka eivät eronneet millään tavalla.

95 %:n luottamusväli hemoglobiinin erosta, (g/l)


Kuvassa on 95 %:n luottamusväli keskimääräisten hemoglobiiniarvojen erolle näiden kahden ryhmän välillä. Viiva kulkee nollamerkin läpi, joten nollan keskiarvojen välillä on ero, mikä vahvistaa nollahypoteesin, että ryhmät eivät eroa toisistaan. Ryhmien välinen ero on –2–5 g/l. Tämä tarkoittaa, että hemoglobiini voi joko laskea 2 g/l tai nousta 5 g/l.

Luottamusväli on erittäin tärkeä indikaattori. Sen ansiosta näet, johtuivatko erot ryhmissä todella keskiarvoeroista vai suuresta otoksesta, sillä suurella otoksella erojen löytäminen on suurempi kuin pienellä.

Käytännössä se saattaa näyttää tältä. Otimme 1000 ihmisen näytteen, mittasimme hemoglobiinitasot ja havaitsimme, että keskiarvoeron luottamusväli oli 1,2-1,5 g/l. Tilastollisen merkitsevyyden taso tällä sivulla

Näemme, että hemoglobiinipitoisuus nousi, mutta lähes huomaamattomasti, siksi tilastollinen merkitsevyys ilmestyi juuri otoskoon vuoksi.

Luottamusvälit voidaan laskea paitsi keskiarvoille myös suhteille (ja riskisuhteille). Meitä kiinnostaa esimerkiksi niiden potilaiden osien luottamusväli, jotka saavuttivat remission ottamalla kehitettyä lääkettä. Oletetaan, että osuuksien eli tällaisten potilaiden osuuden 95 % CI on välillä 0,60–0,80. Näin ollen voimme sanoa, että lääkkeellämme on terapeuttinen vaikutus 60-80 % tapauksista.