Luottamusväli

Mikä on luottamusväli:

Se on tilastossa käytetty alue, joka sisältää populaatioparametrin. Tämä tuntematon populaatioparametri löytyy kerätystä datasta lasketun mallimallien avulla .

Esimerkki: kerätyn näytteen keskiarvo x̅ voi tai ei vastaa todellista populaation keskiarvoa μ. Tätä varten on mahdollista tarkastella joukkoa näytevälineitä, joissa tämä populaation keskiarvo voidaan sisällyttää. Mitä pidempi tämä aikaväli on, sitä suurempi on tämän todennäköisyys.

Luottamusväli ilmaistaan prosentteina, ilmaistuna luottamustasolla, 90%, 95% ja 99% on eniten osoitettu. Alla olevassa kuvassa on esimerkiksi 90% luottamusväli sen ylä- ja alarajan (a ja -a ) välillä.

Esimerkki 90 prosentin luottamusväleistä sen ylä- (a) ja alemman (-a) rajojen välillä.

Luottamusväli on yksi tärkeimmistä hypoteesitestauksen käsitteistä tilastoissa, koska sitä käytetään epävarmuustekijänä. Termin esitteli puolalainen matemaatikko ja tilastollinen Jerzy Neyman vuonna 1937.

Mikä on luottamusintervallin merkitys?

Luottamusväli on tärkeä, jotta voidaan osoittaa epävarmuusmarginaali (tai epätarkkuus) tehtyyn laskentaan nähden. Tässä laskelmassa käytetään tutkimusnäytettä tuloksen todellisen koon arvioimiseksi lähdepopulaatiossa.

Luotettavuusvälin laskeminen on strategia, jossa otetaan huomioon virheen näytteenotto. Tutkimuksen tulosten koko ja luottamusväli kuvaavat alkuperäisen väestön oletettuja arvoja.

Mitä pienempi luottamusväli on, sitä suurempi on todennäköisyys, että tutkittavan väestön prosenttiosuus edustaa lähdepopulaation todellista määrää, mikä antaa suuremman varmuuden tutkimuksen kohteen lopputulokselle.

Miten tulkita luottamusväli?

Luotettavuusvälin oikea tulkinta on todennäköisesti tämän tilastollisen käsitteen haastavin osa. Esimerkki yleisestä tulkinnasta käsitteelle on seuraava:

On 95% todennäköisyys, että tulevaisuudessa väestöparametrin todellinen arvo (esim. Keskiarvo) laskee alueelle X (alaraja) ja Y (yläraja).

Näin ollen luottamusväli tulkitaan seuraavasti: on 95% varma, että X: n (alaraja) ja Y (yläraja) välinen väli sisältää väestöparametrin todellisen arvon.

Olisi täysin väärin todeta, että: on 95% todennäköisyys, että X: n (alaraja) ja Y: n (ylempi raja) välinen väli sisältää väestöparametrin todellisen arvon.

Yllä oleva lausunto on yleisin väärinkäsitys luottamusväleistä. Kun tilastollinen alue on laskettu, se voi sisältää vain populaatioparametrin tai ei.

Välit voivat kuitenkin vaihdella näytteiden välillä, kun taas todellinen populaatioparametri on sama näytteestä riippumatta.

Siksi luottamusväli-luottamusväli voidaan tehdä vain siinä tapauksessa, että luotettavuusvälit lasketaan uudelleen näytteiden lukumäärälle.

Luottamusväli lasketaan

Alue lasketaan seuraavasti:

Kerää näytetiedot: n ;
Laske näytteen keskiarvo x̅;
Määritä, onko populaation keskihajonta ( σ ) tunnettu tai tuntematon;
Jos populaation keskihajonta on tiedossa, vastaavaan luottamustasoon voidaan käyttää z- pistettä;
Jos populaation keskihajonta on tuntematon, voimme käyttää tilastoa t vastaavaan luottamustasoon;
Näin ollen luotettavuusvälin alemmat ja ylemmät rajat löytyvät käyttäen seuraavia kaavoja:

a) Tunnetun populaation keskihajonta :

Kaava tunnetun populaation keskihajonnan laskemiseksi.

b) tuntemattoman populaation keskihajonta :

Kaava tuntemattoman populaation keskihajonnan laskemiseksi.

Käytännön esimerkki luottamusväleistä

Kliinisessä tutkimuksessa arvioitiin astman läsnäolon ja obstruktiivisen uniapnean kehittymisen riskiä aikuisilla.

Jotkut aikuiset otettiin satunnaisesti mukaan luetteloon valtion virkamiehistä, joita seurataan neljän vuoden ajan.

Astmalla osallistuneilla oli suurempi riski sairastua apneaan neljän vuoden aikana verrattuna niihin, jotka eivät ole.

Tämän esimerkin kaltaisia kliinisiä tutkimuksia tehtäessä kiinnostuksen kohteena olevan väestön osajoukko rekrytoidaan yleensä tutkimuksen tehokkuuden lisäämiseksi (vähemmän kustannuksia ja vähemmän aikaa).

Tämä yksilöiden alaryhmä, tutkittu väestö, koostuu niistä, jotka täyttävät osallistumiskriteerit ja suostuvat osallistumaan tutkimukseen, kuten alla olevassa kuvassa on esitetty.

Esimerkissä kuvattujen populaatioiden selittävä graafinen kuva.

Tämän jälkeen tutkimus on suoritettu ja vaikutuskoko (esimerkiksi keskimääräinen ero tai suhteellinen riski ) lasketaan vastaamaan tutkimuskysymykseen.

Tämä prosessi, jota kutsutaan päätelmäksi, käsittää tutkittavasta väestöstä kerättyjen tietojen käytön arvioidakseen kiinnostuksen kohteena olevan väestön todellisen vaikutuksen eli alkuperän populaation koon.

Esitetyssä esimerkissä tutkijat rekrytoivat satunnaisen otoksen valtion työntekijöistä (lähdepopulaatiosta), jotka olivat tukikelpoisia ja suostuivat osallistumaan tutkimukseen (tutkimuspopulaatio), ja raportoivat, että astma lisää riskiä kehittää apneaa tutkimuspopulaatiossa.

Jotta vain kiinnostuksen kohteena olevan väestön alaryhmän rekrytoinnista johtuva näytteenottovirhe otettaisiin huomioon, he laskivat myös 95%: n luotettavuusvälin (arvion ympärillä) 1, 06 - 1, 82, mikä osoittaa todennäköisyyden 95 % että lähdepopulaation todellinen suhteellinen riski olisi 1, 06 ja 1, 82 välillä .

Luottamusväli keskiarvolle

Kun on tietoa väestön keskihajonnasta, voidaan laskea keskiarvon tai keskiarvon luottamusväli.

Kun mitattava tilastollinen ominaisuus (kuten tulot, IQ, hinta, korkeus, määrä tai paino) on numeerinen, useimmissa tapauksissa arvioidaan väestön keskiarvo.

Näin pyrimme löytämään populaation keskiarvon ( μ ) käyttämällä näytteen keskiarvoa ( x̅ ), jossa on virhemarginaali. Tämän laskennan tulosta kutsutaan väestön keskiarvon luottamusväleiksi .

Kun populaation keskihajonta on tiedossa, populaation keskiarvon luottamusväli (CI) on:

missä:

x̅ on näytteen keskiarvo;
σ on populaation keskihajonta;
n on näytteen koko;
Ζ * edustaa normaalin normaalijakauman sopivaa arvoa halutulle luottamustasolle.

Seuraavat ovat eri luotettavuustasojen (( * ) arvot:

Luottamustaso	Z * -arvo -
80%	01:28
90%	1.645 (perinteinen)
95%	1, 96
98%	02:33
99%	02:58

Yllä olevassa taulukossa esitetään z * -arvot annetuille luottamustasoille. Huomaa, että nämä arvot saadaan normaalista normaalijakaumasta (Z-).

Jokaisen z * -arvon ja tämän arvon negatiivisen alueen välillä on (likimääräinen) luottamusprosentti. Z * = 1, 28 ja z = -1, 28 välinen alue on esimerkiksi noin 0, 80. Siksi tätä taulukkoa voidaan laajentaa myös muihin luottamusprosentteihin. Taulukossa on vain yleisimmin käytetyt luottamusprosentit.

Katso myös hypoteesin merkitys.