Varianssin laskeminen

Kirjoittaja: Ellen Moore
Luomispäivä: 11 Tammikuu 2021
Päivityspäivä: 17 Saattaa 2024
Anonim
Keskihajonta
Video: Keskihajonta

Sisältö

Varianssi mittaa tietojoukon leviämistä. Pieni varianssi osoittaa, että joukon arvot on ryhmitelty lähelle toisiaan. Suuri varianssi puolestaan ​​osoittaa, että luvut ovat levinneet enemmän. Tällä käsitteellä on useita käyttötapoja tilastoissa. Esimerkiksi kahden tietojoukon (kuten mies- ja naispotilaiden tulosten) varianssin vertaaminen on tapa tarkastella, aiheuttaako tietty muuttuja havaittavia vaikutuksia. Se on myös erittäin hyödyllinen tilastollisten mallien luomisessa, koska pieni varianssi voi olla merkki siitä, että asetat tiedot yli.

Askeleet

Menetelmä 1/2: Näytteen varianssin laskeminen

  1. Kirjoita näytteen tietojoukko. Useimmissa tapauksissa tilastotieteilijöillä on käytettävissään vain yksi otos tai osa tutkittavasta väestöstä. Esimerkiksi sen sijaan, että analysoidaan väestön "kaikkien autojen kustannuksia Saksassa", tilastotieteilijä voisi analysoida satunnaisen otoksen muutamasta tuhannesta autosta. Hän voi käyttää tätä otosta arvioidessaan saksalaisten autojen kustannuksia, mutta tulos ei todennäköisesti vastaa todellisia lukuja tarkasti.
    • Esimerkki: analysoimalla päivittäin kahvilassa myytävien evästeiden määrää, voit valita kuusi satunnaista päivää ja saada seuraavat tulokset: 17, 15, 23, 7, 9, 13. Tämä on näyte, ei väestö, koska ei ole tietoja päivästä, jolloin kahvila oli auki.
    • Jos sinulla on kaikki populaation datapisteet, siirry alla olevaan menetelmään.

  2. Kirjoita näyte-varianssikaava. Tietojoukon varianssi kertoo kuinka hajautetut ne ovat. Mitä lähempänä nollaa, sitä lähempänä he ovat toisiaan. Kun työskentelet näytetietojoukkojen kanssa, käytä seuraavaa kaavaa varianssin laskemiseen:
    • = /(n - 1)
    • edustaa varianssia, joka mitataan aina neliöyksikköinä.
    • edustaa termiä tietojoukostasi.
    • ∑, joka tarkoittaa "summausta", kehottaa sinua laskemaan seuraavat termit kullekin arvolle ja lisäämään ne sitten yhteen.
    • x̅ edustaa otoksen keskiarvoa.
    • n on näytteessä olevien datapisteiden lukumäärä.

  3. Laske näytekeskiarvo. Symboli x̅ tai "x bar" viittaa näytteen aritmeettiseen keskiarvoon. Laske se ikään kuin mikä tahansa muu keskiarvo: lisää kaikki olemassa olevat tiedot ja jaa tulos niiden lukumäärällä.
    • Esimerkki: lisää aluksi datapisteet: 17 + 15 + 23 + 7 + 9 + 13 = 84.
      Jaa seuraavaksi vastauksesi sen määrällä tai tässä tapauksessa kuudella: 84 ÷ 6 = 14.
      Näytteen aritmeettinen keskiarvo = x̅ = 14.
    • Voit ajatella aritmeettista keskiarvoa ikään kuin se edustaisi tietojoukon "keskipistettä". Jos ne on ryhmitelty keskiarvon ympärille, tämä osoittaa, että varianssi on pieni. Jos ne ovat hyvin levinneitä ja kaukana, varianssi on suuri.

  4. Vähennä keskiarvo kustakin datasta. Nyt on aika laskea - x̅, jossa se edustaa kutakin tietojoukossa olevaa lukua. Jokainen vastaus ilmaisee lukun ja aritmeettisen keskiarvon välisen poikkeaman tai toisin sanoen, mikä on niiden välinen etäisyys.
    • Esimerkki:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x = 7-14 = -7
      - x = 9 - 14 = -5
      - x = 13-14 = -1
    • Tehtyä työtä on helppo tarkistaa, koska yhdistettyjen vastausten pitäisi johtaa nollaan. Tämä tapahtuu aritmeettisen keskiarvon määritelmän takia, koska negatiiviset vasteet (keskiarvon ja pienimmän luvun välinen etäisyys) mitätöivät positiiviset vastaukset (keskiarvon ja suurimman luvun välinen etäisyys).
  5. Neliö kukin tulos. Kuten edellä on kuvattu, nykyinen poikkeamaluettelo (- x̅) summautuu ja johtaa nollaan. Tämä tarkoittaa, että "keskimääräinen poikkeama" on myös aina nolla, mikä ei kerro meille mitään tietojen hajonnasta. Voit ratkaista tämän ongelman etsimällä kunkin poikkeaman neliön. Tämä muuttaa kaikki positiivisiksi luvuiksi, joten negatiiviset ja positiiviset eivät enää peruuta nollaa.
    • Esimerkki:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Sinulla on nyt arvo (- x̅) jokaiselle näytteen datapisteelle.
  6. Etsi arvojen summa neliöön. Lasketaan nyt kaavan koko osoitin: ∑. Isosigma ∑ saa meidät lisäämään seuraavan termin arvon jokaiselle arvolle. Olet jo laskenut (- x̅) jokaiselle otoksen nykyarvolle, ja sinun tarvitsee vain lisätä tulokset.
    • Esimerkki: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Jaa n - 1: llä, missä n edustaa datapisteiden määrää. Kauan sitten tilastotieteilijät jaettiin n: llä laskettaessa otoksen varianssia. Tämä antaa sinulle neliöpoikkeaman keskiarvon, joka vastaa täydellisesti otosvarianssia. Muista kuitenkin, että otos edustaa vain arviota suuremmasta väestöstä. Jos otat toisen satunnaisotoksen ja teet samat laskelmat, saat aivan toisenlaisen tuloksen. Joten jakamalla n - 1: llä pelkän n: n käyttämisen sijasta saat paremman arvion suuremman populaation varianssista, minkä olet kiinnostunut selvittämään. Tämä korjaus on niin yleistä, että siitä on tullut hyväksytyin määritelmä näytteen varianssista.
    • Esimerkki: tässä näytteessä on kuusi datapistettä, joten n = 6.
      Näytteen varianssi = 33,2
  8. Ymmärrä varianssin ja keskihajonnan käsitteet. Huomaa, että koska kaavassa on eksponentti, varianssi mitataan alkuperäisen datan neliöyksikössä. Tämä voi estää vain intuitiivisen ymmärryksen. Tämän lähestymistavan sijaan on usein hyödyllistä käyttää keskihajontaa. Silti et ole hukannut vaivaa, koska se määritellään varianssin neliöjuureksi. Tästä syystä näytteen varianssi kirjoitetaan ja näytteen keskihajonta on.
    • Esimerkiksi edellisen näytteen keskihajonta on s = √33,2 = 5,76.

Menetelmä 2/2: Populaation varianssin laskeminen

  1. Aloita väestötietojoukosta. Termi "populaatio" viittaa asiaankuuluvien havaintojen kokonaisuuteen. Jos esimerkiksi tutkit São Paulon asukkaiden ikää, väestö sisältäisi jokaisen kyseisessä osavaltiossa asuvan kansalaisen iän. Tällaiselle suurelle tietojoukolle sinun on yleensä luotava laskentataulukko, mutta tässä on esimerkkinä pienempi tietojoukko:
    • Esimerkki: kunnallisessa eläintarhassa on täsmälleen kuusi akvaariota yhdessä huoneessa. Kuusi akvaariota sisältää seuraavan määrän kaloja:





  2. Kirjoita populaation varianssin kaava. Koska populaatio sisältää kaikki tarvitsemasi tiedot, tämä kaava antaa varianssin tarkkuudella. Erottaakseen sen otosvarianssista (joka on vain arvio), tilastotieteilijät käyttävät erilaisia ​​muuttujia:
    • σ = /n
    • σ = populaation varianssi. Tässä meillä on pieni neliömäinen sigma, koska varianssi mitataan neliöyksikköinä.
    • edustaa termiä tietojoukostasi.
    • ∑: n sisällä olevat ehdot lasketaan kullekin ja lisätään sitten yhteen.
    • μ edustaa väestön keskiarvoa.
    • n edustaa tietopisteiden määrää populaatiossa.
  3. Etsi väestön aritmeettinen keskiarvo. Kun analysoidaan populaatiota, symboli μ ("mu") edustaa aritmeettista keskiarvoa. Löydät sen lisäämällä kaikki datapisteet ja jakamalla tulos sen määrällä.
    • Voit ajatella aritmeettista keskiarvoa keskipisteenä, mutta muista, että matematiikassa on monia keskiarvon määritelmiä.
    • Esimerkki: keskiarvo = μ = = 10,5
  4. Vähennä keskiarvo kustakin datapisteestä. Lähellä keskiarvoa olevat datapisteet johtavat lähellä nollaa olevaan eroon. Tee uudelleen vähennysongelma jokaisessa datapisteessä ja alat ymmärtää näytteen hajonta.
    • Esimerkki:
      - μ = 5 - 10,5 = -5,5
      - μ = 5 - 10,5 = -5,5
      - μ = 8 - 10,5 = -2,5
      - μ = 12 - 10,5 = 1,5
      - μ = 15 - 10,5 = 4,5
      - μ = 18 - 10,5 = 7,5
  5. Neliö kukin vastaus. Jotkut viimeisen vaiheen luvuista ovat negatiivisia ja jotkut positiivisia. Jos tarkastelet tietoja numeerisella rivillä, nämä kaksi luokkaa edustavat keskiarvon vasemmalla ja oikealla puolella olevia lukuja. Tämä ei ole hyödyllinen varianssin laskemisessa, koska molemmat ryhmät peruuttavat toisensa. Neliö kukin arvo, jotta ne kaikki olisivat positiivisia.
    • Esimerkki:
      (- μ) jokaiselle arvolle i 1-6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Etsi tulosten aritmeettinen keskiarvo. Sinulla on nyt arvo jokaiselle datapisteelle, joka liittyy (epäsuorasti) etäisyyteen aritmeettisesta keskiarvosta. Keskiarvoiset arvot lasketaan yhteen ja jaetaan niiden määrällä.
    • Esimerkki:
      Väestövarianssi = 24,25
  7. Käytä tulosta kaavassa. Jos et ole varma, miten se liittyy menetelmän alussa olevaan kaavaan, yritä kirjoittaa ongelma laajasti:
    • Kun olet löytänyt keskiarvojen ja neliöiden välisen eron, sinulla on arvot (- μ), (- μ) ja niin edelleen, kunnes saavutat (- μ), missä, joka edustaa viimeistä datapistettä aseta.
    • Saadaksesi näiden arvojen keskiarvon, lisää ne yhteen ja jaa tulos n: llä ((((- - μ) + (- μ) + ... + (- μ)) / n
    • Kun olet kirjoittanut osoittajan sigma-merkintöihin, sinulla on /n, varianssin laskemiseen käytetty kaava.

Vinkkejä

  • Koska varianssia on vaikea tulkita, tätä arvoa käytetään yleensä lähtökohtana keskihajonnan laskemisessa.
  • Näytteiden analysoinnissa nimikkeen "n - 1" käyttö nimikkeen "n" sijasta edustaa tekniikkaa, jota kutsutaan Besselin korjaukseksi. Otos edustaa vain arviota koko populaatiosta, ja otoksen keskiarvoon vaikuttaa tämä arvio. Tämä korjaus puolestaan ​​poistaa tuon vaikutuksen. Tämä liittyy siihen, että lukemalla n - 1 datapistettä, lukemattomia päätepisteitä on jo rajoitettu, koska vain muutama arvo johtaa varianssikaavassa käytettävään otoskeskiarvoon (x̅).

Emoleikkauket ja kampauket ovat kauniita, mutta niitä ei aina hyväkytä ammattimaailmaa tai koulua. On olemaa ueita hienovaraiia ​​muutokia, jotka tekevät hiukita täyin hyv...

Tämä artikkeli opettaa inulle, kuinka voit poitaa tietouodattimet arakkeeta tai kokonaieta lakentatauluta Microoft Excelitä. Menetelmä 1/2: uodattimien puhditaminen pylvää...

Neuvostoliitto