|
Kirjeldav statistika on statistika haru, mis keskendub andmete kogumisele ja nende analüüsimisele, tulemused esitatakse graafiliselt või karakteristikute kaudu. Sageli pole võimalik tunnuse väärtusi leida uuritava kogumi kõigi objektide kohta. Sellisel juhul kasutatakse valimit, mille abil püütakse teha järeldusi terve üldkogumi kohta. Käesolevas peatükis kirjeldatud protseduurid sobivad hästi just sellisteks situatsioonideks.
Teiseks võimaluseks on kirjeldavat statistikat kasutada juhuslikult genereeritud andmetega. Sellisel juhul on eesmärgiks teoreetilise mudeli loomine.
Erinevalt teistest matemaatika valdkondadest töötab wiris statistika puhul alati kümnendarvudega, et olla kooskõlas selle valdkonna praktiliste vajadustega.
Järgnev näide demonstreerib võimalusi esitada valimit, mis koosneb kolmest nullist ja neljast ühest.
Esimesel juhul anti valim ette Loend na , kus olid üles loetud valimi elemendid. Sellele järgnes näide, kus oli määratud, kui mitu korda üht või teist elementi valimis esineb. Vaatleme nüüd veel mõnda operatsiooni, mida saame valimile rakendada.
Järgmised näited selgitavad, kuidas saab juhuslikke valimeid rühmitada. Selle võimaluse täielikum seletus on jaotises
Multivalim.
Selles jaotises vaatleme funktsioone, mida saab wirises rakendada statistilisele reale x={x1,x2,...,xn}
dispersioon:
käsklus dispersioon
Arvutab dispersiooni definitsioonist lähtudes valemist kusjuures n=pikkus(x), m x=keskmine(x).
|
mediaan:
käsklus mediaan
Kui statistiline rida x1,x2,...,xn on järjestatud, siis on mediaan defineeritud valemiga
| xk
|
kui |
n=2k-1 |
| (xk+xk+1)/2 |
kui |
n=2k |
kus k on täisarv. Kui rida ei ole järjestatud, siis tuleb see enne järjestada.
|
mood:
käsklus mood
Leiab arvreas kõige sagedamini esineva väärtuse. Kui arvreas on mitu võrdse sagedusega väärtust, tagastab funktsioon nende hulgast vähima.
|
Kahemõõtmelise andmekogumi (x1,y1),(x2,y2),...,(xn,yn) korral toimivate funktsioonide valemid on toodud allpool. Kuigi kummagi tunnuse väärtused saab sisestada sõltumatult, eeldatakse, et mõlemad tunnused kirjeldavad samu objekte.
kovariatsioon:
käsklus kovariatsioon
Arvutusvalem: kusjuures m x=keskmine(x), m y=keskmine(y). Samuti võib argumendiks anda punktide loendi, kus esimesed koordinaadid on esimese tunnuse väärtused ja teised koordinaadid on teise tunnuse väärtused.
|
korrelatsioon:
käsklus korrelatsioon
Arvutab Pearsoni korrelatsioonikordaja, mis iseloomustab kahe tunnuse vahelist lineaarset seost. Arvutusvalem: Käskluse argumendiks võib anda ka punktide loendi, kus esimesed koordinaadid on esimese tunnuse väärtused ja teised koordinaadid on teise tunnuse väärtused.
|
regressioonisirge:
käsklus regressioonisirge
Antud valimi (x1,y1),(x2,y2),...,(xn,yn) põhjal arvutatakse regressioonisirge, kasutades vähimruutude meetodit, võttes X sõltumatuks tunnuseks ja Y sõltuvaks tunnuseks.Käskluse argumendiks võib anda ka punktide loendi, kus esimesed koordinaadid on esimese tunnuse väärtused ja teised koordinaadid on teise tunnuse väärtused.
|
|