Varijacijski nizovi. prosječne vrijednosti. standardna devijacija. prosječna pogreška aritmetičke sredine. Varijacijski nizovi, njihovi elementi

Prikazani su u obliku serija distribucije i prikazani su u obliku.

Niz distribucije jedna je od vrsta grupiranja.

Raspon distribucije— predstavlja uređenu distribuciju jedinica populacije koja se proučava u skupine prema određenom varirajućem obilježju.

Razlikuju se ovisno o karakteristikama na kojima se temelji formiranje serije distribucije atributivni i varijacijski distribucijski redovi:

  • Atributivni- nazivaju se serije distribucije konstruirane prema kvalitativnim karakteristikama.
  • Serije distribucije konstruirane uzlaznim ili silaznim redoslijedom vrijednosti kvantitativne karakteristike nazivaju se varijacijski.
Serije varijacija Distribucija se sastoji od dva stupca:

Prvi stupac daje kvantitativne vrijednosti varirajuće karakteristike, koje se nazivaju opcije i označeni su . Diskretna opcija - izražena kao cijeli broj. Opcija intervala kreće se od i do. Ovisno o vrsti opcija, možete konstruirati diskretni ili intervalni niz varijacija.
Drugi stupac sadrži broj određene opcije, izraženo kao frekvencije ili učestalosti:

Frekvencije- ovo su apsolutni brojevi koji pokazuju koliko se puta određena vrijednost karakteristike pojavljuje u agregatu, a koji označavaju . Zbroj svih frekvencija mora biti jednak broju jedinica u cijeloj populaciji.

Frekvencije() su frekvencije izražene kao postotak ukupnog broja. Zbroj svih frekvencija izražen u postocima mora biti jednak 100% u razlomcima od jedan.

Grafički prikaz serija distribucije

Distribucijske serije vizualno su prikazane pomoću grafičkih slika.

Serije distribucije prikazane su kao:
  • Poligon
  • Histogrami
  • Kumulira
  • Ogives

Poligon

Prilikom konstruiranja poligona, vrijednosti varirajuće karakteristike iscrtavaju se na horizontalnoj osi (x-osi), a frekvencije ili frekvencije se iscrtavaju na okomitoj osi (y-osi).

Poligon na Sl. 6.1 temelji se na podacima mikropopisa stanovništva Rusije 1994. godine.

6.1. Distribucija veličine kućanstva

Stanje: Dati su podaci o rasporedu 25 radnika jednog od poduzeća prema tarifnim kategorijama:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Zadatak: Konstruirajte diskretnu seriju varijacija i grafički je prikažite kao distribucijski poligon.
Riješenje:
U u ovom primjeru opcije je tarifni razred zaposlenika. Za određivanje učestalosti potrebno je izračunati broj zaposlenih s pripadajućim tarifnim razredom.

Poligon se koristi za diskretne varijacijske serije.

Da bismo konstruirali poligon distribucije (Slika 1), crtamo kvantitativne vrijednosti varirajuće karakteristike - varijante - duž apscisne (X) osi, a učestalosti ili učestalosti duž ordinatne osi.

Ako su vrijednosti neke karakteristike izražene u obliku intervala, tada se takav niz naziva interval.
Intervalne serije distribucije su prikazane grafički u obliku histograma, kumulata ili ogiva.

Statistička tablica

Stanje: Naveden je podatak o veličini depozita 20 pojedinaca u jednoj banci (tisuća rubalja) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Zadatak: Konstruirajte niz intervalnih varijacija s jednakim intervalima.
Riješenje:

  1. Početna populacija sastoji se od 20 jedinica (N = 20).
  2. Sturgessovom formulom određujemo potreban iznos korištene grupe: n=1+3,322*lg20=5
  3. Izračunajmo vrijednost jednakog intervala: i=(152 - 2) /5 = 30 tisuća rubalja
  4. Podijelimo početnu populaciju u 5 grupa s intervalom od 30 tisuća rubalja.
  5. Rezultate grupiranja prikazujemo u tablici:

S takvim zapisom kontinuirane karakteristike, kada se ista vrijednost pojavljuje dva puta (kao gornja granica jednog intervala i donja granica drugog intervala), tada ta vrijednost pripada skupini u kojoj ta vrijednost djeluje kao gornja granica.

Grafikon

Za konstruiranje histograma, vrijednosti granica intervala naznačene su duž osi apscise i na temelju njih konstruirani su pravokutnici čija je visina proporcionalna frekvencijama (ili frekvencijama).

Na sl. 6.2. prikazuje histogram raspodjele ruskog stanovništva 1997. godine po dobnim skupinama.

Riža. 6.2. Raspodjela ruskog stanovništva po dobnim skupinama

Stanje: Dat je raspored 30 zaposlenika tvrtke po mjesečnim plaćama

Zadatak: Prikažite niz varijacija intervala grafički u obliku histograma i kumulirajte.
Riješenje:

  1. Nepoznata granica otvorenog (prvog) intervala određena je vrijednošću drugog intervala: 7000 - 5000 = 2000 rubalja. S istom vrijednošću nalazimo donju granicu prvog intervala: 5000 - 2000 = 3000 rubalja.
  2. Da bismo konstruirali histogram u pravokutnom koordinatnom sustavu, crtamo duž osi apscise segmente čije vrijednosti odgovaraju intervalima varikozne serije.
    Ti segmenti služe kao donja baza, a odgovarajuća frekvencija (frekvencija) služi kao visina formiranih pravokutnika.
  3. Izgradimo histogram:

Za konstruiranje kumulata potrebno je izračunati akumulirane frekvencije (frekvencije). Određene su sekvencijalnim zbrajanjem učestalosti (učestalosti) prethodnih intervala i označene su sa S. Akumulirane frekvencije pokazuju koliko jedinica populacije ima karakterističnu vrijednost ne veću od one koja se razmatra.

Kumulira

Distribucija karakteristike u nizu varijacija preko akumuliranih frekvencija (učestalosti) prikazana je pomoću kumulacije.

Kumulira ili kumulativna krivulja, za razliku od poligona, konstruirana je od akumuliranih frekvencija ili frekvencija. U ovom slučaju, vrijednosti karakteristike postavljene su na apscisnu os, a akumulirane frekvencije ili frekvencije postavljene su na ordinatnu os (slika 6.3).

Riža. 6.3. Kumulacije distribucije veličine kućanstva

4. Izračunajmo akumulirane frekvencije:
Kumulativna učestalost prvog intervala izračunava se na sljedeći način: 0 + 4 = 4, za drugi: 4 + 12 = 16; za treći: 4 + 12 + 8 = 24 itd.

Prilikom konstruiranja kumulata, akumulirana frekvencija (frekvencija) odgovarajućeg intervala pripisuje se njegovoj gornjoj granici:

Ogiva

Ogiva konstruiran je slično kao kumulat s jedinom razlikom što su akumulirane frekvencije smještene na apscisnoj osi, a karakteristične vrijednosti na ordinatnoj osi.

Vrsta kumulata je koncentracijska krivulja ili Lorentzov dijagram. Za konstruiranje krivulje koncentracije, na obje osi pravokutnog koordinatnog sustava ucrtana je skala u postocima od 0 do 100. Istovremeno su akumulirane frekvencije naznačene na apscisnoj osi, a akumulirane vrijednosti udjela. (u postocima) po volumenu karakteristike naznačeni su na ordinatnoj osi.

Jednolika raspodjela karakteristike odgovara dijagonali kvadrata na grafu (sl. 6.4). Uz neravnomjernu raspodjelu, grafikon predstavlja konkavnu krivulju ovisno o razini koncentracije svojstva.

6.4. Krivulja koncentracije
Naziv parametra Značenje
Tema članka: Serije varijacija
Rubrika (tematska kategorija) Proizvodnja

Opažene vrijednosti slučajne varijable x 1 , x 2 , …, x k se zovu opcije.

Frekvencija opcije x ja se obično zove broj n i (ja=1,…,k), pokazujući koliko se puta ova opcija pojavljuje u uzorku.

Frekvencija(relativna frekvencija, frakcija) opcije x i (ja=1,…,k) obično se naziva omjer njegove frekvencije n i na veličinu uzorka n.

Frekvencije i frekvencije se nazivaju mjerila.

Kumulativna učestalost Uobičajeno je nazvati broj opcija čije su vrijednosti manje od zadane x:

Kumulativna učestalost Uobičajeno je nazvati omjer akumulirane frekvencije i volumena uzorka:

Serije varijacija (statistička serija) – uobičajeno je nazivati ​​niz opcija napisanih uzlaznim redoslijedom i njihove odgovarajuće težine.

Serije varijacija bi trebale biti diskretna(uzorkovanje vrijednosti diskretne slučajne varijable) i kontinuirano (interval)(uzorak vrijednosti kontinuirane slučajne varijable).

Diskretni varijacijski niz ima oblik:

Kada je broj opcija velik ili je značajka kontinuirana ( slučajna vrijednost mogu uzeti bilo koje vrijednosti u određenom intervalu), su interval varijacijske serije.

Da biste konstruirali niz intervalnih varijacija, izvedite grupiranje opcija - podijeljeni su u zasebne intervale:

Broj intervala ponekad se određuje pomoću Sturgesove formule:

Zatim se broji broj opcija koje ulaze u svaki interval – frekvencije n i(ili učestalost n i/n). Ako je opcija na granici intervala, tada je pridružena desnom intervalu.

Intervalni varijacijski niz ima oblik:

Mogućnosti
Frekvencije

Empirijska (statistička) funkcija distribucije uobičajeno je pozvati funkciju čija vrijednost u točki x jednaka je relativnoj frekvenciji koju će varijanta poprimiti manju vrijednost x(kumulativna učestalost za x):

Frekvencijski poligon naziva se izlomljena linija čiji segmenti povezuju točke s koordinatama ( x 1 ; n 1), (x 2 ; n 2), …, (x k; n k). Gradi se na sličan način frekvencijski poligon, što je statistički analog distribucijskog poligona.

Vrijedno je reći da se za seriju kontinuirane varijacije poligon može konstruirati ako su vrijednosti x 1 , x 2 , …, x k uzeti sredine intervala.

Niz intervalnih varijacija obično se prikazuje grafički pomoću histogrami.

Grafikon– stepenasta figura koja se sastoji od pravokutnika čije su osnovice djelomični intervali dužine h= x i +1 – x i, ja= 0,…,k-1, a visine su jednake frekvencijama (ili frekvencijama) intervala n i (w i).

Kumulira(cumulative curve) – krivulja akumuliranih frekvencija (frekvencija). Za diskretne serije Kumulat predstavlja isprekidanu liniju koja spaja točke ili , . Za intervalne serije Kumulat počinje od točke čija je apscisa jednaka početku prvog intervala, a ordinata jednaka akumuliranoj frekvenciji (frekvenciji) jednakoj nuli. Ostale točke ove izlomljene linije odgovaraju krajevima intervala.

Varijacijski nizovi - pojam i vrste. Klasifikacija i obilježja kategorije "Varijacijski nizovi" 2017., 2018.

  • - Varijacijski nizovi distribucije

    Raspodjela prometa na malo Ruska Federacija u 1995. prema vrsti vlasništva, milijuna rubalja. Vrste serija distribucije Predavanje VIII. Serije distribucije Kao rezultat obrade i sistematizacije primarnih statističkih podataka dobivamo... .


  • - Serije varijacija

    Najjednostavnija transformacija statističkih podataka je poredati ih po veličini. Uzorak volumena iz opće populacije, poredan neopadajućim redoslijedom elemenata, tj. , naziva se serija varijacija: . U slučaju kada je volumen opažanja... .


  • - Zadatak 2. Intervalni varijacijski nizovi

    1. Na temelju zadanog uzorka koji odgovara varijanti zadatka konstruirati intervalni varijacijski niz; izgraditi histogram i kumulirati (koristite dvije metode: umetanje Excel grafikona i mod “Histogram” paketa “Analiza podataka”). 2. Analizirajte dobiveni histogram. ... .


  • - Sastaviti varijacijski niz varijabilnosti svojstva u sjemenu graha ili lišću biljke iste starosti. Identificirati obrasce varijabilnosti osobina.

    Populacija je strukturna jedinica vrste. Veličina populacije. Razlozi fluktuacije stanovništva. Odnosi između jedinki u populacijama i između različitih populacija iste i različitih vrsta. 1. Važna značajka vrste je njezino naseljavanje u skupinama, populacije u...

    1. Sve vrijednosti svojstva koje se proučava koje se javljaju u populaciji koja se proučava nazivaju se vrijednošću atributa (opcija, opcija), a promjena ove vrijednosti variranjem. Opcije su označene malim slovima latinične abecede s indeksima koji odgovaraju serijskom broju grupe - x ja .

      Broj koji pokazuje koliko se puta svaka karakteristična vrijednost pojavljuje u populaciji koja se proučava frekvencija i označavaju f ja . Zbroj svih frekvencija serije jednak je obujmu populacije koja se proučava.

      Vrlo često morate računati akumulirana frekvencija (S). Akumulirana učestalost za svaku karakterističnu vrijednost pokazuje koliko jedinica u populaciji ima karakterističnu vrijednost koja nije veća od te vrijednosti. Akumulirana frekvencija izračunava se uzastopnim dodavanjem sljedećih vrijednosti atributa frekvenciji prve vrijednosti znaka frekvencije:

    Akumulirana frekvencija počinje se računati od prve vrijednosti atributa

    Zbroj frekvencija uvijek je jednak jedan ili 100%. Zamjena frekvencija s frekvencijama omogućuje usporedbu nizova varijacija s različitim brojem opažanja.

    Frekvencije serije (f i) u nekim se slučajevima mogu zamijeniti frekvencijama (ω i).

    Ako je niz varijacija dan u nejednakim intervalima, tada je za ispravnu predodžbu o prirodi distribucije potrebno izračunati apsolutnu ili relativnu gustoću distribucije.

      Apsolutna gustoća distribucije (str f ) predstavlja vrijednost frekvencije po jedinici veličine intervala posebne skupine serije:

    R f = f/ ja

      Relativna gustoća distribucije (str ω ) predstavlja vrijednost frekvencije po jedinici veličine intervala posebne skupine serije:

    R ω = ω / ja

    Za serije s nejednakim intervalima, samo ove karakteristike daju točniju ideju o prirodi distribucije od učestalosti i učestalosti.

      Distribucija statističkog uzorka navedite popis opcija (vrijednosti predznaka) i njihove odgovarajuće frekvencije ili gustoće distribucije, relativne frekvencije ili relativne gustoće distribucije.

    Različite nizove distribucije karakteriziraju različiti skupi frekvencijskih karakteristika:

    minimalno – serija atributa (učestalost, frekvencija),

    za diskretne se koriste četiri karakteristike (frekvencija, frekvencija, akumulirana frekvencija, akumulirana frekvencija),

    za intervalne – svih pet (frekvencija, frekvencija, akumulirana frekvencija, akumulirana frekvencija, apsolutna i relativna gustoća distribucije).

    1. Pravila za konstruiranje niza intervalnih varijacija

    1. Grafički prikaz varijacijskih serija

    Prva faza proučavanja niza varijacija je konstruiranje njegovog grafičkog prikaza. Grafički prikaz nizova varijacija olakšava njihovu analizu i omogućuje prosuđivanje oblika distribucije. Za grafička slika konstruiraju se varijacijski nizovi u statistici, histogram, poligon i kumulativna distribucija.

    Niz diskretnih varijacija prikazan je kao takozvani poligon frekvencija.

    Za prikaz niza intervala koriste se poligon distribucije frekvencija i histogram frekvencija.

    Grafikoni se konstruiraju u pravokutnom koordinatnom sustavu.

    Redovi izgrađeni na kvantitativnoj osnovi, se zovu varijacijski.

    Distribucijska serija sastoji se od opcije(karakteristične vrijednosti) i frekvencije(broj grupa). Pozivaju se frekvencije izražene kao relativne vrijednosti (frakcije, postoci). frekvencije. Zbroj svih frekvencija naziva se volumen niza distribucije.

    Po vrsti, serije distribucije podijeljene su na diskretna(konstruirano na temelju diskontinuiranih vrijednosti karakteristike) i interval(na temelju kontinuiranih vrijednosti karakteristike).

    Serije varijacija predstavlja dva stupca (ili retka); od kojih jedna daje pojedinačne vrijednosti različitih karakteristika, koje se nazivaju varijante i označavaju s X; au drugom - apsolutni brojevi koji pokazuju koliko se puta (koliko često) pojavljuje svaka opcija. Indikatori u drugom stupcu nazivaju se frekvencije i konvencionalno se označavaju s f. Napomenimo još jednom da se u drugom stupcu mogu koristiti relativni pokazatelji koji karakteriziraju udio učestalosti pojedinih opcija u ukupnom zbroju učestalosti. Ovi relativni pokazatelji nazivaju se frekvencije i konvencionalno se označavaju s ω Zbroj svih frekvencija u ovom slučaju jednak je jedan. No, učestalosti se mogu izraziti i u postocima i tada zbroj svih frekvencija daje 100%.

    Ako su varijante niza varijacija izražene u obliku diskretnih veličina, tada se takav niz varijacija naziva diskretna.

    Za kontinuirane karakteristike, nizovi varijacija se konstruiraju kao interval, odnosno vrijednosti atributa u njima su izražene “od... do...”. U ovom slučaju, minimalne vrijednosti karakteristike u takvom intervalu nazivaju se donja granica intervala, a maksimalne - gornja granica.

    Serije intervalnih varijacija također su konstruirane za diskretne karakteristike koje variraju u velikom rasponu. Intervalne serije mogu biti sa jednak I nejednak u intervalima.

    Razmotrimo kako se određuje vrijednost jednakih intervala. Uvedimo sljedeću oznaku:

    ja– veličina intervala;

    - najveća vrijednost obilježja za jedinice populacije;

    – minimalna vrijednost obilježja za jedinice populacije;

    n – broj dodijeljenih grupa.

    , ako je n poznat.

    Ako je broj skupina koje treba razlikovati teško unaprijed odrediti, tada se za izračunavanje optimalne vrijednosti intervala s dovoljnom veličinom populacije može preporučiti formula koju je predložio Sturgess 1926.

    n = 1+ 3,322 log N, gdje je N broj jedinica u agregatu.

    Veličina nejednakih intervala određuje se u svakom pojedinačnom slučaju, uzimajući u obzir karakteristike predmeta proučavanja.

    Distribucija statističkog uzorka pozvati popis opcija i njihove odgovarajuće frekvencije (ili relativne frekvencije).

    Statistička distribucija uzorka može se odrediti u obliku tablice, u prvom stupcu u kojem se nalaze opcije, au drugom - frekvencije koje odgovaraju tim opcijama. ni, odnosno relativne frekvencije Pi .

    Statistička distribucija uzorka

    Intervalne serije su varijacijske serije u kojima su vrijednosti karakteristika na kojima se temelji njihovo formiranje izražene unutar određenih granica (intervala). Učestalosti se u ovom slučaju ne odnose na pojedinačne vrijednosti atributa, već na cijeli interval.

    Nizovi intervalne distribucije konstruirani su na temelju kontinuiranih kvantitativnih karakteristika, kao i na diskretnim karakteristikama koje variraju unutar značajnih granica.

    Niz intervala može se prikazati statističkom distribucijom uzorka koja pokazuje intervale i njihove odgovarajuće učestalosti. U ovom slučaju, zbroj učestalosti varijanti koje spadaju u ovaj interval uzima se kao učestalost intervala.

    Kod grupiranja po kvantitativnim kontinuiranim obilježjima važno je odrediti veličinu intervala.

    Uz srednju vrijednost uzorka i varijancu uzorka koriste se i druge karakteristike varijacijskog niza.

    Moda Varijanta koja ima najveću frekvenciju naziva se.

    Metoda grupiranja također vam omogućuje mjerenje varijacija(varijabilnost, fluktuacija) znakova. Kada je broj jedinica u populaciji relativno mali, varijacija se mjeri na temelju rangiranog broja jedinica koje čine populaciju. Serija se zove rangiran, ako su jedinice poredane uzlaznim (silaznim) redoslijedom obilježja.

    No, rangirane serije su prilično indikativne kada je to potrebno Usporedne karakteristike varijacije. Osim toga, u mnogim slučajevima imamo posla sa statističkim populacijama koje se sastoje od veliki broj cjeline koje je praktički teško prikazati u obliku određene serije. U tom smislu, radi početnog općeg upoznavanja sa statističkim podacima, a posebno radi lakšeg proučavanja varijacija karakteristika, pojave i procesi koji se proučavaju obično se spajaju u skupine, a rezultati grupiranja prikazuju se u obliku skupnih tablica.

    Ako grupna tablica ima samo dva stupca - grupe prema odabranom svojstvu (opcije) i broj grupa (učestalost ili učestalost), naziva se blizu distribucije.

    Raspon distribucije - najjednostavniji tip strukturnog grupiranja na temelju jedne karakteristike, prikazan u grupnoj tablici s dva stupca koji sadrže varijante i učestalosti obilježja. U mnogim slučajevima, s takvim strukturnim grupiranjem, t.j. Sastavljanjem serija distribucije počinje proučavanje polazne statističke građe.

    Strukturno grupiranje u obliku niza distribucije može se pretvoriti u pravo strukturno grupiranje ako odabrane skupine karakteriziraju ne samo frekvencije, već i druge statistički pokazatelji. Glavna svrha serija distribucije je proučavanje varijacija karakteristika. Teorija serija distribucije detaljno je razvijena matematičkom statistikom.

    Distribucijske serije dijele se na atributivni(grupiranje prema atributskim karakteristikama, npr. podjela stanovništva prema spolu, nacionalnosti, bračnom statusu itd.) i varijacijski(grupiranje po kvantitativnim obilježjima).

    Serije varijacija je skupna tablica koja sadrži dva stupca: grupiranje jedinica prema jednom kvantitativnom svojstvu i broj jedinica u svakoj skupini. Intervali u varijacijskom nizu obično su jednaki i zatvoreni. Niz varijacija je sljedeće grupiranje ruskog stanovništva prema prosjeku po glavi stanovnika novčani prihod(Tablica 3.10).

    Tablica 3.10

    Raspodjela stanovništva Rusije prema prosječnom dohotku po glavi stanovnika u razdoblju 2004.-2009.

    Skupine stanovništva prema prosječnom novčanom dohotku po stanovniku, rub./mjesec

    Stanovništvo u skupini, % od ukupnog broja

    8 000,1-10 000,0

    10 000,1-15 000,0

    15 000,1-25 000,0

    Preko 25.000,00

    Cijelo stanovništvo

    Varijacijski nizovi se pak dijele na diskretne i intervalne. Diskretna serije varijacija kombiniraju varijante diskretnih karakteristika koje variraju unutar uskih granica. Primjer diskretne serije varijacija je distribucija ruskih obitelji prema broju djece koju imaju.

    Interval serije varijacija kombiniraju varijante ili kontinuiranih karakteristika ili diskretnih karakteristika koje variraju u širokom rasponu. Interval je niz varijacija distribucije ruskog stanovništva prema prosječnom novčanom dohotku po glavi stanovnika.

    Diskretni varijacijski nizovi se ne koriste često u praksi. U međuvremenu, njihovo sastavljanje nije teško, budući da je sastav skupina određen specifičnim varijantama koje proučavane karakteristike grupiranja zapravo posjeduju.

    Nizovi intervalnih varijacija su rašireniji. Pri njihovom sastavljanju postavlja se teško pitanje broja skupina, kao i veličine intervala koje treba uspostaviti.

    Načela za rješavanje ovog pitanja navedena su u poglavlju o metodologiji za izradu statističkih grupa (vidi paragraf 3.3).

    Varijacijski nizovi su sredstvo sažimanja ili sažimanja različitih informacija u kompaktni oblik; iz njih se može donijeti prilično jasan sud o prirodi varijacije i proučavati razlike u karakteristikama fenomena uključenih u skup koji se proučava. Ali najvažnije značenje varijacijskih nizova je to što se na njihovoj osnovi izračunavaju posebne generalizirajuće karakteristike varijacije (vidi Poglavlje 7).