Gjennomsnittsverdien av intervallserien. Variasjonsindikatorer: konsept, typer, formler for beregninger

I følge utvalgsundersøkelsen ble innskytere gruppert etter størrelsen på innskuddet deres i byens Sberbank:

Definere:

1) variasjonsomfang;

2) gjennomsnittlig innskuddsstørrelse;

3) gjennomsnittlig lineært avvik;

4) dispersjon;

5) standardavvik;

6) variasjonskoeffisient for bidrag.

Løsning:

Denne distribusjonsserien inneholder åpne intervaller. I slike serier er verdien av intervallet til den første gruppen konvensjonelt antatt å være lik verdien av intervallet til den neste, og verdien av intervallet til den siste gruppen er lik verdien av intervallet til den forrige.

Verdien av intervallet til den andre gruppen er lik 200, derfor er verdien til den første gruppen også lik 200. Verdien av intervallet til den nest siste gruppen er lik 200, noe som betyr at det siste intervallet også vil har en verdi på 200.

1) La oss definere variasjonsområdet som forskjellen mellom de største og laveste verdi skilt:

Variasjonen i innskuddsstørrelsen er 1000 rubler.

2) Den gjennomsnittlige størrelsen på bidraget vil bli bestemt ved hjelp av den vektede aritmetiske gjennomsnittsformelen.

La oss først bestemme den diskrete verdien av attributtet i hvert intervall. For å gjøre dette, ved å bruke den enkle aritmetiske middelverdiformelen, finner vi midtpunktene til intervallene.

Gjennomsnittsverdien av det første intervallet vil være:

den andre - 500, etc.

La oss legge inn beregningsresultatene i tabellen:

Innskuddsbeløp, gni.Antall innskytere, fMidt i intervallet, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Total 400 - 312000

Gjennomsnittlig innskudd i byens Sberbank vil være 780 rubler:

3) Det gjennomsnittlige lineære avviket er det aritmetiske gjennomsnittet av de absolutte avvikene til individuelle verdier av en karakteristikk fra det totale gjennomsnittet:

Fremgangsmåten for å beregne gjennomsnittlig lineært avvik i intervallfordelingsserien er som følger:

1. Det vektede aritmetiske gjennomsnittet beregnes, som vist i avsnitt 2).

2. Absolutte avvik fra gjennomsnittet bestemmes:

3. De resulterende avvikene multipliseres med frekvenser:

4. Finn summen av vektede avvik uten å ta hensyn til tegnet:

5. Summen av vektede avvik er delt på summen av frekvenser:

Det er praktisk å bruke beregningsdatatabellen:

Innskuddsbeløp, gni.Antall innskytere, fMidt i intervallet, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Total 400 - - - 81280

Det gjennomsnittlige lineære avviket i størrelsen på innskuddet til Sberbank-kunder er 203,2 rubler.

4) Dispersjon er det aritmetiske gjennomsnittet av kvadrerte avvik for hver attributtverdi fra det aritmetiske gjennomsnittet.

Beregning av varians i intervallfordelingsserier utføres ved å bruke formelen:

Prosedyren for å beregne varians i dette tilfellet er som følger:

1. Bestem det vektede aritmetiske gjennomsnittet, som vist i avsnitt 2).

2. Finn avvik fra gjennomsnittet:

3. Kvaddra for avviket for hvert alternativ fra gjennomsnittet:

4. Multipliser kvadratene til avvikene med vektene (frekvensene):

5. Oppsummer de resulterende produktene:

6. Den resulterende mengden deles på summen av vektene (frekvensene):

La oss sette beregningene i en tabell:

Innskuddsbeløp, gni.Antall innskytere, fMidt i intervallet, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Total 400 - - - 23040000

Ved statistisk bearbeiding av resultatene av selve forskningen forskjellige typer de oppnådde verdiene er ofte gruppert i en sekvens av intervaller. For å beregne generaliserte sammenstillinger av slike sekvenser, er det noen ganger nødvendig å beregne midten intervall- "sentralt alternativ". Metodene for å beregne det er ganske primitive, men har noen funksjoner som oppstår både fra skalaen som brukes for måling og arten av grupperingen (åpne eller lukkede gap).

Bruksanvisning

1. Hvis intervallet er en del av en konstant numerisk sekvens, bruk vanlige matematiske metoder for å beregne det aritmetiske gjennomsnittet for å finne midten. Minimumsverdi intervall(hans forord) legg til med maksimum (slutt) og del totalen i to - dette er en av metodene for å beregne det aritmetiske gjennomsnittet. La oss si at denne regelen gjelder når vi snakker om om alder intervall X. La oss si, middelaldrende intervall i området fra 21 til 33 år vil merket være 27 år fordi (21+33)/2=27.

2. Noen ganger er det mer praktisk å bruke en annen metode for å beregne det aritmetiske gjennomsnittet mellom øvre og nedre grenser intervall. I dette alternativet bestemmer du først bredden på området - trekk minimumsverdien fra maksimumsverdien. Etter dette, del den resulterende verdien i to og legg summen til minimumsverdien av området. La oss si at hvis den nedre grensen tilsvarer verdien på 47,15, og den øvre grensen tilsvarer 79,13, vil bredden på området være 79,13-47,15 = 31,98. Så midten intervall vil være 63,14 fordi 47,15+(31,98/2) = 47,15+15,99 = 63,14.

3. Hvis intervallet ikke er en del av en vanlig tallsekvens, regner du det ut midten i samsvar med repeterbarheten og dimensjonen til måleskalaen som brukes. La oss si, hvis vi snakker om en historisk periode, så midten intervall vil være en viss kalenderdato. Så for intervall fra 1. januar 2012 til 31. januar 2012 vil midtpunktet være 16. januar 2012.

4. I tillegg til ordinære (lukkede) intervaller kan statistiske forskningsmetoder også operere med «åpne». For slike områder er en av grensene ikke definert. For eksempel kan den åpne perioden spesifiseres med ordlyden "fra 50 år og eldre." Midten i dette tilfellet bestemmes av analogimetoden - hvis alle andre områder av den aktuelle sekvensen har identiske bredder, antas det at dette åpne intervallet har samme dimensjon. I det motsatte tilfellet må du bestemme dynamikken til metamorfose av bredden på hullene foran den åpne, og utlede dens betingede bredde basert på den resulterende tendensen til metamorfose.

Av og til kan det i hverdagslige aktiviteter være behov for å oppdage midten rett linjesegment. For eksempel, hvis du trenger å lage et mønster, en skisse av et produkt, eller enkelt sage en trekloss i to like deler. Geometri og litt hverdagslig oppfinnsomhet kommer til unnsetning.

Du vil trenge

  • Kompass, linjal; nål, blyant, tråd

Bruksanvisning

1. Bruk vanlige verktøy forberedt for lengdemåling. Dette er den enkleste metoden å finne midten segmentet. Mål lengden på segmentet med en linjal eller målebånd, del den resulterende verdien i to og mål den resulterende summen fra den ene enden av segmentet. Du vil få et punkt som tilsvarer midten av segmentet.

2. Det er en mer nøyaktig metode for å finne midtpunktet til et segment, lært fra et skolegeometrikurs. For å gjøre dette, ta et kompass og en linjal, og linjalen kan erstattes av et hvilket som helst objekt av passende lengde med en rett side.

3. Still inn avstanden mellom bena på kompasset slik at den er lik lengden på segmentet eller større enn halvparten av segmentet. Etter dette setter du kompassnålen i den ene enden av segmentet og tegner en halvsirkel slik at den skjærer segmentet. Flytt nålen til den andre enden av segmentet, og uten å endre spennvidden på kompassets ben, tegn den andre halvsirkelen riktig på samme måte.

4. Du har mottatt to skjæringspunkter av halvsirkler på begge sider av segmentet, midten som vi ønsker å oppdage. Kombiner disse to punktene med en linjal eller en flat blokk. Forbindelseslinjen vil passere nøyaktig i midten av segmentet.

5. Hvis du ikke har et kompass for hånden eller lengden på segmentet betydelig overstiger det mulige spennet på bena, kan du bruke en enkel enhet fra improviserte midler. Den kan lages av en vanlig nål, tråd og blyant. Knyt endene av tråden til en nål og en blyant, og lengden på tråden skal litt overstige lengden på segmentet. Med en slik improvisert erstatning for et kompass, gjenstår det bare å følge trinnene beskrevet ovenfor.

Video om emnet

Nyttige råd
Du kan ganske nøyaktig finne midten av et brett eller en blokk ved hjelp av en vanlig tråd eller ledning. For å gjøre dette, kutt tråden slik at den passer til lengden på brettet eller stangen. Det gjenstår bare å brette tråden i to og kutte den i to like deler. Fest den ene enden av den resulterende målingen til enden av objektet som måles, og den andre enden vil tilsvare midten.

Når du beregner det aritmetiske gjennomsnittet for en intervallvariasjonsserie, bestemmer du først gjennomsnittet for hvert intervall som halvsummen av øvre og nedre grense, og deretter gjennomsnittet av hele serien. Ved åpne intervaller bestemmes verdien av det nedre eller øvre intervallet av størrelsen på intervallene ved siden av dem.

Eksempel 3 . Definere gjennomsnittsalder kveldselever.

Alder i år

Antall studenter

Gjennomsnittlig verdi av intervallet

Produkt av midtpunktet i intervallet (alder) og antall elever

opptil 20

(18 + 20) / 2 =19 18 i dette tilfellet, grensen til det nedre intervallet. Beregnet som 20 - (22-20)

20 - 22

(20 + 22) / 2 = 21

22 - 26

(22 + 26) / 2 = 24

26 - 30

(26 + 30) / 2 = 28

30 eller mer

(30 + 34) / 2 = 32

Total

Gjennomsnitt beregnet fra intervallserier er omtrentlige.

  1. Strukturelle gjennomsnitt

I tillegg til effektgjennomsnitt, brukes strukturelle gjennomsnitt i statistikk: modus og median for den relative karakteriseringen av verdien av en varierende karakteristikk og egenskapene til distribusjonsserier.

Mote– Dette er den vanligste varianten av serien. Mote brukes for eksempel til å bestemme størrelsen på klær og sko som er mest etterspurt blant kjøpere.

Modusen for en diskret serie er den med høyest frekvens.

Når du beregner modusen for en intervallvariasjonsserie, må du:

    Bestem først det modale intervallet (ved maksimal frekvens),

    deretter - verdien av den modale verdien av attributtet i henhold til formelen:

Bestemme modusen grafisk: Modusen bestemmes av histogrammet til distribusjonen. For dette

det høyre toppunktet til det modale rektangelet er koblet til det øvre høyre hjørnet av det forrige rektangelet, og det venstre toppunktet til det modale rektangelet er koblet til det øvre venstre hjørnet av det påfølgende rektangelet. Abscissen til skjæringspunktet til disse linjene vil være distribusjonsmodusen.

Median

Median- dette er verdien av karakteristikken som deler variasjonsserien i to like deler.

Median for en diskret serie.

For å bestemme medianer i en diskret seriemed oddetall antall observasjonsenheter først mediantall ved å bruke formelen: , og deretter bestemme hvilken verdi av alternativet som har en akkumulert frekvens lik mediantallet.

Hvis serien inneholder til og med antall elementer, vil medianen være lik gjennomsnittet av de to karakteristiske verdiene plassert i midten. Antallet av det første av disse tegnene bestemmes av formelen: , for det andre - . = n (antall elementer i en rad).

Median for en intervallserie

Ved beregning av medianen for intervallvariasjonsserier Først bestemmes medianintervallet som medianen ligger innenfor.

For dette:

Eksempel . Finn modus og median for intervallserien.

Aldersgrupper

Antall studenter

Summen av akkumulerte frekvenser ΣS

25 - 30

1054

2272

45 år eller mer

Løsning :

    La oss definere mote

I dette eksemplet er det modale intervallet innenfor aldersgruppen 25-30 år, siden dette intervallet har høyest frekvens (1054).

La oss beregne størrelsen på modusen:

Det betyr at elevens modale alder er 27 år.

    La oss bestemme medianen.

Medianintervallet er inne aldersgruppe 25-30 år, siden det innenfor dette intervallet er et alternativ som deler befolkningen i to like deler (Σf Jeg /2 = 3462/2 = 1731). Deretter erstatter vi de nødvendige numeriske dataene i formelen og får medianverdien:

Det betyr at den ene halvparten av elevene er under 27,4 år, og den andre halvparten er over 27,4 år.

Grafisk bestemmes medianen av kumulasjonen. For å bestemme det, er høyden på den største ordinaten, som tilsvarer summen av alle frekvenser, delt i to. Gjennom det mottatte punktet

tegne en rett linje parallelt med abscisseaksen til den skjærer med kumulatet. Abscissen til skjæringspunktet er medianen.

Ofte i statistikk, når man analyserer et fenomen eller en prosess, er det nødvendig å ta hensyn til ikke bare informasjon om gjennomsnittsnivåene til indikatorene som studeres, men også spredning eller variasjon i verdiene til individuelle enheter , som er viktig egenskap befolkningen som studeres.

De mest gjenstand for variasjoner er aksjekurser, tilbud og etterspørselsvolum, renter V ulike perioder tid og på forskjellige steder.

De viktigste indikatorene som karakteriserer variasjonen , er rekkevidde, spredning, standardavvik og variasjonskoeffisient.

Variasjonsområde representerer forskjellen mellom maksimums- og minimumsverdiene for karakteristikken: R = Xmax – Xmin. Ulempen med denne indikatoren er at den kun evaluerer variasjonsgrensene til en egenskap og ikke reflekterer variasjonen innenfor disse grensene.

Spredning mangler denne mangelen. Det beregnes som gjennomsnittlig kvadrat av avvik for attributtverdiene fra deres gjennomsnittsstørrelse:

En forenklet måte å beregne varians på utføres ved å bruke følgende formler (enkle og vektet):

Eksempler på anvendelse av disse formlene er presentert i oppgave 1 og 2.

En mye brukt indikator i praksis er standardavvik :

Standardavviket er definert som Kvadratrot fra variansen og har samme dimensjon som egenskapen som studeres.

De vurderte indikatorene lar oss få den absolutte verdien av variasjonen, dvs. vurdere det i måleenheter for egenskapen som studeres. I motsetning til dem, variasjonskoeffisienten måler variasjon i relative termer - i forhold til gjennomsnittsnivået, som i mange tilfeller er å foretrekke.

Formel for beregning av variasjonskoeffisienten.

Eksempler på å løse problemer om emnet "Indikatorer for variasjon i statistikk"

Oppgave 1 . Ved å studere påvirkningen av reklame på størrelsen på gjennomsnittlig månedlig innskudd i banker i regionen, ble 2 banker undersøkt. Følgende resultater ble oppnådd:

Definere:
1) for hver bank: a) gjennomsnittlig innskudd per måned; b) bidragsspredning;
2) gjennomsnittlig månedlig innskudd for to banker sammen;
3) Innskuddsavvik for 2 banker, avhengig av annonsering;
4) Innskuddsavvik for 2 banker, avhengig av alle faktorer unntatt reklame;
5) Total varians ved bruk av addisjonsregelen;
6) Bestemmelseskoeffisient;
7) Korrelasjonsforhold.

Løsning

1) La oss lage en beregningstabell for en bank med reklame . For å bestemme gjennomsnittlig månedlig innskudd, finner vi midtpunktene til intervallene. I dette tilfellet blir verdien av det åpne intervallet (det første) betinget likestilt med verdien av intervallet ved siden av det (det andre).

Vi vil finne den gjennomsnittlige innskuddsstørrelsen ved å bruke den vektede aritmetiske gjennomsnittsformelen:

29 000/50 = 580 gni.

Vi finner variansen til bidraget ved å bruke formelen:

23 400/50 = 468

Lignende handlinger vi skal produsere for en bank uten reklame :

2) La oss finne den gjennomsnittlige innskuddsstørrelsen for de to bankene sammen. Хср =(580×50+542,8×50)/100 = 561,4 rub.

3) Vi vil finne variansen til innskuddet for to banker, avhengig av reklame, ved å bruke formelen: σ 2 =pq (formel for variansen til et alternativt attributt). Her er p=0,5 andelen faktorer som er avhengig av reklame; q=1-0,5, deretter σ2 =0,5*0,5=0,25.

4) Siden andelen av andre faktorer er 0,5, så er variansen til innskuddet for to banker, avhengig av alle faktorer unntatt reklame, også 0,25.

5) Bestem den totale variansen ved å bruke addisjonsregelen.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 fakta + σ 2 hvile = 552,08+345,96 = 898,04

6) Bestemmelseskoeffisient η 2 = σ 2 fakta / σ 2 = 345,96/898,04 = 0,39 = 39 % - størrelsen på bidraget avhenger av annonsering med 39 %.

7) Empirisk korrelasjonsforhold η = √η 2 = √0,39 = 0,62 – sammenhengen er ganske nær.

Oppgave 2 . Det er en gruppering av foretak i henhold til størrelsen på salgbare produkter:

Bestem: 1) spredningen av verdien av salgbare produkter; 2) standardavvik; 3) variasjonskoeffisient.

Løsning

1) Etter betingelse presenteres en intervallfordelingsserie. Det må uttrykkes diskret, det vil si finne midten av intervallet (x"). I grupper med lukkede intervaller finner vi midten ved hjelp av et enkelt aritmetisk gjennomsnitt. I grupper med øvre grense - som differansen mellom denne øvre grensen og halvparten av det neste intervallet (200-(400 -200):2=100).

I grupper med en nedre grense - summen av denne nedre grensen og halvparten av størrelsen på forrige intervall (800+(800-600):2=900).

Vi beregner gjennomsnittsverdien av salgbare produkter ved å bruke formelen:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Her er a=500 størrelsen på alternativet ved den høyeste frekvensen, k=600-400=200 er størrelsen på intervallet ved den høyeste frekvensen La oss sette resultatet i tabellen:

Så gjennomsnittsverdien av kommersiell produksjon for perioden som studeres er generelt lik Хср = (-5:37)×200+500=472,97 tusen rubler.

2) Vi finner variansen ved å bruke følgende formel:

σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) standardavvik: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 tusen rubler.

4) variasjonskoeffisient: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52 %

Eksempel : Det kreves for å bestemme gjennomsnittsalderen til eleven korrespondanseskjema trening i henhold til dataene spesifisert i følgende tabell:

Elevers alder, år ( X)

Antall studenter, personer ( f)

gjennomsnittsverdien av intervallet (x", xsentral)

xi*fJeg

26 og eldre

Total:

For å beregne gjennomsnittet i intervallserier, bestemmer du først gjennomsnittsverdien av intervallet som halvsummen av øvre og nedre grenser, og beregner deretter gjennomsnittet ved å bruke den aritmetiske vektede gjennomsnittsformelen.

Ovenfor er et eksempel med like intervaller, hvor den første og siste er åpen.

Svar: Gjennomsnittlig studentalder er 22,6 år, eller omtrent 23 år.

Harmonisk middel har en mer kompleks struktur enn det aritmetiske gjennomsnittet. Brukes i tilfeller hvor statistisk informasjon inneholder ikke frekvenser for enkeltpersoner verdier av attributtet, og er representert ved produktet av attributtverdien av Frekvens . Det harmoniske middelet som en type kraftmiddel ser slik ut:

Avhengig av presentasjonsformen til kildedataene kan det harmoniske gjennomsnittet beregnes som enkelt eller vektet. Hvis kildedataene ikke er gruppert, da gjennomsnitt harmonisk enkel :

Det brukes i tilfeller av å bestemme for eksempel gjennomsnittskostnadene for arbeid, materialer osv. per produksjonsenhet for flere bedrifter.

Når du arbeider med grupperte data, bruk harmonisk middelveid:

Geometrisk gjennomsnittgjelder i tilfeller hvor når det totale volumet av den gjennomsnittlige funksjonen er en multiplikativ størrelse,de. bestemmes ikke ved å summere, men ved å multiplisere de individuelle verdiene til karakteristikken.

Form av geometrisk vektet gjennomsnitt i praktiske beregninger ikke aktuelt .

Gjennomsnittlig firkant brukes i tilfeller der, når du erstatter individuelle verdier av en karakteristikk med en gjennomsnittsverdi, er det nødvendig å holde summen av kvadrater av de opprinnelige verdiene uendret .

hjem omfanget av bruken – måling av fluktuasjonsgraden av individuelle verdier av en karakteristikk i forhold til det aritmetiske gjennomsnittet(standardavvik). I tillegg den gjennomsnittlige kvadratet brukes i tilfeller hvor det er nødvendig å beregne gjennomsnittsverdien en egenskap uttrykt i kvadratiske eller kubiske måleenheter (ved beregning av gjennomsnittlig størrelse på kvadratiske områder, gjennomsnittlige diametre rør, stammer osv.).

Rotgjennomsnittet beregnes i to former:

Alle kraftmidler skiller seg fra hverandre i verdiene til eksponenten. hvori, jo høyere eksponent, jo merkvantitativ verdi av gjennomsnittet:

Denne egenskapen til effektgjennomsnitt kalles egenskap med hovedvekt av gjennomsnitt.