Il valore medio della serie di intervalli. Indicatori di variazione: concetto, tipologie, formule per i calcoli

Secondo l’indagine campionaria, i depositanti sono stati raggruppati in base all’entità del loro deposito presso la Sberbank della città:

Definire:

1) ambito di variazione;

2) dimensione media del deposito;

3) deviazione lineare media;

4) dispersione;

5) deviazione standard;

6) coefficiente di variazione dei contributi.

Soluzione:

Questa serie di distribuzione contiene intervalli aperti. In tali serie, si assume convenzionalmente che il valore dell'intervallo del primo gruppo sia uguale al valore dell'intervallo del successivo, e il valore dell'intervallo dell'ultimo gruppo sia uguale al valore dell'intervallo del precedente.

Il valore dell'intervallo del secondo gruppo è pari a 200, quindi anche il valore del primo gruppo è pari a 200. Il valore dell'intervallo del penultimo gruppo è pari a 200, il che significa che anche l'ultimo intervallo sarà hanno un valore di 200.

1) Definiamo l'intervallo di variazione come la differenza tra il più grande e valore più basso cartello:

L'intervallo di variazione dell'importo del deposito è di 1000 rubli.

2) L'entità media del contributo sarà determinata utilizzando la formula della media aritmetica ponderata.

Determiniamo innanzitutto il valore discreto dell'attributo in ciascun intervallo. Per fare ciò, utilizzando la semplice formula della media aritmetica, troviamo i punti medi degli intervalli.

Il valore medio del primo intervallo sarà:

il secondo - 500, ecc.

Inseriamo i risultati del calcolo nella tabella:

Importo del deposito, strofinare.Numero di depositanti, fMetà dell'intervallo, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Totale 400 - 312000

Il deposito medio nella Sberbank della città sarà di 780 rubli:

3) La deviazione lineare media è la media aritmetica delle deviazioni assolute dei singoli valori di una caratteristica dalla media complessiva:

La procedura per calcolare la deviazione lineare media nella serie di distribuzione degli intervalli è la seguente:

1. Si calcola la media aritmetica ponderata, come indicato al comma 2).

2. Le deviazioni assolute dalla media sono determinate:

3. Le deviazioni risultanti vengono moltiplicate per le frequenze:

4. Trova la somma delle deviazioni ponderate senza tenere conto del segno:

5. La somma delle deviazioni ponderate è divisa per la somma delle frequenze:

È conveniente utilizzare la tabella dei dati di calcolo:

Importo del deposito, strofinare.Numero di depositanti, fMetà dell'intervallo, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Totale 400 - - - 81280

La deviazione lineare media dell'entità del deposito dei clienti Sberbank è di 203,2 rubli.

4) La dispersione è la media aritmetica delle deviazioni al quadrato di ciascun valore di attributo dalla media aritmetica.

Il calcolo della varianza nelle serie di distribuzione di intervalli viene effettuato utilizzando la formula:

La procedura per calcolare la varianza in questo caso è la seguente:

1. Determinare la media aritmetica ponderata, come indicato al paragrafo 2).

2. Trova le deviazioni dalla media:

3. Eleva al quadrato la deviazione di ciascuna opzione dalla media:

4. Moltiplicare i quadrati delle deviazioni per i pesi (frequenze):

5. Riassumi i prodotti risultanti:

6. L'importo risultante viene diviso per la somma dei pesi (frequenze):

Mettiamo i calcoli in una tabella:

Importo del deposito, strofinare.Numero di depositanti, fMetà dell'intervallo, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Totale 400 - - - 23040000

Quando si elaborano statisticamente i risultati della ricerca stessa vari tipi i valori ottenuti sono spesso raggruppati in una sequenza di intervalli. Per calcolare le regole di confronto generalizzate di tali sequenze, a volte è necessario calcolare mezzo intervallo- “opzione centrale”. I metodi per calcolarlo sono piuttosto primitivi, ma presentano alcune caratteristiche derivanti sia dalla scala utilizzata per la misurazione sia dalla natura del raggruppamento (gap aperti o chiusi).

Istruzioni

1. Se l'intervallo è una sezione di una sequenza numerica costante, per trovare la sua metà, utilizzare i normali metodi matematici per calcolare la media aritmetica. Valore minimo intervallo(la sua prefazione) aggiungi il massimo (fine) e dividi il totale a metà: questo è uno dei metodi per calcolare la media aritmetica. Diciamo che questa regola si applica quando stiamo parlando circa l'età intervallo X. Diciamo, di mezza età intervallo nella fascia dai 21 ai 33 anni il voto avrà 27 anni perché (21+33)/2=27.

2. A volte è più conveniente utilizzare un altro metodo per calcolare la media aritmetica tra i limiti superiore e inferiore intervallo. In questa opzione, determina prima la larghezza dell'intervallo: sottrai il valore minimo dal valore massimo. Successivamente, dividi il valore risultante a metà e aggiungi il totale al valore minimo dell'intervallo. Diciamo che se il limite inferiore corrisponde al valore di 47,15 e il limite superiore corrisponde a 79,13, la larghezza dell'intervallo sarà 79,13-47,15 = 31,98. Poi il mezzo intervallo sarà 63,14 perché 47,15+(31,98/2) = 47,15+15,99 = 63,14.

3. Se l'intervallo non fa parte di una sequenza numerica ordinaria, calcolalo mezzo in conformità con la ripetibilità e la dimensione della scala di misurazione utilizzata. Diciamo che se stiamo parlando di un periodo storico, allora la metà intervallo sarà una cosa certa data del calendario. Quindi per intervallo dal 1 gennaio 2012 al 31 gennaio 2012, il punto medio sarà il 16 gennaio 2012.

4. Oltre agli intervalli ordinari (chiusi), i metodi di ricerca statistica possono operare anche con quelli “aperti”. Per tali intervalli, uno dei confini non è definito. Ad esempio, il periodo aperto può essere specificato con la dicitura “dai 50 anni in su”. Il centro in questo caso è determinato dal metodo delle analogie: se tutti gli altri intervalli della sequenza in questione hanno la stessa larghezza, si presume che questo intervallo aperto abbia la stessa dimensione. Nel caso opposto, è necessario determinare la dinamica della metamorfosi della larghezza degli spazi precedenti quello aperto e derivarne l'ampiezza condizionale in base alla conseguente tendenza alla metamorfosi.

Occasionalmente nelle attività quotidiane potrebbe essere necessario rilevare mezzo segmento di retta. Ad esempio, se devi realizzare un modello, uno schizzo di un prodotto o segare facilmente un blocco di legno in due parti uguali. La geometria e un po' di ingegno quotidiano vengono in soccorso.

Ne avrai bisogno

  • Bussola, righello; spillo, matita, filo

Istruzioni

1. Utilizzare strumenti comuni predisposti per la misurazione della lunghezza. Questo è il metodo più semplice per trovarlo mezzo segmento. Misurare la lunghezza del segmento con un righello o un metro a nastro, dividere il valore risultante a metà e misurare il totale risultante da un'estremità del segmento. Otterrai un punto corrispondente al centro del segmento.

2. Esiste un metodo più accurato per trovare il punto medio di un segmento, imparato da un corso di geometria a scuola. Per fare questo, prendi una bussola e un righello e il righello può essere sostituito con qualsiasi oggetto di lunghezza adeguata con un lato dritto.

3. Impostare la distanza tra le gambe della bussola in modo che sia uguale alla lunghezza del segmento o maggiore della metà del segmento. Successivamente, posiziona l'ago della bussola a un'estremità del segmento e disegna un semicerchio in modo che intersechi il segmento. Sposta l'ago all'altra estremità del segmento e, senza modificare l'apertura delle gambe del compasso, disegna correttamente il secondo semicerchio allo stesso modo.

4. Hai ricevuto due punti di intersezione di semicerchi su entrambi i lati del segmento, mezzo che vogliamo scoprire. Combina questi due punti usando un righello o un blocco piatto. La linea di collegamento passerà esattamente al centro del segmento.

5. Se non hai una bussola a portata di mano o la lunghezza del segmento supera significativamente la possibile estensione delle sue gambe, puoi utilizzare un semplice dispositivo con mezzi improvvisati. Può essere realizzato con uno spillo, un filo e una matita normali. Lega le estremità del filo a uno spillo e una matita e la lunghezza del filo dovrebbe superare leggermente la lunghezza del segmento. Con un sostituto così improvvisato della bussola, non resta che seguire i passaggi sopra descritti.

Video sull'argomento

Consigli utili
Puoi individuare con precisione il centro di una tavola o di un blocco utilizzando un normale filo o una corda. Per fare ciò, tagliare il filo in modo che corrisponda alla lunghezza della tavola o della barra. Non resta che piegare il filo a metà e tagliarlo in due parti uguali. Attacca un'estremità della misurazione risultante all'estremità dell'oggetto da misurare e la seconda estremità corrisponderà al suo centro.

Quando si calcola la media aritmetica per una serie di variazioni di intervallo, determinare innanzitutto la media per ciascun intervallo come semisomma dei limiti superiore e inferiore, quindi la media dell'intera serie. Nel caso di intervalli aperti, il valore dell'intervallo inferiore o superiore è determinato dalla dimensione degli intervalli ad essi adiacenti.

Esempio 3 . Definire mezza età studenti serali.

Età in anni

Numero di studenti

Valore medio dell'intervallo

Prodotto del punto medio dell'intervallo (età) e del numero di studenti

fino a 20

(18 + 20) / 2 =19 18 in questo caso, il limite dell'intervallo inferiore. Calcolato come 20 - (22-20)

20 - 22

(20 + 22) / 2 = 21

22 - 26

(22 + 26) / 2 = 24

26 - 30

(26 + 30) / 2 = 28

30 o più

(30 + 34) / 2 = 32

Totale

Le medie calcolate dalle serie di intervalli sono approssimative.

  1. Medie strutturali

Oltre alle medie di potenza, in statistica, per la caratterizzazione relativa del valore di una caratteristica variabile e delle caratteristiche delle serie di distribuzione, vengono utilizzate le medie strutturali: moda e mediana.

Moda- Questa è la variante più comune della serie. La moda viene utilizzata, ad esempio, per determinare la taglia dei vestiti e delle scarpe più richieste dai clienti.

La modalità per una serie discreta è quella con la frequenza più alta.

Quando si calcola la moda per una serie di variazioni di intervallo, è necessario:

    determinare innanzitutto l'intervallo modale (per frequenza massima),

    quindi - il valore del valore modale dell'attributo secondo la formula:

Determinazione grafica della modalità: La modalità è determinata dall'istogramma della distribuzione. Per questo

il vertice destro del rettangolo modale è collegato all'angolo superiore destro del rettangolo precedente, e il vertice sinistro del rettangolo modale è collegato all'angolo superiore sinistro del rettangolo successivo. L'ascissa del punto di intersezione di queste linee sarà la modalità di distribuzione.

Mediano

Mediano- è il valore della caratteristica che divide la serie di variazione in due parti uguali.

Mediana per una serie discreta.

Per determinare mediane in una serie discretacon dispari prima il numero di unità di osservazione numero mediano utilizzando la formula: , quindi determinare quale valore dell'opzione ha una frequenza accumulata pari al numero mediano.

Se la serie contiene Anche numero di elementi, allora la mediana sarà pari alla media dei due valori caratteristici posti al centro. Il numero del primo di questi segni è determinato dalla formula: , per il secondo - . = n (numero di elementi in una riga).

Mediana per una serie di intervalli

Quando si calcola la mediana per le serie a variazione di intervallo Innanzitutto viene determinato l’intervallo mediano entro il quale si trova la mediana.

Per fare questo:

Esempio . Trova la moda e la mediana per la serie di intervalli.

Gruppi di età

Numero di studenti

Somma delle frequenze accumulate ΣS

25 - 30

1054

2272

45 anni o più

Soluzione :

    Definiamo la moda

In questo esempio, l'intervallo modale rientra nella fascia di età 25-30 anni, poiché questo intervallo ha la frequenza più alta (1054).

Calcoliamo l'entità della modalità:

Ciò significa che l’età modale degli studenti è di 27 anni.

    Determiniamo la mediana.

L'intervallo mediano è dentro fascia di età 25-30 anni, poiché all'interno di questo intervallo esiste un'opzione che divide la popolazione in due parti uguali (Σf io /2 = 3462/2 = 1731). Successivamente, sostituiamo i dati numerici necessari nella formula e otteniamo il valore della mediana:

Ciò significa che la metà degli studenti ha meno di 27,4 anni e l'altra metà ha più di 27,4 anni.

Graficamente, la mediana è determinata dal cumulo. Per determinarlo si divide a metà l'altezza dell'ordinata maggiore, che corrisponde alla somma di tutte le frequenze. Attraverso il punto ricevuto

tracciare una linea retta parallela all'asse delle ascisse fino ad intersecare il cumulo. L'ascissa del punto di intersezione è la mediana.

Spesso nelle statistiche, quando si analizza un fenomeno o un processo, è necessario tenere conto non solo delle informazioni sui livelli medi degli indicatori studiati, ma anche dispersione o variazione dei valori delle singole unità , che è caratteristica importante la popolazione oggetto di studio.

I più soggetti a variazione sono i prezzi delle azioni, i volumi della domanda e dell’offerta, tassi di interesse V periodi diversi tempo e in luoghi diversi.

I principali indicatori che caratterizzano la variazione , sono intervallo, dispersione, deviazione standard e coefficiente di variazione.

Gamma di variazione rappresenta la differenza tra i valori massimo e minimo della caratteristica: R = Xmax – Xmin. Lo svantaggio di questo indicatore è che valuta solo i limiti di variazione di un tratto e non riflette la sua variabilità entro questi confini.

Dispersione manca questa mancanza. Viene calcolato come il quadrato medio delle deviazioni dei valori degli attributi dai loro dimensione media:

Un modo semplificato per calcolare la varianza effettuata utilizzando le seguenti formule (semplici e ponderate):

Esempi di applicazione di queste formule sono presentati nelle attività 1 e 2.

Un indicatore ampiamente utilizzato nella pratica è deviazione standard :

La deviazione standard è definita come radice quadrata dalla varianza e ha la stessa dimensione del tratto studiato.

Gli indicatori considerati ci permettono di ottenere il valore assoluto della variazione, ovvero valutarlo in unità di misura della caratteristica oggetto di studio. A differenza di loro, coefficiente di variazione misura la variabilità in termini relativi, rispetto al livello medio, che in molti casi è preferibile.

Formula per il calcolo del coefficiente di variazione.

Esempi di risoluzione di problemi sull'argomento "Indicatori di variazione nelle statistiche"

Problema 1 . Nello studio dell'influenza della pubblicità sull'entità del deposito mensile medio nelle banche della regione, sono state esaminate 2 banche. Sono stati ottenuti i seguenti risultati:

Definire:
1) per ciascuna banca: a) deposito medio mensile; b) dispersione contributiva;
2) il deposito medio mensile di due banche insieme;
3) Variazione dei depositi per 2 banche, a seconda della pubblicità;
4) Variazione dei depositi per 2 banche, dipendente da tutti i fattori tranne la pubblicità;
5) Varianza totale utilizzando la regola dell'addizione;
6) Coefficiente di determinazione;
7) Rapporto di correlazione.

Soluzione

1) Creiamo una tabella di calcolo per una banca con pubblicità . Per determinare il deposito mensile medio, troveremo i punti medi degli intervalli. In questo caso il valore dell'intervallo aperto (il primo) è condizionalmente equiparato al valore dell'intervallo ad esso adiacente (il secondo).

Troveremo la dimensione media del deposito utilizzando la formula della media aritmetica ponderata:

29.000/50 = 580 rubli.

Troviamo la varianza del contributo utilizzando la formula:

23 400/50 = 468

Azioni simili produrremo per una banca senza pubblicità :

2) Troviamo insieme la dimensione media del deposito per le due banche. Хср =(580×50+542,8×50)/100 = 561,4 rub.

3) Troveremo la varianza del deposito per due banche, a seconda della pubblicità, utilizzando la formula: σ 2 =pq (formula per la varianza di un attributo alternativo). Qui p=0,5 è la proporzione dei fattori dipendenti dalla pubblicità; q=1-0,5, allora σ2 =0,5*0,5=0,25.

4) Poiché la quota degli altri fattori è 0,5, anche la varianza del deposito per due banche, che dipende da tutti i fattori tranne la pubblicità, è 0,25.

5) Determinare la varianza totale utilizzando la regola dell'addizione.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 fatto + σ 2 resto = 552,08+345,96 = 898,04

6) Coefficiente di determinazione η 2 = σ 2 fatto / σ 2 = 345,96/898,04 = 0,39 = 39% - l'entità del contributo dipende per il 39% dalla pubblicità.

7) Rapporto di correlazione empirica η = √η 2 = √0,39 = 0,62 – la relazione è abbastanza stretta.

Problema 2 . Esiste un raggruppamento di imprese in base alla dimensione dei prodotti commerciabili:

Determinare: 1) la dispersione del valore dei prodotti commerciabili; 2) deviazione standard; 3) coefficiente di variazione.

Soluzione

1) Per condizione, viene presentata una serie di distribuzioni di intervalli. Deve essere espresso in modo discreto, cioè trovare il centro dell'intervallo (x"). Nei gruppi di intervalli chiusi, troviamo il centro utilizzando una semplice media aritmetica. Nei gruppi con un limite superiore - come la differenza tra questo limite superiore e metà della dimensione dell'intervallo successivo (200-(400 -200):2=100).

Nei gruppi con un limite inferiore: la somma di questo limite inferiore e metà della dimensione dell'intervallo precedente (800+(800-600):2=900).

Calcoliamo il valore medio dei prodotti commerciabili utilizzando la formula:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Qui a=500 è la dimensione dell'opzione alla frequenza più alta, k=600-400=200 è la dimensione dimensione dell'intervallo alla frequenza più alta Inseriamo il risultato nella tabella:

Pertanto, il valore medio della produzione commerciale per il periodo in esame è generalmente pari a Хср = (-5:37)×200+500=472,97 mila rubli.

2) Troviamo la varianza utilizzando la seguente formula:

σ2 = (33/37)*2002-(472,97-500)2 = 35.675,67-730,62 = 34.945,05

3) deviazione standard: σ = ±√σ 2 = ±√34.945,05 ≈ ±186,94 mila rubli.

4) coefficiente di variazione: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

Esempio : È necessario determinare l'età media dello studente modulo di corrispondenza allenamento secondo i dati specificati nella seguente tabella:

Età degli studenti, anni ( X)

Numero di studenti, persone ( F)

valore medio dell'intervallo (x",xcentrale)

xi*Fio

26 anni e più

Totale:

Per calcolare la media nelle serie di intervalli, determinare innanzitutto il valore medio dell'intervallo come semisomma dei limiti superiore e inferiore, quindi calcolare la media utilizzando la formula della media aritmetica ponderata.

Sopra c'è un esempio con intervalli uguali, con il primo e l'ultimo aperti.

Risposta: L'età media degli studenti è di 22,6 anni, ovvero circa 23 anni.

Media armonica ha una struttura più complessa della media aritmetica. Utilizzato nei casi in cui le informazioni statistiche non contengono frequenze individuali valori dell'attributo ed è rappresentato dal prodotto del valore dell'attributo per frequenza . La media armonica come tipo di media di potenza si presenta così:

A seconda della forma di presentazione dei dati sorgente, la media armonica può essere calcolata come semplice o ponderata. Se i dati di origine non sono raggruppati, allora media armonico semplice :

Viene utilizzato nei casi in cui si determinano, ad esempio, i costi medi di manodopera, materiali, ecc. Per unità di produzione per diverse imprese.

Quando si lavora con dati raggruppati, utilizzare media armonica ponderata:

Media geometricasi applica nei casi in cui quando il volume totale della caratteristica media è una quantità moltiplicativa,quelli. è determinato non sommando, ma moltiplicando i singoli valori della caratteristica.

Forma della media geometrica ponderata nei calcoli pratici non applicabile .

Quadrato medio utilizzato nei casi in cui, sostituendo i singoli valori di una caratteristica con un valore medio, è necessario mantenere invariata la somma dei quadrati dei valori originali .

Casa ambito del suo utilizzo – misurazione del grado di fluttuazione dei singoli valori di una caratteristica rispetto alla media aritmetica(deviazione standard). Inoltre, il quadrato medio utilizzato nei casi in cui è necessario calcolare il valore medio caratteristica espressa in unità di misura quadrate o cubiche (nel calcolare la dimensione media delle aree quadrate, i diametri medi tubi, tronchi, ecc.).

La radice quadrata media viene calcolata in due forme:

Tutti i mezzi di potenza differiscono l'uno dall'altro nei valori dell'esponente. Allo stesso tempo, più alto è l'esponente, maggiore è il valorevalore quantitativo della media:

Questa proprietà delle medie di potenza si chiama proprietà della maggioranza delle medie.