Quando utilizzare la formula di Bayes. Formula della probabilità totale

Comprendere (studiare) la probabilità inizia dove finisce il corso classico di teoria della probabilità. Per qualche motivo, nelle scuole e nelle università insegnano la probabilità di frequenza (combinatoria), ovvero la probabilità di ciò che viene determinato. Il cervello umano funziona diversamente. Abbiamo teorie (opinioni) su tutto nel mondo. Valutiamo soggettivamente la probabilità di determinati eventi. Possiamo anche cambiare idea se succede qualcosa di inaspettato. Questo è ciò che facciamo ogni giorno. Ad esempio, se incontri un'amica al monumento a Pushkin, capisci se arriverà puntuale, con 15 minuti di ritardo o con mezz'ora di ritardo. Ma quando esci in piazza dalla metropolitana e vedi 20 cm di neve fresca, aggiornerai le tue probabilità per tenere conto dei nuovi dati.

Questo approccio è stato descritto per la prima volta da Bayes e Laplace. Sebbene Laplace, penso che non avesse familiarità con il lavoro di Bayes. Per ragioni a me sconosciute, l’approccio bayesiano è piuttosto scarsamente rappresentato nella letteratura di lingua russa. Per fare un confronto, noto che quando viene richiesto Bayes, Ozon produce 4 collegamenti e Amazon - circa 1000.

Questa nota è una traduzione di un piccolo libro inglese e ti fornirà una comprensione intuitiva di come utilizzare il Teorema di Bayes. Inizia con una definizione e poi utilizza esempi in Excel per aiutarti a seguire l'intero ragionamento.

Scott Hartshorn. Esempi di teoremi di Bayes: una guida visiva per principianti. – 2016, 82 pag.

Scarica la nota in formato o, esempi in formato

Definizione del Teorema di Bayes e spiegazione intuitiva

Teorema di Bayes

dove A e B sono eventi, P(A) e P(B) sono le probabilità di A e B senza tener conto l'uno dell'altro, P(A|B) è la probabilità condizionata dell'evento A purché B sia vero, P (B|A) è la probabilità condizionata di B se A è vera.

In realtà l’equazione è un po’ più complicata, ma per la maggior parte delle applicazioni è sufficiente. Il risultato del calcolo è semplicemente un valore ponderato normalizzato basato sull'ipotesi originale. Quindi, prendi la tua ipotesi iniziale, confrontala con altre possibilità iniziali, normalizzala in base all'osservazione:

Man mano che risolviamo i problemi, eseguiremo i seguenti passaggi (diventeranno più chiari in seguito):

  1. Determina quali probabilità vogliamo calcolare e quali osserviamo.
  2. Stimare le probabilità iniziali per tutte le possibili opzioni.
  3. Assumendo la verità di una certa opzione iniziale, calcola la probabilità della nostra osservazione; e così via per tutte le opzioni iniziali.
  4. Trova il valore ponderato come prodotto della probabilità iniziale (passaggio 2) e della probabilità condizionata (passaggio 3), e così via per ciascuna delle opzioni iniziali.
  5. Normalizzare i risultati: dividere ciascuna probabilità ponderata (passaggio 4) per la somma di tutte le probabilità ponderate; somma delle probabilità normalizzate = 1.
  6. Ripetere i passaggi 2-5 per ogni nuova osservazione.

Esempio 1. Esempio semplice con i dadi

Diciamo che il tuo amico ha 3 dadi: con 4, 6 e 8 facce. Ne seleziona uno a caso, non te lo mostra, lo lancia e riporta il risultato - 2. Calcola la probabilità che sia stato scelto un 4 lati, 6 lati o 8 lati.

Passaggio 1. Vogliamo calcolare la probabilità di scegliere un 4-edro, un 6-edro o un 8-edro. Vediamo il numero estratto - 2.

Passaggio 2. Dato che c'erano 3 dadi, la probabilità iniziale di sceglierne ciascuno è 1/3.

Passaggio 3. Osservazione: il dado è caduto sul lato 2. Se è stato preso un lato a 4 facce, le probabilità che ciò accada sono 1/4. Per un dado a 6 facce, le probabilità di ottenere un 2 sono 1/6. Per un ottaedro – 1/8.

Passaggio 4. Lanciare un 2 per un 4 facce = 1/3 * 1/4 = 1/12, per un 6 facce = 1/3 * 1/6 = 1/18, per un 8 facce = 1/ 3 * 1/8 = 1/24.

Passaggio 5. Probabilità totale che esca 2 = 1/12 + 1/18 + 1/24 = 13/72. Questo numero è inferiore a 1 perché le probabilità di lanciare un 2 sono inferiori a 1. Ma sappiamo che abbiamo già lanciato un 2. Pertanto, dobbiamo dividere le probabilità di ciascuna opzione del passaggio 4 per 13/72 in modo che la somma di tutte le probabilità per tutti i dadi che siano 2° sia uguale a 1. Questo processo è chiamato normalizzazione.

Normalizzando ciascuna probabilità ponderata, troviamo la probabilità che sia stato scelto questo particolare dado:

  • tetragono = (1/12) / (13/72) = 6/13
  • Esagono = (1/18) / (13/72) = 4/13
  • Ottaedro = (1/24) / (13/72) = 3/13

E questa è la risposta.

Quando abbiamo iniziato a risolvere il problema, abbiamo ipotizzato che la probabilità di scegliere un particolare osso fosse del 33,3%. Dopo aver lanciato un 2, abbiamo calcolato che le probabilità che fosse scelto inizialmente quello a 4 facce aumentavano al 46,1%, le probabilità di scegliere quello a 6 facce diminuivano al 30,8% e le probabilità che fosse scelto quello a 8 facce diminuivano completamente fino al 23,1%.

Facendo un altro tiro, potremmo utilizzare le nuove percentuali calcolate come ipotesi iniziali e perfezionare le probabilità in base alla seconda osservazione.

Se hai una sola osservazione, è conveniente presentare tutti i passaggi sotto forma di tabella:

Tavolo. 1. Soluzione passo passo sotto forma di tabella (per le formule vedere il file Excel sul foglio Esempio 1)

Notare che:

  • Se invece del 2, ad esempio, fosse uscito un 7, allora le probabilità al passo 3 per quelli a 4 e 6 facce sarebbero state pari a zero, e dopo la normalizzazione le probabilità per quelli a 8 facce sarebbero state 100 %.
  • Poiché l'esempio prevede solo tre dadi e un lancio, abbiamo utilizzato frazioni semplici. Per la maggior parte dei problemi con un gran numero di opzioni ed eventi, è più semplice lavorare con i decimali.

Esempio 2: più ossa. Altri lanci

Questa volta abbiamo 6 dadi con 4, 6, 8, 10, 12 e 20 facce. Ne scegliamo uno a caso e lo lanciamo 15 volte. Qual è la probabilità che sia stato scelto un particolare osso?

Utilizzo un modello in Excel (Figura 1; vedere foglio Esempio 2). I numeri casuali vengono generati nella colonna B utilizzando la funzione =RANDBETWEEN(1,$B$9). In questo caso, nella cella B9 è selezionato un ottagono, quindi i numeri casuali possono variare da 1 a 8. Poiché Excel aggiorna i numeri casuali dopo ogni modifica nel foglio di lavoro, ho copiato la colonna B negli appunti e incollato solo i valori in colonna C. Ora i valori non cambiano e verranno utilizzati per i disegni successivi. (Ho aggiunto la possibilità di "giocare" scegliendo il numero di lati e rotoli casuali sul foglio Esempio di gioco 2. Risultati particolarmente interessanti si ottengono impostando il numero 13 nella cella B9 🙂 – Nota Baguzina.)

Riso. 1. Generatore di numeri casuali

Passaggio 2. Poiché ci sono solo sei dadi, la probabilità di sceglierne uno a caso è 1/6 o 0,167.

Passaggi 3 e 4. Scrivi un'equazione per la probabilità di scegliere inizialmente un particolare dado dopo il lancio corrispondente. Come abbiamo visto alla fine dell'esempio 1, alcuni tiri potrebbero non corrispondere a determinati dadi. Ad esempio, lanciando un 9 la probabilità di un dado a 4, 6 e 8 facce è pari a zero. Se viene lanciato un numero “legittimo”, la sua probabilità per un dato dado è uguale a uno diviso per il numero di facce. Per comodità, abbiamo combinato i passaggi 3 e 4, quindi annotiamo immediatamente la formula per la probabilità di un lancio moltiplicata per la probabilità normalizzata dopo il lancio precedente (Fig. 2):

SE(rotolo > numero di facce; 0; 1/numero di facce * probabilità normalizzata precedente)

Se lo usi con attenzione, puoi trascinare questa formula su tutte le linee.

Riso. 2. Equazione delle probabilità; Per ingrandire l'immagine, fare clic destro su di essa e selezionare Apri l'immagine in una nuova scheda

Passaggio 5. L'ultimo passaggio consiste nel normalizzare i risultati dopo ogni lancio (area L11:R28 in Fig. 3).

Riso. 3. Normalizzazione dei risultati

Quindi, dopo 15 lanci, con una probabilità del 96,4%, possiamo supporre di aver inizialmente scelto il dado a 8 facce. Anche se ci sono ancora possibilità che sia stato scelto l'osso con b O un numero maggiore di facce: 3,4% per un dado a 10 facce, 0,2% per un dado a 12 facce, 0,0001% per un dado a 20 facce. Ma la probabilità dei dadi a 4 e 6 facce è zero, poiché i numeri estratti erano 7 e 8. Ciò corrisponde naturalmente al fatto che abbiamo inserito il numero 8 nella cella B9, limitando i valori per il numero casuale generatore.

Se tracciamo la probabilità di ogni scelta iniziale del dado, lancio per lancio, vedremo (Figura 4):

  • Dopo il primo lancio, la probabilità di scegliere un dado a 4 facce scende a zero, poiché viene immediatamente lanciato un 6. Pertanto, la leadership è stata presa dalla variante del dado a 6 facce.
  • Per i primi lanci, il dado a 6 facce ha la probabilità più alta perché ha il minor numero di facce tra i dadi che possono essere lanciati.
  • Al quinto lancio esce un 8, la probabilità del 6 facce scende a zero e l'8 facce diventa il leader.
  • Le probabilità dei dadi a 10, 12 e 20 facce sono gradualmente diminuite durante i primi lanci, per poi registrare un picco quando il dado a 6 facce è uscito dalla corsa. Questo perché i risultati sono stati normalizzati su un campione molto più piccolo.

Riso. 4. Modificare le probabilità lancio dopo lancio

Notare che:

  • Il teorema di Bayes per eventi multipli è semplicemente una moltiplicazione ripetuta su dati aggiornati sequenzialmente. La risposta finale non dipende dall’ordine in cui si sono verificati gli eventi.
  • Non è necessario normalizzare le probabilità dopo ogni evento. Puoi farlo una volta alla fine. Il problema è che se non si normalizza regolarmente, le probabilità diventano così piccole che Excel potrebbe non funzionare correttamente a causa di errori di arrotondamento. Quindi è più pratico normalizzare ad ogni passaggio piuttosto che verificare se sei vicino al limite di precisione di Excel.

Teorema di Bayes. Terminologia

  • Viene chiamata probabilità iniziale, la probabilità di ciascuna possibilità prima che si verifichi l'osservazione a priori.
  • Viene chiamata la risposta normalizzata dopo aver calcolato la probabilità per ciascun punto dati (per ciascuna osservazione). a posteriori.
  • La probabilità totale utilizzata per normalizzare la risposta è costante di normalizzazione.
  • Probabilità condizionata, cioè viene chiamata la probabilità di ciascun evento credibilità.

Ecco come appaiono questi termini nel primo esempio (confronta con la Figura 1).

Riso. 5. Termini del teorema di Bayes

Lo stesso teorema di Bayes nelle nuove definizioni si presenta così (confronta con la formula 2):

Esempio 3: moneta sleale

Hai una moneta che sospetti non sia giusta. Lo lanci 100 volte. Calcola la probabilità che una moneta disonesta esca testa a testa con una probabilità dello 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%.

Passiamo al file Excel, foglio Esempio 3. Nelle celle B13:B112 ho generato un numero casuale compreso tra 0 e 1 e ho utilizzato un incolla speciale per spostare i valori nella colonna C. Nella cella B8 ho inserito la percentuale prevista di teste per questa moneta disonesta. Nella colonna D, utilizzando la funzione SE, ho trasformato le probabilità in unità (teste, per probabilità R da 0,35 a 1) o a zero (croce, per R da 0 a 0,35).

Riso. 6. Dati iniziali per il lancio di una moneta abusiva

Ho ottenuto 63 teste e 37 croci, che corrispondono bene al generatore di numeri casuali se impostiamo la probabilità di testa al 65% come input.

Passaggio 1. Vogliamo calcolare le probabilità che testa appartenga ai panieri 0%, 10%, ... 100% osservando 63 teste e 37 croci in 100 lanci.

Passaggio 2. Ci sono 11 possibilità iniziali: probabilità 0%, 10%, ... 100%. Assumiamo ingenuamente che tutte le possibilità iniziali abbiano la stessa probabilità, cioè 1 possibilità su 11 (Fig. 7). (Più realisticamente, potremmo dare alle probabilità iniziali circa il 50% in più di peso rispetto alle probabilità ai bordi 0% e 100%. Ma la cosa interessante è che poiché abbiamo fino a 100 lanci, le probabilità iniziali non sono così importanti !)

Fase 3 e 4. Calcolo della probabilità. Per calcolare la probabilità dopo ogni lancio in Excel, utilizzare la funzione SE. Nel caso delle teste, la probabilità è uguale al prodotto della possibilità e della probabilità normalizzata precedente. Se il risultato è testa, la probabilità è uguale a (1 meno la possibilità) * la probabilità normalizzata precedente (Figura 8).

Riso. 8. Plausibilità

Passaggio 5. La normalizzazione viene eseguita come nell'esempio precedente.

I risultati sono presentati più chiaramente come una serie di istogrammi. La pianificazione iniziale è la probabilità a priori. Quindi ogni nuovo grafico mostra la situazione dopo i successivi 25 lanci (Fig. 9). Poiché abbiamo impostato la probabilità che esca testa all'input al 65%, i grafici presentati non sono sorprendenti.

Riso. 9. Probabilità di opzioni dopo una serie di lanci

Cosa significa effettivamente una probabilità del 70% per un'opportunità di 0,6? Non c'è una probabilità del 70% che la moneta colpisca con precisione il 60%. Poiché abbiamo avuto un incremento del 10% tra le opzioni, stimiamo che ci sia una probabilità del 70% che questa moneta scenda tra il 55 e il 65%. La decisione di utilizzare 11 opzioni iniziali, con incrementi del 10%, è stata del tutto arbitraria. Potremmo utilizzare 101 possibilità iniziali con incrementi dell'1%. In questo caso, otterremmo un risultato con un massimo al 63% (dato che avevamo 63 teste) e un calo più graduale nel grafico.

Si noti che in questo esempio abbiamo osservato una convergenza più lenta rispetto all'esempio 2. Questo perché la differenza tra una moneta che lancia il 60% contro il 70% è inferiore a quella tra un dado a 8 facce e un dado a 10 facce.

Esempio 4. Più ossa. Ma con errori nel flusso dei dati

Torniamo all'esempio 2. Un amico ha nella borsa dei dadi con 4, 6, 8, 10, 12, 20 facce. Tira fuori un dado a caso e lo lancia 80 volte. Annota i numeri estratti, ma sbaglia il 5% delle volte. In questo caso, al posto del risultato effettivo del tiro appare un numero casuale compreso tra 1 e 20. Dopo 80 tiri, quale dado pensi sia stato scelto?

Come dati di input in Excel (foglio di lavoro Esempio 4) Ho inserito il numero di lati (8), nonché la probabilità che i dati contengano un errore (0,05). Formula per il valore del lancio (Fig. 10):

SE (RANDBET() > probabilità di errore; RANDBETWEEN(1, numero di facce); RANDBETWEEN(1,20))

Se il numero casuale è maggiore della probabilità di errore (0,05), allora non c'è stato alcun errore in questo lancio, quindi il generatore di numeri casuali sceglie un valore compreso tra 1 e il numero "indovinato" di facce del dado, altrimenti un numero intero casuale dovrebbe essere generato tra 1 e 20.

Riso. 10. Calcolo del valore del lancio

A prima vista, potremmo risolvere questo problema nello stesso modo dell'esempio 2. Ma, se non teniamo conto della probabilità di errore, otterremo un grafico di probabilità come in Fig. 11. (Il modo più semplice per ottenerlo in EXCEL è generare prima i lanci nella colonna B con un valore di errore di 0,05; quindi spostare i valori dei lanci nella colonna C e infine modificare il valore nella cella B11 in 0; dal momento che le formule per calcolare la probabilità nell'intervallo D14:J94 si riferiscono alla cella B11, si otterrà l'effetto di non contare gli errori.)

Riso. 11. Elaborazione del valore dei lanci senza tener conto della probabilità di errori

Poiché la probabilità di errore è piccola e il generatore di numeri casuali è impostato su 8 facce, la probabilità di quest'ultimo diventa dominante ad ogni lancio. Inoltre, poiché un errore può con una probabilità del 40% (otto su venti) dare un valore compreso tra 8, il valore dell'errore che ha influenzato il risultato è apparso solo al 63esimo lancio. Tuttavia, se gli errori non vengono presi in considerazione, la probabilità dell'8 edro sarà pari a zero e il 20 edro riceverà il 100%. Si noti che al 63° lancio la probabilità di una scommessa a 20 facce era solo 2*10 –25.

La possibilità di ottenere un errore è del 5% e la possibilità che un errore dia un valore maggiore di 8 è del 60%. Cioè, il 3% dei lanci darà un errore con un valore superiore a 8, cosa che si è verificata al lancio 63, quando è stato inserito 17. Se la formula della verosimiglianza non tiene conto dei possibili errori, otterremo un aumento la probabilità di un 20-edro da 2 * 10 –25 a 1, come in Fig. 11.

Se una persona osserva attentamente i dati, può rilevare questo errore e ignorare i valori errati. Per automatizzare il processo, integrare l'equazione della verosimiglianza con il controllo degli errori. Non impostare mai le probabilità di errore su zero se si presuppone che non possano essere completamente eliminate. Se si tiene conto delle probabilità di errore, centinaia di dati "corretti" non consentiranno ai singoli valori errati di rovinare il quadro.

Integriamo l'equazione della funzione di verosimiglianza controllando gli errori (Fig. 12):

SE($C15>F$13;$B$11*1/20*N14;($B$11*1/20+(1-$B$11)/F$13)*N14)

Riso. 12. Funzione di verosimiglianza che tiene conto degli errori

Se il valore del lancio registrato è maggiore del numero di lati ($C15>F$13), non azzeriamo la probabilità condizionata, ma la riduciamo tenendo conto della probabilità di errore ($B$11*1/20*N14). Se il numero scritto è inferiore al numero di facce, aumentiamo la probabilità condizionata non per intero, ma tenendo conto anche del possibile errore ($B$11*1/20+(1-$B$11)/F$13)* N14). In quest'ultimo caso consideriamo che il numero scritto potrebbe essere sia la conseguenza di un errore ($B$11*1/20) sia il risultato di una registrazione corretta (1-$B$11)/F$13).

La variazione della probabilità normalizzata diventa più resistente ai possibili errori (Fig. 13).

Riso. 13. Variazione della probabilità normalizzata da lancio a lancio

In questo esempio, il dado a 6 facce è inizialmente il favorito perché i primi 3 tiri sono 5, 6, 1. Poi viene lanciato un 7 e la probabilità del dado a 8 facce aumenta. Tuttavia, la comparsa di un 7 non annulla la probabilità di un 6 facce, perché un 7 può essere un errore. E i successivi nove lanci sembrano confermarlo, quando vengono lanciati valori non superiori a 6: la probabilità di un 6 facce ricomincia ad aumentare. Tuttavia, al 14° e al 15° tiro, vengono lanciati nuovamente 7 e la probabilità di un dado a 6 facce si avvicina allo zero. Successivamente compaiono i valori 17 e 19, che il “sistema” determina come chiaramente errati.

Esempio 4A. Cosa succede se il tasso di errore è molto elevato?

Questo esempio è simile al precedente, ma il tasso di errore è aumentato dal 5% al ​​75%. Poiché i dati sono diventati meno rilevanti, abbiamo aumentato il numero di lanci a 250. Utilizzando le stesse equazioni dell'esempio 4, otteniamo il seguente grafico:

Riso. 14. Probabilità normalizzata con il 75% di registrazioni errate

Con un tasso di errore così elevato, erano necessari molti più lanci. Inoltre, il risultato è meno certo e il 6-edro diventa periodicamente più probabile. Se il tasso di errore è ancora più elevato, ad esempio il 99%, è comunque possibile ottenere la risposta corretta. Ovviamente, maggiore è il tasso di errore, maggiore sarà il numero di scatti da effettuare. Per il 75% degli errori otteniamo un valore corretto su quattro. Se la probabilità di errore fosse del 99%, otterremmo solo un valore corretto su cento. Probabilmente avremmo bisogno di 25 volte più dati per identificare la variante dominante.

Cosa succede se non conosci la probabilità di errore? Consiglio di “giocare” con gli esempi 4 e 4A, impostando valori diversi nella cella B11 da molto piccoli (ad esempio 2*10 –25 per esempio 4) a molto grandi (ad esempio 90% per esempio 4A). Ecco le principali conclusioni:

  • Se il tasso di errore stimato è superiore al tasso di errore effettivo, i risultati convergeranno più lentamente, ma convergeranno comunque alla risposta corretta.
  • Se si stima un tasso di errore troppo basso, c'è il rischio che i risultati non siano corretti.
  • Più basso è il tasso di errore effettivo, maggiore è il margine di manovra che hai per indovinare il tasso di errore.
  • Maggiore è il tasso di errore effettivo, maggiore è la quantità di dati necessari.

Esempio 5. Problema del carro armato tedesco

In questo problema stai cercando di stimare quanti carri armati sono stati prodotti in base ai numeri di serie dei carri armati catturati. Il teorema di Bayes fu utilizzato dagli Alleati durante la seconda guerra mondiale e alla fine produsse risultati inferiori a quelli riportati dall'intelligence. Dopo la guerra, i documenti dimostrarono che le stime statistiche basate sul teorema di Bayes erano più accurate. (È interessante che io abbia scritto una nota su questo argomento senza ancora sapere cosa siano le probabilità bayesiane; vedi . - Nota Baguzina.)

Quindi, analizzi i numeri di serie presi dai carri armati schiantati o catturati. L'obiettivo è stimare quanti serbatoi sono stati prodotti. Ecco cosa sai sui numeri di serie dei serbatoi:

  • Partono da 1.
  • Questi sono numeri interi senza spazi.
  • Hai trovato i seguenti numeri di serie: 30, 70, 140, 125.

Ci interessa la risposta alla domanda: qual è il numero massimo di serbatoi? Inizierò con 1000 carri armati. Ma qualcun altro potrebbe iniziare con 500 o 2000 carri armati e potremmo ottenere risultati diversi. Analizzerò ogni 20 serbatoi, il che significa che ho 50 possibilità iniziali per il numero di serbatoi. Puoi complicare il modello e analizzarlo per ogni singolo numero in Excel, ma la risposta non cambierà molto e l'analisi diventerà molto più complicata.

Presumo che tutte le possibilità per il numero di carri armati siano uguali (cioè la probabilità di avere 50 carri armati è la stessa di averne 500). Tieni presente che il file Excel ha più colonne di quelle mostrate nella figura. La probabilità condizionata per la funzione di verosimiglianza è molto simile alla probabilità condizionata dell'Esempio 2:

  • Se il numero di serie osservato è maggiore del numero di serie massimo per questo gruppo, allora la probabilità di avere quel numero di serbatoi è 0.
  • Se il numero di serie osservato è inferiore al numero di serie massimo per quel gruppo, la probabilità è divisa per il numero di serbatoi moltiplicato per la probabilità normalizzata nel passaggio precedente (Figura 15).

Riso. 15. Probabilità condizionali di distribuzione dei serbatoi in gruppi

Le probabilità normalizzate appaiono così (Fig. 16).

Riso. 16. Probabilità normalizzate del numero di serbatoi

C'è un grande picco di probabilità per il numero seriale massimo osservato. Successivamente si verifica una diminuzione asintotica fino a zero. Per 4 numeri di serie rilevati, il massimo corrisponde a 140 serbatoi. Ma anche se questo numero è la risposta più probabile, non è la stima migliore poiché quasi certamente sottostima il numero di carri armati.

Se prendiamo il numero medio ponderato di serbatoi, ad es. sommare i gruppi moltiplicati a coppie e le loro probabilità per quattro carri armati utilizzando la formula:

ARROTONDA(SOMMAPRODOTTO(BD9:DA9;BD14:DA14),0)

otteniamo il miglior punteggio di 193.

Se inizialmente avessimo ipotizzato 2.000 carri armati, la media ponderata sarebbe stata di 195 carri armati, il che sostanzialmente non cambia nulla.

Esempio 6: test antidroga

Sapete che lo 0,5% della popolazione fa uso di droghe. Hai un test che ha un tasso di veri positivi del 99% per i tossicodipendenti e un tasso di veri negativi del 98% per i non consumatori. Seleziona casualmente una persona, esegui un test e ottieni un risultato positivo. Qual è la probabilità che una persona faccia effettivamente uso di droghe?

Per il nostro individuo casuale probabilità iniziale che sia un tossicodipendente è dello 0,5% e la probabilità che non sia un tossicodipendente è del 99,5%.

Il passo successivo è calcolare la probabilità condizionata:

  • Se il soggetto fa uso di droghe, il test risulterà positivo nel 99% dei casi e negativo nell'1% dei casi.
  • Se il soggetto non fa uso di sostanze stupefacenti il ​​test risulterà positivo nel 2% dei casi e negativo nel 98% dei casi.

Le funzioni di probabilità per i consumatori e i non consumatori di droga sono presentate in Fig. 17.

Riso. 17. Funzioni di probabilità: (a) per i consumatori di droga; (b) per i non consumatori di droga

Dopo la normalizzazione, vediamo che, nonostante il risultato positivo del test, la probabilità che questa persona a caso faccia uso di droghe è solo dello 0,1992 ovvero del 19,9%. Questo risultato sorprende molte persone perché, dopo tutto, la precisione del test è piuttosto elevata, fino al 99%. Poiché la probabilità iniziale era solo dello 0,5%, anche un forte aumento di questa probabilità non era sufficiente per rendere la risposta veramente ampia.

L'intuizione della maggior parte delle persone non tiene conto della probabilità iniziale. Anche se la probabilità condizionata è veramente alta, una probabilità iniziale molto bassa può portare ad una probabilità finale bassa. L'intuizione della maggior parte delle persone è sintonizzata sulla probabilità iniziale di 50/50. Se questo è il caso e il risultato del test è positivo, la probabilità normalizzata sarà quella prevista del 98%, confermando che la persona sta facendo uso di droghe (Figura 18).

Riso. 18. Risultato del test con probabilità iniziale 50/50

Per un approccio alternativo alla spiegazione di tali situazioni, cfr.

Per una bibliografia sul teorema di Bayes si veda la fine della nota.

Lezione n.4.

Argomento: Formula della probabilità totale. La formula di Bayes. Schema Bernoulliano. Circuito polinomiale. Schema ipergeometrico.

FORMULA DELLA PROBABILITA' TOTALE

FORMULA DI BAYES

TEORIA

Formula della probabilità totale:

Sia presente un gruppo completo di eventi incompatibili:

(, ).Quindi la probabilità dell'evento A può essere calcolata utilizzando la formula

(4.1)

Gli eventi sono chiamati ipotesi. Vengono avanzate ipotesi riguardanti la parte dell'esperimento in cui è presente incertezza.

, dove sono le probabilità a priori delle ipotesi

Formula di Bayes:

Lascia che l'esperimento sia completato e sia noto che l'evento A si è verificato come risultato dell'esperimento. Quindi, tenendo conto di queste informazioni, possiamo sovrastimare le probabilità delle ipotesi:

(4.2)

, Dove probabilità a posteriori delle ipotesi

RISOLUZIONE DEL PROBLEMA

Compito 1.

Condizione

Nei 3 lotti di pezzi arrivati ​​al magazzino, i pezzi utilizzabili sono: 89 %, 92 % E 97 % di conseguenza. Il numero di pezzi in lotti si riferisce a 1:2:3.

Qual è la probabilità che un pezzo scelto a caso dal magazzino sia difettoso? Fai sapere che una parte selezionata a caso si è rivelata difettosa. Trova le probabilità che appartenga alla prima, seconda e terza parte.

Soluzione:

Indichiamo con A l'evento in cui una parte scelta a caso risulta essere difettosa.

1a domanda – alla formula della probabilità totale

2a domanda - alla formula di Bayes

Vengono avanzate ipotesi riguardanti la parte dell'esperimento in cui è presente incertezza. In questo problema, l’incertezza risiede nel lotto da cui proviene la parte selezionata casualmente.

Facciamo entrare il primo gioco UN dettagli. Poi nel secondo gioco... 2 UN dettagli, e nel terzo - 3 UN dettagli. In soli tre lotti 6 UN dettagli.

(la percentuale di difetti sulla prima riga è stata convertita in probabilità)


(la percentuale di difetti sulla seconda riga è stata convertita in probabilità)

(la percentuale di difetti sulla terza riga è stata convertita in probabilità)

Utilizzando la formula della probabilità totale, calcoliamo la probabilità di un evento UN

-risposta a 1 domanda

Le probabilità che un pezzo difettoso appartenga al primo, secondo e terzo lotto si calcolano utilizzando la formula di Bayes:

Compito 2.

Condizione:

Nella prima urna 10 palle: 4 bianco e 6 nero. Nella seconda urna 20 palle: 2 bianco e 18 nero. Da ogni urna viene scelta casualmente una pallina e posta nella terza urna. Poi si estrae a caso una pallina dalla terza urna. Trova la probabilità che la pallina estratta dalla terza urna sia bianca.

Soluzione:

La risposta alla domanda problematica può essere ottenuta utilizzando la formula della probabilità totale:

L'incertezza è quali palline finiranno nella terza urna. Avanziamo ipotesi sulla composizione delle palline della terza urna.

H1=(nella terza urna ci sono 2 palline bianche)

H2=(nella terza urna ci sono 2 palline nere)

H3=(nella terza urna c'è 1 pallina bianca e 1 pallina nera)

A=(la pallina estratta dall'urna 3 sarà bianca)

Compito 3.

Una pallina bianca viene lasciata cadere in un'urna contenente 2 palline di colore sconosciuto. Successivamente, prendiamo 1 pallina da questa urna. Trovare la probabilità che la pallina estratta dall'urna sia bianca. La pallina prelevata dall'urna sopra descritta si è rivelata bianca. Trova le probabilità che che nell'urna prima dello spostamento c'erano 0 palline bianche, 1 pallina bianca e 2 palline bianche .

1 domanda c - alla formula della probabilità totale

Domanda 2-sulla formula di Bayes

L'incertezza risiede nella composizione iniziale delle palline nell'urna. Per quanto riguarda la composizione iniziale delle palline nell'urna avanziamo le seguenti ipotesi:

Ciao=(era nel cestino prima di traslocarei-1 pallina bianca),i=1,2,3

, i=1,2,3(in una situazione di completa incertezza, assumiamo che le probabilità a priori delle ipotesi siano le stesse, poiché non possiamo dire che un'opzione sia più probabile dell'altra)

A=(la pallina rimossa dall'urna dopo il riposizionamento sarà bianca)

Calcoliamo le probabilità condizionali:

Facciamo il calcolo utilizzando la formula della probabilità totale:

Rispondi a 1 domanda

Per rispondere alla seconda domanda usiamo la formula di Bayes:

(diminuito rispetto alla probabilità a priori)

(non è cambiato rispetto alla probabilità precedente)

(aumentato rispetto alla probabilità a priori)

Conclusione da un confronto tra probabilità a priori e probabilità a posteriori delle ipotesi: l'incertezza iniziale è cambiata quantitativamente

Compito 4.

Condizione:

Durante la trasfusione di sangue è necessario tenere conto dei gruppi sanguigni del donatore e del paziente. Una persona che ha quarto gruppo sangue Puoi trasfondere sangue di qualsiasi tipo, persona con il secondo e il terzo gruppo può essere versato o sangue del suo tipo, o prima. A una persona con il primo gruppo sanguigno puoi fare una trasfusione di sangue? solo il primo gruppo.È noto che tra la popolazione 33,7 % Avere primo gruppo pu, 37,5 % Avere secondo gruppo, 20,9% Avere terzo gruppo E Il 7,9% ha il gruppo 4. Trovare la probabilità che un paziente a caso possa ricevere una trasfusione di sangue da un donatore a caso.


Soluzione:

Proponiamo ipotesi sul gruppo sanguigno di un paziente selezionato casualmente:

Ciao=(nel pazientei-esimo gruppo sanguigno),i=1,2,3,4

(Percentuali convertite in probabilità)

A=(è possibile eseguire la trasfusione)

Usando la formula della probabilità totale otteniamo:

Cioè, la trasfusione può essere eseguita in circa il 60% dei casi

Schema di Bernoulli (o schema binomiale)

I test di Bernoulli - Questo test indipendenti 2 risultati, che convenzionalmente chiamiamo successo e fallimento.

P- probabilità di successo

Q– probabilità di fallimento

Probabilità di successo non cambia da esperienza a esperienza

Il risultato del test precedente non influenza i test successivi.

L'esecuzione dei test sopra descritti è detta schema di Bernoulli o schema binomiale.

Esempi di test di Bernoulli:

Lancio della moneta

Successo - stemma

Fallimento- code

Il caso di una moneta giusta

caso di moneta sbagliata

P E Q non cambiamo da esperimento a esperimento se non cambiamo la moneta durante l'esperimento

Lanciare un dado

Successo - rotolare "6"

Fallimento - tutto il resto

Il caso di un dado giusto

Il caso di un dado irregolare

P E Q non cambiamo da esperimento a esperimento se non cambiamo i dadi durante l'esperimento

Tiratore che spara al bersaglio

Successo - colpo

Fallimento - mancare

p =0,1 (il tiratore mette a segno un colpo su 10)

P E Q non cambiare da esperimento a esperimento se non cambiamo il tiratore durante l'esperimento

La formula di Bernoulli.

Permettere eseguito N P. Considera gli eventi

(Vn Test di Bernoulli con probabilità di successop accadràm successi),

-per le probabilità di tali eventi esiste una notazione standard

<-Formula di Bernoulli per il calcolo delle probabilità (4.3)

Spiegazione della formula : la probabilità che si verifichino m successi (le probabilità si moltiplicano, poiché le prove sono indipendenti, ed essendo tutte uguali appare un grado), - la probabilità che si verifichino n-m fallimenti (la spiegazione è simile a quella per i successi) , - il numero di modi in cui si svolgono gli eventi, ad es. in quanti modi possono essere collocati m successi in n posti.

Corollari della formula di Bernoulli:

Corollario 1:

Permettere eseguito N Test di Bernoulli con probabilità di successo P. Considera gli eventi

UN(m1,m2)=(numero di successi inn I test di Bernoulli saranno nell’intervallo [m1;m2])

(4.4)

Spiegazione della formula: La formula (4.4) segue dalla formula (4.3) e dal teorema di addizione delle probabilità per eventi incompatibili, poiché è la somma (unione) di eventi incompatibili e la probabilità di ciascuno è determinata dalla formula (4.3).

Corollario 2

Permettere eseguito N Test di Bernoulli con probabilità di successo P. Considera l'evento

A=( dentroNelle prove Bernoulliane ci sarà almeno 1 successo}

(4.5)

Spiegazione della formula: ={ in n prove di Bernoulli non ci sarà successo) =

(tutti gli n test falliranno)

Problema (sulla formula di Bernoulli e suoi corollari) esempio per il problema 1.6-D. H.

La moneta giusta lanciato 10 volte. Trova le probabilità dei seguenti eventi:

A=(lo stemma apparirà esattamente 5 volte)

B=(lo stemma apparirà non più di 5 volte)

C=(lo stemma apparirà almeno una volta)

Soluzione:

Riformuliamo il problema in termini di test di Bernoulli:

n=10 numero di test

successo- stemma

p=0,5 – probabilità di successo

q=1-p=0,5 – probabilità di fallimento

Per calcolare la probabilità dell'evento A utilizziamo Formula di Bernoulli:

Per calcolare la probabilità dell'evento B utilizziamo conseguenza 1 A Formula di Bernoulli:

Per calcolare la probabilità dell'evento C utilizziamo conseguenza 2 A Formula di Bernoulli:

Schema Bernoulliano. Calcolo utilizzando formule approssimative.

FORMULA MOIVRE-LAPLACE APPROSSIMATIVA

Formula locale

P successo e Q i fallimenti sono per tutti M Vale la formula approssimativa:

, (4.6)

M.

Il significato della funzione lo trovate nell'apposito tavolo. Contiene valori solo per . Ma la funzione è pari, cioè .

Se , allora credono

Formula integrale

Se nello schema Bernoulli il numero di test n è grande e anche le probabilità sono grandi P successo e Q fallimenti, allora la formula approssimativa è valida per tutti (4.7) :

Il valore della funzione può essere trovato in una tabella speciale. Contiene valori solo per . Ma la funzione è strana, cioè .

Se , allora credono

FORMULE DI POISSON APPROSSIMATIVE

Formula locale

Consideriamo il numero delle prove N Secondo lo schema di Bernoulli, la probabilità di successo in un test è piccola e il prodotto . Quindi determinato dalla formula approssimativa:

, (4.8)

La probabilità che il numero di successi in n prove di Bernoulli sia M.

Valori di funzione possono essere trovati in una tabella speciale.

Formula integrale

Consideriamo il numero delle prove N Secondo lo schema di Bernoulli, la probabilità di successo in un test è piccola e il prodotto .

Poi determinato dalla formula approssimativa:

, (4.9)

La probabilità che il numero di successi in n prove Bernoulliane sia compreso nell'intervallo .

Valori di funzione possono essere esaminati in una tabella speciale e quindi sommati nell'intervallo.

Formula

La formula di Poisson

Formula di Moivre-Laplace

Qualità

valutazioni

le stime sono approssimative

10

utilizzato per stime approssimative

calcoli

utilizzato per le applicazioni

calcoli ingegneristici

100 0

utilizzato per eventuali calcoli ingegneristici

n>1000

ottima qualità delle valutazioni

Puoi vedere esempi per i problemi 1.7 e 1.8 D. z.

Calcolo utilizzando la formula di Poisson.

Problema (formula di Poisson).

Condizione:

La probabilità di distorsione di un carattere durante la trasmissione di un messaggio su una linea di comunicazione è uguale a 0.001. Il messaggio si considera accettato se non sono presenti distorsioni. Trova la probabilità che un messaggio sia composto da 20 parole 100 ciascuno caratteri ciascuno.

Soluzione:

Indichiamo con UN

-numero di caratteri nel messaggio

successo: il simbolo non è distorto

Probabilità di successo

Calcoliamo. Consulta i consigli per l'utilizzo di formule approssimative ( ) : per il calcolo è necessario applicare La formula di Poisson

Probabilità per la formula di Poisson di em può essere trovato in una tabella speciale.

Condizione:

La centrale telefonica serve 1000 abbonati. La probabilità che un abbonato abbia bisogno di una connessione entro un minuto è 0,0007. Calcolare la probabilità che alla centrale telefonica vengano ricevute almeno 3 chiamate al minuto.

Soluzione:

Riformuliamo il problema in termini dello schema di Bernoulli

successo: chiamata ricevuta

Probabilità di successo

– l'intervallo in cui dovrebbe trovarsi il numero di successi

A = (arriveranno almeno tre chiamate) - un evento di cui è richiesta la probabilità. trovare nel problema

(meno di tre chiamate ricevute) Vai ad ulteriori. evento, perché la sua probabilità è più facile da calcolare.

(calcolo dei termini, vedi tabella speciale)

Così,

Problema (formula locale di Mouvre-Laplace)

Condizione

Probabilità di colpire il bersaglio con un colpo pari a 0,8. Determina la probabilità che a 400 accadranno dei colpi esattamente 300 colpisce.

Soluzione:

Riformuliamo il problema in termini dello schema di Bernoulli

n=400 – numero di test

m=300 – numero di successi

successo - successo

(Domanda problematica in termini di schema Bernoulli)

Calcolo preliminare:

Eseguiamo test indipendenti, in ognuno dei quali distinguiamo opzioni.

p1 – probabilità di ottenere la prima opzione in una prova

p2 – probabilità di ottenere la seconda opzione in una prova

…………..

pm – probabilità di ricezionela m-esima opzione in una prova

p1,p2, ……………..,i pm non cambiano da esperienza a esperienza

La sequenza di test sopra descritta è chiamata schema polinomiale.

(per m=2 lo schema polinomiale si trasforma in uno schema binomiale), cioè lo schema binomiale sopra è un caso speciale di uno schema più generale detto polinomiale).

Considera i seguenti eventi

A(n1,n2,….,nm)=(negli n test descritti sopra, l'opzione 1 è apparsa n1 volte, l'opzione 2 è apparsa n2 volte, ….., ecc., l'opzione m è apparsa nm volte)

Formula per il calcolo delle probabilità utilizzando uno schema polinomiale

Condizione

Dadi lanciato 10 volte. Devi trovare la probabilità che esca un “6”. 2 volte e apparirà “5”. 3 volte.

Soluzione:

Indichiamo con UN un evento la cui probabilità deve essere trovata nel problema.

n=10 – numero di test

m=3

1a opzione: tira 6

p1=1/6n1=2

2a opzione: tira 5

p2=1/6n2=3

Opzione 3: caduta da qualsiasi bordo tranne 5 e 6

p3=4/6n3=5

P(2,3,5)-? (probabilità dell'evento menzionato nella dichiarazione del problema)

Problema del circuito polinomiale

Condizione

Trova la probabilità che tra 10 Delle persone selezionate casualmente, quattro compiranno gli anni nel primo trimestre, tre nel secondo, due nel terzo e una nel quarto.

Soluzione:

Indichiamo con UN un evento la cui probabilità deve essere trovata nel problema.

Riformuliamo il problema in termini di uno schema polinomiale:

n=10 – numero di prove = numero di persone

m=4– il numero di opzioni che distinguiamo in ciascuna prova

Opzione 1 - nascita nel 1° trimestre

p1=1/4n1=4

Opzione 2 - nascita nel 2° trimestre

p2=1/4n2=3

Opzione 3: nascita nel 3o trimestre

p3=1/4n3=2

Opzione 4: nascita nel 4o trimestre

p4=1/4n4=1

P(4,3,2,1)-? (probabilità dell'evento menzionato nella dichiarazione del problema)

Assumiamo che la probabilità di nascere in qualsiasi trimestre sia la stessa e pari a 1/4. Eseguiamo il calcolo utilizzando la formula per lo schema polinomiale:

Problema del circuito polinomiale

Condizione

Nell'urna 30 palle: Bentornato.3 bianchi, 2 verdi, 4 blu e 1 giallo.

Soluzione:

Indichiamo con UN un evento la cui probabilità deve essere trovata nel problema.

Riformuliamo il problema in termini di uno schema polinomiale:

n=10 – numero di prove = numero di palline selezionate

m=4– il numero di opzioni che distinguiamo in ciascuna prova

Opzione 1: scegliere una pallina bianca

p1=1/3n1=3

Opzione 2: scegliere una pallina verde

p2=1/6n2=2

Opzione 3: scegliere una pallina blu

p3=4/15n3=4

Opzione 4: scegliere una pallina gialla

p4=7/30n4=1

P(3,2,4,1)-? (probabilità dell'evento menzionato nella dichiarazione del problema)

p1,p2, p3,p4 non cambiano da esperienza a esperienza poiché la scelta viene fatta con ritorno

Eseguiamo il calcolo utilizzando la formula per lo schema polinomiale:

Schema ipergeometrico

Siano n elementi di k tipi:

n1 del primo tipo

n2 del secondo tipo

nk k-esimo tipo

Da questi n elementi in modo casuale nessun ritorno seleziona m elementi

Consideriamo l'evento A(m1,…,mk), consistente nel fatto che tra gli m elementi selezionati ci saranno

m1 primo tipo

m2 del secondo tipo

mk k-esimo tipo

La probabilità di questo evento viene calcolata utilizzando la formula

P(A(m1,…,mk))= (4.11)

Esempio 1.

Problema su uno schema ipergeometrico (esempio per il problema 1.9 D. h)

Condizione

Nell'urna 30 palle: 10 bianchi, 5 verdi, 8 blu e 7 gialli(le palline differiscono solo per il colore). Si estraggono casualmente 10 palline dall'urna nessun ritorno. Trova la probabilità che tra le palline selezionate ci siano: 3 bianchi, 2 verdi, 4 blu e 1 giallo.

Abbiamon=30,k=4,

n1=10,n2=5,n3=8,n4=7,

m1=3,m2=2,m3=4,m4=1

P(A(3,2,4,1))= = puoi contare fino a un numero conoscendo la formula delle combinazioni

Esempio 2.

Esempio di calcolo utilizzando questo schema: vedi calcoli per il gioco Sportloto (argomento 1)

Segnale e rumore. Perché alcune previsioni si avverano e altre no Silver Nate

La matematica semplice del teorema di Bayes

Mentre la filosofia alla base del Teorema di Bayes è sorprendentemente profonda, la sua matematica è sorprendentemente semplice. Nella sua forma base è semplicemente un'espressione algebrica con tre variabili note e una sconosciuta. Tuttavia, questa semplice formula può portare a intuizioni predittive.

Il teorema di Bayes è direttamente correlato alla probabilità condizionata. In altre parole, permette di calcolare la probabilità di qualsiasi teoria o ipotesi, Se accadrà qualche evento. Immagina di vivere con il tuo partner e di tornare a casa da un viaggio d'affari e trovare un paio di biancheria intima sconosciuta nel tuo armadio. Forse ti starai chiedendo: quanto è probabile che il tuo partner ti tradisca? Condizioneè che troverai biancheria intima; ipotesiè che sei interessato a valutare la probabilità di essere ingannato. Che tu ci creda o no, il teorema di Bayes può darti una risposta a questo tipo di domande, a condizione che tu conosca (o voglia valutare) tre qualità.

Prima di tutto, devi valutare la probabilità che appaia il bucato come condizione per la correttezza dell'ipotesi - cioè, a condizione che tu venga tradito.

Per risolvere questo problema, supponiamo che tu sia una donna e che il tuo partner sia un uomo e che l'oggetto della controversia siano un paio di mutandine. Se ti tradisce, è facile immaginare come le mutandine di qualcun altro possano entrare nel tuo guardaroba. Ma anche se (o soprattutto se) ti tradisce, puoi aspettarti che sia abbastanza discreto. Diciamo che c'è una probabilità del 50% che le mutandine compaiano se ti tradisce.

In secondo luogo, è necessario stimare la probabilità che appaia il bucato a patto che l’ipotesi sia falsa.

Se tuo marito non ti tradisce, devono esserci altre spiegazioni più innocenti per la comparsa delle mutandine nel tuo guardaroba. Alcuni di essi possono essere piuttosto sgradevoli (ad esempio, potrebbero essere le sue mutandine). È possibile che il suo bagaglio sia stato erroneamente confuso con quello di qualcun altro. È possibile che per qualche motivo qualche tuo amico, di cui ti fidi, abbia passato la notte in casa sua in tutta innocenza. Le mutandine potrebbero essere un regalo per te che si è dimenticato di mettere in valigia. Nessuna di queste teorie è priva di difetti, anche se a volte la spiegazione “il cane ha mangiato i miei compiti” si rivela vera. Stimi che la loro probabilità combinata sia del 5%.

La terza e più importante cosa di cui hai bisogno è ciò che chiamano i bayesiani probabilità a priori(o semplicemente a priori). Come hai valutato la probabilità che tradisse? prima di ciò Come hai trovato la biancheria intima? Naturalmente, è difficile per te rimanere obiettivo nella tua valutazione ora che queste mutandine sono apparse nel tuo campo visivo (idealmente, valuti questa probabilità prima di iniziare a studiare le prove). Ma a volte la probabilità di tali eventi può essere valutata empiricamente. Ad esempio, diversi studi hanno dimostrato che ogni anno circa il 4% dei partner sposati (570) tradisce il proprio coniuge, quindi prenderemo questa cifra come probabilità a priori.

Se hai stimato tutti questi valori, puoi applicare il teorema di Bayes per stimare probabilità a posteriori. È questa cifra che ci interessa di più: quanto è probabile che ci tradiscano, dato che abbiamo trovato la biancheria intima di qualcun altro?

Il calcolo e una semplice formula algebrica che ne permette l'esecuzione sono riportati in tabella. 8.2.

Tabella 8.2. Un esempio di calcolo della probabilità di tradimento utilizzando il teorema di Bayes

Si scopre che la probabilità di tradimento è ancora piuttosto ridotta: 29%. Questo può sembrare controintuitivo: le mutandine non sono una prova abbastanza forte? Forse questo risultato è dovuto al fatto che hai utilizzato un valore a priori troppo basso per la probabilità che tradisca.

Anche se una persona innocente può avere molte meno opzioni per spiegazioni ragionevoli rispetto a una persona colpevole per quanto riguarda l'aspetto delle mutandine, inizialmente si presumeva che fosse innocente e questo ha avuto un grande impatto sull'esito dell'equazione.

Quando abbiamo fiducia a priori in qualcosa, possiamo essere notevolmente flessibili anche quando emergono nuove prove. Un classico esempio di tali situazioni è l’individuazione del cancro al seno nelle donne di età superiore ai 40 anni. Fortunatamente, la probabilità che una donna sviluppi un cancro al seno dopo i 40 anni è piuttosto bassa, circa l’1,4% (571). Tuttavia, qual è la probabilità che la sua mammografia abbia un risultato positivo?

La ricerca mostra che anche se una donna NO cancro, la mammografia mostrerà erroneamente la sua presenza nel 10% dei casi (572). D’altro canto, se ha un cancro, una mammografia lo rileverà circa nel 75% dei casi (573). Dopo aver visto queste statistiche, potresti pensare che una mammografia positiva significhi che le cose vanno molto male. Tuttavia, un calcolo utilizzando il teorema di Bayes con queste cifre ci permette di trarre una conclusione diversa: la probabilità di avere un cancro al seno in una donna di età superiore ai 40 anni a condizione che abbia una mammografia positiva, è ancora intorno al 10%. In questo caso, questo risultato dell'equazione è dovuto al fatto che non poche giovani donne hanno il cancro al seno. Questo è il motivo per cui molti medici raccomandano che le donne non inizino a sottoporsi a mammografie regolari prima dei 50 anni, dopodiché la probabilità a priori di cancro al seno aumenta in modo significativo (574).

Problemi di questo tipo sono indubbiamente complessi. Durante un recente studio sull'alfabetizzazione statistica degli americani, è stato presentato loro l'esempio del cancro al seno. E si è scoperto che solo il 3% di loro era in grado di calcolare correttamente i valori di probabilità (575). A volte, rallentando un po’ e cercando di visualizzare il problema (come mostrato nella Figura 8.2), possiamo facilmente verificare la realtà delle nostre approssimazioni imprecise. L'imaging ci aiuta a vedere il quadro generale più facilmente: poiché il cancro al seno è estremamente raro nelle giovani donne, il semplice fatto di una mammografia positiva non significa nulla.

Riso. 8.2. Rappresentazione grafica dei dati sorgente per il teorema di Bayes utilizzando l'esempio di una mammografia

Tuttavia, tendiamo a concentrarci sulle informazioni più recenti o più disponibili e il quadro generale comincia a perdersi. Giocatori intelligenti come Bob Voulgaris hanno imparato a sfruttare abilmente queste carenze nel nostro modo di pensare. Voulgaris ha fatto una buona scommessa sui Lakers in parte perché i bookmaker avevano prestato troppa attenzione alle prime partite dei Lakers e avevano cambiato le probabilità che la squadra vincesse il titolo da 4 a 1 a 65 a 1. Tuttavia, in realtà la squadra ha giocato tutto bene come potrebbe giocare una buona squadra in caso di infortunio di uno dei suoi giocatori di punta. Il Teorema di Bayes ci impone di riflettere più attentamente su questo tipo di problemi. Può essere estremamente utile per identificare i casi in cui le nostre approssimazioni istintive sono troppo grossolane.

Ma non intendo dire che le nostre aspettative precedenti prevalgano sempre sulle nuove prove o che il teorema di Bayes porti sempre a risultati apparentemente controintuitivi. A volte nuove prove risultano così significative per noi da superare tutto il resto, e possiamo quasi istantaneamente cambiare idea e diventare completamente fiduciosi in un evento, la cui probabilità era considerata quasi zero.

Diamo un'occhiata a un esempio più oscuro: gli attacchi dell'11 settembre. La maggior parte di noi, quando si è svegliata quella mattina, ha assegnato una probabilità quasi zero alla probabilità che i terroristi facessero schiantare gli aerei contro i grattacieli di Manhattan. Tuttavia, abbiamo riconosciuto l’ovvia possibilità di un attacco terroristico dopo che il primo aereo si è schiantato contro il World Trade Center. E abbiamo perso ogni dubbio sul fatto che fossimo sotto attacco dopo che l'aereo si è schiantato contro la seconda torre. Il teorema di Bayes è in grado di rappresentare questo risultato.

Diciamo che prima che il primo aereo colpisse la torre, i nostri calcoli sulla probabilità di un attacco terroristico contro i grattacieli di Manhattan erano solo 1 possibilità su 20mila, ovvero lo 0,005%. Tuttavia, dovevamo anche considerare che la probabilità che un aereo si scontrasse per errore con la torre del World Trade Center fosse piuttosto bassa. Questa cifra può essere calcolata empiricamente. Nei 25mila giorni precedenti gli eventi dell'11 settembre, durante i quali furono effettuati voli su Manhattan, si verificarono solo due incidenti di questo tipo (576): una collisione con l'Empire State Building nel 1945 e con una torre al 40 di Wall Street , nel 1946. Pertanto, la probabilità che si verificasse un simile incidente era di circa 1 su 12.500 in un giorno qualsiasi. Se queste cifre vengono calcolate utilizzando il teorema di Bayes (tabella 8.3a), la probabilità di un attacco terroristico aumenta dallo 0,005 al 38% nel momento in cui il primo aereo si scontra con l'edificio.

Tabella 8.3a.

Tuttavia, l'idea alla base del Teorema di Bayes è che non aggiustiamo i nostri calcoli delle probabilità solo una volta. Lo facciamo continuamente man mano che emergono nuove prove. Pertanto, la nostra probabilità a posteriori del 38% di un attacco terroristico dopo il primo attacco aereo diventa la nostra a priori la possibilità di una collisione con il secondo.

E se esegui nuovamente i calcoli dopo che il secondo aereo ha colpito la torre del World Trade Center, vedrai che la probabilità del 99,99% di un attacco terroristico viene sostituita dalla certezza quasi completa di questo evento. Un incidente in una luminosa giornata di sole a New York era estremamente improbabile, ma un secondo era quasi certo che si verificasse (Tabella 8.3b), come ci siamo resi conto all'improvviso e con grande orrore.

Tabella 8.3b. Un esempio di calcolo della probabilità di un attacco terroristico utilizzando il teorema di Bayes

Ho scelto deliberatamente casi abbastanza complessi come esempi – attacchi terroristici, cancro, adulterio – perché voglio dimostrare la portata dei problemi a cui può essere applicato il pensiero bayesiano. Il Teorema di Bayes non è una formula magica. La sua formula più semplice, che presentiamo in questo libro, utilizza semplici operazioni aritmetiche per addizione, sottrazione, divisione e moltiplicazione. Ma affinché ci dia un risultato utile, dobbiamo fornirgli delle informazioni, in particolare i nostri calcoli delle probabilità a priori.

Tuttavia, il teorema di Bayes ci obbliga a pensare alla probabilità che accadano eventi nel mondo, anche quando si tratta di questioni che non vorremmo considerare manifestazioni del caso. Non richiede che percepiamo il mondo internamente, metafisicamente indeterminato: Laplace credeva che tutto, dalle orbite dei pianeti al movimento delle molecole più piccole, fosse governato da regole newtoniane ordinate. Eppure giocò un ruolo importante nello sviluppo del teorema di Bayes. Piuttosto, possiamo dire che questo teorema è correlato a epistemologico incertezza: i limiti della nostra conoscenza.

Questo testo è un frammento introduttivo. Dal libro Giornale Domani 156 (48 1996) autore Zavtra Giornale

ARITMETICA SEMPLICE (Russia e CSI) Y. Byaly 18 novembre - C'è una spaccatura nel Consiglio supremo della Bielorussia: 75 deputati hanno firmato una richiesta per mettere sotto accusa Lukashenko e 80 deputati hanno dichiarato fedeltà alla linea del presidente. - In segno di disaccordo con la linea di condotta di Lukashenko, si sono dimessi

Dal libro Giornale Domani 209 (48 1997) autore Zavtra Giornale

MATEMATICA INFERIORE Denis Tukmakov Stavo alla fermata dell'autobus aspettando l'autobus e ho cercato invano di capire il paragrafo del libro di testo di matematica superiore che ci è stato assegnato oggi. Stavo leggendo qualcosa sui valori del seno quando ho sentito la domanda: “Scusate, chi è l’autore di questo libro di testo?” IO

Dal libro Capire la Russia con la mente autore Kalyuzhny Dmitry Vitalievich

Conseguenze del “teorema amaro” In condizioni di libera circolazione dei capitali, nessun singolo investitore, né nostro né straniero, investirà nello sviluppo di quasi tutte le produzioni in Russia. Non ci sono investimenti nel nostro settore e non ci saranno.

Dal libro Vocabolario autore Rubinstein Lev Semyonovich

1.5. Analisi del “Teorema Amaro” di Parshev

Dal libro Giornale Letterario 6281 (n. 26 2010) autore Giornale letterario

Una storia semplice Ultimamente si parla molto di storia. Cioè, non sulla storia in quanto tale, ma su come insegnare questa storia ai giovani curiosi. La questione più sottile, come sempre accade, è la storia recente. Dov'è sottile? e così via. E la verità: come

Dal libro WikiLeaks. Prove compromettenti sulla Russia autore Autore sconosciuto

La semplice e terribile verità di Biblioman. Dozzina di libri La semplice e terribile verità Diario dell'assedio. – Tallinn – San Pietroburgo: Società di Tallinn dei residenti della Leningrado assediata; Centro di informazione ed editoria del governo di San Pietroburgo “Petrocenter”, 2010. – 410 pp.: ill. Molti

Dal libro Consumismo [La malattia che minaccia il mondo] di Van David

Crescenti ritardi nei visti: cattiva volontà o semplice incompetenza? 19. (C) Vi è anche una crescente preoccupazione che stia diventando sempre più difficile ottenere un visto tagico - non solo per il personale delle ONG americane, ma anche per i dipendenti delle ONG europee, per

Dal libro Presidenti RU autore Minkin Aleksandr Viktorovich

Dal libro Il crollo del sistema mondiale del dollaro: prospettive immediate. autore Maslyukov Yu.

Sistema semplice, 25 novembre 1994, “MK” Un simile unguento coprirà la ferita con una crosta, ma il pus nascosto divorerà tutto all'interno. Shakespeare. Amleto Sotto il fuoco di precisione Nel 1941, Anatoly Papanov combatté in un battaglione penale. Quando mi raccontò della guerra nel 1980, mi sembrò che avessi capito tutto. Papanov,

Dal libro Giornale Letterario 6461 (n. 18 2014) autore Giornale letterario

3.1. Analfabetismo semplice Se consideriamo le minacce a breve termine descritte per gli Stati Uniti (nella sfera economica, manifestate attraverso la minaccia al dollaro), dovremmo prima di tutto scartare quelle che sono causate dal semplice analfabetismo degli autori che le propongono. Parla del fatto che è nuovo

Dal libro La storia più interessante nella storia dell'umanità autore Delyagin Mikhail Gennadievich

Corollari del “teorema della minoranza” Ciò che ci impedisce di stare insieme nella vita e sullo schermo A febbraio, Alexander Prokhanov e io ci siamo esibiti nella Siberia occidentale. Sono arrivati ​​con libri diversi, ma domande del pubblico: solo Ucraina. Alexander Andreevich ha ammesso con un sospiro: “Gli occidentali

Dal libro Segnale e rumore. Perché alcune previsioni si avverano e altre no? di Silver Nate

L'ago di Koshchei non è semplice, è un ago petrolifero. Naturalmente abbiamo già parlato delle sanzioni. Cosa accadrà ai prezzi del petrolio dopo che l’Occidente farà la pace con l’Iran – Diminuiranno, ma non in modo critico? E non è un dato di fatto che durerà a lungo, perché il prezzo del petrolio è determinato in un segmento molto ristretto appositamente selezionato

Dal libro Ciò che la scienza moderna non sa autore Team di autori

L'incredibile eredità di Thomas Bayes Thomas Bayes era un sacerdote inglese nato nel 1701 o nel 1702. Poco si sa della sua vita, sebbene abbia dato il nome a un intero movimento statistico e forse al suo teorema più famoso. Non è nemmeno chiaro

Dal libro Viale del ferro autore Lurie Samuil Aronovich

Quando le statistiche deviarono dai principi di Bayes Uno statistico e biologo inglese di nome Ronald Eimler (R. A.) Fisher fu forse il principale rivale intellettuale di Thomas Bayes, anche se nacque nel 1890, quasi 120 anni dopo la sua morte. Ha mostrato

Dal libro dell'autore

Matematica sul destino Certezza Che cosa ha più valore nella scienza? A quanto pare, può predire il futuro. È su questa base che la maggior parte delle persone separa la “scienza” dalla “non scienza”. Se dici: “Forse sarà così, anche se potrebbe essere diverso”, lo sei

Dal libro dell'autore

I TEOREMI DI CHAADAYEV Massone. Scrittore di lingua francese. Ho scritto trecento pagine, ne ho stampate trenta, di cui dieci lette da molti; per le quali dieci pagine era sospettato di russofobia; punito C'era qualcosa come una nota, come se una digressione dall'argomento del discorso: spiegare

Breve teoria

Se un evento si verifica solo a condizione che si verifichi uno degli eventi che formano un gruppo completo di eventi incompatibili, allora è uguale alla somma dei prodotti delle probabilità di ciascuno degli eventi per il corrispondente portafoglio di probabilità condizionale.

In questo caso, gli eventi sono chiamati ipotesi e le probabilità sono chiamate a priori. Questa formula è chiamata formula della probabilità totale.

La formula di Bayes viene utilizzata per risolvere problemi pratici quando si è verificato un evento che appare insieme a uno qualsiasi degli eventi che formano un gruppo completo di eventi ed è necessario effettuare una nuova stima quantitativa delle probabilità delle ipotesi. Le probabilità a priori (prima dell'esperimento) sono note. È necessario calcolare le probabilità a posteriori (dopo l'esperimento), ad es. essenzialmente devi trovare probabilità condizionali. La formula di Bayes è simile alla seguente:

La pagina successiva discute il problema su .

Esempio di soluzione del problema

Condizione del compito 1

In una fabbrica, le macchine 1, 2 e 3 producono rispettivamente il 20%, 35% e 45% di tutte le parti. Nei loro prodotti, i difetti sono rispettivamente del 6%, 4%, 2%. Qual è la probabilità che un prodotto selezionato a caso sia difettoso? Qual è la probabilità che sia stato prodotto: a) dalla macchina 1; b) macchina 2; c) macchina 3?

Soluzione al problema 1

Indichiamo con l'evento che un prodotto standard risulta essere difettoso.

Un evento può verificarsi solo se si verifica uno dei tre eventi:

Il prodotto è stato realizzato sulla macchina 1;

Il prodotto viene realizzato sulla macchina 2;

Il prodotto viene realizzato sulla macchina 3;

Scriviamo le probabilità condizionali:

Formula della probabilità totale

Se un evento può verificarsi solo se si verifica uno degli eventi che formano un gruppo completo di eventi incompatibili, allora la probabilità dell'evento si calcola con la formula

Utilizzando la formula della probabilità totale, troviamo la probabilità di un evento:

Formula di Bayes

La formula di Bayes consente di “riorganizzare causa ed effetto”: dato il fatto noto di un evento, calcolare la probabilità che sia stato causato da una determinata causa.

La probabilità che un prodotto difettoso venga realizzato sulla macchina 1:

Probabilità che un prodotto difettoso sia stato realizzato sulla macchina 2:

Probabilità che sulla macchina 3 sia stato realizzato un prodotto difettoso:

Condizione problematica 2

Il gruppo è composto da 1 studente eccellente, 5 studenti con buoni risultati e 14 studenti con risultati mediocri. Uno studente eccellente risponde a 5 e 4 con uguale probabilità, uno studente eccellente risponde a 5, 4 e 3 con uguale probabilità e uno studente mediocre risponde a 4,3 e 2 con uguale probabilità. Uno studente selezionato a caso ha risposto 4. Qual è la probabilità che sia stato chiamato uno studente con un rendimento mediocre?

Soluzione al problema 2

Ipotesi e probabilità condizionate

Sono possibili le seguenti ipotesi:

Rispose l'eccellente studente;

Il bravo ragazzo rispose;

- rispose lo studente mediocre;

Lascia che l'evento -studente ottenga 4.

Risposta:

Il prezzo è fortemente influenzato dall'urgenza della decisione (da un giorno a diverse ore). L'assistenza online per esami/test è disponibile su appuntamento.

Puoi lasciare una richiesta direttamente nella chat, dopo aver inviato preventivamente le condizioni degli incarichi e informato i tempi per la soluzione di cui hai bisogno. Il tempo di risposta è di pochi minuti.

Università statale siberiana delle telecomunicazioni e dell'informatica

Dipartimento di Matematica Superiore

nella disciplina: “Teoria della probabilità e statistica matematica”

"La formula della probabilità totale e la formula di Bayes (Bayes) e la loro applicazione"

Completato:

Responsabile: professor B.P

Novosibirsk, 2010


Introduzione 3

1. Formula della probabilità totale 4-5

2. Formula di Bayes (Bayes) 5-6

3. Problemi con le soluzioni 7-11

4. I principali ambiti di applicazione della formula di Bayes (Bayes) 11

Conclusione 12

Letteratura 13


Introduzione

La teoria della probabilità è una delle branche classiche della matematica. Ha una lunga storia. Le basi di questo ramo della scienza furono gettate da grandi matematici. Nominerò, ad esempio, Fermat, Bernoulli, Pascal.
Successivamente, lo sviluppo della teoria della probabilità fu determinato nel lavoro di molti scienziati.
Gli scienziati del nostro paese hanno dato un grande contributo alla teoria della probabilità:
P.L.Chebyshev, A.M.Lyapunov, A.A.Markov, A.N.Kolmogorov. I metodi probabilistici e statistici sono ormai penetrati profondamente nelle applicazioni. Sono utilizzati in fisica, tecnologia, economia, biologia e medicina. Il loro ruolo è particolarmente aumentato in connessione con lo sviluppo della tecnologia informatica.

Ad esempio, per studiare i fenomeni fisici si fanno osservazioni o esperimenti. I loro risultati sono solitamente registrati sotto forma di valori di alcune quantità osservabili. Quando ripetiamo gli esperimenti, scopriamo una dispersione dei loro risultati. Ad esempio, ripetendo le misurazioni della stessa quantità con lo stesso dispositivo mantenendo determinate condizioni (temperatura, umidità, ecc.), otteniamo risultati almeno leggermente diversi tra loro. Anche misurazioni ripetute non consentono di prevedere con precisione il risultato della misurazione successiva. In questo senso si dice che il risultato di una misurazione è una variabile casuale. Un esempio ancora più ovvio di variabile casuale è il numero di un biglietto vincente in una lotteria. Si possono fornire molti altri esempi di variabili casuali. Tuttavia, nel mondo del caso, vengono rivelati alcuni schemi. L'apparato matematico per studiare tali modelli è fornito dalla teoria della probabilità.
Pertanto, la teoria della probabilità si occupa dell'analisi matematica di eventi casuali e delle variabili casuali associate.

1. Formula della probabilità totale.

Lascia che ci sia un gruppo di eventi H 1 ,H 2 ,..., Hn, avente le seguenti proprietà:

1) tutti gli eventi sono incompatibili a coppie: CIAO

Hj=Æ; io, J=1,2,...,N; io¹ J;

2) la loro unione forma lo spazio degli esiti elementari W:

.
Fig.8

In questo caso lo diremo H 1 , H 2 ,...,Hn modulo gruppo completo di eventi. Tali eventi vengono talvolta chiamati ipotesi.

Permettere UN- qualche evento: UNÌW (il diagramma di Venn è mostrato nella Figura 8). Allora regge formula della probabilità totale:

P(UN) = P(UN/H 1)P(H 1) + P(UN/H 2)P(H 2) + ...+P(UN/Hn)P(Hn) =

Prova. Ovviamente: A=

e tutti gli eventi ( io = 1,2,...,N) sono incompatibili a coppie. Da qui, utilizzando il teorema di addizione delle probabilità, otteniamo

P(UN) = P(

) + P( ) +...+ P(

Se lo teniamo in considerazione con il teorema della moltiplicazione P(

) = P(A/H io) P(H io) ( io= 1,2,...,N), allora dall'ultima formula è facile ottenere la formula di probabilità totale di cui sopra.

Esempio. Il negozio vende lampade elettriche prodotte da tre fabbriche, con una quota della prima fabbrica del 30%, della seconda del 50% e della terza del 20%. I difetti nei loro prodotti sono rispettivamente del 5%, 3% e 2%. Qual è la probabilità che una lampada scelta a caso in un negozio risulti difettosa?

Lasciamo che l'evento H 1 è che la lampada selezionata è prodotta nel primo stabilimento, H 2 al secondo, H 3 - al terzo impianto. Ovviamente:

P(H 1) = 3/10, P(H 2) = 5/10, P(H 3) = 2/10.

Lasciamo che l'evento UNè che la lampada selezionata si è rivelata difettosa; A/H i indica il caso in cui viene selezionata una lampada difettosa tra le lampade prodotte in io-esima pianta. Dalla dichiarazione del problema segue:

P (UN/ H 1) = 5/10; P(UN/ H 2) = 3/10; P(UN/ H 3) = 2/10

Usando la formula della probabilità totale otteniamo

2. Formula di Bayes (Bayes)

Permettere H 1 ,H 2 ,...,Hn- un gruppo completo di eventi e UNМ W è un evento. Quindi, secondo la formula della probabilità condizionata

(1)

Qui P(Hk/UN) – probabilità condizionata di un evento (ipotesi) Hk o la probabilità che ciò accada Hk viene implementato a condizione che l'evento UN accaduto.

Secondo il teorema della moltiplicazione delle probabilità, il numeratore della formula (1) può essere rappresentato come

P = P = P(UN/Hk)P(Hk)

Per rappresentare il denominatore della formula (1), è possibile utilizzare la formula della probabilità totale

P(UN)

Ora dalla (1) possiamo ottenere una formula chiamata Formula di Bayes:

La formula di Bayes calcola la probabilità che l'ipotesi si realizzi Hk a condizione che l'evento UN accaduto. Viene anche chiamata la formula di Bayes formula per la probabilità delle ipotesi. Probabilità P(Hk) è detta probabilità a priori dell'ipotesi Hk e la probabilità P(Hk/UN) – probabilità a posteriori.

Teorema. La probabilità di un'ipotesi dopo il test è uguale al prodotto della probabilità dell'ipotesi prima del test e della corrispondente probabilità condizionale dell'evento accaduto durante il test, diviso per la probabilità totale di questo evento.

Esempio. Consideriamo il problema di cui sopra sulle lampade elettriche, basta cambiare la questione del problema. Supponiamo che un cliente abbia acquistato una lampada elettrica in questo negozio e si sia rivelata difettosa. Trova la probabilità che questa lampada sia stata prodotta nel secondo stabilimento. Grandezza P(H 2) = 0,5 in questo caso è la probabilità a priori dell'evento che la lampada acquistata sia stata prodotta nel secondo stabilimento. Avendo ricevuto l'informazione che la lampada acquistata è difettosa, possiamo correggere la nostra stima sulla possibilità di produrre questa lampada nel secondo stabilimento calcolando la probabilità a posteriori di questo evento.

Scriviamo la formula di Bayes per questo caso

Da questa formula otteniamo: P(H 2 /UN) = 15/34. Come puoi vedere, le informazioni ricevute hanno portato al fatto che la probabilità dell'evento che ci interessa è inferiore alla probabilità a priori.

3. Problemi con soluzioni.

Compito 1. Il negozio ha ricevuto nuovi prodotti da tre fabbriche. La composizione percentuale di questi prodotti è la seguente: 20% - prodotti della prima impresa, 30% - prodotti della seconda impresa, 50% - prodotti della terza impresa; inoltre, il 10% dei prodotti della prima impresa è della qualità più alta, nella seconda impresa il 5% e nella terza il 20% dei prodotti della qualità più alta. Trova la probabilità che un nuovo prodotto acquistato a caso sia della massima qualità.

Soluzione. Indichiamo con IN caso in cui verrà acquistato un prodotto premium

indichiamo gli eventi consistenti nell'acquisto di prodotti appartenenti rispettivamente alla prima, alla seconda e alla terza impresa.

Puoi applicare la formula della probabilità totale e nella nostra notazione:

Sostituendo questi valori nella formula della probabilità totale, otteniamo la probabilità desiderata:

Compito 2. Uno dei tre tiratori viene chiamato sulla linea di tiro e spara due colpi. La probabilità di colpire il bersaglio con un colpo per il primo tiratore è 0,3, per il secondo - 0,5; per il terzo - 0,8. Il bersaglio non viene colpito. Trovare la probabilità che i colpi siano stati sparati dal primo che ha sparato.