Info

Bayes Teorema definiție și exemple

Bayes Teorema definiție și exemple


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Teorema lui Bayes este o ecuație matematică folosită în probabilitate și statistici pentru a calcula probabilitatea condițională. Cu alte cuvinte, este utilizat pentru a calcula probabilitatea unui eveniment bazat pe asocierea acestuia cu un alt eveniment. Teorema este cunoscută și ca legea lui Bayes sau regula lui Bayes.

Istorie

Teorema lui Bayes este numită pentru ministrul și statisticianul englez Reverendul Thomas Bayes, care a formulat o ecuație pentru lucrarea sa „Un eseu către rezolvarea unei probleme în doctrina șanselor”. După moartea lui Bayes, manuscrisul a fost editat și corectat de Richard Price înainte de publicarea în 1763. Ar fi mai exact să ne referim la teoremă ca regula Bayes-Price, deoarece contribuția lui Price a fost semnificativă. Formularea modernă a ecuației a fost concepută de matematicianul francez Pierre-Simon Laplace în 1774, care nu știa lucrările lui Bayes. Laplace este recunoscut drept matematicianul responsabil pentru dezvoltarea probabilității bayesiene.

Formula pentru teorema lui Bayes

Există mai multe moduri diferite de a scrie formula pentru teorema lui Bayes. Cea mai comună formă este:

P (A ∣ B) = P (B ∣ A) P (A) / P (B)

unde A și B sunt două evenimente și P (B) ≠ 0

P (A ∣ B) este probabilitatea condițională a evenimentului A, având în vedere că B este adevărat.

P (B ∣ A) este probabilitatea condițională a apariției evenimentului B având în vedere că A este adevărat.

P (A) și P (B) sunt probabilitățile ca A și B să apară independent unele de altele (probabilitatea marginală).

Exemplu

S-ar putea să doriți să găsiți probabilitatea unei persoane de a avea artrita reumatoidă dacă are febră de fân. În acest exemplu, „a avea febră de fân” este testul pentru artrita reumatoidă (evenimentul).

  • A ar fi evenimentul „pacientul are artrită reumatoidă”. Datele indică 10% dintre pacienții dintr-o clinică au acest tip de artrită. P (A) = 0,10
  • B este testul „pacientul are febră de fân”. Datele indică 5% dintre pacienții dintr-o clinică au febră de fân. P (B) = 0,05
  • Înregistrările clinicii arată, de asemenea, că dintre pacienții cu artrită reumatoidă, 7 la sută au febră de fân. Cu alte cuvinte, probabilitatea ca un pacient să aibă febră de fân, dat fiind faptul că are artrită reumatoidă este de 7 la sută. B ∣ A = 0,07

Conectarea acestor valori la teoremă:

P (A ∣ B) = (0,07 * 0,10) / (0,05) = 0,14

Deci, dacă un pacient are febră de fân, șansa sa de a avea artrită reumatoidă este de 14 la sută. Este puțin probabil ca un pacient la întâmplare cu febră de fân să aibă artrită reumatoidă.

Sensibilitate și specificitate

Teorema lui Bayes demonstrează în mod elegant efectul falselor pozitive și false negative în testele medicale.

  • Sensibilitate este adevărata rată pozitivă. Este o măsură a proporției pozitive identificate corect. De exemplu, într-un test de sarcină, ar fi procentul de femei cu un test de sarcină pozitiv care au rămas însărcinate. Un test sensibil rareori ratează un „pozitiv”.
  • Specificitate este adevărata rată negativă. Măsoară proporția de negative identificate corect. De exemplu, într-un test de sarcină, ar fi procentul femeilor cu un test de sarcină negativ care nu au rămas însărcinate. Un test specific înregistrează rareori o falsă pozitivă.

Un test perfect ar fi 100% sensibil și specific. În realitate, testele au o eroare minimă numită rata de eroare Bayes.

De exemplu, ia în considerare un test de droguri care este sensibil la 99 la sută și specific la 99 la sută. Dacă jumătate la sută (0,5%) dintre oameni utilizează un medicament, care este probabilitatea ca o persoană la întâmplare cu un test pozitiv să fie de fapt utilizator?

P (A ∣ B) = P (B ∣ A) P (A) / P (B)

poate rescris ca:

P (utilizator ∣ +) = P (+ ∣ utilizator) P (utilizator) / P (+)

P (utilizator ∣ +) = P (+ ∣ utilizator) P (utilizator) / P (+ ∣ utilizator) P (utilizator) + P (+ ∣ non-utilizator) P (non-utilizator)

P (utilizator ∣ +) = (0.99 * 0.005) / (0.99 * 0.005 + 0.01 * 0.995)

P (utilizator ∣ +) ≈ 33,2%

Doar aproximativ 33% din timp o persoană aleatorie cu un test pozitiv ar fi de fapt consumator de droguri. Concluzia este că, chiar dacă o persoană testează pozitiv un medicament, este mai probabil să o facă nu folosesc drogul decât cel pe care îl fac. Cu alte cuvinte, numărul falsurilor pozitive este mai mare decât numărul adevăratelor pozitive.

În situațiile din lumea reală, un compromis se face de obicei între sensibilitate și specificitate, în funcție de faptul că este mai important să nu ratezi un rezultat pozitiv sau dacă este mai bine să nu etichetezi un rezultat negativ ca pozitiv.


Priveste filmarea: exercitii rezolvate probabilitati (Mai 2022).