Calculando probabilidades condicionales: Teorema de Bayes

Filed under Matemáticas
Tagged as

Introducción

El Teorema de Bayes ofrece un método matemático que nos permite contestar a preguntas relacionadas con la probabilidad condicional inversa en ciertas situaciones. Por ejemplo, si tenemos dos eventos A y B y se conocen P(A|B) y P(B), podemos deducir con relativa facilidad P(B|A). Ésto, que a simple vista puede parecer carente de significado, resume aspectos tan cotidianos de nuestra vida como nuestra forma de tomar ciertas decisiones.

Algunos conceptos

Antes de empezar de lleno a hablar de la Regla de Bayes no estarían mal un par de definiciones. A mi al menos me fueron de ayuda cuando empecé en ésto del cálculo probabilístico… ;-)
Básicamente lo que tenemos que saber es que cuando nos encontramos algo como P(B|A), lo que estaremos viendo es simplemente ésto:

“La probabilidad de que habiendo sucedido A, suceda B.”

Es decir, la probabilidad condicional de B dado A.

La Regla de Bayes hace un planteamiento “inverso” de la probabilidad condicional. Básicamente supondremos que B ha sucedido y en base a ello nos interesaremos por la probabilidad de que A halla sido el desencadenante de B. Es decir, ahora calcularemos P(A|B).

Para aclarar todo ésto un poco, supongamos que la acción A es estar resfriado y la acción B es tener fiebre. Sabemos que existe una probabilidad dada (y de hecho relativamente alta) de tener fiebre si estamos resfriados (P(B|A)). Por tanto, si vamos a un médico a que nos diagnostique y ve que tenemos fiebre (B) determinará las probabilidades de que dicha fiebre halla sido causada por un resfriado (P(A|B)).

Regla de Bayes

Generalizando el ejemplo anterior, la Regla de Bayes nos ayudará en el caso de que tengamos un conjunto de causas C = \{A_{1}, A_{2}, A_{3}, ... , A_{N}\} excluyentes entre si, un efecto B que ha sucedido, un conjunto de probabilidades \{P(B|A_{1}), P(B|A_{2}), P(B|A_{3}), ... , P(B|A_{N})\} y necesitemos saber la probabilidad de que hallan sucedido cada una de las posibles causas (vamos, lo que hace House metiéndose con el escote de Cuddy, pero matemáticamente).

Para determinar la probabilidad que han tenido cada una de las causas de suceder partimos de lo siguiente:

P(B|A_{1}) = \frac{P(B \wedge A_{1})}{P(A_{1})}

y del mismo modo sabemos que

P(A_{1}|B) = \frac{P(B \wedge A_{1})}{P(B)}

con lo cual es fácil deducir que P(A_{1}|B)P(B) = P(A_{1}|B)P(A_{1}), de donde obtenemos la probabilidad de que A_{1} halla sido causante de B:

P(A_{1}|B) = \frac{P(B|A_{1})P(A_{1})}{P(B)}

Pero además sabemos que B es debida a alguna de las causas del conjunto P que definimos anteriormente, es decir

P(B) = P[(A_{1}\wedge B) \bigcup (A_{2}\wedge B) \bigcup (A_{3}\wedge B) \bigcup ... \bigcup (A_{N}\wedge B)]

Como éstas causas son excluyentes entre si, al aplicar las Reglas de la adición obtenemos

P(B) = P(A_{1})P(B|A_{1})+P(A_{2})P(B|A_{2})+P(A_{3})P(B|A_{3})+ ... +P(A_{N})P(B|A_{N})

Si ahora sustituimos el denominador en la ecuación con la que calculamos P(A_{1}|B) anteriormente, obtendremos la Regla de Bayes generalizada:

P(A_{1}|B) = \frac{P(A_{1})P(B|A_{1})}{P(A_{1})P(B|A_{1})+P(A_{2})P(B|A_{2})+P(A_{3})P(B|A_{3})+ ... +P(A_{N})P(B|A_{N})}

A las probabilidades P(A_{1}, P(A_{2}), P(A_{3}), ... P(A_{N}) se las conoce como probabilidades sin corregir o probabilidades a “priori”.

Un ejemplo

Ahora veámoslo todo con un ejemplo. Supongamos que la probabilidad de encontrar una mujer morena en Sudámerica sea P(m|s)=0.7, la probabilidad de encontrar una mujer morena en Centroamérica es de P(m|c)=0.9 y la probabilidad de encontrar una mujer morena en Norteamércia es de P(m|n)=0.4.

Si se realiza un concurso de belleza para elegir Miss América y el 30% de las participantes son sudaméricanas, el 20% centroaméricanas y el 50% norteaméricanas y nos presentan a una mujer morena ¿de qué parte de América viene?

Analizando los datos dados podemos obtener las siguientes probabilidades “a priori”:

Probabilidad de que la mujer sea una concursante centroaméricana: P(c)=0.2.
Probabilidad de que la mujer sea una concursante sudaméricana: P(s)=0.3.
Probabilidad de que la mujer sea una concursante norteaméricana: P(n)=0.5

La probabilidad de hallar una morena según la región es:

Probabilidad de encontrar una morena estando en Sudamérica: P(m|s)=0.7.
Probabilidad de encontrar una morena estando en Centroamérica: P(m|c)=0.2.
Probabilidad de encontrar una morena estando en Norteamérica: P(m|n)=0.4.

Nuestro objetivo es determinar la probabilidad de que la morena que acabamos de conocer sea de una u otra parte del continente, es decir, buscamos P(c|m), P(s|m) y P(n|m) sabiendo que el suceso m = sucedió:

P(s|m) = \frac{P(m|s)P(s)}{P(m|s)P(s)+P(m|s)P(c)+P(m|s)P(n)}

Sustituyendo:
P(s|m) = \frac{0.7*.03}{0.7*0.3 + 0.9*0.2 + 0.4*0.5} = 0.36

Del mismo modo obtendremos P(c|m)=0.31 y P(n|m)=0.33 de donde podemos deducir que lo mas probable es que la morena que acabamos de conocer sea sudaméricana.

Para el cálculo de dichos valores se ha utilizado la siguiente tabla:

SudamericanaCentroamericanaNorteamericanaP(Morena)
Mujer Morena0.210.180.200.59
Mujer no morena0.090.020.300.41
P(origen)0.300.200.501

En la tabla, las probabilidades marginales informan de la probabilidad del color de piel independientemente de la región geográfica y viceversa.

Referencias

La práctica totalidad de ésta entrada se ha obtenido de unos apuntes online de la Facultad de Ciencias Económicas – Sede Trelew de la Universidad Nacional de la Patagonia.

Éste documento no pretende ser una guía para la utilización de la Regla de Bayes, sino que se trata de un resumen a título personal para asentar mejor los conocimientos adquiridos.

Post a Comment

Your email is never published nor shared. Required fields are marked *

*
*
Security Code: