Blog Image

Parentela

Blog: genetica forense y probabilidad

Familias y mucho más
¿No os acordáis? sen^2 x + cos^2 x = 1 :))))))

relMix 2

Software Posted on jue, mayo 17, 2018 20:18:17

Frecuencias
mínimas en relMix

Como mucho de
vosotros sabéis, en relMix y en Familias se requiere que la suma de las
frecuencias alélicas de cada marcador sume 1, como en la vida real. Esto
también tiene que ver con los modelos mutacionales que el software puede
utilizar (ver por ejemplo, pág. 171 del libro de Thore:
http://www.familias.name/book.html). Pero ¿qué pasa si queremos utilizar
una frecuencia mínima en algún caso que estemos evaluando? Bueno, pues aquí va
la explicación de cómo funciona esto en relMix (aplicable también a Familias),
con un ejemplo que me envió Thore.

En realidad
existen dos versiones de relMix:
i) la llamada «function version»
más orientada a investigadores y
ii) la «GUI version» más orientada
a usuarios.
Pero ambas versiones usan el mismo código, la misma función de
verosimilitud y necesitan que las frecuencias de cada marcador sumen 1. En la
versión GUI, las frecuencias alélicas se «pre-procesan» de forma que
si no suman 1, el usuario tiene que tomar una decisión (como en Familias).

Por ejemplo,
imaginemos que disponemos de las siguientes frecuencias (no muy realistas, sólo
es un ejemplo) para el siguiente marcador M1:

Marker-1

Alelo 8 = 0.0008

Alelo 9 = 0.3992

Alelo 10 = 0.4000

Suman 0.8, en
lugar de 1. El software entonces te ofrece dos opciones:

a) Añadir un
«rest allele», es decir añadir un alelo extra con la frecuencia
necesaria para que la suma sea 1

b) Escalar, es
decir, redondear las frecuencias de los alelos 8, 9 y 10 para que sumen 1

En el ejemplo
anterior, si el usuario decide añadir un alelo extra llamado «rest
allele», obtendrá:

Marker-1

Alelo 8 = 0.0008

Alelo 9 = 0.3992

Alelo 10 = 0.4000

Rest allele = 0.2

Y si por el
contrario, el usuario decide escalar, cada frecuencia alélica se dividirá por
la suma de todas las frecuencias (en este caso, por 0.8), y así obtendrá:

Marker-1

Alelo 8 = 0.0010

Alelo 9 = 0.4990

Alelo 10 = 0.5000

Pero no nos
perdamos, estábamos interesados en usar frecuencias mínimas, así que imaginemos
que la frecuencia del alelo 8 (0.0008) nos parece demasiado pequeña e imprecisa
y pensamos que esto podría sesgar el resultado. Queremos entonces usar la
frecuencia mínima en lugar de la estimada, por ejemplo queremos usar una
frecuencia mínima de 0.01. En relMixGUI esto se define cuando cargamos la base
de datos (Database -> Options) y así, nuestro archivo original (con alelo 8
= 0.0008) se convierte en:

Marker-1

Alelo 8 = 0.01

Alelo 9 = 0.3992

Alelo 10 = 0.4000

En este caso,
como las frecuencias no suman 1 (suman 0.8092), el usuario tiene que decidir si
escalar o añadir un alelo extra. Pero en otros casos, si al añadir la
frecuencia mínima, la suma supera el valor 1, la única opción es escalar (no se
pueden añadir alelos extra, pues la suma aún daría un valor más grande que 1).

En el ejemplo, lo
más razonable es añadir un alelo extra, pues si escalamos la frecuencia mínima
que hemos introducido en el alelo 8 se modificaría también
(0.01/(0.01+0.3992+0.4000) = 0.0125), y no queremos que eso pase.

Veamos cómo funciona
entonces con un ejemplo de Thore:

Ejemplo (sin
drop-out, sin alelo silente, sin theta)

Madre = 9/9

Padre = 8/10

Mezcla = 8/9

p = frec. alelo 8
= 0.0008

H1 :
«Padre» es el padre

H2 : un hombre al
azar es el padre

LR = 0.5/p = 625

(En detalle: LR
=0.5/(p^2+2*p(1-p)*0.5)=1/p)

El resultado LR =
625 es exactamente el que saldría con relMixGUI si la frecuencia mínima la
definimos = 0 y no escalamos.

Si decidimos
escalar, pero seguimos sin usar la frecuencia mínima, entonces la frecuencia
del alelo 8 pasa de ser 0.0008 a ser 0.001 como hemos visto anteriormente (p =
0.0008 / 0.8) y el LR sería entonces:

LR = 0.5/p = 500

Finalmente, si
decidimos usar una frecuencia mínima de 0.01 y no escalamos (p = 0.01), el LR
tomaría un valor de:

LR = 0.5/p =50

Para que lo
podáis comprobar Thore nos manda archivos con este ejemplo. Podéis descargarlos
aquí: mezcla, referencias, database (ya sabéis, una vez estéis en la dirección,
control + s para guardarlos en vuestro ordenador)

Espero que os sea
útil este comentario! Lo importante es que sigamos aprendiendo!



relMix 1

Software Posted on mar, mayo 15, 2018 10:59:28

Menudo grupo de matemáticos forenses hay en Noruega!! Además
de ser buenísimos, son de lo más generoso. Hoy os voy a hablar de una
herramienta que ha creado Guro Dørum,
una genial matemática que además es la mejor bailarina de salsa de Europa, os
lo aseguro!

Guro ha puesto a nuestra disposición de forma gratuita, una
aplicación para evaluar mezclas en las que los contribuyentes están
emparentados. ¿Habéis tenido alguna vez un caso de agresión sexual con
resultado de embarazo en el que hayáis necesitado comparar una muestra de suero
de la víctima (mezcla) con un sospechoso? Demostrar la paternidad en este caso
es muy importante, pues puede implicar al sospechoso como agresor. Y sin ir a
un caso tan extremo… ¿habéis necesitado investigar la paternidad de un niño
aún no nacido?

El principal problema de estos casos de mezclas es que no
conocemos el perfil genético del bebé, lo tenemos formando parte de una mezcla
con su madre. Claramente, en las hipótesis tendremos que tener en cuenta que la
mezcla está formada por individuos emparentados.

El software se llama relMix y está hecho en R. Una vez que
os descarguéis e instaléis el paquete «relMix» en R, podéis acceder a
él con los siguientes comandos:

>
library(relMix)

>
relMixGUI()

Es bastante frecuente que en las muestras de plasma materno
detectemos la mezcla muy desequilibrada, con un perfil muy mayoritario
procedente de la madre y un perfil muy minoritario correspondiente al niño. No
pasa nada! Con relMix podéis evaluar este tipo de mezclas sin problemas, pues
se puede tener en cuenta que puede haber drop-out y drop-in en la mezcla (y
también podéis evaluar varios replicados de la mezcla a la vez). El software
también es capaz de evaluar la mezcla considerando mutación (con diferentes
modelos). Es decir, que el caso puede ser complicado, pues relMix está
preparado para evaluar casos complejos.

Más aún, las relaciones de parentesco no tienen por qué ser
el típico trío padre-madre-hijo, relMix evalúa también otros parentescos. Por
ejemplo, una mujer que ha mantenido relaciones con 2 hermanos y queda
embarazada puede querer saber cuál de los dos es el padre, antes de que nazca
el bebé. Pues simplemente hay que definir bien las hipótesis y ya está. Alucinante!!

Podéis encontrar toda la información sobre relMix en la
publicación de Guro:

Dørum, G.,
Kaur, N. & Gysi, M. Pedigree-based relationship inference from complex DNA
mixtures. Int J Legal Med (2017) 131: 629.
https://doi.org/10.1007/s00414-016-1526-x

Y además podéis descargaros una presentación .pdf y un vídeo
explicativo de nuestro queridísimo Thore en estos links:

http://www.few.vu.nl/~ksn560/Block-III-Part2-Mixtures-TE-ISFG2017.pdf

http://familias.name/VideosBook.pdf
(es el primer vídeo de la lista)

Bueno, pues además tenemos que dar la enhorabuena a Guro
doblemente, por el software y porque ha sido mamá hace poco. Esperamos que hayas pasado un feliz día de la
madre querida Guro!!



El peligro de las exclusiones en los casos de parentesco

Hipótesis Posted on vie, marzo 23, 2018 18:26:55

El establecimiento de hipótesis
en los casos de parentesco también tiene sus matices. Ya vimos en los
comentarios sobre el significado del LR
(http://parentela.familias.name/#category8) que es posible que no conozcamos
todos los escenarios posibles de nuestros casos. Como ya vimos, el LR no nos dice si una hipótesis es cierta o
no, más bien, si los resultados apoyan más una hipótesis que otra. Pero resulta
que ambas hipótesis podrían no ser ciertas!!

Imaginaros que una mujer que
viaja con tres menores (niña1, niña2 y niño3) declara en la frontera que son
sus hijos. La policía detecta que el pasaporte de la mujer es falso. Esto
podría ser un caso de inmigración ilegal, pero también pude ser algo más grave
como tráfico de menores. Para aclarar la situación os piden que hagáis estudios
de ADN con el fin de determinar si los tres menores son hijos de esta mujer…
y tras analizar aSTRs veis que la niña1 presenta incompatibilidades con esta
mujer en 12 de los 21 marcadores analizados y los otros dos menores son compatibles
con la mujer.

Bueno, pues parece un caso fácil.
Y si calculamos LRs suponiendo «maternidad» vs. «no
relacionado» para cada uno de los tres menores obtendríamos un LR muy
cercano a 0 en el caso de la niña1 (demasiadas mutaciones para que la hipótesis
de maternidad sea cierta!) y LRs muy elevados en el caso de los otros dos
menores.

Hasta aquí todo perfecto, pero en los casos en los que se vean
involucrados varios individuos y tengamos exclusión en uno de ellos, os
recomiendo ir un poco más allá y pensar en la posibilidad de otras hipótesis.
Tenemos claro que la niña1 no es hija de esta mujer, pero quizás esté
emparentada por vía paterna con los otros dos menores o al menos con uno de
ellos. También tendremos que ver entonces si la niña2 y el niño3 pueden tener o
no tener el mismo padre, con las siguientes hipótesis:

H1 = la niña2 y el niño3 son hermanos completos, la mujer es su madre

H2 = la niña2 y el niño3 son medio-hermanos, la mujer es su madre

Imaginaros que obtenemos esto cuando hacemos este cálculo con
Familias:

Claramente, H1 se ve favorecida
por los resultados (LRH1vsH2 = 42e+06). Así que ahora podemos
plantear las siguientes hipótesis, pero sin perder de vista que lo que estamos
intentando aclarar es si la niña1 puede pertenecer a este grupo familiar de
alguna forma o se trata de una persona no emparentada con ninguno de ellos.
Planteemos entonces las hipótesis:

H3 = la niña2 y el niño3 son hermanos completos (la mujer es su madre),
y la niña 1 es medio hermana paterna de 2 y 3.

H4 = la niña2 y el niño3 son hermanos completos (la mujer es su
madre), y la niña 1 no está relacionada con este pedigrí.

Quizás el LR aquí no sea muy elevado (imaginaros que alrededor de 380)
y decidamos ampliar análisis. El estudio de XSTRs nos ayudaría mucho en este
caso, está clarísimo. Imaginaros que hemos analizado las 4 muestras, que la
niña1 y la niña2 comparten alelos en cada cluster y que planteamos las mismas
hipótesis H3 y H4. Con FamLinkX podemos calcular de manera muy sencilla si los
resultados de nuestro análisis de XSTRs apoyan más una hipótesis que otra.
Supongamos que obtenemos LRH3vsH4 = e+07. Menos mal que hemos
pensado en otras hipótesis y no nos hemos limitado a informar de la exclusión
entre la niña1 y la madre!! Está claro
que las consecuencias podrían haber sido terribles para esta madre.

Pero Thore me ha dicho que hay una forma mejor de hacer los cálculos!
No es necesario que bombardeemos con tantos LRs en los informes… se pueden contrastar
todas las hipótesis a la vez:

H1 = la niña2 y el niño3 son hermanos completos, la mujer es su madre

H2 = la niña2 y el niño3 son medio-hermanos, la mujer es su madre

H3 = la niña2 y el niño3 son hermanos completos (la mujer es su
madre), y la niña 1 es medio hermana paterna de 2 y 3.

H4 = la niña2 y el niño3 son hermanos completos (la mujer es su
madre), y la niña 1 no está relacionada con este pedigrí.

Si hacemos esto con Familias (marcadores autosómicos) y escalamos en
H4, obtenemos:

Es decir, un LR de unos 380 favoreciendo H3: lo mismo que cuando
comparábamos H3 y H4 sólo. Veis que para H1 nos sale 1 (como H4 escalado). Es
porque H1 y H4 son básicamente la misma hipótesis, pero la hemos definido para
poder compararla con H2. Para ello, escalamos en H2 y obtenemos:

En este caso, H1 se ve favorecida 42E+06 veces, como ya habíamos visto
al comparar sólo H1 y H2. De nuevo, H1 y H4 nos da el mismo resultado porque
son en realidad la misma hipótesis.

Bueno, pues espero que os haya sido útil este ejemplo! Nos ha servido
para ilustrar una vez más lo importante que son las hipótesis y tener la mente
abierta a varias posibilidades!!



COMPRENDIENDO EL LR

Documentos en Español Posted on mar, marzo 06, 2018 17:41:39

En España tenemos la suerte de tener numerosos expertos en estos temas de la valoración estadística de la prueba de ADN. Y uno de ello es José Juan Lucena, Coronel de la Guardia Civil. Es increíble cómo una persona que no es experta en temas de ADN puede explicarnos tan bien cómo valorar nuestra prueba.
Tengo la suerte de contar con su amistad y generosidad, y quería compartir con vosotros este privilegio. Recientemente me ha enviado este documento:

Lucena_comprendiendo_LR_ADN

que considero de muchísima utilidad.

Espero que os resulte muy interesante, yo he disfrutado muchísimo leyéndolo!
Mil gracias José Juan por estar siempre dispuesto a enseñarnos!



Hipótesis en mezclas de dos contribuyentes

Hipótesis Posted on dom, febrero 18, 2018 08:31:52

Buenos día World!
¿Cuál sería la probabilidad de que yo estuviera escribiendo esto si me hubiera tocado la lotería? Pues ni yo misma lo sé, pero si además de haberme tocado la lotería, estuviera presa en la cárcel, seguro que la probabilidad sería alta, sólo por evitar el aburrimientosmiley

Una de las cuestiones primordiales en la valoración de la prueba forense es
el establecimiento de las hipótesis. Y parece que en esto, a veces fallamos. Se
nos olvida que las hipótesis deben representar los puntos de vista de las
partes involucradas en el proceso legal, y no nuestro punto de vista como
genetistas.

Hoy voy a centrarme en las hipótesis más adecuadas en casos de mezclas de 2
contribuyentes. Obviamente, el establecimiento de las mismas depende
enormemente de las circunstancias del caso, y con unos cuantos ejemplos veremos
algunas diferencias en cuanto a los perfiles que pueden cuestionarse.

Imaginemos que tenemos una mezcla M compatible totalmente con las
referencias de una víctima V y un acusado A; y supongamos para todos los casos
que: (i) los implicados en la mezcla no están relacionados genéticamente y (ii)
la población de interés es la española (para no tener que añadir estas dos
puntualizaciones en cada hipótesis).

Es bastante razonable pensar que si la mezcla la hemos detectado en una
muestra corporal (ej. hisopo vaginal de una víctima de agresión sexual), uno de
los perfiles será el de la víctima, y es muy lógico que ni el fiscal ni la
defensa cuestionen ese perfil. En estos casos entonces podemos establecer las
hipótesis:

Hp: la mezcla procede de V y de A
Hd: la mezcla procede
de V y otra persona desconocida

Pero, ¿qué pasa si no tenemos información alguna sobre el caso? Pues que las hipótesis pueden ser varias, ya que no sabemos qué es lo que
pretende esclarecer el tribunal:

H1: la mezcla procede de la víctima
y el acusado
H2: la mezcla procede
de la víctima y otra persona desconocido
H3: la mezcla procede
del acusado y otra persona desconocida
H4: la mezcla procede
de otras dos personas desconocidas

En nuestra rutina diaria, es bastante probable que conozcamos el punto de
vista del fiscal, pues lo que normalmente quiere es implicar al/los acusado/s.
Pero en los casos de mezclas es más difícil establecer el punto de vista de la
defensa. Imaginaros que nos encontramos ante una mezcla compatible con dos
acusados A1 y A2. Lo que puede estar claro es que a ambas partes, fiscalía y
defensa, les interesa que ambos perfiles sean valorados. Podemos tener la
tentación entonces de establecer las siguientes hipótesis:

Hp: la mezcla procede de A1 y A2
Hd: la mezcla procede
de otras dos personas desconocidas

Sin embargo, no debemos esperar que las defensas de A1 y A2 tengan el mismo
punto de vista, pues es perfectamente posible que la defensa de A1 reclame su
inocencia pero quiera implicar a A2. El problema aquí es que estamos intentando
utilizar un marco de dos hipótesis en un caso donde hay potencialmente varias
propuestas de defensa (Gittelson, y otros, 2016).

Por tanto, el perito debe ser consciente de la gama de alternativas que hay
en estos casos, y al menos debe considerar las siguientes hipótesis:

Hp1: la mezcla procede
de A1 y otra persona desconocida
Hp2: la mezcla procede
de A2 y otra persona desconocida

que serán contrastadas por separado con:

Hd: la mezcla procede
de otras dos personas desconocidas

Nuestra condición de genetistas también hace que muchas veces nos empeñemos
en cuestionar perfiles que ni fiscalía ni defensa cuestionarían. Tal es el caso
por ejemplo de una mezcla hallada en la empuñadura de un cuchillo lleno de
sangre, que aparece al lado de un cadáver (pero no clavado en el cadáver). Aunque
la mezcla sea perfectamente compatible con víctima y acusado (sin drop-out,
drop-in, etc), nuestra mente científica hace que cuestionemos que el perfil de
la víctima esté ahí, aunque ni el fiscal ni la defensa duden de que tenga que
estar. Nos lanzamos entonces a establecer las hipótesis:

Hp: la mezcla procede de la víctima y el
acusado
Hd: la mezcla procede de otras dos
personas desconocidas

Pues bien, el valor de LR que vamos a obtener considerando este par de
hipótesis va a ser mucho mayor que el que obtengamos si no cuestionáramos la
presencia del perfil de la víctima (víctima + acusado vs víctima +
desconocido). Lo único que la defensa y el fiscal quieren aclarar es si el
acusado ha participado en la mezcla o no, y estaríamos siendo tremendamente
injustos si en nuestro informe ni si quiera mencionamos que hay otras posibles
hipótesis que se pueden contrastar y con las cuales obtendríamos otros valores
de LR.

En fin… para pensar un poco

También recordaros que debemos enunciar las hipótesis de la forma más clara
y precisa posible. Aquí las he enunciado muy resumidas porque he aclarado al
principio que, en todas las hipótesis que iba a plantear, la población de
referencia sería la española y los contribuyentes a la mezcla no estarían
relacionados genéticamente (tampoco sería un problema si lo estuvieran…sólo
habría que definirlo). Pero si en nuestros informes no hacemos estas
aclaraciones generales, debemos incluir esta información en las hipótesis. Por
ejemplo:

Hp: la mezcla procede de A y de otra persona desconocida de la población
española no relacionada genéticamente con A
Hd: la mezcla procede
de dos personas desconocidas de la población española, no relacionadas
genéticamente ni con A, ni entre sí

… que se nos suele olvidar poner “ni con A” o “ni entre sí”.



Significado del LR – Parte 3

Significado del LR Posted on jue, febrero 08, 2018 16:55:27

Bueno, pues veamos ahora cómo se calcula una probabilidad a
posteriori en forma de apuesta (Bayes Theorem in odds form). Nos basaremos en
la diapositiva 30 de la charla de Thore, y usaremos el mismo ejemplo que
veníamos usando.

Posterior
odds de la comparación de H3 (gemelos) y H1 (hermanos):

Es decir, H3 (gemelos) es 2000 veces más probable que H1
(hermanos) teniendo en cuenta estos priors.
No sabemos si hay más hipótesis o no, si sólo hubiera una más (por ejemplo H2 =
no relacionados), su prior sería = 1 –
P(H1)-P(H3)=0.4999995. Pero podría haber más hipótesis, y el prior 0.4999995 de H2 se subdividiría entre
las hipótesis adicionales. En cualquier caso, el cálculo y la interpretación que
hemos realizado en forma de odds sería igual de válido, ya que sólo estamos
comparando H3 y H1.

Veis entonces que los posterior
en forma de odds nada tienen que ver con las probabilidades a posteriori (que deben tener en cuenta
todas las posibilidades y sumar 1!!).

Quería también poneros un ejemplo clarísimo en el que
enseguida nos damos cuenta de que no conocemos todas las hipótesis posibles. Imaginaros
que nos piden saber si un varón y una mujer son hermanos en un caso de
inmigración, y que resulta que al analizar ADNmt nos damos cuenta de que no
pueden ser hermanos de madre porque sus haplotipos son distintos. Claramente,
no conocemos todas las hipótesis: podrían ser medio-hermanos, primos, no estar
relacionados…Le pregunté a Thore sobre esto y me ha recomendado leer este
paper:

Karlsson et
al., 2007. DNA testing for immigration cases: the risk of erroneous
conclusions. For. Sci. Int. 172: 144-149

Bueno, seguro que os resulta interesante a los que hacéis
casos de inmigración ilegal y reagrupación familiar. Ya me diréis que os
parece!!

***Comentario de revista Hola: el primer autor de este
paper (Andreas Karlsson) es en realidad nuestro conocidísimo Andreas Tillmar,
que se puso el apellido de su mujer cuando se casó. Yo creo que este cambio de
Karlsson a Tillmar puede deberse a dos motivos: quizás lo hizo porque Karlsson
es el tercer apellido más frecuente en Suecia, o quizás porque está enamoradísimo
de su esposa. La segunda opción es tan bonita….



Significado del LR – Parte 2

Significado del LR Posted on mié, enero 31, 2018 13:25:18

Algunos os preguntaréis cómo hemos calculado las
probabilidades a posteriori en el
comentario anterior. Pues simplemente hemos aplicado Bayes, para k hipótesis y
con cualquier probabilidad a priori (En: “Relationship inference with Familias
and R”, Chapter 2, Egeland et al., 2016):

Horror!! Vaya fórmula! Pero no es para tanto, sólo tenemos
que multiplicar cada LR por cada prior (columna
“PRODUCTO” del Excel que veréis abajo), sumar los resultados de esta
multiplicación (casilla “denominador”), y luego dividir cada producto por el
denominador (columna “POSTERIOR”). Mejor lo vemos con el ejemplo:

a) Si H1, H2 y H3 son igualmente probables a priori (1/3 cada una), obtenemos:

Si
queréis ver un ejemplo real en Familias, podéis descargaros el archivo que ha
preparado Thore. He alucinado con este archivo porque Thore ha definido las
persons y las hipótesis en español!! Cada vez tiene menos de nórdico y más de
latino… está totalmente mimetizado con nosotrosJ))Bueno,
el archivo os lo podéis descargar en este link: http://familias.name/blog/blog-dormant.fam (usando los comandos Control+s, una vez que estéis
dentro del link). Obviamente las cifras son diferentes, pero la idea es la misma. En este
archivo podéis ver cómo definir H3 (gemelos) en Familias (seleccionando “direct
match” en el pedigrí). Y además podéis comprobar que el LR de H3 vs H2 es igual
al valor de 1/RMP que obtenemos en la ventana “Case DNA data” cuando hacemos
click en “Compare DNA” (como ya discutimos en la validación del cálculo de RMP,
post del 10/01/2018)

b) Si H1 y H2 son a priori más probables que H3, obtenemos:

Que es justo lo que veíamos en las diapos de Thore.

Pero lo más importante de todo esto es destacar lo que hemos
aprendido con este ejemplo:

a) Como ya vimos, el LR no nos dice si una
hipótesis es cierta o no, más bien, si los resultados apoyan más una hipótesis
que otra (y ambas hipótesis podrían no ser ciertas!!)

b) Que en nuestros casos reales, sólo debemos
calcular probabilidades a posteriori si
nuestras hipótesis son exhaustivas, es decir, si conocemos y tenemos en cuenta
TODAS las hipótesis relevantes. Ya hemos visto con este ejemplo que existe la
posibilidad de que los resultados de ADN apoyen fuertemente una hipótesis que
tenía una probabilidad a priori extremadamente baja (H3, en el ejemplo b, con prior = 10^(-6))

La mayoría de las veces sí que conocemos las hipótesis
relevantes, por el contexto del caso. Pero ¿qué hacemos entonces si nuestras
hipótesis no son exhaustivas? Pues podemos calcular posteriors en forma de apuesta (posterior
odds), pero no probabilidades a
posteriori
.

Si queréis ver cómo, darme un tiempecito y preparo otro post!

02/02/2018
Añado aquí unas imágenes que me ha mandado Thore respecto a este post. Se trata del uso de una página web en la que podéis calcular directamente las probabilidades a posteriori sin necesitad del Excel anterior. Hay de todo en Internet!!

La única precaución que hay que tener es que debemos introducir en la página la verosimilitud de cada hipótesis, no el LR. Aquí veis en ejemplo de Thore (marcador D3 del archivo de Familias anteriro: http://familias.name/blog/blog-dormant.fam)


Y una vez calculado el likelihood, ya podéis meter los datos (prior y likelihood) en la web http://psych.fullerton.edu/mbirnbaum/bayes/BayesCalc3.htm para calcular la probabilidad a posteriori:


Very useful Thore! Many thanks!



Significado del LR – Parte 1

Significado del LR Posted on mié, enero 24, 2018 20:01:22

Como sabéis el LR no nos dice si una hipótesis es cierta o
no, más bien nos dice si nuestros resultados apoyan más una hipótesis que otra.
Por tanto, cuando decimos que:

a)
Si el LR > 1: los resultados apoyan H1 (la
del numerador)

b)
Si el LR = 1: la evidencia es neutra

c) Si el LR < 1: los resultados apoyan H2 (la
del denominador)

estamos hablando realmente en términos relativos, es decir
esto sólo es cierto en el caso de H1 con respecto a H2. Pero, qué pasa si hay
más escenarios posibles?, si hay más hipótesis?

Los que hayáis echado un vistazo a las diapos del curso de
enero que dieron Thore y Magnus en Oslo (y a las que tan amablemente Thore nos dio
acceso, ver cursos), sabréis la respuesta. Para los que no hayáis tenido tiempo de verlas, aquí
os reproduzco un ejemplo que, desde mi punto de vista, es buenísimo para
entender bien esto.

Imaginemos que analizamos los perfiles genéticos de dos
individuos y que queremos saber si pueden ser hermanos. Nuestras hipótesis
podrían ser: “H1 = hermanos” vs “H2: no relacionados”.

Imaginemos que tras el análisis hemos obtenido exactamente
el mismo perfil genético en los dos individuos. Si valoramos nuestra evidencia
teniendo en cuenta esas dos hipótesis, lógicamente el LR nos va a salir elevado, por ejemplo 10^6. La
evidencia por tanto apoya la hipótesis de que son hermanos, pero sólo cuando la
comparamos con la hipótesis de que no estén relacionados.

Obviamente, si descartamos un error en el lab (como podría
ser el hecho de haber analizado la misma muestra dos veces en lugar de analizar
las dos muestras), enseguida nos viene a la mente una tercera hipótesis: “H3=
gemelos idénticos”. Si ahora valoramos este resultado teniendo en cuenta las
hipótesis H3 y H2, el LR nos dará un número aún más elevado (imaginemos que
sale 10^15).

Consideremos ahora que a priori, las tres hipótesis tienen
la misma probabilidad (1/3 cada una). En la tabla siguiente (diapositiva 43 de
la charla “Forensics I: paternity cases, complex identification cases” de
Thore), podéis ver las probabilidades a posteriori:

Así que, en este caso, aunque el LR que obtenemos al tener
en cuenta H1 y H2 es mucho mayor que 1 (10^6), lo cierto es que la probabilidad
a posteriori (P (H1│E)) es menor que la probabilidad a priori (10^9 < 1/3).

Imaginemos ahora que damos mucha más probabilidad a priori a
las hipótesis H1 y H2, y una probabilidad a priori muy pequeña a H3; por
ejemplo casi 0.5 a H1 y H2, y sólo 10^(-6) a H3 (0.000001). Si calculamos las probabilidades
a posteriori, obtenemos (diapositiva 44 de la charla anterior):

De nuevo, la probabilidad a posteriori de H1 es menor que su
probabilidad a priori. Y respecto a H3, a pesar de que hemos definido que su
probabilidad a priori sea muy baja, su probabilidad a posteriori es muy
elevada, ya que H3 es la mejor explicación de nuestros resultados.

Por tanto, aunque el LR que evalúa nuestros resultados comparando
H1 (hermanos) y H2 (no relacionados) es mucho mayor que 1, esto no significa
que H1 sea una buena hipótesis (o que H1 sea cierta). Perfectamente puede
significar que H1 no es una buena hipótesis y que H2 es aún peor. Lo dicho
entonces, que el LR no nos dice si una hipótesis es cierta o no.

En el siguiente post veremos cómo se han calculado las
probabilidades a posteriori en este ejemplo, y lo que podemos aprender de él.



« PrevioSiguiente »