Como sabéis, las nuevas recomendaciones de la ISFG sobre
validación de software (Coble et al., FSI:Gen 25 (2016): 191-197) anima a los
desarrolladores a que verifiquen y validen su propio software, por ejemplo
proporcionando datos e hipótesis a evaluar, así como las soluciones esperadas
de la evaluación estadística. Y Familias cumple perfectamente con esta
recomendación. También hay una validación formal externa a los desarrolladores,
como podéis ver en el paper Drábek, J:
«Validation of software for calculating the likelihood ratio for parentage
and kinship». Forensic Science International: Genetics, 3, 2008.
Podéis encontrar los archivos de la validación de los
creadores y desarrolladores del software en http://familias.no/english/download/.
Ahí bajáis hasta el apartado «Vaidation» y encontraréis con
hipervínculo:
a) «following files«: que te
lleva a un zip con archivos de Familias para varios casos (típico trío, típico
dúo, varios modelos de mutación, alelo silente, pedigrí complejo, parentesco
con y sin Fst)
b) «file«: que te lleva a un Excel
con las soluciones que se obtienen en Familias para esos casos, comparándolas
con las soluciones ofrecidas por otras aplicaciones y/o lo que se obtiene con
cálculos manuales para los mismos casos.
No existe ningún archivo de validación para el cálculo de la
RMP (random match probability) en casos de match directo, pero Thore y Daniel
recibieron una pregunta de Paulo Chaves (Brasil) al respecto y compartieron
conmigo la respuesta. Así que aquí os pongo un ejemplo para esto, que contiene los datos de un ejercicio del libro Egeland, Kling,
Mostad (2016) p. 31. ***Quería incluiros aquí el archivo de Familias directamente, para que no tengáis que teclear nada, pero el editor del blog no me deja subir archivos tipo .fam. Si alguien lo quiere, que me lo pida!!****
Os detallo la base teórica a continuación, incluyendo y sin
incluir corrección Theta.
Como sabéis, la inversa de la RMP (1/RMP) no es más que una
versión del LR (cuando las hipótesis son «H1: los dos perfiles proceden
del mismo individuo» vs. «H2: los dos perfiles proceden de dos
individuos al azar», y no hay eventos de drop-out, drop-in,
contaminación…).
Consideremos el marcador D3S1358 con, entre otros, los
alelos 17 y 18, cuyas frecuencias son 0.204 y 0.139 respectivamente.
Consideremos también dos perfiles genéticos homocigotos 17-17 para este
marcador. La inversa de la RMP se calcula: 1/(0.204)^2 = 24.02922, lo que
indica que es 24 veces más probable obtener estos perfiles si H1 es cierta, en
comparación con que H2 sea cierta. La RMP sería (0.204)^2 = 0.04, y nos indica
la probabilidad de que una persona al azar de la población tuviera este
genotipo 17-17. Para no confundir RMP con 1/RMP, recordar que RMP es una
probabilidad, y por tanto los valores que puede tomar están siempre entre 0 y
1.
Consideremos ahora dos perfiles genéticos heterocigotos
17-18 para este marcador. La inversa de la RMP sería ahora 1/(2*0.204*0.139) =
17.63295, y la RMP sería 2*0.204*0.139 =
0.056712.
Con Familias veréis que se
obtiene lo mismo:
Veamos ahora qué obtendríamos si tenemos en cuenta un valor
de Theta = 0.03. La fórmula general podéis encontrarla en la Sección
2.5.1 del libro mencionado (Egeland, Kling, Mostad (2016) )
En el caso de homocigotos, la inversa de la RMP se
calcula:
1/RMP = 1/(0.03*0.204+(1-0.03)*0.204^2))= 21.51114966
En el caso de heterocigotos, la inversa de la RMP es:
1/RMP = 1/(2*(1-0.03)*0.204*0.139)= 18.17830151
Para hacerlo con Familias sólo tenéis que ir a la ventana de
pedigríes, hacer click en «Parameters» y rellenar la casilla Tetha
con el valor 0.03. Después, como en el caso ilustrado en las figuras, vais a la
ventana de Case DNA data (datos genéticos), y ahí seleccionáis uno de los
perfiles y click en «Compare DNA».
En resumen, esto es lo que debéis obtener:
Familias 3 tiene muchas funciones nuevas que aún hay que
validar, pues ya sabéis que esto de las validaciones es un no parar y hay que
estar actualizándose continuamente, como nos pasa en el Lab. Poco a poco iremos
haciéndolo!
Bueno, pues espero que este post os sea útil para que
también podáis hacer cálculos de LRs en casos de match directo respaldados con
validación!
Hola Mariana!
Mil gracias por tus amables palabras!
Bueno pues los valores de los cálculos según las versiones del software son prácticamente los mismos. Las diferencias se deben sólo al ajuste en el número de decimales.
Respecto a los problemas con el cálculo en el trío, yo creo que lo mejor es que me envíes el archivo de Familias que tú has creado para que lo pueda revisar y decirte que puede estar pasando. Mi correo es lourditasmt@gmail.com.
Un fuerte abrazo!!
Hola Lourdes, yo llamo Mariana, soy analista de ADN forense, brasileña. ¡Enhorabuena por el blog! Muy interesante. He abierto el archivo «file» y me di cuenta de que en la hoja de cálculo de valores del cálculo tiene diferentes veladas, dependiendo de la versión del software Familias. ¿Por qué sucede esto? También no sé cómo calcular ese valor del trío en el software, sólo puedo calcular el dúo. Muchas gracias. Mariana
Queridos!
Thore me ha dicho cómo subir archivos .fam al blog! Así que aquí va el link para que os podais descargar este archivo de validación de la RMP:
http://familias.name/blog/RMP.fam
Para guardarlo en vuestros ordenadores, sólo tenéis que usar «Control+s» una vez que estéis dentro del link.
Many thnaks Thore!!