Como sabéis, las nuevas recomendaciones de la ISFG sobre
validación de software (Coble et al., FSI:Gen 25 (2016): 191-197) anima a los
desarrolladores a que verifiquen y validen su propio software, por ejemplo
proporcionando datos e hipótesis a evaluar, así como las soluciones esperadas
de la evaluación estadística. Y Familias cumple perfectamente con esta
recomendación. También hay una validación formal externa a los desarrolladores,
como podéis ver en el paper Drábek, J:
«Validation of software for calculating the likelihood ratio for parentage
and kinship». Forensic Science International: Genetics, 3, 2008.
Podéis encontrar los archivos de la validación de los
creadores y desarrolladores del software en http://familias.no/english/download/.
Ahí bajáis hasta el apartado «Vaidation» y encontraréis con
hipervínculo:
a) «following files«: que te
lleva a un zip con archivos de Familias para varios casos (típico trío, típico
dúo, varios modelos de mutación, alelo silente, pedigrí complejo, parentesco
con y sin Fst)
b) «file«: que te lleva a un Excel
con las soluciones que se obtienen en Familias para esos casos, comparándolas
con las soluciones ofrecidas por otras aplicaciones y/o lo que se obtiene con
cálculos manuales para los mismos casos.
No existe ningún archivo de validación para el cálculo de la
RMP (random match probability) en casos de match directo, pero Thore y Daniel
recibieron una pregunta de Paulo Chaves (Brasil) al respecto y compartieron
conmigo la respuesta. Así que aquí os pongo un ejemplo para esto, que contiene los datos de un ejercicio del libro Egeland, Kling,
Mostad (2016) p. 31. ***Quería incluiros aquí el archivo de Familias directamente, para que no tengáis que teclear nada, pero el editor del blog no me deja subir archivos tipo .fam. Si alguien lo quiere, que me lo pida!!****
Os detallo la base teórica a continuación, incluyendo y sin
incluir corrección Theta.
Como sabéis, la inversa de la RMP (1/RMP) no es más que una
versión del LR (cuando las hipótesis son «H1: los dos perfiles proceden
del mismo individuo» vs. «H2: los dos perfiles proceden de dos
individuos al azar», y no hay eventos de drop-out, drop-in,
contaminación…).
Consideremos el marcador D3S1358 con, entre otros, los
alelos 17 y 18, cuyas frecuencias son 0.204 y 0.139 respectivamente.
Consideremos también dos perfiles genéticos homocigotos 17-17 para este
marcador. La inversa de la RMP se calcula: 1/(0.204)^2 = 24.02922, lo que
indica que es 24 veces más probable obtener estos perfiles si H1 es cierta, en
comparación con que H2 sea cierta. La RMP sería (0.204)^2 = 0.04, y nos indica
la probabilidad de que una persona al azar de la población tuviera este
genotipo 17-17. Para no confundir RMP con 1/RMP, recordar que RMP es una
probabilidad, y por tanto los valores que puede tomar están siempre entre 0 y
1.
Consideremos ahora dos perfiles genéticos heterocigotos
17-18 para este marcador. La inversa de la RMP sería ahora 1/(2*0.204*0.139) =
17.63295, y la RMP sería 2*0.204*0.139 =
0.056712.
Con Familias veréis que se
obtiene lo mismo:
Veamos ahora qué obtendríamos si tenemos en cuenta un valor
de Theta = 0.03. La fórmula general podéis encontrarla en la Sección
2.5.1 del libro mencionado (Egeland, Kling, Mostad (2016) )
En el caso de homocigotos, la inversa de la RMP se
calcula:
1/RMP = 1/(0.03*0.204+(1-0.03)*0.204^2))= 21.51114966
En el caso de heterocigotos, la inversa de la RMP es:
1/RMP = 1/(2*(1-0.03)*0.204*0.139)= 18.17830151
Para hacerlo con Familias sólo tenéis que ir a la ventana de
pedigríes, hacer click en «Parameters» y rellenar la casilla Tetha
con el valor 0.03. Después, como en el caso ilustrado en las figuras, vais a la
ventana de Case DNA data (datos genéticos), y ahí seleccionáis uno de los
perfiles y click en «Compare DNA».
En resumen, esto es lo que debéis obtener:
Familias 3 tiene muchas funciones nuevas que aún hay que
validar, pues ya sabéis que esto de las validaciones es un no parar y hay que
estar actualizándose continuamente, como nos pasa en el Lab. Poco a poco iremos
haciéndolo!
Bueno, pues espero que este post os sea útil para que
también podáis hacer cálculos de LRs en casos de match directo respaldados con
validación!