Queridos, he recibido un
comentario de Thore que me ha encantado, y no me resisto a contároslo!! Os
pongo aquí el original y mi traducción libre (ya veréis que no es exacta), pero
no puedo evitar darle un toque personal. Allá va!! Disfrutar!!
El título pretende ser
algo desconcertante e intrigante. Veremos primero la “Paradoja del cumpleaños”
(https://es.wikipedia.org/wiki/Paradoja_del_cumplea%C3%B1os) y después
la herramienta “Blind search” de Familias. Esperemos que la relación entre
ambos quede clara al final de estos posts.
Imaginaros un workshop
del GHEP que nos da Thore, en el que hay 23 socios participantes. En la primera
charla del workshop Thore nos pregunta a los 23: ¿Cuál es la probabilidad de
que al menos dos de vosotros tengáis la misma fecha de cumpleaños? Nosotros
intentamos adivinarlo, pues no nos parece muy fácil hacer el cálculo, pero
intuitivamente, la mayoría sugerimos probabilidades cercanas a cero. Cuando Thore
nos dice que la probabilidad es 0.51 (o del 51%), nosotros, claro está, no nos
lo creemos. Como somos alumnos muy interesados y brillantes (como vosotros, que
os habéis parado a leer esto!!), reclamamos
pruebas sólidas a tan atrevida afirmación. Y aquí está la respuesta:
Sabemos que cada año
tiene 365 días (olvidemos los años bisiestos), y sabemos que todos esos días
pueden ser un día de cumpleaños con la misma probabilidad (no del todo cierto…
en mi pueblo se acumulan los cumpleaños 9 meses después de las fiestas patronales
J… pero no hay problema por esto). Como en muchas ocasiones cuando hablamos de
probabilidad, es más fácil considerar la situación complementaria (es decir la
probabilidad de que la fecha de cumpleaños sea distinta). Teniendo en cuenta a
2 alumnos al azar, esta probabilidad (distintos cumpleaños) es 364/365 (un
alumno está de cumpleaños un día concreto y al otro le quedan 365-1= 364 días
para que su cumpleaños caiga en un día diferente al primero). Por tanto, la
probabilidad de que dos alumnos elegidos al azar estén de cumpleaños el mismo
día sería el suceso contrario, es decir: 1 – (364/365) = 1/365.
Para r alumnos (teniendo
en cuenta que los valores que r debe tomar son 0 < r <= 365), la
probabilidad de que ninguno de ellos esté de cumpleaños el mismo día sería:
(365/365)*(364/365)*(363/365)*…*((365-r+1)/365)
porque la segunda
persona no puede tener el mismo cumpleaños que el primero (364/365), la tercera
persona no puede tener el mismo cumpleaños que las dos primeras (363/365), etc. Y por tanto, la probabilidad de que al menos 2 alumnos estén de cumpleaños
el mismo día sería:
1 – [(365/365)*(364/365)*(363/365)*…*((365-r+1)/365)]
Para r = 23, esta operación resulta tener un valor de
0.5072972 o 51%, lo cual demuestra que Thore tiene razón. Y además Thore nos
ilustra y generaliza el caso para 1, 2, …, 3 socios del GHEP, usando R:
r =
50
probs = rep(NA,r)
pupils = 1:r
for(r in pupils)
probs[r] = 1 –
prod((365:(365-r+1)))/365^r
plot(pupils, probs, type = «l», xlab = «Number of pupils»,
ylab = «P(some have
the same birthday)»)
lines(rep(23,20), seq(0.05, probs[23], length = 20), lty = 2)
lines(7:23, rep(0.5, length(7:23)), lty = 2)
text(23, 0, «23»)
text(3, 0.5, «Prob=0.5»)
title(«The birthday paradox illustrated»)
¿Cuál es la conexión
entre esto y la herramienta Blind Search de Familias? Tener paciencia y esperar
el próximo post…
Lo que recibí de Thore:
The title
is intended to be a bit puzzling and intriguing. We first visit the ‘Birthday
paradox’ (Paradoja del cumpleaños, https://es.wikipedia.org/wiki/Paradoja_del_cumplea%C3%B1os) and later ‘Blind search ’ in
Familias; hopefully the connection will be clear eventually. Imagine the first
day of school. The math teacher asks her 23 pupils. “What is the probability
that at least two of you have the same birthday”. The pupils guess, most of
them suggest probabilities close to zero. When the teacher says that the
probability is 0.51 (or 51%), she is met with disbelief. These bright and
interested students demand solid proof for this horrendous claim. Here it is:
We assume that there are 365 days. All days are equally likely to be a birthday
(not quite true, but no problem). As often for probability calculations it is
easier to consider the complimentary event, that birthdays differ. With two
random pupils, this probability is 364/365 and so the probability that two
randomly chosen pupils have the same birthday equals 1-364/365=1/365,
obviously. For r pupils (0 <r <= 365), the probability that no one have
the same birthday is (364/365)*(363/365)*…*((365-r+1)/365). Therefore, the
probability that at least two have the same birthday equals
1 –
(364/365)*(363/365)*…*((365-r+1)/365).
For r = 23,
we find 0.5072972 or 51% proving that the teacher is right. The teacher
illustrates and generalises her claim to classes with 1, 2, …., 50 pupils using
R:…..
……..
What’s the
connection to Blind search of Familias? Please be patient and wait for the next
posting …
Very interesting comment from Oscar.
The approximation is accurate as can be seen from
http://familias.name/blog/birthday2.pdf
This plot is obtained by adding the below to the R code of the blog posting:
approximation = 1- exp(-pupils*(pupils-1)/(2*365))lines(pupils, approximation, lty=3)legend(30, 0.2, c(«Exact», «Approximate»), lty = c(1,3))
Querido Óscar! Mil gracias por tu comentario!! Me alegra mucho! Todos ganamos con tus enseñanzas!!
No se cómo introducir los exponentes. En realidad es 1-e elevado a –r(r-1)/(2·365)
Si el número de individuos es elevado, resulta un poco tedioso hacer los cálculos manualmente. Una aproximación es utilizar una serie de Taylor (función exponencial) que nos da como aproximación que la probabilidad del cumpleaños es 1-e–r(r-1)/(2·365)El desarrollo de esto y otras cuestiones interesantes en: DH Kaye. Beyond uniqueness: the birthday paradox, source attribution and individualization in forensic science testimony. Law, Probability and Risk (2013) 12: 3-11.
I recommend Lou’s Spanish version; it’s much better! Interestingly the English web page uses ‘Birthday problem’ rather than ‘Paradoja del cumpleaños’. This is not a paradox in the conventional sense of being a contradictory statement (at least apparently) like «We must believe in free will – we have no choice» (Isaac B Singer) but rather because it is a suprising fact. I still prefer ‘Birthday paradox’ to ‘Birthday problem’ and vote for the Spanish wikipedia.