Social Icons

twitterfacebookrss feedemail

26 abril 2012

¿Quién es quién?... con partículas subatómicas del Modelo Estándar

Gracias a Francis he descubierto este curioso diagrama de flujo para identificar partículas subatómicas, suponiendo que pudiésemos hacerles preguntas del tipo "¿sientes la fuerza... de la interacción fuerte?". En inglés:

(Ver en grande)

El diseño es de Sean Carroll, físico teórico y autor de la web http://preposterousuniverse.com/



votar

25 abril 2012

Agua a $200 el litro: "Gasolineras" espaciales

"Se buscan buenos mineros espaciales. Planetary Resources está creciendo muy rápido y necesitamos ayuda de más gente maravillosa.[...] Construimos naves espaciales y exploramos asteroides. Si necesitas más motivación para solicitar un puesto de trabajo con nosotros, ni te molestes." (Anuncio)


Chris Lewicki, el ingeniero jefe de esta compañía apoyada por multimillonarios de Google como Larry Page o el director James Cameron, dice que "todo es ciencia ficción hasta que, llegado un punto, se convierte en realidad."


Según el plan desvelado el pasado martes, el fin último de esta empresa es instalar una infraestructura comercial fija en el espacio para abastecer de combustible (H2 y O2) las naves fuera de órbita terrestre.

La compañía se encargaría de localizar e interceptar asteroides de órbita cercana a la Tierra ricos en agua, así como de construir el equivalente a las refinerías y las gasolineras de nuestro mundo basado en petróleo.

¿Cómo convertir esto en un negocio viable? Actualmente, el agua (o mejor, el H2 y O2 por separado) son la base del combustible de muchas misiones espaciales, pero sacar un litro de agua desde la Tierra sale según los cálculos de compañía por unos $20,000. Así que "representaría un enorme cambio si pudieras comprarla directamente en órbita por un 1% de ese precio".



El primero paso está a menos de dos años vista. Planetary Resources tiene previsto lanzar el telescopio espacial Arkyd-101 en un símil de lo que en su día fue el ordenador personal (PC), haciendo accesible el espacio por un precio muy reducido. Aún no han desvelado cómo la pondrán en órbita, pero entre las opciones están el cohete ruso Dnepr, el Ariane europeo, el PSLV indio o el privado SpaceX Falcon. El telescopio tendrá una resolución de un arcosegundo para observaciones astronómicas, o de unos pocos metros si se orienta hacia la superficie terrestre.

Su objetivo: localizar asteroides candidatos a futuros asaltos mineros. Este primero paso se espera esté completado para final de la década.


Para leer más: 1 2



votar

23 abril 2012

Teoría de juegos y una inteligente jugada en un "dilema del prisionero" (TV)

Un concurso de la TV inglesa llamado "Golden Balls" propone a los dos concursantes una elección final entre dos bolas:

  1. "Repartir" (split), para repartir el bote de £13,600 con el otro jugador.
  2. "Robar" (steal), para quedarse todo el premio para sí.

Pero tiene truco, ya que las normas son una versión del famoso "dilema del prisionero" en el que si cada individuo se comporta de manera egoísta todos salen perdiendo. Dependiendo de qué bolas escojan, ocurre lo siguiente:
  • Si ambos escogen repartir, se reparten el premio a medias.
  • Si uno reparte y el otro roba, se lo queda todo el que roba.
  • Si ambos roban, los dos se quedan sin nada.
Evidentemente, si cada jugador piensa en maximizar su propio beneficio escogería "robar", pero si ambos hacen igual el resultado es que no ganan nada. Es un ejemplo clásico de juego de suma no cero.

En el juego clásico, los "prisioneros" tenían que tomar su decisión aislados el uno del otro, pero en este programa se permite que hablen durante un minuto, por lo que pueden hacer un pacto... si se fían el uno del otro.

Piénsalo unos segundos: ¿tú qué harías? 

En este programa, el jugador de la derecha hace una jugada muy inteligente, que puedes ver a partir del minuto 2:30. Para no hacer un spoiler, la comento después del vídeo, con texto en blanco así que tienes que marcar con el ratón para hacer el texto visible.





(Texto en blanco aquí:)

La clave de la complejidad del dilema del prisionero está en que, obviamente, no sabes qué va a hacer el otro.


Así que el jugador de la derecha (D) opta por hacerse "el loco" y mostrarse tozudo en que él va a robar, da igual lo que el de la izquierda (I) diga o piense, prometiendo repartir el premio con él al salir del programa. 


¿Qué opciones le deja esto a (I)? Si (D) de todas formas va a "robar", puede pasar: que sea sincero y quiera repartir el premio, con lo que yo debería "repartir". Si no es honesto, da igual lo que yo haga porque no me voy a llevar nada. Por hacer daño, podría "robar", pero "repartir" es la única opción con la que tengo alguna posibilidad de llevarme algo, con la esperanza de que (D) sea honesto.


Obviamente, esto es lo que (D) quería que (I) pensara, forzándole a tomar una de las dos opciones y pudiendo así elegir tranquilamente "compartir", lo contrario que prometió elegir, ¡pero con lo que ambos jugadores salen ganando a pesar de todo!


(Fin de texto en blanco)




Fuente: 1



votar

21 abril 2012

Calculadoras de significancia estadística en resultados de encuestas

La teoría detrás de estas calculadoras se explica aquí. (There exists an English version too)


1. Margen de error en el apoyo a una de las opciones


Por ejemplo, en el porcentaje de apoyo a un partido político en encuesta de estimación del voto, o en el porcentaje de los que reconozcan en una encuesta haber probado alguna droga, etc.)
Número de entrevistas:
Porcentaje obtenido en la encuesta: %
Intervalo de confianza deseado: σ (en sigmas)
Incertidumbre (1σ): %
Margen de error: %


2. Significancia estadística en diferencia entre dos opciones de una misma encuesta


Sirve para comparar si la ventaja entre dos opciones, p.ej. dos partidos políticos, es realmente significativa.

Número de entrevistas:
Porcentaje obtenido por opción A: %
Porcentaje obtenido por opción B: %
Incertidumbre de la diferencia (1σ): %
Diferencia: =
Significancia estadística:


3. Significancia estadística de diferencia entre dos opciones de distintas encuestas


Este caso incluye la situación de comparar cómo evoluciona una opción a lo largo del tiempo, no tiene porqué servir únicamente para comparar entre diferentes opciones elegidas.

Encuesta 1: Número de entrevistas:
Encuesta 1: Porcentaje obtenido: %
Encuesta 2: Número de entrevistas:
Encuesta 2: Porcentaje obtenido: %
Incertidumbre de la diferencia (1σ): %
Diferencia: =
Significancia estadística:


Referencias:
  1. "NTP 283: Encuestas: metodología para su utilización". Margarita Oncins de Frutos. Ministerio de Trabajo y Asuntos sociales de España. (PDF)
  2. Charles H. Franklin, "The ‘Margin of Error’ for Differences in Polls". 2002 (PDF)
  3. Scheaffer, R.L., Mendenhall III, W., Ott, R.L. & Gerow, K. "Elementary survey sampling". Duxbury Pr, 2011 (Google Books)



votar

Online calculator of statistical significance for poll results

A layman introduction to the theory behind these calculators can be found here (in Spanish!). There is also a Spanish version of these calculators.


1. Margin of error in the support of one choice


For example, in the support of one political party in election polls.


Number of interviews:
Obtained support: %
Desired confidence level: σ ("in sigmas")
Uncertainty (1σ): %
Margin of error: %


2. Statistical significance of the advantage between two choices in a poll



Number of interviews:
Support of choice A: %
Support of choice B: %
Uncertainty in the difference (1σ): %
Difference: =
Statistical significance:


3. Statistical significance of difference in one choice between two different polls


This can be used to evaluate the evolution of the support of one choice (e.g. a political party) along time, by comparing the results from two different polls.


Poll #1: Number of interviews:
Poll #1: Resulting support of some choice:%
Poll #2: Number of interviews:
Poll #2: Resulting support of the same choice: %
Uncertainty of the difference (1σ): %
Difference: =
Statistical significance:


References:
  1. "NTP 283: Encuestas: metodología para su utilización". Margarita Oncins de Frutos. Ministerio de Trabajo y Asuntos sociales de España. (PDF)
  2. Charles H. Franklin, "The ‘Margin of Error’ for Differences in Polls". 2002 (PDF)
  3. Scheaffer, R.L., Mendenhall III, W., Ott, R.L. & Gerow, K. "Elementary survey sampling". Duxbury Pr, 2011 (Google Books)



votar

20 abril 2012

Cómo comparar datos de intención de voto (incluye calculadoras); y ¿qué pasó en las andaluzas de 2012?

(Ir directo a calculadoras)
Segunda parte de la serie: ¡estadística para periodistas!

Los números resultantes de hacer una medición no significan nada, a menos que conozcamos sus márgenes de error e incluso cómo se correlan entre ellas. Por obvio que parezca, es algo que se olvida a menudo.

Cuando se habla de cómo varía la intención de voto según encuestas, encontramos el término "estadísticamente significativo" en casi todos los medios internacionales (e.g. ABCNews, Washington Times, New York Times, CBS News,...).

Por el contrario, no recuerdo haber leído nunca nada parecido en un periódico español. Como ejemplo para la entrada de hoy, voy a basarme en el último artículo de El País (14/04/2012) sobre el tema (no es por nada en particular: todos los diarios parecen ignorar por igual la estadística). Veremos qué afirmaciones de las que se hacen tienen sentido y cuáles tienen el mismo valor que decir que no hay calentamiento global porque hoy hace más frío que ayer.

Las mismas ideas se podrán aplicar también a comparaciones del número de accidentes de tráfico, del valor de las acciones de un día para otro, el número de días que no ha llovido en cada año, la opinión de los españoles sobre cuáles son los principales problemas del país, etc.

1. Objetivos de esta entrada


Al terminar de leer esta entrada, sabrás:
  • Qué significa, intuitiva y visualmente, la "incertidumbre" en una cifra. 
  • ¿A qué se refieren cuando dicen que un "margen de error" es "del 95,5%"? ¿Qué es eso de "p=q=50"? ¿Me afecta en algo? ¿Qué tiene que ver Yao Ming en todo esto? ;-)
  • Cómo calcular el margen de error de una encuesta, más exactamente incluso que las cifras que se suelen dar en las fichas técnicas ya que esas son para el peor caso posible.
  • A interpretar si un margen de diferencia entre dos partidos o entre el mismo partido en dos momentos distintos es estadísticamente significativo.

Espero llegar al máximo número de periodistas posibles. No sé si ningún medio habla con propiedad estadística a posta (¡espero que no!) o por simple desconocimiento.

Si es lo segundo, y aparte de la reflexión de cómo es posible que no se enseñen estas cosas en las facultades de Periodismo, espero que con un mínimo, muy mínimo de esfuerzo sea posible entender lo que voy a explicar. Creo que es posible, y muy fácil, mejorar la calidad técnica de nuestras publicaciones nacionales. Al lío...

2. ¿Qué es la "incertidumbre"?


Para entender qué es un "margen de error" en una medida, también llamado "intervalo de confianza", hay que interiorizar primero qué es la incertidumbre.

Muchas veces manejamos "valores"... de los que realmente no conocemos su valor, por mucho que sepamos por ejemplo su valor medio (p.ej. el salario medio) o una estimación (p.ej. las estimaciones de voto a partir de encuestas).

Veamos un ejemplo: si cogemos a un hombre al azar, ¿cuál sería su altura?

Según estadísticas, en EEUU la altura media está en 1 metro y 78 cm. Pero esto no responde a la pregunta, porque si empezamos a medir a gente al azar: ¿veríamos muchas alturas cerca de 1,78m? ¿habrá mucha gente que mida menos de 1,60m? Y, ¿cómo de raro es encontrar a personas de 2,29m como Yao Ming?

Está claro que un valor medio, por sí sólo, apenas nos dice nada. La animación siguiente muestra una línea negra que va saltando emulando "medidas de altura" que hiciéramos a hombres al azar, en comparación con el valor medio (la línea roja discontinua). Cada "salto" que da sería una medida a un nuevo individuo:

¿Cómo podríamos cuantificar la "incertidumbre" de la altura? ¿El "cuánta variación" existe? 
Una manera muy intuitiva es ir contando cuántas veces nos aparece cada uno de los valores (la altura 177cm, la 178cm, la 179cm, etc.). 

La siguiente gráfica muestra este proceso, con una "torre" que va creciendo en cada valor de centímetro según las veces que ha aparecido:


Estoy seguro que todos reconoceréis la forma a la que tiende este contador, llamado "histograma": tiende a una campana de Gauss (distribución de probabilidad Gausiana, también llamada normal).


Cuanto más estrecha sea la campana, menos incertidumbre tiene nuestra medida (o si hablamos de una estimación como las de las encuestas, menos "margen de error"). Una campana más ancha claramente quiere decir que los valores se extienden más a lo largo y eso los hace más "imprecisos".

De estas dos medidas, la de la derecha tiene mucha menos incertidumbre ya que los valores se dispersan menos.


Por una serie de razones técnicas en las que no hace falta entrar, se da la casualidad de que muchas, muchas de las incertidumbres del mundo real tienen precisamente forma de campana de Gauss. De ahí su importancia.

La forma de medir "el ancho" de una campana, lo incierta que es, es lo que se llama desviación estándar. Este "ancho" es la famosa sigma (σ). Para el ejemplo de las alturas de hombres, se ha medido que la sigma es de σ=7,11cm. 

Y por fin llegamos al concepto intervalo de confianza, casi similar al del margen de error de las encuestas (luego vemos la sutil diferencia). Conociendo la media y la sigma σ, se puede demostrar matemáticamente (*) que a pesar de ser hechos aleatorios, que parecen fuera de control alguno, si medimos muchos siempre tendremos un 68% de ellos dentro del intervalo centrado en la media y de ancho 2 sigmas. 

Es decir: que desde la "media menos σ" hasta "media más σ" estarán el 68% de los casos. Normalmente esto se escribe media ± σ. Igualmente, dentro del rango media ± 2σ, que es más ancho y por lo tanto abarca más casos, se demuestra que entran aproximadamente un 95,5% de los casos. 

Estos "rangos" son justamente los intervalos de confianza o márgenes de error, y precisamente el famoso "95% de probabilidad" con el que se dan los resultados de encuestas vienen de incluir todas las posibilidades dentro de un ancho de ±2σ alrededor de la media o la estimación. ¡Fácil, verdad! 

¿Por qué ±2σ y no ±3σ o ±4σ? Realmente es un compromiso entre incluir la mayoría de los casos habituales dentro del margen de error sin hacerlo demasiado grande para que entren los valores "raros" o dispersos. Por ejemplo, para incluir la altura de Yao Ming dentro del margen de error de las alturas que esperamos encontrar habría que usar ±7σ (¡siete sigmas!) ... lo que sería absurdo porque ya con ±4σ nos estaríamos pasando al ampliar demasiado el margen de error para incluir al 99.9936% de los casos: lo siento, pero Yao Ming, te quedas fuera de cualquier margen razonable, ¡eres un bicho raro!


3. Ejemplo: encuestas de intención de voto


Existen teorías estadísticas muy bien estudiadas (ver [1,3]) que nos ayudan a diseñar encuestas a partir del margen de error que deseamos obtener. Obviamente, cuanto más seguros queramos estar a más individuos habría que entrevistar, llegando al extremo de preguntar a toda la población si queremos reducir la incertidumbre a cero.

Pero eso se lo dejamos a las empresas de demoscopia. Nos ponemos en el papel de haber recibido el resultado de una encuesta. Por ejemplo, la que antes mencionaba de de El País.

Esta es la estimación del voto según las encuestas de los últimos meses (lo siento, por comodidad en el eje horizontal en vez de fechas he puesto números, mirad el gráfico original de El País para fechas):
En el artículo del periódico se hacen una serie de afirmaciones sobre estos datos, por ejemplo:

  • Que el PP se desploma en el último mes, cayendo 8% su intención de voto. Esta afirmación se basa en que se pasa de un 46,3% en marzo a un 38,1% en abril.
  • UPyD e IU son los que recogen el voto perdido por PP y PSOE. En el último mes IU sube del 9,1% al 11,6%, mientras que UPyD sube del 5,1% al 5,9%.

Viendo las gráficas, también podríamos decir, por ejemplo, que el PP no ha parado de subir desde enero de 2011 (43,1%) hasta enero de 2012 (46,4%).

Pues bien: aunque todas estas afirmaciones parezcan de lo más razonables, no hay que olvidar lo fundamental:
Los valores de estimaciones de voto son eso: estimaciones. Los datos reales podrían bien ser mayores que menores. En otras palabras: cada valor de intención de voto tiene su incertidumbre.

He creado una animación que ayudará a interiorizar de qué estamos hablando: teniendo en cuenta las fórmulas que luego veremos, la incertidumbre de las estimaciones de votos significan que los datos reales (desconocidos) bien podrían ser cualquiera de todos estos que aparecen como bailando alrededor de la estimación de la encuesta:
Lo que estamos viendo no es ni más ni menos que los efectos de que las estimaciones de voto no sean perfectas, sino que tengan una desviación estándar (un sigma) de incertidumbre.

En concreto, para una encuesta basada en N entrevistas, la desviación estándar de una opción cuya estimación es del P% se puede demostrar que es aproximadamente (ver [2,3] y la nota (*2) ):

 (en %)

Si queremos saber a qué "margen de error" se corresponde esto, tenemos que decidir hasta qué "seguridad" queremos llegar, y multiplicar esta sigma por el número correspondiente. Un ejemplo: en una entrevista de N=1000 llamadas telefónicas, una opción recibe un apoyo del p=60%, la desviación estándar de ese porcentaje de apoyo será:


Por lo que con un 95,5% de seguridad, a lo que corresponde un margen de error de ±2σ como vimos antes, el apoyo real de esa opción está entre 60% ± (2 x 1,55%) = 60% ± 3,1%, es decir entre el 56,9% y el 63,1%. Por cierto, en las fichas técnicas de las encuestas solamente se da el margen de error para el peor caso posible, que se puede demostrar es el de una opción apoyada por el 50% de los individuos (¡a eso se refiere el "famoso" p=q=50!), pero nada nos impide usar la fórmula que doy arriba y saber la incertidumbre exacta.

Siguiendo con la gráfica de antes, el efecto de la incertidumbre se ve aún más claro si vemos todas las posibilidades simultáneamente. Recuerda que lo que la encuesta nos está diciendo es que el valor real podría ser cualquiera de entre estas marañas:


Y ahora sabiendo que la realidad se encuentra entre esas líneas: ¿qué cosas nos atreveríamos a afirmar con certeza?

Así "a ojo" está bastante claro que a día de hoy el PP ganaría al PSOE fuera de toda duda razonable, ya que ni el punto más alto del "borrón de líneas" del PSOE se acerca al punto inferior de el del otro partido. También está bastante claro (aunque menos) que IU sacaría más votos que UPyD. 

Ahora, si tuviera que apostar algo a que el PSOE ha perdido algo de votos en el último mes o a que IU los haya ganado (como se puede concluir ingenuamente a partir de las gráficas originales), mejor haría en estarme quieto. Y aún menos me atrevería a decir que UPyD ha seguido aumentando en intención de voto, como hizo el artículo de El País.  

Si tuviéramos que fiarnos del ojímetro, poco habríamos avanzado usando la estadística hasta este punto. Pero por suerte, ¡existe una forma objetiva de medir la seguridad en nuestras afirmaciones!


4. Comparando valores


¡Ya llegamos a la parte interesante! Aunque sea un poco más abstracto, también existen los conceptos de desviación estándar y de margen de error para las diferencias entre dos valores a comparar, p.ej. la ventaja en votos entre dos partidos. Y no es tan sencillo como sumar las dos desviaciones estándar de cada valor a comparar; ojo, que es un error bastante común.

Está claro que es muy importante conocer el margen de error de una ventaja para determinar si ésta es estadísticamente significativa... o no, en cuyo caso podemos tratar al lector como si fuera inteligente y decirle que "existe una ventaja de tal y tal, pero no es estadísticamente significativa". Además, si fuera redactor, estaría orgulloso de poder dar información de calidad científica... (¡ahí lo dejo!).

Fijémonos en el caso concreto de la encuesta de El País, en el que IU aventaja claramente con un 11,6% a UPyD que sólo tiene un 5,9% para ese mismo mes, en la misma encuesta.

Ingenuamente, parece indudable que IU ganaría a UPyD ya que, vaya... ¡tiene el doble de votos!

Pero debemos asegurarnos y nunca dar nada por sentado, ya que ambos valores de intención de voto tienen su incertidumbre. Y además... están correlados, ya que no son independientes. Es decir, si IU en la realidad tuviera un 1% menos de votos, ese 1% bien podría ir a parar a UPyD. Lo que no es probable es que ambos tuvieran, simultáneamente, un 1% más de votos que lo estimado ya que lo que uno gane lo podría perder el otro. A eso es a lo que se llama correlación estadística.

Para casos como este en que comparamos porcentajes de apoyo a distintas opciones A y B, dentro de una misma encuesta, se demuestra que la desviación estándar de la ventaja entre A y B, dando los porcentajes p_A y P_B en tanto por ciento, es:



En el caso de la ventaja de IU al UPyD, al que le saca 11.6% - 5.9% = 5.7%, obtenemos con la fórmula de arriba una sigma del 1.31% para dicha ventaja.

Ahora, aplicamos el criterio de relevancia estadística, que consiste en ver en "cuántas sigmas" consiste la diferencia. Es decir, en dividir:

Decimos entonces que la ventaja de IU a UPyD es de "4.35 sigmas", ¡lo cuál es mucho! Para quienes sepan de estadística, este número ya les dice mucho, pero de cara a un público generalista estaría bien usar las siguientes conversiones entre "número de sigmas" y probabilidad de que "lo que estamos probando no sea cierto":
Número 
de sigmas
Probabilidad 
      de error en la 
  hipótesis planteada 

Probabilidad de que
la hipótesis planteada
sea cierta

0,5 σ
61,71%
38,29%
σ
37,73%
68,27%
1,5 σ
13,36%
86.63%
2 σ
4,45%
95,45%
2,5 σ
1,25%
98,76%
3 σ
0,27%
99,73%
4 σ
0,0063%
99,9937%
5 σ
0,0001%
99,9999%

Es decir, que existe una probabilidad del ~99,9% de que IU ganase a día de hoy a UPyD, como nos decía el sentido común. Ojo, porque sólo sabemos con esa seguridad que ganaría, pero no por cuánto ganaría. Calcular eso ya nos obligaría a hacer cuentas más complejas, así que lo dejaremos por hoy (si alguien está interesado, ¡que consulte a su amigo matemático más cercano!).

Como normal general se usa como criterio que todo lo superior a 2 sigmas (o 3 sigmas siendo muy conservador) ya se puede dar como bastante seguro. Únicamente para hechos muy singulares se exigen 4 sigmas o más antes de aceptarlos como ciertos, como ocurre con la detección del famoso bosón de Higgs en el acelerador LHC.


Ahora bien, esto era para comparar dos partidos políticos en la misma encuesta. Si queremos comparar la evolución de una opción a lo largo del tiempo, debemos usar esta otra fórmula para la incertidumbre:


Donde p_A y p_B son el apoyo (en %) que recibió en los momentos A y B, y N_A y N_B son el número de entrevistas que se realizaron en cada una de dichas encuestas, dato que podría haber variado, especialmente en esta época de crisis en que cada año se recorta más en todo.

Veamos si realmente UPyD ha subido este último mes, al pasar de un 5,1% a un 5,9%. Tenemos un incremento del 0,8% pero la sigma es de σ=1.02%, por lo que el aumento es de 0,8 / 1,02 =0.78 sigmas, muy lejos del valor de 2 sigmas usado como umbral. De hecho, mirando la tabla de arriba vemos que la hipótesis de que UPyD haya subido en votos tiene menos de un 60% de probabilidad de ser cierta, luego su incremento no es estadísticamente significante.

5. Andaluzas de 2012

Los resultados de las elecciones andaluzas de 2012 (ver resultados) fueron toda una sorpresa, ya que parecían contradecir todo lo que las encuestas habían pronosticado hasta una semana antes.

Usando las fórmulas que hemos aprendido arriba, vamos a analizar qué cambios fueron realmente significativos entre las predicciones de las encuestas y el resultado real. Para ello, voy a usar los datos de la encuesta de La Razón basada en 2700 entrevistas. Estos son los votos esperados por cada opción política, y su desviación estándar:

PP=46%    (σ=0.95%)
PSOE=36,1% (σ=0.92%)
IU=9,3%   (σ=0.56%)
UPD=4.2% (σ= 0.96%)
Abstención=32,4% (σ=0.9%)

Y estos fueron los resultados reales de las elecciones, junto a la distancia (en número de sigmas) a la predicción de la encuesta y la correspondiente probabilidad de que la estimación de voto fuera errónea:

PP=40.66%        => 5.56σ =>  99.99999730225 %
PSOE=39.52%  => 3.56σ =>   99.96291 %
IU=11.34%        => 2.10σ =>   96.42711 %
UPD=3.35%      => 0.89σ =>  62.65 %
Abs=37.77%      => 5.60σ =>  99.99999785 %

Lo esperable es que todas las probabilidades de predicciones erróneas hubieran sido bajas... pero obviamente no fue así. En cambio, únicamente la predicción de UPyD estuvo acertada, y siendo generosos, la de IU por los pelos. El resto de predicciones (PP, PSOE, abstención) fueron absoluta basura: casi al 100% fueron erróneas.

Distintas empresas de demoscopia hicieron análisis independientes y llegaron a predicciones compatibles entre sí. Luego, sólo veo tres explicaciones posibles a este desastre de las predicciones:
  • O todas las empresas se equivocaron en algo importante a la hora de planificar el muestreo, lo que implicaría que todas ellas dispusieron de datos erróneos sobre la estructura de la población (clases sociales, edad, etc.), 
  • o realmente pasó algo que hizo cambiar su voto a mucha gente en la última semana, 
  • o una combinación de estas dos razones.
Asumiento que las encuestas fueron correctas, la explicación más probable de qué cambió en la última semana serían aquellos cambios de mayor sigma:
Con una certeza del ~99,99999%, un 5,34% de andaluces, simpatizantes del PP, no les votaron finalmente, mientras que un 5,37% de andaluces más de lo esperado se quedaron en casa y no fueron a votar; lo que se corresponde con hechos de 5,56σ y 5,60σ, respectivamente.
Obviamente, esto no quiere decir que todo el aumento de la abstención se nutriera de potenciales votantes del PP, ya que sólo hablamos en términos estadísticos y no hay forma de identificar a quienes dejaron de ir a votar... aunque podamos suponerlo.

Irónicamente, todo apunta a que la perspectiva de una victoria demasiado segura fuera el origen del descalabro del PP.





6. Calculadoras

Están en una entrada aparte por comodidad.

Referencias:
  1. "NTP 283: Encuestas: metodología para su utilización". Margarita Oncins de Frutos. Ministerio de Trabajo y Asuntos sociales de España. (PDF)
  2. Charles H. Franklin, "The ‘Margin of Error’ for Differences in Polls". 2002 (PDF)
  3. Scheaffer, R.L., Mendenhall III, W., Ott, R.L. & Gerow, K. "Elementary survey sampling". Duxbury Pr, 2011 (Google Books)


(*) Sólo sería exacto si la distribución de probabilidad fuera exactamente una Gausiana. A los que no les den miedo las mates, recomiendo que lean sobre la distribución chi cuadrado.


(*2) Realmente el "N" sería "N-1" pero como siempre serán valores grandes el error de usar N a cambio de no complicar la fórmula es asumible



votar

10 abril 2012

Objetivo de DARPA para 2014: Robots capaces de arreglar otro desastre como el de Fukushima en 24 horas

Bienvenidos al futuro.

Cuando ocurrió el desastre de Fukushima I  muchos se preguntaron: ¿y dónde están los famosos robots japoneses? ¿por qué hay señores con casco intentando entrar donde debería haber un androide tipo manga arreglando eso pero ya?

Quienes sigáis lo que cuento de robótica en este blog sabréis que la robótica del mundo real está aún, por desgracia, mucho más atrasada de lo que muchos imaginan viendo las llamativas demos que salen en televisión.

Pues bien: la DARPA, el I+D del ejercito norteamericano, acaba de anunciar hoy su ambicioso objetivo, un nuevo DARPA Robotics Challenge que pretende conseguir robots humanoides capaces de subirse y bajarse de coches, operar herramientas pesadas y manipular elementos industriales en entornos de desastre para dentro de dos años.

Y estoy convencido de que se va a conseguir. ¿Por qué? Simplemente porque tienen lo necesario: dinero, mucho dinero. Y quieren gastar decenas de millones de dólares en esta idea.


Recreación artística de las pruebas a superar en esta edición (las explico más abajo) (Créditos: DARPA)


Precedentes

Precisamente ayer recordaba los Challenges de DARPA. Y es que este de hoy no es más que el último de una serie de "retos" lanzados a universidades y empresas de todo el mundo con el objetivo de fomentar el desarrollo de herramientas tecnológicas en robótica. A base de financiar con millones de dólares a los mejores equipos y repartir sustanciosos premios en efectivo de 1-2 millones de dólares, los dos retos anteriores fueron superados a pesar de parecer ciencia ficción:


  • DARPA Grand Challenge: Proponía que un vehículo sin conductor recorriera, usando únicamente sus sensores y los ordenadores de a bordo, un camino de 11km a través de escarpadas carreteras por el desierto y las montañas. En su primera convocatoria (2004) nadie lo superó, pero en 2005 cinco coches terminaron la prueba. El ganador fue Stanley, diseñado en Stanford (CA) bajo la dirección de Sebastian Thrun, que se embolsó los 2 millones de dólares del premio.

  • DARPA Urban Challenge: El reto para 2007 fue más complicado. Ahora, los vehículos conducidos por ordenador debían hacer un recorrido a través de una mini ciudad construida como escenario para el reto, incluyendo cruces, aparcar, etc. Superaron la prueba seis vehículos






El nuevo reto 2012-14


Anuncio del reto:
  • El objetivo del nuevo programa es "desarrollar robots terrestres con capacidad para ejecutar tareas complejas en entornos humanos en situaciones de desastres". Se menciona explícitamente lo ocurrido en Fukushima I, donde robots de este tipo habrían sido de enorme ayuda.
  • Plazos: Habrá dos fases, cada una culminada en una etapa competitiva. La primera durará desde octubre de 2012 hasta diciembre de 2013 y la segunda durante todo 2014. 
  • Premios y financiación: El equipo que construya el robot capaz de superar todas las pruebas recibirá un premio en metálico de 2 millones de dólares. Sólo habrá un premio, aunque se financiará con decenas de millones de dólares a quienes superen una serie de etapas iniciales. 
  • Pueden competir equipos de todo el mundo en distintas categorías, tanto en la construcción de robots físicos como en el diseño de simuladores. No es requisito ser norteamericano, como creo ocurría en anteriores ediciones.
  • Se construirá un robot "gubernamental" para permitir participar a aquellos equipos que no tengan recursos suficientes para diseñar su propio hardware. El robot tendrá brazos de 7 grados de libertad (DOF) con dos o tres dedos, piernas con 6DOF y una cabeza con visión estéreo y un escáner láser. 
  • Software libre: como novedad, existirá una categoría de simuladores, para incentivar el desarrollo de ambiciosas herramientas de simulación de robots que deberán ser de código abierto.

Y el reto en sí:
  1. El robot deberá subirse a un coche normal, conducirlo hasta el lugar de la catástrofe y salir del coche, todo autónomamente, claro. El coche sería un estilo a Polaris Ranger y el robot deberá arrancarlo con sus manos y conducirlo con los pedales, al igual que un humano.
  2. Cruzar una zona con el suelo roto y pendientes. Algo que un humano no tuviese problemas en recorrer. 
  3. Quitar escombros de delante de una puerta.
  4. Abrir la puerta y entrar. A día de hoy, solamente esto es ya un reto (vídeo).
  5. Subir por una escalera industrial, usando las manos y pies, y atravesar un pasillo. 
  6. Usar herramientas, como un martillo y un cincel, para abrir un boquete en una pared de hormigón (no armado). Alucinante, esto sí que no me lo quiero perder. Y miedo me da pensar lo que tardaremos en importarlo como robot albañil en España ;-)
  7. Localizar y cerrar una válvula cerca de una tubería con un escape. Habrá muchas tuberías pero sólo una dejará escapar humo y emitirá un silbido fácilmente audible. Un humano necesitaría las dos manos para cerrar la válvula.
  8. Reemplazar algún componente, como una válvula de escape, lo que requerirá aflojar (y luego volver a apretar) varios tornillos.

Realmente, el reto DARPA más ambicioso hasta la fecha. Si el primer premio de 2004 se quedó desierto, es probable que este también necesite al menos dos convocatorias para ser superado pero... nada de lo que se pide es físicamente imposible, luego todo es cuestión de tiempo... y dinero invertido en I+D, algo en lo que DARPA no escatima. Seguiremos informando.

Fuentes: 1 2



votar

09 abril 2012

Pasos hacia vehículos que conduzcan solos: percepción

Ya hemos hablado en otras ocasiones por aquí de avances en algoritmos de conducción de vehículos autónomos (1,2) o incluso de avances legales. Pero la gran barrera a día de hoy está en la percepción: lo que nuestro cerebro hace en tiempo real a partir de lo que ven nuestros ojos es extremadamente complejo de igualar con un ordenador.

Más aún si queremos que los coches del futuro sigan conduciendo solos cuando haya niebla, llueva, o incluso cuando tengamos el sol de frente, situaciones que a día de hoy arruinan cualquier algoritmo por muy en el estado del arte que esté.

Ejemplo de segmentación de elementos del entorno (fuente: [1])

Por eso quiero traeros a todos los interesados un genial trabajo que será presentado en junio en el CVPR 2012. Se trata de una iniciativa conjunta del Karlsruhe Institute of Technology y el instituto tecnológico de Toyota en Chicago, y consiste en un dataset, unos conjuntos de datos recogidos usando un coche modificado con sensores muy caros y que ponen a disposición de cualquier investigador interesado para realizar comparaciones entre distintos métodos.

El coche modificado con sensores del grupo cvlibs (fuente)

Antes de describir para qué sirve todo esto, recomiendo ver el vídeo que han creado:



Este dataset servirá para evaluar métodos de:
  • Cálculo de odometría estéreo: estimar la posición del coche sólo "viendo" cómo se mueven las cosas a tu alrededor, una etapa fundamental y cuya robustez debe ser crítica si queremos que algún día los coches anden sólos.
  • Flujo óptico.
  • Segmentación: Distinguir qué cosas de las que ves son otros coches, suelo y, muy importante, ¡peatones!.
  • Construcción autómatica de mapas del entorno (SLAM): no podemos asumir que siempre tendremos un mapa actualizado de cada ciudad del mundo. Los coches deben aprender a partir de lo que ven. El dataset contiene ground-truth a partir de GPS-RTK y sistemas inerciales para comparación de los distintos métodos de SLAM.

En su trabajo, los autores comparan su dataset con otros existentes, incluyendo el que nuestro grupo publicó de la ciudad de Málaga [2], y que era el dataset con ground-truth más largo (en kilómetros) hasta la fecha.

Artículos técnicos:
  • [1] Andreas Geiger and Philip Lenz and Raquel Urtasun, "Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite". Computer Vision and Pattern Recognition (CVPR), 2012 - PDF
  • [2] "A Collection of Outdoor Robotic Datasets with centimeter-accuracy Ground Truth", 2009. (web)

UPDATE: Como ejemplo de porqué digo que el cuello de botella actual es la percepción, os dejo algunos vídeos de los Darpa Challenge's, concursos en los que el ejército norteamericano dota con millones de dólares a los equipos que construyan los vehículos autónomos capaces de superar ciertas pruebas. 

A día de hoy, el 99% de la información crucial en estos coches entra en forma de escáneres láser, con precios que pueden superar (cada láser) a un vehículo comercial normal. Si se consiguiese reemplazar los lásers con cámaras (cientos de veces más baratas), se habrá superado uno de los mayores obstáculos para hacer realidad el sueño de llamar a tu coche y que te recoja a donde estés... ¡y sin tener que buscarle aparcamiento! ;-)






votar

06 abril 2012

Inversiones de capital riesgo en start-ups de robótica (2011)

A pesar del enorme potencial (teórico) de la robótica en las próximas décadas, las empresas que apuestan por esta línea de negocio aún son bastante escasas. Hoy sólo quiero traeros un estudio sobre la financiación de dichas empresas en 2011.

La empresa con mayor inversión fue una enfocada a la robótica de rehabilitación médica, con 42M$. En comparación con la financiación de empresas "punto com", que consiguieron el año pasado una cifra récord de 6,900M$ en inversiones, el mundo robótico en su conjunto consiguió solamente 160M$.

Los motivos principales que parecen asustar a los inversores son los factores adversos intrínsecos que existen en robótica y que evitan que existan historias exitosas estilo Google, como es el elevado coste en materiales necesario para cualquier proyecto por pequeño que sea (bases robóticas, sensores, brazos, etc.).

Leer más: 1



votar
Related Posts Plugin for WordPress, Blogger...