Matemáticas de cuchufleta

24.9.06

Cifras y letras

Seguro que habrán visto ustedes muchas veces en internet páginas en las que les piden que introduzcan una serie de letras y números que aparecen en un recuadrito y que parecen dibujadas por George Bush o por un niño de cinco años.

Esos recuadritos los verá cuando quiere dar de alta una página suya para que aparezca en un buscador, o cuando abre una cuenta de correo electrónico gratuita, o en muchas otras circunstancias que no enumeraré exhaustivamente por no aburrirle y, sobre todo, porque no las conozco.

El propósito de hacer esto es evitar que programas robots hagan estas operaciones automática y masivamente sin que haya un humano de carne y hueso detrás (o de carne, hueso y silicona). Por ejemplo, en el caso de las altas en buscadores, hay programas especializados en la promoción de páginas web en los que usted introduce unos datos básicos, como el título, URL, descripción del contenido de la página, palabras clave y correo electrónico del autor, y el programa automáticamente registra su página, con esos datos, en un montón de buscadores distintos, con lo que le ahorra el trabajo de hacerlo usted a mano, lo cual le ocasionaría un aburrimiento mortal y un ataque agudo de tendinitis. Así que los portales y buscadores se previenen de esto pidiéndole que usted introduzca esas cifras y letras a mano. La primera pregunta que surge es: si a los directivos de la empresa del buscador les interesa que su página o sitio web aparezca en su directorio independientemente de que haya hecho usted el registro en persona o utilizando uno de estos programas-robots, ¿entonces qué sentido tiene el andar tocando los cojones con las letritas de marras? Eso, amigos, es y seguirá siendo un misterio. Yo les adelanto una hipótesis...¿está realmente detrás de todo esto la asociación de especialistas en tendinitis?

La segunda pregunta que surge, detrás de la primera como debe ser, porque si no no sería la segunda, es la de por qué el tener que copiar las letras que usted ve en el recuadro evita que un programa pueda introducir los datos por usted. La respuesta a esto es que ES DIFÍCIL RECONOCER LETRAS ESCRITAS. Quizás usted no esté de acuerdo con esta afirmación. Al fin y al cabo, lleva reconociéndolas perfectamente bien y a la primera desde que era pequeñito (si tuviera usted que corregir un taco de exámenes periódicamente seguramente pensaría de otro modo). El hecho es es que usted le lleva cierta ventaja en eso a un ordenador, ya que su cerebro se ha ido desarrollando a lo largo de miles de años de evolución (el suyo en concreto no tantos años, a no ser que sea usted Mick Jagger, sino el de la especie). Un ordenador le dará cien mil vueltas en hacer cálculos a velocidad de vértigo o en mostrar fotos de Pamela Anderson, pero usted le superará en tareas que requieran una visión global de conjunto, como reconocer una melodía, o una fotografía (¿la misma que le mostró el ordenador?) o en captar el sentido de un texto que esté leyendo. Así que, en el caso concreto de reconocer letras a partir de sus trazos dibujados en un papel o en la pantalla, usted le gana con creces a un programa informático.

El problema es que las máquinas nos quieren hacer la competencia también en este terreno; hay una rama de la ciencia, la inteligencia artificial, que busca implementar en máquinas el tipo de inteligencia propio del ser humano. Uno de los primeros problemas que resolvió la inteligencia artificial fue precisamente el reconocimiento de caracteres, y en particular de letras y números. Ello fue posible, cómo no, gracias a la inestimable ayuda de las matemáticas (¿hay algo en lo que no estén presentes?), a través de unos dispositivos llamados redes neuronales. Las redes neuronales "imitan" el modo en que se coordinan las neuronas en el cerebro del ser humano. Las redes neuronales están formadas por unas neuronas artificiales, llamadas unidades de proceso, dispuestas en capas (normalmente, cuantas más capas haya, mayor es la complejidad de los problemas que puede resolver la red neuronal, es decir, la inteligencia de "la cosa", aunque en realidad esto es simplificar demasiado el tema, que en realidad es más complicado, pues una superabundancia de capas y unidades de proceso puede dar lugar al fenómeno no deseado del sobreentrenamiento), cada una de las cuales recibe "entradas" de otras neuronas que pueden estar en distintos niveles de actividad, desde totalmente apagadas hasta completamente activas. Las neuronas, ademas de las "entradas", también tienen una "salida" que se puede propagar a su vez a otras neuronas. Para calcular la actividad de salida se integran las actividades de entrada a través de una función de propagación (¡¡¡más matemáticas!!!), que suele ser una media ponderada a través de ciertos pesos de las actividades de entrada. Esta media ponderada se pasa después por el tamiz de una segunda función de activación y ¡voilà!, ya tenemos la actividad de salida. El modo en que se conectan unas neuronas con otras a través de dichas entradas y salidas se realiza a través de un proceso de "aprendizaje", en el que las conexiones entre neuronas se van estableciendo progresivamente a través del proceso de aprendizaje de forma que la red neuronal responda de la forma más parecida a la deseada o a la correcta (¡que no siempre es lo mismo!) que sea posible. El proceso de aprendizaje se lleva a cabo utilizando distintos algoritmos matemáticos, uno de los más populares de los cuales es el método del mínimo gradiente de cambio.

Asi que, ¡¡¡PELIGRO!!!, el sistema de las letras y números puede ser burlado con un poquito de inteligencia artificial. ¿Cuál es la solución? Ponérselo un poquito más difícil a la inteligencia artificial, de forma que se ponen en práctica, como usted ya habrá observado por sí mismo, las más maquiavélicas variantes para burlar a los programas-robots. Unas pocas de estas variantes son las siguientes: se mezclan mayúsculas con minúsculas, se tuercen las letras a derecha e izquierda, se meten entre una nube de puntos aleatoriamente dispuestos, se añaden líneas cruzadas para despistar...

¿Y tiene éxito esta estrategia? sí que lo tiene...¡Tiene DEMASIADO éxito! tanto es así que todos hemos tenido la desagradable experiencia (yo por lo menos sí que la he tenido, no sé ustedes) de meter los susodichos caracteres para después obtener un mensaje de error que dice que los caracteres introducidos no son correctos. En el segundo intento se vuelve a obtener el mismo mensaje de error, y al tercero...al tercero se les manda al carajo definitivamente, se le hace un corte de mangas a la pantalla y se va uno al cine.

8 Comments:

  • leí por ahí que para los expertos en visión artificial, como los que trabajan con las sondas espaciales, los "captcha" son fáciles de descifrar. No sé cuánto tardará para que estén disponibles en gente menos científica y más comerciante

    By Blogger Mauricio Duque Arrubla, at 3:07 p. m.  

  • cuando lo vi.. dije noo pero lo lei todo :P

    Ahora no solo se pa que sirven esas letritas.. pensaba que era una estupidez y ahora pienso lo mismo pero con una base teorica muy interesante de por medio.

    Excelente blog, saludos!!

    By Anonymous Anónimo, at 6:31 a. m.  

  • Pasaba a saludarte y espero que tengas un feliz fin de semana...y disfrutes esta navidad junto a los tuyos


    Feliz navidad jojojo

    :)

    saludos desde Valparaíso

    By Blogger J.C.Morgado, at 8:29 p. m.  

  • espero que pases unas felices fiestas de año nuevo :)



    Muchas felicidades y éxito para el próximo año !!



    Un saludo desde Valparaíso

    :)

    By Blogger J.C.Morgado, at 4:05 p. m.  

  • Gracias, que tengas un feliz año nuevo tú también y todos los lectores y lectoras del blog, que deben de estar pensando que me he muerto al no haber escrito nada desde hace meses. Pues no, a pesar de la elevada ingesta de alcohol de estas fiestas, sigo vivo, aunque con algunas neuronas menos que han caído ahogadas en el champagne pero que por lo menos han terminado sus días contentas, así que cualquier día de estos caerá algún posteo nuevo.

    By Blogger luis, at 5:05 p. m.  

  • Muy bueno, saludos! estan invitados a mi blog.

    By Blogger Unknown, at 10:34 p. m.  

  • hahaham, mui interesant tipo de scritura la tuia, haha hoi mismo andba ienando uno de esos cuadritos i plop qe n el ultimo caracter me pregunte: "qe putas es eso??" haha pense qe era una I pero dspues dije: no no creo i ia no puc nada i si me lo dio....haha lol...seguire leiendo, qe sta mui bueno tu blog!

    By Anonymous Anónimo, at 11:27 a. m.  

  • Un matemático con buena sintaxis es casi demasiado. Enhorabuena.

    By Blogger F, at 12:46 a. m.  

Publicar un comentario

<< Home


 
Contigo han caí­do ya   pardillos que han visitado este blog.