sábado, 20 de diciembre de 2008

Fotos del otoño

El otoño llegando a mi casa


Ahora que el final del otoño es oficial, (y esta era la primera vez en mi vida que lo vivía) quiero compartirles algunas de mis fotos "aficionadas" que tomé durante esta estación. Son tomadas en Raleigh, NC, donde actualmente me encuentro. El set completo de fotos está en flickr.
En la universidad (NCSU)
Yendo hacia el mercado...En el parque nacional "Smoky mountains"

Probando la macrofotografía...

martes, 16 de diciembre de 2008

viernes, 5 de diciembre de 2008

Grandes avances tecnológicos previstos para 2025


El consejo nacional de Inteligencia de los Estados Unidos ha hecho público en el mes de Noviembre un documento llamado Tendencias globales 2025: Un mundo transformado ("Global Trends 2025: A transformed world" que se puede consultar aquí). El documento establece posibles escenarios mundiales a 15 años vista, haciendo principal énfasis en los aspectos geopolíticos que conciernen a Estados Unidos. Habla de la tendencia de los países asiáticos (principalmente India y China) a tener un papel cada vez más relevante en el mundo, así como su tendencia a apoderarse de la riqueza mundial; da cifras concretas sobre el envejecimiento de la población y la escasez de recursos básicos que muchas personas ya viven y que se incrementará en estos 15 años;hace anotaciones sobre los riesgos teroristas y la reconfiguración de las fuerzas políticas más allá de las naciones (transnacionales del crimen, empresas multinacionales y religiones, por ejemplo). En fin, un documento interesante para todo aquel que quiera conocer las posibles tendencias del futuro y prepararse -o anticiparse- a ellas.
En lo que a este blog concierne, lo más interesante es un cuadro resumen llamado "Technology breakthroughs by 2.025" (Avances tecnológicos importantes para el 2.025), que establece las 10 tendencias tecnológicas más relevantes para el futuro del mundo que podrían desarrollarse y estar disponibles para 2.025. Las clasifican en probables, posibles y plausibles(de mayor a menor grado de posibilidad). Aquí van:

Probables

Computación ubicua : También llamada el "Internet de las cosas". La posibilidad de que los empaques de comida, el mobiliario, los documentos, y en fin, las cosas puedan ser localizadas, identificadas, puedan "comunicarse" entre sí y puedan ser controladas remotamente. Estas tecnologías están siendo primordialmente impulsadas para la reducción de costos en las cadenas de abastecimiento, el monitoreo de seguridad y eficiencia energética.

Agua limpia: Creación de tecnologías relacionadas con formas más baratas y eficientes de obtener agua fresca y tratar el agua sucia, incluyendo la desalinización del agua de mar. Esta tecnología es impulsada por los avances en nanopartículas y nanofibras, así como bioreactores de membranas y otras técnicas de purificación. La escasez de agua (que ya sufren 800 millones de personas) y el crecimiento poblacional llevan a que este desarrollo se apresure al máximo, siendo geoestratégicamente rentable.

Almacenamiento de energía
:Sistemas y técnicas de almacenamiento de energía son requeridas para dos temas principales: la miniaturización de los computadores y el uso de energías renovables. El cuello de botella para el uso de energías como la solar y la eólica es su naturaleza intermitente y la incapacidad que tenemos para almacenarlas eficientemente. Este desarrollo incluye materiales para las baterías, ultracapacitores y materiales de almacenamiento de hidrógeno.


Posibles

Biogerontecnología: Es el estudio de los fundamentos moleculares y celulares de la enfermedad y el envejecimiento aplicados al desarrollo de nuevos medios tecnológicos para identificar y tratar enfermedades e impedimentos relacionados con la edad. Estas tecnologías incluyen bionsensores para monitorear la sauld en tiempo real, tecnología de información robusta, medicina específica relacionada con el ADN de la persona y secuenciación de DNA móvil. Para nadie es un secreto que los países más ricos del mundo a hoy están envejeciendo, y prolongar la vida saludable y trabajadora de las personas de mayor edad aliviaría en parte este problema.

Limpieza del carbon:
Es la tecnología relacionada con un uso más ecologíco y racional del carbón. Incluye las tecnologías de secuestro de CO2- por ejemplo, sepultarlo en el mar- para impedir su llegada a la atmósfera, la gasificación del carbon y su posterior reconversión a hidrocarburo. El balance entre necesidades energéticas y daño ecológico es el principal impulsor aquí, sin olvidar la necesidad de fuentes de energía diferentes al petróleo por parte de muchos países.

Aumento de la fortaleza humana:
Incluye sistemas electrónicos y mecánicos para suplir o aumentar las capacidades humanas, como por ejemplo, exoesqueletos con articulaciones que hagan parecer a la persona un robot humanoide con sensores, interfaces y sistemas de energía que respondan a movimientos de las personas. Esta es otra tecnología impulsada por el envejecimiento y por las personas con discapacidad, así como por la industria militar e industrias que requieren trabajos pesados.

Biocombustibles: La producción de etanol a partir de cultivos. Resulta llamativo que no esté dentro de los más probables, sino dentro de los posibles, debido quizás a su consumo de agua y a la competencia que hace por los terrenos cultivables para alimentación. Sin embargo, la transformación química de celulosa a partir de papel, residuos de madera y residuos vegetales le da un nuevo aire a esta conocida tecnología.

Plausibles
Servicios robóticos: Incluye robots y vehículos no tripulados para aplicaciones que no son de manufactura, incluyendo hardware (sensores, sistemas de poder) y software (algoritmos adaptativos, inteligencia artificial) que permitan la realización de labores de manera autónoma y semiautónoma. De nuevo el cuidado de la salud y el reemplazo de la fuerza laboral son sus grandes impulsores.
Aumento de la cognición humana: Incluye drogas, implantes, ambientes de aprendizaje virtual, y dispositivos que se pueden vestir para mejorar las habilidades cognitivas. Incluye el software de entrenamiento especialmente diseñado así como dispositivos implantables o de uso en la ropa para mejorar la visión, el oído, e incluso la memoria.

Observen que las 10 tecnologías pueden enmarcarse en tres grandes temas: el tema energético-ecológico (agua, almacenamiento de energía, biocombustibles, carbón), el tema de desarrollos computacionales de generación superior (computación ubicua, servicios riodivobóticos) y la incorporación de tecnología directamente en los seres humanos (biogerontecnología, aumento de capacidades mentales y físicas). Para estar en la jugada en los próximos años hay que estar en por lo menos uno de esos temas....

Colofón: Colombia es mencionada 4 veces en el informe. La primera vez, se trata de una amenaza: corremos el riesgo de que la tierra cultivable sea escasa para nuestra población proyectada. Dos veces es mencionada como importante productora de recursos energéticos: biocombustibles y carbón principalmente, imagino. La última vez, como potencial beneficiario del envejecimiento de los países emergentes, para proveer capital humano educado y buen ambiente de negocios. No se requieren más diagnósticos para saber el papel que puede jugar el país en un futuro cercano. Quizás el tema de la biodiversidad se les escape... o quizás sea una historia que nos hemos tragado sin mayor análisis.

martes, 2 de diciembre de 2008

Temporada de huracanes 2008: fuerte, pero no para alarmarse


La temporada de huracanes 2008 en el Caribe ha oficialmente terminado. Como lo hiciera para la temporada 2006 y para la temporada 2007, les comento los resultados para la temporada 2008, a ver si en ella vemos la señal del final del mundo.
Pues bien, el informe del centro nacional de huracanes indica que ésta fue una temporada por encima del promedio: 16 tormentas tropicales (promedio 11), 8 huracanes (promedio 6) y 5 grandes huracanes(promedio 2). La energía ciclónica fue el 167% de la mediana a largo plazo. En suma, tuvimos una temporada dificil.
¿Porqué entonces no escucho las voces de los apocalípticos clamando por el fin del mundo? Bueno, principalmente porque ninguno de los grandes huracanes causo en U.S.A los destrozos que Katrina hizo en el 2.005. Que los huracanes de este año hayan arrasado con Haiti y con media Cuba no parece de mayor importancia para los agoreros, que de seguro deben considerarlos países sin importancia. También el último de los grandes huracanes prácticamente no salió en las noticias porque no tocó tierra mas allá de unas pequeñas islas.
Como lo advertí en 2006, y luego en 2007, una temporada por encima del promedio no significa nada especial ni fuera de lo común, menos aún si ha sido precedida por dos temporadas por debajo del promedio (2006 y 2.007). Habrá que esperar más años para ver si los huracanes en el Atlántico realmente están siendo incrementados por el cambio climático. Por ahora, no hay evidencia de que los huracanes estén aumentando o cambiando de tendencia, y en el campo de los huracanes no hay síntomas del daño que le estamos haciendo a la tierra o señales del fin del mundo.

miércoles, 12 de noviembre de 2008

Percepcion del tiempo: parece que fue ayer



La imagen la encontré aqui; al parecer los relojes los venden en chillichilly.net

Ayudando a unos estudiantes para su trabajo de grado en Ingeniería Industrial, me topé con un tema que es intrigante y lo que encontré por allí bien vale un post. Los estudiantes están tratando de medir la insatisfacción al hacer una fila en el cine, o en el banco. Como cualquier insatisfacción, se trata de una diferencia entre las expectativas y las percepciones. Pero, ¿cómo percibimos la duración de una espera? Para ello es necesario entender cómo percibimos el paso del tiempo, y particularamente, qué factores afectan ese paso del tiempo. Como en toda pregunta, siempre se encuentra uno con más investigación de la que podría suponer. Intentaré hacer un resumen de lo que me pareció más interesante... muchas de las conclusiones se dirá que "ya las sabíamos sin haber investigado" pero yo no estoy tan seguro...

¿tic-tac interno? : La pregunta de oro de la percepción del tiempo es si tenemos realmente un mecanismo interno tipo reloj que nos permite determinar la duración del tiempo o si elaboramos la duración del tiempo a partir de lo que observamos, de los acontecimientos, de una combinación de la memoria y la información de los sentidos.! Hagan sus apuestas!

Parece que fue ayer: Los seres humanos somos mejores recordando intervalos cortos de tiempo que intervalos largos de tiempo. De décimas de segundo a minutos, parecemos ser bastante precisos; pero somos imprecisos recordando intervalos de horas, días o años. En términos técnicos, la varianza de la percepción del tiempo crece linealmente con la media del tiempo a estimar.

Te lo advertí: Resulta que si nos advierten que se nos va a preguntar cuánto tiempo duró algo (tiempo percibido) diremos que se demoró más tiempo que si no nos advierten y sólo hasta el final nos preguntan la duración de la tarea (tiempo recordado). Esto probablemente tiene bastante que ver con el siguiente punto.


Estoy aburrido de esperar: Una de las partes más aburridas de esperar se debe a que mientras esperamos no estamos haciendo nada, y toda nuestra atención se dirige hacia el tiempo que estamos "perdiendo", y así, el tiempo se hace más largo. Si se realizan actividades interesantes, el tiempo recordado se hace más corto, pero el tiempo percibido no se ve afectado. Esto puede tener una gran influencia en las esperas pues con frecuencia conscientemente uno está preparado para medir cuánto tiempo desperdició haciendo fila. Algunos neurocientíficos piensan que el efecto "distraído" se debe a la cantidad de recursos que podemos dedicar (o dedicamos conscientemente) a evaluar el paso del tiempo.

Lo ví hace un momento: Somos más precisos para juzgar la duración de estímulos auditivos que la duración de estímulos visuales. De alguna manera el sentido del ritmo, del tiempo, está en el oído. !Ah, eso cualquier director de orquesta lo sabe!

!Fue horrible! !se me hizo eterno!: Que las emociones juegan un papel importante en la percepción del tiempo, parece sencillo de decir, pero ¿cómo funciona ello? Hay dos elementos clave: la excitación y la valencia. La valencia es positiva si lo que se vive es placentero, y negativo si es doloroso, u horroroso. A su vez, se puede estar muy excitado o poco excitado. Ejemplo:

alta excitación, valencia positiva: relaciones sexuales.
baja excitación, valencia positiva: mirar paisajes, jugar con un bebé.
alta excitación, valencia negativa: accidentes, heridas.
baja excitación, valencia negativa: arañas.

La interacción funciona así: si la excitación es baja, las valencias negativas se perciben de menor duración y las positivas, de mayor duración. Se diría que uno quiere olvidarse de lo malo y acordarse de lo bueno que le ha pasado. Pero...
si la excitación es alta, las valencias negativas se perciben de mayor duración. Un accidente con heridas se nos hace eterno porque no podemos evitar seguir viéndolo. Si estamos profundamente emocionados haciendo algo que nos gusta, la duración del tiempo desaparecerá. Yo relaciono particularmente ésto con el aprendizaje: es importante para nuestra supervivencia aprender de las situaciones dolorosas y críticas que la amenazaron en el pasado, y por ello estas situaciones son recordadas como más largas.

La flecha del tiempo: Relacionamos el espacio con el tiempo (la famosa flecha del tiempo), en dos formas diferentes: o el tiempo viene hacia nosotros (los exámenes se acercan) o nosotros avanzamos en el tiempo (ya vamos llegando a fin de año). En ambos casos, las personas que hablamos español o inglés dibujamos mentalmente la flecha del tiempo de forma horizontal. Las personas que hablan mandarín perciben esa flecha del tiempo de forma vertical. (la investigación, aquí) Si a las personas que hablan mandarín se les pide ordenar una secuencia temporal en una lista vertical, lo harán más rápido que nosotros; pero, su ordenamiento será más lento si la lista está dispuesta horizontalmente. Esto al parecer no tiene mucho que ver con la duración del tiempo percibido en particular, pero me pareció interesantísimo.
¿Recuerdas cuánto tiempo ha pasado? El efecto túnel funciona aquí tambien. Mientras más tiempo pase, más imprecisos son nuestros recuerdos del pasado, incluida la duración de los eventos. Que tomen nota los jueces, en los testimonios que ocurren años después del suceso en donde todavía se pregunta qué hora era y cuánto duró una situación.

A medida que envejezco, los años se pasan más rápido (De nuevo la maldita dopamina): Por último, el clásico efecto del tiempo que pasa más rápido a medida que tenemos años parece tener su explicación en los niveles de dopamina. Sí, la dopamina, la famosísima hormona que es la fuente del placer, el refuerzo, la capacidad de socializar, y un largo ertcétera... resulta que la emisión de dopamina disminuye con los años, y al parecer, un mayor nivel de dopamina hace que el tiempo pase despacio, y un menor nivel, que el tiempo pase rápido. esta inferencia se basa en estudios con drogas alucinógenas y personas con enfermedad de parkinson. Si alguien inhala cocaina, su dopamina se dispara, así como su reloj interno y el tiempo pasa más despacio; si, por el contrario, fuma marihuana, el tiempo se le pasará más rápido porque su reloj interno se hace más lento (y por eso hablan más leentoo). Bueno, yo no sabía que la dopamina disminuye después de los 20... así que probablemente encontramos menos placer en las cosas a medida que envejecemos... sniff, digo, en fin....
La mayor parte de lo aquí expuesto se encuentra en estas dos referencias(en inglés), en donde además se referencian los estudios originales:
Edward Willet
Mixing memory

domingo, 2 de noviembre de 2008

¿Cuántas melodías son posibles?

Autor: Pablo Picasso
Cuando era adolescente me parecía que las canciones se iban a agotar en un futuro no muy lejano. Dada la cantidad de canciones nuevas que escuchaba a diario en la radio, o que alguien me sugería escuchar, me parecía imposible que hubiese suficientes melodías diferentes como para continuar alimentando la industria musical. No fue sino hasta varios años después que descubrí el poder combinatorio de la realidad, el que convierte la programación de las rutas del Transmilenio (bus) en una tarea titánica, y a su vez es madre de toda la diversidad biológica. Pero nunca volví a abordar el problema del número, no ya de canciones, sino de melodías posibles para la voz o el instrumento principal. Para ilustrar entonces el poder de la combinatoria, voy a hacer un primer borrador del número de melodías posibles bajo ciertas restricciones- no voy a tener en cuenta segundas voces, posibles arreglos, variantes e instrumentos-. Advertencia: Para entender las restricciones hay que tener un conocimiento básico de notación musical.

Primera restricción: me voy a basar en un compás de 4/4. Eso ya limita muchísimo el alcance de mi intento, porque, por ejemplo, descarto todos los posibles valses (compás 3/4). Sin embargo, el compás 4/4 cubre la mayor parte del rock y el pop modernos, y como el intento es saber qué tan creativos pueden ser aún los creadores de música para la radio... me limitaré a este compás. Pero, insisto, eso reduce en un gran volumen mi universo.

Segunda restricción: Supondré que solo se utilizarán notas redondas (duración 4 en este compás), blancas (duración 2) y negras (duración 1). Con ello limito enormemente mi universo, dejando por fuera corcheas, semicorcheas, fusas y demás.

Tercera restricción: No tendré en cuenta los posibles silencios. Esto con el fin de evitar contar melodías que en su mayor parte, sean solo silencio. Sin embargo, ésta es una nueva limitación que hará del número que calcule menor que el verdadero.

Cuarta restricción: Utilizaré las notas posibles a lo largo de dos escalas, y utilizaré solo las 12 notas por escala de la notación tradicional. Aquí la limitamente no son las 12 notas (casi toda la música de la radio, o aún la música que escuchamos en general, no sale de allí) sino las dos escalas, porque es bastante posible que una canción utilice más que ésto. Sin embargo, mis limitados conocimientos musicales me indican que es una suposición razonable para la canción del verano o el bolero de Luis Miguel.

El cálculo: Tengo 12 notas por escala x 2 escalas= 24 notas de donde escoger.
Si uso una redonda(R), ocupo el compás entero, luego solo hay 24 maneras de llenar un compás con una redonda.
Si uso sólo blancas(B), puedo usar dos notas por compás, pues la duración de la blanca es de 2, y 2+2=4 (¿seguro?). Así que tengo 24*24 maneras de llenar un compás con blancas.
Si uso solo negras(N), puedo usar hasta cuatro notas por compás; así, tengo (24)4 = 373.848 melodías... solo para el primer compás.
Si uso combinaciones de blancas y negras (B y N), tengo tres posibilidades: NNB, NBN o NNB. Por cada una de esas 3 combinaciones, tengo (24)3 posibles melodías.
Ahora viene la última suposición: supongamos que un compás dura dos segundos, y que una cancioncita normal dura 3 minutos. Eso me da 30 compases por minuto, y 90 compases en total para la canción.
Luego el número posible de melodías será..... (373.848)90

Para darnos una idea de la magnitud de este número, vamos primero a pasarlo a notación científica. Simplemente se toma el logaritmo en base 10 , quedando 90*log(373848)=501.54. Esa es la potencia de 10 correspondiente. Para ahorrarme los decimales, redondearé este número a 500 y diré que el número posible de melodías (bajo las restricciones dadas) es, como mínimo:

Número de melodias >= (10)
500


Esta pequeña cifra es MUCHÍSIMO, pero MUCHÍSIMO más que el número de átomos que- se calcula- tiene el universo observable (alrededor de (10)80 ) . Es más, es aproximadamente 100.000 gugols, es decir, 100.000 veces el número que hace 30 o 40 años se usaba para representar un número MUY grande y dificil de imaginar. Por último, es más grande que la lista de posiciones de cada partícula del universo en cada instante del tiempo con la mayor precisión posible ( se calcula en (10)325 ).

Quiero recordarles que usé cuatro restricciones para este cálculo... así que el número posible de canciones de 3 minutos es mayor que ésto. Esta cifra es solo un aproximado del número posible de melodías en 90 compases(3 min) de 4/4 usando dos escalas de 12 notas cada una, con notas redondas, blancas y negras.

Claro: es muy posible que nos encontremos compases repetidos con alguna frecuencia. Solo hay 400.000 posibles compases bajo estas restricciones, así que sí se componen unas 1.000 canciones diarias, es bien posible que en un mismo año más de una canción tenga un compás repetido con otro. Pero que se agote la fuente de posibles canciones.... dificil. Ahora, que esas canciones nos gusten... ya es otra historia, es un asunto de armonía y todo eso. Imagino que muchas de las posibles canciones son simplemente impotables: basta con imaginar la canción que resulta de repetir monótonamente el mismo sonido con la misma duración durante 3 minutos.

Y para cerrar la tuerca, dos consecuencias prácticas: 1) Los casos de plagio tienen un buen argumento si un buen trozo de la canción es repetido. Casi tan bueno como la identificación con ADN. 2) La próxima vez que un artista toque un refrito de hace 20 o 30 años... ya te podrás imaginar su nivel de creatividad.

viernes, 24 de octubre de 2008

Richard Felder, educador universitario a carta cabal


Richard Felder es un profesor universitario de Ingeniería Química que se tropezó con lo que usualmente nos tropezamos las personas que, con alguna experticia en un tema, somos invitados a dar clases en alguna universidad. En sus propias palabras (traducidas por mi):

"La profesión de profesor universitario podría ser la única profesión para la cual no se exige ni se ofrece preparación o entrenamiento. Usted consigue un Ph.D, es contratado por una facultad, ellos le muestran su oficina, y entonces le dicen: “A propósito, vas a dictar el curso 205 el próximo semestre”. Nos vemos!!!

Como resultado de ello, se usan consistentemente técnicas de enseñanza que se ha demostrado exhaustivamente que son inefectivas para promover el aprendizaje."

¿De que técnicas está hablando? Básicamente de la clase 100% magistral, que NO funciona en estudiantes de los 0 a los 150 años. ¿Qué le pasó al Dr. Felderer? Después de graduarse, y hacer un pos-doctorado, y tras cerca de 15 años (!15 años!) de "dar" clase,

"me di cuenta de que algo andaba mal en mi clase de pregrado desde el principio. Yo cubria el material a conciencia, dando montones de ejemplos e ilustraciones de los métodos que usaba, pero cuando hacía preguntas al día siguiente la mayoría de los estudiantes parecían no haber oído ni una palabra de lo que yo había dicho, y cuando teníamos exámenes les iba muy mal".

¿les suena conocido? ¿les ha pasado? A mi también me pasó.....

"me di cuenta de que nadie jamás me había dicho nada acerca de cómo enseñar... lo extraño es que eso no hace parte de la preparación de los profesores universtiarios. Pensé que era una buena idea aprender algo acerca de lo que se suponía que iba a hacer toda mi vida"

¿Que hizo el profesor Felder? Empezó a leer investigación en educación. Yo sé que puede parecer aburrido, sobre todo para un ingeniero... parecerá que el 80% de lo que allí se dice no se puede aplicar o es imposible de entender, pero finalmente empiezan a aparecer resultados. No es una ciencia exacta, pero hay muchas cosas que se pueden mejorar. El que quiera, puede empezar por leer lo que propone el profesor Felder, puesto que su formación de ingeniero hace que sus artículos sean mucho más directos y aplicados de lo que usualmente se encuentra en las ciencias sociales. En palabras de Felder:

"Muchos profesores se sorprenden al enterarse que:
- Hay técnicas de instrucción bien definidas que hacen más efectiva la enseñanza.
- Esas técnicas pueden ser introducidas lenta y metódicamente, sin comprometer el cubrimiento del programa. No requieren grandes gastos de dinero, tiempo o esfuerzo.
- Lo más importante, las técnicas han sido validadas por investigaciones respetables, cuidadosas y documentadas. Su efectividad no es solo un asunto de opinión. !Funcionan!"


¿Cuáles son esas estrategias?

"Las principales estrategias que uso para seguir este método son: Primero, escribir objetivos instruccionales claros y usarlos para estructurar los cursos que imparto; segundo, me dirijo al espectro completo de estilos de aprendizaje de los estudiantes cuando enseño; y tercero, uso aprendizaje activo y cooperativo"

Cada uno de estos tres pasos está brevemente explicado en este artículo y detallado en las referencias que allí da el Dr. Felder, o puedes buscar en la página del Dr. Felder. Si has llegado hasta acá, ya no hay excusa para seguir dando esa aburrida clase magistral.... pero si aún asi no te convences, ve a tu próxima clase y, a la mitad de la clase, mira a tus estudiantes a los ojos (si no los tienen cerrados todavía) y si no sientes la profunda angustia que brota de ese aburrimiento.... te sugeriría que no siguieras siendo profesor.

Y para cerrar la tuerca... el profesor Felder desarrolló todo su trabajo en la facultad de Ingeniería de la Universidad Estatal de Carolina del Norte. Yo ahora soy víctima de la parcelización del conocimiento. Me encuentro en la misma universidad, con profesores de la misma facultad del Dr. Felder, y veo que aún siguen en la prehistoria de la educación. !Por favor, que alguien los ilumine, ya que ningun estudiante en sus cabales (ni yo) sería capaz de decirles algo! ¿Porqué confiamos nuestra educación universitaria a personas que sólo están interesadas en su investigación y no parecen querer desarrollar la más minima habilidad educativa? ¿De donde acá un investigador tiene que ser necesariamente un buen profesor? ¿Porqué es tan dificil escuchar a los profetas de la propia tierra?

lunes, 20 de octubre de 2008

Las leyes secretas de los proyectos de análisis de datos (Analytics projects)


Primera ley de la certeza: La certeza es inversamente proporcional al conocimiento.

La persona que realmente entiende los datos y el análisis entenderá también los riesgos y limitaciones, y por tanto estará constantemente prevenida y atenta a estas dificultades. Las personas que son simples, directas y se muestran 100% seguros usualmente no tienen idea de lo que están hablando.

Segunda ley de la certeza: El atractivo de los resultados es directamente proporcional a la seguridad y certeza de sus presentadores.

Los tomadores de decisiones se sienten atraídos por lo cierto y usualmente no tienen la menor idea de las complejidades de la minería de datos. Lo que ellos necesitan con frecuencia es simplemente alguien que les diga que deberían hacer.

Corolario: Nótese que las leyes 1 y 2 juntas causan multitud de problemas

La ley del valor del tiempo: El valor del análisis es inversamente proporcional a la presión del tiempo para producirlo.

Si alguien quiere algo de inmediato, ello significa que lo quieren como un capricho que no necesitan realmente. El requerimiento que llega a las 4 p.m para la reunión de las 5 p.m será olvidado a las 6 p.m. Los análisis que realmente pueden afectar a una empresa generalmente son identificados después de un análisis cuidadoso, y la gente está dispuesta a esperar por ellos. (Qué bonita idea para los típicos “bomberos” que trabajan hasta tarde).

Primera ley de los malos análisis: Los malos análisis le quitan el espacio a los buenos análisis.

Los malos análisis invariablemente están de acuerdo con las preconcepciones de la gente, y por eso a la gente le gusta oírlos. Este tipo de mal análisis es siempre 100% seguro en sus resultados, no tiene advertencias, supuestos, ni nada difícil de entender, y generalmente es el primero que se hace. Ello significa que los buenos análisis la tienen “cuesta arriba” para hacerse a un lugar.

Segunda ley de los malos análisis: Un mal análisis es peor que ningún análisis.

Si no hay análisis, la gente se las arregla con el sentido común, que usualmente funciona bien. Para realmente equivocarse se necesita una guía común, la cual solo puede venir de un análisis persuasivo que apunte en esa dirección.

Ley de las etapas de un buen análisis:

Todo buen análisis pasa por las siguientes etapas:

1- Eso es imposible de hacer

2- De pronto se puede hacer, pero no vale la pena.

3- Siempre supe que era una buena idea.


Ley del tamaño de la base de datos: Los tomadores de decisiones siempre tendrán un ego proporcionalmente más grande que la base de datos a ser analizada.

Traducido de este enlace. Autores: Edmund Freeman, Mehran Gomari y Ajay OHri


miércoles, 15 de octubre de 2008

lunes, 13 de octubre de 2008

Concurso: La mejor foto del verano

Lissa Bettany, la geek y fotógrafa más sexy de Canadá (según el concurso de wired) lanzó un concurso aficionado para escoger la foto que mejor represente el concepto de "verano" y, que por supuesto, sea una foto hermosa. Los ocho finalistas han sido escogidos, y yo republico aquí las tres que más me gustaron... son fotos simplemente hermosas. ( el html me ganó... no logré poner directamente en el post sino una... para ver las otras dos, sigue los links)


.

"Fireworks over downtown San Diego" por Buto Hairs. Fuegos artificiales en todas partes...

"The anonymous surfer", por Nik Fletcher. La playa es inevitable..

"Summer friends" por Ivan Gomez. Mojados.....

En fin... no queda más que gozarse estas fotos mientras el clima se hace más y más frio todos los días....

Este es el link al grupo de flickr donde están todos los participantes.

miércoles, 8 de octubre de 2008

Modelos estadísticos

"Todos los modelos están equivocados, pero algunos de ellos son útiles".
Essentially, all models are wrong, but some are useful- Frase atribuida a George Box, matemático yestadístico... (Sí, Box, el mismo de los modelos ARIMA de series de tiempo... para los que sepan del tema)


viernes, 3 de octubre de 2008

Cube: arquitectura personalizada por un exoesqueleto


(tomado de la página de Ysrael Seinuk)

En el blog de Angela-Posada Swafford me topé con una interesante historia que mezcla personalización masiva (mass customization) con diseño inspirado en la naturaleza, por lo que me sentí tentado a indagar sobre el tema.

Se trata del edificio residencial Cube, que actualmente se construye en Miami bajo la dirección del arquitecto Chad Oppenheim. Este es un edificio en el que los espacios de cada comprador pueden ser personalizados, pues no se compra un apartamento o un piso, sino una unidad con cubos de espacio que el dueño puede acomodar de una manera flexible. Por ejemplo, si usted compra tres cubos, los puede poner en fila horizontal, o puede poner dos cubos uno detrás de otro y el tercero perpendicular a los anteriores para formar una L, o una T (un poco al estilo Tetris). Como los compradores participan del diseño final del edificio, se podría decir que se trata de arquitectura 2.0; como cada cual escoge la disposición de los cubos que compre a su antojo, se trata de un caso más de mass customization. El arquitecto explica brevemente su concepto en la siguiente entrevista (en inglés):



Este diseño implica que no todos los pisos van a tener las ventanas exteriores al mismo nivel(como se ve en la imagen), y así mismo implica un diseño estructural flexible... y ahí es donde aparece el ingeniero que siempre hay detrás de todo gran arquitecto: El israelí Ysrael Seinuk. Ysrael propuso que la estructura del edificio estuviese por fuera del mismo, evitando así las columnas interiores de concreto reforzado. De esa manera, el edificio estará construido con un exoesqueleto, imitando la estructura de muchos insectos. En efecto, los artrópodos suelen tener esta armazón externa a la que está ligada su movimiento muscular, en contraste con muchos otros animales, como los mamíferos, que tenemos una estructura central (la columna vertebral).
El exoesqueleto del edificio está hecho en acero reforzado con trozos de concreto, y un tubo central llevará todo el cableado y los sistemas mecánicos a los cuales se conectarán los diferentes pisos.

Existen otros edificios con exoesqueletos, como el famoso Burj Al Arab hotel en Dubai, pero ninguno con el concepto de "crea tu propio espacio". Esperemos a ver el resultado estético y económico del proyecto para ver si estamos ante una nueva forma de construir... o ante una idea fantástica cuya puesta en práctica la vuelve un esperpento digno de pesadillas.


Hotel Burj Al Arab

miércoles, 1 de octubre de 2008

el cisne negro: mezcla de pavo y microsiervo

Basta con un contraejemplo para derrumbar toda una teoría científica que ha costado siglos construir. En esa fragilidad reside toda la fortaleza de la ciencia. Esa es la paradoja del pavo inductivista.

Sin embargo,Nassim Taleb va aún más lejos en el ensayo "Un mapa de los límites de la estadística", uno de los tantos colofones de su libro el cisne negro (the black swan), En él relata como los contraejemplos de las crisis económicas, incluida la más reciente, son una demostración de la inconveniencia del uso de la teoría clásica de probabilidades en la valoración del riesgo. Simplemente somos incapaces de predecir cuándo, y sobre todo, qué tan profunda va a ser la próxima caída.
Cisne negro
Sin embargo tropezamos en lo que él denomina la falacia lúdica, que consiste en creer que los juegos de azar se reproducen en nuestra realidad económica y financiera, y que por lo tanto podemos estimar con alguna precisión el valor esperado de nuestra ganancia o pérdida en una crisis o en un golpe de suerte, así como el casino puede estimar sus ganancias a partir de la programación de sus máquinas.

Vana presunción: sabemos qué puede haber una crisis, pero como el pavo de la paradoja nos escudamos en teorías que funcionan bien en otros ámbitos para darnos seguridad, pero ignoramos por completo la información más importante, la que hará del futuro algo diferente del pasado, la que permitiría saber si solo tendremos un susto pasajero en carretera o el choque que se llevará nuestras vidas con él. Así de simple es.

Así mismo podemos tener una ganancia inesperada, y no sabemos qué tan grande será: En el caso de este blog, para rizar el rizo ( y ser bien autorreferente), el post del pavo llamó la atención de uno de los blogs más importantes en el mundo de habla hispana, microsiervos, en particular de Alvy, el microsiervo de las citas. Y yo tuve mi propio cisne negro (de signo positivo, menos mal): 7000 visitas a mi blog en 72 horas, cuando antes había tenido 300 en dos años (98% visitas mías y de familiares, por supuesto). Si usted está leyendo este post, lo más seguro es que haya llegado a él por causa de Microsiervos. En parte ellos tienen la culpa de que yo esté blogueando... y ahora tienen la culpa de que haya gente visitándome....



Gracias = pavo + microsiervos

martes, 30 de septiembre de 2008

NETFLIX PRIZE: primeros archivos

!Ya he logrado enviar al premio tres archivos de prueba exitosamente a este premio! Sin embargo, los resultados están lejos de alcanzar el nivel necesario. Como recordarán, debo pronosticar más o menos 2 millones de calificaciones (de 1 a 5) hechas por usuarios a películas rentadas en Netflix. La vara para ser medido es el RMSE, conocido como la raíz del error cuadrático medio (simplemente la raíz cuadrada del promedio de los "descaches" o errores de predicción al cuadrado). Pues bien, multiplicando simplemente la media de calificaciones de la película por la media de calificaciones del usuario obtengo RMSE=1.0157. Para igualar lo que actualmente hace el sistema de Netflix, debo lograr RMSE=0.9514; para ganar 50.000 dólares antes del primero de Octubre debo lograr RMSE<=0.8625; y para ganar el premio mayor, RMSE<=0.8563 en cualquier momento y no ser superado por nadie durante un mes.

Algunas cosas sencillas que he hecho han bajado mi RMSE a 1.0149. A ese paso todavía estoy lejos... pero ahora si voy a empezar a realizar acciones más intensivas. Mantendré actualizado este blog con mi (más que probable) tortuoso camino hacia mi primer millón... =). Cualquier idea es bienvenida....

domingo, 28 de septiembre de 2008

Privacidad

"Ustedes tiene cero privacidad, de todos modos. Supérenlo."
"You have zero privacy, anyway. Get over it"
Scott McNealy, CEO de Sun Microsystems en 1.999, cuándo se le preguntó por los esfuerzos para combatir el rastreo de usuarios de Internet.

viernes, 26 de septiembre de 2008

Macrofotografías espectaculares




Generalmente son de flores o de insectos, como esta fotografía de un insecto bañado por el rocío de la mañana. Son.... simplemente espectaculares. Las encontré vía microsiervos, y hacen parte de una colección llamada "Inspiración de los Lunes" del blog Smashing Magazine, la cual contiene otras series de fotos maravillosas (ya no macrofotografías). Bueno, y de ahi puedes saltar al grupo de Flirck de macrofotografía y perderte en la red hasta que la vela se apague.....




miércoles, 24 de septiembre de 2008

Algoritmos de optimización y clasificación inspirados en hormigas: ant clustering




En el más reciente CLAIO, tuve la ocasión de asistir a una conferencia sobre investigaciones en minería de texto, dada por unos profesores de la Universidad de Cantabria. En sus trabajos, ellos utilizaron una técnica conocida como ant-based clustering, o agrupamiento basado en hormigas.

La utilización de metáforas biológicas en inteligencia artificial, optimización y clasificación es casi tan antigua como las mismas disciplinas. Generalmente utiliza como idea fundamental la inteligencia colectiva emergente de individuos con muy poca autonomía personal, tales como hormigas, abejas y bandadas de pájaros, que a pesar de su limitada capacidad de recolectar y clasificar información exhiben mecanismos de amplificación que hacen de los comportamientos grupales algo muy elaborado .





El mismísimo Alan Turing en los años 50 previó las posibilidades de las colectividades de organismos simples y planteó su funcionamiento a partir de mecanismos de accion local e inhibición, de acuerdo con esta página (altamente técnica).

Es fácil crear en un computador pequeños automátas que recojan información y hagan clasificaciones simples. Lo dificil (antes de los años 90) era crear miles o millones de los mismos simultáneamente, y lo que hoy en día sigue siendo un reto es crear los mecanismos adecuados de acción, inhibición y amplificación colectiva de la información que hagan de estos "seres" una inteligencia colectiva.
Dos ejemplos clásicos de mecanismos de inteligencia colectiva para resolver problemas (el nombre técnico es metaheurísticas) son: colonia de hormigas e inteligencia de partículas.

El caso de la clasificación basada en hormigas resultó para mi particualmente intrigante por el sistema biológico en el que se basa: la creación de cementerios a partir de cadáveres. Si se pone un conjunto de cadáveres de diferentes tipos (o tamaños) de hormigas en un plato circular, y se ubica en ellos un conjunto de hormigas vivas (de ciertas especies), éstas empiezan a desplazar lentamente los cadáveres hasta formar, después de unas horas, grupos (clusters) de cadáveres perfectamente clasificados.



Al parecer las hormigas no mueven cada cadáver de una vez a su cementerio, sino que los van desplazando lentamente a lo largo del tiempo, usando un mecanismo basado en los cadáveres más recientes que han visto alrededor. Si hay cadáveres parecidos en las cercanías, acercan el nuevo cadáver; si él cadáver es muy diferente a los que hay en las cercanías, lo alejan; y en ocasiones parecen indiferentes a algunos cadáveres. Ese mecanismo ha resultado bastante bueno para realizar clasificaciones de elementos en un computador con conocimiento previo de los grupos que deben clasificarse. En el caso de la minería de texto, la intención es tener un sistema que clasifique automáticamente en categorías la información que se encuentra en la red (p.e en deportes, tecnología, farándula, etc...) para así disminuir la inmensa carga de tener que hacerlo manualmente, dada la explosión de información en Internet.

Algunas de las clasificaciones mostradas por los investigadores no fueron muy exitosas, otras sí; Sin embargo, yo creo que resultaría muy interesante ver porque ciertos artículos no fueron "bien" clasificados y quedaron en regiones indefinidas del "cementerio", o aún peor, en el cementerio equivocado. Más allá de las limitaciones de la técnica, esos automátas podrían estarnos diciendo algo intersante y nuevo acerca de ciertos textos. ¿No es acaso la clasificación humana también falible? ¿Porqué es mejor nuestra clasificación que la de los automátas? ¿No es la clasificación de ella un poquito más objetiva, o al menos, no está esa clasificación basada en criterios matemáticamente definidos frente al juicio subjetivo del evaluador experto?
Es cierto que estas técnicas aún tienen dificultades para clasificar ciertos textos de alguna complejidad. Pero no estoy proponiendo que la minería de textos reemplace al evaluador humano por completo, sino que en ocasiones le de nuevas luces. Así, el autómata clasificaría los textos fáciles, y enriquecería la información para los textos dificiles, dándole nuevas herramientas al evaluador subjetivo para ciertos casos. Lo fácil, para la máquina; lo difícil, para el humano, pero enriquecido.

Y por último, no sobra recordar cómo la naturaleza sigue resultando ser nuestra mayor fuente de inspiración para la resolución de problemas complejos.

martes, 23 de septiembre de 2008

Privacidad y seguridad de la información personal


¿Qué tan pública es nuestra información personal? Todos sabemos que el envío de información por Internet es potencialmente peligroso, pero... ¿qué tan conscientes somos del manejo que las empresas o instituciones a las que hemos entregado información le han dado a nuestros datos?


Los colombianos, por lo menos, nunca olvidaremos el rumor de que durante las "pescas" milagrosas de las FARC, los guerilleros decidían a quién secuestrar consultando en una base de datos al parecer robada o comprada de manera corrupta a funcionarios de la oficina de impuestos nacionales, DIAN.
La privacidad electrónica fue uno de los tópicos de la charla que tuvimos en la Maestría que estoy cursando. La conferencia fue dada por Julie Earp, una experta mundial en el tema. He aquí algunas cifras y anotaciones interesantes:

Julie Earp

- En Estados Unidos no existe como tal el derecho a la intimidad o privacidad, como sí existe en Europa o Colombia. Algunas leyes regulan aspectos puntuales de esa intimidad o privacidad, pero no tienen un rango constitucional o no lo establecen como un derecho de la persona.

- Más de 240 millones de registros se han visto afectados por posibles fallas de seguridad en Estados Unidos desde el 2.005. Estas pérdidas o robos de información solo son tenidos en cuenta si se ha perdido información sensible que pueda llevar al robo de identidad, así que hay muchos más registros perdidos. Y ésto es sólo lo reportado en Estados Unidos.

- Las universidades son uno de los blancos favoritos de los crackers para apoderarse de la información, porque generalmente tienen menor presupuesto para seguridad, poseen información de muchas personas y por su naturaleza investigativa y académica tienen configuraciones electrónicas diseñadas para compartir más que para proteger.

- Entre 6 y 10 millones de personas sufrieron algún tipo de robo o suplantación de identidad en Estados Unidos, de acuerdo con las fuentes oficiales.

Y lo mejor, viene ahora.... la página dónde se llevan registros de todas las brechas de seguridad potencialmente peligrosas que han sido reportadas en los Estados Unidos... no sabe uno si morirse de espanto o morirse de la risa enterándose que ....


Facebook, probando su nueva versión, "accidentalmente"
hizo públicas las fechas de nacimiento de TODOS sus usarios durante un tiempo indeterminado en el mes de Julio, aún si el usuario había decidido mantenerla en secreto.

¿qué le preguntan a uno cuando llama a averiguar por su tarjeta de crédito, por ejemplo, para confirmar identidad? ¿cuándo me informó Facebook de ésto?

Es impresionante hacer un recorrido por esta exhaustiva página: backups de información bancaria enviada sin encriptar, USB pérdidas, funcionarios de nivel medio- bajo que se llevan computadores. Es trsite darse cuenta que ocurren cosas casi todos los días, a veces de 100 registros, a veces de 1.000.000... y si eso es en USA, ni qué decir de países como Colombia.... mejor no llevemos el registro, por favor. A veces siento que prefiero no saber.

domingo, 21 de septiembre de 2008

La paradoja del pavo



Un pavo es alimentado durante 1.000 días. Cada uno de esos días le confirmaba a su departamento de estadística que la raza humana se preocupaba por su bienestar, "con significancia estadística cada vez mayor". El día 1.001 el pavo recibe una sorpresa.
Nassim Nicholas Taleb, en un ensayo para Edge.

¿cómo se entiende esta paradoja estadística? ¿qué significa?... Lean el ensayo completo (en inglés). Más adelante comentaré sobre el tema.

viernes, 19 de septiembre de 2008

CLAIO 2008: Efectos logísticos de los precios del petróleo




Durante el congreso Latino-Iberoamericano de Investigación de Operaciones CLAIO 2008, tuve la ocasión de escuchar al Dr. Edgar Blanco, un egresado de la Universidad de los Andes en Colombia con doctorado en Georgia Tech que ahora trabaja para el Centro para el transporte y la logística de Instituto Tecnológico de Massachusetts. El profesor Blanco dió una conferencia sobre el tema de los cambios logísticos que se están produciendo debido a los altos precios del petróleo. Algunas ideas que me parecieron interesantes:

1- El precio del petróleo es tan solo el 15,2% del costo del transporte. Esta cifra surge de la siguiente manera: el 50% del precio de la gasolina corresponde el precio del petróleo; y solo el 30% del costo del transporte corresponde a la gasolina (60% es mano de obra y 10%, vehiculos y demás). Al respecto encontré esta gráfica del departamento de energía de U.S.A . En ella, el precio del petróleo es el 73% de la gasolina, pero eso es en U.S.A, donde los impuestos no se llevan una tajada tan grande como en otros países y la eficiencia en la distribución es mayor.

2) De esta forma, si el precio del petróleo se triplica su efecto sobre el costo de los bienes es más bien marginal. En palabras de Edgar Blanco, con ajustes básicos en los camiones como mantener las llantas bien infladas y los vehiculos bien reparados, gran parte del impacto puede ser revertido. Por eso no vivimos una catástrofe con los precios del petróleo.


3) Sin embargo, el mercado minorista de bienes depende de pequeños márgenes, así que para las empresas es importante enfrentar el aumento en los precios de petróleo. Las principales tendencias son dos: utilización de mayor transporte intermodal (más barcos y trenes) y utilización de mayor cantidad de centros de distribución.


4) En el tema del transporte intermodal, dos cambios ya se están llevando a cabo. las empresas están llevando su producción cerca de la mayor cantidad de redes multimodales, para así diversificar el riesgo de los precios fluctuantes; también se están tratando de negociar contratos más largos con las transportadoras, crendo así un mercado de futuros del transporte.

5) En el tema de los centros de distribución, se está buscando que los tramos más largos sean los más llenos. Por ejemplo, el agua embotellada que antes se traía de la Isla Fiji hasta Los Angeles para de allí ser enviada por camión a la costa Este, se está llevando directamente en barco hasta Filadelfia a través del Canal de Panamá. El inventario en tránsito está creciendo, así como se disminuye el número de envíos por semana. Aumentar el inventario es quizás algo que va en contra de la teoría clásica de la logística, pero es algo que se está generando por esta nueva situación.El número de centros de distribución y de proveedores está aumentando, con el fin de diversificar el riesgo. Se están generando alianzas de transporte entre empresas competidoras que antes jamás hubieran considerado tal opción.

6) Se requiere un cambio de mentalidad en logística. La logística es un tema cuyos mayores desarrollos se dieron en los años ochentas, época en la que los precios del petróleo, y de la gasolina, eran una constante, situación que se mantuvo hasta hace unos 3 años, como se ve en la siguiente gráfica (de cuño propio) donde se ve la evolución del precio de la gasolina en Carolina del Norte.


Por eso, la teoría logística se basaba en el supuesto de precios bajos y no volátiles de la gasolina, situación usual en los 80´s. De allí parte la necesidad de repensar toda la teoría logística, empezando por la teoría de Just in Time, siguiendo con Lean manufacturing, las decisiones de outsourcing , y las de pricing y packing, todas basadas en la suposición de precios bajos, o al menos constantes, del petróleo.

7) Producción verde: las empresas cada vez más tienden a hablar en sus productos, de frente al cliente, de la huella ecológica. Las empresas de trasnporte, como UPS, calculan cuánta gasolina se consume en transportar cada paquete; Wal-Mart se ha comprometido a reducir en 25% sus emisiones de carbono; y los productos traen su huella ecológica impresa en la etiqueta. Así mismo, cada vez se toma más en cuenta el ciclo de vida del producto, incluyendo disposición del empaque y los residuos. Sin embargo, en opinión del Dr. Blanco, esta tendencia ecológica es más marketing que verdadero compromiso, y podría verse revertida en unos 3 o 4 años, si el precio del petróleo baja.

8) La globalización no se va a acabar, pero su panorama va a cambiar. No existe una tecnología de energía híbrida para el transporte de carga en los próximos 20 años, por lo que las empresas no están preparadas para ese cambio. Los camiones híbridos están hoy muy lejos del mercado, y la única tecnología madura es la que maneja los centros de distribución con energía solar y eólica, la cual ya está siendo implementada en muchas partes. Así mismo surgirán intermediarios de recursos energéticos, como los intermediarios financieros de hoy. Va a haber mayor regulación en el tema energético.

9) Oportunidades para Colombia. Es muy posible que la decisión de poner megaplantas en Asia sea repensada, y ello lleve a tener plantas medianas en varias partes del mundo, incluido, por supuesto, Latinoamérica. El acceso a transporte multimodal va a ser clave en esa redistribución. Aunque ello no sea rentable en el corto plazo, tener la producción cerca a mis clientes es una opción que es necesario tener para minimizar el riesgo.


lunes, 8 de septiembre de 2008

CLAIO 2008



Durante esta semana estaré en Cartagena (Colombia) para asistir al Congreso Latino Ibero-americano de Investigación de Operaciones (CLAIO 2008) donde presentaré la ponencia "Implicaciones del uso de distribuciones heavy-tailed en la prestación de servicios con prioridades percibidas" que escribí en conjunto con la que una vez fuera mi estudiante, Lina Rangel.

Les estaré contando si veo algo interesante que pueda ser medianamente bien explicado en un blog. Estoy esperando encontrarme con muchas ponencias cuyo nivel matemático está por encima de mis capacidades actuales, con el agravante de que sus autores suelen tender a obscurecerlo aun más bien sea por deseos de hacerse notar o por incapacidad de comunicarse con mayor claridad. Al leer los títulos pensé que la mayor parte del tiempo voy a estar en un diálogo de cuasi-sordomudos. Solo trato de tener fe en este dificil diálogo como posible germen de algunas gotas de ciencia que quizás en un futuro no tan lejano sean inspiradoras, útiles, o reveladoras para alguien en el mundo; en otras palabras, espero que este congreso no sirva sólo para engrosar las hojas de vida de los asistentes y hacer networking (bueno, al menos conoceré gente de toda latinoamérica metida en el dantesco mundo de la investigación de operaciones, me digo a mi mismo... y disfrutaré también de cartagena, dice el diablillo dentro mío).
Por ahora, echenle un ojo a las sesiones plenarias y diganme que opinan.... ¿va a estar bueno o no tanto?


Enseñanza práctica

"Reza al dios que quieras pero no dejes de remar hacia la orilla"

Comentario de qui prodest? en el blog fogonazos

sábado, 6 de septiembre de 2008

El arte de Linda Bergkvist

Copyright: Linda Bergkvist.
Vagando un poco por la red, me encontré con el espectacular trabajo de esta noruega. El ambiente medioeval y de cuento de hadas me pareció simplemente sobrecogedor.





Copyright: Linda Bergkvist.
De los mejores que he visto, en este tema de los bosques mágicos. Las imágenes hablan por sí solas.


Copyright: Linda Bergkvist.





Copyright: Linda Bergkvist.

jueves, 4 de septiembre de 2008

Bailando sobre el planeta tierra

¿Que pasa cuando alguien empieza a bailar repentinamente en cualquier lugar del mundo?? ¿Cambian las reacciones según el lugar?


Where the Hell is Matt? (2008) from Matthew Harding on Vimeo.

Matt Harding se ha vuelto un popular productor de estos videos... pero que hacemos si la alegría es contagiosa!!

martes, 2 de septiembre de 2008

El bikini

"Las estadísticas son como los bikinis: lo que sugieren es interesante, pero lo que esconden es vital"
Leído en Selecciones (versión en español de Reader´s Digest) en alguna de sus ediciones de 2.008.

domingo, 31 de agosto de 2008

Adivina tu sexo según las páginas web que visitas



¿qué hace la minería de datos web? Bueno, uno se puede dar una pequeña idea con ayuda de este juego que pretende adivinar tu sexo a partir de las páginas web que visitas. Allí informan que muchas empresas han mostrado interés en este tipo de aplicaciones, e inclusive Xerox tiene una patente al respecto.


El juego utiliza los 10.000 sitios más visitados de los Estados Unidos (que en muchos casos coinciden con los del mundo, al menos occidental) y las proporciones de hombres y mujeres que lo visitan; luego, a través del uso de un javascript (social history) recupera tus visitas a esos sitios. Después, utliza regresión logística para calcular la "probabilidad" de que alguien sea hombre (o mujer), o más bien, la tendencia que tiene la persona que usa determinado computador a visitar sitios preferidos por hombres o mujeres.

En la regresión logística se utilizan los denominados "odd ratios", que no tienen traducción al español, aunque a veces se les llame radios de probabilidad. Si alguna vez el lector ha visto apuestas en U.S.A, entenderá de que le hablo: allí se dice que las apuestas a favor de determinado equipo o jugador están 2 a 1, lo que de algún modo quiere decir que la gente piensa que es dos veces más probable que el jugador o equipo gane, lo que, finalmente, expresado en probabilidades, representa el 66.6% de probabilidad de victoria. Bueno, pues si se han visitado dos sitios, uno con "odd ratio" de 2 a 1 a favor de los hombres y otro con "odd ratio" de 3 a 1 para los hombres, entonces la probabilidad de ser considerado mujer es (1/(1+2*3))=1/7. Esta sencilla explicación evite los logaritmos y funciones de Euler que realmente están involucradas en ello, relacionados con el gráfico que presento en esta entrada.

¿Y yo, parezco hombre, o mujer?

A mi me resultó mal: dice que mi probabilidad de ser mujer es del 53%. Veamos por qué, en resultados de radio hombre-mujer:

Visito google: el radio es 0.98, es decir es más visitado por mujeres (ligeramente)

yahoo: 0.9, más visitado por mujeres

facebook: 0.83. más visitado por mujeres. La socialización no es el fuerte de los hombres.

blogger: 1.06. Hacer este blog ayuda a que piensen que soy hombre!!!

wired: definitivamente una página de hombres, con 1.41

amtrak: viajar en tren me va volviendo mujer: 0.75

cheapflights: viajar en avión también !me feminiza!!: 0.75

ncsu: la universidad en la que estoy tiene más mujeres, ¿¿pero donde?? 0.87

popular mechanics: !!ese si es para macho que se respete!! 1.74

wordreference: el diccionario también me hace un poquito más mujer: 0.94


En fin, es solo una burda aproximación. Lo interesante es lo fácil que resulta empezar a obtener datos personales con un poquito de estadística y la navegación en la web. Quizás yo no sea mujer, pero no estoy inclinado a visitar más sitios de mujeres o de hombres. Eso ya dice algo de mi, ¿ o no?. Y así con la edad, el ingreso, etc...
Y usted, querido lector, ¿qué resultado obtuvo? ¿con qué páginas? Espero su comentario.....



viernes, 29 de agosto de 2008

Edge: el pensamiento humano en la frontera

Hoy quiero recomendarles una página que conozco ya hace algún tiempo (está en ingles): La de la fundación Edge. Se trata de un club conformado por "algunas de las mentes más interesantes en el mundo" con el propósito de "promever el estudio y la discusión de temas intelectuales, filosóficos, artísticos y literarios, así como trabajr por el éxito intelectual y social de la sociedad"

Larry


Poquita cosa, ¿no?. Lo sorprendente es que hacen parte de Edge personas como Matt Ridley (autor de genoma y ¿qué nos hace humanos?), los creadores de google (sergey bring y larry page), marvin minsky (un conocido psicólogo cognitivo e investigador en inteligencia artificial), richard dawkins (el renombrado autor de El gen egoísta) y un etcétera de personajes interesantísimos que permiten dar una mirada a la vanguardia del pensamiento científico.




Sergey


Una de las secciones que más me gusta se llama "The world question center" y se trata de una pregunta que los miembros de Edge intentan pensar durante el año. Para el 2.008 la pregunta es: ¿sobré qué has cambiado de opinión y porqué?. Es fascinante ver a los científicos contando como cambiaron lo que creían sobre un tema específico. Las de los años pasados son: ¿sobre qué eres optimista? y ¿cuál es tu idea más peligrosa?. Esta última me encantó y sus respuestas me tuvieron atrapado durante todo el año.


Richard dawkins



En fin, quiero recomendar muchísimo esta página y para quienes no dominan el inglés lo suficiente, es probable que intente traducir en el futuro algunos apartes fascinantes... no lo garantizo, pero trataré.

jueves, 28 de agosto de 2008

Refranero geek....

Uno que me hizo reír mucho.....

No por mucho Megaram carga windows más temprano...

je,je,je....
y de postre: a programa pirateado no se le miran las fuentes.....

Para ver el refranero completo haz clic aquí.

martes, 5 de agosto de 2008

El premio Netflix




Desde Octubre del año 2.006 hay un premio de un millón de dólares esperando ser ganado. Se trata de The Netflix Prize, una iniciativa de la empresa de renta de películas Netflix.

Ellos tienen un sistema llamado Cinematch para predecir la calificación que una persona le va a dar a una película nueva basados en las calificaciones que anteriormente le dio a otras películas y en las calificaciones que otros usuarios le han dado a la película que va a ser calificada.

¿Listos para asumir el reto? Yo piqué el anzuelo e inscribí un "equipo" (por ahora solo).

Pues bien, la base de datos que le entregan a los competidores contiene 100 millones de registros y pesa 700 Megas (comprimida). Ni siquiera sé si seré capaz de obtener una estadística básica de esa información. Luego hay que hacer un pronóstico sobre 2.5 millones de registros y obtener un RMSE (desviación cuadrática media) un 10% superior a la obtenida por el sistema de Netflix. ¿cómo la ven? Así mismo hay un premio anual (50.000 dólares) si se logra un mejoramiento del 1% sobre el mejor resultado del año anterior.

Este concurso plantea retos interesantes. La información disponible de cada cliente es nula, solo se tienen las fechas de renta, la calificación dada, una fecha y el nombre de la película. Por lo visto está más orientada a torturar los datos hasta exprimirles una predicción que a crear un modelo explicativo de lo que ocurre. Se trata de una batalla entre aquellos que aun quieren explicarse el mundo y aquellos que solo quieren sacarle utilidad. Y estos últimos van ganando la partida por mucho. Y hace mucho. Sería interesante cuando menos lograr algún tipo de modelo combinado o tradeoff de esas dos tendencias.

Ya les contaré como avanzo (si es que logro siquiera avanzar). Así mismo cualquier idea es bienvenida, así como ofertas para participar en el grupo.

Por ahora se puede explorar la página de los ganadores del año pasado. Y hay que apurarse, pues el concurso este año cierra el primero de octubre!!

martes, 29 de julio de 2008

Personalización masiva (mass customization)

Uno de los temas con el que la minería y el análisis de datos están relacionados se conoce como personalización masiva (mass customization): la posibilidad de ofrecer servicios a la medida de los gustos y actividades de cada persona, pero haciéndolo de manera simultánea y rápida con millones y millones de personas. Yo sabía que ese era uno de los objetivos del análisis de datos Web (Web analytics), pero no me había dado cuenta hasta que punto ya era un concepto implementado en Estados Unidos.



Pongámoslo de esta manera: cuando visitaba una página web en Colombia (digamos, la revista Semana o facebook) la publicidad que me aparecía era de próposito general: compra de carros, apoyo a un senador en problemas, y productos de consumo masivo en general. Cualquier otra persona recibía los mismos anuncios.


Pero desde que estoy en Estados Unidos, las páginas web hacen suposiciones (muchas veces válidas) sobre quién soy, lo que hago y adónde vivo. ¿ejemplos?


1- Si leo noticias colombianas (el tiempo) o ciertas páginas colombianas, ahora me salen anuncios para conocer mujeres colombianas y casarme con ellas, cosa que no ocurría cuando estaba en Colombia.



2- En facebook obtengo propaganda dirigida a hombres mayores de 30 años para que reduzcan su abdomen, o avisos de financiación para estudiantes universitarios en la zona de Carolina del Norte.



3- El correo de gmail (uno de los más agresivos en este campo) me pone propaganda sobre: Raleigh, data mining y entrenamiento en SAS. En este caso supongo que tienen que usar por los menos el "asunto" de mi correo para averiguar sobre mis intereses, por lo que me siento profundamente invadido.



4- Llevando 25 días en USA (y quizás 18 desde que tengo mi celular)- recibí una llamada al celular en ESPAÑOL ofreciéndome seguro médico (que está a punto de vencerse) "por tan solo 2 dólares diarios para 5 personas". El único descache es que no tengo familia que dependa de mi acá. De resto, dispararon bien.



Cada día nos parecemos más en ciertos aspectos a la famosa pelicula de steven spielberg (minority report). UN día cualquiera, el aviso publicitario de la calle me mirará directamente a los ojos y me dirá: "hola jorge, ¿estás buscando un IPOD, verdad?"

lunes, 28 de julio de 2008

La explosión de nuestra vida social

"We have a drive to connect and socialize: this drive has now been accelerated and amplified as comprehensively as the steam engine amplified human strength two hundred and fifty years ago....the 'hyperconnectivity' engendered by these new (technological) toys is transforming the human landscape of social relations.".

- Mark Pesce (via http://www.edge.org/)
Traducción: Si no estás por lo menos en Facebook, Plaxo, Twitter, Flickr,Hi5,Myspace, (yahoo+msn+gmail)*messenger o no los actualizas.... estás jodido!!!!

miércoles, 23 de julio de 2008

Happy b-day

El lunes fue el cumpleaños de una compañera del Master, Doris. Por ello el viernes fuimos a comer italiano a un restaurante de Cary (el condado vecino de Raleigh). En esta ocasión se ha apuntado más gente, y ha estado un grupo de aproximadamente 12 personas allí (varios de ellos con su esposo o esposa). en esta foto vemos a Nilang (el hindú... se distingue?), a Brian (el muchacho sonriente) y a Shawn (al lado de brian). No recuerdo el nombre de mi otro compañero y su esposa.



Si bien se trataba de un restaurante italiano, el ambiente del "dinner" gringo se sentía en el aire. La costumbre de cantar el feliz cumpleaños se ha perdido. Ahora lo hace la gente del restaurante (la moda hace rato que está en bogotá) para evitarle el ridículo a la gente y proveer algo más estándar.
Para mi sorpresa, la esposa de Justin resultó ser de las filipinas. Así que se mezclaron aún más culturas. En esta foto los vemos con Doris.


Comimos delicioso. Sin embargo aún me falta mucho para entender todas las conversaciones que manejan entre ellos. Así mismo pienso que en ocasiones digo cosas que parecen no venir al caso. En fin, sigo intentando hablar para destrabar la lengua. Pero la verdad es que sin clases de inglés paralelas probablemente me haga entender, pero no llegue a tener un buen manejo del idioma.

Quien definitivamente está perdida en esta cultura es Cherry. Me generó una sensación de fragilidad ver cómo le costaba trabajo hablar, de qué manera se enredó con la cuenta y con la propina (no sabía cómo o cuánto dar, cuando le dieron una tabla de propinas lo pensó diez veces, y no supo expresar que necesitaba quedarse con la cuenta para sus registros personales) y la ternura que me generó verla abrir un paquete de dólares que probablemente venía sellado desde la China, esa plata que imagino fue celosamente guardada y ahorrada por ella o por algún familiar.



Ella misma nos dijo que era la primera vez que salía. Estoy con ella en el grupo de trabajo del verano y es la que vive más desconectada. No se suscribe al grupo, no está pendiente del comienzo de la reunión y le cuesta trabajo expresarse. Hasta la he visto dormida en mitad de la clase!!! Me he preocupado por ayudarla. Me imagino a mi mismo en Singapur, perdido en medio de una cultura extraña y sin mayor ayuda. Pobrecita!!! Ojalá logre salir adelante. O de pronto nos da una sorpresa. Vamos a ver.