martes, 5 de agosto de 2008

El premio Netflix




Desde Octubre del año 2.006 hay un premio de un millón de dólares esperando ser ganado. Se trata de The Netflix Prize, una iniciativa de la empresa de renta de películas Netflix.

Ellos tienen un sistema llamado Cinematch para predecir la calificación que una persona le va a dar a una película nueva basados en las calificaciones que anteriormente le dio a otras películas y en las calificaciones que otros usuarios le han dado a la película que va a ser calificada.

¿Listos para asumir el reto? Yo piqué el anzuelo e inscribí un "equipo" (por ahora solo).

Pues bien, la base de datos que le entregan a los competidores contiene 100 millones de registros y pesa 700 Megas (comprimida). Ni siquiera sé si seré capaz de obtener una estadística básica de esa información. Luego hay que hacer un pronóstico sobre 2.5 millones de registros y obtener un RMSE (desviación cuadrática media) un 10% superior a la obtenida por el sistema de Netflix. ¿cómo la ven? Así mismo hay un premio anual (50.000 dólares) si se logra un mejoramiento del 1% sobre el mejor resultado del año anterior.

Este concurso plantea retos interesantes. La información disponible de cada cliente es nula, solo se tienen las fechas de renta, la calificación dada, una fecha y el nombre de la película. Por lo visto está más orientada a torturar los datos hasta exprimirles una predicción que a crear un modelo explicativo de lo que ocurre. Se trata de una batalla entre aquellos que aun quieren explicarse el mundo y aquellos que solo quieren sacarle utilidad. Y estos últimos van ganando la partida por mucho. Y hace mucho. Sería interesante cuando menos lograr algún tipo de modelo combinado o tradeoff de esas dos tendencias.

Ya les contaré como avanzo (si es que logro siquiera avanzar). Así mismo cualquier idea es bienvenida, así como ofertas para participar en el grupo.

Por ahora se puede explorar la página de los ganadores del año pasado. Y hay que apurarse, pues el concurso este año cierra el primero de octubre!!

No hay comentarios.: