martes, 30 de septiembre de 2008

NETFLIX PRIZE: primeros archivos

!Ya he logrado enviar al premio tres archivos de prueba exitosamente a este premio! Sin embargo, los resultados están lejos de alcanzar el nivel necesario. Como recordarán, debo pronosticar más o menos 2 millones de calificaciones (de 1 a 5) hechas por usuarios a películas rentadas en Netflix. La vara para ser medido es el RMSE, conocido como la raíz del error cuadrático medio (simplemente la raíz cuadrada del promedio de los "descaches" o errores de predicción al cuadrado). Pues bien, multiplicando simplemente la media de calificaciones de la película por la media de calificaciones del usuario obtengo RMSE=1.0157. Para igualar lo que actualmente hace el sistema de Netflix, debo lograr RMSE=0.9514; para ganar 50.000 dólares antes del primero de Octubre debo lograr RMSE<=0.8625; y para ganar el premio mayor, RMSE<=0.8563 en cualquier momento y no ser superado por nadie durante un mes.

Algunas cosas sencillas que he hecho han bajado mi RMSE a 1.0149. A ese paso todavía estoy lejos... pero ahora si voy a empezar a realizar acciones más intensivas. Mantendré actualizado este blog con mi (más que probable) tortuoso camino hacia mi primer millón... =). Cualquier idea es bienvenida....

No hay comentarios.: