Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 8 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

Aprende gratis Analytics OLAP sobre Pentaho

La solución open source para business intelligence y Big Data sobre Pentaho, no te lo pierdas!!

19 jun. 2012

Caso de Estudio Business Intelligence: Bicing

Estamos realizando un pequeño caso de estudio. El objetivo es explorar y comparar diferentes opciones de visualización y cómo, visualizando un mismo set de datos se puede aportar más o menos información más o menos relevante. El Estudio ha sido realizado por nuestros compañeros Juanjo y Xavi. Un buen ejemplo de uso práctico del Business Intelligence.
Para ello nos vamos a basar en los datos de diferentes servicios de bicicletas públicas  que proporciona http://www.citybik.es/ y que hemos recopilado. Recogemos datos de diferentes ciudades pero para un primer estudio nos centraremos en el servicio del Bicing de Barcelona.

Tenemos un proceso ETL que carga los datos y que compone un datamart con las siguientes perspectivas de análisis y métricas a analizar:

  • Estación: Ubicación  de la estación 
  • Tiempo : El estado de las estaciones en los distintos momentos de tiempo
  • Anclajes disponibles: Número de anclajes libres para que los usuarios depositen su bicicleta
  • Bicicletas disponibles: Número de anclajes ocupados o bicicletas disponibles para que los usuarios las utilicen.
Ciertamente es un set de datos reducido y en parte esa es la gracia de este ejercicio. Extraerle el máximo de información a este set de datos reducido.
Cual va a ser el primer enfoque? Pues el claro y evidente:

Evolución de las bicicletas disponibles a lo largo del tiempo.

Pero al lo largo del tiempo ¿Que quiere decir?, la comparación de la media de bicicletas disponibles en diferentes días o la evolución durante un día? Cómo siempre: Lo quiero todo

Que nos permite ver esta vista? (puedes pulsar en la imagen superior para acceder)
  • Que los domingos la gente coge la bicicleta progresivamente a lo largo del día y poco a poco desde las 8 de la mañana los más madrugadores hasta la 1 del mediodía su uso se intensifica.

  • Pero los días de diario la gente coge la bici para ir a trabajar, o al menos eso parece. Fijaros en la "pronunciada" bajada de bicicletas disponibles desde las 7:30 hasta las 9:00 que empieza a recuperarse.... y por la tarde para volver escalonadamente. 

  • Si hacemos zoom en la gráfica que nos interesa: 


De hecho, si nos fijamos en una de las peores estaciones notamos un marcado acento en esta posibilidad:




Pero hay más puntos de vista interesantes:
  • Comparativas de uso entre días
    • Comparativas de uso de los diferentes días de la semana
    • Comparativas de uso entre 2 días análogos (Domingo vs Domingo por ejemplo)
  • Donde se usa más el bicing, en el centro o en la periferia.
    • Se usa la bici para ir al centro y/o para volver a casa?
    • Que zonas tienen más actividad? Laborales, ocio o comerciales?
  • Si se usa para ir a trabajar.... Que tipos de trabajo tienen esos usuarios? Van a zonas de oficinas o zonas de tiendas o zonas "industriales"?
Cómo veis hay mucha información que extraer. Si queréis ver los Cuadros de Mando Online, podéis acceder desde estos enlaces y de forma completa en nuestra Demo:

 





1 comentarios:

Toni Santos dijo...

Lo malo es que la inteligencia se queda en las herramientas.
Los responsables de Bicing deben conocer, o al menos tienen las herramientas, cual es la demanda por zonas.
Lo malo es que no hacen ningún caso y mientras unas zonas están siempre llenas de bicicletas, sistemáticamente otras siempre están vacías.
A parte de Inteligencia en los sistemas, hace falta inteligencia en los responsables.