Kepler.gl es una herramienta web de código abierto desarrollada por Mapbox y Uber orientada a la visualización y análisis de datos espaciales sobre mapas interactivos. La herramienta permite construir fácilmente visualizaciones de datos sobre mapas interactivos que pueden ser integrados en plataformas de terceros como CARTO, así como en
Leer más...
Apache NiFi es un sistema de flujo de datos basado en los conceptos de programación basada en flujo (FBP, del inglés Flow-Based Programming). Descargar Tutorial en español sobre Apache NifiAdmite gráficos dirigidos de enrutamiento de datos, transformación y lógica de mediación del sistema. Apache NiFi tiene una interfaz de usuario
Leer más...
Probably you want to learn from the best specialists in Big Data, Machine Learning and Artificial Intelligence. Thanks to recent Big Things Conference you can learn and enjoy of this On Demand Training. Up to 50 lessons covered with about 35 hours lenght
Leer más...
Presto es un motor de consulta SQL distribuido de alto rendimiento para grandes datos. Su arquitectura permite a los usuarios consultar una variedad de fuentes de datos como Hadoop, AWS S3, Alluxio, MySQL, Cassandra, Kafka y MongoDB. Incluso se pueden consultar datos de múltiples fuentes de datos en una sola
Leer más...
Cada vez son más las iniciativas Smart City que se llevan a cabo, no solo en España, en donde hay iniciativas pioneras, si no a lo largo de todo el globo En este post, os hacemos un resumen de las principales tecnologías open source que se usan en estos proyectos,
Leer más...
Muy interesante también sería conocer sobre lo siguiente: Muy interesante la aportación de Datastack en donde se definen los skills necesarios para ser un Data Engineer en este 2020 Recursos y enlaces gratuitos para aprender a ser Data Engineer:Apache Beam: IntroducciónApache Beam es un modelo unificado de código abierto
Leer más...
Apache Airflow es una herramienta de orquestación que permite crear, programar y monitorizar flujos de trabajo mediante programación en Python. Estos flujos de trabajos se representan como Grafos Acíclicos Dirigidos o DAGs (del inglés Directed Acyclic Graph) de tareas / procesos, es decir grafos donde los datos fluyen en una sola
Leer más...
Apache Atlas es una herramienta open-source, con licencia Apache 2.0, para la gobernanza del dato la cual permite la integración con todo el ecosistema de datos de las empresas. Puedes descargarte un paper en español que te explica los conceptos y funcionalidades principales Atlas permite crear un almacén de
Leer más...
The use of Business Intelligence (BI) systems usually gets a very fast and interactive response when using dashboards, reports and detailed analytical queries. BI applications that meet this interactive processing requirement are known as OLAP (On-Line Analytical Processing) applications. However, when we work with data sources with Big Data
Leer más...