TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Etiqueta: etl

Total 63 artículos

Tutorial para conocer Apache Nifi

Apache NiFi [https://nifi.apache.org/] es un sistema de flujo de datos basado en los conceptos de programación basada en flujo (FBP, del inglés Flow-Based Programming). Descargar Tutorial en español [https://stratebi.es/todobi/Feb21/Apache_NiFi.pdf] sobre Apache Nifi Admite gráficos dirigidos de enrutamiento de datos, transformación

Como extraer y trabajar con los datos de SAP

Cada vez es más importante, para la construcción de robustos y completos Data Lakes, así como de potentes Dashboards y sistemas de información analítica, integrar las fuentes de datos más importantes de las organizaciones Por ello, en este paper gratuito, os indicamos como podemos conectarnos a las diferentes aplicaciones de

Apache Beam: Introducción

Apache Beam es un modelo unificado de código abierto para definir pipelines de procesamiento de datos por lotes o de streaming. Actualmente, Apache Beam SDK tiene soporte para tres lenguajes de programación: Java, Python y Go. Los pipelines se programan usando uno de los SDKs mencionados anteriormente y luego se

Conociendo Hop ETL Open Source

Gracias al gran Matt Casters, buen amigo, creador de Kettle (Pentaho Data Integration), se encuentra embarcado en el desarrollo de una nueva herramienta ETL open Source, Hop (os contamos todas las novedades que ya incluye: Aquí puedes descargar el paper gratuito [http://stratebi.es/todobi/Ago20/Hop_ETL.pdf] en

Que es Apache Airflow

Apache Airflow [https://airflow.apache.org/] es una herramienta de orquestación que permite crear, programar y monitorizar flujos de trabajo mediante programación en Python. Estos flujos de trabajos se representan como Grafos Acíclicos Dirigidos o DAGs (del inglés Directed Acyclic Graph) de tareas / procesos, es decir grafos donde los datos