TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Cual es el roadmap para ser un Data Engineer

Muy interesante también sería conocer sobre lo siguiente:


Muy interesante la aportación de Datastack en donde se definen los skills necesarios para ser un Data Engineer en este 2020

Recursos y enlaces gratuitos para aprender a ser Data Engineer:

Apache Beam: Introducción
Apache Beam es un modelo unificado de código abierto para definir pipelines deprocesamiento de datos por lotes o de streaming. Actualmente, Apache Beam SDKtiene soporte para tres lenguajes de programación: Java, Python y Go. Los pipelines se programan usando uno de los SDKs mencionados anteriorme…
Gran recopilación de AI, Data Science y Machine Learning: Libros, Cheatsheets y Tutoriales
1. Getting Your First Data Science Job [http://stratebi.es/todobi/Sep20/document(6).pdf] (76 pag) 2. Step by Step Guide to Data Cleaning with Python (NumPy and Pandas)[http://stratebi.es/todobi/Sep20/document…
Power BI vol. II (trucos, buenas prácticas y novedades)
Ya está disponible el volumen II del ebook: ‘Power BI: trucos y buenasprácticas’. Además, este nuevo volumen incluye las novedades que se vanintroduciendo en la herramienta en estos últimos meses. Y, como el anterior,totalmente gratuito y sin necesidad de registrarte, simplemente descargatelo De…
Fundamentos de Visualización de Datos (libro gratuito)
Que interesante el libro que deja de forma gratuita en su versión online elautor del mismo, para todos los apasionados del Analytics y la Visualización El libro pretende ser una guía para hacer visualizaciones que reflejen conprecisión los datos, cuenten una historia y tengan un aspecto profesion…
Comparacion Amazon vs Azure vs Google vs Snowflake
Muy interesante esta comparativa que ha realizado Qlik, comparando las mejoressoluciones Cloud de Data Warehouse. En TodoBI llevamos ya tiempo comentandosobre muchas de ellas. Las empresas han empezado a apostar por los Data Warehouse en la nube, de formaque les permite crear modernos Data Lakes…
Introducción a Microsoft Azure Synapse
Nuestros compañeros de Stratebi [https://www.stratebi.com/power-bi], que sonPartners Certificados de Microsoft, nos hacen una Introducción a una tecnologíaque, estamos seguros, está revolucionando el mundo del Business Intelligence,Data Warehouse y Data Lakes: Microsoft Synapse[https://azure.microsoft.com/es-es/services/synapse-analytics/…
Manual de Introduccion a Knime
KNIME [https://www.knime.com/] es una plataforma open source para analítica deBusiness Intelligence, Machine Learning y ETL mediante un simple proceso de dragand drop (arrastrar y soltar). KNIME proporciona una plataforma con una interfazgráfica de usuario donde se pueden crear flujos de trabajo …
Comparativa de las mejores soluciones de Data Warehouse
Cómo elegir una herramienta de Data WarehouseSeleccionar herramientas de Data Warehouse es de las tareas más importantespuesto que la complejidad y las variables de estas herramientas son enormes. Esto se debe en parte a que el campo de la analítica de datos está viendo unainversión explosiva, …
Como integrar Power BI con Microsoft Dynamics
Microsoft Dynamics es un conjunto de aplicaciones ERP y CRM para laadministración de empresas. Estas aplicaciones se pueden dividir en dos grupos,atendiendo al tipo de sistema que son: Aplicaciones CRM: · Microsoft Dynamics CRM: es un software de Microsoft orientado a las relacionesde la empres…
Data Governance: Comparacion Azure y Talend
Introduccion a spaCy (Industrial-Strength Natural Language Processing en Python)
spaCy [https://spacy.io/] es una librería de Python que permite construiraplicaciones de procesamiento de lenguaje natural (NLP). spaCy proporcionamodelos preentrenados de diferentes lenguajes, lo cual junto a una sintaxisclara hace que sea ideal para principiantes en el campo de la NLP. Además…
Aplicacion IoT datos meteorologicos: PowerBI, Node.js, Talend y Vertica
En esta aplicación basada en una implementación real, hacemos uso de diferentestecnologías como Node.js [https://nodejs.org/es/], Talend[https://es.talend.com/products/data-integration/…
Alternativas para crear Dashboards con Python
En la mayoría de ocasiones, después de hacer un cálculo, queremos mostrar deforma sencilla algún resultado de tal forma que cualquiera lo pueda visualizar. Sin embargo, a veces el resultado no es algo sencillo y queremos proporcionarherramientas para que otros puedan “juguetear” los datos y que …
Que es Apache Airflow
Apache Airflow [https://airflow.apache.org/] es una herramienta de orquestaciónque permite crear, programar y monitorizar flujos de trabajo medianteprogramación en Python. Estos flujos de trabajos se representan como Grafos Acíclicos Dirigidos o DAGs(del inglés Directed Acyclic Graph) de tareas…
Guía de Introducción a Azure Machine Learning
Azure ML [https://azure.microsoft.com/es-es/free/machine-learning/] es unservicio que está basado en la plataforma “Microsoft Azure[https://azure.microsoft.com/es-es/]”. Azure ML, al igual que el resto de lasaplicaciones de “Microsoft Azure”, está basado en la nube, por lo que no esnecesario nin…
Como transformar y convertir a tu empresa en ‘Data-driven’ orientada al dato
Si te has encontrado con estos problemas en tu organización, esta presentación[https://www.slideshare.net/zanorte/9-problemas-en-proyectos-data-analytics] teserá de gran utilidad:
Paper: Apache Atlas para tus procesos de datos
Apache Atlas [https://atlas.apache.org/2.0.0/index.html] es una herramienta open-source, con licencia Apache 2.0, para la gobernanza del dato la cualpermite la integración con todo el ecosistema de datos de las empresas. Puedes descargarte un paper en español[http://stratebi.es/todobi/May20/Apache_Atlas.pdf…
Workshop de Sports Analytics (Webinar disponible)
Hace unas pocas semanas, más de 300 apasionados del deporte, del futbol sobretodo, y de los datos, se reunieron en el Workshop práctico de algo más de doshoras que realizaron los compañeros de Stratebi[https://www.stratebi.com/sports-analytics] Os dejamos el enlace en donde podéis tener acceso a…
Free whitepaper ‘Big Data Analytics benchmark’ for fastest Business Intelligence performance
The use of Business Intelligence (BI) systems usually gets a very fast andinteractive response when using dashboards, reports and detailed analyticalqueries. BI applications that meet this interactive processing requirement areknown as OLAP (On-Line Analytical Processing) applications.However, w…
Que algoritmo de Machine Learning elegir para cada problema?
Dado que existen muchos algoritmos, como hemos venido contando ultimamente[/tag/machine%20learning], os vamos a dar/unas pistas para ayudaros:1. Cuando usar Machine LearningLo primero que tenemos que tener en cuenta es que, aunque hablar y usar MachineLearning es una tendencia y es ‘cool’, deb…
Glosario de Inteligencia Artificial (AI)
Red neuronal artificial (RNA)Un algoritmo que intenta imitar al cerebro humano, con capas de “neuronas”conectadas que se envían información entre sí.Algoritmos de caja negraCuando el proceso de toma de decisiones o la salida de un algoritmo no puede serfácilmente explicado por el ordenador o el…
Business Intelligence Tools ‘White Paper’ comparison
Great paper you can download[http://www.stratebi.es/todobi/Sep18/CommercialTools_TVCG_Journal_FINAL.pdf],where you can compare several Business Intelligence tools[http://www.stratebi.es/todobi/Sep18/CommercialTools_TVCG_Journal_FINAL.pdf…
Herramientas Business Intelligence Open Source
En este post os dejamos un listado que recoge algunas de las principalesherramientas business intelligence open source que han destacado este año en elmercado. Si queréis profundizar más, no olvidéis echarle un vistazo a estacompleta comparativa de herramientas business intelligence[/comparativa…
Que es Metatron Open Source Dashboards
1. IntroducciónMetatron Discovery es una plataforma end-to-end de análisis de datosdesarrollada por la empresa de Corea del Sur SK Telecom. Su propósito es el deuna herramienta BI tradicional, es decir, cargar, explorar y analizar grandesvolúmenes de datos y representarlos visualmente en cuadro…
Industrial Internet of Things (IIoT)
Cada vez es más frecuente la explotación analítica y la toma de decisiones en elámbito del Internet of Things, Industria 4.0 y para Smart Cities, Telemetría,etc... un nuevo mundo de posibilidades, que además se puede hacer contecnologías Open Source. Aquí os dejamos información y una presentación…
69 claves para conocer Big Data
Presentación sencilla, útil y muy clarificadora... Quizás te interese también: Big Data para Dummies [/big-data-para-dummies/] y 53Claves para conocer Machine Learning [/las-53-claves-para-conocer-machine/]
Integracion SAP - PowerBI
Actualmente, en buena parte de las mayores organizaciones del mundo usan tantoSAP como PowerBI, de ahí, que se haga especialmente útil, la posibilidad deexplotar analíticamente toda la informacion de SAP, máxime si está almacenada enmodelos orientados al análisis como SAP A continuación, os incl…
Introducción, análisis y uso de Neo4J
Neo4j [https://neo4j.com/] es un software libre de Base base de datos orientadaa grafos, creada por Neo Technology Inc e implementado en Java. Neo4j almacenadatos estructurados en grafos en lugar de en tablas, es decir,la información sealmacena de forma relacionada formando un grafo dirigido ent…
Algunos campos de actuación de Machine Learning (Vertica, R, Python)
En este documento estudiaremos posibles campos de actuación de algunosalgoritmos de Machine Learning (ML). Buscamos estudiar la implementación de losalgoritmos en Vertica y la librería Vertica-ML-Python con casos sencillos ycomprobamos su rendimiento con las implementaciones en Python y R. Enume…
Herramientas Change Data Capture (CDC)
En bases de datos, las CDC (Change Data Capture) son patrones de diseño softwareque se emplean para capturar cambios que se producen en los datos y propagarlosa clientes intermedios. Normalmente se emplean en entornos de data-warehouse,para preservar el estado de los datos a lo largo del tiempo, …
Una introduccion a Dataiku
Dataiku [https://www.dataiku.com/] es una herramienta colaborativa detratamiento de datos donde pueden trabajar conjuntamente científicos de datos,ingenieros de datos y analistas de datos. A su vez tiene paneles dedicados a lamonitorización de los equipos para ayudar a los gerentes de proyecto a …
Top Jupyter Notebooks
En esta página tenéis una colección de Jupyter [https://jupyter.org/]/IPythonnotebooks destacables. No dudéis en añadir Table of Contents 1. Entire books or other large collections of notebooks on a topic [https://github.com/jupyter/jupyter/wiki/A-gallery-of-interesting-Jupyter-Notebooks#entire-books-or-other-large-collections-of-notebooks-on-a-topic…
Free Machine Learning Tutorial – All the Essential Concepts in Single Tutorial
Tutorial de aprendizaje de Machine Learning para principiantes. Como es untutorial de iniciación es bastante sencillo, pero también completo. Ver Tutorial [https://data-flair.training/blogs/machine-learning-tutorial/] ¿Alguna vez has ido a hacer la compra? ¿Qué haces antes de ir al mercado?Siemp…
Big Data Dictionary: From A to Z
Association rule mining[http://blog.programmableweb.com/2014/02/10/swiftiq-released-innovative-data-mining-api/]B – Bayes belief networks[http://library.bayesia.com/display/FAQ/Bayesian+Belief+Network+Definition…
Big Data para Dummies
Hace unas semanas, nuestro compañero Emilio Arias de Stratebi[http://www.stratebi.com/]realizó un Webinar de ′ Introducción a Big Data. BigData para Dummies’ para todos aquellos interesados que no tienen una experienciatécnica previa amplia.Es decir, la introducción perfecta para responsables d…
How to create an open source Big Data Stack
Big Data StackSub second interactive queries, machine learning, real time processing and datavisualizationNowadays there is a lot technology that enables Big Data Processing. However,choosing the right tools for each scenario and having the know-how to use thesetools properly, are very common p…
Tutorial y Demo: trabajando con Grafana
Ya tenemos demo Grafana con datos públicos de ocupación del Ayuntamiento deMálaga recogidos mediante API.Adjuntamos Tutorial para descargar[http://www.stratebi.es/todobi/Jun19/Trabajando_con_Grafana.pdf] El propósito de este documento es recoger el proceso de creación de un cuadro demandos que…