Qué es una Arquitectura Medallón?

Emilio ago. 13, 2025 0

🚀 La 𝗔𝗿𝗾𝘂𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗮 𝗠𝗲𝗱𝗮𝗹𝗹𝗼𝗻 𝗲𝘀 𝘂𝗻 𝗽𝗮𝘁𝗿𝗼𝗻 𝗺𝗼𝗱𝗲𝗿𝗻𝗼 𝗱𝗲 𝗼𝗿𝗴𝗮𝗻𝗶𝘇𝗮𝗰𝗶𝗼𝗻 𝗱𝗲 𝗱𝗮𝘁𝗼𝘀 𝗲𝗻 𝗱𝗮𝘁𝗮 𝗹𝗮𝗸𝗲𝘀 (y lakehouses) que se basa en dividir los datos en capas sucesivas: Bronze, Silver y Gold. Cada una representa un nivel de refinamiento o procesamiento.

🥉 𝗖𝗮𝗽𝗮 𝗕𝗿𝗼𝗻𝘇𝗲 — "Guarda todo, ya lo limpiaremos"Qué contiene: Datos crudos, tal y como vienen del origen. CSVs feos, JSONs medio rotos, logs, Kafka, APIs, IoT... todo entra aquí.Consejo: Guarda TODO, pero con control de versiones y particionado. Usa formatos columnar como Parquet aunque sean datos sucios. ¡No seas salvaje!Tecnologías típicas: Apache Spark, Delta Lake, S3, ADLS, Kafka para ingestión...

🥈 𝗖𝗮𝗽𝗮 𝗦𝗶𝗹𝘃𝗲𝗿 — "Limpiamos lo que vale la pena"Qué contiene: Datos filtrados, validados, con tipos correctos y relaciones coherentes. Aquí ya puedes hacer joins sin que te explote el clúster.Consejo: Aplica control de calidad, deduplication, reglas de negocio simples. Usa notebooks para perfilado y PySpark o dbt para transformación.Pro tip: Añade trazabilidad con Data Lineage desde esta capa. Herramientas como DataHub o OpenMetadata, que te van a ser de gran ayuda

🥇 𝗖𝗮𝗽𝗮 𝗚𝗼𝗹𝗱 — "Esto ya es material de dashboard"Qué contiene: KPIs, métricas agregadas, datasets listos para Power BI, Tableau, LinceBI o APIs para apps.Consejo: Aquí sí, intenta optimizar con todo: índices, particiones, Z-Ordering si usas Delta Lake, compresión, cachés. Porque los usuarios finales no quieren esperar 12 minutos por su gráfico de ventas.Ejemplos: Ventas mensuales por región, churn rate, top productos.

⚙️ Algunas 𝗿𝗲𝗰𝗼𝗺𝗲𝗻𝗱𝗮𝗰𝗶𝗼𝗻𝗲𝘀 𝘆 𝘁𝗿𝘂𝗰𝗼𝘀:

- Usa Delta Lake o Iceberg para control de versiones y time travel entre capas. Es como tener Git para tus tablas.

- Orquesta con Apache Airflow o dbt Cloud: el control de dependencias entre capas evita "cascadas de desastre".

- Evita los infiernos de joins mal definidos: documenta tus claves primarias y foráneas aunque estés en un data lake.

- Testing de datos en Silver: frameworks como Great Expectations o SodaSQL son tus nuevas linternas anti-bugs.

- Security: controla accesos por capa. Bronze = casi nadie. Gold = analistas y negocio.

🔎 𝗧𝗲 𝗽𝘂𝗲𝗱𝗲 𝗶𝗻𝘁𝗲𝗿𝗲𝘀𝗮𝗿:

- Arquitecturas de Datos (Azure, AWS, Google y Open Source), comparativa muy útil!! https://lnkd.in/dP5wk2gp

- Big Book of Data Warehousing and BI: https://lnkd.in/deJKPYMe

- Arquitectura 'Data Lake Open Source': https://lnkd.in/dDf_kyj4

- Diccionario de Arquitecturas de Datos: https://lnkd.in/dhwFuXct

- 15 recursos para aprender gratis Microsoft Fabric: https://lnkd.in/dz9NscJh

LinceBI, la mejor solución Big Data Analytics basada en Open Source

Formación Data 2026 (más de 30 Cursos)

Checklist para elegir Arquitectura de Datos

Conceptos Fundamentales de Business Intelligence

Nuevo!! Data University

Qué es una Arquitectura Medallón?

Curso Fabric Gratuito

Top Open Source Data Integration Tools

Libro gratuito: Trucos de PowerBI (5)

12 aplicaciones gratuitas para crear Dashboards

Groot AI LinceBI: la nueva plataforma Analytics AI Open Source

25 Consejos de un veterano para los que empiezan en Data

Curso Databricks Gratuito

Curso Snowflake Gratuito

Deepseek AI integrations

Cómo convertirse en especialista IA si vienes del mundo Data y BI

Curso Fabric Gratuito

Qué es una Arquitectura Medallón?

Diccionario de Arquitectura de Datos

50 Consejos de Visualización

17 KPIs para medir un proyecto de Data Governance

Como funciona el nuevo Fabric Data Agent

𝗔𝗿𝗾𝘂𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗮𝘀 𝗱𝗲 𝗗𝗮𝘁𝗼𝘀 (𝗔𝘇𝘂𝗿𝗲, 𝗔W𝗦, 𝗚𝗼𝗼𝗴𝗹𝗲 𝘆 𝗢𝗽𝗲𝗻 𝗦𝗼𝘂𝗿𝗰𝗲), comparativa muy útil!!

50 sesgos cognitivos a considerar en Negocios

Cuales son y para que sirven las bases de datos de Grafos?

Diccionario de Arquitecturas de Datos

Comparativa Databrics vs Fabric vs Snowflake

Top Open Source Data Integration Tools

Como extraer y trabajar con los datos de SAP

Los 40 mejores libros de gestión, tecnología e innovación

30 Consejos y Buenas Prácticas para hacer un proyecto de Power BI con éxito

Cómo aplicar NoSQL en casos reales

Videotutorial: Trabajando con Python en Power BI