{"id":40,"date":"2025-08-12T13:02:46","date_gmt":"2025-08-12T18:02:46","guid":{"rendered":"https:\/\/marybernalj.com\/blog\/?p=40"},"modified":"2025-11-09T13:04:55","modified_gmt":"2025-11-09T18:04:55","slug":"los-cimientos-invisibles","status":"publish","type":"post","link":"https:\/\/marybernalj.com\/blog\/index.php\/2025\/08\/12\/los-cimientos-invisibles\/","title":{"rendered":"Los cimientos invisibles"},"content":{"rendered":"\n<p>Componentes de una buena arquitectura de datos<\/p>\n\n\n\n<p><strong>Serie \u00b7 Data Architecture Stories<\/strong><br><em>De los datos al conocimiento: c\u00f3mo dise\u00f1ar infraestructuras con prop\u00f3sito<\/em><\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"4928\" height=\"3264\" src=\"https:\/\/marybernalj.com\/blog\/wp-content\/uploads\/2025\/11\/plains.jpg\" alt=\"\" class=\"wp-image-41\"\/><\/figure>\n\n\n\n<p>Imagina una ciudad y c\u00f3mo todo en ella se conecta. Las calles comunican barrios, las redes el\u00e9ctricas abastecen edificios y las tuber\u00edas invisibles sostienen el movimiento diario de millones de personas. Si las calles no est\u00e1n bien trazadas, el tr\u00e1fico colapsa, los servicios no llegan y nadie sabe por d\u00f3nde transitar. Si una de esas conexiones falla, el caos se propaga. Lo mismo ocurre con los datos: cuando los flujos no est\u00e1n bien dise\u00f1ados, las decisiones se congestionan porque los datos no fluyen con orden ni prop\u00f3sito. Como mencionamos en el post anterior, la arquitectura de datos es, en esencia, el plano urbano de la informaci\u00f3n. No se ve, pero lo sostiene todo.<\/p>\n\n\n\n<p>Toda arquitectura de datos moderna tiene sus propios barrios y carreteras. Las&nbsp;<strong>fuentes de datos<\/strong>&nbsp;son los lugares donde la informaci\u00f3n nace: registros de clientes, bases transaccionales, sensores, aplicaciones, formularios o incluso las hojas de c\u00e1lculo que alguien actualiza cada lunes. A partir de all\u00ed empieza el viaje. La siguiente etapa es la&nbsp;<strong>ingesta<\/strong>, ese proceso de transporte que mueve los datos desde sus or\u00edgenes hacia entornos m\u00e1s controlados. Puede hacerse en tiempo real o por lotes, pero lo importante est\u00e1 en la&nbsp;<strong>trazabilidad<\/strong>: saber de d\u00f3nde viene cada dato, qui\u00e9n lo transform\u00f3 y c\u00f3mo lleg\u00f3 a su destino.<\/p>\n\n\n\n<p>Despu\u00e9s est\u00e1 el&nbsp;<strong>almacenamiento<\/strong>, el equivalente a los edificios donde la informaci\u00f3n \u201cvive\u201d. Hay quienes eligen un&nbsp;<em>data warehouse<\/em>, donde todo est\u00e1 estructurado, limpio y ordenado como una biblioteca; otros prefieren un&nbsp;<em>data lake<\/em>, m\u00e1s flexible y amplio, donde se guardan los datos sin procesar. En la pr\u00e1ctica, las organizaciones modernas combinan ambos, creando lo que se conoce como una arquitectura h\u00edbrida o&nbsp;<em>data lakehouse<\/em>, que busca el equilibrio entre estructura y flexibilidad. (De esto hablaremos en un siguiente post).<\/p>\n\n\n\n<p>En el coraz\u00f3n de esta ciudad digital est\u00e1 el&nbsp;<strong>procesamiento<\/strong>, donde los datos se transforman para cobrar sentido: esa infraestructura que limpia, transforma y prepara la informaci\u00f3n para que sea \u00fatil. Aqu\u00ed la ingenier\u00eda se combina con la intenci\u00f3n: reglas de calidad, automatizaci\u00f3n y flujos orquestados garantizan que la informaci\u00f3n mantenga su coherencia. Es el sistema nervioso que convierte el caos en conocimiento. Finalmente, llega la&nbsp;<strong>capa de an\u00e1lisis y visualizaci\u00f3n<\/strong>, el punto donde todo el viaje cobra sentido y los datos encuentran su prop\u00f3sito. Es el espacio donde los tableros, los modelos y las proyecciones convierten la complejidad en decisiones comprensibles.<\/p>\n\n\n\n<p>Lo anterior constituye los componentes de una arquitectura de datos, en donde se reconoce que dise\u00f1arla es como construir una ciudad: puedes tener edificios espectaculares, pero si las tuber\u00edas est\u00e1n mal conectadas, nada fluye. Y esto es lo que ocurre muchas veces en las organizaciones: los datos se mueven sin direcci\u00f3n, saltando entre sistemas y equipos, sin un mapa que los gu\u00ede. Cada \u00e1rea almacena lo suyo, cada persona tiene su versi\u00f3n, y las decisiones se construyen sobre fragmentos.<\/p>\n\n\n\n<p>Una buena arquitectura de datos empieza por reconocer que el dato es un activo vivo, no un archivo est\u00e1tico. Necesita espacio para moverse, reglas para transformarse y guardianes que velen por su calidad. En t\u00e9rminos pr\u00e1cticos, una arquitectura s\u00f3lida combina tres capas fundamentales:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>La capa de integraci\u00f3n<\/strong>, donde se definen los flujos y conexiones entre fuentes.<\/li>\n\n\n\n<li><strong>La capa de almacenamiento<\/strong>, que organiza la informaci\u00f3n seg\u00fan su naturaleza y uso.<\/li>\n\n\n\n<li><strong>La capa de consumo<\/strong>, que entrega los datos transformados a quienes los necesitan para analizar o decidir.<\/li>\n<\/ol>\n\n\n\n<p>Hasta aqu\u00ed parece simple, pero la clave est\u00e1 en la coherencia entre ellas. Una integraci\u00f3n mal definida genera ruido; un almacenamiento desordenado multiplica errores; un consumo sin control produce decisiones basadas en imprecisiones.<\/p>\n\n\n\n<p>La arquitectura no se trata solo de herramientas o nubes: se trata de acuerdos. De definir qui\u00e9n tiene derecho a ver qu\u00e9, c\u00f3mo se valida lo que se guarda y c\u00f3mo se garantiza que los datos de hoy ser\u00e1n compatibles con los de ma\u00f1ana. Es tambi\u00e9n cultura. No hay tecnolog\u00eda que reemplace a una organizaci\u00f3n que no conversa sobre sus datos.<\/p>\n\n\n\n<p>Una empresa de servicios financieros descubri\u00f3 el valor de este enfoque cuando, tras tiempo de inconsistencias en sus indicadores, decidi\u00f3 revisar su arquitectura desde cero. Al mapear sus flujos, se identific\u00f3 que los datos de clientes llegaban por tres canales distintos, sin un proceso de validaci\u00f3n unificado. Las bases de ventas y atenci\u00f3n al cliente se actualizaban en momentos diferentes, y el sistema de reportes combinaba fuentes sin control de versiones. Cada \u00e1rea ten\u00eda \u201csu verdad\u201d.<\/p>\n\n\n\n<p>Estructuramos una nueva arquitectura basada en cinco pasos pr\u00e1cticos:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>Identificar fuentes y responsables.<\/strong>\u00a0Saber qui\u00e9n genera los datos y en qu\u00e9 formato es la base del orden.<\/li>\n\n\n\n<li><strong>Unificar la ingesta.<\/strong>\u00a0Estandarizar procesos de carga y trazabilidad, garantizando que los datos llegaran completos y auditables.<\/li>\n\n\n\n<li><strong>Centralizar el almacenamiento.<\/strong>\u00a0Combinar la estabilidad del\u00a0<em>warehouse<\/em>\u00a0con la flexibilidad del\u00a0<em>lake<\/em>\u00a0en una estructura h\u00edbrida.<\/li>\n\n\n\n<li><strong>Automatizar el procesamiento.<\/strong>\u00a0Incorporar reglas de calidad y limpieza continua.<\/li>\n\n\n\n<li><strong>Conectar la anal\u00edtica.<\/strong>\u00a0Definir una capa com\u00fan para reportes y modelos, evitando que cada \u00e1rea interpretara los datos a su manera.<\/li>\n<\/ol>\n\n\n\n<p>Al redise\u00f1ar su arquitectura, se comenz\u00f3 por documentar cada fuente, definir un flujo de ingesta com\u00fan y centralizar el almacenamiento en un repositorio h\u00edbrido. Luego se automatiz\u00f3 el procesamiento con reglas de calidad y se cre\u00f3 una capa anal\u00edtica compartida. En menos de seis meses, los indicadores dejaron de contradecirse y las reuniones de seguimiento se transformaron: por primera vez, todos hablaban el mismo idioma de datos. Los resultados fueron inmediatos: indicadores coherentes, decisiones m\u00e1s r\u00e1pidas y, sobre todo, confianza. Lo m\u00e1s interesante fue ver c\u00f3mo el concepto de arquitectura, que parec\u00eda lejano, se volvi\u00f3 tangible. Las reuniones ya no giraban en torno a \u201cqui\u00e9n tiene la cifra correcta\u201d, sino a \u201cqu\u00e9 historia nos est\u00e1n contando los datos\u201d.<\/p>\n\n\n\n<p>Esa es la diferencia entre una arquitectura construida a partir de herramientas y otra dise\u00f1ada a partir de prop\u00f3sito. Las herramientas por s\u00ed solas no garantizan coherencia; lo que lo hace es la conexi\u00f3n entre las piezas. Cuando los datos viajan con l\u00f3gica, las decisiones se vuelven predecibles, trazables y confiables.<\/p>\n\n\n\n<p>Un consejo pr\u00e1ctico para comenzar es crear un&nbsp;<strong>Data Blueprint<\/strong>, un mapa visual que describa c\u00f3mo tus datos fluyen desde las fuentes hasta las decisiones. Elaborarlo no requiere herramientas sofisticadas, sino claridad. Empieza por definir las&nbsp;<strong>fuentes<\/strong>&nbsp;(de d\u00f3nde viene la informaci\u00f3n), las&nbsp;<strong>rutas de ingesta<\/strong>&nbsp;(c\u00f3mo viaja), los&nbsp;<strong>repositorios<\/strong>&nbsp;(d\u00f3nde se almacena), los&nbsp;<strong>procesos<\/strong>&nbsp;(qu\u00e9 transformaciones aplica) y los&nbsp;<strong>puntos de consumo<\/strong>&nbsp;(qui\u00e9n usa los datos y para qu\u00e9). Al conectarlos, se obtiene un mapa que muestra no solo el flujo t\u00e9cnico, sino tambi\u00e9n la relaci\u00f3n entre las \u00e1reas y sus responsabilidades. Visualizarlo permite identificar redundancias, dependencias y oportunidades de mejora.<\/p>\n\n\n\n<p>Construir ese mapa es, en el fondo, un ejercicio de comprensi\u00f3n organizacional. Los datos no son l\u00edneas ni nodos; son historias que se cruzan. Y cuando se dibuja su recorrido, aparece algo m\u00e1s que un plano: aparece la l\u00f3gica que sostiene las decisiones.<\/p>\n\n\n\n<p>Ver el mapa de tus datos es el primer paso para entenderlos. Una arquitectura bien dise\u00f1ada no es un producto terminado, sino un lenguaje com\u00fan entre la tecnolog\u00eda y la estrategia. Porque al final, construir una arquitectura de datos no trata solo de flujos y sistemas: trata de conectar prop\u00f3sito, conocimiento y confianza en un mismo espacio.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<p><em>Este art\u00edculo hace parte de la serie\u00a0<strong>Data Architecture Stories<\/strong>, donde exploramos c\u00f3mo los datos se convierten en conocimiento a trav\u00e9s del dise\u00f1o, la cultura y la tecnolog\u00eda.<\/em><br><em>Pr\u00f3ximo post:\u00a0<strong>Del Data Warehouse al Data Lake\u2026 y m\u00e1s all\u00e1.<\/strong><\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Componentes de una buena arquitectura de datos Serie \u00b7 Data Architecture StoriesDe los datos al conocimiento: c\u00f3mo dise\u00f1ar infraestructuras con prop\u00f3sito Imagina una ciudad y c\u00f3mo todo en ella se conecta. Las calles comunican barrios, las redes el\u00e9ctricas abastecen edificios y las tuber\u00edas invisibles sostienen el movimiento diario de millones de personas. Si las calles [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[23,7,22],"class_list":["post-40","post","type-post","status-publish","format-standard","hentry","category-data-analitica","tag-arquitectura","tag-dataarchitecture","tag-datos"],"_links":{"self":[{"href":"https:\/\/marybernalj.com\/blog\/index.php\/wp-json\/wp\/v2\/posts\/40","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/marybernalj.com\/blog\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/marybernalj.com\/blog\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/marybernalj.com\/blog\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/marybernalj.com\/blog\/index.php\/wp-json\/wp\/v2\/comments?post=40"}],"version-history":[{"count":1,"href":"https:\/\/marybernalj.com\/blog\/index.php\/wp-json\/wp\/v2\/posts\/40\/revisions"}],"predecessor-version":[{"id":42,"href":"https:\/\/marybernalj.com\/blog\/index.php\/wp-json\/wp\/v2\/posts\/40\/revisions\/42"}],"wp:attachment":[{"href":"https:\/\/marybernalj.com\/blog\/index.php\/wp-json\/wp\/v2\/media?parent=40"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/marybernalj.com\/blog\/index.php\/wp-json\/wp\/v2\/categories?post=40"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/marybernalj.com\/blog\/index.php\/wp-json\/wp\/v2\/tags?post=40"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}