Gobernar no es catalogar: entender el mercado antes de empezar una iniciativa de Gobierno del Dato & IA
Gobernar no es catalogar
Entender el mercado antes de empezar una iniciativa de Gobierno de Datos & IA
En los últimos años, el mercado del Data Management ha cambiado de forma significativa. No es casualidad que Gartner dejase de publicar el histórico Magic Quadrant for Metadata Management Solutions para evolucionar hacia nuevas categorías como Active Metadata Management y, más recientemente, el Magic Quadrant for Data & Analytics Governance Platforms.
Este movimiento no es simplemente terminológico. Refleja una realidad del mercado: no todas las soluciones que gestionan metadatos o catalogan activos están diseñadas para gobernar datos e IA desde un punto de vista organizativo.
Hoy conviven, al menos, dos grandes bloques tecnológicos:
Por un lado, las Plataformas de Datos & IA que incluyen capacidades de gobierno técnico dentro de su propio stack (Microsoft Fabric y Purview, AWS Glue Catalog, Lake Formation, DataZone y Sagemaker, Google Dataplex, Unity Catalog en Databricks, Snowflake Horizon, IBM, SAP, Oracle, Cloudera, Denodo, Qlik-Talend, Stratio, entre otros).
Por otro lado, las Plataformas de Gobierno de Datos & IA independientes y transversales, reconocidas como categoría propia por Gartner, donde se sitúan soluciones como Collibra, Informatica, Atlan, Alation, Erwin, DataGalaxy… y Anjana Data Platform.
Para una organización que está empezando, entender esta diferenciación es crítico. Porque el error más habitual no es elegir una herramienta equivocada. Es no entender qué problema está resolviendo realmente cada tipo de solución.
Catalogar vs Gobernar: una diferencia estructural
Muchas organizaciones comienzan su camino activando el catálogo técnico que ya viene incluido en su plataforma cloud o analítica. Es lógico: la funcionalidad está disponible, la integración es sencilla y el valor es inmediato.
Herramientas como Microsoft Purview, AWS Glue Catalog, Google Dataplex, Unity Catalog, Snowflake Horizon o Cloudera Catalog permiten descubrir activos técnicos automáticamente, extraer metadatos estructurales, inferir linaje técnico y clasificar información sensible (con algunas limitaciones, por supuesto). Para equipos de arquitectura y data engineering, esto es extremadamente útil.
Pero catalogar no es gobernar.
Catalogar significa describir lo que existe. Gobernar significa decidir cómo debe existir, quién es responsable, bajo qué reglas se construye y cómo se consume.
Un catálogo responde a la pregunta:
¿Qué activos técnicos tengo y cómo están conectados?
Una plataforma de gobierno organizativo responde a preguntas más complejas:
¿Quién es el Data Owner?
¿Qué políticas aplican?
¿Qué contrato regula su consumo?
¿Qué impacto tiene un cambio?
¿Cómo se integra esto en la gestión de la demanda y en los procesos de negocio?
Desde nuestra experiencia en proyectos reales —incluyendo organizaciones que han tenido que rediseñar su enfoque tras varios meses de implantación— la confusión entre ambos conceptos suele generar iniciativas con mucha visibilidad técnica y poco control organizativo.
Gobierno técnico vs Gobierno funcional
Los catálogos nativos de las plataformas cloud y de datos cumplen una función clara: proporcionar gobierno técnico dentro de su propio ecosistema.
- Purview y OneLake «gobiernan» Azure y Fabric.
- Unity Catalog «gobierna» Databricks.
- Horizon «gobierna» Snowflake.
- Cloudera SDX «gobierna» Cloudera.
- Dataplex «gobierna» GCP.
- Glue Catalog, Lake Formation, DataZone y Sagemaker «gobiernan» AWS.
Su integración es profunda, su automatización es potente y su alineación con la arquitectura subyacente es natural. Son piezas muy valiosas.
Pero su alcance está limitado al ámbito tecnológico que controlan.
El gobierno funcional, en cambio, tiene que ver con cómo la organización estructura dominios, responsabilidades, políticas, contratos de datos, workflows de aprobación y modelos operativos. Tiene que ver con cómo se gestiona el ciclo de vida completo del dato y de los activos de IA desde una perspectiva organizativa, no solo técnica.
Aquí es donde aparecen las Plataformas de Gobierno de Datos & IA reconocidas por Gartner como categoría diferenciada. Estas plataformas —Collibra, Informatica, Atlan, Alation, entre otras— nacen con vocación transversal, no como extensión de una única arquitectura tecnológica.
Anjana no compite con el gobierno técnico nativo de las Plataformas de Datos & IA. Lo eleva a una capa superior de gobierno integral, transversal, agnóstico y orientado al negocio.
No sustituye el gobierno técnico. Lo complementa y lo integra en un marco organizativo más amplio.
Gobierno pasivo y reactivo vs Gobierno proactivo y preventivo
Existe otra distinción menos visible pero igualmente crítica.
Un modelo basado exclusivamente en catálogo técnico tiende a ser reactivo. Descubre activos una vez construidos. Detecta cambios cuando ya han ocurrido. Clasifica información después de su creación.
Es un gobierno posterior al hecho.
Un modelo de gobierno proactivo integra el gobierno en el diseño. Declara activos antes de su construcción. Define reglas y responsabilidades antes de su puesta en producción. Evalúa impactos antes de ejecutar cambios.
En organizaciones que aspiran a modelos como Data Mesh y DataOps, ecosistemas híbridos y federados o gobierno de agentes de IA avanzado, el enfoque reactivo resulta insuficiente. No porque el catálogo técnico no sea útil, sino porque llega tarde para influir en decisiones críticas.
En nuestra experiencia, las iniciativas más sólidas son aquellas que combinan visibilidad técnica automatizada con operativización organizativa preventiva.
Linaje técnico inferido vs Linaje declarativo
El linaje es uno de los argumentos más utilizados en el mercado.
Las plataformas técnicas tienen ciertas capacidades para inferir linaje técnico automáticamente (OJO, la magia negra no existe y aquí hay mucho humo en el mercado) a partir de pipelines, consultas y transformaciones. Esta capacidad es valiosa para entender dependencias técnicas y analizar impactos.
Pero el linaje técnico inferido no captura relaciones organizativas ni contractuales. No representa responsabilidades, acuerdos de compartición, políticas aprobadas o dependencias entre productos de información desde un punto de vista funcional.
El linaje declarativo, en cambio, permite modelar explícitamente estas relaciones. Representa cómo los activos están conectados desde la perspectiva de gobierno, no solo desde la transformación técnica.
Ambos enfoques no son excluyentes. De hecho, deben convivir.
El linaje técnico vive donde debe vivir: en la capa técnica.
El linaje declarativo aporta una capa de significado organizativo que el inferido no puede ofrecer.
Cuando se diseñan arquitecturas híbridas bien pensadas, ambos flujos se integran bidireccionalmente bajo principios de Active Metadata.
Gobierno basado en control vs Gobierno flexible
Algunas organizaciones interpretan el gobierno como un mecanismo de control centralizado rígido. En la práctica, esto genera resistencia, fricción y ralentización.
Pero tampoco funciona el extremo opuesto: el gobierno puramente observacional que solo documenta lo que ocurre.
Un gobierno flexible combina estructura y autonomía. Permite modelos centralizados, federados o híbridos. Se adapta a grupos empresariales con múltiples organizaciones. Puede coexistir en entornos multi-cloud y on-premise.
En arquitecturas reales —con Azure, AWS, GCP, Snowflake, Databricks, Oracle, SQL Server, Cloudera, Denodo y múltiples combinaciones— la agnosticidad no es un lujo, es una necesidad.
Evitar el lock-in no es solo una cuestión tecnológica. Es también conceptual.
Si el modelo de gobierno está diseñado alrededor de una única plataforma técnica, cualquier cambio estratégico futuro puede obligar a rediseñar el gobierno desde cero.
Anticiparse al coste y a la madurez
El modelo de coste es otro elemento que rara vez se analiza en profundidad al inicio.
Algunas soluciones técnicas operan bajo modelos de consumo continuo: escaneos recurrentes, perfilados automáticos, clasificación dinámica, detección de cambios. En fases iniciales el impacto puede parecer reducido. Con el crecimiento del ecosistema, puede convertirse en un factor estructural.
Pero más allá del coste, está la madurez organizativa. Un modelo excesivamente técnico puede funcionar en organizaciones centradas en ingeniería. Resulta insuficiente cuando el gobierno debe involucrar negocio, riesgos, cumplimiento normativo o gobierno de IA.
Anticiparse a estos factores es una cuestión de diseño estratégico, no de configuración técnica.
Defender el escenario híbrido desde el inicio
Después de años trabajando con organizaciones reales —y viendo tanto implementaciones exitosas como rectificaciones complejas— nuestra conclusión es clara:
El debate no es “Purview o Anjana”.
No es “Unity Catalog o plataforma de gobierno”.
No es “catálogo nativo u open-source”.
El debate es arquitectura y visión.
Lo razonable es aprovechar el gobierno técnico nativo allí donde aporta valor —descubrimiento, clasificación, linaje técnico profundo— y elevar esa información a una capa superior de gobierno organizativo, transversal y agnóstico.
Ese enfoque híbrido:
- Evita el lock-in conceptual y tecnológico.
- Permite escalar a medida que crece la madurez.
- Integra gobierno técnico y funcional.
- Facilita el paso del gobierno reactivo al proactivo.
- Hace sostenible el modelo a medio y largo plazo.
Gobierno del Dato & Gobierno de la IA
Gobernar datos y gobernar IA no es exactamente lo mismo. Pero tampoco pueden abordarse como mundos separados.
El gobierno del dato tradicionalmente se ha centrado en aspectos como calidad, definición semántica, responsabilidades, trazabilidad, cumplimiento normativo y control de accesos. Incluso cuando se ha limitado al plano técnico, su foco ha estado en la gestión del ciclo de vida de los activos estructurados: tablas, pipelines, informes, datasets.
El gobierno de la IA introduce nuevas dimensiones:
-
- Versionado de modelos.
- Trazabilidad de datasets de entrenamiento.
- Explicabilidad.
- Evaluación de riesgos.
- Impacto ético y regulatorio.
- Supervisión continua del comportamiento.
- Control de agentes autónomos.
-
Gestión de prompts, embeddings y fuentes de conocimiento en entornos generativos.
Las piezas de gobierno técnico nativas de las plataformas suelen extender sus capacidades hacia la IA desde una perspectiva igualmente técnica. Por ejemplo, integrando metadatos de modelos, capturando información sobre entrenamientos o mostrando dependencias técnicas entre datasets y modelos dentro del mismo ecosistema tecnológico.
Esto es útil, pero insuficiente.
Porque gobernar IA no es solo registrar que un modelo existe o saber con qué dataset fue entrenado. Es establecer quién lo aprobó, bajo qué criterios, con qué finalidad, con qué límites de uso, bajo qué política de riesgo y qué mecanismos de supervisión aplican.
Es pasar del metadato técnico al contexto organizativo.
Furthermore, un modelo, un sistema o un agente de IA no existe en el vacío. Depende de datos de entrenamiento, definiciones semánticas, reglas de calidad, políticas de acceso, dominios responsables, contratos de uso, etc.
Si el gobierno del dato y el gobierno de la IA están gestionados en plataformas diferentes, con modelos organizativos distintos o sin integración real, aparecen problemas estructurales. Aparecen las inconsistencias en responsabilidades, la falta de trazabilidad end-to-end, las dificultades para evaluar impacto regulatorio, la duplicidad de workflows, la falta de alineamiento entre negocio y tecnología y el riesgo de que la IA consuma datos no aprobados o no certificados.
En un entorno donde la regulación sobre IA está creciendo y donde los agentes autónomos empiezan a tomar decisiones operativas, esta desconexión no es solo una ineficiencia. Es un riesgo estratégico.
Gobernar datos sin gobernar la IA deja abierta la puerta a decisiones automatizadas sin control organizativo.
Gobernar IA sin integrar el gobierno del dato genera modelos técnicamente trazables pero organizativamente opacos.
Cuando el gobierno del dato y el gobierno de la IA conviven en una misma Plataforma de Gobierno de Datos & IA, el enfoque cambia radicalmente.
En un modelo integrado:
-
Un modelo de IA puede declararse como producto de información.
-
Se asocia a un dominio responsable.
-
Se vincula formalmente a los datasets aprobados que lo alimentan.
-
Se somete a workflows de aprobación antes de su despliegue.
-
Se le asignan contratos de uso específicos.
-
Se conecta con políticas regulatorias.
-
Se integra en el linaje declarativo junto con los activos de datos.
Esto permite tener una visión completa, desde el dato bruto hasta la decisión automatizada. No es solo una cuestión técnica. Es una cuestión de coherencia organizativa.
Además, la integración aporta tres beneficios estratégicos clave:
- Trazabilidad end-to-end real: Desde el dato fuente hasta el modelo y desde el modelo hasta el proceso de negocio que lo consume.
- Responsabilidad clara: Cada activo —dato o modelo— tiene un dominio y roles asociados dentro de un mismo marco organizativo.
- Gobernanza preparada para agentes autónomos: En un mundo donde los consumidores de conocimiento ya no son solo personas sino también agentes de IA, tener una capa de gobierno unificada permite controlar qué conocimiento se expone, bajo qué condiciones y con qué contratos.
Las plataformas técnicas pueden registrar modelos y datasets dentro de su ecosistema. Pero no están diseñadas para articular un modelo organizativo transversal que conecte datos, modelos, contratos, responsabilidades y procesos.
Una Plataforma de Gobierno de Datos & IA moderna permite integrar ambos mundos bajo una misma lógica de gobierno.
No se trata de añadir “gobierno de IA” como un módulo adicional. Se trata de reconocer que los modelos de IA son activos de información gobernados y que deben formar parte del mismo sistema de responsabilidades, políticas y contratos que los datos.
Aquí vuelve a cobrar sentido el mensaje central: Anjana no compite con el gobierno técnico nativo de las Plataformas de Datos & IA. Lo eleva a una capa superior de gobierno integral, transversal, agnóstico y orientado al negocio.
Y en el contexto actual, esa integración entre gobierno del dato y gobierno de la IA no es opcional. Es el único enfoque coherente para organizaciones que quieren escalar su uso de la inteligencia artificial sin asumir riesgos innecesarios.
Del Data Catalog al Knowledge Marketplace: la verdadera ventaja competitiva
Hasta aquí hemos hablado de visibilidad, control y arquitectura. Pero hay una pregunta aún más estratégica que pocas organizaciones se hacen al inicio:
¿Para qué queremos gobernar realmente?
La respuesta no debería ser únicamente cumplir normativa o tener el inventario ordenado. El verdadero objetivo es convertir los datos y la IA en conocimiento reutilizable, compartible y explotable de forma controlada.
Si el gobierno del dato y el gobierno de la IA están integrados en una misma lógica organizativa, ocurre algo muy interesante. La conversación deja de ser puramente defensiva —control, cumplimiento, mitigación de riesgos— y pasa a ser estratégica.
Porque cuando datos y modelos están declarados formalmente como activos gobernados, asociados a dominios y responsables, vinculados mediante linaje declarativo, sujetos a workflows y políticas, regulados mediante contratos de uso y son auditables en todo su ciclo de vida, entonces la organización no solo controla. También puede activar el conocimiento de forma segura y escalable.
Y es en ese punto donde aparece el siguiente nivel evolutivo. No hablamos ya de catálogo. No hablamos solo de gobierno. Hablamos de Knowledge Marketplace.
Durante años, el mercado ha hablado de Data Marketplace como repositorio de datasets. Pero esa visión es limitada. Un Knowledge Marketplace no publica solo tablas; publica productos de información completos, que integran datos, contexto semántico, reglas de calidad, políticas de uso, responsables, contratos y trazabilidad.
No se comparte únicamente el dato. Se comparte conocimiento empresarial gobernado.
Y esto no puede construirse únicamente sobre un catálogo técnico. Un catálogo puede mostrar que un dataset existe. Pero no puede, por sí solo, declararlo como producto aprobado, asociarlo a un dominio responsable, establecer contratos de uso ni automatizar la concesión de accesos bajo reglas organizativas.
La materialización real de un Knowledge Marketplace exige una Plataforma de Gobierno de Datos & IA moderna, capaz de convertir activos técnicos en productos gobernados.
Esto transforma la democratización del conocimiento en un proceso regulado, trazable y alineado con el modelo de gobierno.
Y cobra aún más relevancia en el contexto actual. Los consumidores de conocimiento ya no son solo personas. Son también modelos de IA, agentes autónomos y sistemas automatizados que necesitan acceder al conocimiento empresarial de forma estandarizada, segura y gobernada.
Estos agentes no pueden interpretar informalidades organizativas ni navegar manualmente catálogos técnicos. Necesitan contexto, contratos y reglas claras.
En este escenario, el Knowledge Marketplace se convierte en la guinda del pastel. Es el resultado natural de haber diseñado correctamente la arquitectura de gobierno desde el inicio.
Y es, cada vez más, la fuente de ventaja competitiva real.
Conclusión. Del catálogo al gobierno real
Gobernar no es catalogar. El gobierno técnico no sustituye al gobierno organizativo. El linaje inferido no reemplaza la responsabilidad declarativa. El control reactivo no equivale a diseño preventivo.
Democratizar el conocimiento no significa abrir accesos sin control. Significa hacerlo de forma gobernada, contextualizada, segura y alineada con responsabilidades claras.
Y gobernar la IA no consiste únicamente en registrar modelos. Consiste en garantizar que cada decisión automatizada esté respaldada por datos aprobados, políticas definidas y contratos de uso explícitos.
Anjana no compite con el gobierno técnico nativo de las Plataformas de Datos & IA. Lo eleva a una capa superior de gobierno integral, transversal, agnóstico y orientado al negocio.
Una capa que permite integrar gobierno del dato y gobierno de la IA bajo una misma lógica organizativa. Una capa que habilita la democratización controlada del conocimiento empresarial. Una capa que hace posible que personas y agentes autónomos accedan al conocimiento de forma estandarizada, segura y trazable.
En un mercado cada vez más impulsado por datos, IA y automatización, la diferencia no está en quién tiene más metadatos. Está en quién es capaz de transformar datos y modelos en conocimiento gobernado y activable. Y esa diferencia es estratégica.
