Data Sharing Agreements y el autoservicio gobernado de datos

Actualidad, Artículos, 12 febrero 2021 |
0

A diferencia de otros muchos activos, los datos tienen la característica esencial de que su valor aumenta cuanto más y mejor se comparten. Es por eso que compartir datos es vital para que una organización se convierta en data-driven. Sin embargo, establecer los mecanismos para hacerlo de forma segura, gobernada, efectiva y eficiente, es uno de los mayores retos de un programa de gobierno del dato.

En este contexto, venimos de un mundo donde los datos estaban organizados en silos custodiados por equipos puros de TI (Sistemas, DBAs, …) y estos se servían en forma de reportes, métricas o proyectos totalmente cocinados y con tiempos largos de desarrollo; esto es algo que, a día de hoy, ha quedado totalmente obsoleto y ya se está rompiendo en muchas organizaciones.

Ya llevamos años viviendo un torrente tecnológico que aporta nuevas capacidades en el tratamiento de los datos (Big Data, Cloud, IoT, Advanced Analytics, IA & ML, …), contamos con una mayor cultura del dato de las personas y las organizaciones, existe una mayor formación en materia de datos, data literacy y data storytelling, se adquieren nuevas habilidades para consumir datos y generar insights en las áreas de negocio gracias a más y mejores analistas y científicos de datos, … por lo que queda claro que los datos ya no es algo que pueda ser custodiado por equipos puros de TI y servidos en tiempos largos de desarrollo sino que es algo que debe ponerse al servicio del negocio (personas o algoritmos) para la toma de decisiones de forma rápida y eficaz que generen una ventaja competitiva.

 

¿Qué beneficios tiene compartir datos en una organización o entre organizaciones?

 

  • Maximizar las sinergias entre diferentes intervinientes para mejorar su operativa diaria. Esto podemos verlo en el entorno de una única organización donde los diferentes departamentos tienen que compartir información para poder, en su día a día, realizar sus tareas, actividades o tomar ciertas decisiones. Otro caso muy claro es para la investigación e innovación, de ahí que existan muchos proyectos de Open Data a nivel mundial enfocados en la compartición de datos abiertos (el último de ellos y más grande el de la Unión Europea 

 

  • Además, compartir esos datos, hace que se mejore la calidad de los datos clave para la toma de mejores decisiones de forma más rápida. Si los datos son puestos a disposición de otros consumidores, los productores van a poner más énfasis en compartir datos de calidad que faciliten tomar las decisiones de una forma más rápida.

 

  • Reutilizar desarrollos y trabajos ya realizados aumentando la eficiencia de los proyectos de datos. De esta forma conseguiremos que cada iniciativa de datos que requiera del desarrollo de procesos o de trabajos previos de análisis, no tenga que empezar de cero y pueda reaprovechar los trabajos ya realizados en frameworks comunes o modelos de colaboración.

 

  • Ahorro en costes operativos y mejora en la productividad de los profesionales. El compartir datos también conlleva un ahorro en los costes operativos porque evita que se dupliquen datos para ciertas actividades o que se solapen tareas manuales de gestión de datos (búsqueda, entendimiento, solicitud, limpieza, …), y eso redunda en una mejora de la productividad de los profesionales de la organización.

 

  • A su vez, también pretende mejorar el time-to-market y el time-to-value de nuevos productos y servicios de cualquier tipo. A día de hoy gran parte de los productos o servicios que se lanzan al mercado, tanto desde la administración pública como de las organizaciones privadas, dependen en gran medida de análisis realizados a partir de datos históricos o de predicciones futuras. Todos conocemos el caso tan exitoso del algoritmo de recomendaciones de Netflix

 

  • Ayudar a los científicos de datos en el desarrollo de mejores modelos de analítica avanzada, dándoles por un lado una mejor materia prima mucho más completa (más datos y de mejor calidad) y por otro lado evitando que inviertan gran cantidad de su tiempo en buscar, entender, solicitar, enriquecer y limpiar datos para pasar a dedicarlo a las tareas donde realmente aportan valor que es la construcción de modelos (https://www.datanami.com/2020/07/06/data-prep-still-dominates-data-scientists-time-survey-finds/)

 

 

Una vez tenemos claros los beneficios que tiene compartir datos, esto nos lleva a un dilema entre dos partes: por un lado, debemos potenciar el uso y la reutilización de los datos y para eso tenemos que democratizar su acceso; y por otro lado, tenemos que tener un control sobre el uso que se hace de esos datos para garantizar el cumplimiento regulatorio y la seguridad de los mismos. Al final, siempre aparece ese punto de inflexión que nos hace reflexionar sobre los diferentes caminos que conlleva compartir los datos.

 

“Aurea mediocritas: En el punto medio está la virtud” – Aristóteles

 

Ese es el punto medio que se logra con la entrada en juego de los Data Sharing Agreements (DSAs) para compartir datos en un entorno donde nos sintamos cómodos y haya un gobierno. En este sentido, siempre tenemos que buscar el equilibrio entre dar valor al negocio y cumplir la regulación; seguir lo que el negocio necesita, pero a la vez no tener grandes costes tecnológicos; potenciar el autoservicio, pero teniendo un control de la información que se está poniendo a disposición del resto; y luego también perseguir soluciones innovadoras y disruptivas sin olvidar que lo tradicional no puede desaparecer de la noche a la mañana.

El dato es un activo estratégico, pero tiene diferentes visiones

 

Cada vez que hablamos de compartir datos, a lo que nos referimos es a disponibilizar información por parte de unos productores para su uso por unos consumidores, y en ese proceso además hay unos roles que tienen que velar por que todo funcione de manera correcta. Al final, cada persona o cada tipo de rol va a tener su perfil, sus visiones y necesidades; y gracias a los DSAs podremos cubrir todos.

Si nos situamos en el punto de vista de un consumidor de datos, este necesita tener acceso al conocimiento de los datos gracias a su contexto y a su significado; una garantía de la calidad de los datos utilizados para la toma de decisiones; un cumplimiento de los SLAs por parte de los productores; y un cumplimiento regulatorio desde el punto de vista del uso.

Desde el punto de vista de un productor, este busca controlar los procesos de producción y de disponibilización de sus datos, preparar y certificar los datos que va a compartir, conocer qué procesos y qué personas están usando los datos y para qué, y cumplir la regulación y normativa de datos.

Desde un punto de vista transversal de gestión y supervisión, los objetivos van a ser: maximizar el ROI de las iniciativas de datos, aumentar la eficiencia en la productividad de los procesos, automatizar y reducir costes y riesgos operacionales, conseguir una visión homogénea del consumo de la información y asegurar el cumplimento regulatorio.

 

Pero, ¿qué es realmente un Data Sharing Agreement?

Un DSA básicamente es un mecanismo para compartir datos entre productores y consumidores de forma ágil y personalizada, facilitando el cumplimento regulatorio y normativo en el uso de los datos. Además, gracias a los DSAs podemos estandarizar la forma en la que se solicitan, se conceden y se gestionan los accesos a los datos y a la información ganando en eficiencia y productividad.

Por otro lado, los DSAs se representan como activos lógicos que agrupan diferentes activos técnicos de datos o Datasets (tablas, ficheros, vistas, documentos, eventos, …) por lo que ofrecen a los stakeholders una nueva experiencia de compartir información facilitando toda esa complejidad técnica que hay por debajo de ese ‘compartir datos’ al contener toda la información de metadatos de los activos técnicos que engloban. Así pues, los DSAs acercan el dato al consumidor de negocio, abstrayéndole de todos los conceptos técnicos subyacentes.

Por último, los DSAs permiten, además, la definición, implementación y operativización de los Contratos de Datos con la finalidad de aportar la flexibilidad necesaria para aterrizar las diferentes políticas de acceso a datos que se quieran implementar para cada uno de los casos particulares de compartición de información, ya que no es lo mismo compartir datos públicos de hace 3 años que compartir la dirección donde viven los ciudadanos o compartir datos confidenciales de la estrategia de una organización. Hay veces que un Contrato de Datos puede servir a múltiples propósitos y múltiples consumidores pero hay otras veces que se necesitan Contratos de Datos específicos para casos muy concretos.

¿Y cómo puedo incorporar los DSAs en una organización? 

Incorporar elementos innovadores en el gobierno de los datos como los DSAs no es una tarea sencilla pero si de verdad te interesa y quieres hacerlo lo mejor es contar con las personas adecuadas, los procesos correctos y la tecnología necesaria. Si quieres saber más acerca de cómo operativizar los DSAs, diferentes casos de uso y casos de éxito, échale un vistazo a este documento, a este webinar o ponte en contacto con nosotros.

Avatar
Sobre el Autor: Angela Miñana Francés
(angelamf@anjanadata.com)


1

¡DESCUBRE LA SOLUCIÓN PARA EL GOBIERNO DEL DATO!