Centro Universitario de Tecnología y Arte Digital

Facebook
Twitter
LinkedIn

¿Dónde está el límite en los datos?

Izaskun López-Samaniego, es Data Strategy & Data Scientist en Globant; y Gonzalo Zarza trabaja como Studio Partner (VP Tech) en el Studio de Data & Artificial Intelligence en la misma compañía. Hablamos con estos dos profesionales, que hace algunos días impartieron sendos webinars en U-tad, sobre el mundo de los datos y sus límites. ¿Existen límites en los datos? Así han respondido los expertos a nuestra pregunta. ¡Sigue leyendo!

 

¿Tienen límite los datos?

Izaskun: en mi opinión sí hay límites. Lo que nos permiten los datos es tener una visión más precisa y objetiva de situaciones, entornos y comportamientos. Por muy objetivo que intentes ser tienes un límite de contexto, de experiencia, de ética, etc., que hay que tener en cuenta.

Gonzalo: para mí no tienen un límite por sí mismos, pero lo que le da el límite es lo que ha comentado Izaskun del contexto, alcance, qué se quiere buscar, si tenemos suficientes datos, etc. No es tanto un tema de si el dato me sirve o no, de si puede solucionar un problema o no. Por lo general, cuando hay un límite, lo que ocurre es que no sabemos qué queremos responder. El límite está más bien dado por el contexto. Lo que hay que hacer es ir hacia atrás y ver qué datos tenemos y qué podemos responder con ellos. Ahí se le encuentran límites porque, o no tienes las herramientas, o los equipos a veces no están con la gimnasia suficiente para poder aprovechar esos datos. Luego surgen otros problemas: que no sea de calidad, que no sea confiable, que esté duplicado o esté estropeado, por ejemplo.

 

¿Y a nivel de protección de datos?

Izaskun: por un lado está el marco legal, que establece cómo puedes utilizar unos datos. Luego está la ética con la que utilizas dichos datos metiéndolos en un contexto, pero sin manipularlos, sin ser intrusivos, evitando sesgos (que todos tenemos y que luego se ven en nuestro trabajo). Tienes que mirar los datos de la forma más objetiva posible. Es necesario separar los sesgos de la experiencia. La experiencia te da un contexto y te ayuda a buscar qué datos necesitas para, después, con esos datos, tener una visión más amplia del trabajo que vas a hacer. Los datos los tienes que utilizar para ampliar ese contexto o para buscar una primera hipótesis.

Gonzalo: como sabemos, la protección de datos a nivel legal varía entre lugares. En Europa la regulación es muy diferente por ejemplo que en Estados Unidos está relacionado con el uso que se hace de los datos. Hay muchos ejemplos precisamente sobre el uso debido o indebido de los datos. Por ejemplo, algunos años una compañía de supermercados estadounidense utilizaba datos para saber el estado de gestación de las mujeres, sin consentimiento de las usuarias. Pensaban, en el buen sentido, que si podían saber más tempranamente el estado de gestación de una mujer, les podría ofrecer productos más personalizados. Lo que ocurrió es que funcionó tan bien que empezaron a enviar publicidad a la casa de una menor cuya familia no sabía que estaba embarazada. Allí empezó a surgir un dilema sobre el uso ético de esos datos. En este caso, menor.

 

¿La objetividad real existe?

Izaskun: la idea es que lo intentes. Los datos te dan una base objetiva para trabajarlos. Hay que tratar de no sesgarlos. Hay que contar lo que cuentan los datos y ponerlo en contexto, porque muchas veces parece que te están diciendo algo por una razón que tú piensas, y tal vez te estén revelando otras cosa. Ahí es donde tienes que investigar antes de decidir qué contar. Es ahí cuando utilizas la experiencia y contrastas.

Gonzalo: los datos no siempre son objetivos. Pasa mucho con procesamiento de lenguaje natural. Muchas soluciones están entrenadas con los textos que se han escrito en los últimos años y décadas, y muchas veces esos datos arrastran sesgos. Por ejemplo, la literatura es mayoritariamente machista cuanto más hacia atrás en el tiempo vamos. Si entrenamos nuestras soluciones de datos usando esa información sesgada, el resultado va a tener el mismo sesgo, que quizás replica la forma de pensar de otra época. Por tanto, los datos no siempre son objetivos, o lo son, pero en otro contexto que no es el actual. Hay una máxima que dice que puedes torturar a los datos hasta donde quieras, hasta que digan lo que tú quieres que digan. Según cómo haga el análisis puedo tener ciertas ideas o validaciones que parezcan estar sostenidas con los datos. Se ve mucho en el ámbito de la política, por ejemplo.

 

¿Hay límite en cuanto al alcance de esos datos?

Izaskun: para mi ese límite hoy está lejos. El mundo de los datos se puede extender a casi todos los entornos. Lo encontramos en medicina, marketing digital, economía, sostenibilidad, temas sociales… siempre hay datos y formas de hacer uso de los mismos. Cada vez, de hecho, encontramos maneras más disruptivas e innovadoras para trabajar con los datos. De momento no hemos encontrado el límite. Si lo hay, estamos lejos.

Gonzalo: yo no me atrevo a decir que no tienen límite, pero sí creo que estamos lejos. Si existe una limitación está en si podemos conseguir datos de un contexto específico. Igual no tenemos hoy las herramientas para conseguir esos datos, y eso es lo que genera una limitación porque tenemos datos parciales o porque no podemos definir tantas cosas como querríamos.

 

¿Más allá de perfiles técnicos y de negocio, profesionales de ámbitos más sociales pueden unirse a la ola de los datos?

Gonzalo: sí. Hay disponibilidad de herramientas y de formaciones que permiten que todo el mundo se pueda acercar. No es un camino fácil, tiene una barrera de entrada que al comienzo cuesta un poquito, pero una vez se entiende esa lógica, se puede.

Izaskun: yo he conocido periodistas, abogados, criminólogos… y hasta nosotros en el equipo tenemos un filósofo que es data engineer. Es gente que ha entrado en el mundo de data y le ha cogido el gustillo y ha trabajado en ello. Son personas que se han ido formando, moviendo y, al final, son de la gente más motivada que conozco, pero su camino no ha sido nada fácil. Si te gusta y eres capaz de ver más allá de la simple matemática o de la informática; si consigues conjugar tu camino más social con la parte más técnica; si logras romper esos pensamientos que te dicen que al venir de letras no puedes programar… al final con esfuerzo se consigue. Yo lo he visto.

Gonzalo: además, cada vez hay más herramientas muy fáciles de utilizar y que no requieren tanto conocimiento técnico. La madurez de las soluciones ayuda también, soluciones donde todo se ve de manera visual de forma más simple, y se consiguen resultados en menos tiempo. Eso ayuda mucho al acercamiento de estas personas.

Más información sobre nuestro Máster en Inteligencia Artificial & Data Science.
Facebook
Twitter
LinkedIn