Wikipedia toolsGoogle adiestra un algoritmo para ser capaz de escribir artículos en Wikipedia. ¿Cómo lo adiestra? Qué pregunta tan tonta, ¿no? Con artículos de Wikipedia. En pocos años, las enciclopedias pueden pasar de ser una tarea llevada a cabo por cientos o miles de expertos en temáticas de todo tipo, a ser escritos por algoritmos capaces de resumir y documentar con enlaces el conocimiento humano.

Obviamente, el artículo va más allá del simple hecho de imaginarse a un robot escribiendo en Wikipedia. ¿Cuántas tareas repetitivas o pesadas haces a lo largo del día, y por qué no te planteas su automatización? Sencillamente, porque la automatización de determinadas tareas no es tan sencilla como parece. Imaginemos, por poner un ejemplo que conozco bien, mi propio día a día: me levanto por la mañana, y en cuanto tengo un rato relativamente tranquilo, reviso mis feeds en Feedly para saber qué ha pasado en el mundo. Marco aquellos que me han resultado interesantes, para, en una segunda pasada, escoger el mejor o los mejores de cada tema, y pasarlos a mi tablero de Pinterest y mi revista de Flipboard. En ambos casos hablamos de herramientas de trabajo, bien porque posteriormente las utilizo para recuperar información cuando la necesito, o porque son seguidas por un cierto número de personas que las utilizan a modo resumen de prensa filtrada. ¿Qué criterio utilizo para decidir qué noticias son mejores en cada tema? La verdad es que no lo sé con certeza, pero… ¿podría educar a un algoritmo para que supiese hacerlo, si tengo datos históricos de las noticias que he ido seleccionando a lo largo del tiempo? Muy posiblemente, sí.

A la hora de escribir, la verdad es que preferiría seguir haciéndolo yo mismo: me relaja, me ofrece ciertas posibilidades y libertades creativas, y me permite retener algunos temas algo mejor. Sin embargo, añadir enlaces a mis artículos es una tarea pesada e intensiva, dado que cuando escribo, procuro enlazar muchísimo para poder tener a mano las fuentes que utilicé (recordemos que mi actividad principal es la de profesor, y que cuando escribo estoy, en realidad, preparando materiales para mis clases). Dado que lo que enlazo proviene, por lo general, de artículos de mi archivo o de fuentes generales que uso para documentar, ¿podría un algoritmo educado con los artículos que he escrito durante muchos años aprender mi criterio a la hora de enlazar, cuándo usar un enlace a Wikipedia para documentar un término, cuándo recurrir a un artículo de mis archivos, etc., y ayudarme en esa fase de la redacción? Una vez escrito, comparto el artículo en redes sociales, una tarea puramente repetitiva, pero que la mayoría de las herramientas que conozco no hacen bien, así que termino haciendo mediante copiado y pegado manual. ¿Podría un algoritmo entender cómo y con qué criterio copio y pego de manera más o menos mecánica el titular y el enlace de mis artículos, y pasar a hacerlo por mí? ¿Puede un algoritmo revisar los artículos que he escrito a lo largo del tiempo, monitorizar los enlaces a contenidos que han desaparecido o no están accesibles, y sustituirlos por los enlaces válidos correspondientes, si existen?

La respuesta a esas preguntas es, estoy prácticamente seguro, afirmativa. Y hablamos de tareas muy específicas, que seguramente muy pocas personas hacen como yo, con la misma combinación de necesidades y motivaciones. ¿Para cuándo algoritmos que permitan ese tipo de aprendizaje a partir de tareas relativamente repetitivas – pero no completamente mecánicas – y que puedan ser utilizados a modo de asistentes personales? ¿Qué haría falta para conseguir que una persona normal, sin conocimientos de machine learning, pudiese definir una tarea, aportar datos para un aprendizaje, y monitorizar el progreso de un algoritmo a la hora de completar una tarea de su día a día? Estoy convencido de que ese tipo de tareas serán así dentro de no mucho tiempo: llevar a cabo la tarea un cierto número de veces, para que el algoritmo de turno sea capaz de entender lo que hacemos, con qué criterios lo hacemos, y pueda posteriormente repetirlo de manera automatizada para nosotros. ¿Cuántas cosas de tu día a día querrías mecanizar con ese tipo de criterios? ¿Cuánto mejor trabajarías si pudieses hacerlo?

 

IMAGE: Scyther5 - 123RFMuchos pensarán que todo empezó con esta entrada de Mark Zuckerberg en su página personal, definiendo su desafío personal para el año 2018 como “arreglar los problemas de Facebook“, definidos por él mismo como “defender a la comunidad contra el abuso y el odio”, “defendernos contra la interferencia de naciones y estados”, o “asegurarnos que el tiempo que pasamos en Facebook es tiempo bien invertido”.

Esta entrada desencadenó rápidamente todo tipo de reacciones: desde John Battelle sentenciando sencillamente que “Facebook no tiene arreglo“, hasta Roger McNamee, que apunta “medidas para arreglar Facebook antes de que sea Facebook quien nos arregle a nosotros“, pero la gran realidad es que la cuestión no empezó con la resolución de año nuevo de Mark, sino mucho, mucho antes.

A lo largo de los últimos tiempos, Facebook no solo se ha demostrado como una compañía enormemente rentable, con una capitalización bursátil por encima de los quinientos mil millones de dólares y con una acción en continuo crecimiento, sino también como una herramienta para influenciar procesos electorales y atacar la misma esencia de la democracia, para promover el genocidio hasta el punto de que algunos se planteen juzgar a la compañía por crímenes de guerra, para promover la exclusión en función de criterios de todo tipo, o para promover el discurso del odio, el acoso y la exclusión, sin que las medidas tomadas por la compañía para evitarlo hayan servido para evitarlo.

A lo largo de su fastuoso crecimiento hasta superar los dos mil millones de personas en todo el mundo, Facebook se ha construido sobre un mecanismo fundamental: un algoritmo que muchos aceptan como completamente normal, pero que desde mi punto de vista debería ser considerado completamente inaceptable. La cuestión es tan sencilla y fácil de entender como efectivamente lo parece: cuando creas contenido en una página de Facebook, ese contenido tiene un alcance orgánico determinado. Alcanza la atención de que manera natural debe alcanzar, en función de sus características y de las personas que deciden compartirlo. Desde ese punto de vista, la red social se convierte en una plataforma, en un entorno en el que la información circula libremente, y cada uno encuentra los contenidos que aquello que ha definido como su entorno de interés, sus amigos, las páginas que decide seguir, etc. le aportan. Sin embargo, a partir de un momento dado, el algoritmo empieza a actuar, restringiendo de manera artificial el alcance orgánico de los contenidos creados, pretendiendo que el creador del contenido, para obtener una audiencia similar a la que tenía antes, se vea obligado a adquirir publicidad. La gran mayoría del negocio de Facebook proviene ni más ni menos que de ahí, de forzar a los creadores de contenidos a pagar por un alcance que podrían estar obteniendo de manera natural, pero del que el algoritmo de Facebook les priva artificialmente. En ese sentido, Facebook es como un vendedor de droga: si quieres mantener tu relevancia, tendrás que pagarme cada vez más.

Ese, y no otro, es el responsable de la inmensa mayoría de los problemas de Facebook. No se puede establecer un imperio que alcanza e implica a más de dos mil millones de personas sobre un algoritmo así, más calificable como de sucio truco que como un verdadero modelo de negocio, por mucho que le haya ido bien con él. A partir del momento en que, de manera artificial, restringes el alcance que un contenido debería haber tenido para pasar a vender ese alcance a su creador, sabes perfectamente que no estás inventándote hábilmente un modelo de negocio, sino cometiendo un fraude. Estás creando un engaño, un sistema perverso que puede ser explotado para lo que se quiera. El problema de Facebook es haberse desarrollado con un enorme éxito gracias a ese algoritmo, haber creado un sistema que permite comercializar la atención sin ningún tipo de límite – ni siquiera los que legalmente debería tener, como filtrar por determinados criterios – y sin prácticamente ningún tipo de control, salvo los que se han intentado ir creando a golpe de crisis. El problema es que lo que le ocurre a Facebook es lo que pasa cuando superpones la naturaleza humana a un algoritmo absurdo, que debería ser completamente inaceptable, pero que por alguna razón, hemos convenido en calificar como normal. No, no lo es. Nadie debería ganar dinero haciendo algo así, manipulando los procesos de atención de esa manera. El problema de Facebook es un problema de mentalidad, y se ha hecho más evidente a medida que ha ido creciendo. Ahora, en plena madurez, la magnitud del cambio que Facebook necesita es prácticamente fundacional.

A partir de aquí, veremos. La primera medida, modificar el News Feed para reducir el alcance de las noticias y los vídeos, y reforzar la presencia de los contenidos creados por tus amigos, es una solución temporal: si te conviertes en el mayor medio de comunicación del mundo, en el sitio donde más personas leen la prensa, te aseguras convertirte también en el objetivo de todos los que han generado los grandes problemas a los que Mark se refiere: de estados que intentan manipular procesos electorales, de quienes intentan distribuir el discurso del odio, de quienes pretenden manipular todo lo manipulable. Pero solucionar tus problemas a base de reducir tu relevancia no es una solución: es una retirada. Lo normal, lo esperable, es que una red social como Facebook termine siendo un lugar donde acceder a noticias, donde verlas tamizadas por los intereses de tus amigos, donde comentarlas, como en la barra de un bar.

Este primer cambio de Facebook es eso, solo el primero de muchos que están por venir. Mark Zuckerberg es una persona con una brillantez excepcional, y aunque sea una tarea difícil y compleja, sabe que tiene que llevarla a cabo. A corto plazo, veremos muchos sustos: todos aquellos medios que hayan confiado su audiencia a la compra de tráfico en Facebook se verán afectados, se encontrarán con caídas, y se resentirán en su alcance, con todo lo que ello conlleva. Pero por otro lado, veremos un panorama más lógico, más razonable y, a medio plazo, más real, menos distorsionado. Porque lo que hacía Facebook no era ni más ni menos que eso: distorsionar la relevancia y el alcance de las cosas. Y sobre algo así, no puede construirse nada bueno.

 

IMAGE: lkeskinen - 123RFGoogle, acosada por las marcas que planteaban retirar su publicidad de YouTube debido a los escándalos que rodeaban los vídeos de contenido supuestamente infantil, anuncia que se dispone a llevar a cabo un nivel de moderación mucho más agresivo para evitar que malos actores se aprovechen de la apertura de su plataforma, y que contratará hasta diez mil personas durante 2018 para llevar a cabo procesos de inspección manual de contenidos.

En las pasadas semanas, YouTube ha suspendido 270 cuentas y ha eliminado unos 150,000 vídeos considerados ofensivos o desaconsejables para niños, en un esfuerzo por normalizar y reconducir la situación. Además, la compañía planea seguir utilizando machine learning para ayudar a esos supervisores a eliminar casi cinco veces más videos de los que serían capaces de revisar de manera puramente manual. Según los datos manejados por YouTube, los contenidos revisados e identificados de manera algorítmica habrían requerido la supervisión de 180,000 personas trabajando 40 horas a la semana. Además de llevar a cabo la citada supervisión, la compañía difundirá un reporte regular sobre los avances en la ejecución de este plan, y adoptará un nuevo enfoque en publicidad con criterios más estrictos y más procesos de curación manual. 

Los esfuerzos de YouTube evocan los de otra compañía de su misma industria, Facebook, que el pasado mayo anunció la contratación de tres mil personas más para unirlas a las 4,500 que ya tiene en todo el mundo trabajando en supervisión de contenidos, y que en octubre, coincidiendo con la revelación de las inversiones de capital ruso en campañas publicitarias destinadas a sesgar la campaña electoral de las pasadas elecciones presidenciales, anunció la contratación de mil personas más para la supervisión de esos anuncios.

¿Cuántas personas en el mundo trabajarán en un futuro en la supervisión de contenidos? ¿Estamos hablando de una de esas “nuevas profesiones” que podrían definir las sociedades del futuro, o de un trabajo de los de la llamada gig economy, desempeñado a tiempo parcial y que termina por generar empleo de baja calidad que lleva a los que lo desempeñan a no sentirse humanos? Según algunos estudios, la carga psicológica que supone pasarse horas inspeccionando contenidos entre los que aparecen todo lo peor del ser humano puede generar problemas psicológicos de diversos tipos y síndrome de estrés post-traumático, lo que lleva a que la necesidad de adiestrar algoritmos para una supervisión precisa y adecuada que libre a los trabajadores humanos de los contenidos de naturaleza más gruesa sea todavía más acuciante.

¿De qué estamos hablando? Las compañías que ahora anuncian importantes contrataciones de miles de personas para esta función parecen asumir que, en el futuro, esos trabajos serán desempeñados por algoritmos, no por personas, y que esas contrataciones, por tanto, tendrán únicamente una naturaleza temporal. Esas personas están siendo contratadas porque las máquinas no llevan aún a cabo ese trabajo con el nivel adecuado, pero a su vez, sus acciones están siendo empleadas para adiestrarlas y que lo hagan mejor en el futuro, eliminando la necesidad de esos empleos humanos. La paradoja persiste: por mucho que Amazon contrate a muchísimas personas, se convierta en uno de los generadores de empleo más importantes de los Estados Unidos, y sus trabajadores se reciclen en otras funciones a medida que su trabajo es llevado a cabo por robots, la realidad es que a medida que el ejército de robots crece, el empleo total generado por la industria disminuye, y que en el futuro, hay muchos trabajos que nos resultará raro imaginar desempeñados por personas.

¿Se limita la sustitución a los trabajos de las denominadas 4D, Dull (aburridos), Demeaning (degradantes), Dirty (sucios) o Dangerous (peligrosos), o hablamos de un proceso sensiblemente más complicado y con más matices? ¿Veremos en el futuro a miles de personas contratadas como “content inspectors”, supervisores de contenido y sometidos a enfermedades laborales derivadas de ello, o hablamos de empleos temporales hasta que un algoritmo sea capaz de llevar a cabo esa tarea al nivel adecuado? ¿Tiene sentido tener a un ser humano corriendo en un almacén mientras recibe órdenes por un pinganillo, sentado en una línea de cajas moviendo y escaneando artículos, conduciendo en medio del infernal tráfico de una gran ciudad o enfrentándose a horas de contenidos que reflejan lo peor del ser humano? Y tenga o no sentido, ¿qué pasa con las personas que hoy viven de llevar a cabo esos trabajos?

Cada día que pasa, surgen nuevos trabajos temporales de escasa calidad en logística, conduciendo, en tareas repetitivas o en otras que escasamente podrían considerarse enriquecedoras o esencialmente adecuadas para las habilidades de un ser humano… ¿hablamos de un fenómeno de ajuste, o de una perversión de un capitalismo que va eliminando los controles y los logros que llevó muchos años conseguir? ¿Cuál es el futuro de la relación del reparto de tareas entre máquinas y hombres?

 

IMAGE: Hafakot - 123RF

Cada día está más claro: a medida que las soluciones de machine learning y su aprendizaje rebajan sus barreras de entrada, su manejo a cierto nivel se convierte en la nueva línea imprescindible en el curriculum, en el nuevo talento escaso por el que las compañías están dispuestas a pagar salarios cada vez más elevados. En pleno 2017, poder plantear modelos de machine learning para una gama cada vez más elevada de situaciones está pasando a ser lo que, en su momento, pudo ser poder poner en tu curriculum que utilizabas “informática a nivel de usuario” o que tenías “soltura en el manejo de hojas de cálculo”, un elemento cada día más imprescindible.

Robots que fabrican otros robots, máquinas que se programan a sí mismas, automóviles que cuesta menos asegurar porque tienen prestaciones de conducción semi-autónoma que da lugar a una accidentalidad menor, enormes librerías de vídeos para enseñar conceptos a las máquinas, todo tipo de propuestas para entender y aprender machine learning sin necesidad de programar… no, esto ya no es una cuestión de movimientos propagandísticos y de cuál es el siguiente reto que una máquina consigue hacer mejor que un humano. Esto es la revolución que viene, el gran game changer, con un nivel de impacto sobre nuestras vidas similar al que tuvo en su momento el desarrollo de internet. Lo puedes leer en todas partes.

Cuando todo a tu alrededor, hasta tu smartphone, empieza a incorporar prestaciones basadas en machine learning y es capaz de reconocer tu cara aunque te hayas dejado barba o lleves unas gafas puestas, o de proponerte usos basados en la información que recibes o en los hábitos que muestras habitualmente, lo que nos está diciendo es que hablamos de la próxima frontera, de lo que hay que tener para que los productos y servicios sean competitivos. Hablemos de fabricación, de operaciones, de marketing, de distribución, de servicio al cliente, de marketing o de lo que sea, tenemos que acostumbrarnos a pensar que nos vamos a encontrar con esto en una gama creciente de productos y servicios, y que alguien va a tener que gestionarlos, que saber cómo convertir esas posibilidades en ventajas competitivas. La nueva generación de directivos tendrá necesariamente que pasar por ese desarrollo de habilidades, o bien volver a formarse para adquirirlas. Hablar simplemente de oídas o quedarse con mitos manoseados y lugares comunes no va a ser suficiente.

¿Burbuja? Como en todas las cosas y como en todas las tecnologías anteriores, una parte sí. Pero sin duda, es el momento de asentar conceptos y de amueblar bien nuestro futuro en torno a un tema que va a jugar un importantísimo papel en su definición.

 

Bonnier, G. et G. de Layens, "Flore complète portative de la France, de la Suisse et de la Belgique"En la foto, el Bonnier. Para la mayoría, simplemente un libro viejo. Pero para miles de estudiantes de Biológicas de media Europa, la tortura que simbolizaba el examen de Botánica (en el plan que yo estudié, la asignatura era Fanerogamia, separada de la Criptogamia, que se estudiaba en el año anterior) en el que tenías que identificar, utilizando las claves dicotómicas del Bonnier, un número determinado de especies vegetales, entre las que siempre había algunas gramíneas, con taxonomías particularmente enrevesadas y basadas en atributos mínimamente discernibles, para los que, en ocasiones, era preciso utilizar la lupa binocular. Una tarea ardua, pesada y que para llevar a cabo con ciertas garantías, era preciso acumular una cierta experiencia. Por lo que he podido encontrar, la determinación botánica sigue haciéndose del mismo modo, se sigue utilizando el Bonnier, aunque la edición es más moderna, e incluso sigue formando parte de los temarios de algunas oposiciones a profesorado.

En mi época, a mediados de los ’80, el Bonnier que utilizábamos era exactamente ese de la ilustración (sí, ya sé que parezco el abuelo Cebolleta, pero os prometo que en su momento ya tenía aspecto de libro viejísimo, aunque la edición era de 1972), estaba encuadernado en rústica y con un papel de malísima calidad, no estaba traducido al castellano, y a mí, que en aquel momento ya llevaba algunos años interesado por la tecnología y las bases de datos, me obsesionaba la idea de informatizarlo. Incluso llegué a preparar una estructura de una base de datos y una interfaz sencilla para ello con las herramientas que utilizaba entonces, dBASE y Clipper, todo sobre MS-DOS. De haber seguido con el tema, cosa que no hice al ver el ingente trabajo que habría supuesto digitalizar todas aquellas fichas y atributos de varios miles de especies de plantas vasculares, habría conseguido simplemente una cierta comodidad: en lugar de movernos por las páginas del libro, habríamos podido seleccionar las opciones en una pantalla… visto así, no parecía realmente un gran avance.

Ahora, más de treinta años después, me encuentro a través de Boing Boing un artículo de Nature, Artificial intelligence identifies plant species for science, en el que dan cuenta del desarrollo de un algoritmo de machine learning que va bastante más allá: tras entrenarlo con unas 260,000 imágenes digitalizadas de más de mil especies de plantas en herbarios de todo el mundo – se calcula que hay unos tres mil herbarios de cierta entidad en el mundo, con un total aproximado de unas 350 millones de muestras, de las que tan solo una pequeña parte están digitalizadas – el algoritmo es capaz de determinar la planta que se le está mostrando con unas tasas de acierto aproximadas del 80% (en un 90% de ocasiones, la especie estaba entre las cinco primeras elecciones del algoritmo). Esas tasas de acierto superan las habituales en botánicos expertos en taxonomía (en mi época, para aprobar necesitábamos identificar correctamente tres plantas de un total de cinco, y éramos simples estudiantes de tercer año). 

Cuando ves a un algoritmo capaz de llevar a cabo una tarea cuya dificultad eres capaz de valorar adecuadamente en función de tu experiencia, es cuando de verdad te das cuenta de lo que puede llegar a suponer el machine learning. En su momento, mi intento rudimentario de digitalización simplemente solucionaba un factor de comodidad, reducía una parte de la fricción implicada en la determinación. Ahora, basta con mostrar al algoritmo la imagen digitalizada de la planta, y directamente contesta con su género y especie, con un 80% de acierto.

¿Qué implicaciones tendrá algo así para el desarrollo de la Botánica? En pocos años, teniendo en cuenta el rendimiento del algoritmo y las necesarias correcciones progresivas, ya no existirán investigadores capaces de determinar la especie de una planta sin la ayuda del correspondiente algoritmo: los pocos que puedan hacerlo serán jubilados que aún guarden el Bonnier en su estantería, y recuerden cómo utilizar con un mínimo de soltura sus claves dicotómicas. Y sin embargo, esto no significará una pérdida del valor del profesional como tal, porque solo con los conocimientos de esos profesionales se habría podido llegar a adiestrar a ese algoritmo, y porque el papel de esos profesionales estará ya situado mucho más allá, en un escenario en el que ya no será necesario invertir tiempo ni esfuerzo en la determinación de una planta, porque eso se hará ya de manera automatizada. Será preciso modificar la forma de enseñar la disciplina, incluir otro tipo de ejercicios, otros materiales y otras disciplinas, ampliando así las fronteras del conocimiento. ¿Será la idea de perder la habilidad de determinar plantas a mano una gran pérdida como tal para la disciplina? La respuesta es simplemente… no. Del mismo modo que hoy prácticamente nadie sería capaz de escribir en cuneiforme sobre una tabla de arcilla.

¿Algo que ver con la idea de robots “inteligentes”? No, un algoritmo que clasifica especies vegetales lleva a cabo una tarea que hasta entonces, solo un humano podía hacer, pero está muy lejos de la inteligencia: simplemente es capaz de llevar a cabo una tarea muy definida en función de una serie de atributos de una muestra. Sácalo de ese entorno, y necesitará muchísimos ajustes para poder aplicarlo a otra tarea. La inteligencia es otra cosa. ¿Algo que ver con la idea de robots que  sustituyen a expertos en Botánica? En absoluto, y de hecho, la idea parece, vista así, de un simplismo que asusta. Hablamos de otras cosas: de aplicar la inteligencia humana a tareas de más entidad, de liberar recursos que no estaban siendo optimizados… de más progreso y más avance en la disciplina. ¿Podríamos imaginar de alguna manera a profesionales de la disciplina negándose a colaborar con el entrenamiento del algoritmo por miedo a ser eventualmente sustituidos? La sola idea resulta absurda, prácticamente ofensiva.

¿Cuántas de las cosas que hoy consideramos exclusivamente humanas acabarán haciendo algoritmos? ¿Cuántas cosas más podremos hacer cuando sea así?