IMAGE: lkeskinen - 123RFGoogle, acosada por las marcas que planteaban retirar su publicidad de YouTube debido a los escándalos que rodeaban los vídeos de contenido supuestamente infantil, anuncia que se dispone a llevar a cabo un nivel de moderación mucho más agresivo para evitar que malos actores se aprovechen de la apertura de su plataforma, y que contratará hasta diez mil personas durante 2018 para llevar a cabo procesos de inspección manual de contenidos.

En las pasadas semanas, YouTube ha suspendido 270 cuentas y ha eliminado unos 150,000 vídeos considerados ofensivos o desaconsejables para niños, en un esfuerzo por normalizar y reconducir la situación. Además, la compañía planea seguir utilizando machine learning para ayudar a esos supervisores a eliminar casi cinco veces más videos de los que serían capaces de revisar de manera puramente manual. Según los datos manejados por YouTube, los contenidos revisados e identificados de manera algorítmica habrían requerido la supervisión de 180,000 personas trabajando 40 horas a la semana. Además de llevar a cabo la citada supervisión, la compañía difundirá un reporte regular sobre los avances en la ejecución de este plan, y adoptará un nuevo enfoque en publicidad con criterios más estrictos y más procesos de curación manual. 

Los esfuerzos de YouTube evocan los de otra compañía de su misma industria, Facebook, que el pasado mayo anunció la contratación de tres mil personas más para unirlas a las 4,500 que ya tiene en todo el mundo trabajando en supervisión de contenidos, y que en octubre, coincidiendo con la revelación de las inversiones de capital ruso en campañas publicitarias destinadas a sesgar la campaña electoral de las pasadas elecciones presidenciales, anunció la contratación de mil personas más para la supervisión de esos anuncios.

¿Cuántas personas en el mundo trabajarán en un futuro en la supervisión de contenidos? ¿Estamos hablando de una de esas “nuevas profesiones” que podrían definir las sociedades del futuro, o de un trabajo de los de la llamada gig economy, desempeñado a tiempo parcial y que termina por generar empleo de baja calidad que lleva a los que lo desempeñan a no sentirse humanos? Según algunos estudios, la carga psicológica que supone pasarse horas inspeccionando contenidos entre los que aparecen todo lo peor del ser humano puede generar problemas psicológicos de diversos tipos y síndrome de estrés post-traumático, lo que lleva a que la necesidad de adiestrar algoritmos para una supervisión precisa y adecuada que libre a los trabajadores humanos de los contenidos de naturaleza más gruesa sea todavía más acuciante.

¿De qué estamos hablando? Las compañías que ahora anuncian importantes contrataciones de miles de personas para esta función parecen asumir que, en el futuro, esos trabajos serán desempeñados por algoritmos, no por personas, y que esas contrataciones, por tanto, tendrán únicamente una naturaleza temporal. Esas personas están siendo contratadas porque las máquinas no llevan aún a cabo ese trabajo con el nivel adecuado, pero a su vez, sus acciones están siendo empleadas para adiestrarlas y que lo hagan mejor en el futuro, eliminando la necesidad de esos empleos humanos. La paradoja persiste: por mucho que Amazon contrate a muchísimas personas, se convierta en uno de los generadores de empleo más importantes de los Estados Unidos, y sus trabajadores se reciclen en otras funciones a medida que su trabajo es llevado a cabo por robots, la realidad es que a medida que el ejército de robots crece, el empleo total generado por la industria disminuye, y que en el futuro, hay muchos trabajos que nos resultará raro imaginar desempeñados por personas.

¿Se limita la sustitución a los trabajos de las denominadas 4D, Dull (aburridos), Demeaning (degradantes), Dirty (sucios) o Dangerous (peligrosos), o hablamos de un proceso sensiblemente más complicado y con más matices? ¿Veremos en el futuro a miles de personas contratadas como “content inspectors”, supervisores de contenido y sometidos a enfermedades laborales derivadas de ello, o hablamos de empleos temporales hasta que un algoritmo sea capaz de llevar a cabo esa tarea al nivel adecuado? ¿Tiene sentido tener a un ser humano corriendo en un almacén mientras recibe órdenes por un pinganillo, sentado en una línea de cajas moviendo y escaneando artículos, conduciendo en medio del infernal tráfico de una gran ciudad o enfrentándose a horas de contenidos que reflejan lo peor del ser humano? Y tenga o no sentido, ¿qué pasa con las personas que hoy viven de llevar a cabo esos trabajos?

Cada día que pasa, surgen nuevos trabajos temporales de escasa calidad en logística, conduciendo, en tareas repetitivas o en otras que escasamente podrían considerarse enriquecedoras o esencialmente adecuadas para las habilidades de un ser humano… ¿hablamos de un fenómeno de ajuste, o de una perversión de un capitalismo que va eliminando los controles y los logros que llevó muchos años conseguir? ¿Cuál es el futuro de la relación del reparto de tareas entre máquinas y hombres?

 

IMAGE: Hafakot - 123RF

Cada día está más claro: a medida que las soluciones de machine learning y su aprendizaje rebajan sus barreras de entrada, su manejo a cierto nivel se convierte en la nueva línea imprescindible en el curriculum, en el nuevo talento escaso por el que las compañías están dispuestas a pagar salarios cada vez más elevados. En pleno 2017, poder plantear modelos de machine learning para una gama cada vez más elevada de situaciones está pasando a ser lo que, en su momento, pudo ser poder poner en tu curriculum que utilizabas “informática a nivel de usuario” o que tenías “soltura en el manejo de hojas de cálculo”, un elemento cada día más imprescindible.

Robots que fabrican otros robots, máquinas que se programan a sí mismas, automóviles que cuesta menos asegurar porque tienen prestaciones de conducción semi-autónoma que da lugar a una accidentalidad menor, enormes librerías de vídeos para enseñar conceptos a las máquinas, todo tipo de propuestas para entender y aprender machine learning sin necesidad de programar… no, esto ya no es una cuestión de movimientos propagandísticos y de cuál es el siguiente reto que una máquina consigue hacer mejor que un humano. Esto es la revolución que viene, el gran game changer, con un nivel de impacto sobre nuestras vidas similar al que tuvo en su momento el desarrollo de internet. Lo puedes leer en todas partes.

Cuando todo a tu alrededor, hasta tu smartphone, empieza a incorporar prestaciones basadas en machine learning y es capaz de reconocer tu cara aunque te hayas dejado barba o lleves unas gafas puestas, o de proponerte usos basados en la información que recibes o en los hábitos que muestras habitualmente, lo que nos está diciendo es que hablamos de la próxima frontera, de lo que hay que tener para que los productos y servicios sean competitivos. Hablemos de fabricación, de operaciones, de marketing, de distribución, de servicio al cliente, de marketing o de lo que sea, tenemos que acostumbrarnos a pensar que nos vamos a encontrar con esto en una gama creciente de productos y servicios, y que alguien va a tener que gestionarlos, que saber cómo convertir esas posibilidades en ventajas competitivas. La nueva generación de directivos tendrá necesariamente que pasar por ese desarrollo de habilidades, o bien volver a formarse para adquirirlas. Hablar simplemente de oídas o quedarse con mitos manoseados y lugares comunes no va a ser suficiente.

¿Burbuja? Como en todas las cosas y como en todas las tecnologías anteriores, una parte sí. Pero sin duda, es el momento de asentar conceptos y de amueblar bien nuestro futuro en torno a un tema que va a jugar un importantísimo papel en su definición.

 

Bonnier, G. et G. de Layens, "Flore complète portative de la France, de la Suisse et de la Belgique"En la foto, el Bonnier. Para la mayoría, simplemente un libro viejo. Pero para miles de estudiantes de Biológicas de media Europa, la tortura que simbolizaba el examen de Botánica (en el plan que yo estudié, la asignatura era Fanerogamia, separada de la Criptogamia, que se estudiaba en el año anterior) en el que tenías que identificar, utilizando las claves dicotómicas del Bonnier, un número determinado de especies vegetales, entre las que siempre había algunas gramíneas, con taxonomías particularmente enrevesadas y basadas en atributos mínimamente discernibles, para los que, en ocasiones, era preciso utilizar la lupa binocular. Una tarea ardua, pesada y que para llevar a cabo con ciertas garantías, era preciso acumular una cierta experiencia. Por lo que he podido encontrar, la determinación botánica sigue haciéndose del mismo modo, se sigue utilizando el Bonnier, aunque la edición es más moderna, e incluso sigue formando parte de los temarios de algunas oposiciones a profesorado.

En mi época, a mediados de los ’80, el Bonnier que utilizábamos era exactamente ese de la ilustración (sí, ya sé que parezco el abuelo Cebolleta, pero os prometo que en su momento ya tenía aspecto de libro viejísimo, aunque la edición era de 1972), estaba encuadernado en rústica y con un papel de malísima calidad, no estaba traducido al castellano, y a mí, que en aquel momento ya llevaba algunos años interesado por la tecnología y las bases de datos, me obsesionaba la idea de informatizarlo. Incluso llegué a preparar una estructura de una base de datos y una interfaz sencilla para ello con las herramientas que utilizaba entonces, dBASE y Clipper, todo sobre MS-DOS. De haber seguido con el tema, cosa que no hice al ver el ingente trabajo que habría supuesto digitalizar todas aquellas fichas y atributos de varios miles de especies de plantas vasculares, habría conseguido simplemente una cierta comodidad: en lugar de movernos por las páginas del libro, habríamos podido seleccionar las opciones en una pantalla… visto así, no parecía realmente un gran avance.

Ahora, más de treinta años después, me encuentro a través de Boing Boing un artículo de Nature, Artificial intelligence identifies plant species for science, en el que dan cuenta del desarrollo de un algoritmo de machine learning que va bastante más allá: tras entrenarlo con unas 260,000 imágenes digitalizadas de más de mil especies de plantas en herbarios de todo el mundo – se calcula que hay unos tres mil herbarios de cierta entidad en el mundo, con un total aproximado de unas 350 millones de muestras, de las que tan solo una pequeña parte están digitalizadas – el algoritmo es capaz de determinar la planta que se le está mostrando con unas tasas de acierto aproximadas del 80% (en un 90% de ocasiones, la especie estaba entre las cinco primeras elecciones del algoritmo). Esas tasas de acierto superan las habituales en botánicos expertos en taxonomía (en mi época, para aprobar necesitábamos identificar correctamente tres plantas de un total de cinco, y éramos simples estudiantes de tercer año). 

Cuando ves a un algoritmo capaz de llevar a cabo una tarea cuya dificultad eres capaz de valorar adecuadamente en función de tu experiencia, es cuando de verdad te das cuenta de lo que puede llegar a suponer el machine learning. En su momento, mi intento rudimentario de digitalización simplemente solucionaba un factor de comodidad, reducía una parte de la fricción implicada en la determinación. Ahora, basta con mostrar al algoritmo la imagen digitalizada de la planta, y directamente contesta con su género y especie, con un 80% de acierto.

¿Qué implicaciones tendrá algo así para el desarrollo de la Botánica? En pocos años, teniendo en cuenta el rendimiento del algoritmo y las necesarias correcciones progresivas, ya no existirán investigadores capaces de determinar la especie de una planta sin la ayuda del correspondiente algoritmo: los pocos que puedan hacerlo serán jubilados que aún guarden el Bonnier en su estantería, y recuerden cómo utilizar con un mínimo de soltura sus claves dicotómicas. Y sin embargo, esto no significará una pérdida del valor del profesional como tal, porque solo con los conocimientos de esos profesionales se habría podido llegar a adiestrar a ese algoritmo, y porque el papel de esos profesionales estará ya situado mucho más allá, en un escenario en el que ya no será necesario invertir tiempo ni esfuerzo en la determinación de una planta, porque eso se hará ya de manera automatizada. Será preciso modificar la forma de enseñar la disciplina, incluir otro tipo de ejercicios, otros materiales y otras disciplinas, ampliando así las fronteras del conocimiento. ¿Será la idea de perder la habilidad de determinar plantas a mano una gran pérdida como tal para la disciplina? La respuesta es simplemente… no. Del mismo modo que hoy prácticamente nadie sería capaz de escribir en cuneiforme sobre una tabla de arcilla.

¿Algo que ver con la idea de robots “inteligentes”? No, un algoritmo que clasifica especies vegetales lleva a cabo una tarea que hasta entonces, solo un humano podía hacer, pero está muy lejos de la inteligencia: simplemente es capaz de llevar a cabo una tarea muy definida en función de una serie de atributos de una muestra. Sácalo de ese entorno, y necesitará muchísimos ajustes para poder aplicarlo a otra tarea. La inteligencia es otra cosa. ¿Algo que ver con la idea de robots que  sustituyen a expertos en Botánica? En absoluto, y de hecho, la idea parece, vista así, de un simplismo que asusta. Hablamos de otras cosas: de aplicar la inteligencia humana a tareas de más entidad, de liberar recursos que no estaban siendo optimizados… de más progreso y más avance en la disciplina. ¿Podríamos imaginar de alguna manera a profesionales de la disciplina negándose a colaborar con el entrenamiento del algoritmo por miedo a ser eventualmente sustituidos? La sola idea resulta absurda, prácticamente ofensiva.

¿Cuántas de las cosas que hoy consideramos exclusivamente humanas acabarán haciendo algoritmos? ¿Cuántas cosas más podremos hacer cuando sea así?

 

Google what? Google lanza una actualización prácticamente sin nombre de una actualización igualmente anunciada sin nombre en diciembre del pasado año, confirmando que es, posiblemente, una de las empresa que peor entiende la comunicación del mundo, posiblemente la más torpe de su tamaño e importancia a la hora de comunicar al mundo lo que hace.

El nuevo desarrollo está basado en un feed, en una serie de contenidos que acompañan a la caja de búsqueda y que se actualizan constantemente en función de los intereses del usuario y la coyuntura en la que se encuentra, al estilo de lo que conocían los que utilizaban Google Now. Pero ahora, lo que pretende Google es que pasemos a utilizar su página o su app para informarnos de lo que nos interesa, llenar ese enorme espacio blanco característico con aquellas noticias o temas que sus algoritmos creen que queremos ver.

El problema de Google es claro: la búsqueda nos proporciona información cuando, en efecto, queremos activamente buscar algo. Pero cuando no es así, cuando lo único que queremos es enterarnos de lo que pasa en el mundo, Google se había convertido en irrelevante con la imperfecta excepción de Google News (que nos informaba de las noticias de los medios, no necesariamente de cualquier otro contenido no mediático en el que pudiésemos tener interés). Desde hace mucho tiempo, cuando queremos informarnos de según qué temas, acudimos a sitios como Twitter, Facebook, LinkedIn, Pinterest, Flipboard y muchos otros, pero decididamente no a Google. Google es para hacer una búsqueda, no para informarte de los temas que te interesan.

Ahora, Google pretende aprovechar toda la información que obtiene de nosotros para que sus algoritmos entiendan en qué cosas estamos interesados, y construyan con ello un feed en permanente cambio, un suministro permanente de información relevante sobre lo que aparentemente queremos saber. Para ello, necesita diferenciar entre lo que buscamos de manera coyuntural, para obtener un resultado rápido posiblemente importante en el momento pero no necesariamente representativo de nuestros intereses, y lo que sí nos interesa de verdad, manteniendo las primeras como simples búsquedas, pero permitiéndonos que pasemos a seguir las segundas, con un botón de Follow en los resultados que permita ajustar el feed que veremos al entrar en Google con los resultados relevantes en ese tema.

La idea, como tal, no es mala. Algunas cosas que Google ha hecho con Google Now utilizando la información de nuestros correos, por ejemplo, son casi mágicas, y decididamente útiles. Sin duda, la iniciativa refleja la obsesión de Google por apartarse de un terreno, lo social, que jamás ha logrado entender y en el que ha cosechado posiblemente sus mayores fracasos como compañía: la relevancia de nuestro feed, de los temas que queremos seguir y que aparecerán ante nuestros ojos, la marcamos nosotros, no nuestra red, ni nuestros amigos, ni la agenda mediática. Nuestro feed es nuestro, no de nuestros amigos o conocidos, una especie de anti-Facebook o de rechazo a lo social: dame lo que me interesa a mí, no me des más fotos de los bebés de mis amigos, por muy monos que sean. Habrá que ver si eso funciona adecuadamente, o si se convierte en una manera de que nos perdamos aquellas noticias que posiblemente en principio no estuviesen entre nuestros intereses pero sean verdaderamente relevantes, y por tanto pasen a interesarnos. Seguramente no marcaría a Corea del Norte como uno de mis intereses, pero si Kim Jong Un lanza un misil nuclear, me temo que, quiera o no, pasa a interesarme, y seguramente bastante. Con seguridad no marcaría determinadas cosas como un interés mío, pero si se convierte súbitamente en un interés de todos mis amigos, seguramente querré saberlo, aunque solo sea para tener tema de conversación con ellos y que no parezca que vivo aislado en una cueva.

La idea de Google parece ser evitar la construcción de esa mítica burbuja definida por Eli Pariser en su libro The filter bubble que, supuestamente, dependía de las acciones de nuestro entorno, de nuestros amigos, de nuestros Likes. De alguna manera, Google parece creer que eliminando los amigos, los Likes, la elección de fuentes concretas y toda traza de mecanismos sociales, podremos eliminar esa burbuja. La gran realidad, mucho me temo, es que esa burbuja es algo que construimos nosotros mismos, que ahora pasaremos simplemente a vivir en burbujas construidas algorítmicamente, y que lo social, al menos, nos daba cierta posibilidad, a los que tenían una mentalidad suficientemente abierta, de que entrasen otros elementos en la burbuja que no habrían seleccionado como intereses ellos mismos. Sinceramente, entiendo el interés de Google en abandonar los desarrollos sociales viendo lo espantosamente mal que lo han hecho en ellos tradicionalmente, pero tengo serias dudas de que sustituir los mecanismos sociales por otros algorítmicos sea capaz de eliminar ninguna burbuja.

Por otro lado, la idea de seguir activamente temas y marcarlos en una página genera una desagradable sensación de tiempo perdido, de déjà vu, de nostalgia del producto cuyo abandono fue posiblemente uno de los mayores errores de Google: el cierre de Google Reader. Con Reader, Google no solo tenía una imagen clarísima y no filtrada de mis intereses, sino que, además, tenía una base perfecta para que, con mis acciones, educase a sus algoritmos sobre lo que realmente me interesaba y lo que no. Desde la base de Google Reader, la compañía podía haber construido el super-producto capaz de hacer que todos sus clientes se sintiesen bien y activamente informados. A día de hoy, sería el líder en información. Y en su lugar, renunció a entenderlo, lo cerró, y envió a sus usuarios a buscarse la vida a otras compañías, despreciándolos totalmente y sin darles ninguna solución propia. Con ello renunció a toda posible aplicación de lo que en aquel momento, en 2013, ya era una creciente realidad: el machine learning. Si querías aprender de los intereses de tus usuarios y usar esa información para educar a tus algoritmos, Google Reader era el producto perfecto. Viendo lo que Google lanza ahora, a mediados de 2017, podemos ya asegurar sin miedo a equivocarnos que el cierre de Google Reader en 2013 fue un absurdo y estúpido error de primera magnitud, y que el pequeño producto que desapareció en una Spring Cleaning firmada por Urs Hölzle representaba mucho más y tenía mucha más importancia potencial de lo que algún torpe directivo nunca fue capaz de ver. Desde el cierre de Google Reader me informo en Feedly, convertido en hogar para los varios millones de “refugiados” de Reader, y resultará muy difícil sacarme de ahí, y opto por redes sociales para esa parte de la información que no proviene de los temas que activamente sigo, sino de la coyuntura exterior o de lo que leen las personas a las que decido seguir.

El espacio que ahora Google pretende reclamar está ahora ocupado por un montón de aplicaciones, la mayoría con base social, que aspiran a mantener a sus usuarios bien informados. Y es ahora cuando viene Google a decirles que si marcan determinadas búsquedas, será esa página, que identifican con “búsqueda y nada más”, la que les mantendrá informados de lo que les interese. Suerte. No digo que no vaya a funcionar, podría hacerlo porque hay muchos usuarios que se informarán simplemente con lo que les pille más a mano… pero es una espantosa forma de reconocer un error y de demostrar que se han perdido miserablemente más de cuatro años. ¿Mi experiencia por el momento? Aquello que los algoritmos de Google creen que es en lo que estoy interesado coincide más bien poco con mis verdaderos intereses. A lo mejor es que soy un raro.

Ahora, Google quiere que vayas a su página no solo a buscar cosas, sino a informarte en función de lo que sus algoritmos estiman que te interesa. Ya sabes los riesgos de eso: no le tomes mucho cariño, porque como todo servicio de Google, te lo pueden cerrar de un día para otro según les dé por ahí, de manera completamente errática y sin que exista una razón clara. Para los periódicos, una posible fuente de tráfico además de Google News (salvo que vivas en España y no tengas Google News), o una manera de depender más aún de los algoritmos de la compañía, algo que sin duda deberán tener en cuenta. Pero si aún así te gusta y eres capaz de cambiar la percepción de la página de Google para que, además de un buscador, sea una especie de periódico personal que posiblemente llegue a reflejar tus intereses, ya sabes… di adiós al icónico espacio blanco de la página de búsqueda, y ahí lo tienes.

 

IMAGE: Leo Blanchette - 123RFUna noticia en el Technology Review del MIT, Your best teammate might some day be an algorithm, me lleva a pensar en ese balance entre el desarrollo de más y más capacidades en las máquinas que, sin duda, pueden llevar a que muchos trabajos dejen de tener sentido, y la visión particular que siempre he tenido de mi trabajo viéndose cada vez más potenciado por el uso de ese tipo de tecnologías.

Francamente, nunca he tenido demasiado miedo de que un algoritmo me deje sin trabajo. Será porque me dedico a algo que pocos ubican en las quinielas de trabajos a ser rápidamente sustituidos por robots o por la flexibilidad absoluta que la institución para la que trabajo me ofrece a la hora de enfocar mi actividad, pero siempre he pensado que si todo mi entorno se ve revolucionado por la tecnología, seguiré teniendo posibilidad de estudiarlo y explicárselo a alguien a quien le pueda añadir valor.

Así, el enfoque de un desarrollo de herramientas algorítmicas enfocado en la colaboración me lleva a plantearme qué cosas podré hacer cuando algunas de las partes de mi trabajo que menos me gustan y que, posiblemente, menos valor añade, puedan ser llevadas a cabo por algoritmos, cada vez más fáciles de desarrollar y educar gracias a herramientas cada vez más sencillas.

Nuestro trabajo y nuestra vida en general están cada vez más rodeados de herramientas, que aportan una eficiencia cada vez mayor. Sin embargo, fallan aún algunos elementos: el primero de todos ellos es el que afecta a la visión de automatización incompleta de muchas tareas, que no llegan a suponer automatismos exactos, sino que están sujetas a una cierta variabilidad o “toque humano”, y que precisamente por eso, las herramientas aún no aciertan a llevar a cabo con el nivel de rendimiento adecuado. Durante muchos años, las herramientas se han planteado la automatización como una manera de replicar procesos de manera idéntica y predecible, un enfoque que se ha mostrado limitado. La posibilidad de introducir en esos algoritmos pasos que repliquen en algunos puntos el juicio de un humano en función de datos generados anteriormente permitirían establecer procesos de automatización mucho más potentes, planteados en función de diversos parámetros, y con mayor posibilidad de añadir valor. Hace relativamente poco tiempo, separar el spam del correo electrónico era una tarea pesada y manual. Ahora, prácticamente nada escapa al algoritmo, y la carpeta de spam ya prácticamente no merece supervisión manual. Y como eso, mil cosas más.

Muchas de las tareas que llevo a cabo a lo largo del día precisan de atributos que aún son inequívocamente humanos. Pero muchos otros tienen un componente mucho más mecánico y repetitivo, y podrían beneficiarse claramente de un tratamiento algorítmico. Antes de ver cómo los robots roban nuestros trabajos, veremos muchos otros casos de desarrollo de algoritmos que nos permitan niveles de automatización muy superiores que los que conocemos hoy, en tareas que no son completamente repetitivas, pero que llegan a parecérnoslo, y que potenciarán nuestras capacidades al tiempo que liberan tiempo para otras tareas. En muchos casos, cuando los algoritmos y los robots ya puedan hacer nuestro trabajo, nosotros ya estaremos haciendo otros trabajos diferentes, siguiendo un enfoque que, en función de lo ocurrido en épocas anteriores que ya son historia, me parece mucho más adecuado, constructivo y lógico. Cuantos más algoritmos veo, más quiero trabajar con ellos, aplicarlos a mi día a día y sentir que potencian mis capacidades como ser humano.