IMAGE: Sajapong Rhienmora - 123RFUna compañía china de machine learning aplicada al reconocimiento de voz y textos, iFlyTek, poco conocida fuera del país, alcanza los quinientos millones de usuarios y es utilizada a diario por millones de personas en sus transacciones cotidianas, en todo aquello que tenga que ver con traducciones, transcripciones de voz a texto, etc.

Contrariamente a lo que podría parecer, hablar de quinientos millones de usuarios no es simplemente una forma de presumir del tamaño de la compañía, de su éxito o de su nivel de adopción: dado que hablamos de una compañía de machine learning, dedicada a educar a algoritmos para una serie de funciones que tienen que ver con el ámbito del procesamiento del lenguaje, hablamos en realidad de una compañía con una ventaja competitiva brutal, verdaderamente difícil de superar: es capaz de generar y trabajar con muchísimos más datos que prácticamente cualquiera de sus competidores. En machine learning, tener acceso a un flujo de datos bueno, consistente y con un elevado volumen puede ser completamente decisiva a la hora de definirse como un líder en un campo determinado. Simplemente, tus algoritmos cuentan con muchísimo más material sobre el que trabajar, con el que entrenarse, y los resultados y la calidad del producto puede mejorar de forma mucho más rápida. En machine learning, los grandes números no son una complicación, sino una enorme fuente de ventaja.

Ayer, participé en un curso in-company en una gran compañía, en la que me comentaban que su subsidiaria en China se había convertido claramente en uno de los más importantes generadores de tendencias. Para aquella compañía, hablar con los directivos que habían pasado tiempo en el país se había convertido en una manera de reconocer tendencias, de evaluar la importancia de determinadas cuestiones, de valorar los distintos elementos del escenario tecnológico. Vivir un tiempo en una sociedad en la que herramientas como el smartphone o la mensajería instantánea son utilizados constantemente y para todo por una parte enormemente significativa de la población, y no ya para su función supuestamente primigenia, sino para muchísimas otras, como pagar o identificarse, genera una sensación de fast forward que, sin duda, tiene un importante valor empresarial. Entender las tendencias de consumo, el desplazamiento de buena parte del comercio al canal online, los efectos de la logística avanzada o los desarrollos más punteros en interacción con el cliente es algo que permite entender muchas cosas, y con un valor indudable si gracias a ello aprendes a valorarlo antes que tus competidores. En China se comienza a hablar ya de una supuesta “muerte del smartphone“, cuando un buen número de las funciones para las que hoy necesitamos el terminal y una aplicación sean sustituidas por elementos biométricos que llevamos en todo momento encima porque forman parte de nosotros – con todos los efectos que ello puede conllevar sobre cuestiones como el control, la vigilancia o la privacidad.

La próxima semana tengo una intervención en un evento ante jóvenes emprendedores chinos. Se trata de un evento periódico, que se repite cada cierto tiempo. Hace algunos años, no tantos, recuerdo cómo ese evento consistía, básicamente, en que unos cuántos profesores explicásemos a aquellos emprendedores chinos “cómo de moderno” era el mundo occidental. Ahora, francamente… no tengo claro qué contarles, y decididamente, el mensaje de fondo no va a ser en absoluto ese. El acceso a su enorme mercado, en base en gran medida gracias a un comportamiento profundamente autárquico, a un pragmatismo brutal y a unas reglas de juego claramente sesgadas, ha convertido al mercado chino en un escaparate de tendencias en el que muchas compañías comienzan a buscar claves, y a las compañías que triunfan en el mercado chino en potenciales líderes si consiguen dar el salto fuera de su país. La tecnología china ya no copia, o no solo: ahora también lidera. Y no es casualidad, sino parte de una estrategia cuidadosamente anticipada y preparada.

Los números son, sin duda, una gran ventaja. En los tiempos que corren, cuando dependemos de ellos para educar a algoritmos, claramente más aún: se puede convertir, bien utilizado, en toda una formidable ventaja competitiva. Y China lo sabe.

 

IMAGE: Robodread - 123RFEl título del liderazgo económico mundial no es precisamente honorífico. A los Estados Unidos, esa posición le ha brindado durante décadas una ventaja fundamental, y se ha convertido en uno de los factores más importantes a la hora de dar forma al mundo tal y como lo conocemos. Pero a estas alturas, todo aquel que estudie o planifique de cara al futuro debería tener cada vez más claro que esa posición está a punto de cambiar: el próximo liderazgo mundial no va a ser ejercido por los Estados Unidos, sino por otro país que lleva tiempo preparándose para ello: China.

El plan de China para convertirse en líder mundial absoluto tiene mucho sentido, y empieza por entender el factor más importante en esa transición: los datos. Olvida todo planteamiento de la privacidad como un derecho: en un país en el que el estado es el principal proveedor de datos, lo sabe absolutamente todo y lo comparte con sus compañías, cuestiones como autentificarte con tus datos biométricos, disponer de un sistema de rating crediticio universal o desarrollar el famoso Departamento de Precrimen se convierten en posibilidades reales, que no chocan con todos los obstáculos habituales que encontramos lógicos y normales en el garantista mundo occidental.

El país ha conseguido dar forma a un mercado doméstico enorme, con actores completamente diferentes a los del resto del mundo: las principales compañías tecnológicas ya no son únicamente norteamericanas, y se ven ya preparadas para tomar por asalto los mercados mundiales, mientras las empresas líderes de la etapa anterior se ven acosadas por intentos legislativos de reducir un poder considerado excesivo. En China, no es que Apple no sea un competidor importante en su segmento principal, el smartphone: es que está a punto de dejar de estar incluida entre las cinco primeras, con compañías chinas por encima como Huawei, Oppo, Vivo o Xiaomi que, además, ya conquistan los mercados internacionales. Y en tecnologías como 5G ocurre exactamente lo mismo.

El liderazgo chino comienza por un férreo control de una educación orientada al futuro, sigue con fuertes inversiones en desarrollo y en investigación, y continúa con ídolos locales con conocimiento del mercado como Andrew Ng o Kai-Fu Lee. El país ya se plantea superar a los Estados Unidos como líder en el desarrollo de inteligencia artificial en un futuro cercano, cuenta con los mejores laboratorios en automatización de la producción, está entrando con éxito en las aplicaciones más punteras del machine learning como los vehículos autónomos. Cualquier compañía que quiera trabajar en un entorno en el que la regulación se adapte al desarrollo de tecnologías con impacto en el futuro en lugar de plantearse mil impedimentos y resistencias, se encontrará en su salsa en China. Una actitud diferente hacia el futuro, que está empezando a dar sus frutos, con fortísimas posiciones en mercados emergentes como África o América Latina, y en la que todo se pone al servicio de los planes del estado para esa dominación mundial.

¿Positivo? ¿Negativo? Da igual. China ha planteado su modelo, con elementos que resultan implanteables en el mundo occidental, y ha convertido elementos como la ausencia de una democracia o la importancia de los derechos humanos en una ventaja inalcanzable. Te gustará o no, pero China va a ser el próximo líder económico mundial, con todo lo que ello conlleva. Ve preparándote.

 

Bonnier, G. et G. de Layens, "Flore complète portative de la France, de la Suisse et de la Belgique"En la foto, el Bonnier. Para la mayoría, simplemente un libro viejo. Pero para miles de estudiantes de Biológicas de media Europa, la tortura que simbolizaba el examen de Botánica (en el plan que yo estudié, la asignatura era Fanerogamia, separada de la Criptogamia, que se estudiaba en el año anterior) en el que tenías que identificar, utilizando las claves dicotómicas del Bonnier, un número determinado de especies vegetales, entre las que siempre había algunas gramíneas, con taxonomías particularmente enrevesadas y basadas en atributos mínimamente discernibles, para los que, en ocasiones, era preciso utilizar la lupa binocular. Una tarea ardua, pesada y que para llevar a cabo con ciertas garantías, era preciso acumular una cierta experiencia. Por lo que he podido encontrar, la determinación botánica sigue haciéndose del mismo modo, se sigue utilizando el Bonnier, aunque la edición es más moderna, e incluso sigue formando parte de los temarios de algunas oposiciones a profesorado.

En mi época, a mediados de los ’80, el Bonnier que utilizábamos era exactamente ese de la ilustración (sí, ya sé que parezco el abuelo Cebolleta, pero os prometo que en su momento ya tenía aspecto de libro viejísimo, aunque la edición era de 1972), estaba encuadernado en rústica y con un papel de malísima calidad, no estaba traducido al castellano, y a mí, que en aquel momento ya llevaba algunos años interesado por la tecnología y las bases de datos, me obsesionaba la idea de informatizarlo. Incluso llegué a preparar una estructura de una base de datos y una interfaz sencilla para ello con las herramientas que utilizaba entonces, dBASE y Clipper, todo sobre MS-DOS. De haber seguido con el tema, cosa que no hice al ver el ingente trabajo que habría supuesto digitalizar todas aquellas fichas y atributos de varios miles de especies de plantas vasculares, habría conseguido simplemente una cierta comodidad: en lugar de movernos por las páginas del libro, habríamos podido seleccionar las opciones en una pantalla… visto así, no parecía realmente un gran avance.

Ahora, más de treinta años después, me encuentro a través de Boing Boing un artículo de Nature, Artificial intelligence identifies plant species for science, en el que dan cuenta del desarrollo de un algoritmo de machine learning que va bastante más allá: tras entrenarlo con unas 260,000 imágenes digitalizadas de más de mil especies de plantas en herbarios de todo el mundo – se calcula que hay unos tres mil herbarios de cierta entidad en el mundo, con un total aproximado de unas 350 millones de muestras, de las que tan solo una pequeña parte están digitalizadas – el algoritmo es capaz de determinar la planta que se le está mostrando con unas tasas de acierto aproximadas del 80% (en un 90% de ocasiones, la especie estaba entre las cinco primeras elecciones del algoritmo). Esas tasas de acierto superan las habituales en botánicos expertos en taxonomía (en mi época, para aprobar necesitábamos identificar correctamente tres plantas de un total de cinco, y éramos simples estudiantes de tercer año). 

Cuando ves a un algoritmo capaz de llevar a cabo una tarea cuya dificultad eres capaz de valorar adecuadamente en función de tu experiencia, es cuando de verdad te das cuenta de lo que puede llegar a suponer el machine learning. En su momento, mi intento rudimentario de digitalización simplemente solucionaba un factor de comodidad, reducía una parte de la fricción implicada en la determinación. Ahora, basta con mostrar al algoritmo la imagen digitalizada de la planta, y directamente contesta con su género y especie, con un 80% de acierto.

¿Qué implicaciones tendrá algo así para el desarrollo de la Botánica? En pocos años, teniendo en cuenta el rendimiento del algoritmo y las necesarias correcciones progresivas, ya no existirán investigadores capaces de determinar la especie de una planta sin la ayuda del correspondiente algoritmo: los pocos que puedan hacerlo serán jubilados que aún guarden el Bonnier en su estantería, y recuerden cómo utilizar con un mínimo de soltura sus claves dicotómicas. Y sin embargo, esto no significará una pérdida del valor del profesional como tal, porque solo con los conocimientos de esos profesionales se habría podido llegar a adiestrar a ese algoritmo, y porque el papel de esos profesionales estará ya situado mucho más allá, en un escenario en el que ya no será necesario invertir tiempo ni esfuerzo en la determinación de una planta, porque eso se hará ya de manera automatizada. Será preciso modificar la forma de enseñar la disciplina, incluir otro tipo de ejercicios, otros materiales y otras disciplinas, ampliando así las fronteras del conocimiento. ¿Será la idea de perder la habilidad de determinar plantas a mano una gran pérdida como tal para la disciplina? La respuesta es simplemente… no. Del mismo modo que hoy prácticamente nadie sería capaz de escribir en cuneiforme sobre una tabla de arcilla.

¿Algo que ver con la idea de robots “inteligentes”? No, un algoritmo que clasifica especies vegetales lleva a cabo una tarea que hasta entonces, solo un humano podía hacer, pero está muy lejos de la inteligencia: simplemente es capaz de llevar a cabo una tarea muy definida en función de una serie de atributos de una muestra. Sácalo de ese entorno, y necesitará muchísimos ajustes para poder aplicarlo a otra tarea. La inteligencia es otra cosa. ¿Algo que ver con la idea de robots que  sustituyen a expertos en Botánica? En absoluto, y de hecho, la idea parece, vista así, de un simplismo que asusta. Hablamos de otras cosas: de aplicar la inteligencia humana a tareas de más entidad, de liberar recursos que no estaban siendo optimizados… de más progreso y más avance en la disciplina. ¿Podríamos imaginar de alguna manera a profesionales de la disciplina negándose a colaborar con el entrenamiento del algoritmo por miedo a ser eventualmente sustituidos? La sola idea resulta absurda, prácticamente ofensiva.

¿Cuántas de las cosas que hoy consideramos exclusivamente humanas acabarán haciendo algoritmos? ¿Cuántas cosas más podremos hacer cuando sea así?

 

IMAGE: Rangizzz - 123RFLa discusión entre demócratas y republicanos al hilo de los sucesivos intentos de anulación de Obamacare en los Estados Unidos han puesto de actualidad la discusión sobre el futuro del cuidado de la salud. En un país como los Estados Unidos, que históricamente ha carecido de un sistema universal de cuidado de la salud, la Patient Protection and Affordable Care Act, conocida como Obamacare, supuso un impedimento para las posibilidades de las aseguradoras de salud de discriminar a los pacientes en función de sus condiciones preexistentes, de introducir techos de gasto anuales o totales, de expulsar o denegar la renovación de la póliza a personas que contraían determinadas enfermedades, o de incrementar de manera abusiva las franquicias, entre otras posibilidades.

Con el avance de las técnicas asociadas al machine learning, las posibilidades de las aseguradoras de salud de desarrollar sistemas algorítmicos capaces de predecir el coste asociado con el cuidado de la salud de un paciente específico se incrementan de manera notable. Si el uso de este tipo de sistemas no se pone bajo un nivel adecuado de control que impida el abuso, las compañías privadas podrían utilizar de este tipo de sistemas para maximizar sus beneficios a costa de la expulsión o la limitación del gasto en pacientes con mayores probabilidades de incurrir en tratamientos de coste elevado.

Por otro lado, todo apunta a que el futuro de la salud se basa, fundamentalmente, en la gestión de modelos preventivos, apoyados en la entrada de nuevos competidores como Apple o Amazon, la disponibilidad progresiva de nuevos dispositivos y pruebas diagnósticas, el desarrollo del diagnóstico genético a nuevos niveles y el sinfín de wearables y dispositivos afines inicialmente dedicados al fitness o al bienestar, pero con cada vez mayor interés en el mercado de la salud preventiva.

Indudablemente, nos dirigimos hacia un futuro en el que no recurriremos al sistema de salud únicamente cuando notemos los síntomas de una enfermedad, sino en el que un conjunto de dispositivos y prácticas nos permitirán monitorizarla de manera constante. En ese tipo de entorno, garantizar que la compañía encargada de velar por mi salud no utiliza mis datos para denegarme la póliza en función de mi probabilidad de contraer enfermedades que originen un nivel de gasto elevado se convierte en fundamental: no hacer nada equivale a sostener un sistema que se enriquece a partir de una cartera de clientes sanos, mientras expulsa a los más necesitados de cuidados con el fin de maximizar sus beneficios.

¿Cómo desarrollar mecanismos de control sobre las aseguradoras que garanticen un comportamiento ético, al tiempo que permitimos que restrinjan, por ejemplo, comportamientos voluntarios del paciente que sean susceptibles de generar un gasto más elevado? ¿Cómo tratar ya no simplemente a un paciente que fuma, sino a uno que de manera voluntaria se niega a monitorizar determinados aspectos de su salud o a someterse a determinadas pruebas rutinarias, lo que podría conllevar que el tratamiento de una eventual afección resultase mucho más complejo al ser diagnosticado en una fase más avanzada? El diseño de un sistema de control de las aseguradoras que permita, por otro lado, ejercer también un cierto nivel de incentivo o desincentivo de determinados comportamientos en los pacientes supone un reto importante, que por otro lado, hace referencia ya a un entorno que está ya prácticamente entre nosotros: con los datos que una aseguradora de salud puede obtener sobre un usuario simplemente a través del uso de los servicios médicos a lo largo del tiempo, pueden llevarse a cabo ajustes del importe de la póliza destinados a expulsar de facto a ese paciente en función de una previsión de siniestralidad, y todo ello en un entorno en el que los importes de las pólizas suelen ser completamente arbitrarias y carentes de mecanismos de control o de transparencia. Si una compañía aseguradora puede, básicamente, poner a mi póliza el coste que buenamente quiera sin prácticamente control alguno, ¿cómo evitar el abuso y los comportamientos no éticos ante algoritmos cada vez más potentes, mejor entrenados y capaces de predecir el nivel de gasto en el que puede incurrir un paciente? ¿Cómo evitar el abuso en un entorno en el que, por definición, una de las partes va a tener cada vez más y mejor información, tanto agregada como individualizada, sobre la otra?

 

IMAGE: Yauhen Korabau - 123RFMi columna en El Español de esta semana se titula “Inteligencia artificial y miedos irracionales” (pdf), y es un comentario al hilo de las declaraciones de Elon Musk, sin duda una de las personas más influyentes, respetadas y seguidas del actual entorno tecnológico, en las que reclama “regulación para la amenaza existencial que supone la inteligencia artificial, antes de que sea demasiado tarde“.

Que una petición de este tipo venga nada menos que de la persona que convierte en realidad retos tecnológicos tan complejos como el vehículo eléctrico, la generación de energía sostenible o la exploración espacial es algo que resulta, en principio, inquietante. Sin duda, Elon Musk no es un indocumentado que opine desde la barra de un bar. Que su preocupación se una, además, a las de personas como el físico teórico Stephen Hawking o el fundador de Microsoft, Bill Gates, podría desencadenar toda una epidemia de miedos y prevenciones. Sin embargo, el hecho de que ninguno de ellos tenga experiencia concreta y directa en la investigación o el desarrollo de este tipo de tecnología es algo que debe más bien llevarnos a considerarlo más bien como un caso de libro del llamado argumento o falacia de autoridad: el hecho de que sean personas indudablemente destacadas en otros ámbitos de la ciencia o la industria no convierte necesariamente sus preocupaciones en elementos que no puedan ser discutidos o puestos en duda.

En múltiples ocasiones he hablado de las enormes posibilidades del machine learning, la parte que considero en este momento más real y prometedora de eso que se ha dado en llamar inteligencia artificial y que no deja de ser un conjunto laxo de tecnologías que algunos piensan que terminarán llevando a que una máquina piense como una persona. Por el momento, las máquinas son capaces de muchas cosas: el hecho de que sean capaces de aprender a partir de un conjunto de datos dentro de un escenario sujeto a una serie de restricciones y reglas claras e inmutables, por ejemplo, es algo que lleva a cientos de compañías de todo el mundo a pagar por herramientas que permiten tal posibilidad, y que hacen que puedan optimizar procesos y convertirlos en ahorros o en ganancias de eficiencia. Las máquinas son capaces de reconocer imágenes, de participar en conversaciones, y por supuesto, como es bien sabido por su uso como argumento publicitario, son capaces de ganar a los humanos en cosas como el ajedrez, el Jeopardy, el Go o el póker. Sin embargo, en todos esos casos seguimos hablando de lo mismo: de la dedicación de la máquina a una tarea que se intenta limitar de todas las maneras posibles a un escenario completamente cognoscible, a un conjunto de reglas fijas y un contexto estable en el que, además, sea posible acumular y analizar una gran cantidad de datos. Extrapolar estos casos para imaginar una inteligencia “completa”, un robot capaz de tratar de manera inteligente una situación general, no limitada ni restringida por una serie de reglas fijas, es algo tentador, pero no real. Pasar de ver algoritmos capaces de construir procesos de aprendizaje en tareas específicas a imaginarse a Skynet, esa red de ordenadores de Terminator convencida de que debe acabar con la raza humana es algo indudablemente fácil, pero para considerarlo una realidad es preciso pasar por un sinnúmero de saltos conceptuales que están aún muy, pero que muy lejos, si es que en algún momento llegan a tener algún viso de realidad.

Reclamar regulación sobre una tecnología o conjunto de tecnologías antes de que se desarrollen es un problema. La regulación parte de una base muy problemática, y es que muy pocas veces se desarrolla de la manera adecuada, y tiende a basarse en la restricción de posibilidades. Eso la convierte, por un lado, en algo por lo general imposible de llevar a ejecución en un mundo en el que esa regulación tiene en prácticamente todos los casos un ámbito estrictamente territorial – los intentos de regulación a nivel global son pocos y, por lo general, con desigual nivel de cumplimiento – y, por otro, en una manera de identificar los elementos que permitirían, en caso de obtenerse, generar una supuesta ventaja. Regular – o mejor dicho, restringir – el uso de transgénicos en Europa, por ejemplo, o de tecnologías de manipulación genética en otros países es algo que ya está siendo activamente utilizado en otros países para obtener ventajas tangibles en términos de productividad y de avance científico. Plantear que sistemas regulatorios que resultan tan malos e ineficientes se apliquen a un conjunto de tecnologías con tanto potencial, y generar una especie de histeria colectiva en torno a la posibilidad de robots más inteligentes que las personas desplazándose por las calles y dedicándose a matar todo lo que se mueve, como si algo así fuese a llegar pasado mañana, me parece inadecuado y peligroso. Y cuantas más personas conozco trabajando directamente en el ámbito del machine learning, de la IA o de la robótica, más me convenzo de que es así. Por muchas películas que veamos, Skynet no está ni se le espera.

Esperemos que esas peticiones de regulación no lleguen a ningún político temeroso e inspirado. Y mientras tanto, sigamos trabajando.