IMAGE: Janajech - Creative Commons BY SADos artículos largos muy recomendables hablan sobre la evolución de la publicidad en la red y cómo pasó de ser una actividad que meramente trasladaba el negocio del papel a la pantalla, y pasó a ser el dominio de la matemática, la estadística y la analítica. Por un lado, Adrianne Jeffries incide en el origen de la publicidad programática, la que a día de hoy crece de manera más pronunciada en prácticamente todos los mercados, y su origen por parte de Right Media en 2005, en How to succeed in advertising (and transform the internet while you’re at it). Por el otro, Ken Auletta describe en How The Math Men overthrew The Mad Men o detallando cómo los “math men” destronaron a los “Mad Men” e incide en el cambio de los perfiles requeridos para trabajar en una industria a la que la transformación digital ha llegado decididamente para quedarse – con todo lo que ello conlleva. Me han parecido lecturas imprescindibles para cualquier que aspire a entender tanto el panorama de la publicidad en la red, como para quienes busquen referencias para anticipar el efecto de la automatización, la algoritmia y el machine learning sobre cualquier industria.

¿Cómo se decidía, hace algunos años, el mix de medios en los que se programaba una campaña? Básicamente se dependía de agencias de medios. Una industria con una marcada tendencia a la opacidad y la ocultación de información, que no solo vive de la intermediación entre anunciantes y soportes, sino que además, lo hace infringiendo una de las reglas fundamentales de la teoría de agencia: además de hacer una labor de agente supuestamente a favor del anunciante, las agencias también cierran acuerdos con las publicaciones, a las que demandan el pago de extratipos o comisiones por volumen, lo que impide que esa labor de intermediación tenga lugar en términos transparentes. Bajo unas condiciones así, el anunciante nunca puede saber si los medios que la agencia le recomienda son los que realmente convienen para exponer su mensaje al segmento al que debe llegar, o si simplemente la agencia, como ocurre en algunos casos, se limita a recomendarle los medios que le ofrecen un extratipo más elevado, una mejor comisión.

¿En qué se ha convertido, en un número creciente de casos, esa actividad? En un proceso, la compra programática, en el que la intervención humana se reduce únicamente a la determinación del target y de una serie de restricciones, mientras la plataforma ofrece oportunidades de compra y las asigna en función de una subasta en tiempo real. En una sola generación de desarrollo algorítmico, las personas hemos pasado a ser relativamente prescindibles en el flujo productivo de la industria publicitaria, en las decisiones del día a día del tipo “lancemos esta campaña aquí o allí”, y muchos de los procesos han pasado a depender únicamente de la interacción entre anunciantes y soportes dentro de una plataforma publicitaria.

Sin embargo, esto no ha determinado ningún tipo de éxodo o apocalipsis: la transformación se ha dado de una manera razonablemente ordenada, las compañías han ido incorporando – en la mayoría de los casos – o formando – en menor medida – los perfiles que necesitaban, se han creado nuevos puestos, y se ha reducido el papel de algunos intermediarios que, en el nuevo contexto, ya no aportaban valor ni valían en absoluto lo que pretendían cobrar. Esos intermediarios no han desaparecido, y se mantienen básicamente gracias a los hábitos de anunciantes que aún no se han dado cuenta o ha entendido que el mundo ha cambiado, que simplemente no quieren complicaciones ni riesgos de ningún tipo, o que prefieren sacrificar margen a perder familiaridad con los procesos de negocio que han conocido durante toda su vida profesional. Han surgido nuevos intermediarios, no todos transparentes ni honestos, que van desde los que controlan flujos de tráfico hasta los que lo fabrican, lo falsean y lo venden, y la industria, sencillamente, ha cambiado hasta el punto de que si alguien que trabajase en la publicidad durante la primera década del siglo fuese descongelado en la segunda, seguramente tendría graves problemas para desempeñar su actividad, y se encontraría con que sus habilidades ahora cuentan bastante poco.

Una metáfora interesante para las industrias en reconversión de la mano de la transformación digital: los mercados son muy grandes, hay muchos participantes que cambian a muy distintos ritmos – como muy bien dijo el escritor de ciencia-ficción canadiense William Gibson, “el futuro ya está aquí, solo que no está uniformemente distribuido” – y eso lleva a que sean muy pocos los casos en los que se generan verdaderos cataclismos apocalípticos, provocando que se hable más de evoluciones que de revoluciones. ¿Ha cambiado la industria de la publicidad? Sin duda, y le queda aún mucho por cambiar, por evolucionar y por equilibrar. Se ha producido una reconversión importante, y en muchos casos – no en todos – para bien. Sigue habiendo, como en todas las industrias, actores buenos, malos y regulares, aunque la tecnología utilizada haya cambiado y la trazabilidad debiera ser, supuestamente, mucho mayor. Sin embargo, esa heterogeneidad en la adopción hace que hoy puedas montar un diario en cualquier sitio, simular una gran audiencia adquiriendo flujos de tráfico completamente falsos y que no se corresponden con usuarios reales o interesados en lo que publicas, e incluso llegar a adquirir un cierto nivel de influencia basada en esa simulación de la realidad.

¿Hemos mejorado? Depende para quién. Pero de nuevo, la tecnología no se desinventa, no se detiene, y sus propuestas terminan siendo adoptadas por mucho que algunos pretendan resistirse a ellas. Cambios que no traen ni infiernos, ni paraísos: solo nuevos contextos a los que adaptar la actividad de todos aquellos que sepan hacerlo. La vida sigue. Si tienes dudas sobre la transformación digital y sus efectos sobre las industrias, estudia la experiencia de la evolución de la publicidad.

 

IMAGE: Nick Youngson CC BY-SA 3.0 Alpha Stock ImagesEste artículo largo en The Verge, How Tesla and Waymo are tackling a major problem for self driving cars: data es de lo mejor que he leído últimamente, y no tanto por los interesantes detalles sobre las estrategias de cara al desarrollo de la conducción autónoma de ambas compañías, que de por sí es susceptible de dar lugar a muchas interesantes discusiones, sino por la evidencia que presenta de manera palmaria: solo aquellas compañías que desarrollen y ejecuten una buena estrategia de datos lograrán ser competitivas en el futuro.

Puedes ser muy bueno haciendo lo que haces, pero a menos que elabores una estrategia específica que te permita producir, recoger y analizar datos, ten por seguro que va a aparecer alguien que terminará, en poco tiempo, haciendo lo que haces mucho mejor que tú. Esa es la esencia de la actividad empresarial hoy: los datos, convertidos en el nuevo elemento que define la competitividad.

Ese, de hecho, es el principal problema de todos los negacionistas que no aceptan que proyectos como el vehículo autónomo puedan convertirse en realidad en plazos mucho más reducidos de los que se manejan hoy en día: creen que las máquinas son eso, objetos inmutables que son diseñados de una manera determinada, y funcionan así a partir del momento en que son fabricados. Nada más lejos de la realidad: las máquinas han pasado de ser ingenios destinados a la automatización de tareas, a ser objetos capaces de incorporar aprendizaje de manera automática, de adquirir nuevos datos, procesarlos y obrar en consecuencia en función de reglas que derivan del análisis de esos mismos datos. Y no solo de los datos que genera esa máquina, sino de los que son capaces de generar a través de todo el parque de máquinas disponibles y de las distintas estrategias que podamos añadir. En el caso de compañías como Tesla o Waymo, esas estrategias no solo utilizan los datos que puedan generar sus flotas de vehículos – propia y directamente gestionada en el caso de Waymo, o en manos de terceros, de clientes de la compañía, en el caso de Tesla – sino que, además, incluyen todo tipo de tests en circuitos, en entornos virtuales o en todas las estrategias imaginables que permitan obtener y probar situaciones que puedan resultar más problemáticas, menos probables o más complejas.

El resultado es el que es: un vehículo autónomo “ha visto muchísimo más” que cualquier conductor humano por mucho que haya conducido en su vida, se ha enfrentado a más problemas que el mejor de los conductores, y además, lleva a cabo las posibles soluciones a problemas de una manera infinitamente más precisa. Pero vayamos más allá de la conducción autónoma, porque ese razonamiento, en realidad, puede extenderse a prácticamente cualquier actividad, y sobre todo, puede convertirse en una importante fuente de ventaja competitiva. Estamos llegando a un punto en el que lo más importante no es dar más préstamos, firmar más pólizas de seguros o vender más cursos que nadie: lo verdaderamente importante es cuánta información eres capaz de extraer de esas actividades, y de qué manera puedes procesarla para que tu compañía sea capaz de aprender de esos datos y mejorar su eficiencia frente al trabajo que desarrollan sus competidores.

Lo importante no es que la estrategia de datos de Tesla o la de Waymo puedan ser mejores, más eficientes o más rápidas: lo importante es entender que esas compañías son lo que son gracias al hecho de tener una estrategia de datos. ¿Tiene tu compañía una? Los datos, su generación y su análisis, convertidos en la verdadera arma competitiva. Eso es lo que la gran mayoría de directivos aún no han logrado entender. La necesidad de una adecuada estrategia de datos: no simplemente una que sea buena, sino además, que sea mejor que la de tus competidores. Se compite en generación de datos, en formas de obtener más datos, y en técnicas que permitan analizarlos de manera que podamos extraer más rendimiento en términos de aprendizaje. Esa es la nueva variable competitiva. Quien no lo entienda, que vaya pensando en una lenta, inexorable y asegurada deriva hacia la pérdida de competitividad. Quien no entienda y lleve a cabo ese tipo de estrategias en su compañía – y no es en absoluto tan sencillo como podría parecer en una primera interpretación – no será capaz de mantener su posición competitiva en el futuro.

 

Paradise Papers

Un nuevo lote de archivos obtenido por el diario alemán Süddeutsche Zeitung a partir de filtraciones de dos despachos de abogados especializados en la gestión de patrimonios en paraísos fiscales y parte integrante del llamado Offshore Magic CircleAppleby y Asiaciti Trust, es procesado durante un año por 382 periodistas de todo el mundo coordinados por el International Consortium of Investigative Journalism (ICIJ), y divulgado a partir del día de ayer por una serie de medios de comunicación que aportaron recursos para la investigación, en España El Confidencial y LaSexta. Hablamos de 13.4 millones de documentos que abarcan todo tipo de transacciones, constituciones y gestiones en diecinueve paraísos fiscales de todo el mundo a lo largo de sesenta y seis años (entre 1950 y 2016), nada menos que 1.4TB de información. 

Poner en manos de periodistas de todo el mundo esa ingente cantidad de información de una manera que garantice su uso confidencial y permita a los medios rentabilizar los recursos invertidos supone un desafío tecnológico enorme, como ya comentamos en su momento con motivo de una filtración anterior, la de los papeles de Panamá. En esta ocasión hablamos de un contingente de documentos aún mayor, que deben ser individualizados, limpiados, catalogados y puestos a disposición de los periodistas que deseen investigar sobre ellos, en lo que supone un proyecto de sistemas de información extraordinariamente ambicioso sobre una base enorme de material. Por el proyecto anterior, el de los Panama Papers, el ICIJ recibió en 2017 el prestigioso premio Pulitzer .

¿Cuál es la importancia de este leak, y de todo el trabajo anterior – los Offshore Leaks, los Luxembourg Leaks, los Swiss Leaks o los Panama Papers, de magnitudes inferiores a este último – con los que la ICIJ ha logrado convertirse en referencia en el ámbito de la evasión de impuestos y los paraísos fiscales? No deberíamos caer en la tentación de analizar estos leaks en función de la importancia de las personas cuyas prácticas se ven denunciadas, que en este caso y particularizando a nuestro país son muy escasas, sino proyectarlo un poco más allá. Básicamente, lo importante de este tema es la creación de una conciencia colectiva con respecto al uso de este tipo de herramientas. Los paraísos fiscales son territorios que basan una parte importante de su economía en la provisión de herramientas de evasión fiscal a ciudadanos de todo el mundo que pretenden, como eufemísticamente se dice, “optimizar” su factura con el fisco, interpretando “optimizar” como “pagar lo menos posible”. Durante generaciones, esta idea de pagar menos impuestos o de no pagarlos en absoluto ha formado parte de un imaginario colectivo en el que los más ricos, los más poderosos o en general, “los más listos”, tenían acceso a una serie de herramientas que los ciudadanos normales no podían aspirar a utilizar, y que les permitía el privilegio de contribuir mucho menos a las haciendas públicas de sus países.

Cuando yo era un niño, recuerdo a amigos de mis padres que presumían de cómo se ahorraban dinero en sus impuestos, y cómo eso era poco menos que “jaleado”, o considerado incluso un símbolo de inteligencia o, en cierto sentido, de prestigio social: si utilizabas esos esquemas, era porque eras “lo suficientemente rico” como para que valiese la pena, y comentarlo en privado era como hacer cierta ostentación de esa riqueza. Ahora, en España, si alguien te confiesa que no paga determinados impuestos, solo te falta insultarlo: hemos pasado, gracias a un uso de casos de perfil y visibilidad elevados y a un trabajo de concienciación, a tener cada vez más claro que quien no paga impuestos, nos está robando a todos. 

Los sistemas basados en la asimetría informativa proporcionada por los paraísos fiscales son cada vez más caducos, están cada vez más cuestionados y puestos en evidencia y, sobre todo, están adquiriendo una connotación cada vez más negativa: a medida que se producen más y más leaks y son explotados con más profesionalidad y seriedad, la idea de que el que es encontrado utilizando sistemas de ese tipo es “el más listo” va siendo sustituida por otro tipo de adjetivos, independientemente de que la persona incurra o no en delito. Se puede figurar en algunas de esas bases de datos y tener la situación perfectamente regularizada con el fisco de tu país declarando esas sociedades o instrumentos de manera transparente, pero ni es la circunstancia más común en esos casos, ni te exime de un cada vez más elevado coste en términos reputacionales, lo que cada vez más, conlleva que, ante el riesgo que suponen, esos esquemas puedan ir pasando a ser parte del pasado. El riesgo existe aunque seas la mismísima reina de Inglaterra, y el ejercicio democrático que supone que la televisión pública de un país dedique artículos a la corrupción de su reina no debe ser minimizado. 

¿Un mundo sin paraísos fiscales? No, desgraciadamente estamos aún muy lejos de algo así. Pero la tecnología debería proveernos cada vez más de mejores armas a la hora de trazar las transacciones, al tiempo que disminuye los riesgos e incrementa los incentivos para todo aquel que quiera llevar a cabo un leak. Protegerse de todo posible ex-empleado o empleado desleal, de todo eslabón débil que pueda tener la tentación de guardar unos archivos y enviarlos a un medio es una tarea muy compleja, y los sucesivos leaks y su correspondiente explotación profesionalizada y eficiente demuestran que estamos en el buen camino. El verdadero valor de los Paradise Papers y del trabajo de ICIJ en general es el de que sirvan como herramienta de concienciación, como prueba de que incurrir en determinados comportamientos no es, no debería ser, lo esperable cuando alguien logra tener muchos ingresos. Apreciar el trabajo de ICIJ, ponerlo en valor y otorgarle la importancia que verdaderamente tiene es un paso fundamental para cambiar las cosas en el futuro.

 

IMAGE: Alphaspirit . 123RFUna usuaria de Facebook y periodista, Kashmir Hill, ve una persona con un apellido que le suena familiar en una de las recomendaciones que Facebook insiste en hacerle dentro del listado de “Personas que quizá conozcas”, y tras contactarla, se da cuenta de que es la mujer que está casada con el hermano de su abuelo biológico, al que nunca conoció y con el que no comparte apellido porque abandonó a su padre cuando era pequeño. Por razones que no alcanza a comprender, Facebook parecía conocer mejor su árbol genealógico que ella misma, y había sido capaz de trazar una relación a pesar de que, tras ser adoptado, su padre recibió un apellido completamente diferente, y ni él ni las personas que posteriormente llegó a conocer de manera puntual de su familia biológica (con ocasión del funeral de su madre) utilizaban Facebook.

¿Qué sabe realmente Facebook de sus usuarios? Además de la gran cantidad de datos que compartimos voluntariamente con la compañía, bien de manera explícita cuando nos damos de alta o vamos rellenando aspectos de nuestro perfil, o bien de forma implícita durante los más de cincuenta minutos diarios que, como media, pasamos en sus dominios, resulta que la compañía invierte importantes sumas de dinero en la adquisición de bases de datos externas y brokers que reflejan aspectos de nuestra actividad fuera de la red, mediante acuerdos con proveedores de datos como el que tiene desde 2012 con Datalogix, compañía líder norteamericana en la explotación de datos de consumo a través de programas de lealtad y otras fuentes. Esos datos son, realmente, la fuente de negocio de la compañía, tanto gracias a la publicidad que recibimos cuando estamos dentro de su red, como cuando estamos en otras páginas.

¿Qué puede llegar a ver en el análisis de nuestras redes aquel que tiene la capacidad de verlo prácticamente todo, incluyendo partes de nuestro comportamiento en la red y fuera de ella, dónde estamos o por dónde nos movemos en función de la localización de nuestro teléfono, o incluso “pequeños detalles sin importancia” como esos fugaces momentos de curiosidad por saber qué fue de un antiguo un compañero de colegio o de una pareja anterior que tenemos en un momento dado o que tienen otras personas con respecto a nosotros? Un breve paso por el listado de personas que Facebook nos dice que quizá conozcamos nos brinda casi siempre detalles curiosos, que generalmente identificamos y somos capaces de explicarnos en función de datos como el número de contactos comunes que compartimos con alguien, el que pertenezcamos a un mismo grupo o se nos haya etiquetado juntos en una misma fotografía, las redes a las que podamos pertenecer (el colegio o la universidad en la que estudiamos, las empresas en las que trabajamos, etc.) y cuestiones similares. Pero la realidad es que el algoritmo de Facebook, sobre el que la compañía no ofrece datos porque lo considera parte de su ventaja competitiva, utiliza unas cien variables para obtener ese listado de personas que quizás conozcamos, y que tiene como función que tengamos redes más completas y exhaustivas porque, según su investigación, las personas con redes más completas tienden a tener una mayor fidelidad hacia la aplicación.

¿Qué sabe Facebook de nosotros? ¿Te has encontrado con sugerencias curiosas que no puedes explicarte de qué manera Facebook llegó a ellas? Tanto si quieres compartirlo aquí como si prefieres mantenerlo en privado, la periodista está pidiendo colaboración para hacer un poco de ingeniería inversa y tratar de entender qué tipo de datos está utilizando la compañía para hacer sus recomendaciones. ¿Está Facebook logrando convertirse en “el ojo que todo lo ve”?

 

Es la hora de las empresas con algoritmos inteligentes - Cinco DíasMarimar Jiménez, de Cinco Días, me envió algunas preguntas por correo electrónico para documentar un artículo sobre las ventajas competitivas que puede suponer el machine learning para las compañías, artículo que publicó ayer viernes bajo el título “Es la hora de las empresas con algoritmos inteligentes” (pdf).

Machine learning es, ante todo, un conjunto de herramientas que permiten que una máquina aprenda de manera iterativa de unos datos y sea capaz de desarrollar modelos de forma automatizada, modelos que no han sido específicamente programados por una persona. La herramienta, como tal, tiene suficiente capacidad de disrupción en la forma en la que hacemos muchas cosas como para convertirse en una ventaja competitiva: dado que los algoritmos que se desarrollan se adaptan a los datos y terminan por generar mejores predicciones y resultados que los desarrollados por personas, la compañía que utiliza machine learning obtiene de ello una mayor eficiencia, mejores prestaciones, más agilidad o funciones que antes podían resultar imposibles de obtener.

Pero como herramienta, el machine learning no es algo que se pueda “comprar e instalar”, porque depende de los datos, de su calidad y de su accesibilidad, y requiere por ello toda una orientación al dato, una “data-centricidad” que, para muchas compañías, se antoja aún una quimera, un imposible. Una gran parte de lo que hoy se pretende que es el machine learning está compuesto de expectativas hiper-infladas, de promesas incumplidas y de esperanzas irreales de compañías que pagan por una herramienta y creen que va a convertirlas en la empresa del futuro, cuando la realidad es que simplemente el desarrollo de procedimientos que permitan la obtención y la preparación de los datos se convierte en un trabajo enormemente complejo, que no está al alcance de cualquiera. Como sucede con todas las herramientas, el machine learning se encuentra ahora ante una epidemia de desinformación que pretende que una compañía puede desarrollar poco menos que robots asesinos, cuando la realidad es muy diferente y, sobre todo, mucho más pragmática. Solo aquellas compañías que sean capaces de orientarse a la generación y proceso de datos serán capaces de recoger los frutos del machine learning y convertirlos en verdaderas ventajas competitivas.

A continuación, las preguntas y respuestas que crucé con Marimar:

 

P. ¿Estás de acuerdo en que los datos se han convertido en el principal activo de las compañías? ¿Por qué? Resulta curioso ver cómo empresas como General Electric o Siemens se autodefinen hoy como empresas de datos. ¿Qué está pasando?

R. Los datos permiten obtener la ventaja competitiva en el nuevo planteamiento de los negocios en torno al machine learning. Solo las empresas que sean capaces de obtener y mantener algoritmos más inteligentes y potentes que sus competidores estarán aquí la próxima década, y lo fundamental para obtener esos algoritmos es tener datos con los que alimentarlos. Es algo que llevamos diciendo mucho tiempo ya: si no orientas tu negocio a los datos, maximizando tu intensidad informativa y trabajando con arreglo a tu nivel de permiso, aparecerá otra compañía que sí sea capaz de hacerlo y que proporcione a sus usuarios mejores productos y servicios que tú. Los datos se convierten en el combustible que alimenta el motor de tus algoritmos, pero con los datos no sirve: hay que saber definir los objetivos, prepararlos, transformarlos, construir modelos, evaluaciones, predicciones… orientar la compañía a los datos es solo un primer paso, y los subsiguientes no son tan sencillos o triviales como muchos pretenden vender.

P. Se habla de big data, de analítica de datos, de machine learning, todo como piezas de un mismo puzzle. ¿Es el aprendizaje automático the next big thing? ¿Cómo va a impactar (o está impactando ya) en los negocios? ¿qué podemos esperar de los algoritmos aplicados a los negocios?

R. Hace ya mucho tiempo que el machine learning es the next big thing, lo puedes ver simplemente viendo la evolución de las etiquetas relacionadas en mi página: desde hace un par de años, no paro de hablar del tema y de sus aplicaciones, las compañías que se dedican a ello están siendo objeto de adquisiciones importantísimas, y los gigantes de la red como Google, Amazon, Facebook, Apple o Microsoft están reorientando todas sus estrategias en torno al tema. Hemos pasado de ver a un algoritmo como algo con más capacidad de cálculo, más fuerza bruta matemática que una persona (cuando Deep Blue ganó a Kasparov) a verlo como algo capaz de entender el lenguaje humano mejor que muchas personas (Watson ganando al Jeopardy), capaz de hacer cosas que un humano nunca había hecho gracias al deep learning (AlphaGo ganando a los campeones mundiales de Go) o incluso, a tomar decisiones mejor que un humano en situaciones de información imperfecta (Libratus ganando al póker). La cuestión no es ya que una máquina pueda llegar a hacer lo que hace una persona, sino que, además, lo hace muchísimo mejor. En todo entorno competitivo, quien no sepa extraer partido de algo así, desaparecerá.

P. El profesor de UC Berkeley y experto en aprendizaje automático, Michael I. Jordan, asegura que más y más datos aumenta la probabilidad de hacer conexiones falsas. ¿Será esto un handicap para el avance de la economía de los datos, y cómo puede evitarse?

R. Todo correlaciona con todo dadas las circunstancias adecuadas. Pero precisamente ese es el ámbito en el que el machine learning destaca: se pueden evaluar muchos algoritmos en función de los resultados obtenidos, y aplicar procesos de mejora para que esos resultados sean cada vez mejores. Los algoritmos analizan datos y extraen reglas que permiten generar predicciones, detectar excepciones, aislar patrones… a medida que alimentamos a los algoritmos con más datos, mejoran en esas capacidades, y permiten incluso ponerlos a inventar nuevas situaciones hipotéticas que no han ocurrido anteriormente, a “jugar contra sí mismos” para mejorar los resultados obtenidos. Los datos se obtienen en escenarios de todo tipo, y son aplicados a todo el sistema: cada vehículo autónomo que conduce por un lugar determinado aporta datos que sirven para toda la flota, y los algoritmos son capaces, además, de aprender jugando a juegos como el Grand Theft Auto para generar nuevas situaciones que no se darían en conducción real. Lo importante es entender el proceso: no se trata de sistemas de reglas o de menus, de programación al uso: el machine learning permite posibilidades que sobrepasan aquello para lo que creíamos que era un ordenador.

P. ¿Cuáles son los retos a los que se enfrentan las corporaciones en esta nueva economía, tanto desde el punto de vista tecnológico como cultural o de otro tipo?

R. En este momento, los retos están en orientar la compañía a la generación de datos que puedan ser analizados. Si lo único que generas cuando vendes un producto es eso, una venta, y no tienes más datos ni sobre quién lo compró, ni sus características, ni la evaluación del producto, ni su uso, ni nada, cualquiera que pueda llevar a cabo tu negocio en un entorno más rico en datos superará tus posibilidades muy rápidamente, hará mejores predicciones y convertirá su oferta en más competitiva que la tuya. Pero además de obtener datos (todos pensamos que los tenemos, pero no es así), hay que desarrollar las capacidades para su explotación. Las compañías tienen personas que hacen medias, medianas y modas, con suerte alguna regresión. Esto va mucho más allá. En Amazon, la intuición humana está prohibida a la hora de tomar decisiones: si tomas una decisión, enséñame los datos que la justifican.

P. ¿Hay empresas que han nacido al calor del big data y del machine learning, que no existirían si no fuera por estas tecnologías? Ponme algún ejemplo. ¿Y alguna empresa tradicional que esté haciendo un uso magistral de los datos?

R. Lo más tangible ahora son las adquisiciones y movimientos en torno a las herramientas: todas las grandes han llevado a cabo adquisiciones cuantiosas de compañías de machine learning, adquisiciones que están entre el acqui-hire (la adquisición para incorporar talento) y la aplicación directa de capacidades a sus procesos. Todas las grandes empresas están posicionándose para incorporar esas capacidades, esos especialistas, y ofrecerles entornos en los que puedan desarrollarse. Estamos viviendo los inicios del mayor cambio que la tecnología ha provocado, con un impacto más importante que el propio desarrollo de internet.