El Támesis parece atraer a personas que trabajan en la recopilación de inteligencia. Los fantasmas del MI6 se encuentran en un edificio de aspecto extravagante con vista al río. Unos 3.2 km río abajo, en un espacio de oficinas compartidas cerca del Puente Blackfriars, está Arkera, una empresa que utiliza tecnología de aprendizaje automático para clasificar información de periódicos, sitios web y otras fuentes públicas para inversores en mercados emergentes. Su ubicación es casual.
Londres tiene la zona horaria correcta, entre las Américas y Asia. Es un buen lugar para vivir. El Támesis atraviesa la ciudad.
Los fundadores de Arkera, Nav Gupta y Vinit Sahni, tienen experiencia en fondos de cobertura "macro", del tipo que les gusta apostar por grandes movimientos en monedas y precios de bonos y acciones antes de los cambios pronosticados en el clima político.
Los clientes de la empresa podrían querer controlar los riesgos políticos que afectan las finanzas públicas en Brasil, o medir las presiones sociales que pueden surgir como consecuencia de un programa de austeridad en Egipto. La firma aplica el aprendizaje automático para encontrar información de inteligencia de mercado y hacerla utilizable.
Para muchas personas, el uso de tales tecnologías en finanzas es material de ciencia ficción distópica, de máquinas que se vuelven locas. Pero una vez que miras la inteligencia de mercado a través de la visión de la informática, provoca pensamientos inquietantes de un tipo diferente. Da una idea de cuán chirriante y desordenado ha sido el negocio análogo de la recolección de inteligencia de la vieja escuela.
Los analistas han utilizado datos de texto para tratar de predecir cambios en los precios de los activos durante un siglo o más. En 1933, Alfred Cowles, un economista cuyo abuelo había fundado el Chicago Tribune, publicó un artículo pionero en este sentido. Cowles clasificó los comentarios del mercado de valores de William Peter Hamilton, un editor de larga data del Wall Street Journal, en tres categorías (alcista, bajista o dudosa) y adjuntó una acción a cada uno (comprar, vender o evitar).
Llegó a la conclusión de que a los inversores les habría ido mejor simplemente comprando y manteniendo las principales acciones del índice Dow Jones que siguiendo el rumbo de Hamilton.
La aplicación de modelos de aprendizaje automático a texto como datos puede parecer un mundo alejado del enfoque de Cowles. Pero en concepto, es similar. Se busca el texto relevante. Se le atribuyen valores. Se aplica un modelo estadístico. Se prueba la solidez de sus predicciones.
Por supuesto, con sacos de poder informático y conjuntos de modelos de autoaprendizaje, la empresa está en una escala diferente del ejercicio rudimentario de Cowles. La extensión infinita de Internet significa un material fuente mucho más rico. El rango de posibles valores que se le atribuirán será más amplio que "alcista, bajista o dudoso". Y los algoritmos de autoaprendizaje pueden probar y volver a probar las combinaciones que producen las mejores predicciones.
Es tentador centrarse en los elementos de caja negra de todo esto: el software de lenguaje que "lee" el texto fuente y los algoritmos que usan los datos para hacer predicciones. Pero esto es como juzgar un sistema de alta fidelidad por sus altavoces. Gran parte del trabajo importante llega antes en el proceso. Arkera, por ejemplo, gasta mucho esfuerzo para encontrar todo el texto relevante y "limpiarlo", despojándolo de basura ajena, como leyendas y descargos de responsabilidad. "Una buena señal es crucial", dice Gupta.
Él cita la reforma de pensiones de Brasil como ejemplo. El país tiene 513 parlamentarios. Tienen cuentas de redes sociales, sitios web y blogs. Hablan con la prensa: Brasil tiene muchos periódicos regionales. Todos son fuentes potenciales de datos útiles. Si uno toma atajos en esta etapa, puede perderse algo que incluso el mejor modelo estadístico no puede solucionar más adelante. No tiene mucho sentido tener un amplificador genial y unos altavoces excelentes si el lápiz de tu tocadiscos está desgastado.
Cualquier buen analista de mercados emergentes también lo sabe. Si te topaste con uno poco después de las elecciones de Brasil el año pasado, probablemente se dirigía a Brasilia para conocer las perspectivas de una reforma crucial de las pensiones. Sin ella, la deuda pública de Brasil seguramente explotaría, provocando la fuga de capitales.
En julio, una ley de pensiones finalmente pasó a la Cámara Baja de Brasil. Los modelos de Arkera rastrearon las inclinaciones de los políticos de Brasil para tener una idea temprana del resultado probable. Sería difícil para un analista que trabaja sin ayuda imitar este alcance, incluso si siempre estuviera en el terreno y hablara un portugués perfecto.
La recopilación de inteligencia es un negocio intensivo en mano de obra. Por lo tanto, está listo para la automatización. Que esto esté sucediendo en finanzas también es natural. Hay un objetivo bien definido (ganar dinero). Hay un punto final bien definido (comprar, vender o evitar). Sin tal claridad de propósito, la inteligencia es un río sin fin. Es una cosa tras otra sin contener.