Atomian crea una tecnología cognitiva para extraer conocimiento del Big Data

Big DataCienciaDatos y AlmacenamientoInnovaciónInvestigación y Desarrollo

La visión de Atomian pasa conseguir una macrobase de datos con todo el conocimiento universal a la que se pueda preguntar casi de todo y se tenga una respuesta concreta basada en datos reales y no en supuestos probabilísticos.

Atomian, la startup tecnológica que desarrolla y comercializa productos de software de computación cognitiva, ha creado una tecnología cognitiva que permite formular preguntas en lenguaje natural y extraer conocimiento casi inmediato de cualquier base de datos estructurados y no estructurados. La compañía española ya ha puesto a punto su tecnología en empresas del sector sanitario, banca, seguros y viajes, entre otras, y ahora está ultimando una prueba piloto para evaluar la calidad de los datos, la estructura y contendidos de los informes de Departamento de Salud de Cataluña. 

Atomian, con sede en Sant Cugat del Vallés, al lado de Barcelona, fue creada hace tres años, aunque la tecnología cognitiva que constituye su base tecnológica se ha desarrollado a lo largo de los últimos 17 años, llegando a su momento culminante en 2011, cuando el ingeniero y actual responsable de la compañía, Miquel Montero, logró el primer prototipo operativo. Aparte de perfeccionar el modelo cognitivo, lo que ha hecho Atomian en los últimos años es adecuarlo a distintos sectores verticales para facilitar su comercialización y permitir su crecimiento.  

La empresa cuenta ahora con quince empleados y está en plena fase de despegue tecnológico. Colaboran con distintos partners, que ayudan al volcado de datos de los clientes al modelo cognitivo de Atomian, para poder así explotar y extraer conocimiento de sus sistemas de información. Entre los clientes de Atomian se encuentran la aseguradora FiatC y en el ámbito sanitario los hospitales Clínic y Sant Pau de Barcelona y el de Granollers, así como CatSalut, el departamento de salud pública de Cataluña. 

Uno de los proyectos más ambiciosos de Atomian es la creación de Atomian Medical Records, un programa de computación cognitiva destinado al personal sanitario que permite a los profesionales del sector el acceso a todo el conocimiento que él mismo genera diariamente y queda registrado en las historias clínicas. El programa permite a los usuarios interactuar mediante una interfaz web en lenguaje natural. El acceso directo a sus datos, estructurados o no, facilita la toma de decisiones, mejora la gestión interna y calidad asistencial y optimiza los recursos sanitarios. 

 

Diagrama del funcionamiento de Atomian Medical Records.
Diagrama del funcionamiento de Atomian Medical Records.

En estos momentos, Atomian está haciendo una prueba piloto con 10.000 documentos que contiene la Historia Clínica Compartida Catalana (HC3). HC3 es una inmensa base de datos de todos los historiales médicos particulares de la sanidad pública en Cataluña y que los profesionales pueden acceder desde cualquier ambulatorio o hospital adscrito a la red pública sanitaria. 

El problema es que la mayoría de historiales contiene datos no estructurados, fundamentalmente en documentos PDF, lo que permite su consulta, pero complica la explotación a fondo de la información que contienen. Atomian Medical Records reúne los diversos procedimientos, terminología y estructura de las historias clínicas, como si fuera un conjunto de hospitales y ambulatorios. La prueba consiste inicialmente en extraer los datos de 10.000 documentos y volcarlos en unidades mínimas de información al sistema. Atomian evaluará la calidad de los datos, la estructura y contenidos básicos de los informes, además de realizar un análisis cualitativo de los informes de alta de pacientes que han sufrido un episodio de ictus.  

En la actualidad, HC3 tiene más de 180 millones de documentos publicados e incorpora cerca de 1,5 millones de nuevos documentos mensuales. El proyecto final consiste en incorporar todos los documentos a Atomian Medical Records, una vez superada con éxito la fase piloto. Aparte de que la consulta se puede escribir en lenguaje natural, se obtiene una respuesta conclusiva, no basada en probabilidades y respuestas preprogramadas, dice Miquel Montero. “A diferencia de otras herramientas, Atomian crea la respuesta al momento, responde de forma concreta e incluye la información en el formato más adecuado, sólo con respuestas certeras y datos determinantes”, añade.  

El modelo de computación cognitiva de Atomian forma parte de los sistemas de inteligencia artificial, tan en boga hoy en día pero que se están desarrollando desde mediados del siglo pasado. El modelo más conocido de inteligencia artificial es el Machine Learning o Deep Learning, que esencialmente permite el autoaprendizaje de un ordenador a través del procesamiento de miles de millones de datos o imágenes captadas con tarjetas gráficas, para tener así más conocimiento.  

La tecnología de Atomian no sigue el modelo de aplicar la fuerza bruta para lograr conocimiento sino que es cognitivo, en el sentido de que es un sistema de procesado de lenguaje que transforma los datos en “átomos” o unidades mínimas de conocimiento (de ahí el nombre de Atomian, precisa Miquel Montero) que después se pueden estructurar. Una gran ventaja es que no requiere una gran infraestructura informática ni potencia de cálculo, porque no trata los datos de forma masiva. 

 “La arquitectura de Atomian permite simular algunos procesos de cognición de cerebro, como el reconocimiento del lenguaje, y generar modelos de conocimiento”, añade el máximo responsable de Atomian y creador de la tecnología de la compañía. Mediante un proceso ETL (extracción, transformación y volcado del dato a una base de datos) todos los datos de una empresa se extraen de sus sistemas de información, se transforman en átomos y se agrupan en diferentes memorias.  

Cuando se realiza una consulta, Atomian convierte la frase en un conjunto de átomos computables dentro de la base de conocimiento, lo que equivale a la comprensión. Después se explora en las diferentes memorias la información relativa a la consulta y se pasa a la exploración. Un motor de conocimiento razona una respuesta e inmediatamente después, el sistema de Atomian fabrica una respuesta concreta y la verbaliza, que puede tomar la forma de una frase, un gráfico, un listado o una combinación de todos ellos, explica Miquel Montero. 

La visión que tiene Miquel Montero de cara a un próximo futuro es tener una macrobase de datos con todo el conocimiento universal a la que se pueda preguntar casi de todo y se tenga una respuesta concreta basada en datos reales y no en supuestos probabilísticos. El camino que queda por recorrer es muy largo, pero Miquel Montero se muestra confiado. 

La tarea que ha llevado a cabo en los últimos años este científico de datos, ingeniero de software y emprendedor de 41 años es trasladar su tecnología cognitiva a una serie de modelos de negocio que sean comprensibles para sus clientes potenciales, generen valor fácilmente cuantificable y le permitan así facturar y crecer como empresa.  

De esta forma, Atomian se está introduciendo en sectores verticales como sanidad o seguros pero también en otros más especializados y con procedimientos más concretos como agencias de viajes o el sector legal. Además, Atomian ha establecido acuerdos de colaboración con importantes empresas del ámbito tecnológico como la multinacional Everis y la compañía de Business Intelligence Houndline, entre otras, y en el ámbito de la salud con Asho y el Grupo Pulso.