inteligencia artificial semántica
Inteligencia Artificial Semántica basada en Grafos de Conocimiento
El futuro de la Inteligencia Artificial
El proyecto GNOSS se enmarca en el escenario tecnológico del Programa de Inteligencia Artificial interpretada semánticamente o basada en la explotación por parte de humanos y máquinas de las posibilidades inherentes al enlazado de datos en un grafo de conocimiento.
Durante más de 5 décadas, DARPA (Defense Advanced Research Projects Agency) ha liderado la investigación y el desarrollo que ha posibilitado el avance y aplicación de tecnologías de Inteligencia Artificial basadas en reglas y aprendizaje estadístico. Como destaca DARPA (AI Next Campaign), la segunda ola de la IA ha venido de la mano de una explosión de interés en el subcampo de la IA denominado machine learning, en el que se aplican métodos estadísticos y probabilísticos a conjuntos de datos masivos para crear representaciones generalizadas que pueden usarse en futuras muestras de datos. Una de las aproximaciones principales es el aprendizaje profundo (deep learning) con redes neuronales (artificiales) que pueden entrenarse para desempeñar variadas tareas de clasificación y predicción cuando se dispone de adecuados datos históricos. Sin embargo, ahí está su problema: las tareas de recolección, etiquetado y verificación de los datos con los que entrenar estas técnicas de IA pueden llegar a suponer un coste y unos tiempos prohibitivos.
Según DARPA, la IA de siguiente generación permitirá a los sistemas añadir la capacidad de explicar sus resultados y dotarlos de razonamiento con conocimiento de “sentido común”.
El reconocimiento desambiguado e indubitable de entidades y su enlazado en un grafo de conocimiento significativo, esto es, que recoja las reglas que modelan el funcionamiento de esas entidades en el mundo percibido por las personas, es conditio sine qua non para la construcción de una IA dotada de “sentido común”.
En esta nueva IA pueden y deben converger algunas de las técnicas de la segunda ola que se han mostrado particularmente útiles en tareas concretas y que pueden resultar de ayuda cuando el volumen de los conjuntos de datos hace casi imposible que sean gestionados por humanos. En los proyectos GNOSS aplicamos modelos neuronales en tareas de clasificación de la información que forman parte de los procesos ETL (Extract Transform Load) hacia el grafo de conocimiento, como la extracción de tópicos, la categorización de entidades o el análisis de similitud semántica de textos; y otras técnicas y algoritmos sobre los grafos ya construidos, en tareas como el análisis de similitud de grafos o subgrafos o el reconocimiento y desambiguación de entidades (NERD) de GNOSS Sherlock.
Inteligencia Artificial basada en Grafos de Conocimiento
El cerebro almacena nuestros recuerdos en una red de experiencias conectadas conformando una base de conocimiento. En los sistemas inteligentes de GNOSS este componente son los grafos de conocimiento: un modo de almacenar datos que permite dotarlos de estructura y contexto a la par que capacita a las máquinas para aprender y razonar explotando sus datos e interrelaciones.
Un grafo de conocimiento es un tipo particular de grafo que, de acuerdo con la definición de Gartner (2018) “codifican información (“conocimiento”) como datos organizados en una malla o red ("grafo") de nodos y enlaces (“aristas o arcos”) en lugar de en tablas de filas y columnas. Los nodos contienen datos o sus etiquetas o metadatos; las aristas enlazan nodos, representando las relaciones entre ellos.”
Estas relaciones se pueden representar y hacer calculables utilizando un tipo de lógica especial, la Lógica de Predicados de Primer Orden; esta clase de lógica puede representar estas relaciones como secuencias de “triples”, es decir, nodo-arista-nodo, o “Velázquez-pintó-Las Meninas”, que pueden acomodar, a lo largo del ciclo de vida del gráfico, esquemas de datos múltiples y variados sin la necesidad de rediseño. Una vez codificada, la información se puede recuperar o sintetizar en respuesta a cualquier clase de consulta, incluidas las más imprevistas.
La creciente necesidad de integrar contenido heterogéneo y distribuido, de interpretarlo y dotarle de contexto ha llevado a los grafos de conocimiento a una situación prominente. Los casos del Knowledge Graph de Google o Microsoft Graph son ejemplos de su creciente utilidad y popularidad. Los grafos de conocimiento son el medio para enriquecer los datos con datos relacionados, pero que no están dentro de los sistemas de la organización.
Un grafo de conocimiento tiene cuatro grandes propiedades: unifica información heterogénea y distribuida, la hace interrogable por máquinas y personas, es expresivo y esta expresividad puede extenderse o ampliarse con facilidad.
Los grafos de conocimiento resultan una solución ideal para almacenar datos extraídos del análisis de fuentes no estructuradas, como documentos, utilizando el procesamiento en lenguaje natural (PNL). También son capaces de almacenar datos estructurados, incluidos los metadatos que, de manera implícita, proporcionan estructura y contexto a la información. En definitiva, los grafos de conocimiento permiten almacenar datos, dotarlos de estructura y contexto a la par que ofrecen sistemas de interrogación, recuperación de la información, descubrimiento de conocimiento y análisis que los hacen imprescindibles en un muy largo número de casos de uso.
Mediante el análisis basado en grafos de conocimiento, se pueden descubrir y explotar de manera automática las relaciones orgánicas y dinámicas entre activos digitales, fuentes de datos, procesos, personas e interacciones. Un aspecto clave a este respecto es la extracción de entidades. Las entidades (personas, organizaciones, lugares, eventos, etc.) pueden identificarse a través de técnicas de procesamiento del lenguaje natural antes de la ingesta de datos y posterior desambiguación. De este modo, los grafos de conocimiento acumulan silenciosamente "datos inteligentes", es decir, datos expresivos que los sistemas de Inteligencia Artificial apropiados pueden leer y "entender" fácilmente y cuya explotación ofrece resultados de alta calidad.
Conocimiento profundo en las funciones de inteligencia de tu empresa
GNOSS hace posible que las organizaciones puedan construir su propio grafo de conocimiento, integrando en él el conjunto de información relevante para la empresa. Ese grafo de conocimiento facilita las siguientes explotaciones funcionales: Descubrimiento de conocimiento; Enriquecimiento de la información y generación de información contextual; y, Sistemas de recomendación y perfilado de usuarios basado en el reconocimiento explícito de intereses.
GNOSS hace posible que las organizaciones puedan construir su propio grafo de conocimiento, integrando en él el conjunto de información relevante para la empresa. Ese grafo de conocimiento facilita las siguientes explotaciones funcionales:
- Descubrimiento de conocimiento
- Sistemas de interrogación, búsqueda y recuperación de información
- Búsqueda basada en restricciones iteradas o razonamiento natural: buscadores facetados
- Búsquedas basadas en restricciones iteradas o razonamiento natural sobre mapas
- Búsquedas basadas en restricciones iteradas o razonamiento natural sobre ‘timelines’
- Interrogación basada en visualizaciones gráficas de indicadores
- Navegación a través de entidades
- Sistemas de gestión de metadatos y etiquetado de la información de la empresa
- Sistemas de Análisis basados en datos interpretados
- Business Analytics and Insights
- Learning Analytics
- Sistemas de interrogación, búsqueda y recuperación de información
- Enriquecimiento de la información y generación de información contextual
- Sistemas de recomendación y perfilado de usuarios basado en el reconocimiento explícito de intereses
Impacto en el negocio de la IA basada en Grafos de Conocimiento
Las organizaciones más en la frontera pueden esperar obtener un valor significativo de los grafos de conocimiento en las áreas de aplicación que permiten la construcción de las funciones de inteligencia y aprendizaje, destacando las siguientes:
- - Colaboración, intercambio y aprendizaje social
- - Investigación y auditoría
- - Análisis e informes
- - Integración y administración del contenido de la empresa: interoperabilidad y automatización
- - Gestión del contenido
- - Reutilización de datos y colaboración entre industrias y empresas
- - Gestión de la relación con el cliente
Las organizaciones más en la frontera pueden esperar obtener un valor significativo de los grafos de conocimiento en las áreas de aplicación que permiten la construcción de las funciones de inteligencia y aprendizaje, destacando las siguientes áreas:
- Colaboración, intercambio y aprendizaje social: los datos consolidados en un grafo de conocimiento están interrelacionados y contextualizados, lo que ayuda a su descubrimiento y localización a través de conexiones implícitas e indirectas. Un grafo de conocimiento puede funcionar como la “mente” de las aplicaciones de colaboración y aprendizaje de la empresa, tales como:
- Software social en el lugar de trabajo.
- Plataformas de aprendizaje y formación
- Sistemas de Learning Analytics
- Investigación y auditoría: la capacidad de capturar y desambiguar entidades que se asignan a individuos, cosas, organizaciones, lugares, eventos, procesos de fabricación o distribución, etc. en el mundo real, permite explorar las relaciones entre todas ellas para identificar el origen de incidentes, fraudes, riesgos en las cadenas de suministros, defectivos en cadenas de fabricación….
- Análisis e informes: una vez procesados e interpretados, tanto datos estructurados como no estructurados, en un grafo de conocimiento, éstos se pueden consultar, interrogar, integrar con terceras partes y visualizar de un modo no administrado, expresivo y personal, facilitando de este modo la extensión de las funciones de inteligencia y análisis al conjunto de la organización.
- Integración y administración del contenido de la empresa: interoperabilidad y automatización. La lectura autónoma y la "comprensión" de los datos por parte de las máquinas hace posible la integración y la operatividad de los datos para el conjunto de aplicaciones de la organización.
- Gestión del contenido:
- Gestión del contenido de la organización: integración, publicación, distribución y notificación inteligente, en función del perfilado de las distintas audiencias, del contenido de la organización.
- Comunicación, gestión del contenido de la web e integración con contenidos externos.
- Reutilización de datos y colaboración entre industrias y empresas: los datos, en un grafo de conocimiento, están vinculados conceptualmente o, si se prefiere, semánticamente; esto facilita que se combinen datos y metadatos y, de ese modo, que puedan compartirse más fácilmente y resulten más fácilmente reutilizables.
- Gestión de la relación con el cliente: perfilado y caracterización de la experiencia del cliente. El CRM y la caracterización de los clientes y de su experiencia contribuyen al diseño de estrategias comerciales que optimizan la rentabilidad, la eficiencia operativa, la satisfacción del cliente y su lealtad mediante la implementación de procesos centrados en el cliente.
Smart Data para Análisis Predictivo
El mundo y las empresas se han llenado de datos. Pero no todos los datos cuentan historias. Los Datos Masivos (Big Data) se preocupan por el volumen de los datos, la velocidad a la que se ingieren, la variedad de fuentes y su veracidad, pero la interpretación queda en manos de las personas que los manipulan. Los Datos Interpretados (Smart Data) cuentan historias; añaden a lo anterior el hecho de que los datos saben lo que son y con que otros están relacionados y que pueden ser semánticamente interpretados por máquinas y sistemas.
El mundo y las empresas se han llenado de datos. Pero no todos los datos cuentan historias. Los Datos Masivos (Big Data) se preocupan por el volumen de los datos, la velocidad a la que se ingieren, la variedad de fuentes y su veracidad, pero la interpretación queda en manos de las personas que los manipulan. Los Datos Interpretados (Smart Data) cuentan historias; añaden a lo anterior el hecho de que los datos saben lo que son y con que otros están relacionados y que pueden ser semánticamente interpretados por máquinas y sistemas.
Los Datos interpretados funcionan como los átomos de un grafo de conocimiento y de los sistemas analíticos asociados, y son la base para construir una solución de Inteligencia Artificial capaz de responder a la pregunta "¿Qué puede suceder?" Los sistemas predictivos y de detección de tendencias y futuros basados en el análisis de datos masivos interpretados representan una forma de Inteligencia Artificial que hace posible análisis avanzados.
Las empresas que desean consolidar su función de inteligencia están obligadas a hacer análisis predictivo sobre la base de datos interpretados, consolidados en un grafo de conocimiento que integre y unifique la información de la empresa con información relevante del exterior.
Este conjunto de técnicas se enmarca dentro del campo de la Inteligencia Artificial para análisis y definición de estrategias, un campo central de la Inteligencia de Negocio. El objetivo es identificar estrategias, prácticas, tecnologías y productos que van a crear valor para el negocio en el futuro.
Algunos de los casos de uso más relevantes serían los que pretenden:
- la predicción de la demanda
- el establecimiento dinámico de precios
- el mantenimiento predictivo de equipos y máquinas
- la identificación de patrones de fraude y detección de fraudes