EvindeSSE [Semantic Search Engine] est le nom de notre librairie d’analyse, d’indexation et de recherche qui intègre à présent une couche cognitive.
L’architecture fonctionnelle d’EvidenSSE assure les services génériques qui suivent :
- un moteur de crawling et de dépôt de contenus (plus de 100 formats gérés et convertis)
- la suggestion de requêtes de recherche
- l’expansion de la requête de recherche (synonyme et/ou cross language)
- la recommandation de contenu par rapprochement sémantique
- le réglage fin du tri de la liste de résultats (métadonnées surpondérées par paramétrage)
- la classification automatique des documents
- l’extraction automatique d’énoncés définitoires (pour construire des dictionnaires sur mesure)
- l’évaluation automatique de réponses courtes à des questions ouvertes
- l’extraction automatique de la terminologie
- la correction automatique de la requête de recherche (orienté sur le corpus et indépendamment de la langue)
- le filtrage des résultats de recherche
- l’extraction automatique des entités nommées
- la détection automatique des citations et la détection du plagiat
- l’anonymisation des données sensibles
- extraction des métadonnées d’un document (titre, auteur, mots-clés, date) et des références bibliographiques citées + crawling de ces dernières
Langues traitées : 26 langues de l’UE, l’arabe, le russe, l’indonésien.
L’API EvidenSSE est accessible en service web (JSON RPC over http). Les performances sont garanties grâce à une architecture qui supporte un déploiement distribué sur plusieurs serveurs, chaque instance de l’applicatif assurant elle-même un service multithreads.