Troubadour : l’application décentralisée de la semaine d’iExec (RLC)

Trading du CoinTrading du Coin

Après un Workerdrop en décembre, où les participants pouvaient tester le fonctionnement du système iExec et gagner quelques tokens RLC, la crypto-startup basée à Lyon reprend son Dapp of the Week qui met en valeur une application décentralisée utilisant le réseau de cloud computing d’iExec. Cette semaine, c’est Troubadourqui est à l’honneur.

[coin-widget id=”iexec-rlc”]

Le « Natural Language Processing » avec Troubadour

Ce qu’on appelle le Natural Language ProcessingNLP, ou traitement automatique du langage naturel – est la capacité des machines à comprendre et à interpréter le langage humain, aussi bien à l’écrit qu’à l’oral, et vise à créer un pont entre ces langages et les langages de programmation des ordinateurs.

Les ordinateurs sont très efficaces pour traiter rapidement des informations “structurées” comme les bases de données, mais le langage humain est bien plus subtil et complexe à comprendre, déjà pour un humain, mais encore plus pour une machine : contexte de discussion, sarcasmes, proverbes…

Pourtant, d’après une étude de Gartner citée par iExec, c’est un enjeu important pour les sociétés, puisque 80% des données d’entreprise sont aujourd’hui sous forme non structurées (e-mail, rapports, contrats…).

Troubadour et ses outils NLP à la rescousse

Le Natural Language Processing a pour ambitieux objectif de rendre les machines aussi intelligentes que les humains pour comprendre le langage.

Il transforme le langage humain naturel (écrit ou parlé) en composants élémentaires pouvant être étiquetés et organisés dans un format normalisé et structuré. Cela permet de faciliter leur traitement informatique par la suite, et d’en extraire facilement des données.

Troubadour est une plateforme qui remplit ces fonctions, en fournissant des outils NLP intuitifs et accessibles. Il est alimenté par le projet NewsReader, dont ils sont également devenus partenaires. C’est une initiative universitaire financée par l’UE qui vise à fournir des solutions de NLP accessibles à tous.

« NewsReader est un système qui extrait ce qui est arrivé à qui/quoi, quand et où, à partir de sources multiples et le stocke dans une base de données structurée, permettant une recherche plus précise sur cette immense pile d’informations » extrait de la publication d’iExec

La puissance de calcul du réseau iExec au service de Troubadour

Évidemment, le traitement informatique d’une telle masse de données est très gourmand en termes de puissance de calcul. Mais iExec résout ce besoin sans que les chercheurs soient obligés d’acquérir de matériel coûteux.

« iExec nous fournit une plateforme où les développeurs n’ont pas à entretenir de serveur, mais ont la possibilité de demander/offrir rapidement [leur besoin en puissance de calcul] en fonction des demandes de leurs clients », extrait publication iExec

Exemple de traitement NLP de Troubadour via iExec

Dans l’exemple ci-dessous, c’est un article de presse traitant du pape et de l’Irak qui a été traité par Troubadour, avec la puissance de calcul fournie par des “workers” du réseau iExec.

Après que l’utilisateur ait téléchargé le fichier texte de son choix, puis réglé le coût en RLC pour louer la puissance de calcul nécessaire via Metamask, le fichier texte est traité par l’outil NLP de Troubadour.

 

À terme, Troubadour sera en mesure de fournir : l’extraction d’entités, la désambiguïsation du sens des mots, l’étiquetage du rôle sémantique, la résolution des noyaux (d’événements), la vérification des faits, l’identification des relations temporelles et causales, et l’analyse du sentiment.

Des informations supplémentaires sur les entités extraites peuvent être trouvées dynamiquement par Troubadour

Les développeurs de Troubadour espèrent fournir une première version officielle au premier trimestre de 2019.

Rémy R.
Issu d’une formation universitaire en Sciences, je m’intéresse aux blockchains et à Bitcoin depuis 2013 et en ai même miné à l’époque. La bulle qui s'en est suivie m'en a détourné, mais je m'y suis replongé depuis 2017 et les étudie depuis avec passion.

Poster un Commentaire

avatar