Troubadour : l’application décentralisée de la semaine d’iExec (RLC)
Après un « Workerdrop« en décembre, où les participants pouvaient tester le fonctionnement du système iExec et gagner quelques tokens RLC, la crypto-startup basée à Lyon reprend son « Dapp of the Week« qui met en valeur une application décentralisée utilisant le réseau de cloud computing d’iExec. Cette semaine, c’est « Troubadour » qui est à l’honneur.
[coin-widget id= »iexec-rlc »]
Le « Natural Language Processing » avec Troubadour
Ce qu’on appelle le Natural Language Processing – NLP, ou traitement automatique du langage naturel – est la capacité des machines à comprendre et à interpréter le langage humain, aussi bien à l’écrit qu’à l’oral, et vise à créer un pont entre ces langages et les langages de programmation des ordinateurs.
NLP is the ability of machines to understand and interpret language and the way it is written and spoken.
Troubadour is a decentralized application already bridging the gap between data on a computer and human language.#blockchain #dapps #AIhttps://t.co/Kehv4FFko6
— iExec RLC – Official (@iEx_ec) January 8, 2019
Les ordinateurs sont très efficaces pour traiter rapidement des informations « structurées » comme les bases de données, mais le langage humain est bien plus subtil et complexe à comprendre, déjà pour un humain, mais encore plus pour une machine : contexte de discussion, sarcasmes, proverbes…
Pourtant, d’après une étude de Gartner citée par iExec, c’est un enjeu important pour les sociétés, puisque 80% des données d’entreprise sont aujourd’hui sous forme non structurées (e-mail, rapports, contrats…).
Troubadour et ses outils NLP à la rescousse
Le Natural Language Processing a pour ambitieux objectif de rendre les machines aussi intelligentes que les humains pour comprendre le langage.
Il transforme le langage humain naturel (écrit ou parlé) en composants élémentaires pouvant être étiquetés et organisés dans un format normalisé et structuré. Cela permet de faciliter leur traitement informatique par la suite, et d’en extraire facilement des données.
Troubadour est une plateforme qui remplit ces fonctions, en fournissant des outils NLP intuitifs et accessibles. Il est alimenté par le projet NewsReader, dont ils sont également devenus partenaires. C’est une initiative universitaire financée par l’UE qui vise à fournir des solutions de NLP accessibles à tous.
« NewsReader est un système qui extrait ce qui est arrivé à qui/quoi, quand et où, à partir de sources multiples et le stocke dans une base de données structurée, permettant une recherche plus précise sur cette immense pile d’informations » extrait de la publication d’iExec
La puissance de calcul du réseau iExec au service de Troubadour
Évidemment, le traitement informatique d’une telle masse de données est très gourmand en termes de puissance de calcul. Mais iExec résout ce besoin sans que les chercheurs soient obligés d’acquérir de matériel coûteux.
« iExec nous fournit une plateforme où les développeurs n’ont pas à entretenir de serveur, mais ont la possibilité de demander/offrir rapidement [leur besoin en puissance de calcul] en fonction des demandes de leurs clients », extrait publication iExec
Exemple de traitement NLP de Troubadour via iExec
Dans l’exemple ci-dessous, c’est un article de presse traitant du pape et de l’Irak qui a été traité par Troubadour, avec la puissance de calcul fournie par des « workers » du réseau iExec.
Après que l’utilisateur ait téléchargé le fichier texte de son choix, puis réglé le coût en RLC pour louer la puissance de calcul nécessaire via Metamask, le fichier texte est traité par l’outil NLP de Troubadour.
À terme, Troubadour sera en mesure de fournir : l’extraction d’entités, la désambiguïsation du sens des mots, l’étiquetage du rôle sémantique, la résolution des noyaux (d’événements), la vérification des faits, l’identification des relations temporelles et causales, et l’analyse du sentiment.
Les développeurs de Troubadour espèrent fournir une première version officielle au premier trimestre de 2019.
[es_tradingview symbol= »bittrex:rlcbtc » interval= »D » height= »500″ colors= »Light »]