Ahmed Nouisser : « La traduction automatique du dialecte tunisien va renforcer le champ académique »

La start-up tunisienne iCompass, spécialisée en intelligence artificielle, plus particulièrement dans le domaine du traitement du langage naturel (TLN) vient de lancer le projet “Tunizi”, une base de données comportant 100 000 phrases écrites en dialecte tunisien et qui regroupe le premier grand ensemble de données d’analyse du sentiment, utilisé sur les réseaux sociaux.

Ahmed Nouisser, co-fondateur et CEO d’iCompass a déclaré à Réalités Online : « Qui dit intelligence artificielle dit données (data) et pour que celles-ci soient efficaces, nous devons leurs donner des annotations, en d’autres termes, les raffiner comme l’essence par rapport à du pétrole brut. A partir du moment où l’on possède des data annotées, nous pouvons tester tous les modèles de Deep learning que nous voulons. ICompass a effectuer une annotation des données par rapport au dialecte tunisien ».

Le responsable a expliqué dans ce contexte, que les langues arabes et africaines étaient d’une manière générale, sous représentées dans le champ académique. Comme exemple, il cite Word  ou encore Google translator qui utilisent une option permettant de retranscrire des textes qu’on lui lit à voix haute soit en anglais ou en Français. Cette fonctionnalité n’est disponible ni en langue arabe, ni en aucun autre dialecte africain. Fort de ce constat, ICompass a décidé de remédier à cette situation. « Nous avons donc commencé à recueillir un échantillon de données linguistiques disponibles travers les commentaires sur les réseaux sociaux (Facebook, Youtube, Twitter, Instagram..) et nous leurs avons créé une annotation. Nous avons ensuite mis ces informations à disposition des publics académiques et estudiantins, à travers la plateforme baptisée « Tunizi » » a expliqué le responsable.

En effet, pour l’intelligence artificielle, cette démarche est nécessaire parce que les ensembles de données annotés conditionnent désormais la réussite des algorithmes utilisés comme base d’apprentissage. Les études analytiques cherchent à explorer et à reconnaître les opinions en ligne dans le but de les exploiter à des fins de planification et de prédiction telles que la mesure de la satisfaction du client et l’établissement de stratégies de vente et de marketing.

L’objectif de ce projet est de créer des bases de données annotées et développer et soumettre des ensembles de données de tout dialecte sous-desservi et sous-représenté en vue de les utiliser dans les futures applications de NLP comme la traduction automatique, les agents conversationnels (Chatbot) ou la reconnaissance vocale.

« Cette plateforme collaborative servira à améliorer le traitement de la langue tunisienne dans le champ académique d’une manière générale et dans le business afin que notre dialecte puisse être intégré dans le process de compréhension et de développement des produits » a précisé Ahmed Nouisser avant d’ajouter :  « Nous avons déjà offert un chatbot Aziza au ministère de la santé et nous collaborons avec plusieurs organismes privés et publics (Douane tunisienne,..) pour leur donner accès à ce produit type de produit ».

Selon-lui, il était auparavant difficile de créer un système de compréhension de langue car il fallait créer des tables de correspondance.  « Aujourd’hui, grâce à l’intelligence artificielle, il suffit de recueillir des données pertinentes et de les raffiner pour obtenir des résultats escomptés » a conclut le CEO de iCompass.

 

Related posts

Charles-Nicolle : première kératoplastie endothéliale ultra-mince en Tunisie

Affaire du complot : Qui sont les accusés en fuite ?

Une opération sécuritaire inédite : Saisie de plus d’un million de comprimés d’ecstasy (Vidéo)