Un professeur renforce l’intelligence artificielle dans son pays natal, le Bangladesh

A man wearing a blue NASA shirt crosses his arms in front of his chest and smiles in front of a bookshelf and painting.

Grâce à une subvention de 2 millions de dollars du gouvernement du Bangladesh, Mohammad Ruhul AminPh.D., professeur adjoint d’informatique et de sciences de l’information à Fordham, travaille à renforcer la capacité de son pays d’origine à utiliser l’intelligence artificielle.

«Une fois le projet terminé, il nous donnera un cadre dans lequel des centaines de chercheurs pourront construire des modèles d’IA intéressants qui pourront être utilisés au quotidien dans des pays à revenu intermédiaire comme le Bangladesh et l’Inde, ainsi qu’avec d’autres locuteurs de la langue bangla. dans le monde entier.” dit Amine. “Cela réduira potentiellement la fracture numérique à l’échelle mondiale.”

Un langage populaire avec une faiblesse critique

L’intelligence artificielle est devenue un élément essentiel de la vie quotidienne, des correcteurs orthographiques en ligne aux appareils à commande vocale comme Amazon Echo. Pour utiliser l’IA, ces machines doivent d’abord être entraînées à comprendre le langage humain. Leur traitement du langage naturel (NLP) doit absorber des quantités massives de données pour reconnaître toutes les parties uniques d’une langue, y compris les idiomes, les métaphores et même le sarcasme.

L’anglais, la langue principale d’Internet, a une pléthore de textes en ligne à apprendre, y compris un corpus mature : une grande collection de textes anglais rassemblés par des universitaires qui sont utilisés pour construire la PNL pour la langue anglaise. Il comprend les médias sociaux, les journaux et les blogs.

Mais ce n’est pas le cas pour la langue nationale du Bangladesh, connue sous le nom de bangla—une des langues les plus parlées au monde.

“En ce qui concerne l’anglais, Google comprend d’abord une requête, traite la requête, puis fournit le meilleur résultat à l’utilisateur. Mais ce n’est pas le cas avec le bengali et d’autres langues à faibles ressources », a déclaré Amin. “Google fournit de très bons résultats de recherche pour certaines langues comme l’anglais, le chinois et l’espagnol. Avec le bengali, Google fournit des résultats de recherche mais ne peut pas analyser ces données car il ne dispose pas d’une base d’informations sémantiques en bengali à extraire. Google ne comprend pas la langue, linguistiquement. Les résultats de recherche Google en anglais sont donc très dynamiques, mais pas en bengali. »

Un projet mondial pour développer l’intelligence artificielle à l’étranger

Au cours des deux prochaines années, Amin travaille avec GigaTechune entreprise technologique mondiale au Bangladesh, pour développer le premier corpus en bengali.

“Nous voulons créer un grand ensemble de données étiqueté avec des propriétés grammaticales par des experts linguistiques, qui seront en mesure d’identifier les personnes, les lieux et les choses. Cela renforcera le cadre NLP de la langue nationale bengali. Ensuite, nous développerons un algorithme de calcul à grande échelle capable de détecter automatiquement ces éléments à partir de textes en bengali », a déclaré Amin. « À l’avenir, les chercheurs pourront améliorer le modèle et les industries locales pourront créer des applications avec. C’est l’objectif du gouvernement bangladais – créer le cadre pour que les technologies de l’information et de la communication dans le pays puissent décoller.

Amin est originaire du Bangladesh. Il est né et a grandi dans la capitale, Dhaka, et a immigré aux États-Unis en 2013. Cette même année, il a développé le premier moteur de recherche national du Bangladesh—Pipilikaqui a duré au total huit ans – dans le cadre d’un projet cofinancé par télénor, accentueret a2iun programme du gouvernement bangladais qui vise à améliorer l’accès aux services publics grâce aux nouvelles technologies.

Recherche guidée par la philosophie ignatienne

En 2019, Amin a rejoint la faculté de Fordham, où enseigne et mène des recherches avec des étudiants de premier cycle et des cycles supérieurs. Il collabore également avec des institutions universitaires en Amérique du Nord, en Europe, en Australie et en Asie du Sud-Est.

« La plupart des problèmes résolus par mon équipe sont situés aux États-Unis, mais cela ne signifie pas que nous devons simplement résoudre les problèmes ici. Nous pouvons faire la même chose pour les autres langues et nations où nous sommes », a déclaré Amin, qui travaille virtuellement avec Giga Tech et le gouvernement bangladais sur ce projet.

Amin a déclaré que ses recherches, que ce soit aux États-Unis ou au Bangladesh, sont toujours guidées par les principes ignatiens de Fordham.

« Je suis profondément motivé par les principes ignatiens et je crois que l’éducation est l’un des meilleurs moyens d’aider les gens. Nous devons continuer à diffuser les connaissances que nous créons à l’intérieur de Fordham pour toucher les gens à l’extérieur de l’Université », a déclaré Amin. “La meilleure façon d’y parvenir est de collaborer avec des entités externes – pas seulement par le biais de la recherche universitaire, mais par une mise en œuvre qui atteint la vie des gens au-delà des binaires et des frontières.”