Sommaire
Dans le scénario technologique actuel, aucun sujet n’est autant spéculé sur les nouvelles innovations que l’intelligence artificielle. C'est au milieu de ce scénario concurrentiel que Gabriel Sales, étudiant en statistiques à l'UFF, à Rio de Janeiro, apparaît comme un visionnaire en dirigeant un projet d'Intelligence Artificielle qui traduit la langue des signes. Son projet vise à surmonter les barrières de communication entre les personnes sourdes et entendantes, en offrant un moyen efficace de transcrire la langue des signes en portugais en temps réel.
Selon Gabriel, l'objectif principal de cette IA est de révolutionner la façon dont les personnes sourdes communiquent, en offrant accessibilité, indépendance et opportunités à la communauté. Le projet, encore en développement, démontre qu'il est capable d'interpréter les signes des personnes sourdes dans des vidéos, en les traduisant instantanément en portugais.
Comment fonctionne l’IA pour les personnes sourdes ?
Le projet utilise trois intelligences artificielles distinctes pour atteindre son objectif. La première IA est chargée de capturer les points clés du corps, en les cartographiant sur les images d’une vidéo. Ces données sont ensuite envoyées à la deuxième IA, un classificateur qui identifie le signal spécifique émis. La dernière IA entre en action pour contextualiser les signaux identifiés, transformant la liste des signaux prédits en un message lisible et compréhensible en portugais.
Le potentiel de ce projet est vaste. En général, toute communication entre les personnes sourdes et les personnes ayant des difficultés à interpréter les Balance serait simplifiée en une traduction simultanée qui résoudrait le bruit du dialogue. Si elle est efficace, la technologie pourrait résoudre plusieurs problèmes de communication qui touchent environ 10 millions de citoyens sourds au Brésil, soit environ 5 % de la population brésilienne, selon l'IBGE.
Cependant, Gabriel Sales est confronté à des défis dans son projet, tels que des limitations en matière de matériel et de ressources pour collecter des données essentielles. Il recherche des contributions pour acquérir un ordinateur plus puissant, des caméras de haute qualité et des ressources pour faire avancer la recherche et le développement du projet, grâce à un vakinha en ligne.
Le projet dirigé uniquement par Gabriel Sales reflète non seulement sa passion pour la technologie, mais met également en valeur le pouvoir de l'intelligence artificielle pour créer des solutions innovantes à impact social important. Publier des vidéos sur vos mises à jour d'IA sur Instagram, @projeto_ia_libras, Gabriel a déjà gagné plus de 86,1 XNUMX abonnés, en plus de milliers de vues sur ses publications.
Entretien avec le créateur de l'IA
Pour mieux comprendre les fonctionnalités de cette IA dans la transcription en temps réel de dialogues en langue des signes, nous avons interviewé le programmeur et créateur du projet, l'étudiant en statistiques Gabriel Sales.
Qui est le programmeur et étudiant en statistiques de l'UFF à l'origine du projet ? Et comment vous est venue cette idée ?
Gabriel Ventes : Je m'appelle Gabriel, je viens de Rio de Janeiro. Je suis un étudiant passionné de technologie. J'ai eu mon premier ordinateur quand j'avais dix ans et, depuis, je me suis lancé dans ce domaine de l'informatique. J'ai commencé à étudier la programmation à l'âge de douze ans et j'ai progressé jusqu'à me lancer dans la science des données. Quand j'ai découvert le domaine, j'ai trouvé que c'était vraiment cool, surtout la partie intelligence artificielle, où les robots pensent d'une manière presque humaine, donc ça m'a laissé très fasciné. Et donc j’ai commencé à étudier ces choses. Je suis entré à la faculté de statistique de l'UFF, car les statistiques constituent une base importante pour la science des données. Et j'ai commencé mon parcours dans ce domaine de l'intelligence artificielle.
J'ai commencé à approfondir l'IA, j'ai commencé à réaliser plusieurs petits projets. Et puis j'ai eu un cours de Balance dans mon collège, au premier semestre de l'année dernière, et j'ai été très fasciné par l'histoire de la prof, car elle était sourde et a réussi à devenir médecin, malgré toutes les difficultés qu'elle évoque dans son histoire.
J’ai donc commencé à réfléchir à ce que je pouvais faire d’intéressant et inclusif pour cette communauté, pour l’aider. Et puis je suis parti d’une idée d’intelligence artificielle qui pourrait classer les alphabets Balance. Type : lettre a, lettre b, lettre c, etc. Tout cela en vidéo. C'était ma première idée, mon premier test pour voir à quel point cela serait difficile, à quel point cela serait complexe, puis j'ai évolué, j'ai commencé à ajouter des signaux robustes et à améliorer mes connaissances en IA.
Comment définissez-vous votre projet ? Qu’entendez-vous changer avec cela dans la réalité actuelle, en particulier pour les malentendants ?
Gabriel Ventes : L’objectif principal est de révolutionner la communication entre les personnes sourdes et entendantes, car il existe une énorme barrière entre ces personnes. Parce que, forcément, il faut connaître les Balance pour pouvoir communiquer avec des personnes sourdes, donc en ayant ce système d'intelligence artificielle, vous pouvez faire tomber un peu cette barrière. Nous pouvons appliquer cela dans les entreprises, dans le service client, dans l’accessibilité numérique. Le client sourd s'y rend et peut dire clairement ce qu'il veut. S’il souhaite acheter quelque chose, s’il a besoin d’une aide particulière, sans recourir à un interprète Libra, tout peut être fait numériquement grâce à l’IA.
Également dans les hôpitaux, dans les situations d'urgence, où la personne a besoin de soins rapides et parfois il n'y a personne qui sait parler Balance, n'est-ce pas ? Parfois, vous avez besoin de connaître son groupe sanguin, vous devez savoir si elle a une maladie, ou quelque chose comme ça, et avec ce système, cela serait également possible.
En éducation aussi, pour enseigner aux Balance, ce système éducatif sera très efficace pour tester la précision des élèves, s'ils font correctement les signes, s'ils apprennent bien. Et même pour les enseignants sourds, qui n’ont pas tous la capacité de parler, car il y a des personnes sourdes qui peuvent développer la capacité de parler, mais pas tous, le système serait également utile dans ce cas. Plusieurs applications peuvent donc être faites.
Comment décrivez-vous le fonctionnement de cette IA ?
Gabriel Ventes : Il existe trois IA. Un pour capturer les points clés du corps, donc il va cartographier tout le corps de la personne, le visage, l'épaule, le coude, les mains, les doigts, et ce au fil des frames, car il faut faire ça sur vidéo . Cette cartographie se fera donc au fil des frames. Et après cela, il sera transmis à un classificateur. Il classera ces données, à partir des points clés du corps, et vous indiquera de quelle option il s'agit.
Et la dernière IA consiste à créer le contexte des signaux. Ainsi, après avoir cartographié le corps, après avoir classé de quel signe il s'agit, elle dressera la liste des signes prédits et transformera cela en un message, un message naturel, lisible et compréhensible. Cette IA assemblera ensuite le contexte des signaux déjà prédits par la deuxième IA.
Dans l’ensemble, votre projet est-il unique ou avez-vous des projets similaires impliquant l’IA pour aider ainsi les personnes sourdes ?
Gabriel Ventes : Il doit certainement y avoir des projets similaires. Mais aucune d’entre elles n’a abouti, peut-être à cause du manque d’investissements au Brésil. Les gens finissent par quitter le pays, notamment en raison de la facilité d’accès à la technologie. Mais je ne sais pas s'ils sont développés (autres projets), il peut y avoir des prototypes.
Dans ce cas, pour vous, quelle est la plus grande différence de votre projet ?
Gabriel Ventes : La capacité d'évoluer, elle peut évoluer très facilement avec des investissements et être développée plus rapidement... La principale différence est que nous surmontons la barrière de la communication pour les personnes sourdes, car cela aidera dans les domaines de l'éducation, de l'économie, de la culture et de la politique.
De quoi auriez-vous besoin pour faire évoluer le projet ?
Gabriel Ventes : J'ai besoin de données, car l'IA a besoin de vidéos pour s'entraîner... C'est comme enseigner à un enfant, il faut montrer quel est le signal et le répéter plusieurs fois jusqu'à ce qu'il comprenne. Et aussi des équipements pour les traiter tous, puisque nous allons créer un Big Data Donc.
Quelles sont vos prochaines étapes avec le projet ?
Gabriel Ventes : Je cherchais depuis un moment une entreprise partenaire, il y en a une qui m'aide avec mon site internet. Et maintenant, je recherche un partenariat avec des personnes influentes sur ce marché, pour peut-être ouvrir une startup, attirer des investisseurs et pouvoir ensuite évoluer plus facilement. L’idée est de vendre aux entreprises qui souhaitent disposer d’une accessibilité numérique pour la proposer à leurs clients.
Comment protéger votre IA du « plagiat » ?
Gabriel Ventes : En matière d’intelligence artificielle, il est difficile de plagier. Vous pouvez faire quelque chose de similaire, mais c'est pareil, c'est très difficile. C'est comme si Elon Musk fabriquait une IA similaire à ChatGPT, il peut le faire, mais les deux auront des réponses différentes. Parce que ce qui interfère avec cela, ce sont les données disponibles, et en livres, elles sont rares. Besoin d’investissement dans la collecte de données.
Quels tests subissez-vous pour comprendre que l'IA interprète correctement les signaux en kilos ?
Gabriel Ventes : Je fais des tests en temps réel, en émettant différents signaux pour vérifier l'exactitude. Le peu de connaissances en kilos que j'ai appris pendant la matière collégiale, je l'applique et regarde des vidéos sur internet pour développer une formation en IA.
Voir aussi:
Fontes: Milne, Forbes e Clic intelligent.
Revu par Glaucon Vital le 18/1/24.
En savoir plus sur Showmetech
Inscrivez-vous pour recevoir nos dernières actualités par email.