Gémeaux 1. 5 pro

La mise à jour Gemini 1.5 Pro permet à l'IA d'écouter et de générer du contenu

Avatar de João Lucas Batista
Avec la nouvelle mise à jour, l'intelligence artificielle de Google comprend et analyse désormais l'audio. Imagen 2 peut désormais ajouter et supprimer des éléments d'image et créer des GIF de 4 secondes

A Intelligence artificielle de GoogleQu'il s'agisse d'un vin rare et exotique ou du même vin dans différents millésimes, quel que soit votre choix au GEMINI, a reçu une mise à jour inédite et innovante ce mardi 9 avril, lors de la Google Cloud Suivant. Avec la mise à niveau, le Gémeaux 1.5 Pro, a reçu la capacité de comprendre et d'analyser les lignes audio et vidéo, en produisant du contenu basé sur ce qui est saisi dans l'application.

Dans un premier temps, la nouvelle fonctionnalité n'est disponible que pour les utilisateurs du IA des sommets, logiciel destiné à machine learning (apprentissage automatique), utilisé par les programmeurs et les scientifiques pour développer de nouvelles IA.

Que fait Gemini, l'IA de Google ?

La mise à jour Gemini 1. 5 pro permet d'écouter et de générer du contenu. Avec la nouvelle mise à jour, l'intelligence artificielle de Google comprend et analyse désormais l'audio. Imagen 2 peut désormais ajouter et supprimer des éléments d'image et créer des gifs de 4 secondes
Interface Gémeaux. Image : Lucas Gomes/Showmetech

O GEMINI, l'intelligence artificielle de Google, a été lancée en décembre de l'année dernière, remplacer Bard, et se distingue par sa capacité à gérer des tâches très complexes, du codage au raisonnement logique raffiné.

L'Intelligence Artificielle dispose de fonctions qui peuvent aider l'utilisateur dans les tâches les plus diverses, en manipulant une grande variété de fichiers, dans le but de combiner différents types d'informations, en plus de les organiser. Ses capacités vous permettent d'utiliser différents formats de contenu, notamment :

  • des textes;
  • images;
  • audios ;
  • vidéos; C'est
  • langages de programmation.

O GEMINI Il dispose de trois modes de fonctionnement, avec des spécificités différentes :

  • Gémeaux Ultra — plus grand et plus performant pour des tâches très complexes ;
  • Gemini Pro — idéal pour faire évoluer une grande variété de tâches ;
  • Gémeaux Nano — plus efficace pour les tâches mobiles.

Mise à jour Gemini 1.5 Pro et ses nouvelles fonctions

La mise à jour Gemini 1. 5 pro permet d'écouter et de générer du contenu. Avec la nouvelle mise à jour, l'intelligence artificielle de Google comprend et analyse désormais l'audio. Imagen 2 peut désormais ajouter et supprimer des éléments d'image et créer des gifs de 4 secondes
Gémeaux IA. Image : Rafares/Shutterstock)

Ce nouveau modèle, présenté par le géant de la technologie, représente une avancée significative par rapport au précédent, avec des améliorations en termes de performances et de compréhension des contextes longs. Le Gémeaux 1.5 Pro, qui est la version initiale mise à disposition pour les tests, est optimisée pour une variété de tâches et est plus efficace en termes de calcul, étant une version plus robuste et capable de répondre aux exigences d'activités encore plus complexes.

De plus, le Gémeaux 1.5 Pro contient une ressource expérimentale qui, en théorie, pourrait traiter jusqu'à 1 million de jetons pour les modèles de base à grande échelle, ce qui sera révolutionnaire. Selon Google, cette somme immense représente 700.000 30.000 mots et XNUMX XNUMX lignes de code, ce qui équivaut à une heure de vidéo ou 11 heures d'audio.

Les nouveaux outils de Gemini 1.5 Pro permettent à l'application de raisonner entre les images (images) et l'audio (parole) pour les vidéos téléchargées sur le site. Google IA Studio, ce qui facilitera la production de contenu. Selon les informations officielles, la mise à jour de l'IA de Google est disponible dans plus de Pays 180 via l'API Gemini (Application Programming Interface, en portugais), avec une capacité native sans précédent à comprendre l'audio et une nouvelle API qui facilite la gestion des fichiers.

La version propose également de nouvelles instructions système et fonctionnalités de mode. JSON (format de données léger pour l'échange d'informations entre systèmes informatiques). Croyant au potentiel de la nouvelle mise à jour, Google promet que le modèle d'intégration de texte surpasse ses concurrents dotés de fonctions similaires.

O Gémeaux 1.5 Pro est actuellement disponible uniquement via Sommet AI.

Imagen 2 peut créer des GIF

Pendant l'événement Google Cloud Suivant, une autre annonce importante a été faite par Google : le modèle IA Image 2, qui peut générer des images et de courtes vidéos à partir de instructions du texte. Avec cela, il est possible de créer des GIF d'une durée maximale de quatre secondes sous différents angles de caméra et également d'afficher des mouvements.

La différence avec cet outil est justement la possibilité d'explorer différents angles, avec plus de dynamisme dans les scènes, bien au-delà des vidéos IA générées avec des photos statiques et des mouvements limités.

Exemple de créations depuis Imagen 2 dans Vertex IA. Vidéo : Google Cloud/YouTube

O Image 2 a la capacité de produire des clips vidéo, également appelés images en direct, à basse résolution 640 x 360. De plus, Google utilise sa technique ID de synthétiseur appliquer un filigrane invisible dans les clips et les images générés par l’IA. La société prétend que le ID de synthétiseur peut prendre en charge les modifications et même la compression, mesures qui visent à promouvoir sécurité des données.

À ce jour, les ressources de Image 2 sont disponibles uniquement via Sommet AI, qui inclut désormais la prise en charge de la peinture interne et externe, ainsi que la possibilité de modifier des images à l'aide de l'IA, vous permettant d'élargir les bordures ou d'ajouter/supprimer des parties spécifiques de l'image. Outils destinés aux professionnels du marketing et création de contenu pour les campagnes, entre autres éléments publicitaires et plateformes vidéo.

Sommet AI

La mise à jour Gemini 1. 5 pro permet d'écouter et de générer du contenu. Avec la nouvelle mise à jour, l'intelligence artificielle de Google comprend et analyse désormais l'audio. Imagen 2 peut désormais ajouter et supprimer des éléments d'image et créer des gifs de 4 secondes
Plateforme Vertex AI. Image : Google/Reproduction

O Sommet AI est une plateforme de machine learning (ML) qui permet la formation et le déploiement d'outils et d'applications d'IA, y compris la personnalisation de grands modèles de langage (LLM) à utiliser dans des applications basées sur l'IA.

La plate-forme compile les diverses fonctionnalités et applications de Google, intégrant les workflows d'ingénierie des données, de science des données et d'ingénierie des données. machine learning, permettant la collaboration entre les équipes via un ensemble commun d'outils, ainsi que la mise à l'échelle des applications avec les avantages de Google Cloud.

A IA des sommets propose plusieurs options de formation et de déploiement de modèles :

  • AutoML vous permet d'entraîner des données tabulaires, images, texte ou vidéo sans avoir besoin d'écrire du code ou de préparer des fractionnements de données.
  • La formation personnalisée vous donne un contrôle total sur le processus de formation, y compris l'utilisation de cadre Code ML préféré, propre codage de formation et sélection d'options de réglage des hyperparamètres.
  • jardin modèle Permet la découverte, les tests, la personnalisation et le déploiement des modèles Vertex AI, y compris la sélection de modèles et les ressources Open Source (OSS).
  • A IA générative offre un accès aux grands modèles d'IA générative de Google dans de multiples modalités (texte, code, images, parole). Vous pouvez ajuster les LLM de Google pour répondre à vos besoins et les déployer pour les utiliser dans vos applications basées sur l'IA.

source: The Verge, Google pour les développeurs, Guide de Tom, Beebom, Google Cloud.

Voir aussi:

Revu par Glaucon Vital le 10/4/24.


En savoir plus sur Showmetech

Inscrivez-vous pour recevoir nos dernières actualités par email.

Related posts