O Google a annoncé, ce mardi (14), son nouveau modèle génératif vidéo, Veo, qui fait partie de l'outil VideoFX. La nouvelle fonctionnalité permettra la création de vidéos basées sur des invites textuelles et arrive en tant que concurrent de Sora da OpenAI.
L'outil a été annoncé lors d'une diffusion en direct lors de la Google I / O 2024. En plus de permettre la création de contenu, la plateforme permettra d'interagir avec les autres technologies de l'entreprise, comme l'outil de création musicale grâce à l'IA.
Qu'est-ce que Veo
Lors de la révélation de la dernière intelligence artificielle développée par Google pour la création vidéo, un point clé a été souligné : Veo va au-delà de la durée typique d'une minute, offrant des résultats en résolution 1080p et la possibilité d'explorer une variété de styles et de visuels cinématographiques.
Selon l'entreprise, cette IA possède des connaissances avancées à la fois en langage naturel et en sémantique visuelle, permettant un rendu plus précis même avec des commandes plus longues et plus détaillées.
Google affirme que Veo est capable de générer un contenu cohérent et cohérent, dans lequel les personnes, les animaux et les objets se déplacent de manière réaliste tout au long des vidéos. De plus, l'outil est capable de comprendre des termes spécifiques de l'univers cinématographique, tels que « timelapse » et « enregistrement aérien d'un paysage », offrant ainsi un plus grand contrôle créatif sur les résultats souhaités.
La présentation de la nouvelle IA s'adressait à un groupe de cinéastes et de créateurs, qui ont eu l'occasion de tester le modèle et de fournir des commentaires à l'entreprise, contribuant ainsi à d'éventuelles améliorations futures.
Google a également annoncé que certaines fonctionnalités de Veo seraient progressivement intégrées à YouTube Shorts et à d'autres produits de l'entreprise, sans toutefois préciser de date pour cela.
VidéoFX
VideoFX est un portail accessible via le navigateur lui-même pour utiliser Veo, un modèle génératif créé par l'entreprise pour concurrencer Sora, d'OpenAI. Actuellement, la nouveauté n'est disponible qu'en phase expérimentale aux États-Unis.
Avec juste une invite de texte, d'image ou de vidéo, les nouvelles fonctionnalités vous permettent de créer et d'éditer des vidéos de plus de 60 secondes dans différents styles visuels, permettant à l'utilisateur d'explorer les idées les plus différentes.
Selon Google, l'outil propose également quelques options d'édition, comme le mode Storyboard pour travailler sur les scènes générées, en plus de l'inclusion de musique et d'effets sonores.
Les résidents des États-Unis peuvent accéder à l'outil via un liste d'attente. Pour le moment, il n'y a aucune prévision de lancement au Brésil et dans d'autres pays.
ImageFX
Google a également annoncé Image 3, disponible dans ImageFX de Google Labs. Avec lui, il est possible de créer des images complètement nouvelles basées sur une invite de texte, quelque chose de très similaire à ce que nous voyons dans MidJourney, par exemple.
Avec la 3ème génération, Google promet que les utilisateurs disposeront d'images tout aussi fidèles à la réalité, grâce à des améliorations dans la qualité et la fidélité de la génération d'images.
Selon le géant de Mountain View, Imagem 3 pourra même placer des mots et des phrases dans des images, ce qui pose encore quelques problèmes sur les plateformes proposant des propositions similaires.
Musicfx
Google a également annoncé un autre outil d'IA générative pour créer de la musique, MusicFX with AI Sandbox. La nouvelle fonctionnalité, qui arrive en partenariat avec YouTube, concurrencera directement des sociétés comme Moises.ai, qui utilise l'IA pour séparer les pistes d'une même chanson.
"Ces outils sont conçus pour ouvrir un nouveau terrain de créativité, permettant aux utilisateurs de créer de nouvelles sections instrumentales à partir de zéro, de transformer le son de nouvelles manières, et bien plus encore.“, a déclaré Google lors de la présentation.
ApprendreLM
Enfin, Google a dévoilé sa nouvelle famille de modèles d’IA générative adaptés à l’apprentissage. LearnLM est conçu pour guider les étudiants de manière « conversationnelle » dans une variété de sujets.
"LearnLM est basé sur la recherche pédagogique, rendant les expériences d'apprentissage plus personnelles et engageantes», a expliqué mardi James Manyika, vice-président senior de la recherche, de la technologie et de la société chez Google Research, à Google I/O.
LearnLM est actuellement alimenté par des fonctionnalités de produits Google, notamment YouTube, les applications Gemini de Google, la recherche Google et Google Classroom.
Dans les applications Gemini, par exemple, il sera possible, dans les mois à venir, de créer des chatbots personnalisés pouvant faire office d'experts sur divers sujets. Les chatbots fourniront des conseils d'étude et des activités pratiques, telles que des quiz et des jeux, en respectant les préférences individuelles de chaque étudiant.
Voir aussi:
source: Google.
En savoir plus sur Showmetech
Inscrivez-vous pour recevoir nos dernières actualités par email.