Le troisième jour de l’événement 12 Days of OpenAI s’est terminé et OpenAI a enfin dévoilé Sora, son modèle de génération vidéo très attendu. Voici tout ce que vous devez savoir sur Sora, ses fonctionnalités, sa disponibilité et bien plus encore.
Qu’est-ce que Sora ?
Sora est le nouveau modèle de génération vidéo d’OpenAI qui crée des vidéos à partir de texte ou d’images. Les utilisateurs peuvent générer des vidéos jusqu’à une résolution de 1080p, d’une durée maximale de 20 secondes et dans des formats d’image grand écran, verticaux ou carrés. Contrairement aux spéculations antérieures, Sora n’est pas intégré à ChatGPT mais est un produit autonome accessible sur Sora.com. Cependant, les utilisateurs disposant d’un abonnement ChatGPT Plus (20 $/mois) ou Pro (200 $/mois) peuvent y accéder sans frais supplémentaires. Voici les fonctionnalités de Sora mises en évidence lors de l’événement en direct par l’équipe OpenAI :
Section Explorer: Sora comprend une section Explorer où les utilisateurs peuvent visualiser les vidéos générées par la communauté, ainsi que les invites utilisées pour les créer. Cette section est idéale pour trouver l’inspiration sur ce que vous pouvez générer à l’aide de Sora et également pour améliorer vos propres compétences en matière d’invite pour la génération de vidéos.
Générer des vidéos: Au bas de l’interface, il y a une zone de texte dans laquelle les utilisateurs peuvent saisir des invites pour générer des vidéos. Vous pouvez personnaliser les paramètres tels que le rapport hauteur/largeur, la qualité et le nombre de vidéos à générer. De plus, vous pouvez télécharger une image pour donner du contexte à votre invite, permettant ainsi à Sora de créer des vidéos qui perpétuent l’esthétique et la scène représentées dans l’image.
Vue du scénarimage: La fonctionnalité remarquable de Sora est sa vue Storyboard basée sur la chronologie. Cela permet aux utilisateurs d’ajouter des invites ou des images à des points spécifiques sur une chronologie. La vidéo générée suivra précisément les instructions de la chronologie. Par exemple, si vous démarrez la chronologie avec l’image d’un chien qui court et ajoutez une invite au bout de 5 secondes pour « chien sautant un obstacle », la vidéo passera de manière transparente entre les deux, en fonction de votre saisie.
Remixer : Une fois une vidéo générée, les utilisateurs peuvent modifier des éléments spécifiques sans recommencer à zéro grâce à la fonction Remix. Par exemple, OpenAI a démontré comment les mammouths laineux d’une vidéo pouvaient être remplacés de manière transparente par des robots.
Recouper : La fonction Recut permet aux utilisateurs de réorganiser ou de modifier des sections de leurs vidéos, offrant ainsi un contrôle précis sur le rythme et la structure.
Boucle: La fonction Loop vous permet de créer des vidéos en boucle transparente. Les utilisateurs ont un contrôle total sur le début et la fin de la boucle ainsi que sur la manière dont elle évolue.
Mélange: L’option Blend permet aux utilisateurs de fusionner deux vidéos en une seule sortie unique. Vous pouvez également contrôler la vitesse de transition et d’autres paramètres pour obtenir l’effet souhaité.
Disponibilité et limites de Sora
Sora est lancé aujourd’hui dans le monde entier, sauf au Royaume-Uni, en Suisse et dans l’Espace économique européen, où l’accès est prévu plus tard. Il sera disponible pour les utilisateurs de ChatGPT Plus et Pro avec les limites suivantes sur les générations de vidéos :
- ChatGPT Plus: Vous pouvez générer jusqu’à 50 vidéos à une résolution de 480p ou moins de vidéos à 720p chaque mois.
- ChatGPT Pro: 500 générations vidéo par mois ou générations lentes illimitées. OpenAI revendique également des résolutions plus élevées et des durées plus longues pour la version professionnelle.
Actuellement, Sora n’est pas inclus avec les comptes ChatGPT Team, Enterprise ou Edu ni pour les utilisateurs de moins de 18 ans. OpenAI affirme qu’il y aura de nouveaux projets à l’avenir pour différents types d’utilisateurs qui pourraient être disponibles à partir du début de l’année prochaine 2025. À première vue, Sora pourrait également suivre un système de crédits similaire à d’autres outils de génération d’images et de vidéos. Vous pouvez vérifier combien de crédits seront consommés par chaque génération en survolant l’icône en forme de point d’interrogation.
OpenAI a également introduit une version plus rapide, Sora Turbo, qui réduit considérablement le temps de génération vidéo, produisant des sorties de résolution inférieure en moins d’une minute, ce qui est idéal pour générer des vidéos d’idées.
Métadonnées C2PA sera ajouté à toutes les vidéos générées par Sora, afin que les gens puissent identifier qu’il s’agit d’une vidéo générée par l’IA de Sora. Il existe également un outil de recherche interne pour vérifier si le contenu provient de Sora. Les vidéos générées ont également un filigrane visible par défaut.
Bien que Sora offre des capacités révolutionnaires, il génère souvent une physique irréaliste et se débat avec des actions complexes sur de longues durées. Dans leur blog, ils ont également mentionné que les téléchargements de personnes seront limités au lancement afin de réduire les risques de deepfakes et d’abus sexuels. Selon Sam Altman, PDG d’OpenAI, Sora représente une première étape dans la technologie de génération vidéo et verra des améliorations significatives à l’avenir.
Quelle est la prochaine étape ?
Le troisième jour des 12 Jours d’OpenAI a placé la barre plus haut pour cet événement. Avec neuf autres annonces à venir, pourrions-nous voir des mises à niveau de Sora ou des outils entièrement nouveaux ? Restez à l’écoute pendant que nous couvrons toutes les révélations passionnantes d’OpenAI au cours de ces 12 jours.
Lire aussi :