L’IA continue d’évoluer à une vitesse vertigineuse et cette semaine apporte une multitude d’annonces passionnantes, notamment avec le CES 2025 qui occupe le devant de la scène. Des annonces matérielles de Nvidia aux réflexions de Sam Altman sur l’AGI, il y a beaucoup à découvrir. Permettez-moi de simplifier les choses pour vous : voici tout ce qui est passionnant et nouveau dans l’IA cette semaine.
A lire absolument : Avez-vous consulté notre dernière semaine sur l’IA ? Lisez pour rester au courant de ce qui s’est passé la semaine dernière.
Nvidia dévoile les GPU de la série RTX 50
Nvidia a volé la vedette au CES cette année avec une série d’annonces majeures, dont le très attendu GPU série RTX 50. Ces GPU, construits sur la nouvelle architecture Blackwell de Nvidia, sont conçus pour répondre aux besoins des les joueurs, les monteurs vidéo et surtout les passionnés d’IA. Avec des performances jusqu’à deux fois supérieures à celles de la génération précédente, ils peuvent exécuter localement de nombreux modèles d’IA génératifs.
La gamme comprend quatre GPU : RTX 5070, RTX 5070 Ti, RTX 5080 et RTX 5090. Un élément remarquable de la gamme est le RTX5070l’offre économique de Nvidia. Il offre des performances comparables à celles du RTX 4090 haut de gamme de l’année dernière pour seulement 549 $-à propos d’un tiers du prix du RTX 4090.
Nvidia lance DIGITS, un supercalculateur personnel d’IA
Une autre annonce de Nvidia concerne son nouveau superordinateur IA appelé DIGITS. Imaginez un appareil de taille Mac mini capable d’exécuter des modèles d’IA avec jusqu’à 200 milliards de paramètres mais disponible pour les utilisateurs finaux comme vous et moi. En son cœur se trouve la superpuce Grace Blackwell de Nvidia, associée à 128 Go de mémoire et 4 To de stockage SSD NVMe.
Essentiellement, c’est comme avoir un serveur d’IA sur votre bureau, conçu pour vous permettre d’exécuter ou de créer des modèles d’IA localement. DIGITS fonctionne sur le système d’exploitation DGX de Nvidia, un système basé sur Ubuntu Linux open source, et prend en charge les outils d’IA de Nvidia ainsi que les frameworks d’IA populaires. Au prix de 3 000 $, il devrait arriver sur le marché en mai 2025.
DeepMind développe des modèles de simulation mondiale pour la formation en IA
DeepMind travaille sur des modèles d’IA qui simulent des environnements réels. Ceux-ci sont parfaits pour entraîner des robots et des systèmes autonomes sans avoir besoin de données réelles. Imaginez tester une voiture autonome dans un environnement enneigé ou optimiser l’aménagement d’une usine, le tout dans un espace virtuel. Cette technologie accélère le développement de l’IA tout en réduisant les coûts, rendant le produit final plus abordable.
Google présente l’écoute quotidienne des podcasts personnalisés générés par l’IA
La nouvelle fonctionnalité Daily Listen de Google transforme votre page Google Discover en un podcast personnalisé généré par l’IA. Considérez-le comme votre propre mise à jour quotidienne personnalisée sous forme de podcast. Cette fonctionnalité sera bientôt accessible sur Google Discover.
Semblable à Google NotebookLM, le podcast comprend deux hôtes IA. La fonctionnalité est déployée progressivement, alors gardez un œil dessus.
Modèle Phi 4 Microsoft Open Source
Phi 4 est le modèle d’IA de Microsoft. Il est désormais open source et disponible sur Hugging Face. Il est conçu pour des tâches telles que les mathématiques, la résolution de problèmes multilingues et la génération de code fonctionnel. Avec seulement 14 milliards de paramètres, il est léger mais puissant, ce qui en fait une excellente option pour les développeurs et les utilisateurs souhaitant exécuter localement des modèles d’IA plus petits ou les intégrer dans leurs applications.
XAI lance Grok en tant qu’application iPhone autonome
Grok, le chatbot IA de xAI d’Elon Musk, dispose désormais d’une application iPhone aux États-Unis. Auparavant, Grok n’était accessible que via le site Web ou l’application X (anciennement Twitter).
Bien que la nouvelle application soit simple et allégée, elle promet moins de censure par rapport aux autres chatbots IA. Que vous cherchiez à discuter ou à générer du contenu créatif, Grok est gratuit, ce qui vaut le détour.
Sam Altman présente les plans pour AGI et ASI
PDG d’OpenAI, Sam Altman, annoncé ils sont confiants dans la réalisation de l’AGI (Artificial General Intelligence) et visent désormais l’ASI (Artificial Super Intelligence). AGI fait référence à une IA aussi intelligente que les humains, tandis qu’ASI va au-delà de l’intelligence humaine. Selon Altman, nous pourrions voir les agents de l’IA transformer les lieux de travail dès 2025. Trop tôt pour l’humanité ?
Gaze-LLE suit la concentration oculaire dans les vidéos et les images
Cet outil d’IA prédit où quelqu’un regarde dans une image ou une vidéo. Par exemple, vous pouvez télécharger une vidéo et elle montrera où chaque personne dans la vidéo regarde. L’IA génère des cartes thermiques pour mettre en évidence les zones prioritaires, vous permettant d’analyser l’attention en temps réel.
REGARD LLE est un modèle open source, vous pouvez donc le télécharger pour l’exécuter localement ou l’utiliser sur des plateformes comme Hugging Face et Google Colab. Il est utile pour la surveillance, la recherche et les expériences interactives.
Stereocrafter convertit les vidéos 2D en 3D
Ce nouveau modèle d’IA peut facilement transformer des vidéos 2D en 3D. Normalement, la création d’un effet 3D nécessite qu’un artiste VFX sépare manuellement chaque calque pour plus de profondeur. Cependant, ce modèle automatise l’ensemble du processus. Une fois convertie, vous pouvez regarder la vidéo avec des lunettes 3D classiques rouges et vertes.
Mais cela ne s’arrête pas là. Stéréocrafter peut également réaliser des vidéos compatibles avec les casques VR comme l’Apple Vision Pro. Il utilise votre entrée comme vue de gauche et génère la vue de droite correspondante, créant ainsi une expérience VR immersive. C’est un modèle open source disponible sur GitHub.
Razer présente Project Ava, un coach IA pour les joueurs
Le Project Ava de Razer est un assistant de jeu alimenté par l’IA, conçu pour faire passer vos compétences de jeu au niveau supérieur. Cet outil analyse votre gameplay en temps réel, identifiant les modèles d’attaque, identifiant les erreurs et suggérant des stratégies plus intelligentes. La communauté des joueurs est divisée sur ce point, car certains pensent que cela ressemble à de la triche qui prive les joueurs qui comptent sur l’expérience, les compétences et la stratégie pour gagner.
Que vous affrontiez un boss coriace ou que vous élaboriez une stratégie pour un mode multijoueur compétitif, Ava vous soutient. Une fois le jeu terminé, il génère des rapports d’après-match détaillés, comprenant des statistiques, des rediffusions de moments critiques et des conseils personnalisés pour vous aider à vous améliorer. Considérez-le comme un coach professionnel toujours à vos côtés, prêt à vous aider à passer au niveau supérieur à chaque match.
Spar3D de Stability AI génère des modèles 3D à partir d’images uniques
Spar3D aidera à créer ou plutôt à générer des modèles 3D. Cet outil basé sur l’IA vous permet de générer un modèle 3D à partir d’une seule image en moins d’une seconde. Il prétend créer des représentations 3D précises et détaillées pour la RA, la VR, la conception de jeux et les animations à l’aide de techniques avancées de nuage de points et de création de maillage.
Spar3D prend également en charge l’édition en temps réel : vous pouvez modifier les modèles, changer les couleurs et remodeler les objets à la volée. Il est rapide et accessible, ce qui le rend adapté aux concepteurs et aux développeurs qui cherchent à gagner du temps.
VLC lance des sous-titres et des traductions générés par l’IA
Au CES de cette année, VLC a présenté une nouvelle fonctionnalité d’IA qui fournit des sous-titres et des traductions en temps réel pour les vidéos dans plus de 100 langues. La meilleure partie ? Il fonctionne entièrement hors ligne, ce qui signifie qu’aucune connexion Internet n’est nécessaire. Cela garantit non seulement un traitement plus rapide, mais protège également votre vie privée. Les détails sur la date à laquelle la fonctionnalité sera disponible ne seront pas disponibles.
Adobe permet la création de vidéos transparentes
La nouvelle fonctionnalité d’IA d’Adobe permet aux utilisateurs de générer des vidéos avec des arrière-plans transparents. Vous pouvez l’utiliser pour générer des animations sur écran vert, des graphiques et des effets spéciaux pour vos séquences existantes. Par exemple, vous pouvez générer des effets de fumée, des explosions, des éclairages et des superpositions météorologiques. Cela devrait rendre le montage vidéo plus facile et plus rapide.
Video Anydoor permet aux utilisateurs de modifier, remplacer et ajouter des objets dans les vidéos
Vidéo à toute porte est un outil d’IA de pointe qui vous permet d’ajouter, de remplacer ou de manipuler des objets dans des vidéos de manière transparente. Quelques exemples d’utilisation de cette fonctionnalité sont l’échange de visage, l’ajout de logos et l’insertion naturelle d’objets entièrement nouveaux. Il ajuste automatiquement l’éclairage, les ombres et les couleurs pour correspondre à l’environnement de la vidéo d’origine. Par exemple, vous pouvez ajouter un papillon à un clip nature ou échanger la tenue d’un personnage dans une scène de film, et le résultat final devrait être homogène. Cela peut être un outil précieux pour les cinéastes, les annonceurs et les créateurs de contenu.
L’IA de Hailuo maintient les personnages vidéo cohérents d’une scène à l’autre
L’un des problèmes majeurs de la plupart des modèles de génération vidéo IA est qu’ils créent souvent des vidéos avec des caractères incohérents. Mais que se passe-t-il si vous souhaitez que toutes vos vidéos présentent le même personnage ? La référence du sujet du générateur de vidéo Hailuo indique que vous pouvez désormais télécharger l’image d’un personnage, saisir une invite et la vidéo générée présentera systématiquement le personnage que vous avez choisi.
Cette fonctionnalité fonctionne avec de vrais visages humains, des animations, des dessins animés et même des visages d’animaux. La fonctionnalité de référence du sujet est en cours de déploiement et vous pouvez la consulter sur le Site de Hailuo.
Le chatbot médical Movano EvieAI revendique une précision de 99 %
EvieAI est un chatbot médical qui prétend fournir des réponses précises à 99 % sans hallucinations ni conjectures. Formé sur 10 000 revues médicales provenant de sources fiables comme la Mayo Clinic, il promet fiabilité et précision.
Si le chatbot ne dispose pas des informations dont vous avez besoin, il dit simplement « Je ne sais pas » au lieu de fournir une réponse aléatoire ou inexacte. Actuellement disponible en version bêta, EvieAI est gratuit pour les utilisateurs d’Evie Ring via l’application compagnon.
Omnia AI Smart Mirror surveille votre santé
L’Omnia de Withings, dévoilé au CES 2025, est un miroir intelligent conçu pour intégrer la surveillance de la santé à votre routine quotidienne. Il analyse votre corps pour mesurer des paramètres de santé tels que le poids, la santé cardiaque et la composition corporelle. Grâce à l’IA, il fournit des commentaires en temps réel et des informations personnalisées pour vous aider à rester sur la bonne voie avec vos objectifs de santé.
L’aspirateur Saros Z70 de Roborock est livré avec un bras Robo
Le Saros Z70 de Roborock est un robot aspirateur intelligent avec une particularité : il dispose d’un bras OmniGrip à cinq axes. Ce bras peut ramasser des objets comme des chaussettes, des jouets et de petits objets (jusqu’à 300 grammes) qui bloquent généralement les aspirateurs ordinaires. Dégager le chemin en premier garantit un nettoyage meilleur et ininterrompu. Le Z70 utilise une IA et des capteurs avancés pour naviguer dans votre maison et contrôler le bras pour ramasser des objets.
Mudra Link apporte des gestes de la main aux appareils VR
Mudra Link, présenté au CES 2025, est un bracelet qui vous permet de contrôler des appareils à l’aide de simples gestes de la main. Il détecte les mouvements subtils des doigts et du poignet et les traduit en commandes pour votre smartphone, ordinateur et casques AR/VR.
Imaginez jouer à des jeux VR sans contrôleurs et rien que vos mains. Le bracelet a été reconnu dans la catégorie XR Technologies au CES pour son design innovant.
Sortie du film avec le Deepfake de Poutine
Un nouveau film anglais intitulé Poutine sur la vie de Vladimir Poutine vient de sortir en salles cette semaine. Mais au lieu d’utiliser un maquillage épais ou les effets visuels habituels, il utilise une IA avancée et une technologie deepfake pour placer le visage de Poutine sur l’acteur polonais Slawomir Sobala – qui a passé deux ans à étudier le langage corporel et les manières de Poutine pour améliorer le portrait.
Bien que la technologie soit impressionnante, elle soulève une fois de plus des questions éthiques sur l’utilisation de l’IA dans la narration. Le film est sorti le 10 janvier 2025 dans plusieurs pays, dont les États-Unis et l’Ukraine, mais il ne sortira pas en Russie.
Alors, qu’avez-vous lu dans AI cette semaine ? Faites-le nous savoir sur X.