Et si je vous disais qu’il existe un nouveau chatbot IA qui surpasse presque tous les modèles de l’espace IA et qui est également gratuit et open source ? Oui, DeepSeek V3 est exactement cela. Dans le Classement Aider LLMDeepSeek V3 occupe actuellement la deuxième place, détrônant GPT-4o, Claude 3.5 Sonnet et même le nouvellement annoncé Gemini 2.0. Il vient juste derrière le modèle de raisonnement o1, qui prend quelques minutes pour générer un résultat.
Alors, est-il enfin temps de passer à un modèle d’IA open source ? Doit-on arrêter nos abonnements Gemini et ChatGPT ? Dans cet article, nous explorerons mon expérience avec DeepSeek V3 et verrons à quel point il se compare aux meilleurs joueurs.
Recherche profonde V3
Développé par la société chinoise d’IA Recherche profondeDeepSeek V3 utilise une architecture basée sur un transformateur. Plus précisément, il utilise un transformateur Mixture-of-Experts (MoE) dans lequel différentes parties du modèle se spécialisent dans différentes tâches, ce qui rend le modèle très efficace. DeepSeek rend tous ses modèles d’IA open source et DeepSeek V3 est le premier modèle d’IA open source qui a surpassé même les modèles fermés dans ses benchmarks, en particulier dans les aspects code et mathématiques.
Le seul inconvénient du modèle pour l’instant est qu’il ne s’agit pas d’un modèle d’IA multimodal et qu’il ne peut fonctionner que sur des entrées et des sorties de texte. Un chatbot IA multimodal peut travailler avec des données dans différents formats comme le texte, l’image, l’audio et même la vidéo. Bien que l’option de téléchargement d’images soit disponible sur le site Web, elle ne peut extraire que le texte des images. Voici les spécifications DeepSeek V3 que vous devez connaître :
Architecture | Transformateur avec mélange d’experts (MoE) |
Paramètres totaux | 671 milliards, mais n’active que 37 milliards de paramètres pour chaque jeton afin de maintenir l’efficacité du modèle. |
Jetons d’entraînement | 14,8 billions |
Fenêtre contextuelle | 128 000 jetons |
Limite de sortie | 8 000 jetons |
Vitesse | 60 jetons par seconde |
Source ouverte | Oui |
La plupart des sociétés d’IA ne divulguent pas ces données pour protéger leurs intérêts, car il s’agit de modèles à but lucratif. Cependant, DeepSeek V3 est tout à fait conforme aux spécifications estimées des autres modèles. La meilleure partie est que DeepSeek a formé son modèle V3 avec seulement 5,5 millions de dollars, contre 100 millions de dollars d’investissement pour OpenAI. (mentionné par Sam Altman). Comparons donc DeepSeek avec d’autres modèles utilisés dans le monde réel.
DeepSeek V3 vs ChatGPT vs Gemini : comparaison des modèles d’IA
J’ai comparé le modèle DeepSeek V3 avec le modèle GPT 4o et Gemini 1.5 Pro (Gemini 2.0 est toujours en version bêta) avec diverses invites. Tous les modèles sont très avancés et peuvent facilement générer de bons modèles de texte comme des e-mails ou récupérer des informations sur le Web et les afficher comme vous le souhaitez, par exemple. Dans ce test, nous avons essayé de comparer leurs capacités de raisonnement et de compréhension.
1. J’ai commencé avec cette invite :
Vous disposez de 2 sabliers : l’un mesure 7 minutes et l’autre 11 minutes.
Question : Comment pouvez-vous les utiliser pour mesurer exactement 15 minutes ?
Étonnamment, ChatGPT et DeepSeek ont tous deux donné une mauvaise réponse. Alors que DeepSeek conclut en disant simplement de retourner 7 sabliers deux fois et de compter 1 minute de plus, ChatGPT s’est trompé et a ensuite conclu que vous pouvez mesurer 15 minutes avec la logique ci-dessus.
Seul Gemini a pu répondre à cette question même si nous utilisons un ancien modèle Gemini 1.5.
Gagnant: Gémeaux
2. J’ai ensuite posé une autre question logique :
Remplacez chaque lettre par un chiffre unique (0 à 9) dans l’équation ci-dessous :
ENVOYER + PLUS = ARGENT
Question : Quelle est la solution ?
Ce problème est plus difficile à résoudre qu’il n’y paraît. Cependant, Gemini et ChatGPT ont directement donné la bonne réponse. Alors que DeepSeek a donné une réponse de 200 lignes avec une explication détaillée.
Mais lorsque j’ai demandé une explication, ChatGPT et Gemini l’ont expliquée en 10 à 20 lignes maximum. En fin de compte, tous les modèles ont répondu à la requête, mais DeepSeek a expliqué le processus complet étape par étape d’une manière plus facile à suivre. Cependant, si vous préférez simplement parcourir le processus, Gemini et ChatGPT sont plus rapides à suivre.
Gagnant: Recherche profonde
3. Enfin, j’ai demandé à tous les modèles de créer un organigramme :
Créez un organigramme décrivant le processus de diagnostic et de résolution d’un problème de connexion Wi-Fi. L’organigramme doit commencer par vérifier si l’appareil est connecté au routeur et se terminer par un résultat « Connexion fixe » ou « Contacter le FAI ». Incluez des points de décision tels que la vérification des connexions physiques, le redémarrage du routeur, la vérification de la configuration IP et les tests avec un autre appareil.
Il s’agit d’une comparaison injuste car DeepSeek ne peut pour l’instant fonctionner qu’avec du texte. Créer un organigramme avec des images et des documents n’est pas possible. Même si le résultat est difficile à comprendre, la logique reste vraie.
Seul ChatGPT a pu générer un organigramme parfait comme demandé.
Gemini a simplement extrait d’Internet une image d’organigramme qui montre comment créer des organigrammes au lieu de résoudre les problèmes de dépannage Wi-Fi. Ensuite, il m’a donné des étapes écrites au lieu d’un organigramme. Mais lorsque j’ai demandé à nouveau un organigramme, il a créé un organigramme basé sur du texte, car Gemini ne peut pas travailler sur des images avec le modèle stable actuel.
Gagnant: ChatGPT
Lire aussi :
DeepSeek V3 contre ChatGPT contre Gemini
DeepSeek semble être à égalité avec les autres principaux modèles d’IA en termes de capacités logiques. La société affirme également qu’elle résout le problème de l’aiguille dans une botte de foin, ce qui signifie que si vous avez donné une grande invite, le modèle d’IA n’oubliera pas quelques détails entre les deux. Ils disent que tous les détails seront pris en compte à coup sûr.
Notez qu’il s’agit de premiers stades et que la taille de l’échantillon est trop petite. Nous continuerons à tester et à tester ce nouveau modèle d’IA pour plus de résultats et vous tiendrons au courant. Restez à l’écoute pour en savoir plus.