Récemment, un nouveau modèle d’IA appelé Deepseek R1 a fait des vagues dans le monde de l’IA. Ce qui a commencé comme un projet secondaire «mettre les GPU miniers au travail» s’est transformé en un succès massif. Le R1 de Deepseek fonctionne à égalité avec le modèle O1 de premier niveau d’Openai, mais le fait avec seulement 3% du coût. Aucun point pour avoir supposé qu’il est sorti de la Chine.
En fait, Deepseek est actuellement l’application n ° 1 sur l’App Store, et sa popularité a affecté les cours des actions de nombreuses sociétés d’IA américaines, notamment Alphabet, Microsoft et Meta. Plus particulièrement, Nvidia a vu son cours de bourse baisser de près de 17%.
Alors, qu’est-ce qui rend le modèle R1 de Deepseek mieux que le modèle O1 d’Openai? Découvons.
1. GRATUIT à utiliser
Tout d’abord, Deepseek R1 est entièrement gratuit à utiliser et open source. C’est un modèle de raisonnement, ce qui signifie qu’il faut du temps pour analyser ses propres réponses et raison de résoudre des problèmes et de fournir des réponses, contrairement aux modèles d’IA à usage général. Ces modèles de raisonnement sont généralement coûteux à exécuter. Le R1 de Deepseek est entièrement libre à utiliser mais il y en a plus. Vous pouvez également l’installer et l’exécuter localement sur votre machine.
En revanche, le modèle O1 d’Openai est disponible uniquement pour Chatgpt Plus, avec des niveaux plus élevés atteignant jusqu’à 200 $ par mois. Cependant, en réponse à la concurrence de Deepseek, Openai a annoncé que leur nouveau modèle O3-MinI serait disponible pour les utilisateurs gratuits.
ok nous vous entendions tous.
* Le niveau plus obtiendra 100 requêtes O3-MinI par jour (!) * Nous amènerons l’opérateur à plus dès que nous pouvons * notre prochain agent lancera avec disponibilité dans le niveau plus
Profitez 😊 https://t.co/w8sfsq6mi1
– Sam Altman (@sama) 25 janvier 2025
2. Open-source
Deepseek R1 est un modèle entièrement open source sous licence MIT. Cela signifie que les utilisateurs peuvent accéder au code, le modifier et créer des solutions personnalisées par-dessus. La nature open source du modèle permet à tout le monde de comprendre comment il fonctionne. De plus, les gens peuvent télécharger et exécuter le modèle sur leurs propres appareils ou serveurs, ce qui améliore la confidentialité et le contrôle.
En revanche, le modèle O1 d’Openai est propriétaire. En conséquence, les utilisateurs ne peuvent pas afficher les processus sous-jacents, comprendre comment fonctionne le modèle ou vérifier pleinement ses allégations de confidentialité et de sécurité.
3. Limites d’utilisation généreuses
Avec un abonnement de 20 $ plus, OpenAI ne propose que 50 messages par semaine avec le modèle O1, sauf si vous êtes sur leur plan professionnel. Deepseek, en revanche, fournit un généreux 50 messages par jour – absolument gratuit. Tout ce que vous avez à faire est de télécharger leur application ou de visiter leur site Web pour commencer à l’utiliser.
4. Les modèles plus petits peuvent même fonctionner sur votre ordinateur portable
Bien que vous recevez 50 messages par jour sur leur site Web, vous pouvez supprimer cette limite en téléchargeant le modèle sur votre ordinateur portable. Ensuite, vous recevez des messages illimités.
Deepseek R1 propose des modèles plus petits et distillés. L’un d’eux est le modèle 1.5b – un modèle léger qui peut fonctionner facilement sur votre ordinateur portable ou votre système. Imaginez avoir un modèle de raisonnement AI avancé sur votre appareil personnel. Cela signifie que vous pouvez l’exécuter hors ligne sans Internet. Pas besoin de vous soucier de la confidentialité et vous pouvez même le personnaliser selon vos besoins si vous le souhaitez.
5. Peut accéder à Internet avec un modèle de raisonnement
OpenAI et Deepseek offrent un modèle de raisonnement et une fonction de recherche qui peuvent récupérer des informations sur Internet. Cependant, OpenAI ne peut en utiliser qu’un à la fois. Cela signifie que si vous utilisez l’O1 (modèle de raisonnement), vous ne pouvez pas vérifier les mises à jour Internet. Ses connaissances se limitent aux données de formation qui se terminent en octobre 2023.
Le modèle de raisonnement de Deepseek R1 peut accéder à Internet. Il peut donc récupérer des informations à jour lorsque vous interagissez avec elle. Cela permet à R1 de puiser dans les événements actuels, les données récentes et les mises à jour en temps réel dans ses réponses, ce qui n’est pas possible avec le modèle O1 à ce jour.
6. Peut vérifier l’ensemble du processus de raisonnement
La transparence est un autre domaine où Deepseek R1 brille. Le modèle affiche son raisonnement et comment il est arrivé à la conclusion ou à répondre étape par étape. Cette fonctionnalité est particulièrement utile pour déboguer et comprendre les sorties complexes. De plus, l’ensemble du processus de raisonnement est écrit dans la perspective du modèle AI Deepseek, qui est sain et ajoute une touche de personnalité.
Le modèle O1 d’Openai n’offre pas cette transparence. Bien qu’il produise des réponses, vous ne pouvez pas voir le processus de réflexion derrière eux.
7. Performance supérieure dans des repères spécifiques
En termes de performances, Deepseek R1 est comparable au modèle O1. Cependant, dans des références spécifiques – en particulier celles liées aux mathématiques – Deepseek R1 surpasse O1 d’Openai. Par exemple, Deepseek a marqué un pass à @ 1 taux de 97,3% sur MATH-500 par rapport aux 96,4% d’OpenAI. Il a également atteint des scores plus élevés sur l’American Invitational Mathematics Examination (AIME), marquant 79,8 par rapport à l’OpenAI 78.2.
Deepseek est également très compétitif dans les tâches de raisonnement logique et de codage. Alors que l’O1 d’OpenAI excelle dans des applications plus larges, les forces ciblées de Deepseek en font une meilleure option pour les tâches de mathématiques et de logique.
8. CARFACT pour les développeurs
Pour les développeurs, Deepseek R1 est incroyablement rentable. Ses coûts d’API sont de 90 à 95% moins chers qu’Openai. Par exemple, le traitement de 1 million de jetons d’entrée et de sortie combinés coûte environ 2,74 $ sur Deepseek, contre 75 $ sur O1 d’OpenAI. Combinez cette abordabilité avec sa nature open-source, et vous avez un outil d’IA qui n’est pas seulement efficace mais aussi favorable à un budget.
9. Méthodologie de formation efficace
Bien que cela puisse ne pas avoir un impact direct sur les utilisateurs, il convient de noter que la formation de Deepseek était incroyablement efficace. En utilisant une architecture de mélange d’experts (MOE), il active seulement 37 milliards de paramètres pendant l’inférence, malgré le modèle contenant 671 milliards de paramètres dans l’ensemble. Cette approche a réduit les demandes matérielles et les coûts de formation. C’est l’une des principales raisons pour lesquelles les cours des actions de Nvidia sont en baisse, car Deepseek montre au monde que la puissance massive du serveur n’est pas nécessaire pour exécuter un bon modèle d’IA. Vous pouvez le faire pour une fraction du coût, quelque chose qui est l’USP de la Chine.
Deepseek R1> Openai O1
Deepseek, bien qu’il soit libre et open-source, est également efficace, offre plus de fonctionnalités, des limites de messages plus généreuses, de meilleures performances dans plusieurs tâches et montre même tout son processus de raisonnement.
Pas seulement en théorie – nous avons également testé les deux modèles dans l’utilisation du monde réel, et Deepseek R1 a surpassé l’O1 d’OpenAI dans nos tests.