Moment Of Game
  • Accueil
  • Actualités
  • Jeux Vidéo
  • Technologie
  • Divertissement
  • Gadgets
Aucun résultat
Voir tous les résultats
Moment Of Game
  • Accueil
  • Actualités
  • Jeux Vidéo
  • Technologie
  • Divertissement
  • Gadgets
Aucun résultat
Voir tous les résultats
Moment Of Game

DeepSeek R1 : un modèle de raisonnement d’IA open source qui bat l’o1 d’OpenAI

Moment Of Game par Moment Of Game
il y a 5 mois
dans Technologie
A A
DeepSeek R1 un modele de raisonnement dIA open source.webp
0
SHARES
14
VUES
Share on FacebookShare on Twitter

DeepSeek a publié son modèle V3 le mois dernier. L’entreprise a maintenant a dévoilé son modèle de raisonnement, DeepSeek R1. DeepSeek affirme qu’il correspond non seulement au modèle o1 d’OpenAI, mais qu’il le surpasse également, en particulier dans les questions liées aux mathématiques. La bonne nouvelle est qu’un modèle R1 est open source, gratuit et peut même s’exécuter localement. Voyons si R1 est vraiment si bon.

Modèle de raisonnement d'IA open source DeepSeek R1 qui bat OpenAI o1.webp

Qu’est-ce que DeepSeek R1 ?

DeepSeek R1 est un modèle de raisonnement, ce qui signifie qu’il ne fournit pas simplement la première réponse trouvée. Au lieu de cela, il « réfléchit » aux problèmes étape par étape, prenant quelques secondes, voire quelques minutes, pour parvenir à une solution. Ce processus délibéré de chaîne de pensée le rend beaucoup plus précis que les modèles d’IA traditionnels et particulièrement utile dans des domaines comme les mathématiques, la physique et le codage, où le raisonnement est crucial.

Articles Similaires

Android 16 QPR Beta 1 : Material 3 Expressif est ici !

Android 16 QPR Beta 1 : Material 3 Expressif est ici !

il y a 4 semaines
Honkai Star Rail Rail GAXION Meilleure Construction : Cons de lumière, reliques et compositions d’équipe

Honkai Star Rail Rail GAXION Meilleure Construction : Cons de lumière, reliques et compositions d’équipe

il y a 4 semaines
Connexions du NYT d’aujourd’hui # 702 Indices et réponses pour le 13 mai 2025

Connexions du NYT d’aujourd’hui # 711 Indices, réponses – 22 mai 2025

il y a 4 semaines
Bordure NYT d’aujourd’hui # 1378 Indices et réponses pour le 28 mars 2025

Bordure NYT d’aujourd’hui # 1433 indices, réponses – 22 mai 2025

il y a 4 semaines

DeepSeek atteint cette capacité de raisonnement grâce à une combinaison de Apprentissage par renforcement (RL) et Réglage fin supervisé (SFT). Quoi? Voici ce que signifient ces deux termes :

  • Apprentissage par renforcement (RL) : En RL, un agent apprend en interagissant avec un environnement et en recevant des récompenses ou des pénalités pour ses actions. L’objectif est de maximiser la récompense cumulée au fil du temps.
  • Réglage fin supervisé (SFT) : SFT implique de prendre un modèle de langage pré-entraîné et de le former davantage sur un vaste ensemble de données de texte et de code de haute qualité. Ce processus affine les capacités du modèle, améliorant ainsi sa précision et ses performances sur des tâches spécifiques.

Au départ, DeepSeek s’appuyait uniquement sur l’apprentissage par renforcement sans ajustement. Cette phase « DeepSeek R1 Zero » a démontré des capacités de raisonnement impressionnantes, notamment l’auto-vérification, la réflexion et la génération de longues chaînes de pensée. Cependant, il était confronté à des défis tels qu’une mauvaise lisibilité, la répétition et le mélange des langues. Pour résoudre ces problèmes, DeepSeek a combiné RL avec Supervised Fine-Tuning. Cette double approche permet au modèle d’affiner son raisonnement, d’apprendre des erreurs passées et de fournir des résultats constamment meilleurs. Plus important encore, il s’agit d’un modèle open source sous le Licence MIT.

Les chiffres derrière DeepSeek R1

DeepSeek R1 possède un énorme 671 milliards de paramètres. Considérez les paramètres comme les cellules cérébrales qu’une IA utilise pour apprendre de ses données d’entraînement. Plus un modèle comporte de paramètres, plus sa compréhension est détaillée et nuancée. Pour mettre cela en perspective, bien qu’OpenAI n’ait pas divulgué les paramètres de o1, les experts l’estiment à environ 200 milliardsce qui rend R1 nettement plus grand et potentiellement plus puissant.

Malgré sa taille, R1 n’active que 37 milliards de paramètres par jeton pendant le traitement. DeepSeek affirme que cela est fait pour garantir que le modèle reste efficace sans compromettre les capacités de raisonnement.

Le modèle R1 est construit avec le modèle DeepSeek V3 comme base, donc l’architecture et les autres statistiques sont pour la plupart similaires. Voici les statistiques du modèle DeepSeek R1 :

FonctionnalitéRecherche profonde R1
ArchitectureTransformateur avec mélange d’experts (MoE)
Paramètres totaux671 milliards
Paramètres activés37 milliards
Jetons d’entraînement14,8 billions
Fenêtre contextuelle128 000 jetons
Limite de sortie8 000 jetons
Vitesse60 jetons par seconde
Source ouverteOui

Comment R1 se compare-t-il à o1 d’OpenAI ?

En ce qui concerne les benchmarks, DeepSeek R1 est à égalité avec le modèle o1 d’OpenAI et le surpasse même légèrement dans des domaines comme les mathématiques. Sur des tests mathématiques comme AIME, il a obtenu un score de 79,8 %, légèrement meilleur que les 79,2 % de o1. Pour les tâches de programmation sur Codeforces, il a surpassé 96,3 % des programmeurs humains, ce qui montre qu’il s’agit d’un concurrent sérieux. Cependant, il est légèrement en retard sur o1 dans les tests de codage.

1737463205 233 Modèle de raisonnement d'IA open source DeepSeek R1 qui bat OpenAI o1.webp

Pour les développeurs, le modèle est moins cher à intégrer dans les applications. Alors que le modèle o1 coûte 15 $ par million de jetons d’entrée et 60 $ par million de jetons de sortie, R1 ne coûte que 0,14 $ par million de jetons d’entrée (Cache Hit), 0,55 $ pour un million de jetons d’entrée (Cache Miss) et 2,19 $ pour les jetons de sortie, soit 90 %. 95% moins cher.

Une autre caractéristique remarquable de R1 est qu’il montre son tout le processus de réflexion pendant le raisonnement, contrairement à o1, qui est souvent vague sur la manière dont il arrive à des solutions.

1737463205 870 Modèle de raisonnement d'IA open source DeepSeek R1 qui bat OpenAI o1.webp

Versions distillées pour un usage local

DeepSeek a également publié modèles distillés allant de 1,5 milliard à 70 milliards de paramètres. Ces modèles plus petits conservent une grande partie de la puissance de raisonnement du R1 mais sont suffisamment légers pour fonctionner même sur un ordinateur portable.

Modèles distillés :

Nom du modèleModèle de baseParamètres
DeepSeek-R1-Distill-Qwen-1.5BQwen2.5-Math-1.5B1,5 milliards
DeepSeek-R1-Distill-Qwen-7BQwen2.5-Math-7B7B
DeepSeek-R1-Distill-Llama-8BLama-3.1-8B8B
DeepSeek-R1-Distill-Qwen-14BQwen2.5-14B14B
DeepSeek-R1-Distill-Qwen-32BQwen2.5-32B32B
DeepSeek-R1-Distill-Llama-70BLama-3.3-70B-Instruire70B

Ces modèles plus petits facilitent le test local des capacités avancées d’IA sans avoir besoin de serveurs coûteux. Par exemple, les modèles 1,5B et 7B peuvent fonctionner sur des ordinateurs portables. Tandis que les modèles 32B et 70B offrent des performances proches du niveau R1 mais nécessitent des configurations plus puissantes. Mieux encore, certains de ces modèles surpassent le o1-mini d’OpenAI sur les benchmarks.

1737463206 361 Modèle de raisonnement d'IA open source DeepSeek R1 qui bat OpenAI o1.webp

Lire aussi :

Comment accéder à DeepSeek R1

DeepSeek R1 est facile d’accès. Visite chat.deepseek.com et activer Réflexion profonde mode pour interagir avec le modèle complet de 671 milliards de paramètres.

1737463206 847 Modèle de raisonnement d'IA open source DeepSeek R1 qui bat OpenAI o1.webp

Alternativement, vous pouvez accéder au modèle Zero ou à toute version distillée via le Application Câlins Visageoù vous pouvez télécharger des modèles légers à exécuter localement sur votre ordinateur.

Pourquoi DeepSeek R1 est important

En dehors du modèle Phi 4 de Microsoft, il n’existe aucun autre modèle de raisonnement open source disponible. Phi 4, cependant, ne possède que 14 milliards de paramètres et ne peut pas rivaliser avec les modèles fermés o1 d’OpenAI. DeepSeek R1 offre une alternative gratuite et open source qui rivalise avec les options fermées telles que o1 et Gemini 2.0 Flash Thinking. Pour les développeurs, la rentabilité et l’accessibilité ouverte de R1 le rendent particulièrement attrayant.

Le seul inconvénient est que, en tant que modèle développé en Chine, DeepSeek doit se conformer aux réglementations du gouvernement chinois. Cela signifie qu’il ne répondra pas à des sujets sensibles comme la place Tiananmen ou l’indépendance de Taiwan, car l’Administration chinoise du cyberespace (CAC) garantit que toutes les réponses s’alignent sur les « valeurs socialistes fondamentales ».

Mots clés: batDeepSeekdIAdOpenAIlo1modèleOpenquiraisonnementsource
PartagerTweetPin

Articles Similaires

Android 16 QPR Beta 1 : Material 3 Expressif est ici !
Technologie

Android 16 QPR Beta 1 : Material 3 Expressif est ici !

il y a 4 semaines
Honkai Star Rail Rail GAXION Meilleure Construction : Cons de lumière, reliques et compositions d’équipe
Technologie

Honkai Star Rail Rail GAXION Meilleure Construction : Cons de lumière, reliques et compositions d’équipe

il y a 4 semaines
Connexions du NYT d’aujourd’hui # 702 Indices et réponses pour le 13 mai 2025
Technologie

Connexions du NYT d’aujourd’hui # 711 Indices, réponses – 22 mai 2025

il y a 4 semaines
Bordure NYT d’aujourd’hui # 1378 Indices et réponses pour le 28 mars 2025
Technologie

Bordure NYT d’aujourd’hui # 1433 indices, réponses – 22 mai 2025

il y a 4 semaines
Lies Danse sur la brise dans HSR 3.3 : Statistiques et matériaux
Technologie

Lies Danse sur la brise dans HSR 3.3 : Statistiques et matériaux

il y a 4 semaines
Charger plus
  • Tendance
  • Commentaires
  • Dernier
Ultimate Arise Crossover Guide du Débutant (bêta)

Ultimate Arise Crossover Guide du Débutant (bêta)

11 mars 2025
Comment trouver le trésor de Ventza dans Kingdom Come Deliverance 2

Comment trouver le trésor de Ventza dans Kingdom Come Deliverance 2

7 février 2025
Codes de simulateur de creusement de forage Roblox (mars 2025)

Codes de simulateur de creusement de forage Roblox (mars 2025)

4 mars 2025
Top 10 des jeux les plus joués sur Roblox de tous les temps en 2025

Top 10 des jeux les plus joués sur Roblox de tous les temps en 2025

28 février 2025
Codes pour Roblox Anime Adventures

Codes pour Roblox Anime Adventures

0
Toutes les légendes locales de Natlan dans Genshin Impact

Toutes les légendes locales de Natlan dans Genshin Impact

0
Mises à jour et récompenses des codes de Slayer Battlegrounds de septembre 2024

Mises à jour et récompenses des codes de Slayer Battlegrounds de septembre 2024

0
Maîtriser le Tripcaster pour vaincre les ennemis dans Astro Bot

Maîtriser le Tripcaster pour vaincre les ennemis dans Astro Bot

0
Android 16 QPR Beta 1 : Material 3 Expressif est ici !

Android 16 QPR Beta 1 : Material 3 Expressif est ici !

22 mai 2025
Honkai Star Rail Rail GAXION Meilleure Construction : Cons de lumière, reliques et compositions d’équipe

Honkai Star Rail Rail GAXION Meilleure Construction : Cons de lumière, reliques et compositions d’équipe

22 mai 2025
Connexions du NYT d’aujourd’hui # 702 Indices et réponses pour le 13 mai 2025

Connexions du NYT d’aujourd’hui # 711 Indices, réponses – 22 mai 2025

22 mai 2025
Bordure NYT d’aujourd’hui # 1378 Indices et réponses pour le 28 mars 2025

Bordure NYT d’aujourd’hui # 1433 indices, réponses – 22 mai 2025

22 mai 2025

À propos

Moment Of Game offre une couverture intelligente et approfondie des jeux vidéo, films, séries TV et de la culture geek, avec des contenus captivants pour informer et divertir nos lecteurs.

Catégories

  • Jeux Vidéo
  • Technologie

Article récent

  • Android 16 QPR Beta 1 : Material 3 Expressif est ici !
  • Honkai Star Rail Rail GAXION Meilleure Construction : Cons de lumière, reliques et compositions d’équipe
  • Connexions du NYT d’aujourd’hui # 711 Indices, réponses – 22 mai 2025
  • Bordure NYT d’aujourd’hui # 1433 indices, réponses – 22 mai 2025
  • À propos
  • Conditions d’utilisation
  • Politique de confidentialité
  • Politique de cookies
  • Contactez-nous

© 2024 Moment Of Game - Tous droits réservés.

Aucun résultat
Voir tous les résultats
  • Accueil
  • Actualités
  • Jeux Vidéo
  • Technologie
  • Divertissement
  • Gadgets

© 2024 Moment Of Game - Tous droits réservés.