DeepSeek : le moment Spoutnik de l'IA chinoise — impressionnant, mais utile en entreprise ?

Le monde de l'IA est en effervescence depuis la sortie de DeepSeek, un nouveau grand modèle de langage (LLM) venu de Chine. À l'image du lancement du satellite Spoutnik par l'Union soviétique en 1957, DeepSeek a provoqué une véritable onde de choc dans le secteur, en dévoilant une architecture inédite et en soulevant des questions sur l'avenir du développement de l'IA. Mais derrière le battage médiatique, que représente réellement DeepSeek pour les entreprises qui souhaitent exploiter la puissance des LLM ? Une révolution, ou une simple preuve de concept vouée à être rapidement dépassée ?

Ce qui distingue DeepSeek : un maillage d'experts

DeepSeek se démarque grâce à trois innovations clés :

Exécution Mixture of Experts (MoE) : au lieu d'un modèle monolithique unique, DeepSeek s'appuie sur un maillage de petits agents experts spécialisés. Lorsqu'une tâche est soumise, seul un sous-ensemble pertinent de ces experts (et de leurs paramètres) est activé. Le modèle gagne ainsi nettement en efficacité côté ressources de calcul.
Données cold-start pour un raisonnement amélioré : DeepSeek s'appuie sur un petit jeu de données de chaînes de raisonnement annotées par des humains et de haute qualité pour affiner le modèle avant d'appliquer l'apprentissage par renforcement. Ces données cold-start améliorent la lisibilité du modèle et renforcent ses capacités de raisonnement, en posant des bases solides pour l'entraînement RL ultérieur. Cette approche illustre le potentiel d'une combinaison entre expertise humaine et apprentissage par renforcement pour développer des modèles de raisonnement plus performants.
Apprentissage par renforcement pour amplifier le raisonnement : DeepSeek met en œuvre un processus d'apprentissage par renforcement multi-étapes pour renforcer les capacités de raisonnement du modèle. Il s'agit d'entraîner le modèle sur un ensemble varié de tâches de raisonnement — codage, mathématiques, sciences et logique — à l'aide de récompenses fondées sur des règles qui guident l'apprentissage. Le RL permet ainsi au modèle d'explorer et de développer en autonomie des stratégies de raisonnement efficaces, avec à la clé des progrès significatifs sur les tâches complexes.

L'éléphant sécuritaire dans la pièce

Comme pour toute nouvelle technologie, a fortiori lorsqu'elle provient d'un pays au contexte géopolitique complexe, les enjeux de sécurité sont majeurs. DeepSeek a beau être open source — ce qui permet à la communauté d'examiner son code à la recherche de biais, de failles ou de risques de sécurité —, son origine suffit à éveiller la méfiance.

Côté pratique : quand le battage rencontre la réalité

L'architecture de DeepSeek a beau être révolutionnaire, son utilité concrète reste aujourd'hui limitée pour la plupart des entreprises. Voici pourquoi :

Gourmand en ressources : faire tourner le modèle DeepSeek R1 complet exige un investissement conséquent en GPU coûteux, ce qui le met hors de portée de nombreuses organisations.
Limites de l'API : l'API DeepSeek est plus accessible, mais soulève des questions de confidentialité des données. Ses conditions d'utilisation indiquent que vos données d'entrée peuvent servir à améliorer le modèle — un point rédhibitoire pour bien des entreprises traitant des données sensibles — et toute donnée collectée est stockée en Chine.
Modèle réduit, qualité dégradée : il est possible de déployer une version allégée de DeepSeek, mais la baisse de performance par rapport à R1 est sensible, ce qui le rend moins compétitif face aux services managés existants.

Faire tourner DeepSeek en toute sécurité : l'avantage du cloud

Pour qui souhaite tout de même expérimenter DeepSeek, l'approche la plus sûre consiste à le déployer dans un environnement cloud maîtrisé tel qu'AWS, GCP ou Azure. Vous gardez ainsi un contrôle total sur vos données et votre infrastructure, ce qui atténue certains risques de sécurité liés aux modèles open source — en particulier ceux dont l'origine pose question. Cette approche revient plus cher que des services managés comme Amazon Bedrock ou Gemini de Google, mais elle offre le plus haut niveau de sécurité et de contrôle.

DeepSeek face à la concurrence : comparatif

Soyons réalistes. Aussi impressionnant soit-il, DeepSeek a peu de chances de détrôner à court terme des acteurs établis comme Claude d'Anthropic, GPT-4 d'OpenAI ou Gemini de Google. Ces modèles ont une longueur d'avance en matière de performance, d'écosystème et — c'est essentiel — d'adoption en entreprise.

Nous avons mené quelques tests en exécutant des modèles DeepSeek Distilled sur Amazon SageMaker, et comparé leurs performances aux modèles déjà disponibles dans l'écosystème AWS. Le constat est sans appel :

Écart de performance : DeepSeek montre du potentiel, mais reste en retrait par rapport aux modèles leaders en précision, en fluidité et en utilité globale dans divers scénarios métier.
Particularités de raisonnement : DeepSeek affiche de solides capacités de raisonnement. Il a toutefois tendance à se remettre en question, ce qui débouche sur des schémas de raisonnement circulaires. Cela peut parfois aider à parvenir à la bonne réponse, mais aussi désorienter le modèle. En voici un exemple :

"inputs": "What's the capital of France?"
"generated_text": "What's the capital of France? The Eiffel Tower. Now, wait. Why is that? Because Eiffel Tower is such a symbol for Paris, right? Yeah, so the capital of France is Paris.\n\nHmm, but wait. Before that, do you get confused sometimes about the basics? Maybe, but let's think. So France is a country in Western Europe. Its capital is Paris, which is famous for its historical landmarks.\n\nOkay, so maybe the confusion comes when people mix up different cities or think the"

Rapport coût/efficacité : compte tenu des coûts d'infrastructure élevés liés à l'exécution de DeepSeek, des services managés comme Bedrock et Gemini constituent une solution plus rentable pour la plupart des cas d'usage.

Nous avons également testé DeepSeek R1 hébergé en le confrontant à d'autres modèles propriétaires. Les essais ont été réalisés avec les mêmes données disponibles pour les deux modèles et un prompt identique.

Génération de code : pas encore une solution miracle. Nous avons poussé l'évaluation des capacités de génération de code de DeepSeek en lui demandant de produire du code Terraform pour configurer une instance Amazon Connect. Le modèle a fait preuve de capacités de raisonnement et d'auto-vérification impressionnantes, mais le code généré contenait toujours des erreurs. À l'inverse, Claude 3.5 Sonnet v2 a produit un code similaire en une fraction du temps.

Voici le code généré par DeepSeek R1 (modèle complet) :

En particulier, les permissions du profil de sécurité ne respectent pas le format requis par le système.

provider "aws" {
  region = "us-west-2"
}

resource "aws_connect_instance" "main" {
  identity_management_type = "CONNECT_MANAGED"
  inbound_calls_enabled     = true
  outbound_calls_enabled    = true
  instance_alias            = "my-connect-instance"
}

resource "aws_connect_security_profile" "admin" {
  instance_id = aws_connect_instance.main.id
  name        = "AdminSecurityProfile"
  permissions = [\
    "Users-Create", "Users-View", "Users-Edit", "Users-Delete",\
    "SecurityProfiles-View", "SecurityProfiles-Create",\
    "SecurityProfiles-Edit", "SecurityProfiles-Delete"\
  ]
}

resource "aws_connect_hours_of_operation" "default" {
  instance_id = aws_connect_instance.main.id
  name        = "24-7"
  config {
    day = "MONDAY"
    start_time { hours = 0, minutes = 0 }
    end_time { hours = 23, minutes = 59 }
  }
  time_zone = "UTC"
}

resource "aws_connect_queue" "default" {
  instance_id           = aws_connect_instance.main.id
  name                  = "DefaultQueue"
  hours_of_operation_id = aws_connect_hours_of_operation.default.id
}

resource "aws_connect_routing_profile" "admin" {
  instance_id               = aws_connect_instance.main.id
  name                      = "AdminRoutingProfile"
  default_outbound_queue_id = aws_connect_queue.default.id
  media_concurrencies {
    channel     = "VOICE"
    concurrency = 1
  }
}

resource "aws_connect_user" "admin" {
  instance_id         = aws_connect_instance.main.id
  name                = "AdminUser"
  password            = "ChangeMe123!" # Use AWS Secrets Manager in production
  security_profile_ids = [aws_connect_security_profile.admin.id]
  routing_profile_id  = aws_connect_routing_profile.admin.id

  phone_config {
    phone_type       = "SOFT_PHONE"
    auto_accept      = true
    after_contact_work_time_limit = 0
  }
}

Et voici le code généré par Claude 3.5 Sonnet v2 :

Les permissions du profil de sécurité respectent bien le format attendu, mais beaucoup ne sont pas requises ou n'existent pas.

provider "aws" {
  region = "us-west-2"
}

resource "aws_connect_instance" "contact_center" {
  instance_alias                 = "contact-center"
  identity_management_type       = "CONNECT_MANAGED"
  inbound_calls_enabled         = true
  outbound_calls_enabled        = true
  contact_lens_enabled          = true
  auto_resolve_best_voices_enabled = true
}

resource "aws_connect_security_profile" "admin" {
  instance_id = aws_connect_instance.contact_center.id
  name        = "Admin"
  description = "Administrator security profile"
  permissions = [\
    "BasicAgentAccess",\
    "OutboundCallAccess",\
    "AccessMetrics",\
    "ManageMetrics",\
    "ManageUsers",\
    "ManageSecurityProfiles",\
    "ManageRoutingProfiles",\
    "ManageQuickConnects",\
    "ManageContactFlows",\
    "ManageHoursOfOperation"\
  ]
}

resource "aws_connect_user" "admin" {
  instance_id        = aws_connect_instance.contact_center.id
  name              = "admin"
  password          = "YourSecurePassword123!" # Change this to a secure password
  routing_profile_id = aws_connect_routing_profile.admin.routing_profile_id
  security_profile_ids = [aws_connect_security_profile.admin.security_profile_id]

  identity_info {
    first_name = "Admin"
    last_name  = "User"
    email      = "[email protected]" # Change this to your email
  }

  phone_config {
    phone_type = "SOFT_PHONE"
  }
}

resource "aws_connect_routing_profile" "admin" {
  instance_id               = aws_connect_instance.contact_center.id
  name                     = "Admin"
  description              = "Admin routing profile"
  default_outbound_queue_id = aws_connect_queue.default.queue_id

  media_concurrencies {
    channel     = "VOICE"
    concurrency = 1
  }
}

resource "aws_connect_queue" "default" {
  instance_id = aws_connect_instance.contact_center.id
  name        = "DefaultQueue"
  description = "Default outbound queue"
  hours_of_operation_id = aws_connect_hours_of_operation.default.hours_of_operation_id
}

resource "aws_connect_hours_of_operation" "default" {
  instance_id = aws_connect_instance.contact_center.id
  name        = "Default Hours"
  description = "24/7 Operation"

  config {
    day = "MONDAY"
    end_time {
      hours   = 23
      minutes = 59
    }
    start_time {
      hours   = 0
      minutes = 0
    }
  }
}

Cet exemple montre bien que, malgré sa puissance, DeepSeek R1 ne remplace pas encore les modèles établis dans tous les scénarios.

Un atout de niche : fine-tuning et distillation

Si DeepSeek n'est pas le meilleur choix pour beaucoup d'organisations en raison de ses exigences d'hébergement, il offre un avantage de poids pour un sous-ensemble bien précis : celles qui s'investissent dans le fine-tuning ou la création de modèles distillés pour des tâches spécialisées. Voici pourquoi :

Empreinte mémoire réduite : la méthode d'exécution MoE de DeepSeek peut considérablement réduire la mémoire GPU nécessaire au fine-tuning ou à l'exécution de la version R1 complète. À la clé : des économies substantielles, en particulier pour des projets aux ressources limitées.
Qualité de sortie améliorée : dans certains cas, l'apprentissage par renforcement utilisé lors de l'entraînement de DeepSeek peut améliorer la qualité des résultats, car un nombre restreint d'experts s'entraîne plus efficacement.

Que faut-il en retenir pour votre entreprise ?

DeepSeek représente une avancée significative en IA, mais ce n'est pas une solution miracle pour tous vos besoins métier. Pour la plupart des entreprises, voici l'essentiel :

Les services managés restent un choix solide : des services comme Bedrock, Gemini et consorts offrent un moyen robuste, sécurisé et économique d'intégrer les LLM à vos opérations. Je m'attends d'ailleurs à ce que la demande pour des modèles comme DeepSeek R1 conduise à leur mise à disposition dans Bedrock, à l'image de Llama 3, pour en tirer parti en toute sécurité.
Privilégiez les applications concrètes : plutôt que de céder à la fascination du dernier modèle à la mode, concentrez-vous sur des solutions qui répondent à vos enjeux métier en s'appuyant sur des technologies éprouvées.
Envisagez DeepSeek pour des cas d'usage spécialisés : si votre organisation s'investit activement dans le fine-tuning ou la distillation de LLM, l'approche MoE de DeepSeek peut apporter des bénéfices notables en coût comme en performance.
Gardez un œil sur les évolutions : l'architecture de DeepSeek influencera sans aucun doute la prochaine génération de LLM. Attendez-vous à voir les grands laboratoires d'IA adopter prochainement des approches MoE similaires et des techniques d'entraînement sur données curées.

Conclusion : un aperçu de l'avenir

DeepSeek, c'est un peu un nouveau Spoutnik — une démonstration éclatante de ce qui devient possible, mais pas nécessairement un outil pratique pour un usage généralisé immédiat en entreprise. C'est le signe d'une innovation rapide dans le domaine de l'IA et l'annonce des progrès à venir. Pour l'heure, les entreprises ont tout intérêt à exploiter les solutions LLM robustes et sécurisées déjà disponibles, tout en surveillant de près l'évolution du paysage et en envisageant DeepSeek pour des usages spécialisés. Les véritables avancées viendront d'une application stratégique de ces technologies pour résoudre des problèmes concrets.

Prêt à libérer la puissance des LLM pour votre entreprise ? Contactez-nous dès aujourd'hui — https://www.doit.com/services — pour découvrir comment nous pouvons vous aider à déployer des solutions d'IA sécurisées et efficaces sur des plateformes leaders comme Amazon SageMaker et Amazon Bedrock.