J’ai essayé ce nouveau modèle d’IA surpuissant développé par la Chine

L’intelligence artificielle évolue rapidement, et le chatbot d’IA DeepSeek, développé en Chine, est l’une des nouvelles centrales qui font parler d’elles. Les réponses rapides et détaillées de DeepSeek ont de quoi plaire, mais il présente quelques lacunes qui font qu’il n’est peut-être pas l’outil d’IA vers lequel vous vous tournerez.

Qu’est-ce que DeepSeek ?

DeepSeek est une nouvelle centrale d’IA développée par une entreprise technologique chinoise. Son modèle phare, DeepSeek-V3, utilise une architecture unique de mélange d’experts (MoE). Il s’agit d’une « équipe » de systèmes d’IA spécialisés où seuls les experts les plus pertinents sont « activés » pour traiter des tâches spécifiques, chaque « expert » étant un réseau neuronal spécialisé.

DeepSeek affirme que son LLM V3 a été formé sur 14,8 trillions de tokens, un million de tokens équivalant à environ 750 000 mots. DeepSeek V3 est également un énorme LLM en général, avec 671 milliards de paramètres à travers son architecture MoE, avec 37 milliards de ces paramètres activés par jeton. Cela signifie que chaque invite dispose d’une énorme puissance de traitement, avec des performances plus rapides et plus efficaces.

De plus, il s’agit d’un modèle d’IA open-source, ce qui signifie que tout le monde peut l’explorer, le tester et le développer gratuitement. Cela le distingue de ses concurrents qui gardent leurs modèles étroitement enfermés derrière des murs payants.

Mettre DeepSeek à l’épreuve

Pour voir comment DeepSeek-V3 J’ai testé l’appareil sur trois tâches pratiques : écriture créative, assistance au codage et travail lié à la productivité. Ses performances ont démontré à la fois sa polyvalence et sa puissance brute, avec quelques petits problèmes en cours de route.

Tâche 1 : Rédaction d’une description de personnage fictif

J’ai demandé à DeepSeek de rédiger une description détaillée d’un personnage de fiction : une reine rebelle menant une résistance contre un empire maléfique. Le résultat était vivant et engageant.

Tâche 2 : Débogage d’une fonction JavaScript

J’ai testé les compétences de DeepSeek en matière de codage en lui donnant une fonction JavaScript défectueuse qui calcule la factorielle d’un nombre. Voici le code défectueux que je lui ai fourni :

Voir aussi :  Pourquoi un Intel Core Ultra H est une meilleure option qu'un Intel Core Ultra U

DeepSeek a immédiatement détecté le problème : le signe égal (=) dans la condition provoquait une erreur logique. Il a fourni le code corrigé et expliqué le problème :

Cette correction a parfaitement fonctionné et son explication était suffisamment claire pour qu’un novice en JavaScript puisse la comprendre.

Tâche 3 : Productivité – Création d’un ordre du jour de réunion

Pour un test de productivité, j’ai demandé à DeepSeek de rédiger un ordre du jour concis pour une réunion d’équipe de projet sur le lancement d’un nouveau produit.

DeepSeek a excellé dans la rédaction créative, le codage et les tâches liées à la productivité, fournissant des résultats impeccables dans tous les domaines. Comme pour tout outil d’IA, il est important de vérifier l’exactitude des résultats, en particulier lorsque la précision est importante.

Le bon, le mauvais et le surprenant

Après avoir testé DeepSeek, plusieurs forces et faiblesses sont apparues. Il m’a également surpris de quelques manières inattendues.

DeepSeek gère un large éventail de tâches avec facilité. Qu’il s’agisse de produire des textes créatifs percutants ou de déboguer des codes complexes, il a fait preuve d’une flexibilité qui rivalise avec les principaux modèles d’intelligence artificielle. Son architecture de mélange d’experts est à la hauteur des attentes, car elle permet à DeepSeek d’être rapide sans sacrifier la qualité des résultats. Par exemple, il a généré des résultats détaillés tels qu’une description de personnage ou un ordre du jour de réunion en quelques secondes. DeepSeek ajuste son ton et son style sans effort. Qu’il s’agisse de documents formels ou d’écrits créatifs, il adapte ses réponses à la tâche.

Comme de nombreux modèles d’IA, DeepSeek a parfois fourni des informations incorrectes ou incomplètes, en particulier lorsqu’il était interrogé sur des niches ou des sujets très spécifiques. Par exemple, lors d’un test portant sur des faits historiques, il a donné une mauvaise réponse en toute confiance.

Bien que DeepSeek soit un logiciel libre, son matériel d’assistance et ses guides ne sont pas aussi robustes que ceux d’outils tels que GPT-4, ce qui fait qu’il est plus difficile pour les nouveaux utilisateurs de maximiser son potentiel. Compte tenu de son origine chinoise, certains utilisateurs peuvent s’inquiéter de la manière dont leurs données sont traitées ou stockées. Bien qu’il n’y ait aucune preuve d’une utilisation abusive, ces préoccupations méritent d’être prises en compte pour les tâches sensibles (comme pour tout chatbot d’IA !).

Voir aussi :  Aujourd'hui'est le jour où il faut supprimer son compte X (Twitter)

Plus surprenant encore, pour un modèle développé en Chine, DeepSeek a fait preuve d’une aisance remarquable dans les cultures et les perspectives mondiales. Il a fait preuve d’une compréhension sophistiquée de sujets allant de la littérature européenne à l’histoire africaine. La créativité de DeepSeek est un autre atout inattendu. Lorsqu’on lui a demandé de décrire un personnage, il ne s’est pas contenté de le faire, il a également créé un contexte autour du personnage et de ses relations avec les autres personnages.

Les limites de la conversation ouverte

Cela dit, le traitement par DeepSeek de sujets politiquement ou historiquement sensibles révèle des limites significatives concernant des moments de l’histoire chinoise. Pour explorer ce point, j’ai posé des questions sur des événements tels que les manifestations de la place Tiananmen, le Grand Bond en avant et le massacre de Nanjing. Ses réponses ont mis en évidence une approche prudente ou évasive de ces sujets.

Interrogé sur l’incident de la place Tiananmen, DeepSeek a carrément refusé de répondre.

À titre de comparaison, ChatGPT a fourni plus de contexte dans sa réponse. Voici la réponse de ChatGPT :

Interrogé sur le Grand Bond en avant, DeepSeek a fourni une explication brève et peu détaillée.

ChatGPT, cependant, a offert un compte-rendu plus détaillé, y compris des faits et des analyses clés. Vous trouverez ci-dessous la réponse de ChatGPT :

La disparité est devenue encore plus évidente lorsque j’ai posé la question suivante : combien de civils chinois ont été tués lors du massacre de Nanjing ? Qui était responsable ? DeepSeek s’est dérobé, évitant de mentionner les estimations du nombre de morts. Voici sa réponse :

Voir aussi :  Cette application de limitation du temps d'écran m'aide en fait à moins utiliser mon téléphone

En revanche, ChatGPT a fourni une estimation, reconnaissant même qu’il est difficile d’établir des chiffres exacts en raison de la complexité de l’histoire. Voici la réponse de ChatGPT :

Ces réponses suggèrent que DeepSeek opère dans des limites qu’il s’est lui-même imposées, probablement façonnées par son environnement de développement et des considérations réglementaires. Cela pourrait constituer un inconvénient important pour les utilisateurs qui souhaitent explorer sans filtre l’histoire mondiale, le journalisme ou la recherche universitaire.

Cela dit, pour des tâches telles que l’écriture créative, le codage ou le travail lié à la productivité, où ces limitations sont moins susceptibles d’avoir de l’importance, DeepSeek reste un concurrent de taille. En fin de compte, la question de savoir s’il s’agit de l’outil adéquat dépend du degré de transparence et d’ouverture dont vous avez besoin dans un assistant d’IA.

La Chine est-elle plus avancée que les États-Unis en matière d’IA ?

Les principales entreprises et start-ups axées sur l’IA sont Baidu, Tencent, Alibaba, SenseTime, 4Paradigm et Yitu Technology. Les entreprises chinoises d’IA iFlytek, SenseTime, Cloudwalk et DJI ont été remarquées pour leurs technologies de reconnaissance faciale, de reconnaissance sonore et de drones.

Qui est le leader de l’IA en Chine ?

La Chine, comme d’autres acteurs majeurs, s’efforce de consolider son statut de superpuissance de l’IA, en travaillant activement pour s’assurer une position de premier plan dans les technologies émergentes. Le pays a alloué d’importantes ressources à la recherche et au développement de l’IA. La majorité des publications dans ce domaine proviennent d’institutions chinoises.

La Chine sera-t-elle la superpuissance de l’IA ?

La Chine, comme d’autres acteurs majeurs, s’efforce de consolider son statut de superpuissance de l’IA, en travaillant activement à l’obtention d’une position de premier plan dans les technologies émergentes. Le pays a alloué d’importantes ressources à la recherche et au développement de l’IA. La majorité des publications dans ce domaine proviennent d’institutions chinoises.

Cliquez pour évaluer cet article !
[Total: Moyenne : ]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *