Les 5 meilleures nouvelles fonctionnalités du GPT-4 expliquées

OpenAI a enfin lancé sa très attendue mise à jour GPT, GPT-4. Le Grand Modèle de Langage (LLM) est livré avec de nouvelles fonctionnalités et capacités puissantes qui ont déjà choqué les utilisateurs du monde entier.

En plus d’être nettement meilleur que le GPT-3.5, le LLM existant qui alimente le chatbot viral ChatGPT d’OpenAI, le GPT-4 peut comprendre des entrées plus complexes, a une limite d’entrée de caractères beaucoup plus grande, a des capacités multimodales, et est apparemment plus sûr à utiliser.

1. GPT-4 peut comprendre des données plus complexes

L’une des principales nouveautés de GPT-4 est sa capacité à comprendre des messages plus complexes et plus nuancés. Selon OpenAI GPT-4 « présente des performances de niveau humain sur divers critères professionnels et académiques ».

Cela a été démontré en soumettant GPT-4 à plusieurs examens de niveau humain et à des tests standardisés, tels que le SAT, le BAR et le GRE, sans aucune formation spécifique. Non seulement GTP-4 a compris et résolu ces tests avec un score relativement élevé, mais il a également battu son prédécesseur, GPT-3.5, à chaque fois.

Crédit image : OpenAI

La capacité à comprendre des messages plus nuancés est également facilitée par le fait que GPT-4 a une limite de mots beaucoup plus importante. Le nouveau modèle peut traiter des invites de saisie allant jusqu’à 25 000 mots (pour mémoire, GPT-3.5 était limité à 8 000 mots). Cela aura une incidence directe sur le niveau de détail que les utilisateurs peuvent introduire dans leurs invites, ce qui permettra au modèle de travailler avec beaucoup plus d’informations et de produire des résultats plus longs.

GPT-4 prend également en charge plus de 26 langues, y compris des langues à faibles ressources telles que le letton, le gallois et le swahili. Lors de l’évaluation comparative de la précision à trois coups sur le benchmark MMLU, GPT-4 a battu GPT-3.5 ainsi que d’autres LLM de premier plan tels que PaLM et Chinchilla en termes de performance en langue anglaise dans 24 langues.

2. Capacités multimodales

La version précédente de ChatGPT se limitait à des invites textuelles. En revanche, l’une des caractéristiques les plus récentes de GPT-4 est sa capacité multimodale. Le modèle peut accepter à la fois des messages textes et des messages images.

Voir aussi :  MakeUseOf's Best of Computex 2024 Awards (en anglais)

Cela signifie que l’IA peut accepter une image en entrée et l’interpréter et la comprendre comme une invite textuelle. Cette capacité s’étend à toutes les tailles et à tous les types d’images et de textes, y compris les documents combinant les deux, les croquis dessinés à la main et même les captures d’écran.

Cependant, les capacités de lecture d’images de GPT-4 vont au-delà de la simple interprétation. OpenAI l’a montré dans son flux de développeurs (ci-dessus), en fournissant à GPT-4 une maquette dessinée à la main d’un site web humoristique. Le modèle a été chargé d’écrire du code HTML et JavaScript pour transformer la maquette en site web tout en remplaçant les blagues par des blagues réelles.

GPT-4 a écrit le code en utilisant la mise en page spécifiée dans la maquette. Lors des tests, le code a produit un site fonctionnel avec, comme vous pouvez le deviner, de vraies blagues. Cela signifie-t-il que les progrès de l’IA signifieront la fin de la programmation ? Pas tout à fait, mais c’est une fonction qui sera utile pour aider les programmeurs.

Aussi prometteuse que soit cette fonctionnalité, elle est encore en phase de recherche et n’est pas accessible au public. En outre, le modèle prend beaucoup de temps pour traiter les entrées visuelles, OpenAI ayant elle-même déclaré qu’il faudrait du travail et du temps pour qu’il devienne plus rapide.

3. Une meilleure dirigeabilité

OpenAI affirme également que le GPT-4 est très facile à diriger. Il est également plus difficile pour l’IA de rompre le caractère, ce qui signifie qu’elle est moins susceptible d’échouer lorsqu’elle est mise en œuvre dans une application pour jouer un certain personnage.

Les développeurs peuvent prescrire le style et la tâche de leur IA en décrivant la direction dans le message « système ». Ces messages permettent aux utilisateurs de l’API de personnaliser fortement l’expérience utilisateur dans certaines limites. Étant donné que ces messages constituent également le moyen le plus facile de « jailbreaker » le modèle, on s’efforce également de les rendre plus sûrs. La démo de GPT-4 a mis ce point en évidence en amenant un utilisateur à essayer d’empêcher GPT-4 d’être un tuteur socratique et de répondre à sa question. Cependant, le modèle a refusé de rompre le caractère.

Voir aussi :  GPT-4 vs. GPT-3.5 : 5 différences clés expliquées

4. La sécurité

OpenAI a passé six mois à rendre GPT-4 plus sûr et mieux aligné. L’entreprise affirme qu’elle est 82 % moins susceptible de répondre à des demandes de contenu inapproprié ou autrement interdit, 29 % plus susceptible de répondre conformément aux politiques d’OpenAI à des demandes sensibles, et 40 % plus susceptible de produire des réponses factuelles par rapport à GPT-3.5.

Il n’est pas parfait, et vous pouvez toujours vous attendre à ce qu’il « hallucine » de temps en temps et à ce qu’il se trompe dans ses prédictions. Certes, GPT-4 a de meilleures perceptions et un meilleur pouvoir de prédiction, mais il ne faut pas pour autant faire aveuglément confiance à l’IA.

5. Amélioration des performances

Outre l’évaluation des performances du modèle sur des examens humains, OpenAI a également évalué le bot sur des critères de référence traditionnels conçus pour les modèles d’apprentissage automatique.

Elle affirme que GPT-4 « surpasse considérablement » les LLM existants et « la plupart des modèles de pointe ». Ces tests comprennent le MMLU susmentionné, l’AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval et Drop, qui testent tous les capacités individuelles.

Vous obtiendrez des résultats similaires en comparant les performances des tests de vision académiques. Les tests effectués comprennent VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA et LSMDC, pour lesquels GPT-4 obtient les meilleurs résultats. Cependant, l’OpenAI a déclaré que les résultats de GPT-4 dans ces tests « ne représentent pas entièrement l’étendue de ses capacités », car les chercheurs continuent à trouver de nouvelles choses plus difficiles que le modèle peut traiter.

Un petit pas pour GPT-4, un grand pas pour l’IA

Avec plus de précision, de sécurité d’utilisation et de capacités avancées, GPT-4 a été mis à la disposition du public via le plan d’abonnement mensuel ChatGPT+ qui coûte 20 euros par mois. En outre, l’OpenAI s’est associée à différentes organisations pour commencer à construire des produits grand public avec le GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes et Khan Academy, entre autres, ont déjà intégré la GPT-4 dans leurs produits.

Voir aussi :  Qu'est-ce qu'un conflit IP et comment le résoudre ?

GPT-4 est peut-être une mise à jour incrémentale par rapport à GPT-3.5, mais c’est une grande victoire pour l’IA en général. À mesure que le modèle devient plus accessible, à la fois pour l’utilisateur moyen et pour les développeurs grâce à son API, il semble qu’il constituera un bon argument en faveur de l’implémentation de LLM dans tous les domaines.

S’abonner à notre lettre d’information

Quoi de neuf avec GPT-4 ?

OpenAI explique que les capacités améliorées de GPT-4 « conduisent à de nouvelles surfaces de risque », de sorte qu’elle a amélioré la sécurité en l’entraînant à refuser les demandes d’informations sensibles ou « interdites ». Il est moins probable qu’il réponde à des questions portant, par exemple, sur la manière de fabriquer une bombe ou d’acheter des cigarettes bon marché.

Le GPT-4 peut-il générer des images ?

Bien que GPT-4 ne puisse pas générer d’images (DALL-E d’OpenAI s’en charge), les applications de sa vision informatique sont stupéfiantes. Lors d’une démonstration en direct des capacités de l’IA, Greg Brockman, président et cofondateur d’OpenAI, a montré que l’IA pouvait créer un site web entier à partir d’une simple note dessinée à la main.

Que fait ChatGPT 4 ?

Il fait partie d’une nouvelle génération de systèmes d’apprentissage automatique capables de converser, de générer du texte lisible à la demande et de produire des images et des vidéos inédites en s’appuyant sur ce qu’ils ont appris d’une vaste base de données de livres numériques et de textes en ligne.

Le GPT-4 est-il meilleur ?

Selon OpenAI, GPT-4 est plus performant que ChatGPT – qui est basé sur GPT-3.5, une version de la technologie précédente de l’entreprise – parce qu’il s’agit d’un modèle plus grand avec plus de paramètres (les valeurs d’un réseau neuronal qui sont modifiées au cours de la formation).

Cliquez pour évaluer cet article !
[Total: Moyenne : ]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *