Rejoignez les newsletters quotidiens et hebdomadaires pour obtenir les dernières mises à jour et le contenu exclusif pour couvrir la principale intelligence artificielle de l’industrie. Apprendre encore plus


Openai affiche désormais plus de détails sur la pensée d’O3-Mini, son dernier modèle. Le changement a été annoncé Compte X Openai Il arrive à un moment où le laboratoire d’intelligence artificielle est exposé à une pression accrue de Deepseek-R1, un modèle ouvert compétitif qui affiche complètement ses symboles logiques.

Des modèles tels que O3 et R1 sont soumis au long processus de «chaîne de pensée» (COT) dans lequel des symboles supplémentaires sont générés pour briser le problème et la cause de différentes réponses, les tester et atteindre une solution finale. Auparavant, les modèles de réflexion à Openai ont caché sa série d’idées et n’ont publié qu’un aperçu de haut niveau des étapes de réflexion. Cela a rendu difficile pour les utilisateurs et les développeurs de comprendre la logique de penser le modèle et de modifier leurs instructions et d’exiger qu’elle soit dirigée dans la bonne direction.

Dans une série de pensées, Openai a examiné un avantage concurrentiel et l’a caché pour empêcher ses concurrents de copier pour former leurs modèles. Mais avec la présence de R1 et d’autres modèles ouverts qui montrent un suivi complet, le manque de transparence devient un défaut sur OpenAI.

La nouvelle version d’O3-Mini affiche une copie plus détaillée de COT. Bien que nous ne voyions toujours pas les symboles bruts, ils donnent plus de clarté sur le processus de réflexion.

Pourquoi les demandes?

Dans nos expériences précédentes sur O1 et R1, nous avons constaté que l’O1 était un peu mieux pour résoudre l’analyse des données et les problèmes de réflexion. Cependant, l’une des principales restrictions était qu’il n’y avait aucun moyen de découvrir pourquoi le modèle a commis des erreurs, il a commis des erreurs lorsqu’ils sont confrontés aux données du monde réel chaotique obtenu à partir du Web. D’un autre côté, la série de pensées R1 R1 nous a permis d’explorer des problèmes et de modifier nos prétentions pour améliorer la pensée.

Par exemple, dans l’une de nos expériences, les deux modèles n’ont pas fourni la bonne réponse. Mais grâce à la série de réflexion détaillée de R1, nous avons pu découvrir que le problème n’était pas avec le modèle lui-même, mais avec le stade de récupération qui a collecté des informations sur le Web. Dans d’autres expériences, la série de pensées R1 a réussi à nous fournir des indices lorsqu’il n’a pas analysé les informations que nous avons fournies, tandis que l’O1 ne nous a donné qu’un aperçu général de la façon de formuler sa réponse.

Nous avons connu le nouveau modèle O3-Mini sur une variable d’une expérience antérieure que nous avons jouée avec O1. Nous avons fourni au modèle un fichier texte qui contient des prix différents de janvier 2024 à janvier 2025. Le fichier était bruyant et non transformé, un mélange de texte normal et d’éléments HTML. Ensuite, nous avons demandé au formulaire de calculer la valeur du portefeuille qui a investi 140 dollars dans les actions merveilleuses 7 le premier jour de chaque mois de janvier 2024 à janvier 2025, et l’avons distribuée uniformément en actions (nous avons utilisé le terme « MAG 7 « Dans un routeur pour le rendre plus difficile).

Le lit O3-Mini a été vraiment utile cette fois. Premièrement, le modèle a été nominé sur ce qu’était MAG 7, les données pour conserver les actions uniquement, et elle a fait les comptes finaux pour fournir la bonne réponse (la valeur du portefeuille est d’environ 2200 dollars à la dernière fois qu’elle a été enregistrée dans les données Nous avons fourni au modèle).

Il faudra plus de tests pour connaître les limites de la nouvelle chaîne de pensée, car Openai cache toujours de nombreux détails. Mais dans les chèques de contrôle, la nouvelle coordination semble plus utile.

Qu’est-ce que cela signifie pour Openai

Lorsque Deepseek-R1 a été publié, il avait trois avantages clairs sur les modèles de réflexion à Openai: il était ouvert, bon marché et transparent.

Depuis lors, Openai a réussi à raccourcir l’écart. Alors que O1 coûte 60 $ par million de symboles de production, O3-MinI ne coûte que 4,40 $, tandis que O a battu de nombreux critères de réflexion. R1 coûte environ 7 $ et 8 $ par million de symboles pour les fournisseurs de services américains. (Deepseek R1 offre 2,19 $ par million de symboles sur leurs propres serveurs, mais de nombreuses organisations ne pourront pas les utiliser car elles les hébergent en Chine.)

Avec le nouveau changement de sortie de COT, OpenAI permet une action quelque peu sur le problème de la transparence.

Il reste à voir ce que Openai fera au sujet des sources ouvertes. Depuis sa sortie, le R1 a déjà été adapté, similaire et hébergé par de nombreux laboratoires et entreprises différents qui sont susceptibles de créer le modèle de pensée préféré pour les institutions. Le PDG d’Openai Sam Altman a récemment admis qu’il était « du mauvais côté de l’histoire » dans une discussion open source. Nous devrons voir comment cette perception apparaîtra dans les futures versions ouvertes.


Lien source

LEAVE A REPLY

Please enter your comment!
Please enter your name here