Allez, on remet une pièce dans la machine de l’IA en parlant de nouveau de DeepSeek. Effectivement, lors de son lancement, le chiffre de $6 millions de dollar comme coût de développement était mis en avant (par nous-mêmes également)… Mais nous allons revenir dessus puisque ce dernier est bien plus élevé que cela.
DeepSeek a coûté plus que $6 millions !
Non, l’IA n’a pas coûté que $6 millions pour son développement… En réalité, il s’avère que l’IA chinois a coûté bien plus. Cependant, le marketing faisant son office a décidé de mettre en avant de faible coût qui est lié au coût des GPU pour la phase de préformation. Comme l’indique SemiAnalysis, choisir de mettre en avant ce coût, c’est comme « pointer un élément spécifique d’une liste de composant et le considérer comme coût total ».
En réalité, le coût total de DeepSeek V3 dépasserait aisément le milliard de dollars. Il est estimé que le coût en matériel dépasse déjà les $500 millions. Il faut ensuite ajouter les coûts en recherche, les salaires des employés, le développement, etc. Tout ça fait que nous sommes loin des 6 petits millions mis en avant.
Néanmoins, il faut rendre à César ce qui lui appartient puisque l’IA s’avère impressionnante malgré tout. Au niveau des performances, la V3 de l’IA chinoise surpasse celles de GPT-4o. Mais l’IA est un secteur en constante évolution et ces progrès en matière de performance étaient attendus finalement. Il n’est donc pas surprenant que V3 surpasse GPT-4o sorti en mai 2024… Et la prochaine version de GPT sera encore plus performante, et ainsi de suite.
SemiAnalysis indique alors que c’est le but de la recherche de l’IA : augmenter le nombre de calculs réalisés avec la même capacité en matériel. Le but étant d’obtenir un maximum « d’intelligence » par dollar dépensé. Il est estimé qu’après chaque année écoulée, les progrès algorithmiques font x4. Ainsi, proposer une IA équivalente à GPT-3 en termes de qualité, les coûts en inférences ont été divisés par 1200. Maintenant, on peut avoir une IA qui tourne localement sur un laptop là où il fallait un supercalculateur auparavant.
Finalement, l’IA chinoise, si elle a pu faire sensation par son chiffre de $6 millions, la réalité est bien plus complexe, mais illustre tout de même une certaine dynamique où les performances augmentent là où les coûts diminuent. D’ailleurs, ce modèle vient mettre la pression sur le marché de l’intelligence artificielle puisqu’à sa sortie, le cours de grosses entreprises a chuté, on se souvient des -$589 milliards de valorisations boursières de NVIDIA. Quoi qu’il en soit, on s’attend à un bel avenir pour l’IA.