Welcome to ydxad.com ! Jeux Applications Nouvelles Sujets Classement
Maison > Nouvelles > Les modèles d'IA de la Chine peuvent s'appuyer sur les données OpenAI: découverte ironique

Les modèles d'IA de la Chine peuvent s'appuyer sur les données OpenAI: découverte ironique

Auteur : Leo
Feb 25,2025

Openai soupçonne que Deepseek, un modèle d'IA chinois connu pour son faible coût, a peut-être été formé à l'aide des données d'OpenAI. Cette révélation, associée à l'impact important du marché de Deepseek, a suscité des préoccupations au sein de l'industrie technologique américaine.

Nvidia, un acteur majeur de la technologie GPU cruciale pour l'IA, a connu une baisse record de 16,86% après l'émergence de Deepseek. D'autres sociétés liées à l'IA, dont Microsoft, Meta, Alphabet et Dell, ont également subi des pertes importantes.

Le modèle R1 de Deepseek est commercialisé comme une alternative beaucoup moins chère aux modèles d'IA occidentaux comme Chatgpt. Son coût de formation signalé de seulement 6 millions de dollars, atteint en utilisant le open-source Deepseek-V3, a soulevé des questions sur les investissements massifs réalisés par les entreprises technologiques américaines en IA. La popularité de Deepseek, attestée par son premier classement sur les graphiques de téléchargement des applications américaines, souligne encore la préoccupation.

OpenAI et Microsoft examinent si Deepseek a violé les conditions d'utilisation d'OpenAI en utilisant son API ou en utilisant la «distillation», une technique pour extraire les données de modèles plus grands. OpenAI a confirmé sa conscience de telles tentatives de chinois et d'autres sociétés de tirer parti de la technologie de l'IA en tête. Ils ont souligné leur engagement à protéger leur propriété intellectuelle et collaborent avec le gouvernement américain pour protéger leurs modèles avancés.

David Sacks, le tsar de l'IA du président Trump, soutient l'affirmation selon laquelle Deepseek a utilisé la distillation, une pratique qu'il pense que Openai contrera activement.

La situation met en évidence une ironie importante: Openai, lui-même accusé d'utiliser le contenu Internet protégé par le droit d'auteur pour former Chatgpt, accuse désormais profondément des pratiques similaires. Cette hypocrisie a été largement notée sur les réseaux sociaux, en particulier à la lumière de la déclaration précédente d'Openai selon laquelle la création de modèles d'IA comme Chatgpt sans matériel protégé par le droit d'auteur est impossible. Cette déclaration a été faite dans une soumission à la Chambre des Lords du Royaume-Uni, où Openai a fait valoir que les lois actuelles sur le droit d'auteur rendent impossible la formation de modèles d'IA de premier plan sans utiliser d'œuvres protégées par le droit d'auteur.

La question de la formation des modèles d'IA sur le matériel protégé par le droit d'auteur est un débat juridique et éthique majeur. Les poursuites déposées par le New York Times et 17 auteurs contre Openai et Microsoft illustrent ce conflit en cours. Alors qu'Openai défend ses pratiques comme «utilisation équitable», le paysage juridique reste incertain, en particulier à la lumière d'un bureau de droit d'auteur américain de 2018 selon lequel l'art généré par l'IA n'est pas éligible à la protection du droit d'auteur.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov/Bloomberg via Getty Images.

Derniers articles