Les enjeux de la définition de l’IA open source
Une définition étroite et peu rigoureuse de l’IA open source laisserait la porte ouverte à des entreprises comme Meta, qui pourraient changer de cap et cesser de publier des parties de leurs modèles d’IA si ceux-ci ne servent plus leurs intérêts. Un sujet crucial à l’approche du Sommet pour l’action sur l’IA, qui se tiendra en février. Par Mark Surman, président de Mozilla dans « La Tribune ».
Un document de 500 mots a été publié il y a quelques semaines, qui aura un impact significatif sur l’avenir d’Internet. L’Open Source Initiative (OSI) a publié une définition quasi définitive de l’IA open source qui permettra à la vaste communauté des développeurs d’IA de créer un mouvement florissant pour l’innovation, à l’instar de la création d’Internet.
Les logiciels libres sont à la base de l’infrastructure du web ains que de la plupart des applications utilisées aujourd’hui. Cela s’explique par le fait que les pionniers de l’open source ont défini ce dernier comme un logiciel dont l’utilisation et la modification seraient toujours libres, permettant ainsi une adoption généralisée des logiciels libres et donc de l’innovation qui sous-tend notre vie numérique.
Nous assistons à une vague de modèles d’IA – dont beaucoup proviennent des plus grandes entreprises technologiques – qui sont présentés comme étant « open source » mais ne reflètent pas l’esprit de la définition originale du logiciel open source. Bien que cela puisse sembler sémantique, les mots ont leur importance. Un langage approximatif autour de l’IA open source peut faire échouer des trillions de dollars d’innovations futures et laisser les termes de l’IA entre les mains de quelques grandes entreprises.
Nous verrons les mêmes avantages avec l’IA, mais seulement si les développeurs peuvent librement utiliser, étudier, modifier et partager tous les éléments d’un système d’IA. Dans cette dernière phrase, le passage « tous les éléments d’un système d’IA » est essentiel. L’IA et les logiciels présentent des différences essentielles. Un système d’IA comprend un code logiciel construit à partir de modèles d’IA fonctionnels et de données d’entraînement sous-jacentes utilisées pour créer le modèle.
La nouvelle définition de l’OSI affirme que le code et les modèles doivent être ouverts et que les données doivent être transparentes et reproductibles. Supposons que nous voulions ouvrir une nouvelle ère de créativité et d’innovation. Dans ce cas, il faut que les chercheurs en IA – y compris les grands acteurs commerciaux – adoptent cette définition avant de qualifier ce qu’ils publient d’« open source ». Sans cela, les développeurs risquent d’éviter les modèles ouverts et l’ensemble de l’écosystème open source risque de s’arrêter prématurément.
Les grandes entreprises technologiques ont multiplié les grands modèles de langage (LLM) – le Llama de Meta étant le plus connu – qui ont été présentés comme des logiciels libres. Ces modèles facilitent la création d’applications d’IA sans les coûts exorbitants requis pour les créer à partir de zéro. Nous avons vu des applications d’IA de grande valeur, allant de la découverte de médicaments à l’éducation médicale, construites sur la base de ces modèles. Il est indéniable qu’il s’agit d’un pas dans la bonne direction, mais ne soyons pas dupes : ces modèles d’IA ne sont pas vraiment ouverts.
Dans une lettre ouverte publiée dans The Economist, Mark Zuckerberg et Daniel Ek (PDG de Spotify) ont défini l’IA open source comme « des modèles dont les poids des paramètres sont rendus publics avec une licence permissive » et citent le Llama comme exemple.
Cette définition étroite laisse la porte ouverte à des entreprises comme Meta, qui pourraient changer de cap et cesser de publier des parties de leurs modèles d’IA si ceux-ci ne servent plus leurs intérêts. Dans ce cas, les développeurs qui se sont appuyés sur ces modèles pourraient voir leurs produits inopérants ou, au minimum, sévèrement limités. Cela soulève de réelles inquiétudes quant à la viabilité à long terme des applications conçues à partir de ces modèles et, d’une manière générale, quant à la viabilité d’un écosystème d’IA open source dynamique.
En février, Mozilla et l’université de Columbia ont réuni d’éminents experts pour étudier ce que l’open source devrait signifier à l’ère de l’IA. Le document qui en a résulté a mis en évidence les risques d’une utilisation étroite et peu rigoureuse du terme « open source » dans le domaine de l’IA. Il met également en garde contre les licences soi-disant « ouvertes » – à l’instar de la licence Llama – qui n’autorise la libre utilisation que pour les produits comptant moins de 700 millions d’utilisateurs mensuels. Pouvez-vous imaginer créer votre startup sur la base d’un logiciel ouvert qui serait verrouillé dès que votre entreprise serait prospère ? C’est ce que feraient de telles licences.
Le projet de définition vise à remédier à ces risques en traçant des frontières claires autour de ce qui est considéré comme de l’IA open source, afin que les développeurs sachent à quoi ils peuvent se fier. Cela donnera du souffle aux laboratoires d’IA construisant des modèles d’IA open source qui ne disparaîtront pas ou ne fermeront pas.
Parmi les exemples, citons le modèle GPT-NeoX-20B d’EleutherAI, publié sous la licence Apache 2.0, qui permet à quiconque d’utiliser le modèle. De même, le modèle OLMo de l’Allen Institute offre un accès complet au code, aux données, aux poids et à la suite d’évaluation utilisés pour le développer, ce qui permet aux chercheurs de l’étudier et de l’affiner. Contrairement à Llama, ces modèles permettent aux chercheurs d’étudier et de tester pleinement le fonctionnement interne des systèmes d’IA et de les adapter à leurs propres besoins.
Il convient également de noter que les laboratoires comme Eleuther et AI2 sont des organisations à but non lucratif, ce qui donne aux développeurs l’assurance que ces ressources resteront disponibles et à jour, garantissant ainsi la durabilité de leurs produits construits sur la base de ces modèles. C’est ce même principe de soutien durable qui a permis aux projets open source tels que Linux et Apache d’être si répandus dans les serveurs du monde entier. Les développeurs savent que les fondations Linux et Apache continueront à faire fonctionner leurs logiciels dans l’intérêt du public.
Le travail de ces organisations à but non lucratif a le potentiel de créer un avenir de l’IA qui contribue à la fois à un bien public plus large et constitue une boîte à outils véritablement ouverte pour l’ère de l’IA. Les décideurs politiques, les philanthropes et la communauté technologique au sens large devraient s’engager et soutenir des initiatives de ce type.
Les géants de la tech devraient s’inspirer de ces projets et modifier leur approche pour la rendre plus conforme à la nouvelle définition de l’OSI. Si nous y parvenons, nous pourrons donner à chacun – et à toute communauté – les moyens de façonner l’IA, d’en profiter et de lui faire confiance. L’avenir de notre infrastructure numérique et notre capacité d’innovation en dépendent.