6.8 C
New York

L’apprentissage actif est l’avenir de l’IA générative : voici remark en tirer parti


Au cours du passé six mois, nous avons assisté à des développements incroyables dans l’IA. La sortie de Steady Diffusion a changé à jamais le monde de l’artwork, et ChatGPT-3 a secoué Web avec sa capacité à écrire des chansons, à imiter des paperwork de recherche et à fournir des réponses approfondies et apparemment intelligentes aux questions fréquemment posées sur Google.

Ces progrès de l’IA générative offrent une preuve supplémentaire que nous sommes au bord d’une révolution de l’IA.

Cependant, la plupart de ces modèles d’IA générative sont des modèles fondamentaux : des systèmes d’apprentissage non supervisés à haute capacité qui s’entraînent sur de grandes quantités de données et nécessitent des hundreds of thousands de {dollars} de puissance de traitement pour le faire. Actuellement, seules les establishments bien financées ayant accès à une quantité large de puissance GPU sont capables de construire ces modèles.

La majorité des entreprises qui développent l’IA de la couche utility qui est à l’origine de l’adoption généralisée de la technologie s’appuient toujours sur l’apprentissage supervisé, en utilisant de larges pans de données de formation étiquetées. Malgré les exploits impressionnants des modèles de base, nous en sommes encore aux premiers jours de la révolution de l’IA et de nombreux goulots d’étranglement freinent la prolifération de l’IA de la couche utility.

En aval de la problème d’étiquetage de données bien connu existent des goulots d’étranglement de données supplémentaires qui entraveront le développement de l’IA à un stade ultérieur et son déploiement dans les environnements de manufacturing.

Ces problèmes expliquent pourquoi, malgré les promesses précoces et les flots d’investissements, les applied sciences telles que les voitures autonomes ne sont qu’à un an depuis 2014.

Ces modèles de preuve de idea passionnants fonctionnent bien sur des ensembles de données de référence dans des environnements de recherche, mais ils ont du mal à prédire avec précision lorsqu’ils sont publiés dans le monde réel. Un problème majeur est que la technologie a du mal à atteindre le seuil de efficiency plus élevé requis dans les environnements de manufacturing à enjeux élevés, et ne parvient pas à atteindre les critères de référence importants en matière de robustesse, de fiabilité et de maintenabilité.

Par exemple, ces modèles ne peuvent souvent pas gérer les valeurs aberrantes et les cas extrêmes, de sorte que les voitures autonomes confondent les reflets des vélos avec les vélos eux-mêmes. Ils ne sont ni fiables ni robustes, donc un robotic barista fait un cappuccino parfait deux fois sur cinq mais renverse la tasse les trois autres.

En conséquence, l’écart de manufacturing d’IA, l’écart entre « c’est bien » et « c’est utile », a été beaucoup plus grand et plus formidable que les ingénieurs ML ne l’avaient initialement prévu.

Contre toute attente, les meilleurs systèmes ont également l’interplay la plus humaine.

Heureusement, alors que de plus en plus d’ingénieurs ML ont adopté une approche centrée sur les données pour le développement de l’IA, la mise en œuvre de stratégies d’apprentissage actif a augmenté. Les entreprises les plus sophistiquées tireront parti de cette technologie pour combler le fossé de la manufacturing d’IA et créer des modèles capables de fonctionner plus rapidement dans la nature.

Qu’est-ce que l’apprentissage actif ?

L’apprentissage actif fait de la formation d’un modèle supervisé un processus itératif. Le modèle s’entraîne sur un sous-ensemble preliminary de données étiquetées à partir d’un grand ensemble de données. Ensuite, il essaie de faire des prédictions sur le reste des données non étiquetées en fonction de ce qu’il a appris. Les ingénieurs ML évaluent la certitude du modèle dans ses prédictions et, en utilisant une variété de fonctions d’acquisitionpeut quantifier l’avantage de efficiency ajouté en annotant l’un des échantillons non étiquetés.

En exprimant l’incertitude dans ses prédictions, le modèle décide lui-même quelles données supplémentaires seront les plus utiles pour son apprentissage. Ce faisant, il demande aux annotateurs de fournir plus d’exemples de ce sort de données spécifique uniquement afin qu’il puisse s’entraîner plus intensivement sur ce sous-ensemble lors de son prochain cycle de formation. Pensez-y comme si vous demandiez à un étudiant de déterminer où se situe son manque de connaissances. Une fois que vous savez quels problèmes ils manquent, vous pouvez leur fournir des manuels, des présentations et d’autres helps afin qu’ils puissent cibler leur apprentissage pour mieux comprendre cet side particulier du sujet.

Avec l’apprentissage actif, la formation d’un modèle passe d’un processus linéaire à un processus circulaire avec une forte boucle de rétroaction.

Pourquoi les entreprises sophistiquées devraient être prêtes à tirer parti de l’apprentissage actif

L’apprentissage actif est fondamental pour combler l’écart entre la manufacturing de prototypes et accroître la fiabilité des modèles.

C’est une erreur courante de considérer les systèmes d’IA comme un logiciel statique, mais ces systèmes doivent constamment apprendre et évoluer. Sinon, ils commettent les mêmes erreurs à plusieurs reprises ou, lorsqu’ils sont relâchés dans la nature, ils rencontrent de nouveaux scénarios, commettent de nouvelles erreurs et n’ont pas la possibilité d’en tirer des leçons.

Related Articles

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Articles