6.8 C
New York

Modèle d’intégration nouveau et amélioré


Nous sommes ravis d’annoncer un nouveau modèle d’intégration qui est beaucoup plus performant, rentable et plus easy à utiliser. Le nouveau modèle, text-embedding-ada-002remplace cinq modèles distincts pour la recherche de texte, la similarité de texte et la recherche de code, et surpasse notre précédent modèle le plus performant, Davinci, dans la plupart des tâches, tout en étant proposé à un prix inférieur de 99,8 %.

Lire la documentation

Les incorporations sont des représentations numériques de ideas converties en séquences de nombres, ce qui permet aux ordinateurs de comprendre facilement les relations entre ces ideas. Depuis le lancement preliminary de l’OpenAI /encastrements endpoint, de nombreuses functions ont intégré des intégrations pour personnaliser, recommander et rechercher du contenu.

Vous pouvez interroger le /encastrements level de terminaison pour le nouveau modèle avec deux lignes de code utilisant notre Bibliothèque OpenAI Pythoncomme vous le pouviez avec les modèles précédents :

import openai
response = openai.Embedding.create(
  enter="porcine buddies say",
  mannequin="text-embedding-ada-002"
)

Améliorations du modèle

Des performances plus solides. text-embedding-ada-002 surpasse tous les anciens modèles d’intégration sur les tâches de recherche de texte, de recherche de code et de similarité de phrases et obtient des performances comparables sur la classification de texte. Pour chaque catégorie de tâche, nous évaluons les modèles sur les jeux de données utilisés dans anciens encastrements.





Unification des capacités. Nous avons considérablement simplifié l’interface du /encastrements endpoint en fusionnant les cinq modèles distincts présentés ci-dessus (text-similarity, text-search-query, text-search-doc, code-search-text et code-search-code) en un nouveau modèle distinctive. Cette représentation distinctive fonctionne mieux que nos modèles d’intégration précédents sur un ensemble diversifié de critères de recherche de texte, de similarité de phrases et de recherche de code.

Contexte plus lengthy. La longueur de contexte du nouveau modèle est multipliée par quatre, de 2048 à 8192, ce qui facilite le travail avec de longs paperwork.

Taille d’encastrement plus petite. Les nouveaux plongements n’ont que 1536 dimensions, soit un huitième de la taille de davinci-001 embeddings, ce qui rend les nouveaux embeddings plus rentables pour travailler avec des bases de données vectorielles.

Prix ​​réduit. Nous avons réduit le prix des nouveaux modèles d’encastrement de 90% par rapport aux anciens modèles de même taille. Le nouveau modèle atteint des performances supérieures ou similaires à celles des anciens modèles Davinci à un prix inférieur de 99,8 %.

Dans l’ensemble, le nouveau modèle d’intégration est un outil beaucoup plus puissant pour le traitement du langage naturel et les tâches de code. Nous sommes ravis de voir remark nos shoppers l’utiliseront pour créer des functions encore plus performantes dans leurs domaines respectifs.

Limites

Le nouveau text-embedding-ada-002 le modèle n’est pas performant text-similarity-davinci-001 sur le benchmark de classification de sondage linéaire SentEval. Pour les tâches nécessitant l’entraînement d’une couche linéaire légère au-dessus des vecteurs d’intégration pour la prédiction de la classification, nous vous suggérons de comparer le nouveau modèle à text-similarity-davinci-001 et choisir le modèle offrant des performances optimales.

Vérifier la Limites et risques part dans la documentation des intégrations pour les limitations générales de nos modèles d’intégration.

Exemples d’API Embeddings en motion

Calendrier IA est un produit de sensibilisation des ventes qui utilise des incorporations pour faire correspondre le bon argumentaire de vente aux bons shoppers à partir d’un ensemble de données contenant 340 thousands and thousands de profils. Cette automatisation repose sur la similarité entre les intégrations de profils de shoppers et les argumentaires de vente pour classer les correspondances les plus appropriées, éliminant 40 à 56 % du ciblage indésirable par rapport à leur ancienne approche.

Notionla société d’espace de travail en ligne, utilisera les nouvelles incorporations d’OpenAI pour améliorer la recherche Notion au-delà des systèmes de correspondance de mots clés actuels.


Lire la documentation

Related Articles

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Articles