8.8 C
New York

3 fonctionnalités du produit Microsoft Azure AI qui accélèrent l’apprentissage des langues | Weblog Azure et mises à jour


Le Providers de reconnaissance vocale Microsoft Azure est une assortment complète de applied sciences et de companies visant à accélérer l’intégration de la parole dans les functions et à amplifier ainsi la différenciation sur le marché. Parmi les companies disponibles figurent la parole en texte, la synthèse vocale, le service de transcription de dialog par voix neurale personnalisée (CNV), la reconnaissance du locuteur, la traduction vocale, le SDK vocal et le equipment de développement de dispositif vocal (DDK).

L’IA pour l’éducation est une technologie émergente qui a le potentiel de révolutionner la façon dont nous enseignons et apprenons les langues. L’un des facets les plus importants de l’apprentissage des langues est la capacité à prononcer les mots avec précision, et c’est là que le nouveau service Azure Cognitive Speech Service Évaluation de la prononciation Une autre opportunité clé est le développement de voix bilingues synthétiques pour les expériences d’apprentissage des langues avec Customized Neural Voice, en plus de nos capacités de synthèse vocale.

1. Évaluation de la prononciation

La nouvelle fonctionnalité est conçue pour fournir un retour instantané aux utilisateurs sur la précision, la fluidité et la prosodie de leur discours lors de l’apprentissage d’une nouvelle langue. Le service utilise Synthèse vocale Azure Neural et des modèles de transformateur, ainsi qu’une régression ordinale et une construction hiérarchique, pour améliorer la précision de l’évaluation au niveau du mot. Le service est actuellement disponible dans plus de 10 langues, dont l’anglais américain, l’anglais britannique, l’anglais australien, le français, l’espagnol et le chinois, avec des langues supplémentaires en avant-première.

La fonctionnalité d’évaluation de la prononciation offre plusieurs avantages aux enseignants, aux prestataires de companies et aux étudiants :

  • Pour les éducateurs, il fournit une rétroaction instantanée, élimine le besoin d’évaluations de langage oral chronophages et offre des évaluations cohérentes et complètes.
  • Pour les fournisseurs de companies, il offre des capacités élevées en temps réel, un service cognitif vocal mondial et prend en cost la croissance des activités mondiales.
  • Pour les étudiants et les apprenants, il offre un moyen pratique de pratiquer et de recevoir des commentaires, une notation faisant autorité pour comparer avec la prononciation native et aide à suivre l’ordre precise du texte pour les phrases longues ou les paperwork complets.

L’évaluation de la prononciation est un outil puissant pour l’apprentissage et l’enseignement des langues. En tirant parti des applied sciences d’intelligence artificielle telles que TTS, Transformer et Ordinal Regression, il fournit un retour instantané et précis sur la prononciation de la parole. Avec sa massive gamme de langues prises en cost et sa capacité à travailler avec des régions à faibles ressources, il offre aux apprenants en langues de tous horizons la possibilité d’améliorer leurs compétences linguistiques. Avec l’évaluation de la prononciation, les éducateurs peuvent offrir une expérience d’apprentissage plus engageante et accessible, les fournisseurs de companies peuvent améliorer la productivité des purchasers de l’éducation et les étudiants peuvent pratiquer plus facilement n’importe où et n’importe quand.

Au Microsoft réinvente l’éducation événement du 9 février 2023, nous avons annoncé plusieurs nouveautés pour soutenir la réussite des élèves. L’évaluation de la prononciation de la parole est utilisée dans Coach de lecture sur le lecteur immersif et le Progrès du conférencier dans les équipes Microsoft. Il peut être utilisé à l’intérieur et à l’extérieur de la salle de classe pour faire gagner du temps aux enseignants et améliorer les résultats d’apprentissage des élèves sur la fluidité de la lecture, accessible à tous les apprenants.

2. Discours en texte

Les enseignants et les apprenants en langues mélangeront naturellement la langue maternelle et la langue d’apprentissage au cours de la dialog d’apprentissage. Azure Speech en texte prend en cost l’identification de la langue en temps réel pour les scénarios d’apprentissage des langues multilingues et facilite l’interplay homme-homme avec une meilleure compréhension et un contexte lisible.

La dernière technologie de modélisation multilingue et les strategies d’apprentissage par transfert ont été utilisées pour développer de nouveaux langages de parole en texte (STT) basés sur de grandes quantités de données. Ces modèles ont été formés à l’acoustique et aux connaissances linguistiques dans différentes langues et peuvent gérer à la fois la dictée et la dialog dans une variété de domaines linguistiques. La sortie comprend la normalisation inverse du texte (ITN), la capitalisation (le cas échéant) et la ponctuation automatique pour améliorer la lisibilité. Les développeurs peuvent facilement intégrer ces langages dans leurs projets à l’aide d’une interface de programmation d’utility (API) de streaming en temps réel ou d’une transcription par heaps. Les avantages de l’utilisation d’un modèle unifié dans toutes les langues seront immédiatement apparents.

3. Voix neurale prédéfinie et personnalisée (CNV)

La voix neurale (Textual content-to-Speech) peut lire des helps d’apprentissage de manière native et permettre un apprentissage autonome à tout second et en tout lieu. Microsoft Azure IA fournit plus de 449 voix neurales prédéfinies dans 147 langues et variantes pour permettre aux utilisateurs d’enseigner l’IA, de lire du contenu à haute voix, and so on.

Voix neuronale personnalisée (CNV) est une fonctionnalité offerte par Azure AI qui permet aux utilisateurs de créer une voix synthétique distinctive, personnalisée pour leurs functions. Cette fonctionnalité utilise des échantillons de parole humaine comme données d’entraînement pour générer une voix très naturelle pour une marque ou des personnages. Les entreprises d’éducation utilisent cette technologie pour personnaliser l’apprentissage des langues, en créant des personnages uniques avec des voix distinctes qui correspondent à la tradition et aux antécédents de leur public cible. Par exemple, Duolingo a utilisé Customized Neural Voice pour aider à donner vie à neuf nouveaux personnages au sein de la plateforme d’apprentissage des langues, et Pearson l’a utilisé pour améliorer l’évaluation de la prononciation. CNV est basé sur la technologie neuronale de synthèse vocale et permet aux utilisateurs de créer des voix synthétiques riches en kinds de parole, en plusieurs langues et adaptables. La voix réaliste et naturelle est idéale pour représenter les marques et personnifier les machines pour les interactions conversationnelles avec les utilisateurs.

Inspiration shopper

Alors que la technologie proceed de progresser, il devient de plus en plus clair que l’avenir de l’éducation réside dans l’intégration de l’IA. Azure AI est à l’avant-garde de cette révolution, fournissant aux entreprises du secteur de l’éducation des outils puissants pour améliorer l’expérience d’apprentissage et stimuler l’engagement et la réussite des étudiants. Nous nous inspirons de cinq purchasers dans le domaine de l’éducation :

  1. Pearson: L’entreprise souhaitait utiliser l’IA pour fournir de meilleurs companies aux étudiants et donner aux enseignants des évaluations très précises, en utilisant Azure pour développer des companies basés sur l’IA pour les apprenants en langues. Ils ont adopté de nouveaux algorithmes Microsoft et une fonction d’évaluation de la prononciation de pointe, qui fait partie de la fonctionnalité Speech to Textual content.
  2. Centre de companies pour les malvoyants de Pékin Hongdandan: L’organisation travaille avec Microsoft et une équipe de bénévoles pour générer du contenu audio IA, qui sera utilisé pour améliorer les ressources destinées aux personnes aveugles ou malvoyantes. Ils ont utilisé Azure Customized Neural Voice, un outil de synthèse vocale qui permet aux utilisateurs de créer des polices vocales personnalisées, pour générer le contenu audio.
  3. Duolingo: La société d’apprentissage des langues utilise Customized Neural Voice pour personnaliser l’apprentissage des langues en introduisant une distribution de personnages au sein de la plate-forme. Duolingo a traversé des centaines d’itérations de personnages, visant à ce qu’ils reflètent la base d’utilisateurs des cultures du monde entier tout en s’alignant visuellement avec le personnage principal de longue date de l’utility. Ils ont utilisé Customized Neural Voice pour donner vie aux personnages au sein de la plateforme d’apprentissage des langues. Ils ont également utilisé Azure pour donner vie à neuf nouveaux personnages au sein de la plateforme d’apprentissage des langues.
  4. BonjourTalk: L’utility cell innovante offre un moyen agréable et sans effort d’apprendre une nouvelle langue en connectant les utilisateurs avec des locuteurs natifs du monde entier. Avec ses outils linguistiques intuitifs, y compris sa fonction d’évaluation de la prononciation et ses fonctionnalités communautaires, il permet aux utilisateurs de pratiquer et de s’immerger dans la tradition de leur langue cible, d’améliorer leur prononciation et de se faire de nouveaux amis.
  5. Berlitz: La société mondiale de management et de formation linguistique fournit des produits d’apprentissage des langues qui utilisent la reconnaissance vocale Azure et l’évaluation de la prononciation. Grâce à ces outils innovants, les apprenants reçoivent instantanément des informations détaillées sur la précision et la fluidité de leur discours dans la nouvelle langue. Cela permet aux apprenants Berlitz de pratiquer et de perfectionner leur prononciation n’importe où, n’importe quand avant de parler avec des locuteurs natifs en anglais, allemand, espagnol, and so on.

L’affect futur de l’IA dans l’éducation

L’intégration de l’IA, en particulier companies de parole, dans le secteur de l’éducation devient de plus en plus necessary automotive il peut grandement améliorer l’expérience d’apprentissage et améliorer l’efficacité de l’enseignement. Les companies vocaux tels que l’évaluation de la prononciation Azure et la voix neurale personnalisée offrent une personnalisation, une automatisation et des analyses dans les plateformes d’enseignement, ce qui peut conduire à un meilleur engagement et une meilleure réussite des étudiants. Ces companies permettent également aux éducateurs de fournir des commentaires instantanés sur la précision, la fluidité et l’exhaustivité de la parole, ce qui aide les apprenants en langues à améliorer leur prononciation et leur fluidité. Avec la possibilité d’évaluer la prononciation en temps réel, les companies de reconnaissance vocale basés sur l’IA peuvent aider à rendre l’évaluation linguistique plus attrayante et accessible aux apprenants de tous horizons. De plus, ces companies peuvent également aider à personnaliser l’expérience d’apprentissage de chaque élève en fournissant des commentaires et des recommandations personnalisés en fonction des besoins individuels de l’élève. L’intégration de l’IA dans le secteur de l’éducation peut aider les éducateurs à autonomiser les étudiants et à aider les étudiants à réaliser leur plein potentiel.

Démarrer avec Azure Cognitive Providers

Découvrez ces fonctionnalités dans Speech Studio en utilisant une approche sans code. Speech Studio est un ensemble d’outils basés sur l’interface utilisateur pour créer des companies d’IA dans vos functions.

Related Articles

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Articles