8.8 C
New York

Sciences naturelles – Weblog Google IA


C’est une période incroyablement excitante pour être un scientifique. Avec les progrès étonnants de l’apprentissage automatique (ML) et de l’informatique quantique, nous disposons désormais de nouveaux outils puissants qui nous permettent d’agir sur notre curiosité, de collaborer de nouvelles façons et d’accélérer radicalement les progrès vers des découvertes scientifiques révolutionnaires.

Depuis que j’ai rejoint Google Analysis il y a huit ans, j’ai eu le privilège de faire partie d’une communauté de chercheurs talentueux fascinés par l’utilisation de l’informatique de pointe pour repousser les limites de ce qui est potential en sciences appliquées. Nos équipes explorent des sujets dans les sciences physiques et naturelles. Donc, pour le billet de weblog de cette année, je veux me concentrer sur les progrès à fort impression que nous avons réalisés récemment dans les domaines de la biologie et de la physique, de l’aide à l’organisation des informations mondiales sur les protéines et la génomique au revenue de la vie des gens à l’amélioration de notre compréhension de la nature de l’univers avec des ordinateurs quantiques. Nous sommes inspirés par le grand potentiel de ce travail.

Utiliser l’apprentissage automatique pour percer les mystères de la biologie

Beaucoup de nos chercheurs sont fascinés par l’extraordinaire complexité de la biologie, des mystères du cerveau, au potentiel des protéines, et au génome, qui code le langage même de la vie. Nous avons travaillé aux côtés de scientifiques d’autres organisations de premier plan à travers le monde pour relever des défis importants dans les domaines de connectomique, prédiction de la fonction des protéineset génomiqueet de rendre nos improvements accessibles et utiles à l’ensemble de la communauté scientifique.

Neurobiologie

Une software passionnante de notre Méthodes de ML développées par Google était d’explorer remark l’data voyage à travers le voies neuronales dans le cerveau du poisson zèbre, qui donne un aperçu de la façon dont les poissons adoptent un comportement social comme l’essaimage. En collaboration avec des chercheurs du Institut Max Planck pour l’intelligence biologiquenous avons pu reconstruire par ordinateur une partie des cerveaux de poisson zèbre imagés par microscopie électronique 3D – une avancée passionnante dans l’utilisation de l’imagerie et des pipelines informatiques pour cartographier les circuits neuronaux dans les petits cerveaux, et un autre pas en avant dans notre contributions de longue date au domaine de la connectomique.

Reconstruction des circuits neuronaux d’un cerveau larvaire de poisson zèbre, avec l’aimable autorisation de l’Institut Max Planck pour l’intelligence biologique.

Les avancées methods nécessaires à ces travaux auront des purposes même au-delà des neurosciences. Par exemple, pour résoudre la difficulté de travailler avec des ensembles de données connectomiques aussi volumineux, nous avons développé et publié TensorStoreun bibliothèque de logiciels open supply C++ et Python conçu pour le stockage et la manipulation de n-données dimensionnelles. Nous attendons avec impatience de voir remark il est utilisé dans d’autres domaines pour le stockage de grands ensembles de données.

Nous utilisons également le ML pour faire la lumière sur la façon dont les cerveaux humains accomplissent des exploits remarquables comme le langage en comparer le traitement du langage humain et les modèles de langage profond autorégressifs (DLM). Pour cette étude, une collaboration avec des collègues de université de Princeton et École de médecine Grossman de l’Université de New Yorkles members ont écouté un podcast de half-hour pendant que leur activité cérébrale était enregistrée à l’aide électrocorticographie. Les enregistrements suggèrent que le cerveau humain et les DLM partagent des principes de calcul pour le traitement du langage, y compris la prédiction proceed du mot suivant, le recours aux intégrations contextuelles et le calcul de la shock après le début en fonction de la correspondance des mots (nous pouvons mesurer à quel level le cerveau humain est surpris par le mot, et corréler ce sign de shock avec la façon dont le mot est prédit par le DLM). Ces résultats fournissent de nouvelles informations sur le traitement du langage dans le cerveau humain et suggèrent que les DLM peuvent être utilisés pour révéler des informations précieuses sur la base neurale du langage.

Biochimie

ML nous a également permis de faire des avancées significatives dans la compréhension des séquences biologiques. En 2022, nous avons tiré parti des avancées récentes en matière d’apprentissage en profondeur pour prédire avec précision la fonction des protéines à partir de séquences brutes d’acides aminés. Nous avons également travaillé en étroite collaboration avec le Institut Européen de Bioinformatique du Laboratoire Européen de Biologie Moléculaire (EMBL-EBI) à soigneusement évaluer les performances du modèle et ajouter des centaines de hundreds of thousands d’annotations fonctionnelles aux bases de données publiques sur les protéines UniProt, Pfam/InterProet MGnifier. L’annotation humaine des bases de données de protéines peut être un processus laborieux et lent et nos méthodes ML ont permis un bond en avant géant – par exemple, en augmentant le nombre d’annotations Pfam d’un nombre supérieur à tous les autres efforts combinés au cours de la dernière décennie. Les hundreds of thousands de scientifiques du monde entier qui accèdent à ces bases de données chaque année peuvent désormais utiliser nos annotations pour leurs recherches.

Les contributions de Google Analysis à Pfam dépassent en taille tous les efforts d’enlargement de la base de données au cours de la dernière décennie.

Bien que la première ébauche du génome humain ait été publiée en 2003, elle était incomplète et présentait de nombreuses lacunes en raison des limitations methods des applied sciences de séquençage. En 2022, nous avons célébré les réalisations remarquables du Consortium Télomère-2-Télomère (T2T) dans la résolution de ces régions auparavant indisponibles – y compris cinq bras chromosomiques complets et près de 200 hundreds of thousands de paires de bases de nouvelles séquences d’ADN – qui sont intéressantes et importantes pour les questions de biologie humaine, d’évolution et de maladie. Notre Open supply appelant de variante génomique, Variante profondeétait un des outils utilisé par le Consortium T2T pour préparer leur sortie de une séquence complète de 3,055 milliards de paires de bases d’un génome humain. Le Consortium T2T utilise également notre nouveau Open supply méthode Consensus profondqui fournit une correction d’erreurs sur l’appareil pour les devices de séquençage à lecture longue de Pacific Biosciences, dans leur dernières recherches vers des ressources pangénomiques complètes qui peuvent représenter l’étendue de la diversité génétique humaine.

Utiliser l’informatique quantique pour de nouvelles découvertes en physique

Lorsqu’il s’agit de faire des découvertes scientifiques, l’informatique quantique en est encore à ses balbutiements, mais a beaucoup de potentiel. Nous explorons les moyens de faire progresser les capacités de l’informatique quantique afin qu’elle puisse devenir un outil de découverte et de percées scientifiques. En collaboration avec des physiciens du monde entier, nous commençons également à utiliser nos ordinateurs quantiques existants pour créer de nouvelles expériences intéressantes en physique.

Comme exemple de telles expériences, considérons le problème où un capteur mesure quelque selected, et un ordinateur traite ensuite les données du capteur. Traditionnellement, cela signifie que les données du capteur sont traitées comme des informations classiques sur nos ordinateurs. Au lieu de cela, une idée en informatique quantique est de traiter directement les données quantiques des capteurs. Alimenter les données des capteurs quantiques directement vers les algorithmes quantiques sans passer par des mesures classiques peut offrir un grand avantage. Dans un article scientifique récent écrit en collaboration avec des chercheurs de plusieurs universités, nous montrons que l’informatique quantique peut extraire des informations d’un nombre exponentiel de moins d’expériences que l’informatique classique, tant que l’ordinateur quantique est couplé directement aux capteurs quantiques et exécute un algorithme d’apprentissage. Ce « apprentissage automatique quantique» peut donner un avantage exponentiel dans la taille des ensembles de données, même avec les ordinateurs quantiques bruyants d’aujourd’hui. Parce que les données expérimentales sont souvent le facteur limitant de la découverte scientifique, le ML quantique a le potentiel de libérer la vaste puissance des ordinateurs quantiques pour les scientifiques. Mieux encore, les enseignements tirés de ce travail sont également applicables à l’apprentissage des résultats des calculs quantiques, tels que les résultats des simulations quantiques qui pourraient autrement être difficiles à extraire.

Même sans ML quantique, une software puissante des ordinateurs quantiques consiste à explorer expérimentalement des systèmes quantiques qui seraient autrement impossibles à observer ou à simuler. En 2022, l’équipe Quantum AI a utilisé cette approche pour observer la première preuve expérimentale de plusieurs photons micro-ondes dans un état lié à l’aide de qubits supraconducteurs. Les photons n’interagissent généralement pas les uns avec les autres et nécessitent un élément supplémentaire de non-linéarité pour les faire interagir. Les résultats de nos simulations par ordinateur quantique de ces interactions nous a surpris – nous pensions que l’existence de ces états liés reposait sur des situations fragiles, mais nous avons plutôt constaté qu’ils étaient robustes même aux perturbations relativement fortes que nous avons appliquées.

Probabilité d’occupation par rapport à un pas de temps discret pour les états liés à n-photons. On observe que la majorité des photons (couleurs plus foncées) restent liés entre eux.

Compte tenu des succès initiaux que nous avons eus dans l’software de l’informatique quantique pour faire des percées en physique, nous avons bon espoir quant à la possibilité que cette technologie permette de futures découvertes révolutionnaires qui pourraient avoir un impression sociétal aussi necessary que le création de transistors ou GPS. L’avenir de l’informatique quantique en tant qu’outil scientifique est passionnant !

Remerciements

Je tiens à remercier tous ceux qui ont travaillé dur sur les avancées décrites dans cet article, y compris les équipes Google Utilized Sciences, Quantum AI, Genomics et Mind et leurs collaborateurs au sein de Google Analysis et à l’extérieur. Enfin, je tiens à remercier les nombreux Googleurs qui ont fourni des commentaires lors de la rédaction de cet article, notamment Lizzie Dorfman, Erica Model, Elise Kleeman, Abe Asfaw, Viren Jain, Lucy Colwell, Andrew Carroll, Ariel Goldstein et Charina Chou.

Haut


Recherche Google, 2022 et au-delà

Il s’agissait du septième article de weblog de la série « Google Analysis, 2022 & Past ». Les autres articles de cette série sont répertoriés dans le tableau ci-dessous :

* Les articles seront liés au fur et à mesure de leur publication.

Related Articles

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Articles