Ce n’est qu’en 1957 que les scientifiques ont eu un accès privilégié à la troisième dimension moléculaire.
Après 22 ans d’expériences exténuantes, John Kendrew de l’Université de Cambridge a finalement découvert la structure 3D d’une protéine. C’était un modèle tordu de myoglobine, la chaîne fibreuse de 154 acides aminés qui aide à fournir de l’oxygène à nos muscles. Aussi révolutionnaire que fût cette découverte, Kendrew n’a pas complètement ouvert les vannes de l’architecture des protéines. Au cours de la prochaine décennie, moins d’une douzaine de plus seraient identifiés.
Avance rapide jusqu’à aujourd’hui, 65 ans après cette percée gagnante du prix Nobel.
Jeudi, la société sœur de Google, DeepMind, a annoncé qu’elle avait utilisé avec succès l’intelligence artificielle pour prédire les structures 3D de presque toutes les protéines cataloguées connues de la science. C’est plus de 200 millions de protéines trouvées dans les plantes, les bactéries, les animaux, les humains, à peu près tout ce que vous pouvez imaginer.
“Essentiellement, vous pouvez le considérer comme couvrant l’ensemble de l’univers des protéines”, a déclaré Demis Hassabis, fondateur et PDG de DeepMind, aux journalistes cette semaine.
C’est grâce à AlphaFold, le système d’intelligence artificielle innovant de DeepMind, qui dispose d’une base de données open source afin que les scientifiques du monde entier puissent l’engager dans leurs recherches à volonté et gratuitement. Depuis le lancement officiel d’AlphaFold en juillet de l’année dernière, alors qu’il n’avait identifié que quelque 350 000 protéines 3D, le programme a fait une brèche remarquable dans le paysage de la recherche.
“Plus de 500 000 chercheurs et biologistes ont utilisé la base de données pour visualiser plus de 2 millions de structures”, a déclaré Hassabis. “Et ces structures prédictives ont aidé les scientifiques à faire de nouvelles découvertes brillantes.”
En avril, par exemple, des scientifiques de l’Université de Yale se sont tournés vers la base de données AlphaFold pour les aider à atteindre leur objectif de développer un nouveau vaccin antipaludique très efficace. Et en juillet de l’année dernière, des scientifiques de l’Université de Portsmouth ont utilisé le système pour concevoir des enzymes qui combattront la pollution plastique à usage unique.
“Cela nous a donné un an d’avance, voire deux”, a déclaré au New York Times John McGeehan, directeur du Portsmouth Enzyme Innovation Center et chercheur à l’origine de la dernière étude.
La structure 3D de la vitellogénine, qui forme le jaune d’œuf.
esprit profond
Ces efforts ne sont qu’un petit échantillon de la portée totale d’AlphaFold.
“Au cours de la seule année dernière, il y a eu plus d’un millier d’articles scientifiques sur un large éventail de sujets de recherche utilisant des structures AlphaFold – je n’ai jamais rien vu de tel”, a déclaré Sameer Velankar, contributeur de DeepMind et chef d’équipe du Laboratoire européen de biologie moléculaire. Protein Data Bank a déclaré dans un communiqué de presse.
Selon Hassabis, d’autres personnes ont utilisé la base de données, notamment celles qui tentent d’améliorer notre compréhension de la maladie de Parkinson, les personnes qui espèrent protéger la santé des abeilles et même certaines qui cherchent à obtenir des informations précieuses sur l’évolution humaine.
“AlphaFold change déjà notre façon de penser à la survie des molécules dans les archives fossiles, et je peux voir qu’il deviendra bientôt un outil essentiel pour les chercheurs travaillant non seulement en biologie évolutive mais aussi en archéologie et autres paléosciences.” , Beatrice . Demarchi, professeur agrégé à l’Université de Turin, qui a récemment utilisé le système dans une étude de l’ancienne controverse sur les œufs, dans un communiqué de presse.
Dans les années à venir, DeepMind entend également s’associer à des équipes de la Drugs for Neglected Diseases Initiative et de l’Organisation mondiale de la santé, dans le but de trouver des remèdes à des maladies tropicales peu étudiées mais répandues telles que la maladie de Chagas et la leishmaniose.
“Cela incitera de nombreux chercheurs du monde entier à réfléchir aux expériences qu’ils pourraient faire”, a déclaré aux journalistes Ewan Birney, contributeur de DeepMind et directeur adjoint de l’EMBL. “Et pensez à ce qui se passe dans les organismes et les systèmes qu’ils étudient.”
Serrures et clés
Alors pourquoi tant d’avancées scientifiques dépendent-elles de ce coffre au trésor de la modélisation 3D des protéines ? Expliquons-nous.
Supposons que vous essayez de fabriquer une clé qui rentre parfaitement dans une serrure. Mais vous n’avez aucun moyen de voir la structure de cette serrure. Tout ce que vous savez, c’est que cette serrure existe, quelques faits sur ses matériaux et peut-être des informations numériques sur la taille de chaque crête et l’emplacement de ces crêtes.
Développer cette clé ne serait peut-être pas impossible, mais ce serait assez difficile. Les touches doivent être précises, sinon elles ne fonctionnent pas. Donc, avant de commencer, vous ferez probablement de votre mieux pour modéliser quelques serrures factices différentes avec toutes les informations dont vous disposez afin de pouvoir créer votre clé.
Dans cette analogie, la serrure est une protéine et la clé est une petite molécule qui se lie à cette protéine.
Pour les scientifiques, qu’ils soient médecins essayant de créer de nouveaux médicaments ou botanistes disséquant l’anatomie des plantes pour fabriquer des engrais, l’interaction entre certaines molécules et protéines est cruciale.
Avec les médicaments, par exemple, la manière spécifique dont une molécule médicamenteuse se lie à une protéine pourrait être le point tournant pour savoir si cela fonctionne ou non. Cette interaction est compliquée car, bien que les protéines ne soient que des chaînes d’acides aminés, elles ne sont ni droites ni plates. Inévitablement, ils se plient, se plient et parfois s’emmêlent, comme des cordons d’écouteurs dans votre poche.
En fait, les plis uniques d’une protéine dictent son fonctionnement, et même le plus petit mauvais repliement dans le corps humain peut entraîner des maladies.
Mais pour en revenir aux médicaments à petites molécules, il arrive parfois qu’un médicament ne puisse pas se lier à des fragments d’une protéine repliée. Ils peuvent être pliés d’une manière bizarre qui les rend inaccessibles, par exemple. Des choses comme celle-ci sont des informations très importantes pour les scientifiques qui essaient de faire adhérer leur molécule médicamenteuse. “Je pense qu’il est vrai que presque tous les médicaments qui sont arrivés sur le marché ces dernières années ont été, en partie, conçus à partir de la connaissance des structures protéiques”, a déclaré Janet Thornton, chercheuse à l’EMBL, lors de la conférence.
C’est pourquoi les chercheurs consacrent généralement une quantité incroyable de temps et d’efforts à décoder la structure 3D pliée d’une protéine avec laquelle ils travaillent à peu près de la même manière que vous commenceriez votre voyage de fabrication de clés en assemblant le moule de la serrure. . Si vous connaissez la structure exacte, il devient beaucoup plus facile de savoir où et comment une molécule se lierait à une protéine donnée, ainsi que comment cette liaison pourrait affecter les plis de la protéine en réponse.
Mais cet effort n’est pas simple. Ou bon marché.
“Le coût de la résolution d’une nouvelle structure unique est de l’ordre de 100 000 dollars”, a déclaré Steve Darnell, biologiste structurel et informatique à l’Université du Wisconsin et chercheur à la société de bioinformatique DNAStar, dans un communiqué.
C’est parce que la solution vient généralement de super expériences de laboratoire compliquées.
Kendrew, par exemple, a profité d’une technique appelée cristallographie aux rayons X à l’époque. Fondamentalement, cette méthode vous oblige à prendre des cristaux solides de la protéine qui vous intéresse, à les placer dans un faisceau de rayons X et à observer le motif du faisceau. Ce modèle est plus ou moins la position de des milliers d’atomes à l’intérieur du verre. Ce n’est qu’alors que vous pourrez utiliser le modèle pour découvrir la structure d’une protéine.
Il existe également la technique plus récente connue sous le nom de cryo-microscopie électronique. Ceci est similaire à la cristallographie aux rayons X, sauf que l’échantillon de protéine est bombardé directement d’électrons au lieu d’un faisceau de rayons X. Et bien qu’elle soit considérée comme une résolution beaucoup plus élevée que l’autre technique, elle ne peut pas tout pénétrer exactement. De plus, dans le domaine de la technologie, certains ont tenté de créer numériquement des structures de repliement des protéines. Mais les premières tentatives, comme certaines tentatives dans les années 1980 et 1990, n’ont pas été bonnes. Comme vous pouvez l’imaginer, les méthodes de laboratoire sont également fastidieuses et difficiles.
Au fil des ans, de telles barrières ont donné naissance à ce que l’on appelle le « problème de repliement des protéines ». Les scientifiques ne savent tout simplement pas comment les protéines se replient et ont rencontré des obstacles importants pour surmonter ce problème.
L’IA d’AlphaFold pourrait changer la donne.
Un diagramme fourni par DeepMind de la croissance explosive de la base de données AlphaFold, par espèce.
esprit profond
Résoudre le “problème de pliage”
En bref, les ingénieurs de DeepMind ont formé AlphaFold pour prédire les structures des protéines sans nécessiter la présence d’un laboratoire. Pas de cristaux, pas de tir d’électrons, pas d’expériences à 100 000 $.
Pour amener AlphaFold là où il est aujourd’hui, d’abord, selon le site Web de la société, le système a été exposé à 100 000 structures de repliement de protéines connues. Puis, au fil du temps, il a commencé à apprendre à décoder le reste.
C’est aussi simple que ça. (Eh bien, mis à part le talent qui a permis de coder l’IA.)
“Il faut, je ne sais pas, un minimum de 20 000 dollars et énormément de temps pour cristalliser une protéine”, a déclaré Birney. “Cela signifie que les expérimentateurs doivent prendre des décisions sur ce qu’ils font ; AlphaFold n’a pas encore eu à prendre de décisions.” Cette fonctionnalité de minutie d’AlphaFold est assez fascinante. Cela signifie que les scientifiques ont plus de liberté pour deviner et vérifier, suivre une intuition ou un instinct, et jeter un large filet dans leurs recherches en matière de structures protéiques. Ils n’auront pas à se soucier des coûts ou des délais.
“Les modèles comportent également des erreurs de prédiction”, a déclaré Jan Kosinski, contributeur DeepMind et modélisateur structurel à l’EMBL à Hambourg, en Allemagne. “Et généralement, en fait dans de nombreux cas, l’erreur est vraiment petite. Nous l’appelons donc une précision quasi atomique.”
En outre, l’équipe DeepMind indique également qu’elle a effectué une grande variété d’évaluations des risques pour s’assurer que l’utilisation d’AlphaFold est sûre et éthique. Les membres de l’équipe DeepMind ont également suggéré que l’IA en général pourrait comporter des risques de biosécurité que nous n’avions pas pensé à évaluer auparavant, d’autant plus que cette technologie continue d’imprégner l’espace médical.
Mais au fur et à mesure que l’avenir se déroule, l’équipe DeepMind affirme qu’AlphaFold s’adaptera en douceur et répondra à ces préoccupations au cas par cas. Pour l’instant, cela semble fonctionner, avec un univers de modèles protéiques remontant à un portrait modeste de la myoglobine.
“Il y a à peine deux ans”, a déclaré Birney, “nous ne savions tout simplement pas que c’était faisable.”
Correction à 6h45 PT: Correction du nom de famille et du titre de Janet Thornton.