Prédire le langage biologique du cancer et de la maladie d’Alzheimer à l’aide de l’IA


Les scientifiques ont découvert que de puissants algorithmes utilisés par Netflix, Amazon et Facebook peuvent «  prédire  » le langage biologique du cancer et des maladies neurodégénératives comme la maladie d’Alzheimer.

Les mégadonnées produites au cours de décennies de recherche ont été introduites dans un modèle de langage informatique pour voir si l’intelligence artificielle peut faire des découvertes plus avancées que les humains.

Des universitaires basés au St John’s College, Université de Cambridge, ont découvert que la technologie d’apprentissage automatique pouvait déchiffrer le «  langage biologique  » du cancer, de la maladie d’Alzheimer et d’autres maladies neurodégénératives

Leur étude révolutionnaire a été publiée dans la revue scientifique PNAS aujourd’hui (8 avril 2021) et pourrait être utilisée à l’avenir pour «  corriger les erreurs grammaticales à l’intérieur des cellules qui causent la maladie  ».

Le professeur Tuomas Knowles, auteur principal de l’article et membre du St John’s College, a déclaré: « L’intégration de la technologie d’apprentissage automatique dans la recherche sur les maladies neurodégénératives et le cancer change complètement la donne. En fin de compte, l’objectif sera d’utiliser l’intelligence artificielle pour mettre au point des médicaments ciblés pour soulager considérablement les symptômes ou pour empêcher la démence de se produire. « 

Chaque fois que Netflix recommande une série à regarder ou que Facebook suggère à quelqu’un de se lier d’amitié, les plates-formes utilisent de puissants algorithmes d’apprentissage automatique pour faire des suppositions très éclairées sur ce que les gens vont faire ensuite. Les assistants vocaux comme Alexa et Siri peuvent même reconnaître des personnes individuelles et vous «  répondre  » instantanément.

Le Dr Kadi Liis Saar, premier auteur de l’article et chercheur au St John’s College, a utilisé une technologie d’apprentissage automatique similaire pour former un modèle de langage à grande échelle afin d’examiner ce qui se passe lorsque quelque chose ne va pas avec des protéines à l’intérieur du corps et provoque des maladies. .

Elle a déclaré: « Le corps humain abrite des milliers et des milliers de protéines et les scientifiques ne connaissent pas encore la fonction de nombre d’entre elles. Nous avons demandé à un modèle de langage basé sur un réseau neuronal d’apprendre le langage des protéines.

«Nous avons spécifiquement demandé au programme d’apprendre le langage des condensats biomoléculaires qui changent de forme – des gouttelettes de protéines présentes dans les cellules – que les scientifiques ont vraiment besoin de comprendre pour déchiffrer le langage des fonctions biologiques et des dysfonctionnements qui causent le cancer et les maladies neurodégénératives comme la maladie d’Alzheimer. apprenez, sans qu’on vous le dise explicitement, ce que les scientifiques ont déjà découvert sur le langage des protéines au cours de décennies de recherche. « 

Les protéines sont de grosses molécules complexes qui jouent de nombreux rôles critiques dans le corps. Ils effectuent la plupart du travail dans les cellules et sont nécessaires à la structure, à la fonction et à la régulation des tissus et des organes du corps – les anticorps, par exemple, sont une protéine qui a pour fonction de protéger le corps.

Les maladies d’Alzheimer, de Parkinson et de Huntington sont trois des maladies neurodégénératives les plus courantes, mais les scientifiques pensent qu’il y en a plusieurs centaines.

Dans la maladie d’Alzheimer, qui touche 50 millions de personnes dans le monde, les protéines deviennent indésirables, forment des amas et tuent les cellules nerveuses saines. Un cerveau sain dispose d’un système de contrôle de la qualité qui élimine efficacement ces masses de protéines potentiellement dangereuses, appelées agrégats.

Les scientifiques pensent maintenant que certaines protéines désordonnées forment également des gouttelettes liquides de protéines appelées condensats qui n’ont pas de membrane et fusionnent librement les unes avec les autres. Contrairement aux agrégats de protéines qui sont irréversibles, les condensats de protéines peuvent se former et se reformer et sont souvent comparés à des gouttes de cire changeante dans les lampes à lave.

Le professeur Knowles a déclaré: «Les condensats de protéines ont récemment attiré beaucoup d’attention dans le monde scientifique car ils contrôlent des événements clés dans la cellule tels que l’expression des gènes – comment notre ADN est converti en protéines – et la synthèse des protéines – comment les cellules fabriquent des protéines.

«Tout défaut lié à ces gouttelettes de protéines peut entraîner des maladies telles que le cancer. C’est pourquoi il est essentiel d’intégrer la technologie de traitement du langage naturel dans la recherche sur les origines moléculaires du dysfonctionnement des protéines si nous voulons être en mesure de corriger les erreurs grammaticales à l’intérieur des cellules qui en sont la cause. maladie. »

Le Dr Saar a déclaré: «Nous avons alimenté l’algorithme de toutes les données détenues sur les protéines connues afin qu’il puisse apprendre et prédire le langage des protéines de la même manière que ces modèles apprennent le langage humain et comment WhatsApp sait comment vous suggérer des mots.

« Ensuite, nous avons pu l’interroger sur la grammaire spécifique qui conduit seulement certaines protéines à former des condensats à l’intérieur des cellules. C’est un problème très difficile et le déverrouiller nous aidera à apprendre les règles du langage de la maladie. »

La technologie d’apprentissage automatique se développe à un rythme rapide en raison de la disponibilité croissante des données, de la puissance de calcul accrue et des progrès techniques qui ont créé des algorithmes plus puissants.

Une utilisation plus poussée de l’apprentissage automatique pourrait transformer la recherche future sur le cancer et les maladies neurodégénératives. Des découvertes pourraient être faites au-delà de ce que les scientifiques savent déjà et spéculent actuellement sur les maladies et potentiellement même au-delà de ce que le cerveau humain peut comprendre sans l’aide de l’apprentissage automatique.

Le Dr Saar a expliqué: « L’apprentissage automatique peut être libre des limites de ce que les chercheurs pensent être les cibles de l’exploration scientifique et cela signifiera que de nouvelles connexions seront découvertes que nous n’avons même pas encore conçues. C’est vraiment très excitant. »

Le réseau développé est désormais mis gratuitement à la disposition des chercheurs du monde entier pour permettre à davantage de scientifiques de travailler sur des avancées.

Référence: Saar KL, Morgunov AS, Qi R et al. Apprentissage de la grammaire moléculaire des condensats de protéines à partir des déterminants de séquence et des plongements. PNAS. 2021 et 118 (15). est ce que je: 10.1073 / pnas.2019053118

Cet article a été republié à partir des matériaux suivants. Remarque: le matériel peut avoir été modifié pour sa longueur et son contenu. Pour plus d’informations, veuillez contacter la source citée.



Laisser un commentaire