L’« effet réverbère » en protéomique


Un problème sous-jacent dans la recherche en protéomique

Notre compréhension actuelle de la biologie humaine, animale et végétale est largement dérivée des connaissances fournies par l’étude du code ADN. Cependant, ce code n’est qu’un des éléments constitutifs du dogme central de la biologie. L’ADN doit être lu et converti en protéines, les «chevaux de trait» de la cellule, responsables de la coordination et de la réalisation de fonctions spécifiques.

L’introduction de technologies à haut débit, d’outils bioinformatiques et de méthodes basées sur l’intelligence artificielle (IA) a fait progresser le domaine de la protéomique au cours des dernières années. Bien qu’elle ne soit pas encore « en clinique » pour ainsi dire, l’étude des protéines exprimées dans des états sains ou malades guide le développement de biomarqueurs diagnostiques, l’identification de cibles médicamenteuses et la production de nouveaux produits biopharmaceutiques. Dans l’ensemble des sciences de la vie, les applications de la protéomique sont nombreuses et variées.

Le Projet Protéome Humain (HPP), qui vise à générer une carte de l’architecture moléculaire à base de protéines du corps humain, a découvert 93,2% du protéome humainidentifiant 18 407 protéines.

« La protéomique est passée d’un domaine isolé à un outil complet pour la recherche biologique qui peut être utilisé pour expliquer les fonctions biologiques » – écrivez Yahui Liu et al.

L’avenir de la protéomique est sans aucun doute prometteur. Cependant, un commentaire article publié dans Méthodes naturelles par Kustatscher et al. plus tôt cette année a attiré l’attention sur un problème sous-jacent dans le domaine : certaines protéines attirent plus l’attention de la recherche que d’autres.

La publication indique qu’environ 500 protéines (environ 25 % du protéome humain) représentent 95 % de toutes les publications en sciences de la vie. La plupart de ces protéines étaient déjà connues de la communauté scientifique à l’époque pré-humaine du projet du génome. La protéine tumorale 53 (p53), parfois surnommée la « gardienne du génome » en raison de son rôle dans la réparation de l’ADN et la division cellulaire, est l’une des protéines les plus étudiées. « L’une des nombreuses statistiques effrayantes révélées est le fait que p53 fait l’objet de 2 publications par jour », déclare Professeur Kathryn Lilleyprofesseur de dynamique cellulaire à l’Université de Cambridge et co-auteur de la publication.

Pourquoi ce biais d’annotation existe-t-il ?

Cette inégalité dans l’annotation des protéines est due à une variété de facteurs différents, explique Lilley : « Premièrement, il existe des raisons pratiques pour lesquelles une protéine peut rester non annotée. Cela pourrait être dû au fait qu’il est exprimé à de faibles niveaux et donc rarement « mesuré » dans une expérience.

Les protéines extrêmement petites, ou celles qui possèdent certaines propriétés (comme être hydrophobes, peuvent s’avérer difficiles même pour les technologies analytiques les plus sophistiquées. Certaines protéines peuvent adopter des états instables qui sont présents pendant une fraction de seconde mais jouent des rôles biologiques clés – connus sous le nom de «protéines éphémères», qui ne sont probablement pas prises en compte dans la plupart des études.

« Il se peut que son correspondant et le gène ou le transcrit n’apparaissent pas comme « intéressants/significatifs » dans les études génomiques, ou qu’ils ne soient associés à aucun état pathologique. De plus, il se peut que la protéine ne ressemble à aucune autre protéine en termes de structure de domaine probable, de motifs bien documentés ou de trajectoire évolutive claire », explique Lilley.

Elle décrit les raisons non pratiques comme étant « moins acceptables » à ses yeux : « Il y a de la sécurité dans le nombre dans la recherche scientifique. Si une protéine est bien étudiée, il peut y avoir plus de ressources disponibles qui peuvent être partagées entre différents groupes. Si une protéine est perçue comme présentant un grand intérêt par la communauté scientifique, il y a plus de chances que les résultats de la recherche soient publiés via des mécanismes à fort impact, ce qui entraîne une citation élevée et, par conséquent, une plus grande chance de financement continu.

Ce cycle n’est peut-être pas unique au domaine de la protéomique et aborde des questions plus larges au sein de la recherche scientifique. Mais dans ce cas, cela alimente ce que Lilley appelle un « microcosme auto-entretenu du protéome bien étudié » au détriment de la prise de risques.

« Lorsque des études mettent au jour des ensembles de protéines qui nécessitent des recherches plus approfondies, il est frustrant de parcourir la littérature pour constater qu’historiquement, ces protéines ont été ignorées, beaucoup n’ayant tout simplement pas d’intérêt significatif à poursuivre, pas assez à la mode pour attirer des financements, ou généralement considérées. être un peu « ennuyeux » », – Lilley.

Pourquoi les protéines sous-étudiées sont-elles problématiques ?

Le biais en faveur de protéines bien étudiées inhibe notre connaissance de la fonction cellulaire, du dysfonctionnement et, en fin de compte, entrave les progrès de la recherche en sciences de la vie. « Le protéome peu étudié contient de nombreux exemples de protéines essentielles à la prolifération, un processus cellulaire clé, dont la fonction aberrante sous-tend de nombreuses maladies, le cancer étant le plus pertinent dans de nombreuses voies de recherche. Ce biais s’étendra à la plupart des processus cellulaires, et donc sans annotation fonctionnelle de ce sous-ensemble de protéines, nous n’aurons que peu ou pas de chance de comprendre pleinement le fonctionnement des cellules.

De nombreux médicaments utilisés pour traiter les maladies humaines ciblent les protéines. Les données de la Base de données DrugBank suggère que toute la collection de médicaments approuvés par la Food and Drug Administration (FDA) des États-Unis cible 620 protéines au total, y compris des transporteurs, des enzymes, des canaux ioniques et des récepteurs. « Le protéome sous-étudié contient un nombre considérable [of proteins] qui devraient être drogués », explique Lilley.

Pour créer un nouveau médicament, différentes étapes de développement préclinique et clinique sont nécessaires. La recherche en laboratoire et les essais précliniques reposent sur des modèles qui permettent aux scientifiques d’interroger la fonction du médicament in vitro et invivo. Cependant, si notre connaissance de base des mécanismes cellulaires est défectueuse, nos modèles pourraient l’être aussi. « La connaissance de la fonction et du rôle dans la maladie de ce sous-ensemble considérable du protéome peut entraîner un changement radical dans la découverte de médicaments à l’avenir », note Lilley.

L’initiative des protéines sous-étudiées

Kustatscher et ses collègues ont mis en lumière l’ampleur du problème – mais comment y faire face ? Un changement est clairement nécessaire dans les approches protéomiques pour mettre un terme au cycle perpétuel. L’initiative des protéines sous-étudiéesun roman Bienvenue Confiancefinancée par Kustatscher et al., propose une solution : un effort coordonné de la communauté de la protéomique fonctionnelle. L’initiative suggère que suffisamment de données soient recueillies sur une protéine sous-étudiée – peut-être sur ses interactions, sa localisation ou son expression – de sorte que des hypothèses sur sa fonction puissent être faites. « Dans un monde idéal, les chercheurs pourraient effectuer des tests fonctionnels au niveau des systèmes, où chaque protéine est testée pour une fonction spécifique. Un bon exemple de cela est de tester si une protéine se lie ou non à l’ARN. Il existe de nombreuses méthodes de routine pour réaliser un tel écran de fonctionnalité et qui peuvent également être appliquées dans de nombreuses conditions ; certaines protéines ne peuvent se lier à l’ARN que dans certaines circonstances », explique Lilley.

En utilisant ces données fonctionnelles, il serait plus facile de clarifier ensuite quel domaine ou laboratoire est le mieux adapté pour mener d’autres études détaillées de cette protéine. Essentiellement, la tâche est divisée en deux parties : une pré-caractérisation à grande échelle par des scientifiques en omique, suivie d’études ciblées de biologie moléculaire. « Plus d’études à l’échelle du système nécessiteront un accord sur le système biologique, des ensembles de conditions testées, le partage des ressources et un ensemble holistique de méthodes pour » pousser et piquer « le protéome sous-étudié », explique Lilley. « Ce qui sera particulièrement essentiel sera le partage de données, la curation, l’intégration de bases de données et la création de modèles cellulaires dynamiques. En s’appuyant sur des ressources telles que MuSIC 1.0, une carte hiérarchique de la cellule du laboratoire Idekerétant un très bon point de départ.

Elle poursuit: «Comme un mot d’avertissement, cependant, la tâche à accomplir est presque incalculable en taille. Nous n’avons pas encore calculé de manière adéquate la taille du protéome. Si l’on prend en considération le nombre de protéoformes qui peuvent exister, en d’autres termes, le nombre d’entités chimiques distinctes par le traitement post-transcriptionnel et post-traductionnel et la nature combinatoire probable de ce traitement, la taille du protéome augmente de plusieurs ordres de grandeur. .”

Peu importe l’ampleur du défi prévu, un début doit être fait quelque part. L’initiative des protéines sous-étudiées a publié une invitation ouverte aux chercheurs, décrivant sa « feuille de route » pour le projet. Un sondage librement accessible a été lancée dans un premier temps, qui présente une protéine humaine choisie au hasard et demande à l’utilisateur de lui attribuer un niveau d’annotation. Ensuite, l’enquête demande à l’utilisateur de décrire les outils, les ressources et les considérations qu’il proposerait pour cette évaluation.


« Sur la base des réponses à l’enquête, nous visons à définir le défi d’un effort communautaire pour lutter contre le biais d’annotation des protéines. Nous présenterons et discuterons des résultats lors d’un atelier », les responsables de l’initiative Etat. Les principales questions à aborder lors de l’atelier sont les suivantes :

  • Quelles nouvelles informations sur une protéine non caractérisée déclencheraient des études mécanistes détaillées ?
  • Quel(s) outil(s) fournirait cette information ?
  • Comment un consortium pourrait-il être structuré ?
  • Comment l’information atteindrait-elle efficacement les biologistes moléculaires pour susciter le changement ?

Prendre part

Certains des plus grands triomphes de la science ont été basés sur la prise d’un risque potentiel. Il semble impératif – sans doute maintenant plus que jamais – que les chercheurs se sentent confiants et à l’aise pour poursuivre des études sur des protéines moins connues ou comprises, quel que soit le défi analytique anticipé ou la perception que la protéine est « terne ». Qui sait ce que nous pourrions trouver – peut-être des solutions à certaines des énigmes scientifiques les plus difficiles de notre époque ?

L’Initiative des protéines sous-étudiées ouvre la voie et encourage la communauté à s’impliquer en participant à l’enquête et en passant le mot.

« En fournissant une caractérisation moléculaire de base de toutes les protéines, l’Initiative des protéines sous-étudiées catalysera les recherches mécanistes sur les protéines sous-étudiées, stimulera de nouvelles recherches biomédicales et renforcera notre compréhension du protéome humain et de son rôle dans la maladie », – L’Initiative des protéines sous-étudiées.

Laisser un commentaire