La conception rationnelle de protéines fonctionnelles (enzymes) est un objectif important, tant pour des raisons fondamentales que pratiques. Dans ce travail, nous décrivons un processus pour apprendre les contraintes qui spécifient les protéines à partir de données de séquences provenant de l’Evolution, concevoir et construire des librairies de gènes synthétiques, et tester leur activité in vivo. Pour la chorismate mutase, un enzyme clé dans la biosynthèse des amino-acides aromatiques, nous démontrons que ce processus permet la conception d’une grande diversité de protéines ayant des fonctions catalytiques naturelles. Une étape ultérieure permet d’optimiser notre modèle génératif en tenant compte du contexte génomique. Nos résultats montrent que les modèles statistiques fondés sur les séquences de protéines issues d’organismes ayant divergé au cours de l’Evolution suffisent à spécifier et concevoir des protéines artificielles se comportant fonctionnellement comme les protéines réelles. Ils permettent donc d’accéder à l’énorme espace de ces protéines, très partiellement échantillonné par la Nature au cours de l’Evolution.

 

 

 

Conception de protéines Chorismate Mutase à l’aide d’un modèle appris sur des données de séquences issues de l’Evolution

 

 

En savoir plus :
https://science.sciencemag.org/content/369/6502/440
Interview sur le site de l’ENS “De la physique statistique pour modéliser des protéines”

Informations complémentaires :
Laboratoire de Physique de L’Ecole normale supérieure (LPENS, ENS Paris/CNRS/Sorbonne Université/Université de Paris)


Auteur correspondant : Rémi MonassonSimona Cocco

 

Contact communication : L’équipe de communication