Introduction

Pourquoi recréer des protéines ? D’un point de vue fondamental, on doit au physicien Richard Feynman (Prix Nobel 1965) la citation « What I cannot create, I do not understand » (Ce que je ne peux pas créer, je ne le comprends pas). En synthétisant les protéines de leur choix, les scientifiques peuvent mieux les étudier et comprendre leurs modes de fonctionnement. D’un point de vue plus pratique, on souhaite synthétiser les protéines cibles pour mettre à contribution leurs multiples fonctions.

Macromolécules

Acide α-aminé

Structure Générale

Un acide α-aminé est un composé polyfonctionnel, possédant à la fois un groupe caractéristique -COOH et un groupe caractéristique –NH2. En milieu biologique, où le pH est souvent tamponné aux alentours de 7 (pH physiologique), les acides α-aminés sont chargés, d’une part négativement avec le groupe –COO- (pKA = 3) et d’autre part positivement, avec le groupe –NH3+ (pKA = 9). L’atome de carbone dit « en alpha », c’est-à-dire immédiatement voisin du groupe –COOH, porte une chaîne carbonée appelée chaîne latérale (Figure 1).

Structure générale d’un acide α-aminé, avec la fonction amine en bleu et la fonction acide carboxylique en rouge
Auteur(s)/Autrice(s) : Anna Venancio-Marques

Les 20 acides α-aminés naturels

La chaîne latérale donne son nom à l’acide α-aminé considéré. Il ne s’agit pas de nomenclature systématique, mais de noms d’usage. Dans le corps humain, il y a 20 acides α-aminés différents, bien que l’un d’entre eux, la proline, fasse plus rigoureusement partie de la famille des imino acides. Pour plus de commodité, un code international de correspondance à 1 et 3 lettres peut être utilisé pour désigner chacun de ces vingt acides aminés. Le groupe R est souvent appelé « résidu » et peut comporter des groupes caractéristiques.

Selon la nature la chaîne latérale, l’acide α-aminé considéré aura différentes propriétés. Une chaîne alkyle engendrera un caractère plus hydrophobe, la présence d’une fonction alcool un caractère plus hydrophile. La charge totale de l’acide α-aminé peut également varier selon la présence de groupes chargés dans la chaîne latérale (-COO-,-NH3+…).)

Stéréochimie

Un caractère partagé par tous les acides α-aminés, à l’exception de la glycine, est la présence d’au moins un atome de carbone asymétrique, c’est-à-dire d’un atome de carbone entouré par quatre atomes ou groupes d’atomes distincts. 19 des acides α-aminés sont ainsi chiraux, c’esr-à-dire non superposable à leur image par un miroir plan (Figure 2).

Un centre stéréochimique des acides α-aminés

L’atome de carbone asymétrique est dans un environnement tétraédrique.

Auteur(s)/Autrice(s) : Anna Venancio-Marques

Une particularité notable dans ces composés est le fait qu’un seul énantiomère n’est présent dans la nature. Dans les cas où la molécule possède 2 atomes de carbone asymétriques, un seul des diastéréoisomères est présent dans la nature. Dans la nomenclature de Fischer, tous les acides α-aminés possèdent une configuration absolue L. En nomenclature de Cram, les acides α-aminés possèdent une configuration S, à l’exception de la cystéine qui a une configuration R.

Peptide

Liaison peptidique

Un peptide est un enchaînement d’acides α-aminés. Lorsqu’un grand nombre (plus d’une dizaine) d’acide α-aminés sont reliés entre eux, la macromolécule est appelée protéine. Les acides aminés sont reliés entre eux par une liaison peptidique (Figure 3).

Formation d’une liaison peptide (entourée)

Les groupes réagissant ensemble sont encadrés.

Auteur(s)/Autrice(s) : Anna Venancio-Marques

Il s’agit d’une fonction amide obtenue par réaction d’une fonction acide carboxylique et d’une fonction amine et qui libère une molécule d’eau. Les quatre atomes (C, N, O et H) sont dans un même plan, c’est-à-dire que les liaisons sont coplanaires.

Polymère d'acides α-aminés

L’exemple précédent montre l’obtention d’un dipeptide, c’est-à-dire d’une molécule composée de 2 acides α-aminés. Le dipeptide conserve une fonction amine primaire, du côté du N-terminus, et une fonction acide carboxylique de l’autre côté, au C-terminus. Le dipeptide possède ainsi les mêmes groupes fonctionnels que l’acide α-aminé, et peut ainsi continuer à réagir pour conduire à un polymère.

Peptide et protéines

Traditionnellement, la séquence d’acides α-aminés composant un peptide est lue du N terminus au C terminus. Il est en effet capital de distinguer l’ordre d’enchaînement des acides α-aminés, car les peptides obtenus ne possèdent pas les mêmes propriétés. Des exemples de séquences sont présentés Figure 4.

Exemples de dipeptides et de tripeptides
Auteur(s)/Autrice(s) : Anna Venancio-Marques

Les peptides et protéines sont des composés de masses molaires très variées. Certains peptides sont relativement petits (moins d’une dizaine d’acides aminés), mais les protéines sont des macromolécules qui possèdent des masses molaires très élevées. La taille d’une protéine est très variable, et pour chaque unité « acide α-aminé » il existe 20 composés différents, il est donc peu surprenant qu’il existe un large éventail de protéines dans la nature, remplissant des rôles tout aussi variés.

Structure tri-dimensionnelle

Lors de la formation de la chaîne d’acides α-aminés, la stéréochimie de chaque acide α-aminé est conservée. La position relative des atomes au sein des acides α-aminés est donc fixée. La position relative des acides α-aminés les uns par rapport aux autres est également primordiale. En effet s’il est possible de se représenter une protéine en tant que spaghetti ou collier de perle (structure primaire de la protéine), il faut également prendre en compte le repliement sur elle-même de cette chaîne qui conduit à des objets ayant une structure tridimensionnelle déterminée (structures secondaires, tertiaires et quaternaires : la protéine se replie sur elle-même et dans l’espace, et peut parfois interagir avec d’autres protéines).

Synthèse in vivo

Description des éléments mis en jeu dans la cellule

Les protéines nécessaires au bon fonctionnement d’un organisme sont produites dans les cellules, par lecture du code génétique contenu dans l’ADN. Comme les protéines, l’ADN est une macromolécule, mais son bloc unitaire est différent. Il s’agit d’acides nucléiques (les bases A, T, C,G), qui permettent à l’ADN d’adopter la forme d’une double hélice.

Selon l’emplacement et la fonction de la cellule considérée, certaines portions de l’ADN vont être copiées sous forme de molécules d’ARN, qui est une macromolécule formée d’acide nucléiques légèrement différents par rapport à l’ADN (les bases A, U, C, G). Une enzyme, l’ARN polymérase, permet l’obtention des brins d’ARN, qui sont des copies partielles et beaucoup moins stable de l’ADN. Cette première étape est appelée transcription.

Après quelques modifications, l’ARN sert de base pour le phénomène de traduction, effectué par les ribosomes, au cours duquel une séquence d’ARN est traduite en une séquence d’acide aminé (Figure 5). Les acides α-aminés sont eux-même fréquemment obtenus par digestion des aliments.

Principe de la synthèse des protéines in vivo
Auteur(s)/Autrice(s) : Anna Venancio-Marques

Etapes d'une synthèse de protéines

Le ribosome est chargé d’établir un lien entre la séquence d’ARN et la séquence d’acides aminés à produire. Un véritable système de lecture est mis en place au sein du ribosome :

  • un ensemble de 3 acides nucléiques, connu sous le nom de « codon » est lu par le ribosome ;
  • l’acide aminé correspondant à ce codon est capté dans le milieu environnant, à l’aide d’un ARN de transfert possédant une séquence complémentaire au codon ;
  • l’acide aminé est ajouté à la chaîne d’acides aminés, par formation de liaison peptidique ;
  • le codon suivant est ensuite lu par le ribosome et le cycle d’élongation de la chaîne d’acides α-aminés continue.

Au cours des cycles d’élongation, l’enchaînement d’acide amine croît progressivement du N terminus au C-terminus. Lorsque le ribosome atteint la fin de l’ARN, il relâche l’enchaînement d’acide aminés. Cette protéine peut ensuite subir des modifications, lors d’une phase de maturation. La structure tridimensionnelle de la protéine est fixée par la suite, souvent avec l’intervention de protéines dites chaperones, qui permettent d’obtenir les repliements souhaités.

Des techniques de biotechnologie permettent de synthétiser des protéines dites recombinantes en incorporant l’ADN codant pour la protéine souhaitée dans une cellule hôte (transfection) et en utilisant la machinerie cellulaire de l’hôte pour réaliser les étapes de transcription et traduction.

Synthèse in vitro

Synthèse d’un dipetide : nécessité de la protection

La synthèse du dipeptide Ala-Gly passe par la réaction entre le groupe –COOH d’une molécule de glycine et le groupe –NH2 d’une molécule d’alanine. Toutefois si les deux acides α-aminés sont introduits dans le milieu réactionnel, le dipeptide souhaité n’est pas le seul obtenu. En effet l’enchaînement entre les acides α-aminés peut être inversé, par la réaction entre le groupe –NH2 d’une molécule de glycine et le groupe –COOH d’une molécule d’alanine. Les molécules de glycines et celle d’alanine peuvent également réagir entre elles. Le tableau ci-dessous donne les dipeptides obtenus dans le mélange considéré :

Par ailleurs, le dipeptide possède également des groupes –COOH et –NH2 à ses extrémités et peut donc continuer à réagir pour conduire à la formation de tripeptide ou, en présence de suffisamment de quantité de matière, de polypetides. Sans précaution, un mélange de deux acides α-aminés aussi simples que l’alanine et la glycine peut ainsi conduire à une multitude de produits. Pour des raisons évidentes de purification et de rendement, cette situation est à éviter. Une stratégie de synthèse doit ainsi être mise en place.

Le cas considéré ici est volontairement simple. Il devient nettement plus compliqué lors de la synthèse de polypeptides, voire de protéines, ayant une séquence déterminée plus longue, ainsi que lors de la mise en jeu d’acides α-aminés possédant des chaînes latérales fonctionnalisées et donc susceptibles de réagir à leur tour. La sélectivité atteinte par les ribosomes dans les organismes doit être dupliqué en laboratoire par la mise en place d’une stratégie efficace.

Protection et déprotection

Stratégie

La stratégie adoptée pour la synthèse peptidique utilise la protection et déprotection de fonctions. Ainsi les groupes susceptibles de conduire à des réactions parasites doivent voir leur nature chimique modifiée pour bloquer les réactions non-voulues au cours d’une réaction dite de protection. Cette réaction de protection doit être renversable afin de libérer le groupe protégé en fin de réaction, au cours d’une étape dite de déprotection (Figure 6).

Synthèse sélective du dipeptide Ala-Gly
Auteur(s)/Autrice(s) : Anna Venancio-Marques

Une limitation sévère de cette technique est à relier à la chute de rendement qu’elle peut engendrer : les réactions de protection-déprotection introduisent deux nouvelles étapes dans la synthèse et doivent toutes deux être réalisables avec d’excellents rendements pour ne pas abaisser le rendement total de la formation de liaison peptidique.

Une stratégie supplémentaire est nécessaire pour les acides α-aminés possédant des chaînes latérales fonctionnalisées. Une synthèse utilisant des protections orthogonales est mise en place. Une protection est dite orthogonale s’il est possible d’effectuer les étapes de protection-déprotection d’un groupe d’atomes sans influencer les étapes de protection-déprotection d’un autre groupe d’atome, ce qui par exemple possible en utilisant des conditions de déprotection différente (Figure 7).

Synthèse du dipeptide Lys-Gly avec l’alanine protégée à son N-terminus (GP2)
Auteur(s)/Autrice(s) : Anna Venancio-Marques

Catalogue

Un véritable catalogue de réactions de protection/déprotection a été développée depuis les années 1930. Ces dernières doivent respecter un véritable cahier des charges : des réactions sélectives, ayant de bons rendements et permettant la mise en place d’une stratégie de protection orthogonale. La réaction de déprotection ne doit pas par ailleurs affecter la liaison peptide formée.

  • Protection des groupes amines : toujours basée sur la même tactique, à savoir faire perdre sa nucléophilie (comportement de donneur d’électrons) à l’amine. Les amines sont fréquemment protégées via les groupements t-butyloxycarbonyl (t-Boc) ou 9-fluorenylmethyloxycarbonyl (Fmoc)
  • Protection des acides carboxyliques : Les acides carboxyliques sont fréquemment protégés sous forme d’ester, soit de benzyle ou de t-butyle.
  • Protection des chaînes latérales : La stratégie la plus efficace consiste à enlever les groupes protecteurs des chaînes latérales au cours de la dernière étape. Le choix de la réaction de protection de la chaîne latérale dépend donc de celle effectuée pour la protection de la chaîne principale. De façon générale, la protection des alcools, acides carboxyliques, amides, thiols ... de chaînes latérales est choisie pour permettre une déprotection de toutes les chaînes latérales au cours d’un minimum d’étapes.

Activation

Un peptide est obtenu après une polymérisation d’un grand nombre acides α-aminés. Il est primordial que chaque étape est un rendement optimisé. Par exemple, pour un peptide composé de 30 acides aminés, le rendement total R de la réaction, pour un rendement r de chaque étape d’ajout d’acide α-aminé, est donné par la formule R = r30. Ainsi, pour un rendement par étape de r = 99 %, le rendement total est R = 74 %. Il est possible d’accroître considérablement ce rendement en augmentant à r’ = 99,9 %, R’ valant alors 97 %.

Les étapes de protection et déprotection ont, comme vu au paragraphe précédent, été développées et améliorées pour répondre entre autres à ce critère. L’étape de formation de la liaison peptide doit être tout aussi performante. La liaison amide peut être facilitée par une étape d’activation, grâce à des agents de couplage, qui permettent d’activer le groupe -COOH. Un des agents couramment utilisés est le dicyclohexylcarbodiimide (DCC).

Synthèse sur support solide

Au cours des années 1960, l’équipe de Merrifield développe une stratégie de synthèse peptidique qui, contrairement à une synthèse simple en phase liquide, permet une automatisation complète de la synthèse selon le principe suivant :

La nature des résines utilisées a évolué au cours du temps, permettant de synthétiser des protéines de 60 acides α-aminés de façon automatique (Figure 8).

Synthétiseur automatique de peptides
Auteur(s)/Autrice(s) : Anna Venancio-Marques

Toutefois cette méthode historique a des limites et doit donc être combinées avec d’autres stratégies de synthèse pour obtenir des protéines plus longues. Une technique fréquemment employée est la synthèse de fragments de plus petites tailles qui sont ensuite rassemblés. La synthèse permet d’obtenir un enchaînement défini d’acides α-aminés, mais ne dirige pas le repliement de la chaîne. Là encore des techniques complémentaires sont développées en laboratoire.

Conclusion

D’énormes progrès dans la synthèse de protéines ont été réalisés en améliorant sans cesse la stratégie classique de protection/déprotection. Toutefois, cette approche possède certaines limites, non seulement au niveau de la taille maximale que peuvent avoir les protéines synthétisées mais aussi en ce qui concerne certaines familles de protéines, comme les protéines hydrophobes. La synthèse protéique des laboratoires ne permet pas non plus de reproduire directement les étapes de maturation (repliement, phosphorylation, assemblage de sous-unité…) qui ont lieu dans la cellule.

Pour contourner ces limitations, les biologistes ont adopté une autre stratégie afin d’effectuer la synthèse de protéines d’intérêt : ils injectent, à des bactéries, les morceaux d’ADN codant pour la protéine qu’ils souhaitent obtenir. Les bactéries produisent alors ces protéines avec leurs propres machineries cellulaires. Les biologistes détruisent ensuite les bactéries, isolent les protéines et les purifient. Les protéines obtenues par cette méthode sont appelées protéines recombinantes, pour souligner la manipulation qui a eu lieu au niveau des gènes. Cette méthode, très répandue, possède toutefois également de nombreuses limites.

Ressources en Ligne

[1] Les Acides Aminés

[2] Vache Folle et Prions : quand les protéines attaquent le cerveau !