Ce long article propose une étude transversale visant à comprendre les virus en esquissant un changement de paradigme. Il s’adresse en premier lieu aux virologues, immunologistes et microbiologistes confirmés. Je peux vous adresser le texte en pdf sur demande et pourquoi pas, envisager une publication commune dans une revue spécialisée. Les étudiants et doctorants en science du vivant sont également concernés par cet article. Enfin, ces réflexions s’adressent aussi à l’honnête homme ou femme du XXIe siècle intéressé par les avancées de la recherche et disposant d’un minimum de bagage scientifique pour lire ce texte qui risque de paraître trop technique, pour ne pas dire ésotérique. La littérature, qu’elle soit philosophique ou scientifique, demande des efforts.
Après le SARS-CoV-2, la révolution biosémantique en virologie
Codes protéiques et virus : une approche biosémantique
Bernard Dugué
Pharmacology PhD
Philosophy PhD
duguebernard at gmail (dot] com
Résumé
Cette étude n’est pas une revue « conventionnelle » résumant l’état des recherches dans un champ précis. Elle propose une série d’hypothèses inédites éclairant le « fonctionnement » des virus. Une première partie explore le mode d’entrée utilisé par les virions pour infecter les cellules en traversant la membrane cellulaire. Une protéine de surface est clivée par un enzyme transmembranaire. Tous les virus utilisent ce mécanisme. Le motif clivé est alors interprété comme un « code protéique » constitué d’une série d’acides aminés particuliers et notamment, d’acides basiques. Une seconde partie montre comment le virus est opérationnel dans deux directions. Il utilise des codes pour transformer la cellule infectée en usine à virion. Il joue à la fois sur les voies de signalisation, les opérations moléculaires et les systèmes sémantiques impliqués dans l’identité cellulaire. Il déjoue l’immunité. La troisième partie est plus spéculative et propose une nouvelle vision des virus assortie d’un changement de paradigme accordant aux protéines une prééminence sur le génome. Pour le dire en une formule, « les protéines (virales entre autres) mènent le jeu ». Et les virus sont des unités protéonucléiques perturbant le fonctionnement immunitaire des cellules hôtes en utilisant des codes situés à la surface des protéines virales. Enfin, les virus perturbent le jeu du vivant dont l’une des finalités est de défendre l’identité moléculaire et l’espèce. La vie est un combat se jouant en partie sur le terrain de l’immunité. Le darwinisme sémantique devrait être la prochaine étape dans la compréhension de l’évolution.
Abstract
This study is not a "conventional" review summarizing the state of research in a specific field. It offers a series of novel hypotheses that shed light on the "functioning" of viruses. The first part explores the mode of entry used by virions to infect cells by crossing the cell membrane. A surface protein is cleaved by a transmembrane enzyme. All viruses use this mechanism. The cleaved motif is then interpreted as a "protein code" made up of a series of specific amino acids and in particular, basic acids. A second part shows how the virus works in two directions. It uses codes to turn the infected cell into a virion factory. It affects signaling pathways, molecular operations and semantic systems involved in cell identity. It overrides immunity. The third part is more speculative and proposes a new vision of viruses accompanied by a paradigm shift giving proteins a preeminence over the genome. To put it simply, “proteins (viral among others) lead the game”. And viruses are proteonucleic units that disrupt the immune function of host cells by using codes located on the surface of viral proteins. Finally, viruses disrupt the game of life, one of the purposes of which is to defend molecular identity and species. Life is a battle partly played out in the field of immunity. Semantic Darwinism should be the next step in understanding evolution.
Prologue
Un nouveau virus SARS-CoV-2 a émergé en décembre 2019, causant une pandémie planétaire avec plus de deux millions de décès. L’origine de ce coronavirus n’a pas été élucidée alors que son mode opératoire est à peu près cerné. L’ampleur de la crise sanitaire devrait conduire la virologie à développer de nouveaux modèles permettant de mieux connaître le mode de fonctionnement de l’infection virale, d’autant plus qu’il faut se préparer à l’émergence d’autres virus pouvant être dangereux pour les espèces animales et l’humain. Sans une recherche fondamentale aventureuse et audacieuse, il n’y aura pas d’autres solutions sanitaires que les traitements et les vaccinations conventionnels, héritée de la biologie mécaniste du XXe siècle. Le jeu moléculaire des virus est connu à travers des mécanismes observés, analysés, ce qui n’interdit pas une approche systémique en mettant l’accent sur les communications moléculaires, les codes, les transformations, les interférences complexes entre les protéines virales et les cellules infectées. Pourquoi les virus font-ils tant de dommages, pourquoi l’immunité des organismes infectés est-elle défaillante ? Si nous ne savons pas répondre à ces questions, c’est qu’il existe des zones d’ombre dans le savoir scientifique. Pour éclaircir ces zones, il faut avancer et proposer des éclairages inédits en privilégiant ce qui paraît être d’une plus grande importance.
Les sciences du vivant ont été secouées par une pandémie historique dans le sens où elle est planétaire, a changé le mode de fonctionnent des sociétés, la nature des régimes et maintenant ; une révolution scientifique pressentie, la plus importante depuis la découverte de l’ADN et du code génétique il y a soixante ans. La crise des sciences médicales ressemble à la crise de la physique au tournant de 1900. Puisse cette pandémie projeter la science vers son monde d’après en sortant des cadres mécanistes et des schémas génétiques devenus obsolètes. De toute façon, nous n’avons pas le choix, le SARS-CoV-2 nous impose un effort non seulement sur les traitements pour le Covid et les vaccins mais aussi sur le plan théorique, au niveau le plus fondamental. Percer l’essence des processus virologiques.
- LES VIRUS UTILISENT DES CODES
1) Entrée en matière. Le clivage des virus par les protéines convertases
a) Les proprotéines convertases, PCs, sont une famille de protéines qui activent d'autres protéines. De nombreuses protéines sont inactives lors de leur première synthèse, car elles contiennent des chaînes d'acides aminés qui bloquent leur activité. Les proprotéines convertases éliminent ces chaînes et activent la protéine. La proprotéine convertase prototypique est la furine. Les proprotéines convertases sont impliquées dans de nombreux processus biologiques importants, tels que la synthèse du cholestérol. Des composés peuvent bloquer leur action et empêcher les protéines cibles de devenir actives. De nombreuses proprotéines convertases, en particulier la furine et la PACE, sont impliquées dans des processus pathologiques tels que l'infection virale, l'inflammation, l'hypercholestérolémie et le cancer, et ont été pressenties comme cibles thérapeutiques pour certaines de ces maladies. Ces convertases sont en quelque sorte des nanomachines outils dont le rôle est d’usiner les protéines pour les rendre opérationnelles, à l’image des fraiseuses utilisées dans les usines d’antan pour fabriquer les pièces métalliques destinées à être insérée dans les chars ou les premières automobiles. En plus de la furine et la PACE, d’autres protéases favorisent l’entrée des virions, notamment la cathepsine pour le SARS-CoV de 2003. La protéase transmembranaire à sérine TMPRSS2 est connue pour « activer » l’entrée de nombreux virus parmi lesquels les deux SARS-CoV, de 2003 et 2019. C’est néanmoins la furine qui est surveillée de près et nous allons comprendre pourquoi.b) La liste des virus activés par la furine (et d’autres protéases) ne cesse de s’allonger, comme l’indique le résumé de cette étude récente : « Une grande variété de virus exploitent la furine et d'autres proprotéines convertases (PC) afin d’optimiser leur mécanisme d'entrée cellulaire et leur infectivité. Les protéines de surface des virus enveloppés, ainsi que non enveloppés, sont traitées par ces protéases au sein de la cellule pendant le cycle réplicatif, ou extracellulaire après l’excrétion et au moment de la pénétration afin de générer des virions matures activés pour l'infection. Bien que les virus tirent également profit d'autres protéases, c'est lorsque certains virus deviennent réactifs avec les PC qu'ils peuvent développer une pathogénicité élevée. En plus de réagir avec la furine, certains virus peuvent également réagir avec les PC de l'autre groupe par PC4 / PC5 / PACE4 / PC7. » (Izaguirre, 2019). Ces observations montrent incontestablement que sans la complicité de l’hôte, un virus reste inopérant. Les virions arrivent en quelque sorte « immatures » et doivent être « usinés » pour infecter les cellules. Ils sont usinés par les cellules qu’ils infectent. Ou plutôt, ils infectent les cellules parce qu’elles les usinent.c) Le clivage du virion par les protéases (PCs et autres) est devenu un « paradigme » gouvernant la virologie. La liste des virus « exploitant » les protéases membranaire ne cesse de s’allonger (Izaguirre, 2019). Y figurent les papillomavirus HPV causant quelques cancers ; les virus de l’herpès, causant également la mononucléose infectieuse ; les flavirirus, West Nile, dengue, Zika, etc., causant une multitude de pathologies ; les rétrovirus dont le plus connu est le VIH ; le virus de l’hépatite B ; les filovirus parmi lesquels figurent les plus terrifiants, ceux causant les fièvres de Marburg et d’Ebola ; les paramyxovirus, les orthomyxovirus causant la bien connue grippe saisonnière chez l’homme et affectant d’autres espèces, les oiseaux notamment avec le H5N1 qui cause d’énorme souci aux éleveurs, et last but not least, les coronavirus qui sont les plus étudiés depuis des décennies et dont le dernier représentant n’est autre que le SARS-CoV-2.d) Comme tous les coronavirus, le SARS-CoV-2 n’échappe entre dans une cellule avec un mécanisme composé de deux étapes, adhésion puis fusion/entrée. Ilse colle à la membrane grâce à la protéine de surface S, spike. Les trimères S forment alors des protubérances sur la partie extérieure de la capside virale de ce virus enveloppé. Ces trimères utilisent alors une protéine membranaire de la cellule hôte avec laquelle ils ont une affinité. Cette protéine est le récepteur ACE2, un enzyme de conversion actif dans la voie régulatrice de l’angiotensine. Le récepteur ACE2 est lié à la membrane plasmique (qui sépare une cellule d’une autre) de cellules présentes dans différents tissus, voies nasales, poumons, rein, cœur, vaisseaux sanguins, intestin. La fixation du virion n’est cependant pas suffisante. Il faut une deuxième opération pour permettre l’entrée du virus dans la cellule afin qu’il puisse réaliser ses opérations de réplication. Ce deuxième mécanisme consiste à casser ou cliver une partie de la protéine S si bien que le virion se décolle de la membrane et passe dans le cytoplasme. C’est un peu comme entrer dans une banque en pénétrant dans un sas puis en sortant afin de se diriger vers le guichet. Mais ne vous faites pas d’illusion, la banque ne réplique pas les billets que vous lui présentez.
Le clivage des protéines virales est réalisé par des protéases. La cathepsine est une protéase qui dégrade les protéines. La furine est plus efficace, c’est une proprotéine converstase qui clive les protéines d’un nombre considérable de virus. Et notamment la protéine S d’une majorité de coronavirus. Deux morceaux sont produits, S1 et S2 ; définis comme les deux sous-unités. S1 est la sous-unité de liaison, elle permet au virion de s’accrocher à la membrane de la cellule hôte. S2 est la sous-unité de fusion, elle permet au virion de passer de l’autre côté de la membrane en fusionnant, d’accéder au cytoplasme, ce qui permet de libérer le génome ARN pour réaliser les nombreuses opérations nécessaires à la réplication de l’ARN et la production des protéines structurales. La cathepsine est « utilisée » par le SARS-CoV de 2003 qui est aussi clivé par la furine sans que cette opération ne renforce sa capacité de pénétration (Follis, 2006).
En réalité, l’infectivité et la gravité clinique, du moins celle du SARS-CoV, dépend d’un second site S’2 et clivé par l’élastase et la trypsine (Izaguirre, 2019, Millet, 2015). Le SARS-CoV-2 possède lui aussi une séquence permettant d’être clivé par une trypsine (TMPRSS2) pour entrer avec facilité dans les cellules. Le second site polybasique de clivage été repéré sur la sous-unité S2 du SARS-CoV2 et semble lui aussi être corrélé aux symptômes observés pour le Covid-19, surtout au niveau des poumons dont les cellules expriment la trypsine.
2) Les motifs polybasiques
a) Des motifs polybasiques sont impliqués dans le clivage de la protéine spike. Il existe deux sites sur la plupart des coronavirus, S1/S2 et S2’ (Millet, 2015). Les sites polybasiques sont présents sur la plupart des protéines de surface des virus enveloppés. Il sont enrichis en acides basiques, souvent arginine (R), parfois lysine (K), avec des motifs du genre, R-R-x-R-R↓y, R-R-x-R↓y, ou encore R-R-x-y-R↓y. Sur la protéine F du virus syncytial figure ce motif, KKRKRR. Ces courtes séquences sont désignées comme motifs polybasiques et se dénombrent par dizaines voire centaines sur les virus infectant oiseaux, mammifères et humains. La présence de ces motifs gouverne non seulement le clivage des protéines d’entrées mais aussi le tropisme viral. Ce qui est compréhensible puisque l’étape de fusion en amont du cycle réplicatif est déterminante pour l’entrée des virions. Un premier site de clivage S1/S2 est présent sur la plupart des bêtacoronavirus. Mais le SARS de 2003 n’en fait pas partie. Ce « site furine » est présent sur une longue série de virus appartenant à divers groupe. Il s’écrit ainsi R-x-R-R↓y et plus rarement R-x-K-R↓y. Et pour le coronavirus de 2009, ce site s’écrit ; R-R-A-R↓S. Le site furine figure sur des protéines de fusion et de surface sur nombre de virus (Braun, 2019). Une autre revue confirme la présence de ces motifs sur des virus à ARN ou ADN (Izaguirre, 2019). Ces sites de clivage semblent presque universels en virologie ; la furine est l’une des convertases (parmi d’autres) la plus utilisée pour cliver ces sites. Ces sites sont également mentionnés dans cette analyse récente incluant des tableaux où figurent nombre de virus occasionnant des pathologies souvent sévères (Coutard, 2020). Le site de clivage par les PCs a été repéré sur la PrM du virus Zika et de la fièvre jaune, sur l’hémagglutinine HA des virus grippaux, notamment le virus H5N1 de la grippe aviaire, sur la protéine F du HRSV, virus syncytial respiratoire qui cause des infections respiratoires chez les jeunes assorties de rhinites ou d’un syndrome pseudo-grippal et last but not least, la gp120 du VIH.
b) Parmi les coronavirus, la plupart possèdent un second motif de clivage situé sur la sous-unité de fusion S2. Ce site est placé environ 150 acides aminés après le premier site ; il est désigné comme S2’ ; il est constitué avec un motif polybasique et dans la plupart des cas, c’est une autre convertase qui le clive, le plus souvent la trypsine et plus rarement la furine. Le SRAS de 2003 est cette fois dans la liste avec un clivage réalisé par l’élastase ou la trypsine. Ce motif clivant S2’ également sur les gammacoronavirus IBV de la bronchite aviaire, avec comme motif RRKR pour la souche Beaudette créée en laboratoire (Millet, 2015) Ce second clivage S2’ semble influence le tropisme viral, en termes de tissus ou d’espèces. Le clivage S2’ détermine la capacité d’infection du virus et surtout la gravité des symptômes associés à l’infection, autant chez l’homme que l’animal, notamment les chauves-souris (Millet, 2015). Une analyse détaillée confirme l’importance de ce second site de clivage par une sur le virus IBV : « La protéine de pointe (S) du virus de la bronchite infectieuse (IBV) du coronavirus (CoV) est clivée en sous-unités S1 et S2 au niveau du motif RRFRR (537) / S dans les cellules infectées par le virus. Dans cette étude, nous observons que la sous-unité S2 de la souche IBV Beaudette est en outre clivée au niveau du deuxième site furine RRRR (690) / S) dans les cellules dans les cellules infectées par le virus (…) La mutagenèse dirigée a révélé que le clivage S1 / S2 par la furine n’est pas indispensable, mais pourrait favoriser la formation de syncytium et l'infectivité de l'IBV dans les cellules Vero. En revanche, le deuxième site est impliqué dans la dépendance à la furine de l'entrée virale et de la formation de syncytium. Les mutations du deuxième site RRRR / S en PRRRS et AAARS non clivables ont supprimé l’entrée de l'IBV qui dépend de la furine. » (Yamada, 2009).
Le coronavirus MERS contient également le motif polybasique clivant S2’ avec l’intervention de la furine. Ce second site de clivage semble nettement lié au tropisme pulmonaire des trois coronavirus causant les graves pneumonies chez l’homme. Et ce n’est pas un hasard que de retrouver ce site polybasique S2’ sur le PEDV, alphacoronavirus causant la gastro-entérite porcine, un site repéré sur les souches Miller et Purdue (Millet, 2015). Dangereux le PEDV ? On peut dire que oui, au vu de la mortalité chez le porcelet qui approche les 100 %. Ce virus a causé énormément d’ennuis dans les pays pratiquant l’élevage porcin à grande échelle, comme la Chine.
3) Zoom sur la protéine S des coronavirus à la recherche des pierres de Rosette du virus
(a) La protéine S est composée de deux sous-unités. La première contient le domaine de liaison (RBD) pour ACE2 ; la seconde contient le domaine FP, situé près du second site de clivage. Ce domaine permet la fusion et l’entrée du virion, avec les autres domaines, les heptades, HR1, HR2, le domaine transmembranaire, TM et l’endo-domaine, E. Cette partie composite assure la translocation du virion dont le génome traverse le cytoplasme en direction de l’appareil ribosomal.
= NTD==RBD==SD1=SD2 = S1↓S2== ↓FP=HR1=HR2=TM=E=C-term
===== sous-unité S1 = /S1↓S2 / ==== ↓ S2’ === sous unité S2 =====
Il y a dix ans une publication a fait le point sur une courte séquence du domaine de fusion FP, qui est conservée sur la plupart des coronavirus. Cette séquence situé sur la sous-unité S2 juste après le second clivage S2’ est conservée avec une précision remarqable : « Alors que la protéine (S) du coronavirus (CoV) est connue pour être clivée au niveau S1 / S2, ce site de clivage n'est pas étroitement lié à un peptide de fusion. Cependant, un deuxième site de clivage a été identifié dans le domaine S2 du syndrome respiratoire aigu sévère CoV (SRAS-CoV) Nous avons examiné si ce clivage dans la sous-unité de S2 libère un peptide de fusion. Nous montrons que les résidus immédiatement C-terminaux du site de clivage SARS-CoV S2 {sfiedllfnkvtladagf} sont conservés dans tous les CoV. » (Madu, 2009)
(b) La conservation du motif peptidique sur S2 {sfiedllfnkvtladagf} est vérifiée pour les coronavirus virus humains SARS et les souches infectant chauve-souris et pangolin constituant le réservoir des sarbecovirus (matériel supplémentaire). En revanche, ce peptide de fusion est moins conservé d’un genre à un autre, alpha, gamma, delta, ce qui n’étonne guère, le fait s’expliquant par une divergence phylogénique ancienne et sans doute l’existence de réservoirs distincts abritant ces souches. Les alpha et bêta auraient été disséminés à partir des chauves-souris, les gamma et delta à partir des oiseaux.
(c) Un détail sur le clivage S1/S2 a généré débat passionné sur l’origine du SARS-CoV-2. Presque tous les coronavirus possèdent ce site, quelle que soit leur famille (Millet, 2015). Par exemple cette séquence observée sur le HCoV-OC43 ; ktrrsrr↓a. Le motif polybasique de clivage par la furine ; sprrar↓svasq ; est observé sur le virus de 2019 mais pas sur le SARS-CoV de 2003, ni sur l’énigmatique souche RaTG13 censée avoir été récupérée en 2013 sur une chauve-souris et dont la séquence a été établie en février 2020. Cette souche présente 96% d’homologie avec le SARS-CoV-2, bien plus que toutes les autres souches y compris le SARS-CoV. Elle serait pressentie pour être à l’origine du CoV de 2019 mais elle n’a pas le site de coupure S1/S2 (Coutard, 2020). En revanche elle a le motif FP S2’ caractéristique de tous les coronas et même le second code de clivage skp(s/t)kr propre à la lignée sarbecovirus des dans la famille bêta (voir plus bas). La souche RaTG13 a fait l’objet de controverses sur son existence mais pourtant le procédé conduisant à son séquence n’a rien de douteux. Les Japonais viennent de séquencer un CoV de chauve-souris en utilisant des prélèvements congelés depuis 2013. Ce virus Rc-0319 (GenBank: BCG66635.1) appartiendrait au réservoir dont sont issus les souches affectant les chauves-souris en Chine depuis 2013 et le coronavirus humain de 2019.
(d) Le code kp(t/s)krs des sarbecovirus. En zoomant sur les bêtacoronavirus, nous voyons se dessiner un motif partagé par les virus de la lignée des sarbecovirus, ce sous-genre qui nous pose beaucoup de problèmes depuis l’apparition du SARS en 2003 et maintenant le SARS-CoV-2. Avec sur les radars des souches provenant de quelques espèces de mammifères. Cette sous-famille se caractérise par la présence d’un motif interprété comme un code spécifique formé par trois acides aminés basiques, deux lysines (k) et une arginine (r). Ce code existe en deux versions, avec au milieu une thréonine (t) ou une sérine (s), alors que la lysine est précédée d’une leucine (l) ou d’une sérine (s) Ce code ne se retrouve pas sur les virus de la sous-famille bêta figurant dans une autre lignée. Les OC-46, et HHU-1 humains qui causent de rhumes sont de la lignée embecovirus. Le HKU9-1 de chauve-souris est un nobecorivrus et ne possède pas ce code conservé comme du reste les séquences qui précèdent et suivent ce code et qui s’explicite ainsi pour les sarbecorivus circulant dans le réservoir commun aux SARS humains, chauves-souris, civettes et pangolins :
SARS-CoV : qilpdplkptkr↓sfiedllfnkvtladagf…FP
Civette : qilpdplkptkr↓sfi
SARS-CoV-2 : qilpdpskpskr↓sfi
Pangolin : qilpdpskpskr↓sfi
Ch-souris ZC41 qilpdpskpskr↓sfi
Ch-souris ZXC21 qilpdpskpskr↓sfi
Remarquons que les séquences qui précèdent ou suivent les codes trypsines sont parfaitement conservés sur les sarbecovirus (qilpdp et edllfnkvtladagf) ce qui suggère que ces peptides ont été sélectionnés par le réservoir et sont indispensables à la pénétration des virions. Le code (l/s)kp(s/t)krs, censé être clivé, libère le peptide de fusion FP. Le clivage utilise une protéase, élastase (SARS-CoV) ou TMPRSS2 (SARS-CoV-2) et a été corrélé à la virulence des sarbecovirus surveillés depuis la crise du SRAS de 2003. Ce code est en relation avec le tropisme de ces virus ; ainsi qu’avec la gravité des affections qu’il engendre, causant des pneumonies chez l’homme et chez les mammifères, et parfois des gastro-entérites à forte mortalité. Certaines de ces souches ont été retrouvées dans des excréments de chauve-souris. Le code dans la version t (thréonine) est présent sur le SARS-CoV. Il a été retrouvé sur des prélèvements de patients ayant contracté un syndrome respiratoire aigu pendant l’hiver 2004, c’est-à-dire après la fin de l’épidémie causée par le SARS-CoV en 2003. Ces patients étaient employés dans un restaurant servant des plats à base de civette, animaux fort prisés et du reste placés dans des cages dans ce restaurant. La séquence du CoV de Civette récupérée dans les prélèvements (GenBank: AAU04646.1) contient ce code skptkrs (Wang, 2005). C’est ce code S2’ qui provoque le syndrome respiratoire car il est reconnu par la trypsine alors que dans d’autres souches, le code S2’ est reconnu par la furine.
(e) Un minuscule détail permet de suivre la trace des espèces ayant favorisé la transmission des deux SARS vers l’homme. S’il ne fait aucun doute que la chauve-souris est l’espèce centrale dans la circulation des coronavirus alpha et bêta, il existe en revanche des réservoirs spécifiques. L’un est celui du SARS-2003, dans lequel figure la civette et l’autre celui du SARS-2019 dans lequel figure le pangolin et les souches récentes détectées chez la chauve-souris ; les ZC41, ZXC21, la controversée RaTG13 et tout récemment la souche séquencée au Japon avec un prélèvement sur une chauve-souris effectué en 2013. Le premier réservoir contient ce code lkptkr↓sfi et le second celui-ci, skpskr↓sfi. Ils ne diffèrent que sur deux acides aminés. Ces deux substitutions indiquent une sélection par un nouveau réservoir apparu sans doute vers 2013.
Une recherche plus poussée montre que l’acide aminé précédant la lysine n’est pas strictement conservé. La séquence skptkrs qui contient la sérine du premier SARS humain et la thréonine du second SARS humain figure sur une bonne trentaine de sarbecovirus, tous de chauve-souris, enregistrés la plupart entre 2006 et 2010. En revanche, la quatrième combinaison, lkptskrs ne figure pas sur les virus. On dirait qu’une sorte de glissement s’est dessiné :
lkptkrs → skptkrs → skpskrs
(f) Le réservoir, un concept fondamental en épidémiologie. A l’instar des particules physiques capables d’échanger les bosons du champ d’interaction, il est possible de construire un modèle épidémiologique associant les mécanismes viraux et la propagation des virus. Les organismes hôtes forment en ce sens un réservoir (source et cibles) pour un champ viral qui leur correspond. L’évolution du champ se traduit par un changement dans les codes, les anciens disparaissent, les nouveaux apparaissent et certains subsistent. Le SARS de 2003 est issu d’un réservoir qui s’est légèrement modifié pour faire place au réservoir de 2013-2020. Un réservoir viral évolue dans le temps mais il est aussi caractérisé par une configuration en termes de milieu, de biotope et de codes. La présence de codes polybasiques est-elle liée à un déterminisme génétique ou alors à un effet du darwinisme sémantique ? Autrement dit, une sélection par les codes protéiques est-elle plausible ? Je n’ai pas réponse mais la question est centrale.
(g) Pour clore ce volet, une remarque sur la protéine à sérine TMPSSR2 qui en plus d’être une porte d’entrée du virus pourrait être une cible pathogénique. Cette protéine est suspectée d’être impliquée dans la fibrose pulmonaire idiopathique, maladie chronique aux origines inconnues, se traduisant par une dégradation progressive des tissus pulmonaires, assortie d’une dyspnée, affectant les sujets entre 50 et 70 ans. Or, c’est cette fibrose que l’on observe avec le SARS-CoV-2, sauf qu’elle n’est pas progressive, mais arrive quelques semaines voire plusieurs mois après l’affection par une forme grave de Covid-19, cohérente avec une circulation élevée des protéines virales. Des patients Covid-19 ont eu leurs poumons partiellement détruits. Par ailleurs, l'examen des données du SARS-CoV de 2003 révèle que 36 % à 62 % des survivants ont développé une fibrose pulmonaire importante avec fonction pulmonaire diminuée. La fibrose pulmonaire et la diminution de la fonction pulmonaire observées après le SRAS ressemblent fortement à la fibrose pulmonaire idiopathique (IPF), une maladie pulmonaire caractérisée par une inflammation pulmonaire de basse intensité et une fibrose progressive. Cette observation est parfaitement cohérente avec la présence du second code sur le SARS-CoV ; kptrkrs ; que la trypsine TMPSSR2 reconnaît et clive. Les dernières observations cliniques semblent indiquer que les dégâts pulmonaires occasionnés par le coronavirus sont dans la plupart des cas étrangers à une réponse inflammatoire intempestive causée par une tempête de cytokines. La fibrose idiopathique serait liée à un mécanisme détournée liée à la protéine à sérine transmembranaire TMPSSR2, dont le résultat est une aberration dans la reconstruction du tissu pulmonaire qui ne cicatrise pas correctement. Peut-on relier la fibrose idiopathique et la fibrose causée par les deux coronavirus ? Y aurait-il une origine virale expliquant la fibrose idiopathique ? Cette question mérite d’être posée.
4) Un code kptkrs sur les parvovirus ?
Les parvovirus n’ont pas de génome ARN comme les coronas, mais un génome à ADN simple brin. Ils ne sont pas du même groupe dans la classification de Baltimore et pourtant certain d’entre-eux possèdent un code partagé par les coronas et des tropismes communs. La lignée des protoparvovirus se place comme celle des sarbecovirus dont on vient de parler où figurent les deux SARS-CoV causant les pneumonies humaines et certains CoV infectant chauves-souris, civettes et pangolins. Ces parvovirus sont parmi les plus petits ; ils infectent essentiellement des mammifères carnivores (chiens, chats, visons, renards…) et l’homme. Et comme les coronavirus, ils ont comme particularité d’avoir une séquence conservée dans une protéine de la capside responsable de l’adhésion à la membrane puis de la fusion. Pour les corona, la séquence se situe à droite (C-term) du site de clivage (edllfnkvtladagf, voir Matériel Supplémentaire II) alors que pour les parvovirus de la sous-famille protoparvovirus, la partie conservée est à gauche (N-term) du site de clivage avec une longueur supérieure (frakkaiapvltdtpdhpstsrpt, voir MS IV)
« La partie unique de VP1 (VP1up), située en N-terminale de la protéine et encodée par la région du génome n’étant pas partagée avec VP2, est donc cruciale pour l’infectivité. L’importance de VP1up dans l’infectivité pourrait potentiellement être expliquée par le fait qu’elle possède une activité phospholipase A2 sécrétée (sPLA2) au niveau d’un domaine extrêmement conservé parmi presque tous les Parvoviridae. En effet, la PLA2 virale (pvPLA2) assure une fonction capitale dans les étapes précoces du cycle viral, ce qui lui confère une importance primordiale dans l’infection. Plus précisément, notre laboratoire a démontré que son rôle se situe ultérieurement à l’attachement à la cellule, à l’entrée dans la cellule et à l’entrée dans la voie endocytique mais préalablement aux processus nucléaires. Étant donné l’importance de la pvPLA2 dans l’infectivité et les nombreuses différences la distinguant des sPLA2, nous procédons à sa caractérisation. » (Bouchard-Lévesque, 2009)
Ce qui troublant, c’est que les parvovirus qui sont éloignés des coronavirus possèdent le même code de clivage, kptkrs, et ce, pour la sous-famille des protoparvirus qui, comme les coronas, ont un tropisme entérique. Ce tropisme affecte les visons, les chiens et les chats, affectés par la panleucopénie féline connue comme typhus du chat et qui se présente comme une gastro-entérique souvent mortelle. Ce même motif kptkrs est présent dans les coronas responsables de gastro-entérites chez les pangolins, chauves-souris et civettes. En revanche, le parvovirus de la souris est lymphocytotropique, avec un tropisme différent, affectant rate, ganglions ; il ne possède pas le code kptskr alors qu’il est classé dans les protoparvovirus. (MS, IV). Ce détail confirme un lien entre le tropisme et les protéines de surface. Deux paramètres interviennent, la structure de liaison aux récepteurs membranaires hôtes et les codes d’entrée qui déterminent aussi ce que sera le tropisme en sachant que plusieurs codes peuvent correspondre à un même tropisme, ce qui traduit une redondance, autrement dit la dégénérescence des codes. Le code kptskr est absent des parvovirus classés dans des sous-familles distinctes. Comme les amodoparvovirus dont l’un affecte les visons et cause la maladie aléoutienne. C’est aussi le cas des bocaparvovirus affectant les bovins ou les chiens (MVC). Ces virus ont un tropisme respiratoire ou entérique mais n’ont pas le code kptskr. Un de ces virus aurait comme code prkpk. Une recherche de cette séquence montre qu’elle figure dans de nombreux virus. Une recherche du code kptskrs avec le moteur UniProtKB fait ressortir quelque 220 parvorivus affectant des espèces carnivores et quelque 320 virus du groupe orthoviridae répartis entre 190 coronavirus (du réservoir de 2003) et 130 virus de la mosaïque de la luzerne. Les protéines concernées sont respectivement VP1, Spike et CP.
5) Les codes polybasiques des pneumovirus et des rotavirus
Les coronavirus ne sont pas les seuls virus respiratoires affectant l’homme. Aux côtés des rhinovirus et de la grippe, des pneumovirus occasionnent aussi des soucis de santé publique. Le plus connu étant le HRVS, virus syncytial respiratoire humain qui, à l’inverse du SARS-CoV-2, affecte principalement les nourrissons et les très jeunes enfants, moins de trois ans, en épargnant les adultes. Ce virus possède un génome ARN à polarité négative, sa protéine fusionnelle F possède deux motifs polybasiques interprétables comme code furine et code trypsine ; rarre et kkrkrrf ; à l’image des deux code du SARS-CoV-2 sur la protéine Spike ; rrars et kpskrs. La présence du premier code « furine » semble corrélée à la contagiosité de ces deux virus, contrairement au SARS-CoV qui ne possède que le code « trypsine » (kptkrs). En revanche, le HMPV, métapneumovirus affectant les humains, ne possède que le code trypsine partagé avec le virus syncytial, ce qui ne l’empêche pas d’être presque aussi contagieux et de produire les mêmes symptômes.
Le code kkrkrr est présent sur une large série de virus. Le nombre de séquences ne reflète pas forcément la présence du code sur un type viral étant donné que certains virus sont beaucoup plus suivis, notamment ceux qui affectent les mammifères et surtout l’homme, causant des problèmes de santé publique. Voici quelques motifs polybasiques présents sur des protéines virales de surface :
Poliomavirus de chauve-souris fer à cheval, VP2 : kkkrkrrr
Virus de chenille, ChaB : kkrkrrr
Gammapapillomavirus, L2, kkkkrkrr
Papillomavirus bovin, L2, rkkrkrr
Odocoileus adenovirus 1; p32K, rkkrkrr
Pneumovirus bovin, F, kkrkrrf
Un processus de sélection et conservation des codes se dessine, conformément au principe du darwinisme sémantique. On note également la présence de ce code dans des protéines produites par les bactériophages. La protéine Tat du VIH contient ce code et plus précisément, un motif déterminant comprenant en fait une bonne dizaine de résidus basiques, Lys et Arg. Cette protéine s’associe avec l’ARN polymérase II de la cellule hôte et rend plus efficace la réplication du génome viral.
Les rotavirus n’échappent pas à la règle et utilisent les codes polybasiques pour entrer dans les cellules hôtes : « Le rotavirus cause des maladies diarrhéiques chez les jeunes mammifères. L'espèce A de rotavirus (RVA) est responsable de la plupart des maladies diarrhéiques à rotavirus humain et affecte principalement les nourrissons et les jeunes enfants. L'espèce B de rotavirus (RVB) a été associée à des flambées sporadiques de maladies diarrhéiques chez les adultes humains. On prévoit que RVA et RVB codent pour la plupart des protéines homologues mais diffèrent de manière significative dans les protéines codées par le gène NSP1. Dans le cas du RVB, le gène NSP1 code pour des protéines de fonction inconnue, NSP1-1 et NSP1-2. Nous concluons que le RVB NSP1-1 humain génère la formation de syncytium dans les cellules humaines en culture » (Diller, 2019). Dans cet article, nous observons la présence des codes polybasiques composés de résidus lysine et arginine précédés d’une séquence peptide relativement conservée. Le schéma n’est pas aussi tranché que pour les coronavirus. Il confirme dégénérescence des codes.
6) Virus grippaux
Il aurait été dommage d’écarter les virus grippaux, en première ligne pour les questions de santé publique en tant que virus respiratoires et maintenant surpassés par le SARS-CoV-2. Le virion grippal utilise aussi les codes furine et trypsine pour entrer dans les cellules hôtes avec la protéine de fusion hémagglutinine. Pour le virus A(H1N1) de 2009, le code trypsine est : pkyvkstk ; pour le H5N1 aviaire, le code est rerrkkr (Une recherche sur ce code fait apparaître un nombre des virus grippaux, deux pandoravirus et d’autres gènes présents dans les archaea, bacteria et eukaryota incluant tous les règnes, champignons, algues, protozoaires, métazoaires, animaux et sapiens. On le trouve notamment sur des enzymes, des transférases et ligases opérant sur les ubiquitines, y compris chez sapiens. Une affaire à suivre. Ce motif est néanmoins trop court pour pouvoir tirer des conclusions). La présence des sites polybasiques dans les protéines virales de fusion est déterminante ; elle est corrélée avec la puissance pathogène des virus. Ce constat a été établi pour les coronavirus et se vérifie aussi pour les virus grippaux. L’importance des codes polybasiques pourrait constituer le socle d’un nouveau paradigme en virologie. Ce n’est pas le génome viral qui compte, mais la nature des codes qu’il utilise, pour entrer dans les cellules et aussi pour se reproduire (voir le paragraphe sur la nucléocapside). De la même manière que les coronavirus, les virus grippaux A incluent des souches faiblement pathogènes et d’autres non seulement contagieuses mais aussi très dangereuses, comme l’indique cette note de synthèse :
« La pathogénicité, la virulence et la transmission d'espèce à espèce du virus de la grippe A, qui se trouve généralement chez les espèces aviaires et mammifères, dépendent strictement de la nature des acides aminés composant le site de clivage protéolytique de l'hémagglutinine. Parmi tous les virus de la grippe aviaire hautement pathogènes, H5 et H7 sont les sous-types hautement pathogènes responsables du taux de mortalité élevé chez les volailles ainsi que de la transmission interspécifique, telle que la transmission oiseau-homme (sous-types H5N1 ou H7N7). Des études ont suggéré que la fréquence de l'acquisition de phénotypes hautement pathogènes est plus élevée pour les sous-types H5 et H7 car ils sont génétiquement prédisposés à acquérir des sites de clivage polybasiques d'hémagglutinine. Le virus de la grippe A faiblement pathogène ne contient qu'un seul type d'acide aminé (arginine) au site de clivage de l'hémagglutinine, et les protéases de type trypsine catalysent le processus de clivage protéolytique, conduisant à des infections respiratoires ou intestinales bénignes et localisées. Cependant, ces virus faiblement pathogènes peuvent être transformés en virus hautement pathogènes en raison de l'acquisition de plusieurs acides aminés basiques au site de clivage de l'hémagglutinine (site de clivage polybasique). La furine et la PC6 sont les exemples de protéases ubiquitaires qui reconnaissent le site de clivage polybasique et catalysent le clivage protéolytique de l'hémagglutinine, conduisant à une infection systémique sévère. Divers mécanismes sont impliqués dans la génération d'un site de clivage polybasique. Par exemple, des insertions ou des substitutions de plusieurs nucléotides peuvent se produire pour générer des codons d'acides aminés basiques. De plus, la recombinaison de l'ARN viral avec l'ARN de la cellule hôte peut être un autre mécanisme important derrière l'acquisition d'un site de clivage de l'hémagglutinine polybasique. » (NLMS)
Le lien entre les codes polybasiques et la virulence des souches grippale est établi par des dizaines d’observations sans pour autant être une règle universelle. L’acquisition d’un code polybasique change le cours d’une infection grippale : « Les virus de la grippe aviaire hautement pathogènes avec les sous-types d'hémagglutinine (HA) H5 et H7 évoluent à partir de précurseurs faiblement pathogènes par l'acquisition de plusieurs résidus d'acides aminés basiques au site de clivage de l'AH. Bien que ce mécanisme n'ait été observé naturellement que dans ces sous-types de HA, on en sait peu sur la base génétique de l'acquisition du site de clivage polybasique de HA. » (Nao, 2017). Les observations sur le lien entre les codes polybasiques de l’HA et la virulence grippale se comptent par centaines. Il suffit d’effectuer une requête sur un moteur de recherche pour s’en convaincre.
7) Les origines sur SARS-CoV-2 et le code furine
Le coronavirus apparu en 2019 est à peu près cerné. Il possède un tropisme pluriel qui le différencie du SARS-CoV de 2003 avec tropisme pulmonaire et des coronavirus ordinaire causant des rhumes et plus rarement des affections dans les voies inférieures. C’est au niveau des codes d’entrée qu’il se singularise puisque le reste de la machinerie réplicative et structurale ressemble à celle de tous les coronavirus. Le nouveau virus possède le code trypsine qui lui permet d’infecter entre autres les tissus pulmonaires et le code furine qui lui permet d’infecter les voies nasales supérieures et d’être très contagieux. Le code tryspine (kpskrs) est partagé avec le pangolin et la chauve-souris. Le code furine (rrar) n’a pas d’origine particulière, des centaines de virus ont ce motif, ce qui suggère une sélection par le darwinisme sémantique. Une recherche par motif montre que quelque 200 virus herpès possèdent ce code, parmi lesquels figurent des virus humains, la plupart causant l’herpès. D’autres types de virus humains possèdent ce code et, chose curieuse, un H-CoV-229E possède ce code. Une revue récente parue avant l’arrivée du virus de Wuhan semble prémonitoire en recensant les virus sont les protéines de surface sont susceptibles d’être clivées par la furine avec ce code récurrent composé d’un minimum de trois acides basiques, avec au moins deux arginines (r). Des virus de plusieurs classes possèdent ce code, papillomavirus, herpès, coronavirus, flavivirus, togavirus, bornaviridae, bunyaviridae, filoviridae (ebola etc.), orthomyxoviridae (grippe etc.), rétrovirus, hépatovirus (Braun, 2019)
Le code furine acquis par le SARS-CoV-2 fait l’objet d’une controverse médiatisée mais pas forcément encadrée par la rigueur scientifique. Ce code aurait-il été introduit par génie génétique dans un laboratoire effectuant des expériences de gain de fonction (GOF) ? Personne ne peut répondre à cette question. La thèse d’une origine naturelle soit plus plausible. Une recombinaison avec un échange de codes ? Il se dit que le SARS-CoV-2 aurait été présent dès septembre 2019 ou octobre, en Italie notamment. Si c’était le cas il aurait déclenché une vague dès le mois décembre. On ne peut pas savoir d’où vient ce virus mais juste envisager une recombinaison d’un virus zoonotiques avec un autre virus permettant l’acquisition du code furine. Cette recombinaison aurait rendu le virus hautement contagieux par les voies nasales et déclenché les premiers clusters observés à Wuhan pendant le mois de décembre.
Les deux pneumonies récentes causées par des coronavirus bêta sont liés à une transmission zoonotique suivie d’une transmission interhumaine. C’est ce qui s’est passé en de rares occasions pour le H5N1 aviaire qui heureusement ne s’est pas transformé en virus humain. Le SARS-CoV possède le même code trypsine que celui d’un virus de la civette palmée et la chauve-souris, caractéristique du réservoir de 2003. Le SARS-CoV-2 provient sans doute d’une transmission zoonotique depuis le pangolin ou la chauve-souris avec un code trypsine partagé dans le réservoir de 2019 (déjà présent en 2013). On aurait dû en rester au stade du SRAS de 2003 sauf que le code furine a été récupéré par le virus et tout a changé. La « bombe pneumologique » s’est propagée avec une efficacité redoutable. La question c’est de savoir comment le code furine rrar a été acquis par le nouveau virus. Une observation récente a apporté un élément de plus mais insuffisant pour résoudre l’énigme. La souche RmYN02 prélevée il y a peu sur une chauve-souris possède un génome contenant 93% d’homologie avec la séquence du SARS-CoV-2, ce qui est moins que les 96% pour la souche RaTG13. De plus, le domaine de liaison RBD de cette souche n’a que 60% d’homologie ce qui n’a rien d’étonnant car ce domaine est peu conservé sur les coronavirus. En revanche, une homologie est observée au niveau des résidus basiques responsables du code furine (S1/S2). Un transfert de code aurait pu se produire à la faveur d’une recombinaison assez classique suivie d’une sélection naturelle (Zhou, 2020).
8) Les codes polybasiques des protéines prions
a) Les prions ont connu une célébrité soudaine pendant l’épisode de la vache folle dans les années 1990. Ces petites protéines ont été identifiées comme agents responsables de cette maladie affectant les ruminants dont le nom savant est encéphalopathie spongiforme bovine. Les prions ont aussi affecté quelques centaines d’humains, causant une dégénérescence du système nerveux apparentée à la maladie de Creutzfeldt-Jakob, elle aussi causée par l’agent prion qui dans sa forme anormale s’accumule dans les cellules nerveuses. Le prion est une molécule impliquée dans l’embryogenèse, participant au fonctionnement du système nerveux, assurant entre autres l’adhésion entre cellules. La forme normale du prion est désignée PrPC; la forme anormale est une variante de la protéine repliée différemment, ce qui modifie sa forme et si code il y a, change le code. Elle s’écrit PrPSc. Le prion est une petite protéine de quelque 250 résidus dont de domaine N-terminal contient deux codes polybasiques, vers les positions 20 et 110. Entre les deux s’intercale une répétition de cinq octapeptides. Le second code polybasique a été identifié comme un site de clivage mais actuellement, les protéases pouvant cliver les prions ne sont pas connues (Hara, 2020). En revanche, il a été établi que la partie N-terminale avec le code polybasique et la répétition des octapeptides est déterminante pour les effets des prions.
b) Les séquences du prion conservées par l’évolution cadrent avec le principe du darwinisme sémantique. Les codes et les formes reflètent l’arbre phylogénétique autant sinon plus que les génomes. J’ai procédé à une recherche de séquences peptidiques en sélectionnant quelques motifs incluant les codes polybasiques. A partir de motifs sélectionnés, on repère les prions de différentes espèces possédant ces motifs et le résultat semble assez étonnant. Non seulement les codes polybasiques sont partagés mais aussi les motifs situés à côté de ces codes. Ce qui laisse penser que la recherche de motifs soupçonnés de fonctionner comme des codes dépasse le domaine restreint des motifs polybasiques. Cette méthode permet de suivre les codes sur les clades et principalement, les clades des espèces vertébrées. Deux séquences sont conservées. En (b1) on observe une conservation du code kkrpkp et du peptide qui suit le code et sans doute en fait partie. Deux options ont été choisies, l’une avec 6 résidus supplémentaires et l’autre avec 33 résidus ce qui est une taille raisonnable. La recherche montre pour la première séquence une conservation sur 142 espèces où figurent des rongeurs et primates, et 56 espèces dans le clade des chevaux, ruminants, carnivores, chauve-souris. L’extension de la séquence fait tomber les résultats à 70 et 25 ce qui était prévisible. Ces deux clades sont issus des boreoeutheria regroupant un très grand nombre de mammifères placentaires. En (b2) Une autre option a été choisie, consistant à cibler le motif kpskpktn qui donne quelque 830 résultats pour le clade Opisthokonta qui est très ancien, comprenant animaux mais aussi champignons. Avec deux lettres de plus les résultats font apparaître les mammifères placentaires. Des variations dans le motif polybasique et le peptide qui le suit font apparaître des résultats assez contrastés. Le prion est une protéine possédant une conservation de séquence très forte mais sans atteindre le niveau de conservation des motifs polybasique de certaines histones. Les prions semblent caractéristiques des mammifères. Ces observations appuyent l’hypothèse de codes protéiques conservés avec un indice, la présence des résidus basiques, lysine et arginine.
PrP, Sapiens (GenBank: BAG32276.1) ; partie N-terminale
1 manlgcwmlvlfvatwsdlglckkrpkpggwntggsrypgqgspggnryppqggggwgqp
61 hgggwgqphgggwgqphgggwgqphgggwgqgggthsqwnkpskpktnmkhmagaaaaga
(b1) Premier code polybasique, 20-30
kkrpkpggwnt
Euarchontoglires (142) ; hamster, gerbille, souris, rat, singes, gorille, homo sapiens
Laurasiatheria (56) ; equus, chevaux, zèbre, lion…
Extension de la séquence
kkrpkpggwntggsrypgqgspggnryppqggggwgqp
Euarchontoglires (70) ; primates (70)
Laurasiatheria (25 results) ; equus…
(b2) Second code polybasique, situé vers le résidu 110
kpskpktn Opisthokonta (829)
kpskpktnmk Boreoeutheria (754)
kpskpktnmkhmaga ; Laurasiatheria (45) ; Euarchontoglires (68) hominidae, homininae, homme, chimpanzé, gorille ; Hominidae, pongo, orang-outan
kpskpktnmkhvaga ; Boreoeutheria (635)
kpnkpktnmkhvaga ; Laurasiatheria (31)
kpskpktnlkhvaga ; Boreoeutheria (31) dont 27 Murinae, souris, rat…
kpskpktnmkhvaga ; Boreoeutheria (635)
9) Jeu de piste sur d’éventuels codes (motifs) polybasiques dans les protéines
(a) Histone
Les histones sont des protéines associées à l’ADN au sein du noyau. Elles sont connues comme étant extrêmement conservées et sont fortement enrichies en résidus basiques comme le montre cette séquence dont on peut dire qu’elle n’est faite pratiquement que de codes polybasiques. Une recherche sur deux de ces motifs, en choisissant des séquences d’une dizaine de résidus, montre cette conservation avec le nombre d’espèces partageant ces séquences dans des clades de vertébrés
Histone humaine, H1.5 (NP_005313.1)
1 msetapaetatpapvekspakkkatkkaagagaakrkatgppvselitkavaaskerngl
61 slaalkkalaaggydveknnsriklglkslvskgtlvqtkgtgasgsfklnkkaasgeak
121 pkakkagaakakkpagatpkkakkaagakkavkktpkkakkpaaagvkkvakspkkakaa
181 akpkkatkspakpkavkpkaakpkaakpkaakpkaakakkaaakkk
kkavkktpkkakk ; Boreoeutheria (62)
kpkaakpkaakakk ; Tetrapoda (136) dont Boreoeutheria (65)
(b) Ribonucléoprotéine
La ribonucléoprotéine protéine Sm-D d’homo sapiens (GenBank: AAA36620.1) est impliquée entre autres dans l’épissage. Elle contient des séquences enrichies en lysine et en arginine. Une recherche montre que non seulement le code lysine (kvkskkr) est conservé sur des centaines d’espèces issues du clade Gnathostomata mais que la séquence répétitive contenant l’arginine l’est aussi pour ce clade qui regroupe 99% des vertébrés. Y figurent poissons, requins, hippocampe, mammifères, primates, grenouilles, sauriens, alligators, oiseaux, passereaux, ibis etc.
Sm-D homo sapiens
1 mklvrflmklshetvtielkngtqvhgtitgvdvsmnthlkavkmtlknrepvqletlsi
61 rgnniryfilpdslpldtllvdvepkvkskkreavagrgrgrgrgrgrgrgrgrggprr
pkvkskkre ; 309 jawed vertebra ;
Vagrgrgrgrgrgrgrgrgrggprr ; 270 pour le clade des jawed vertebras (Gnathostomata)
Protéine Sm-D1 de la drosophile
1 mklvrflmkl shetvtielkngtqihgtit gvdvamnthl ksvrmtiknr dpvhletlsi
61 rgnniryfilpdslpletlliddtpksktkkkdsgrvgnrgrgrgargrggprgrgrgrasgrr
c) hemojuvelin
L’hémojuvéline est une protéine transmembranaire impliquée dans l’homéostasie du fer. Elle contient un site de clivage par la furine, rnrr, comparable aux sites de nombreux virus. Ce clivage libère un fragment soluble de l’hémojuviline ; à l’instar du clivage S1/S2 du coronavirus qui permet au virion de quitter la membrane et de pénétrer dans le cytoplasme. Le motif étendu srsernrr apparaît dans les clades de mammifères et aussi étrange que cela soit, ce motif est présent dans les plasmodiums, parasites capables d’infecter les rongeurs.
hémojuviline homo sapiens (NP_001366281.1)
301 aedvamafsaeqdlqlcvggcppsqrlsrsernrrgaitidtarrlckeglpvedayfhs
srsernrr ; Boreoeutheria (30) ; dont Laurasiatheria (4) chauve-souris ; et Euarchontoglires (26) Sapiens, gorille, chimpanzé, chauve-souris mais aussi du clade rodentia, kangourou, castor, souris, rats ; Sar (7) Plasmodium, protozoaire
d) neuroexophilin
Les neurexines sont des protéines adhésives permettant aux neurones de se connecter. Ce sont des protéines transmembranaires très conservées. Les neurexines se lient à des protéines annexes dont le rôle n’est pas encore élucidé et qui semblent activer des circuits de transmission, à l’image des connecteurs électriques. La neuroexophiline est l’une de ces « swing proteins ». Cette protéine de petite taille possède une région riche en résidus polybasique. Cette région de quelque 20 acides aminés est conservée lorsque divergent le clade des poissons cartilagineux, Chondrichthyes et celui des vertébrés à squelette osseux, Euteleostomi, clade conduisant vers les reptiles, oiseaux, mammifères. Le hasard ne peut expliquer la présence de ces motifs constitués de plus de 10 résidus. Ces observations suggèrent d’étudier la phylogenèse en utilisant non pas les génomes ni les gènes, ni les protéines mais des motifs pouvant servir de codes et sélectionnés par les règles du darwinisme sémantique.
71 dldlrydtpepyseqdlwdwlrnstdlqeprprakrrpivktgkfkkmfgwgdfhsnikt
kfkkmfgwgdf ; Chondrichthyes (10) ; Euteleostomi (887)
krrpivktgkfkkmfgwgdf ; Chondrichthyes (10) ; Euteleostomi (736)
e) Hélicase snRNP U5
Cette petite protéine nucléaire est associée à l’ARN et intervient dans les procédés d’épissages, permettant de coller des exons en maintenant deux transcrits ensemble pour en réaliser la suture. La partie N-terminale contient un motif polybasique de dimension moyenne {rrakrrkrdedr} dont on retrouve la trace chez les poissons cartilagineux, osseux, les amphibiens et nombre de clades de mammifères, jusqu’à l’homme. Cette observation repose-t-elle sur un coup de chance habilement réalisé car l’on connaît la conversation des protéines nucléaires pu bien confirme-t-elle la thèse d’une conservation de codes protéiques devenus ubiquitaires dans le fonctionnement fondamental des expressions cellulaires ?
10) Eléments pour un paradigme des codes protéiques et l’esquisse d’une biosémantique
a) Les codes polybasiques (et bien d’autres) utilisés par les virus le sont aussi par un nombre important de protéines assurant des fonctionnalités déterminantes dans les cellules. Ces codes permettent aux protéines de communiquer, de circuler, d’être clivées pour passer d’un domaine à un autre, quitter la membrane pour aller dans les fluides en devenant solubles, ou alors rejoindre le cytoplasme, accéder aux compartiments intracellulaires, réticulum, ribosomes, nucléole, noyaux. Une recherche sur les sites polybasiques conservés génère une série de publications pouvant confirmer le paradigme des codes polybasiques impliqués dans fonctionnalités spécifiques et surtout dans la topologie moléculaire, permettant aux protéines de circuler dans les espaces intra et extracellulaires. Une revue récente sur la calmoduline est éclairante, montrant que cette protéine joue sur les codes polybasiques pour orienter son champ d’action, autrement dit, son tropisme moléculaire : « La phosphorylation des régions basiques des cibles de CaM lipidées N- / C-terminales peut réduire l'affinité à la fois pour le CaM et la membrane. » (Grant, 2020).
Un autre résultat sur une kinase appuie le paradigme des codes polybasiques comme signaux moléculaires permettant aux protéines de circuler, de se déplacer, d’orienter leurs actions. Ces codes sont alors souvent conservés, y compris les séquences qui les englobent et pourraient être parties prenantes dans ces codes ; « Nous montrons en outre que D6PK se lie directement aux phospholipides polyacidiques par un motif polybasique riche en lysine dans le domaine médian de la kinase. Le motif riche en lysine est nécessaire pour une phosphorylation correcte de PIN3 et pour une croissance tropique dépendante du transport de l'auxine. Les motifs polybasiques sont également présents à une position conservée dans d'autres kinases liées à la D6PK et requis pour la liaison membranaire et phospholipidique. Ainsi, la mobilisation liée aux phospholipides vers les membranes à travers des motifs polybasiques pourrait non seulement être nécessaire pour le transport de l'auxine assuré par D6PK mais également d'autres processus régulés par ces kinases, jusqu'à présent, fonctionnellement non caractérisées. » (Barbosa, 2016)
Un détail est essentiel. Ces codes sont conservés sur les protéines et se juxtaposent avec des peptides eux aussi extrêmement conservés, que ce soit du côté N-terminal ou C-terminal. Et maintenant, nous pouvons élargir ce concept de code à une considération d’ordre topologique. Une protéine fonctionne dans un environnement particulier, là où sa fonctionnalité s’entrelace avec d’autres fonctionnalités. Le concept de tropisme hérité de la virologie entre autre fonctionne aussi au niveau cellulaire et moléculaire. Le tropisme moléculaire, c’est le domaine dans lequel une protéine exerce une fonctionnalité et pour ce faire, elle doit posséder des codes pour circuler. Les codes participent au tropisme viral comme au tropisme moléculaire qui détermine la circulation (le trafic) des composants protéiques et participe à l’émergence d’une topologie protéomique. Sans cette topologie, ni la cellule ni l’organisme ne peut fonctionner. D’autres codes sont également utilisés dans les voies de signalisation (voir seconde partie de cette étude).
b) La glycosylation des protéines de la capside
Les codes polybasiques sont composés de résidus d’acide aminés mais la protéine fonctionnelle est une glycoprotéine, ce qui signifie que sans les ajouts de glycanes, une protéine nue ne sert à rien. Les sucres collés sur les protéines sont en quelque sorte des habillages permettant aux protéines de se reconnaître et de circuler. La protéine S du SARS-CoV-2 n’échappe pas à cette règle. La protéomique dévoile les sites potentiels de glycosylation que l’on peut observer avec des analyses assez compliquées, utilisant la spectrométrie de masse. Deux types de « collages » de sucres sont utilisés en général, avec l’azote de l’asparagine ou l’oxygène de la sérine et de la thréonine. Par ailleurs, la protéine S du SARS-CoV-2 est glycosylée trois fois en O- au niveau du code furine et deux fois en N- un peu plus loin. On ne retrouve pas ces glycosylations sur le SARS-CoV de 2003.
661 ecdipigagica(s)yqtq(t)nsprrar↓(s)vasqsiiaytmslgaensvays(n)nsiaipt(n)fti
La glycosylation s’interprète comme l’ajout d’un code de circulation pour la protéine et par voie de conséquence, pour le virion. Une chose importante doit être soulignée. La glycosylation ne se fait pas avec les synthétases codées par le virus. Ce sont les cellules hôtes qui réalisent cette opération. Ce qui signifie une chose claire. Le virion est capable non seulement d’utiliser l’appareil de traduction mais aussi de détourner les systèmes de codage hôtes, d’en acquérir les codes, de les utiliser. Et ce, en supposant que les glycanes fonctionnent comme des codes, des sortes de passeports, de totems, plaqués sur les motifs protéiques.
Ces quelques résultats sur les régions polybasiques penchent en faveur du paradigme des codes polybasiques, sans exclure d’autres codes. Seule une investigation théorique à grande échelle confirmera ce qui pour l’instant reste au stade d’une hypothèse sérieuse, appuyée par une série de résultats convergents et une intuition de l’auteur de ce paradigme ; qui n’est qu’un composant d’une nouvelle conception du vivant dans laquelle le rôle des protéines serait prépondérant sur celui du génome et deviendrait un pilier central pour la biologie cellulaire au XXIe siècle. Et peut-être même pour l’évolutionnisme si l’on admet que la conservation des codes devient aussi importante que la sélection des gènes et conduit à concevoir la théorie du darwinisme sémantique. L’étude des codes et de leur conservation permet d’enrichir considérablement les pratiques théoriques issues du darwinisme. Ces codes doivent être recherchés sur des protéines centrales dans le fonctionnement cellulaire ainsi que dans les virus. Les lignées peuvent être identifiées avec des codes et des séquences dont l’importance est évidente car elles sont conservées. Nous avons trouvé quelques codes caractérisant les sarbecovirus analysés depuis 2000 et notamment les deux SARS humains responsable de pandémies. Ces codes ont été trouvé sur la protéine S (code trypsine et peptide de fusion), la protéine N et ORF6 qui semble importante dans le processus d’attaque immunitaires. D’autres investigations diront si d’autres protéines sont concernées par la présence de « codes ».
AutreS Codes, structures, fonctionNALITEs moléculaires
11) Le concept de tropisme sémantique
(a) Entrer dans la cellule n’est qu’une étape préliminaire pour le virion. Il doit rejoindre le noyau et faire produire ses pièces protéiques pour s’assembler, notamment la réplicase qui lui permet de faire des copies multiples du génome, condition indispensable pour tous les virus à ARN. De plus, il faut que la cellule hôte se prête à ce jeu et veuille bien se détourner pour devenir une usine à virions. Le parcours du génome n’est pas très bien cerné. L’ARN viral doit jouer de ruse ou être accompagné par une protéine spécifique. La protéine de la nucléocapside N est naturellement suspectée de jouer ce rôle ; elle est directement au contact avec l’ARN génomique avec lequel elle forme un complexe. Une chose est certaine, la protéine N intervient dans l’assemblage du virion. Elle permet de plus avec d’autres protéines la sortie du virus (buding). Le rôle exact des protéines N dans le cytoplasme n’est pas encore complètement élucidé. La protéine N des coronavirus possède plusieurs fonctionnalités et apparaît comme plus complexe qu’attendu dans ses interactions. Une investigation combinant topologie, localisation et étude de fonction a permis d’établir cette complexité fonctionnelle (Mc Bride, 2014). La protéine N intervient dans la transcription de l’ARN. Elle a été localisée dans le (1) cytoplasme ainsi que le (2) nucléole. Plusieurs études ont confirmé cette seconde localisation, imputable par ailleurs aux à la présence de résidus basiques. Que vient donc faire la nucléocapside N dans un espace cellulaire dédié à la transcription des ARN ribosomiques alors que toutes les étapes de reproduction virale se produisent dans le réticulum endoplasmique et l’appareil de Golgi situés dans le cytoplasme ? Des hypothèses ont été formulées pour le virus bovin IBV de la famille gamma. La protéine N aurait un rôle dans la stratégie virale en s’associant aux ribosomes pour contrôler des ARN de guidage. Elle s’associerait avec des protéines nucléolaires, sans exclure cependant un artefact causé par l’affinité des ARN pour les protéines capable de former des complexes avec l’ARN (Bride, 2014) ; N est une ribonucléoprotéine puisqu’elle s’associe au génome viral. Elle contient des motifs polybasiques enrichis en lysine, comme nombre de ribonucléoprotéines présentes dans les organismes hôtes.
La protéine N est comme la protéine S très bien conservée dans le réservoir des sarbecovirus où ont émergé les deux SARS-CoV humain. Plus précisément, ce sont des peptides, des domaines fonctionnels et des codes qui sont presque strictement conservés. Cinq motifs polybasiques figurent sur la protéine N des sarbecovirus. Deux motifs sont placés sur la partie N-terminale arskqrrp yrratrrirg et trois sur la partie C-terminale skkprqkrt pkkdkkkka qrqkkq. Les codes ou du moins motifs placés en N-term sont enrichis en arginine et ceux qui sont placés en C-term sont enrichis en lysine, un acide aminé très répandu dans les ribonucléoprotéines, les histones, et qui permet la formation des complexes protéines + ARN(ou ADN). La protéine N du SARS-CoV humain contient deux domaines de liaison à l’ARN, l’un côté N-term et l’autre en C-term qui contient un motif permettant une dimérisation ainsi qu’un signal de localisation spécifique à ce virus (et du reste à tous les sarbecovirus). Ce peptide de signalisation est situé en position 366-381 ; il est enrichi en lysine (Mc Bride, 2014). Aux extrémités de la protéine N figurent deux domaines IDR n’ayant pas de forme tridimensionnelle stable ; ils sont désignés comme régions intrinsèquement désordonnées, ce qui leur confère des degrés de liberté censés moduler les liaisons de la protéine aux acides nucléiques. Ce qui a été observé pour le SARS-CoV. Voici le schéma de la protéine N (Mc Bride, 2014)
IDR -- (RNA binding) -- (SR rich LRK) -- (RNA binding NLS) -- IDR
1_____44__________182_____________247____________366___422
Si les acides basiques sont pressentis pour jouer le rôle de signes, codes, langage moléculaire, une autre piste s’avère tout aussi éclairante, c’est la phosphorylation, mécanisme ubiquitaire consistant à ajouter des résidus phosphoryl sur des acides aminés possédant une fonction alcool, sérine et thréonine, ainsi que sur la tyrosine grâce à la fonction hydroxyl sur la partie phénolique. La protéine N des SARS-CoV contient un domaine fortement enrichi en sérine, laissant penser à une hyper-phosphorylation de ce motif (Mc Bride)
Ce domaine de N, riche en sérine s’écrit ainsi pour le SARS-CoV de 2003 {ssrsssrsrgnsrnstpgssr} ; on le retrouve sur quelques souches prélevées sur des chauves-souris. Sur le SARS de 2019, la séquence est la même avec une délétion d’un résidu glycine et une insertion d’un résidu sérine ; {ssrsssrsrnssrnstpgssr} ; cette séquence a été retrouvée sur des souches prélevées sur des chauves-souris et des pangolins constituant le réservoir SARS de 2013.
b) Y aurait-il aussi des codes protéiques composés de motifs riches en sérine ? Avec une conservation au fil de l’évolution. Tout en sachant que les sérines sont sujettes à des phosphorylations joutant le rôle de commutateur dans d’innombrables opérations moléculaire. La petite ribonucléoprotéine U6 intervient dans l’épissage en coupant et suturant les transcrits. Elle contient un motif enrichi en sérine {shervfsssq} dont la présence est observée chez les poissons osseux, les amphibiens et une série de mammifères jusqu’à l’homme. Rechercher ces séquences riches en sérine est à la portée d’un laboratoire de bio-informatique. Les norovirus causant entre autres des gastro-entérites, sont de tous petits virus à ARN positif non enveloppé de 7kb dont le génome code pour une protéine structurale et une seconde dite mineure, VP2, servant de capside, ou de protéine accessoire et enfin VPg, protéine pouvant se lier au génome comme le confirme la présence de résidus lysine. J’en ai dénombré 17 pour une protéine VPg de quelque 130 aa. Par ailleurs, toutes les séquences des protéines VP2 possèdent un domaine enrichi en sérine comme on a pu l’observer sur N. Par exemple {pargssskssnsstatsvys} sur un Norwalk GII avec ce motif {ssskssnss} observé sur plus de 200 norovirus. Cet autre motif {pargssstpsnsstatsvys} est observé sur quelque 200 souches de GII ce qui offre une conjoncture similaire à celle observée pour les sarbecovirus. La conservation de motif ne peut que renforcer l’idée d’une sélection sémantique d’autant plus que les norovirus sont connu pour muter à une vitesse phénoménale. De plus, l’importance de la phosphorylation dans le mécanisme d’infection cellulaire des virus est confirmée.
c) Le jeu de la biosémantique est risqué. La pierre de Rosette des protéines se dévoile à peine. On l’a constaté sur la protéine S et maintenant sur la protéine N plurifonctionnelle qui se déplace au sein de la cellule hôte et joue un rôle important. Elle se lie à l’ARN viral et assure son transport ; elle intervient à d’autres niveaux en facilitant quelques étapes et notamment la traduction des composants viraux par les ribosomes hôtes. Les codes permettent aux protéines de circuler et de « hacker » son dispositif ribosomal et ainsi de transformer la cellule en usine à virion. Ce constat est valable pour tous les virus. Les codes composé d’acides aminés ne peuvent être considérés indépendamment des autres dispositifs que l’on soupçonne être impliqués dans les codages et décodages, fonctionnant ainsi comme des passes pour rejoindre un espace membranaires, ou alors extra, intra-cellulaire. C’est le principe universel du tropisme moléculaire que je désigne également avec ce concept inédit, le tropisme sémantique. Ce tropisme utilise les codes polybasiques mais aussi deux classes de mécanismes servant en quelque sorte de « marquage » pour les protéines, la glycosylation (i) et la phosphorylation (ii), sortes de passeports pour circuler en étant marqué par un signe et interférer dans la sémantique moléculaires (il en existe d’autres, l’ubiquitination notamment, ou la sumoylation, sans oublier la méthylation). (i) La première semble plutôt liée au tropisme membranaire, (ii) la seconde au tropisme intracellulaire et à la transmission de signaux déclenchant l’activation d’une cascade de mécanisme. La glycosylation serait du genre espace et structure alors que la phosphorylation serait du genre temps et fonction (action)
12) Phosphorylation des nucléoprotéines virales
Les « mécanismes » de phosphorylations sont essentiels aux régulations moléculaires et sont altérés lors d’une infection virale. Le virus ruse avec l’appareil de traduction de l’hôte qui se met à produire les protéines virales. Un coronavirus emploie 16 protéines non structurales pour se répliquer mais aussi pour détourner l’appareil ribosomal tout en interférant avec les voies de signalisation. A ces 16 composants s’ajoutent quelques protéines accessoires codées par les séquences de lecture ORF {6 à 10}. La phosphorylation des protéines N du SARS-CoV-2 est indispensable pour cette molécule classée parmi les phosphoprotéines. D’autres protéines virales sont affectées par les phosphorylations ; tous les virus sont concernés, notamment ceux qui utilisent un ARN simple brin positif ou négatif comme le précise cette revue : « La phosphorylation est essentielle pour que nombre d’agents pathogènes intracellulaires réalisent le cycle reproductif. La préservation des motifs phosphorylés des protéines chez les pathogènes similaires à ceux des composants de l'hôte souligne la trajectoire co-évolutive des virus et des hôtes, et met en lumière la façon dont les agents pathogènes ont détourné, en partie ou dans son ensemble, la machinerie protéique de l’hôte. La phosphorylation des protéines virales pour de nombreux virus à ARN aigus, y compris les flavivirus et les alphavirus, s’est avérée essentielle pour la fonctionnalité de ces protéines. Cette revue se concentre sur les modifications de phosphorylation ; en mettant l'accent sur les virus à ARN simple brin hautement infectieux. » (Keck, 2015)
Le virus de l’hépatite B utilise une protéine HBc, dite clé, équivalente en fonctionnalité à N ; elle interfère avec les acides nucléiques des cellules hôtes. Cette protéine possède dans la partie C-terminale non seulement des motifs polybasiques composés de résidus arginine mais aussi des résidus sérine pouvant être phosphorylés. Cette séquence est la suivante :
141 stlpettvvrrrdrgrsprrrtpsprrrrsqsprrrrsqsresqc
« Le domaine C-terminal contient une série de résidus phospho-accepteurs qui subissent une phosphorylation et une déphosphorylation partielles pendant la réplication du virus. Ce processus hautement dynamique régule la charge homéostatique qui est essentielle pour la stabilité de la capside, l’empaquetage du pgRNA et pour exposer le domaine C-terminal à la surface des particules pour le trafic cellulaire. Dans cette revue, nous discutons des rôles des domaines N-terminal et C-terminal de la protéine HBc au cours de la morphogenèse du VHB, en nous concentrant sur la façon dont la dynamique de phosphorylation du domaine C-terminal régule son interaction avec les acides nucléiques tout au long de l’assemblage et de la maturation des particules du VHB. » (de Rocquigny, 2020).
La séquence { rrrrsqsprrrrs} figure sur quelque 7000 variants (la plupart humains) appartenant à une même lignée de virus hépatiques B infectant des espèces aussi différentes que les singes, chats domestiques, chauves-souris, écureuils, marmottes et sapiens. Ce qui suggère l’existence d’un réservoir multi-espèces pour ces virus appartenant à la lignée des orthohepadnavirus ; ou du moins une origine commune assortie d’une sélection de cette séquence lors de la diffusion du virus d’un réservoir à un autre. Ce phénomène a observé pour les sarbecovirus dont le réservoir comprend les pangolins, civettes, chauves-souris, hommes et peut-être les visons. Remarquons cependant que les codes des sarbecovirus ont été repérés sur la protéine S alors que pour l’hépatite B, ces codes figurent sur la protéine HBc et combinent des motifs polybasiques et des sites de phosphorylation.
La glycosylation des protéines de la capside virale est une étape importante permettant le tropisme des virions, pour entrer dans la cellule ou en sortir, en remarquant que le virion utilise les glycosyl-transférases de l’hôte. Dans le cytoplasme, c’est la phosphorylation des protéines virales qui apparaît comme nécessaire au détournement de l’appareil de traduction et à la production en série des virions.
13) Phosphorylations du virion et des réseaux moléculaires de la cellule infectée
a) réseau et interactome
La reproduction du virus apparaît simple et pourtant, elle nécessite l’intervention de dizaines, voire centaines de protéines mobilisées par la cellule hôte qui devient une usine à virions. Une étude de grande envergure mobilisant plus de cent chercheurs a établi un diagramme permettant de visualiser les interactions entre quelque 330 protéines hôtes et 26 des 29 protéines du SARS-CoV-2 (Gordon, 2020), parmi lesquelles figurent les quatre protéines structurales, S ; N, M, E, puis 13 des 16 protéines non structurales codées par la séquence Orf1ab, le reste étant constitué de protéines codées par les séquences ORF ; 3, 6, 7, 8, 9, 10. Ces investigations avaient comme objectif un ciblage des « mécanismes » afin de repositionner des spécialités pharmaceutiques en vue d’une thérapie antivirale. Elles ont montré l’étendue de l’interactome reliant en un graphe complexe le protéome d’une cellule infectée par le virion dont les protéines présentent des motifs leur permettant de s’arrimer aux composants de la cellule hôte.
Le mécanisme moléculaire d’infection virale ne se résume pas à une sorte de lego comme on peut en voir dans les manuels scolaires, comme si le virion était particule circulant à son aise pour accéder aux ribosomes, utiliser son génome et faire produire par l’appareil de traduction les composants permettant la production industrielle des virions. L’infection par le virion produit une cascade de phosphorylations affectant non seulement les protéines virales mais aussi une partie du protéome hôte. Une étude de l’interactome {virus – hôte}a été réalisée en utilisant un type cellulaire Vero6 sensible à une infection au SARS-CoV-2. Parmi les plus de 300 protéines photographiées dans l’interactome, une partie est altérée ; augmentation ou diminution de la phosphorylation et parfois combinaison des deux, comme le montre le schéma des horloges phosphorylantes (Bouhhadou, 2020). La cascade de phosphorylations s’interprète comme une succession de connexions, à l’image d’un central téléphonique qui active ou ferme un circuit de transmission ou à l’instar des neurones qui commutent en utilisant un signal électrique parcourant les fibres nerveuses et se transmettant par la médiation des synapses qui selon leur « état électrophysiologique », transmettent ou stoppent le signal. Le virion est d’une efficacité redoutable car il change le phénotype de la cellule pour en faire une « usine à virion » en parasitant les systèmes de communication intracellulaire. On lit souvent que le virion « utilise » un arsenal de protéines pour changer le mode opérationnel de la cellule, dérouter ses mécanismes, détourner sa finalité et pour le dire autrement, changer son identité. En réalité, le virion n’a aucune efficience, il véhicule un ensemble d’information et de code que la cellule hôte va reconnaître, décoder pour ensuite répondre à ce signal sémantique complexe et réagir en changeant complètement son identité et sa finalité ; la cellule se fait leurrer par les mécanismes virologiques. Le virus ne doit pas être pris comme objet conceptuel, ni comme objet individué doté de propriétés. Le virus est à l’image d’un langage et l’infection est à l’image d’un acte de langage. Ce sont les interférences systémiques entre le (nucléo)protéome viral et le (nucléo)protéome hôte qui détermine le développement de l’infection virale conçu comme une émergence, de la même manière qu’il n’y a pas de jamais de pathologie mais toujours des patients développant des symptômes caractéristiques de la maladie avec des mécanismes physiologiques et moléculaires déviés, soit par des causes endogènes, soit par des éléments exogènes et notamment les agents infectieux. Une souche unique de SARS-CoV-2 va induire quelque 5 à 10 phénotypes cliniques et chaque infecté développe sa propre pathologie.
b) Le phosphore, clé dynamique dans la stratégie virale
Le virion n’agit pas, il pénètre, utilise ses codes et ce sont les protéines hôtes qui réagissent en suivant les instructions complexes portées par les codes viraux qui une fois décodés, se traduiront par une cascade de phosphorylations réalisées par les kinases. Ces mécanismes sont à l’image des signaux parcourant les neurones du réseau central exécutif. Il est probable qu’une cellule fonctionne sur ce principe, avec un réseau exécutif assurant les fonctionnalités de la cellule mais aussi la stabilité du phénotype en maintenant son édifice structurel. C’est cet édifice qui est transformé en réponse aux codes viraux. Pour transformer une cellule, il faut activer des réseaux opérationnels et en désactiver d’autres. Ce que fait la cellule dont les phosphatases sont aussi mobilisées après une infection virale. Quelques virus codent pour des protéines interférant avec la phosphatase PP2A. Pour se transformer en usine à virions, une cellule utilise la force électrochimique véhiculée par l’ATP, molécule synthétisée dans les mitochondries et servant à de multiples usages, pour générer des réponses moléculaires, façonner des édifices, des structures, des échafaudages protéiques, membranaires et bien évidemment, activer les sarcomères des cellules contractiles pour produire une force mécanique. Le virus ne contient aucun gène intervenant dans ces processus. Il compte sur la cellule qu’il infecte et dont il subvertit les codes.
Une étude de grande envergure a montré l’ampleur des changements cellulaires consécutifs à une infection par le SARS-CoV-2 (Bouhhadou, 2020). Voici les principaux résultats : 8 h après l’infection, les protéines virales ont été synthétisées, sans que l'abondance des protéines de l’hôte ne soit fortement impactée durant 24 h. En revanche, des changements importants ont été observés dans la phosphorylation des protéines, mettant en évidence comment le virus utilise les systèmes de régulation post-traductionnels de l’hôte pour modifier la signalisation cellulaire. Les kinases les plus fortement impactées appartiennent à quelque voies de signalisation ; p38 / MAPK, la signalisation AKT et ERK, la signalisation du cytosquelette Rho GTPase et CK2 et la régulation du cycle cellulaire. Des changements dans l’organisation du cytosquelette sont induits par les virions. L’imagerie des cellules infectées a révélé la formation de filopodes riches en actine contenant des protéines virales. La microscopie électronique confirme la présence de virions assemblés dans ces structures. Les grappes de protéines du SRAS-CoV-2 sont réparties sur les protubérances filopodiales mais des travaux supplémentaires sont nécessaires pour comprendre si le SRAS-CoV-2 utilise soit l’activité motrice de la Myosine X, soit l’assemblage de filaments d’actine pour se déplacer. CK2 est connu pour phosphoryler les protéines de la myosine au niveau des sites endocytaires afin de favoriser la polymérisation de l’actine. En outre, il a été constaté que CK2 régule la formation de la terminaison d'actine pendant l'infection par le virus de la vaccine, permettant une propagation efficace de cellule à cellule du virus. Les activités CDK1 / 2 sont considérablement réduites une infection au SARS-CoV-2, conduisant à un arrêt de phase S / G2 similaire aux effets du virus de la bronchite infectieuse (IBV), un coronavirus prototypique et d’autres virus à ARN. La voie p38 / MAPK répond et contrôle la production de cytokines pro-inflammatoires potentiellement nocives. Plusieurs virus induisent cette signalisation p38 / MAPK conduisant à une inflammation excessive associée à une pathologie grave.
Nous constatons que le phosphore est un connecteur binaire signifiant actif/inactif, ouvert/fermé. Ce sont les protéines qui se « parlent », interprètent les codes, les signaux regroupés en signalisation et qui utilisent le résidu phosphoryl comme une sorte d’interrupteur, capable de transmettre ou de fermer une voie de signalisation, mais seulement après interprétation d’un signal. Le phosphore est employé comme un code universel, utilisé dans les voies de signalisations pour transmettre des signaux, des instructions, créer des tropismes, des structures, stocker des informations, synthétiser les acides nucléiques et produire de la force électromécanique. Les voies du phosphore sont utilisées par les cyanobactéries dépourvues de réticulum endoplasmique et de flagelles, par les végétaux autotrophes et les champignons hétérotrophes, deux règnes n’utilisant pas la force électromécanique et bien évidemment tous les autres systèmes vivants capables de générer cette force, depuis les bactéries et les eucaryotes monocellulaires dotés de flagelles ou de cils, jusqu’aux animaux dotés de muscles et qui par définition sont animés.
Les virus interfèrent avec les voies du phosphore et la cellule infectée est déviée de ses finalités pour être transformée. Le virus induit une série de modifications tactiques et stratégiques. Il dévie le système de défense immunitaire, il induit la transformation du cytosquelette pour se déplacer dans le cytoplasme, sortir de la cellule et infecter d’autres cellules adjacentes en créant des ponts avec l’actine polymérisée, se propageant tel un incendie viral ou alors une conquête coloniale. On pourrait penser qu’il bloque le cycle cellulaire pour neutraliser une stratégie qui lui serait défavorable. Ce serait lui prêter des pouvoirs magiques qu’il ne possède pas. Ce blocage s’explique par une réponse classique de la cellule à un message qu’elle reçoit. Le virus porte ce type de message mais il n’est pas le seul, loin s’en faut. Les voies de signalisation perverties par le virus sont universelles dans le monde des molécules vivantes. Toutes les cellules de l’organisme les utilisent et ces voies sont conservées par l’évolution. Il est logique que les virus les utilisent ou alors que les cellules utilisent les virus, ce qui suppose de renverser le point de vue. Les cellules hôtes seraient-elles transformées par les codes du virus pour se comporter en cellules séditieuses ?
Une chose est certaine, les cellules infectées par le SARS-CoV-2 sont transformées avec des modifications de grande ampleur, affectant la voie P38 / MAPK produisant les cytokines, les voies AKT et ERK régulant le cycle cellulaire, contrôlant l’apoptose et la phase mitotique. Enfin, des altérations dans le cytosquelette sont importantes, avec la production de filopodes dont se sert le virus pour se déplacer, occuper la cellule et même en sortir pour infecter d’autres cellules ou même établir des connexions avec les virions de cellules connexes. Le virus comme concept ne se résume plus à une usine à virion, il est une sorte de langage codé capable de transformer une ou plusieurs cellules, ainsi qu’un tissu cellulaire de l’organisme hôte.
14) Interférences virales avec les voies de signalisation des cellules hôtes. MAPK-ERK, protéines de la famille 14-3-3
a) MAPK
Les virus interfèrent avec les voies de signalisations complexes qui gouvernent la division cellulaire, la différenciation, la survie ou l’apoptose. La voie MAPK-ERK est déterminante ; elle régule la réaction des cellules en réponse à un changement de l’environnement et elle est détournée ou du moins, elle s’active de manière spécifique lorsqu’un virus entre dans la cellule. Tout se passe comme si le virus pouvait hacker les codes de cette signalisation et détourner les processus cellulaires pour faire de la cellule une usine à virion. La plupart des virus utilisent ces voies. On l’a observé pour le SARS-CoV-2, pour d’autres virus à ARN et pour un nombre élevé de types viraux possédant un génome à ADN, qu’ils soient enveloppés ou pas. Une revue récente a décrit l’interférence des virus à ADN avec trois kinases centrales dans les voies de signalisation, Raf, MAPK/ERK et ERK1/2 (DuShane, 2019). Les virus étudiés dans cette revue occasionnent des problèmes de santé publique ; adenovirus, papillomavirus, poxvirus, poliovirus, herpesvirus, hépatovirus B. Les auteurs concluent à une manipulation des cellules par les virus qui les utilisent pour se reproduire. Ou alors les cellules se laissent manipuler en étant leurrées. Elles traduisent les gènes viraux comme s’il s’agissait de leurs propres gènes, mais après c’est trop tard, les protéines virales parviennent à hacker les cascades de signalisation pour dévier la cellule qui fabrique alors les virions en mode industriel. Ces opérations s’effectuent dans un délai imparti, parfois en plusieurs phases comme on l’observe pour les poliovirus. Comme si une horloge activait le jeu viral. Une influence entre infection et horloge circadienne a même été observée pour certains virus.
b) Protéines 14-3-3
Une autre classe de protéines interfère avec un nombre conséquent de virus à ARN ou à ADN où figure le SARS-CoV. Ces agents infectieux utilisent les protéines 14-3-3 afin d’assurer la progression de l’invasion dans les tissus de l’hôte. Ces protéines acides possèdent des motifs caractéristiques associant des résidus basiques et des sérines pouvant être phosphorylées. Une revue récente a recensé les interférence des virus avec ces protéines dont : « La fonctionnalité générique peut être classée en trois catégories ; (A) changements conformationnels de sa protéine de liaison : la structure rigide des protéines 14-3-3 peut servir de base stable pour « usiner » les ligands et modifier de leurs activités ; (B) masquage d’une région phosphorylée sur une protéine de liaison en ciblant des déterminants de surface de la protéine cible ; (C) action comme des molécules d’échafaudage ou des connecteurs entre deux autres protéines de liaison. Ces diverses fonctions des protéines 14-3-3 constituent un spectre d’interactions protéine-protéine entre les protéines hôte et les protéines de l’interaction hôte-virus (Nathan, 2020).
Ces protéines interviennent dans les assemblages, les formatages, créant des saillances à l’instar des sceaux-rouleaux utilisés par les Sumériens pour imprimer des motifs sur les tablettes d’argiles. Les codes sont transmis, imprimés, parfois masqués. Ils ont de multiples usages et les virus manipulent ces codes avec une efficacité redoutable. Ces codes sont conservés mais seule une investigation de grande ampleur permettra d’appuyer la théorie du darwinisme sémantique. Une recherche bibliographique indique que les études sur la conservation de séquences peptidiques sont peu nombreuses, la plupart remontant à plus de dix ans. Les généticiens se sont plus focalisés sur la conservation des gènes, ce qui est consistant avec les principes du néodarwinisme. La conservation des séquences et plus précisément, des codes protéiques, se place dans le cadre d’un élargissement de l’évolutionnisme au sein du paradigme des communications (Dugué, 2017, 2108). Le darwinisme sémantique postule une conservation des codes, des signaux, autrement dit, de la sémantique moléculaire, c’est-à-dire du langage utilisé par les composants du vivant pour organiser le fonctionnement coordonné, façonner les structures, produire les fonctionnalités.
Les protéines 14-3-3 sont très conservées dans le règne eucaryote. Elles possèdent un motif canonique utilisant le plus souvent une combinaison où figurent l’arginine, la sérine et la proline. La recherche de séquences dites «motifs canoniques» élargie à quelque 20 résidus de part et d’autre illustre cette conservation comme l’indiquent ces observations très lacunaires et qu’il faut interpréter avec prudence. Les sites fonctionnels connus ne sont pas les seuls à être conservés. Il est possible de trouver d’autres séquences incluant des résidus basiques et des sites de phosphorylation. J’ai choisi trois protéines, RAF1, YAP-1 et Histone 3.1 dont le motif est extrêmement conservé, présents dès les premiers clades eucaryotes et même sur certaines bactéries. Sur la protéine ADA_22, le motif canonique n’échappe pas à la règle. En revanche, des motifs de 20 résidus pauvres en sérine ou arginine montrent une conservation restreinte, réduite à l’homme et les trois grands singes, plus le gibbon. De plus, une séquence située sur la partie N-terminale, riche en résidus polybasiques et sérine, est spécifique de sapiens
RAF1 ; GLSQRQRSTSTPNVHMVST
Euteleostomi (311)
Coactivateur transcriptionnel YAP1 ; LTPQHVRAHSSPASLQL
Actinopteri (22) ; Tetrapoda (367)
Histone H3.1 ; TKQTARKSTGGKAPRKQLAT
Bacteria (12) Eukaryota (7400) avec le clade Opisthokonta comprenant les eucaryotes avec flagelles et donc générant une force électromécanique, les Viridiplantae ; plantes vertes, algues et donc sans force électromécanique, ainsi que le clade Sar ; sous-règne d’eucaryotes comprenant les rhizaires, plancton qui vit en symbiose avec les algues vertes.
Q9P0K1 (ADA22_HUMAN) ; KRFRPRSNSTETLSPAKSPS
Amniota (253) ; Xenopus (11) comprend les mammifères placentaires ou non et un clade de batraciens
881 pypmpplpdedkkvnrqsar ; Ce peptide de 20 résidus pauvres en sérine ne sont conservés que sur un clade restreint d’où sont issus les grands singes, chimpanzé, gorille, orang-outan, plus le gibbon qui diverge avant les grands singes.
211 pskfilkprpkrskrqlrry ; spécifique à sapiens
15) Le code Ubiquitine
a) Les voies de signalisation utilisent d’autres systèmes de codage exprimés sur les protéines. L’ubiquitine est un peptide de 76 acides aminés utilisé comme marqueur pouvant être ajouté à des protéines par une cascade d’enzymes utilisant l’ATP. Ce peptide est extrêmement conservé dans le règne eucaryote, de la levure aux mammifères. Une recherche sur deux séquences peptidiques de quelque 20 à 30 résidus fait ressortir des occurrences jusque dans le monde des archaea, des bactéries et même des virus. L’un des motifs, situé en C-term, se retrouve sur quelques 100 types viraux où figurent des virus géant comme le mimivirus infectant les amibes. Comme si ces motifs étaient des codes devenus universels, sorte de langage permettant aux molécules de mener leur existence dans un édifice cellulaire dont la complexité est colossale. Ces observations appuient le paradigme du darwinisme sémantique expliquant la conservation des codes moléculaires parce qu’ils sont utilisés, sélectionnés par les cellules qui les utilisent, à l’image du langage humain qui persiste tant qu’il est utilisé et qui disparaît lorsqu’il n’y a plus aucun locuteur utilisant les phonèmes pour se faire comprendre dans l’univers social.
(Ubiquitine Sapiens, GenBank: CAA28495)
1 mqifvktltgktitlevepsdtienvkakiqdkegippdqqrlifagkqledgrtlsdyn
61 iqkestlhlvlrlrgg
qdkegippdqqrlifagkql
Archaea (5) ; Bacteria (63) ; Eukaryota (11764)
Virus (98) parmi lesquels des poxvirus à ADN double brin dont le virus de la vaccine, des pestivirus à ARN positif affectant les bovins, des virus géants, marseillevirus, lausanevirrus, mimivirus classifiés ou non, et toute une série de types viraux assez exotiques.
mqifvktltgktitlevepsdtienvkak
Virus (21) dont Chordopoxvirinae (4) ; Pestivirus (17)
Cellular organisms (2137) dont Bacteria (8) ; Eukaryota (2129)
b) La littérature scientifique utilise le concept de code pour expliciter le rôle de l’ubiquitine dans la régulation du protéome cellulaire. Ce code est dans son principe binaire. Il fonctionne comme le phosphore dont le code signifie actif inactif. Le code ubiquitine signifie autre chose. Il semble dire la chose suivante : on efface ou on conserve, on élimine la protéine ou on la maintient. Ce code gouverne le fonctionnement autonome des protéines et confirme la thèse centrale de cette étude, les protéines mènent le jeu, ou du moins un jeu. Le protéome est pris en tenaille par deux dispositifs. Celui de l’épigénome dont le code est expression ou répression. Alors que le code ubiquitine intervient sur le protéome traduit et signifie, conservation ou effacement, autrement dit, une protéine est-elle utile ou inutile pour réaliser les finalités de la cellule ? Le code ubiquitine semble déterminer l’assemblage des protéines qui doivent fonctionner et constituer l’identité cellulaire.
Les voies de signalisation utilisant les ubiquitines sont d’une complexité redoutable. La voie dite « linéaire » utilise une cascade d’enzymes par dizaines. Ces protéines constituent le « système de codage ubiquitine » dont le principe est de marquer le protéome en utilisant des chaînes linéaires composées de molécules d’ubiquitine polymérisées. Le codage repose sur un système d’écriture utilisant trois séries d’opération, E1, E2, E3, avec pour la troisième étape l’intervention d’un système d’écriture propre aux mammifères, désigné comme LUBAC, qui est au centre de la régulation des réponses immunitaires innées et acquises. Le codage utilise trois type d’opérations, l’écriture réalisée par LUBAC, l’effaçage réalisé par les effaceurs comme OTULIN ou CYLD et enfin le décodage qui est en quelque sorte un système de lecture capable de lire la signalisation et de l’interpréter en vue de communiquer des instructions pour réaliser d’autres opérations devenues nécessaires et se produisant de manière automatique (Oikawa, 2020). Ainsi, le système LUBAC active le signal canonique NF-κB, situé au centre de processus systémiques assurant la réponse immunitaire ainsi que l’apoptose. Ce signal déclenche un rétrocontrôle négatif de l’apoptose en activant une cascade de protéines régulatrices anti-apoptotique. NF-κB est la cible de centaines d’effecteurs et déclenche l’expression d’un bon millier de gènes, notamment pour générer une réponse immunitaire. C’est donc un élément central dans le langage moléculaire qui permet à une cellule de voir son identité et sans doute sa finalité, son destin en quelque sorte. Une cellule est destinée à perdurer ou à dépérir par apoptose selon l’état de la situation. Les plus connues étant le stress, les processus de dégénération, des inflammations aiguës ou alors à bas bruit comme l’inflammation entretenue dans le diabète de type 2. Et last but not least, le stress que représente l’infection d’un tissu par un virus. Dans la plupart des maladies dégénératives, cancer, Alzheimer etc., le code linéaire des ubiquitines fonctionne de manière aberrante, de concert avec le signal NF-κB, ce qui au final crée des phénomènes auto-inflammatoires, auto-immuns, altérant les tissus ou alors des agrégats protéiques conduisant à la dégénérescence des neurones.
Le code ubiquitine pourrait jouer un rôle équivalent à celui du réseau de saillance qui, dans le système nerveux, constitue une sorte de vigie, plaçant sous les yeux du système les signaux nécessaires et dictant l’exécution d’une procédure adaptée à la situation. Le marquage ubiquitine est en quelque sorte une « saillance » appliquée au protéome dont le décodage permet au réseau moléculaire exécutif de déclencher des réactions, à l’instar du réseau exécutif central propre au cerveau. Néanmoins, le code ubiquitine est régulé en amont par d’autres cascades et des signaux d’alerte, par exemple les récepteurs Toll-like capables de détecter les agents viraux dans des cellules compétentes, dendritiques, lymphocytes.
16) Les virus induisent un désordre sémantique « réparé » par l’immunité et l’inflammation
a) Les virus induisent (et non produisent) sur les cellules infectées une sorte de chaos moléculaire observé dans les voies MAPK, ERK et d’autres. Ces voies sont reliées avec le système ubiquitine. Les procédés d’écriture, d’effacement et de décodage du système ubiquitine sont perturbés par la plupart des virus, qu’ils soient à ADN ou à ARN. Parmi les virus, les uns se reproduisent en nombre ; un à 100 milliards de virions occupent l’hôte une semaine après l’infection ; alors que d’autres agissent plus lentement, se cachent parfois, produisant des symptômes des mois voire des années après l’infection. Les virus à ARN simple brin induisent souvent des affections durant quelques jours, voire une à deux semaines. C’est le cas de la grippe, des coronavirus « classique », du virus syncytial respiratoire, du métapneumovirus, des flavirivus comme celui qui cause la fièvre du Nil chez une partie des contaminés alors que la majorité des infectés restent asymptomatiques ; 80% des cas passent inaperçus ; ce chiffre étant aussi observé pour les grippes et le coronavirus de 2020. Les infections virales affectant l’homme semblent plus diversifiées que chez les espèces animales. Un patient façonne une propre réponse. Ce qui nécessite de développer une perspective systémique centrée sur l’hôte, sa capacité à interpréter les codes viraux, les décoder, et déployer en bon ordre une réponse adéquate pour se débarrasser du désordre induit par un agent viral. Le mot qui convient pour l’effet du virus c’est l’induction. Et la réponse de la cellule hôte repose sur la capacité du dispositif immunitaire à « conduire », autrement dit, à développer la conduction appropriée, utiliser les mécanismes, les voies de signalisation, afin de contenir le mieux possible les effets des virions. La réponse passe par l’apoptose, la destruction des cellules infectées, la capture des virions par les anticorps et la réparation inflammatoire après les dommages causés par la réponse immunitaire.
b) Interférence est bien le concept qui convient pour expliquer comment un virus parvient à « neutraliser » le système de veille immunitaire, ou alors à le « leurrer », le « détourner », tout en interférant avec les voies de signalisations fondamentales (§15) et les systèmes de transcription des cellules hôtes (§17). La situation d’un organisme infecté par un virus se conçoit comme un désordre massif dans les signalisations moléculaires si bien que les virions finissent par « occuper » les cellules infectée alors que l’organisme tend de reprendre en main la situation avec les réponses adaptées. Le retour à la situation « normale » passe par l’inflammation, mécanisme systémique indissociable de l’immunité et dont les effets sont tissulaires, permettant une élimination des cellules endommagées, une restauration des tissus, ces deux processus nécessitant une action au niveau de la microcirculation sanguine, mobilisant les processus d’angiogenèse. L’inflammation est aiguë lorsqu’elle intervient après un stress tissulaire intense, une blessure, une brûlure, une infection bactérienne sur une plaie et bien évidemment lors des infections virales affectant les mammifères et l’homme. C’est le cas pour la grippe dont on se remet en général après une à deux semaines ou pour le Covid dont les formes graves sont assorties d’une inflammation aiguë. En revanche, l’inflammation chronique s’installe durablement et s’observe dans diverses pathologies, métaboliques comme le diabète de type 2, cardiovasculaires avec des troubles ischémiques, de l’hypertension etc., articulaires, dans l’arthrite, la goutte, sans oublier les maladies dites dégénératives avec en ligne de mire le cancer.
L’inflammation est le signe d’un désordre dans les communications cellulaires, assorties de réponses épigénétiques défectueuses. L’inflammation s’interprète comme une entropie que l’organisme cherche à éliminer en restaurant l’ordre naturel, l’équilibre, le bon fonctionnement des voies de signalisation, la lecture correcte des signaux, la conformité des réponses efficientes médiatisées par les protéines régulatrices intervenant dans plusieurs lieu, dans les membranes périphériques, le réticulum, les ribosomes, le noyau. Entrent en jeu kinases, phosphorylations, ubiquitinations, méthylations, (plus rarement, sumoylations), avec en amont une expression appropriée des gènes transcrits. Les capacités régénératrices de la réponse inflammatoire sont spectaculaires si l’on observe comment la surface de la peau détruite par une brûlure ou alors une plaie finit par reprendre sa forme initiale. C’est la preuve que le système inflammatoire fonctionne avec la régulatrice d’un orchestre de molécules en nombre colossal dont les opérations sont parfaitement coordonnées. L’état de la peau après certaines infections virales montre en revanche comment une invasion de virion est capable de perturber les régulations cellulaires au point que la peau devienne méconnaissable. C’est le cas de l’herpès, de la rougeole, varicelle, du zona et il y a longtemps, de la variole dont les symptômes sont effroyables.
c) Le détournement de la réponse cellulaire induit par la plupart des virus produit une séquence de signalisation non canonique, pour ne pas dire aberrante. Cette voie utilise deux types de protéines, les Janus kinases, JAK, dont le mécanisme consiste à phosphoryler des facteurs de transcription (STAT) permettant aux cellules de synthétiser les protéines sur « commande ». Il existe quatre types de JAK et sept types de STAT dont les effets sont systémiques, chaque cellule étant « programmée » pour résoudre un problème se propageant à l’échelle d’un tissu, d’un organe, voire de l’organisme. Chaque cellule devient la source d’un champ destiné à influencer les cellules situées à une distance plus ou moins grande. Chaque cellule répond de manière spécifique selon son phénotype.
Les signaux véhiculés par le système JAK/STAT sont de plusieurs types, apoptose, différenciation, division cellulaire, activation des réponses immunitaires, inflammation locale ou généralisée des tissus. De plus, ce système est interconnecté à la voie de signalisation MAPK/ERK qui intervient aussi dans les processus de division ou de mort cellulaire. En imaginant qu’un chef d’orchestre donne la mesure à l’ensemble des cellules de l’organisme pour qu’elles jouent une partition conforme à l’harmonie globale, les signalisations JAK/STAT représentent les battements du chef d’orchestre adressés aux systèmes de transcription cellulaire mais aussi au système de division. On le constate avec les cellules immunitaires de type B, NK et autres dont la multiplication est induite par les JAK/STAT. Remarquons également la conservation de séquences déterminantes au cours de l’évolution. Par exemple, le peptide extrait de la séquence JAK2 de sapiens {kigdfgltkvlpqdkeyykvk} ; contenant 5 lysines et 2 tyrosines juxtaposées, est retrouvé sur le clade Gnathostomata, autrement dit avant la séparation entre les poissons cartilagineux et osseux.
Des études ont associé un système JAK/STAT défectueux à diverses pathologies, cancer, maladie auto-immunes, arthrite rhumatoïde, parfois de l’asthme. Les patients ayant un JAK3 défectueux sont sujets à des déficiences dans l’immunité épidermique ont une tendance accrue à développer un psoriasis. Un JAK2 dysfonctionnel serait lié au développement de lymphomes et de leucémies. Les kinases sont aussi suspectées de favoriser la dégénérescence neuronale, complétant de ce fait la longue série des désordres tissulaires dont on peut dire qu’ils sont générés par des défections dans les communications cellulaires conduisant les cellules à perdre leur identité fonctionnelle. Les virus transforment les cellules en usines à virions et altèrent les tissus. Beaucoup de virus interfèrent avec la signalisation JAK/STAT qui, si elle est correctement activée par l’interféron et réglée au mieux, permet à l’hôte de déployer une défense efficace contre la propagation virale. A l’inverse, si le virus interfère avec ces signalisations, les tissus déploient une défense immunitaire défectueuse, soit déficiente, soit excessive. De nombreuses études ont noté que les virus disposent de protéines capables de déjouer la signalisation interféron JAK/STAT, induisant de ce fait une activation non canonique, non usuelle, favorisant l’infection virale. Ce processus non canonique suggère un fonctionnement défectueux voire détourné ; il dépend d’une seule phosphorylation sur la tyrosine située en position 700 qui est contournée par des virus induisant une réponse STAT1 en phosphorylant une sérine présente sur un domaine régulateur TAD (Nan, 2017). Les mécanismes connexes au dispositif JAK/STAT sont d’une redoutable complexité, englobant des voies de signalisations analysées et d’autres encore inconnues. La décennie en cours permettra de mieux comprendre ces interférences (Nan, 2017) dont on est certain qu’elles s’interprètent dans le cadre de la sémantique moléculaire. Comme si au contact de la sémantique des codes protéiques viraux, la cellule lisait une autre partition et se mettait à l’exécuter avec les voies JAK/STAT et les types d’interféron. STAT3 est aussi pressentie comme une cible interférant avec les virus, laissant penser à une réaction moléculaire jouée avec plusieurs instruments.
c) Le SARS-CoV-2 joue également dans ce registre, utilisant les protéines NSP1 er ORF6 pour neutraliser la voie STAT1, ce qui fait basculer la défense immunitaire sur STAT3 dont l’activation intempestive est responsable des formes graves de Covid (Matsumaya, 2020). ORF6 est une protéine virale dite accessoire et pourtant, elle semble jouer un rôle important en leurrant les mécanismes immunitaires. Cette petite protéine de quelque 60 résidus est extrêmement conservée dans le réservoir d’où est issu le SARS-CoV-2 en 2019. On retrouve cette séquence à l’identique sur la souche RaT-G13. Elle présente des motifs conservés sur une souche prélevée en 2020 sur un pangolin et sur la souche japonaise Rc-o319 prélevée en 2013. La protéine ORF6 est un peu moins conservée dans le réservoir sarbecovirus des années 2000 où figure le premier SARS humain responsable de l’épidémie en 2003 (voir MS VIII). En revanche, la séquence peptidique N-terminale {mfhlvdfqvtiaeil} est présente sur une bonne cinquantaine de souches, pangolins, civettes et surtout chauve-souris, les quelque dix HKU eu autant de TW, les BJ1, YNLF… Ce détail confirme la thèse centrale du darwinisme sémantique postulant la conservation des signes et codes et plus précisément, les codes utilisés par les protéines pour se déplacer, recevoir des signaux et activer des voies de signalisation.
Le SARS-CoV-2 confirme le détournement viral des voies de signalisation. Un virus n’a pas de moyen d’action sur les mécanismes cellulaires ; il ne fait qu’interférer avec les signaux, autrement dit, il utilise des codes pour détourner la cellule dans une direction. Le nouveau coronavirus désactive STAT1 et active STAT3, perturbant à la fois les réponses immunitaires et inflammatoires. La suractivation de STAT3 induit en cascade une suractivation des processus gouvernés par PAI-1 qui produisent une inflammation violente mais qui sont aussi activé à un niveau plus bas dans l’inflammation chronique. Ces deux voies de signalisation ont par ailleurs été impliquées dans le développement de cancers. Ces constatations penchent vers une approche commune entre les infections virales et les processus de dégénérescence. Même s’il est impropre de considérer le Covid-19 comme un cancer, il n’en reste pas moins que le virus induit une série de failles dans le maintien des identités et fonctions cellulaires. Et que ces failles sont liées à la constitution des patients, confirmant ce que nous savons depuis des lustres ; nous ne sommes pas égaux face aux pathologies. De plus, ces failles passent par des voies de signalisation impactées lorsque le virus se déploie ou alors le cancer émerge et prolifère. Les tissus perdent leur organisation, le chaos s’installe. En ce sens, le Covid et d’autres pathologies virales peuvent être considérés comme des cancers superficiels et éphémères, durant quelques jours à quelques semaines. Dans quelques cas d’infection, des pathologies aussi durables que le cancer sont observées, par exemple avec le Sida. Enfin, quelques agents infectieux, papillomavirus par exemple, induisent des cancers.
17) Les protéines virales interfèrent avec le système de transcription de l’hôte
Pendant trop longtemps, les virus ont été considérés comme des « créatures » darwiniennes dont le mécanisme est ajusté pour permettre la reproduction de ces agents considérés comme des parasites, à l’instar des bactéries qui elles, sont darwiniennes. Si un virus se réplique ce n’est pas pour survivre mais pour réaliser une fonctionnalité précise qui souvent, se traduit par des désordres pathologiques dans l’organisme hôte. Autrement dit, la réplication du génome viral n’est pas une fin gouvernée par le principe de sélection darwinienne classique mais un moyen. La réplication est un moyen permettant aux protéines virales d’être fabriquées et de générer un effet dans les cellules hôtes selon le tropisme. Le virus ne se contente pas de se reproduire, il génère des effets non pas avec son génome mais avec toute une série de protéines virales capables d’interférer avec les voies de signalisation et régulation de la cellule hôte. Parmi ces protéines, une classe peu étudiée a fait l’objet d’une revue récente dont l’objectif est de signaler un champ de recherche prometteur à l’image de la pointe d’un immense iceberg offert aux investigations futures. Les génomes viraux codent pour des protéines régulatrices pouvant moduler l’expression de gènes viraux mais des gènes contenus dans génome de la cellule hôte. Ces régulateurs transcriptionnels viraux vTRs interfèrent avec l’appareil de transcription ou alors indirectement, par la médiation de facteurs propres à la cellule hôte. Autrement dit, ils se lient directement aux acides nucléiques ou indirectement. Ils peuvent aussi interférer avec l’appareil de transcription ou alors modifier la structure de la chromatine (Liu, 2020). Plus de 400 vTRs ont été observés en étudiant une vingtaine de famille de virus. Ce sont les virus à ADN, herpes, pox, qui codent pour le plus grand nombre de vTRs, autour de dix facteurs, contre un à deux pour les virus à ARN. Rien d’étonnant, herpes et pox ont un génome de très grande taille. Et du reste, le « mode stratégique » imputé à un virus à ADN diffère de celui d’un virus à ARN, bien que ces deux modes visent à dévier les cellules hôtes de leur fonctionnement « régulier » en détournant les voies de signalisation et en interférant avec les expressions génétiques. Une cellule infectée par un virus se laisse détourner en étant complice de la stratégie virale. La veille immunitaire permet aux cellules hôtes de résister et contrer cette manœuvre de détournement. Parfois ça marche et d’autres fois, cela échoue. Les vTRs modulent la réponse immunitaire ou du moins la perturbent. C’est le cas de la protéine N que l’on pense impliquée dans l’inflammation pulmonaire consécutive à l’infection par la SARS (Liu, 2020). Les mécanismes liés au vTRs sont apparentés à des processus associés au cancer et aux pathologies dégénératives. Les infections virales ne se résument plus à une invasion d’un parasite dans un organisme. C’est tout autre chose. Un processus apparenté aux pathologies dégénératives et d’ailleurs, quelques virus causent des cancers alors que d’autres produisent des altérations importantes dans les tissus qu’ils infectent avec leur tropisme spécifique, variole, varicelle, rougeole, variole, polio, zona, herpes, Kaposi, hépatite, col de l’utérus etc. Les cellules hôtes sont désorientées par les protéines virales. Le génome viral n’est qu’une mémoire permettant aux protéines virales de jouer la partie, d’être fabriquées en vue d’un jeu moléculaire complexe que nous commençons à comprendre bien qu’il nous échappe encore. Les régulateurs transcriptionnels sont employés par les virus pour faciliter leur reproduction dans la cellule, en modifiant l’expression de centaines de gènes impliqués dans des processus fondamentaux du vivant, apoptose, division cellulaire, réaction immunitaire. Ces altérations sont soupçonnées de générer à moyen terme des pathologies secondaires alors que les virions ont disparu de l’organisme. Les facteurs protéiques viraux vTRs sont les empreintes de ces altérations. Serait-ce une explication du Covid durable ?
III. PROTEINES ET CODES VIRAUX, INTRODUCTION AU NOUVEAU PARADIGME DU DARWINISME SEMANTIQUE
18) esquisse d’un nouveau paradigme en virologie
a) Inventer un nouveau paradigme suppose deux risques à affronter. Celui d’énoncer des spéculations fantaisistes assorties d’explications défectueuses ; ou bien le risque d’enfoncer des portes ouvertes et de reformuler avec une terminologie différente ce qui est déjà connu, autrement dit, de mettre un lampadaire d’une lumière différente pour éclairer ce qui l’est déjà par le lampadaire utilisé depuis des lustres. L’idée que les protéines mènent le jeu n’est pas nouvelle en soi. Dans un petit livre paru avant l’an 2000, John Maynard-Smith opposait les deux grands courants en biologie du développement. L’un devenu classique (pour ne pas dire canonique) basé sur l’information génétique, les programmes, les instructions et l’autre plus systémique, fondé sur les mécanismes physiques, dynamiques, conduisant à l’auto-organisation (Maynard-Smith, 2000). Le paradigme que je propose n’oppose pas un univers d’information génétique à un univers protéomique fait de processus physiques auto-organisateurs (comme dans le paradigme de Prigogine). Il suggère que l’univers des protéines est lui aussi un monde dans lequel des informations circulent, des codes sont utilisés, les signalisations sont codées puis interprétés, décodées et même sélectionnés. Le darwinisme sémantique postule que les codes et formes sont sélectionnés s’ils ont utilisés, décodés et se propagent tels les quanta d’un champ systémique émergé complexe. Les codes procurent alors un avantage adaptatif. Les codes moléculaires du vivant sont ainsi à l’image des mots de nos langages qui persistent s’ils sont utilisés et disparaissent si on ne les emploie plus. C’est le principe du darwinisme sémantique. Les protéines du vivant cherchent à occuper un lieu et à former un champ dont les sources sont les noyaux cellulaires et plus particulièrement l’appareil ribosomique de traduction qui produit ces protéines. Le virion entre dans la cellule et grâce à ses codes protéiques permettant de hacker l’appareil ribosomal, il transforme la cellule en usine à virions. Le virion déstabilise également le noyau. Ce n’est plus la biologie du développement qui sert de cadre épistémologique pour concevoir le paradigme de la vie mais la virologie. Une science qui étudie comment la vie est un jeu sémantique, fait de codages et décodages, de fonctionnalités et fonctions régulées par les décodages, la signalisation, l’interprétation.
b) Les évolutionnistes moléculaires cherchent les origines de la vie en scrutant les archaea, les procarya, les virus, mais nous ne savons pas comment le SARS-CoV-2 a émergé, devenant pandémique. Une nouvelle compréhension des « finalités » virales se dessine et laisse penser que la vie est une articulation entre les sources réalisée par le moyen des champs de communications. Les cellules sont des agents reproducteurs qui se sont constitués à partir d’un colossal champ de quanta moléculaires dont les processus ont fini par acquérir une cohérence sémantique. Une cellule vivante est un agent qui maîtrise les codes moléculaires. Dans un organisme pluricellulaire, les cellules utilisent des médiateurs pour exécuter à chaque instant les fonctions de l’organisme (hormones, signaux électriques, signalisation, AMPc, GMPc, PIP2, calcium, kinases…) mais elles échangent aussi des informations plus complexes, des codes protéiques, des ARN, véhiculés par les exosomes.
Pour commencer cette investigation philosophique, écartons une idée reçue. Les virus sont présentés comme des agents infectieux. Le terme est impropre comme bien d’autres employés par commodité mais trahissant la signification profonde des réalités. Un virus n’a aucun pouvoir actif, il n’est qu’inductif, il produit un effet et c’est donc un effecteur. Il diffuse comme une poussière, véhiculé par les mouvements de l’air ou de l’eau. En revanche, la bactérie possède les clés du métabolisme et des cils vibratoires pour se déplacer ; elle est un agent infectieux, comme le sont également les parasites infectant animaux humains. Le virion est « capté » par une cellule puis déclenche un certain nombre d’effets, les plus connus étant la réplication du génome et la reproduction des virions à une échelle « industrielle ». Le virus répond au concept d’usine à virion selon Jean-Michel Claverie. Le concept est une définition formelle et synthétique d’un ensemble de processus, naturels ou sociétaux, se déroulant dans le temps et pouvant être des moyens en vue d’une fin. Est-ce que le virus a comme finalité de se reproduire en transformant la cellule en usine à virions ou bien ce procédé n’est-il qu’un moyen en vue d’une autre fin ? C’est l’une des questions centrales en virologie. L’autre question déterminante concerne le « jeu moléculaire » des génomes, gènes et protéines. Quelle finalité accorder aux virus ? Peut-on interpréter les protéines virales et le génome viral comme deux pôles distincts dont l’un serait considéré comme un moyen utilisé par le second comme une fin ?
L’idée d’une finalité ne garantit aucunement qu’elle repose sur une « essence » des choses naturelles. Elle est au minimum une idée régulatrice permettant de décrire des généralités, de communiquer entre scientifiques, avec parfois une puissance heuristique. C’est en quelque sorte une manière de raconter des histoires. En 1976, Richard Dawkins a publié la thèse du « gène égoïste ». Il a clairement précisé qu’il n’attribuait pas une volonté ou une intention aux gènes du vivant mais que les effets des gènes constatés dans la sélection naturelle étaient tels qu’ils le laissaient penser. Autrement dit, les gènes n’ont pas d’intention mais la sélection naturelle ne s’y prendrait pas autrement si elle était considérée comme un moyen dont se servent les gènes pour se reproduire et se perpétuer dans le temps. De plus, les gènes s’associent, se combinent, tels un collectif jouant une partie pour gagner ensemble. Les gènes seraient en quête d’éternité, ce qui en fait des sortes de divinités naturelles. Dawkins sait parfaitement qu’il a construit un mythe auquel il ne croit pas. En revanche, ce mythe a un intérêt herméneutique dans la mesure où il indique que les gènes occupent une place centrale dans le vivant et semblent être les maîtres du jeu.
Et si c’était l’inverse, les protéines interprétées comme maîtres du jeu ? Je me propose de renverser le mythe du gène égoïste à la lumière qu’apportent les connaissances sur les virus
19) Protéines et codes viraux troublent le jeu
a) Le « clivage » des protéines de surface virales n’utilise qu’un nombre réduit de convertases. Si les PCs ne sont pas les seules classes de protéases permettant d’activer les virus, en revanche, la puissance d’infection est assez bien corrélée au clivage par les PCs (Izaguirre, 2019). Un nombre considérable de virus infectieux disposent des codes pour entrer dans les cellules hôtes grâce à ces clivages. Les virus clivés par les PCs recouvrent les sept groupes répertoriés dans la classification de Baltimore basée sur l’organisation du génome. Les uns ont de l’ADN simple ou double, les autres de l’ARN double ou simple, avec deux polarités pour les simples. Les virus à ADN ont une ADN-polymérase avec ou sans l’ARN polymérase, et parfois, aucune polymérase. Les virus à ARN ont une ARN-polymérase d’un genre particulier car elle copie un génome ARN à partir d’un ARN. Ces observations laissent penser qu’un virus est caractérisé plus par ses protéines que par son génome.
Si le code génétique a pour principe un gène, une protéine, alors nous pouvons esquisser ce principe approximatif : des codes viraux, des tropismes, des fonctionnalités. L’infectivité virale est souvent corrélé à la présence d’un ou deux sites de clivage dans la protéine de fusion, ce qui permet au virion de pénétrer dans une cellule hôte sous réserve que cette cellule possède une protéine transmembranaire capable de reconnaître le code. Pour le SARS-CoV-2 deux protéases jouent ce rôle, la furine et la trypsine. C’est aussi le cas pour les virus grippaux. Si le code génétique est précis mais dégénéré (plusieurs codons correspondent à un acide aminé), le code des protéines est beaucoup plus dégénéré, autrement dit il est fortement redondant, avec des fonctionnalités protéiques pouvant être réalisées avec des centaines de codes sélectionnés au cours de l’évolution virale sémantique. Un virus infecte un ou plusieurs tissus. Le SARS-CoV-2 possède un triple tropisme, entérique, respiratoire supérieur, inférieur, sans oublier d’autres tropismes constatés à l’occasion des symptômes ; sur l’épithélium olfactif, sur les neurones, sur les cellules T. Ces tropismes pourraient être liés à une interaction avec la neuropiline. Les protéines de surface gouvernent cette partie du jeu viral consistant à entrer dans les cellules pour se servir de l’appareil de traduction afin de produire des virions en nombre, ce qui représente la seconde phase du jeu viral.
Si le virion pénètre dans la cellule, c’est que la cellule hôte lui ouvre la porte d’entrée et si elle le fait, c’est parce que ses protéines membranaires sont habilitées à effectuer différents décodages, pas seulement ceux des protéines virales. En ce sens, les convertases sont certainement des enzymes clivantes mais aussi des systèmes de décodage détectant des codes d’accès « écrits » à partir d’acides aminés présent sur les structures protéiques, y compris lorsqu’elles sont virales.
b) Les protéines et non les génomes représentent « l’essence des virus » Nicola Abrescia et ses confrères ont proposé d’étudier la classification et même la phylogenèse des virus en analysant les protéines et non plus les génomes. Est-il possible de comprendre de manière significative la diversité du monde viral ? Ils le pensent. Cette opinion est basée sur l’observation que, bien qu'il y ait une immense variation génomique, chaque virion infectieux est limité par des contraintes strictes dans l’espace représenté par la structure dimensionnelle des protéines virales (c’est-à-dire qu’il existe un nombre limité de façons de plier une chaîne protéique, et seul un petit sous-ensemble de pliages réalisés constitue le virion et signe la marque d’un virus). La structure permet de classifier les virus à une échelle de classification supérieure, lorsque les similitudes génomiques ne sont plus observables. (Abrescia, 2012). La recherche des similitudes sur les protéines virales majeures de la capside (MCP) permettent de construire un arbre phylogénétique plus étendu et inédit si on le compare à l’arbre construit à partir des génomes. Les structures protéiques en 3D peuvent avoir des similitudes malgré une homologie réduite en termes d’acides aminés. Le plus important n’est pas la séquence protéique mais la structure qui en résulte, la forme. Les protéines MCP sont des « empreintes digitales » permettant de tracer la phylogenèse des virus. Elles ont des caractères en communs, notamment des pliages générant des feuillets bêta s’associant alors pour constituer des cylindres bêta. Les MCP s’associent pour former des trimères et ceux-ci produisent des motifs hexamériques, par exemple sur les adénovirus. C’est en suivant ces empreintes, ces structures, en les repérant sur les virus, qu’il est possible d’établir un arbre phylogénétique différent de celui proposé par l’ICTV, comité international de taxonomie des virus (Ravantti, 2020). Ces considérations inclinent à revoir le concept de virus en ne le réduisant pas à une particule dont le génome se réplique une fois le virion entré dans la cellule hôte. Dans l’ancien paradigme, le génome viral se sert des protéines pour se répliquer. Dans le nouveau paradigme, les protéines se servent du génome viral pour étendre leur champ d’action moléculaire et produire leurs effets. Avec la complicité du système protéique hôte.
La littérature est riche d’observations sur le rôle des protéines structurales dans l’infectivité et la pathogénicité comme l’indique cette étude sur le ribovirus BTV transmis par les insectes et infectant les ruminants. « Dans les cellules infectées, la glycoprotéine 3 non structurale BTV (NS3) est associée aux membranes de l'hôte et aux trafics du réticulum endoplasmique à travers l’appareil de Golgi vers la membrane plasmique. Cela suggère un rôle pour NS3 dans la maturation des virions BTV et la sortie non lytique. Cependant, le mécanisme par lequel NS3 coordonne ces événements n'a pas encore été élucidé. Ici, nous avons identifié deux motifs polybasiques (PMB1 / PMB2), cohérents avec la fusion membranaire. » (Labadie, 2019). Les observations sur le lien entre les codes polybasiques et la virulence ne cessent de s’accroître. Ce lien concerne en premier lieu les virus à ARN comme en attestent les investigations ici présentées mais il pourrait être étendu aux virus à ADN. En une formule, les protéines mènent le jeu viral. C’est du moins ce qui se dessine.
Les virions occupent les cellules hôtes, détournent les noyaux et les ribosomes pour y installer des usines à virions se propageant à l’échelle tissulaire. Caetano-Anollés et deux confrères proposent eux-aussi de revoir la classification des virus et leur énigmatique phylogenèse en prenant comme critère le protéome. Autrement dit, en utilisant non plus les similitudes génétiques mais des motifs, structures et fonctionnalité permettant de tracer un arbre phyloprotéique, c’est-à-dire de tracer une ligne évolutive dans laquelle les clades sont des protéines censées avoir évolué à partir d’un ancêtre commun. Les biochimistes ont ainsi classé les protéines en familles et en superfamilles. Les histones ou les immunoglobulines sont regroupées en superfamille sur la base de leur structure. D’autres protéines affichent des similitudes mécanistiques, souvent reliées à des motifs structuraux, par exemple les phosphatases alcalines possédant un feuillet αβα ; chaque monomère possède cinq résidus cystéines, il incorpore deux atomes de zinc et un magnésium actif dans le mécanisme utilisé par les phosphatases. L’étude des familles protéiques permettrait de récapituler les origines et les évolutions des virus, car les structures protéiques résistent bien plus au changement et sont sélectionnées avec une pression largement supérieure à celle qui conserve les séquences complètes d’acides aminés et a fortiori, les séquences géniques (Mughal, 2020). La phylogénèse des protéines virale est assez récente. Elle indique que les séquences, structures et codes protéiques sont sélectionnés par l’évolution et qu’il existe une phylogenèse des formes protéiques comme le montre cette étude faisant apparaître les capsides comme les formes virales qui semblent construites à partir d’une forme ancestrales et dont l’apparition s’est faite à de multiples reprises, dans des lieux différents (Kuprovic, 2017). Bref, les capsides sont à l’image de la roue, cet élément technique qui est apparu dans plusieurs zones du monde, à de multiples reprises, pouvant être utilisé dans nombreux dispositifs techniques, poulie, char, moulin, meule, mécanismes de transmission, etc.
L’étude des virus géant depuis une quinzaine d’année a largement contribué au renouveau des théories développées en virologie. La biosémantique occupe une place marginale mais elle pourrait prendre un essor remarquable pendant la décennie 2020. Non seulement les structures protéiques mais aussi les codes et motifs sont des traces sémantiques permettant de remonter aux origines des virus ainsi qu’aux origines de la vie, avec les ribosomes, viriosomes et histosomes (voir plus bas), faisant émerger les grands règnes, bactéries, archées, eucaryotes puis les végétaux et les animaux. Les codes sont à l’image des mots du langage, ils sont sélectionnés et conservés parce qu’ils sont utilisés par les locuteurs.
20) Protéines, gènes et génomes
a) Les virus n’ont cessé d’interroger les scientifiques philosophes qui la plupart en ont fait une frontière ontologique permettant de scinder la nature en un monde inerte et un monde vivant. Le virus est-il une entité appartenant au monde vivant ? Oui affirme Patrick Forterre en reprenant le concept d’usine à virion cher à Jean-Marie Claverie et le concept de de « virocellule» permettant de placer les virus dans le monde vivant. Les virus sont considérés alors comme des organismes possédant un encodage génétique pour une capside, alors que les cellules sont considérées comme des organismes possédant un encodage ribosomique (Forterre, 2017). Une cellule possède un phénotype complexe déterminé par la traduction ribosomiale des ARN. La vie fonctionne avec la réplication des génomes et la production industrielle des protéines. Forterre évoque le plus petit virus connu qui ne contient que deux gènes, l’un encodant la réplicase et l’autre la capside. Ce virus est différent d’un simple plasmide, fragment d’ADN non indispensable à la cellule et capable de se répliquer dans les bactéries ou dans les cellules eucaryotes en se distinguant de l’ADN chromosomique. Le plasmide est considéré comme étranger à la vie mais pas le virus. Pourquoi l’addition d’un gène dans le virus change-t-elle notre manière de voir ? Cela est absurde nous dit Forterre dont je ne partage pas l’opinion. Je pense que la « collusion » entre le génome viral et la capside encodée est ce qui caractérise le vivant au sens moléculaire. Un virus est donc fondamentalement différent d’un plasmide.
Le monde des virus dévoile une connivence entre le génome et le protéome. Le schéma causal génome -> protéome -> phénotype, assorti d’une sélection naturelle, est une simplification trompeuse. Un virus est fondamentalement associé à une capside qui est par essence une protéine se liant aux acides nucléiques, comme le sont les protéines des sous-unités ribosomiales et les histones associées à l’ADN dans les archées et les eucaryotes. Sans oublier les protéines constituant le chromosome bactérien avec son génome circulaire. Le génome viral produit une protéine ou plusieurs protéines avec lesquelles il s’associe pour former une unité permettant de générer dans la cellule infectée une usine à virion, en se combinant avec les structures ribosomiales et les membranes du réticulum. Le virion utilise toutes les protéines dont il dispose pour installer son dispositif dans la cellule. Les protéines virales sont-elles les instances opérationnelles premières se servant alors du génome viral pour réaliser leurs fins ? Si un virus est contagieux par accident, il est infectieux par nature. Son succès dépend des codes sémantiques employés par ses protéines face aux codes des cellules hôtes qui sont détournés ou contournés. Les bonnes combinaisons et les codes efficaces sont sélectionnés, explicitant alors le darwinisme sémantique. Les protéines virales de l’enveloppe permettent au virion d’entrer dans la cellule, puis la nucléocapside conduit le génome viral vers sa destination. L’ARN viral parvient ribosomes, les protéines sont produite et les virions produits par l’usine sortent des cellules grâce aux protéines structurelles pour en infecter d’autres jusqu’à l’occupation de tissus entiers, autrement dit, des millions de cellules juxtaposées.
b) Les cellules échangent du matériel génétique en utilisant plusieurs mécanismes. Ces processus sont employés dans le règne animal et encore plus dans les milieux aqueux peuplés de bactéries, protozoaires, planctons, eucaryotes monocellulaires, avec la facilité de circulation et de rencontres entre partenaires disposant d’un génome. Les transferts horizontaux de gènes sont courants. Ils sont de trois types selon le mécanisme employé par deux cellules pour transférer un élément génétique, plasmide, transposon, fait d’ADN double brin. La transformation naturelle permet à une cellule d’acquérir un élément génétique circulant dans le milieu. La conjugaison nécessite un contact de cellule à cellule permettant un transfert transmembranaire entre la donneuse et la receveuse. La transduction utilise un vecteur supplémentaire, le virus, qui sort d’une cellule, diffuse et pénètre dans une autre cellule dans laquelle il transmet un gène qu’il a « piqué » sur la cellule donneuse. Un quatrième type a été explicité, la vésiduction (Soler, 2020). La vésiduction partage avec la transduction l’utilisation d’un véhicule mais si le virus produit avec ses gènes son propre véhicule, le gène échangé par vésiduction utilise un véhicule d’emprunt, autrement dit, il trouve une vésicule lui permettant de se glisser et de parvenir à la cellule receveuse. Ces processus sont courants, à la fois dans les milieux liquide et dans les tissus cellulaires. Ces vésicules ont été désignées exosomes.
Les ARN utilisent également les exosomes pour s’échanger entre cellules. Contrairement aux gènes constitués d’ADN et censé avoir une durée de vie étendue, les ARN sont des transcrits frappés d’obsolescence. Ils n’ont pas vocation à s’installer dans la durée. C’est du reste le principe des nouveaux vaccins à ARN dont la traduction en protéine antigénique a une durée limitée, car l’ARN est ensuite dégradé, à l’image d’une data utilisée transitoirement dans la mémoire vive de l’ordinateur puis effacée, contrairement au système d’exploitation qui lui, persiste sur le disque dur à l’instar de l’ADN génomique d’un organisme. Les ARN transmis par exosomes sont de plusieurs type, small, interférant, non codant ou messager. La conjecture des ARN est symétrique à celle des gènes ADN. Une transduction virale n’a rien de commun avec un transfert vésiculaire. Le virus à ARN produit les protéines qui lui permettent de circuler et d’autres permettant de transmettre ses directives épigénétiques ; il n’est pas un simple échange de données transcrites, il transforme la cellule en usine virale. Un ARN simple se dégrade rapidement alors qu’un ARN viral parvient à s’installer durablement dans l’hôte. C’est le cas du poliovirus, dont le génome est encodé dans un ARN à polarité positive et qui produit ses effets longtemps après l’infection.
21) Viriosomes, ribosomes, histosomes
Ce qui définit le virus, son identité biologique, c’est un ensemble de caractères formels et une fonctionnalité dont la cinétique dépend également d’une horloge biologique déterminant la vitesse de reproduction des virions. Le virus change l’identité de la cellule hôte, son phénotype, en la transformant en usine à virions. Le virion change le phénotype de la cellule hôte et la transforme en usine à virion. Tel serait le concept de virus selon Claverie. Mais l’inverse est tout aussi plausible. La cellule hôte dévoile l’identité du virus, gouverne sa chronologie et parfois, elle change l’identité du virus, son phénotype, son génotype, et c’est une nouvelle souche qui apparaît.
Le virus est une particule inerte dans les espaces physiques mais il prend les traits d’une particule vivante lorsqu’il pénètre dans un système vivant. Le virus est à l’image des phonèmes transmis dans l’espace sous forme de vibration par un humain. Ces phonèmes n’ont aucun effet si nul ne les entend, mais en revanche, ces phonèmes peuvent déclencher des réactions de grande ampleur s’ils sont entendus par une personne ou un groupe humain. Le virus infectant un hôte finit par se mélanger aux éléments cellulaires et induit des réactions de grande intensité. Le virus devient alors une usine à virion, dispositif co-construit avec les molécules cellulaires et les grandes structures que sont les ribosomes et les noyaux contenant les chromosomes et que l’on peut aussi désigner comme histosomes. Ce néologisme fait référence aux histones, ces protéines très conservées liées à l’ADN, comme les ribonucléoprotéines le sont à l’ARN ribosomal. Je propose enfin de désigner comme viriosomes les structures virales formées par les virions au sein des cellules hôtes. Le viriosome est un concept dérivé des concepts de ribosome et d’histosome. L’idée étant d’unifier ces trois structures en soulignant l’étroite association entre des acides nucléiques et des protéines. Histones, protéines ribosomales et nucléocapsides.
Le concept d’histosome indique qu’il existe une collusion – connivence entre les protéines nucléaires (histones) permettant le compactage de l’ADN et la structure repliée du génome. L’histosome serait alors un type de virus géant extrêmement sophistiqué. Le complexe {histone et ADN} représente une sorte de nucléocapside géante formant un virus doté de deux enzymes d’une importance majeure, l’ADN polymérase et l’ARN polymérase qui produit les transcrits à partir des gènes, avec pour les eucaryotes, des parties non codantes, introns éliminés lors de l’épissage et les exons, transcrits destinés aux traductions ribosomales. Il est possible de concevoir le noyau comme une structure dotée d’une enveloppe hébergeant de histosomes, autrement dit, des virus géants regroupés que la biologie nomme chromosomes. Ces « virus géants » disposent de deux polymérases mais aussi de protéines accessoires de toute petite taille capable de former avec de courts ARN des ribonucléoprotéines dont les rôles sont multiples, surtout dans les mécanismes d’épissage. On retrouve dans l’histosome la composition canonique du virus, génome à ADN, histones et protéines structurales y compris membrane nucléaire, protéines non structurales (les deux polymérases entre autres) et des protéines accessoires.
Le ribosome lui aussi ressemble à un virus composé de protéines ribosomales et d’éléments génomiques, les ARN ribosomaux (jouant un rôle structurel), qui à l’instar des génomes viraux se combinent avec des protéines ribosomales jouant un rôle symétrique aux nucléocapsides. Le ribosome héberge des protéines non structurales, considérée alors comme fonctionnelles, notamment les aminoacyl synthétases jouant avec les ARN de transferts. Le doublet synthétase -ARNt ressemble à une nucléocapside sauf que la synthétase est une protéine non structurale, donc fonctionnelle. Le ribosome est le virus le plus universel puisqu’il peut produire toutes les protéines. Il s’organise en structure complexe, avec la membrane du réticulum endoplasmique. Ces unités fonctionnelles supra-virales que sont les histosomes et les ribosomes utilisent des lignes Maginot membranaires pour protéger leurs processus de communication, pour laisser entrer les molécules possédant un code compatible avec la sémantique moléculaire et se prémunir contre les interférences sémantiques occasionnées par les éléments créant de l’entropie. Les plus connus de ces particules entropiques sont les virus. Scindés en deux types produisant des Viriosomes à ARN et des Viriosomes à ADN. Notons le caractère exclusif du génome viral, ou bien ARN ou bien ADN et jamais un génome mixte.
Les ribosomes et les histosomes sont des unités complexes, fonctionnelles, composées de protéines et d’acides nucléiques utilisant des codes pour s’assembler et opérer. Ce sont les protéines qui opèrent en utilisant l’énergie mécanique mais aussi transformante, véhiculée par les molécules élémentaires à phosphore (ATP, GTP). Ces unités sont désignées comme nucléoprotéosomes. Le virus se conçoit alors comme une particule se comportant dans la cellule comme un viriosome, c’est-à-dire un « nucléoprotéosome déchu » capable d’interférer avec les ribosomes et les histosomes. Pourquoi déchu ? Parce qu’il a perdu des composants fondamentaux, essentiels, lui permettant de se perpétuer, se diviser, se reproduire en quantité industrielle. Jean-Michel Claverie a analysé le processus de « déperdition génétique » expliquant comment certains virus finissent par laisser les gènes codant pour les polymérases, se reposant alors sur les enzymes de l’hôte pour se répliquer. Un virus est un histosome ou un ribosome qui a perdu des gènes, des composants ou alors qui n’a pas acquis les gènes pour participer au jeu de la vie. Le virus est un être vivant défectueux mais qui parvient à interférer avec le vivant en créant de l’entropie qui, si elle n’est pas surmontée, produit une dégradation voire une destruction du vivant, en se propageant dans les tissus des animaux complexes. Le jeu du kronos l’emporte sur le kosmos.
Que serait-ce un virus parfait, utile, fonctionnel et symbiotique ? Ne serait-ce point une mitochondrie ? Ces microvésicules synthétisent les carburants servant à la cellule. La mitochondrie possède un génome circulaire, comme la bactérie, compact, dépourvu d’exon, comme les virus, et de surcroît, un génome de taille virale, quelque 16500 nucléotides chez l’homme, soit la moitié d’un génome de coronavirus, ce détail faisant évidemment réfléchir au caractère compact du génome mitochondrial capable de produire une fonctionnalité aussi complexe. Le génome mitochondrial humain comporte 37 gènes, lesquels codent 13 protéines, 22 ARN de transfert et 2 ARN ribosomiques. Les gènes sont disposés les uns à la suite des autres, et ne sont séparés que par de courtes régions non codantes. Les gènes codant des protéines sont séparés les uns des autres par des gènes codant des ARN de transfert. Détail surprenant, l’ARN polymérase de mitochondrie est de type viral et non pas bactérien.
La mitochondrie fait figure de virus complet, possédant les gènes et les codes pour répliquer son ADN, fabriquer ses ribosomes, produire ses protéines, y compris celle qui constituent sa membrane, comme s’il s’agissait d’un virus enveloppé possédant une superstructure. En revanche, la mitochondrie a besoin des composants élémentaires pour fonctionner et se diviser, acides aminés, glucose, ions, acides gras. Si le génome mitochondrial s’avère complet pour réaliser la multiplication indéfinie de cet organite depuis des millions d’années, les virus géants sont incapables de réaliser cette prouesse malgré des gènes par centaines et des génomes de taille gigantesque. Les pandoravirus ont un ADN de quelque deux milliards de bases, soit plus de 100 fois la taille de l’ADN mitochondrial et pourtant, ils ne peuvent se reproduire qu’en infectant une cellule.
22) Sources et champs, virus géants, eucaryogenèse, protéo-sémantique
La conjecture des sources et des champs fut appliquée à l’électromagnétisme et à la cosmologie. Le principe est simple, les sources produisent les variations du champ et en retour, le champ indique aux sources comment elles doivent bouger. Champs et sources ont révolutionné la physique de Maxwell à Einstein. Cette conjecture s’applique aussi en biologie. Les sources font varier le champ sémantique en diffusant des signaux et en retour, ce champ est interprété par les sources qui réagissent. Expression complexe avec des gènes mobilisés, des traductions régulées, des voies de signalisation. La vie organisée est arrivée progressivement lorsqu’un ordre sémantique est apparu, autrement dit, lorsque des sources se sont constituées pour ordonner le champ sémantique et coordonner le champ opératoire des protéines. Pour faire simple, les histosomes sont du genre {source individuée, séparée, singularisée} et les virus sont du genre milieu, {champ, particules médiatrices, bosons du vivant}. Les sources sont exclusives et se comportent comme des fermions, les virus se comportent comme des bosons, ils se multiplient intempestivement tout en étant aussi exclusifs avec leur système utilisant une capside, soit simple, soit complexe, avec une enveloppe constituée de plusieurs éléments structuraux (c’est le cas pour les coronavirus et d’autres virus enveloppés). Le virus se conçoit comme une source secondaire capable d’interférer avec les sources primaires, organisées hiérarchiquement, que sont les ribosomes et les histosomes.
histosomes ↔ ribosomes (mitochondries) ↔ ↔ viriosomes
pôle des sources ↔ ↔ ↔ ↔ ↔ ↔ domaine des champs
La logique du vivant se conçoit comme un jeu de transformation où les histosomes et ribosomes se constituent alors que les dispositifs protéiques et membranaires entourent progressivement ces sources informationnelles, sémantiques et exécutives. Les membranes servent à protéger les sources des perturbations liées à l’environnement. Le noyau des cellules eucaryotes est interprétable comme une enveloppe virale alors que les histones forment avec l’ADN une sorte de nucléocapside géante. La thèse d’une origine virale des noyaux eucaryotes a été formulée par Philip Bell en 2001 et vient d’être reformulée à la lumière de la découverte des virus géants. Le noyau aurait une origine virale et c’est ce que confirme la découverte de structures quasiment histosomiales dans un nouveau virus géant, un medusavirus dont le génome contient des gènes pouvant coder des protéines spécifiques aux cellules eucaryotes (Takemura, 2020). Contrairement aux virus dits courants dont le génome est plutôt « spartiate », codant essentiellement une capside et une polymérase, les virus géants disposent d’un protéome extrêmement vaste avec des séquences protéiques dites orphelines car elles n’ont pas de correspondance dans les banques génomiques ; 93% des protéines du pandovavirus salinus sont orphelines (Brandes, 2020). La plupart des protéomes de virus géants n’ont pas de fonction connue. Une étude d’alignements partiels sur le protéome du mimivirus CroV infectant le plancton a montré que les protéines de ce virus ont de multiples similitudes avec les règnes du vivant. Plus précisément, 22% des motifs proviennent de bactéries, 45 % d’eucaryotes et le reste d’autres mimivirus. Ces données appuient la théorie du darwinisme sémantique. Les motifs et les codes sont sélectionnés. Autrement dit, la sélection moléculaire conserve les protéines structurales, fonctionnelles, et plus précisément, les domaines singuliers figurant sur les protéines, ainsi que les codes permettant aux protéines de s’associer, communiquer, s’identifier, déclencher des signalisations.
Il existe au moins trois types de signes. (i) Une Sémantique du tropisme permettant de circuler, s’assembler, façonner des membranes, des édifices, avec les protéines d’échafaudage et d’autres éléments constituant les capsides, les membranes cellulaires, les membranes intracellulaire, réticulum, Golgi, les enveloppes nucléaires, les éléments ribosomiaux, les composant du cytosquelette, les histones. Ce sont des codes topologiques. (ii) Une seconde sémantique gouverne la fonctionnalité, les techniques moléculaires, les causes efficientes, les opérations, kinases, phosphorylation, signalisation, transmission d’ordre, de signaux indiquant une action à effectuer, une séquence d’opération coordonnées (iii) Une troisième sémantique détermine l’identité, l’appartenance des protéines à un ensemble identitaire, un soi moléculaire ou cellulaire. Cette sémantique rend visible, génère des saillances, des traces, des marquages, une cohérence immunitaire, avec des codes imprimés ou bien effacés.
Au final, la collusion entre génomes et protéomes utilisée par les viriosomes fait que les protéines mènent le jeu, se combinent, se confrontent si bien que des codes et des structures sont sélectionnées avec les gènes qui les déterminent.
23) Evolution à la lumière des virus, un nouveau paradigme en biologie moléculaire et évolutive
a) Le monde des virus nous rapproche des processus ayant abouti pour faire émerger la vie. Il n’y a pas une mais deux évolutions. La première est la plus ancienne, elle concerne l’univers microbiologique, avec les archaea, procaryota, euraroyta, protozoaires, champignons unicellulaires et last but not least, les virus à ADN, incluant les virophages, les bactériophages et les virus géants. S’ajoutent à cette longue liste les virus à ARN qui, chez les animaux supérieurs et les humains, induisent des pathologies parfois sévères, et qui infectent aussi les bactéries, comme par exemple le bactériophage MS2 au génome très réduit, quelque 3500 bases, le dixième d’un génome de coronavirus. La seconde évolution commence avec la fusion de deux génomes lors de la reproduction sexuée dont on peut penser qu’elle est un puissant facteur d’évolution et de stabilisation des espèces. Les grandes avancées scientifiques émergent lorsqu’un savant introduit une hypothèse audacieuse (les quanta de Planck) ou relie des phénomènes épars (la gravité terrestre et céleste, Newton). Je propose de concevoir le virus comme une sorte de gamète très imparfaite, largement incomplète, mais capable d’infecter et de transformer une cellule ou un tissu. En ce sens, l’infection par un virion et la fécondation d’un ovule par un gamète mâle constituent les multiples faces d’un même processus protéo-génétique. Mais avec des différences colossales puisque la fécondation induit une suite de divisions cellulaires conduisant vers un organisme fonctionnel et abouti, alors qu’une infection virale ne produit qu’une altération cellulaire, parfois superficielle, étendue à un tissu qui devient difforme. L’infection virale est pour un organisme, un processus comparable à la tératogenèse qui est une déviation anarchique conduisant vers des tissus difformes, autrement dit, un organisme avorté, dévasté par une entropie, un désordre tissulaire.
Virions → viriosome → virocellules, transformation
Gamètes mâle → ovule → organisme, ontogenèse
Lors de l’ontogenèse sexuée, un génome mâle féconde un ovule femelle. On observe une hiérarchie dans l’organisation des gènes et des mécanismes cellulaires. La viriogenèse produit une transformation horizontale induite par les viriosomes et se propageant de cellule en cellule. Le virus perturbe l’ordre tissulaire. Le virus est un « germe transformateur » dont on ne connaît pas l’origine. Les cellules infectées produisent les virus qui ensuite diffusent accidentellement. Les tissus tentent de maîtriser leur capacité invasive et leur potentiel interférant ; c’est le rôle de l’immunité. L’inflammation est un second dispositif propre aux organismes constitués de tissus. L’inflammation répare et restaure l’intégrité physiologique des tissus.
b) gain de fonction, perte de fonction, les protéines des virus géants
La découverte des virus géants recèle une révolution scientifique. L’eucaryogenèse virale dit que le noyau des cellules eucaryotes ou plus exactement les histosomes ont une origine virale. Autrement dit, les noyaux sont des viriosomes ayant réussi à s’isoler, se perfectionner et devenir des sources centrales du vivant, régnant sur les viriosomes et les ribosomes. L’étude des virus nous conduit plus loin que l’eucaryogenèse. Les virus géants ont un génome de taille conséquente et codent pour 500 à 1500 protéines. Ils sont en quelque sorte des chromosomes dégénérés, ayant perdu des gènes indispensables au vivant. En revanche, malgré cette déperdition génétique, ces virus géants sont riches en gènes, bien plus que les virus canoniques occasionnant les pathologies classiques. Ils ressemblent à un manuscrit déchiré en morceaux, contenant des paragraphes alors que d’autres sont absents, ou alors ils sont à l’image de notices de montages incomplètes, capables de fabriquer des pièces du vivant alors que d’autres font défaut. Le protéome du virus CroV contient des gènes permettant de fabriquer des composants nécessaire à la traduction, une douzaine de protéines ribosomales, des ARNt synthétases, 22 gènes codants pour cinq ARN de transfert. La présence de ces gènes contredit le dogme canonique sur les virus dont un des caractères est l’absence de tout composant impliqué dans la fabrication des protéines. Des observations similaires ont été effectuées en étudiant d’autres membres de la famille des mimivirus (Brandes, 2020). Les virus se conçoivent comme des unités fonctionnelles mobiles, émanées du vivant, dont le caractère fondamental est de moduler les fonctions cellulaires en ayant perdu les fonctionnalités fondamentales. Les virus sont des « morceaux de vie » dégénérés, déchus de leur puissance formelle vitale.
24) Un nouveau paradigme, « gain » et « perte » de « fonction »
Cette étude mène vers un nouveau paradigme sur les virus et l’évolution. Brièvement, les protéines qui mènent le jeu des opérations alors que le génome est un texte comportant une notice de montage pour les protéines. Ce texte est recopié, soit par les cellules hôtes, soit par une réplicase fabriquée par le génome viral. Une hypothèse est possible ; elle énonce que le virus serait un histosome ou un ribosome ayant perdu des fonctions. En précisant que les fonctions sont doubles, opérationnelles et techniques, cognitives et sémantiques. La cellule infectée prend le contrôle du virus et parfois le perd, ce qui cause des pathologies. Aucun virus ne peut être étudié ni compris indépendamment des cellules hôtes qu’il infecte et transforme avec les viriosomes.
Depuis deux décennies, les virologues étudient comment un virus peut passer d’une espèce à une autre. Ces expériences sont désignées par le sigle GOF, gain of function. Un gain de fonction permet à un virus d’augmenter l’étendue de son tropisme. Inversement, une perte de fonction correspond à la suppression d’un tropisme ou alors, à une atténuation de la capacité contagieuse. En 2000, des Néerlandais ont modifié un coronavirus de souris pour en faire une chimère en utilisant des techniques de recombinaison d’ARN. Un domaine de la protéine S de ce virus a été remplacé par un emprunt à une protéine S de coronavirus félin. Le résultat a été spectaculaire. Le nouveau virus infectait les félins mais avait perdu sa virulence sur les souris (Kuo, 2000). Ces expériences réalisées en laboratoire ne sont-elles pas le modèle de ce qui se produit dans la nature ? Rappelons que Darwin s’est basé sur la sélection des bêtes par les éleveurs pour concevoir la sélection naturelle. En suivant un même ordre d’idée, la sélection des virus par les virologues conduit vers l’idée d’une sélection naturelle des particules protéonucléiques par gain de fonction. Ces particules du vivant habitent des espaces ayant fait sécession avec le milieu, ce sont les viriosomes, ribosomes et histosomes. Il reste à établir quelles sont les fonctions et qui mène le jeu moléculaire en sachant que l’hypothèse des protéines tient la route.
Le gain de fonction peut se concevoir comme un gain de puissance dans le domaine des opérations techniques, avec l’assemblage d’éléments jouant de manière coordonnée, ou alors comme une diversification de fonctions par une combinaison de différents types protéiques. De plus, cette évolution des particules vivantes se produit dans deux directions, augmentation ou diminution de fonction, addition ou soustraction de fonction. Une cellule vivante se conçoit comme une combinaison de fonctions qui sont modulables. Les diverses voies de signalisation utilisant le phosphore s’interprètent comme des « modulations de fonction » réalisées par des kinases ou des phosphatases ; autrement dit, activation ou répression de fonction.
La fonction moléculaire devient un élément central de la biologie et se superpose aux gènes et aux protéines pour concevoir au niveau élémentaire la vie cellulaire. Le virus est un ensemble nucléoprotéique fonctionnel qui pour fonctionner sur un mode vivant, opérationnel, transformant, formel, doit être complété par les fonctions de la cellule hôte. Tout repose sur les fonctions élémentaires et pour commencer, les étapes permettant de conduire le virion vers les ribosomes ou le noyau. Un coronavirus est enveloppé et dispose de la protéine S spécialisée dans la liaison au récepteur membranaire puis la fusion. La protéine N de la nucléocapside conduit le génome vers sa destination. En revanche, un rhinovirus n’est pas enveloppé et la circulation du génome repose sur les quatre protéines de la capside, VP1, VP2, VP3 et VP4. Ce virus est minuscule, 30 nanomètres, et son génome contient 7000 bases, ce qui ne l’empêche pas d’infecter les voies nasales supérieures avec une efficacité remarquable. Le rhinovirus produit une infection comparable à celle d’un coronavirus de type 229E bien plus complexe avec ses trois protéines constituant l’enveloppe, une quatrième formant la nucléocapside, 16 protéines non structurales plus quelques composants accessoires. Le virus se définit par ses protéines et leurs fonctions mésoscopiques. Le génome est alors l’élément pour transférer d’une cellule à une autre les différentes fonctions du virus.
Nous pouvons passer à l’étape de conceptualisation suivante en considérant les fonctions sous un angle formel et dynamique, autrement dit comme forme et puissance, à l’image de l’hylémorphisme aristotélicien basé sur la forme et la matière en sachant que dans la métaphysique d’Aristote, le substantif hylé (matière) peut tout aussi bien signifier le mouvement et dans une acception moderne, l’énergie au sens physique du terme. La cellule vivante est dotée d’une identité formelle fondée par une essence qui détermine la forme stabilisée de cette cellule, une forme réglée par les voies de signalisation sémantique canoniques. Le virus est une essence pouvant devenir une puissance de transformation lorsque les viriosomes se reproduisent dans la cellule, cette puissance se propageant tel un feu viral dans les tissus. Le virus rend difformes les cellules infectées.
Protéines et fonctions constituent un axe central du nouveau paradigme. Lorsqu’un gamète mâle entre dans un œuf, la fusion des deux génomes ou plutôt des histosomes, produit un gain de fonction, de puissance et un embryon en résulte car les fonctions métabolites sont codées et bien d’autres. En revanche, un virus ne possède d’une puissance réduite ; il est dépourvu des fonctions fondamentales, sauf la capacité à détourner le fonctionnement d’une cellule dans laquelle il entre à l’instar du gamète dans l’ovule. Le concept de fonction se développe dans plusieurs directions, gain de puissance et fonction ou diminution de puissance ; disparition, perte de fonction, apparition, émergence de fonction, combinaison, addition, soustraction de fonction, hiérarchisation des fonctions, les unes devenant moyens pour les autres assumant des finalités ; et enfin, fonction défectueuses. Comme ce peut être le cas lors d’une réponse systémique des fonctions immunitaires et inflammatoires après une infection par le coronavirus. La « mécanique virale » s’interprète en élargissant la notion de gain de fonction aux processus intracellulaires. Le virus peut générer un gain de fonction inflammatoire au sein de l’hôte, ce gain mobilisant alors la cellule qui en quelque sorte, s’affole, alors qu’en contrepartie, une diminution de fonction affecte la reconnaissance immunitaire qui devient inopérante face au virus. Ces phénomènes ont été étudiée, faisant notamment apparaître les régulations JAK/STAT (§16) mais aussi cet élément de signalisation faisant l’objet de toutes les attentions, le facteur STING, stimulateur d’interférons, impliqué dans l’immunité, l’inflammation mais aussi les pathologies auto-inflammatoires et le cancer.
Finalement qu’est-ce qu’un virus ? Si mon chemin de pensée est correct, un virus est une unité composite moléculaire véhiculant une fonction en puissance qui devient en acte lorsque le virion interfère avec la cellule et devient un viriosome ; cette fonction consiste à transformer une cellule ou un tissu en interférant avec les fonctions moléculaires et basiques des cellules hôtes. Les fonctions virales sont assurées par les protéines de la capside puis les composants fabriqués dans la cellule grâce aux instructions fournies par le génome. Le virus est donc une unité polymorphe fonctionnelle, doté d’un tropisme multiple permettant avec des codes protéiques (formés d’acides aminés) une adhésion, une entrée cellulaire et une circulation vers les ribosomes et les noyaux des cellules infectées. Le virus transforme une cellule en utilisant les codes pour détourner le fonctionnement « normal » de la cellule infectée. Réciproquement, il est concevable qu’une cellule puisse transformer un virus. Les scientifiques parlent de recombinaison, de mutation, en sous-entendant que c’est « la particule virale » qui se recombine. Il ne faut pas sous-estimer les interférences systémiques entre la « mécanique » cellulaire et la production des virions. Et surtout ne pas oublier que les dernières étapes de production des virions nécessitent une participation des mécanismes cellulaires étrangers aux éléments codés par le génome viral. C’est le cas de la glycosylation des protéines structurale ainsi que de la maturation des enveloppes virales avec la production de bicouches lipidiques réalisée grâce au procédés employés par les cellules hôtes pour fabriquer les membranes, qu’elles soient périphériques ou internes comme le réticulum endoplasmique ou l’appareil de Golgi.
Aucune théorie solide n’explique l’origine des virus. En me basant sur le paradigme des « protéines menant le jeu », un virus doit être considéré comme un protéogénome, autrement dit une unité composite dont l’élément fondamental et universel est une nucléocapside. Il n’y a pas de virus sans nucléocapside. En revanche, la plupart des virus sont plus complexes qu’une nucléocapside et sont composés d’une enveloppe formée de plusieurs types protéiques. Il est maintenant établi que la plupart des virus se caractérisent dans la famille des ribonucléoprotéines (génome ARN) ou alors des désoxyribonucléoprotéines (génome ADN). De plus, le virus grippal est segmenté et chacun des huit fragments est lié à une protéine. L’origine du virus reste incertaine. Dans le cadre du paradigme que je propose, l’origine n’est pas génétique mais protéonucléique ; autrement dit, un virus est un fragment de ribosome ou d’histosome qui s’est détaché et s’est transformé à la faveur d’usinages successifs réalisés par les cellules hôtes. Sans cellules il n’est point de virus. L’énigme des origines n’est pas résolue. Les virus géants indiquent des emprunts génétiques aux cellules infectées alors que les virus infectant les animaux disposent de gènes et protéines propres au virus, étrangers aux gènes utilisés par les espèces animales.
Ces observations imposent de distinguer deux mondes viraux, celui qui fonctionne au sein des espaces microbiotiques, infectant bactéries, levures et autres protozoaires et celui qui infecte les organismes pluricellulaires macroscopiques, animaux et végétaux. Les virus interfèrent avec le microbiote et sont sans doute utiles pour réguler ce milieu. Nos intestins remplis de bactéries possèdent également un virome régulant ce milieu. En revanche, les virus infectant les animaux ne paraissent pas avoir une utilité et devraient être considérés comme le résultat de défaillances vitales que l’on peut préciser comme étant des défaillances immunitaires. Ces défaillances sont endémiques dans les réservoirs d’espèces hébergeant les virus. Ce sont ces défaillances qui entretiennent les particules virales dont le tropisme finit par être sélectionné et parfois, le passage d’un virus dans une autre espèce produit une nouvelle souche capable de dévoiler les défaillances immunitaires. C’est ce qui s’est passé avec le premier coronavirus SARS en 2002, le MERS en 2012 et en 2019 le second SARS issu comme celui de 2002 d’un réservoir à sarbecovirus.
Si les virus ont pu jouer un rôle dans l’évolution microbiotique et l’émergence des organismes pluricellulaires, il est peu probable qu’ils aient participé à la progression des espèces. Leur mode accidentel et aléatoire de transmission en fait des « particules » parasites, source de désordre, de désorganisation. Sans doute, il y a bien longtemps, les cellules ont intégré des gènes viraux et c’est encore le cas dans le microbiote. En revanche, ce n’est plus le cas pour le monde animal dont le moteur évolutif est la reproduction sexuée. Les insertions de gènes viraux dans les organismes animaux sont l’exception. La Nature a inventé la reproduction sexuée pour booster l’évolution des espèces. Des génomes entiers s’échangent et se combinent.
L’infection virale s’interprète comme une « diversion pseudo-fécondante asexuée » réalisée par des unités protéogénomiques capables de modifier l’identité des cellules hôtes. Le virus n’est pas un parasite contrairement à une bactérie ou un champignon, dont la reproduction se fait à l’extérieur des cellules et qui ne changent pas l’identité des cellules hôtes. Une infection bactérienne est une invasion, une infection virale est une « diversion immunitaire ». La cellule infectée se trouve face à une confrontation sémantique dont le résultat sera un succès ou un échec pour le processus de diversion immunitaire. Le virus transforme le tissu ou bien la fonction immunitaire l’emporte, utilisant les procédés de reconnaissance et de défense.
25) Epilogue, l’immunité est un combat vital
Le gain de fonction obtenu par les virus s’interprète comme le résultat d’un principe explicité comme élan vital par Bergson, sauf que cet élan repose non pas sur une force mais une stratégie sémantique. L’élan vital est certes un principe de puissance mécanique mais il est aussi un principe de puissance sémantique, une puissance qui joue sur l’identité et l’immunité. La reproduction sexuée repose sur une puissance désirante ou du moins une affinité qui génère la rencontre des partenaires se reconnaissant à travers une identité. Elle est une source de stabilisation identitaire, elle permet la fixation des espèces, elle réduit la divergence génétique, la diversion. La reproduction sexuée est à l’origine des espèces. Elle représente une puissance conservatrice. Finalement, le virus est une unité sémantique faisant diversion et représentant une anomalie dans l’univers du vivant.
Les virus perturbent la vie. Or la vie est selon Peter Sloterdijk la phase de réussite d’un système immunitaire. Sloterdijk parle bien entendu de la vie sociale mais son propos visionnaire vaut autant pour la vie moléculaire et cellulaire. La vie est apparue lorsqu’un système immunitaire s’est constitué, permettant aux molécules et cellules de se constituer comme une cohérence sémantique, avec des codes et des structures, d’évoluer en utilisant de plus en plus de codes et de fonctions en sachant que les nouveaux codes peuvent détruire la cohérence du système. Grâce à l’immunité, cellules et organismes ont évolué en étant capables de se protéger face aux perturbateurs sémantiques tout en générant leur propre dispositif évolutif (recombinaison, transposons, reproduction sexuée) Les virus n’ont pas disparu, ils persistent sans qu’on ne sache s’ils sont utiles au vivant ou s’ils ne sont que des perturbateurs sémantiques faisant échec à la vie. Autrement dit, les virus empêchent le succès total et intégral de l’immunité.
Peut-être avons-nous dans ce chemin de pensée un sens incroyable sur le monde opératoire des virus et notamment le SARS-CoV-2. Si une cellule infectée reconnaît les virions comme des intrus immunitaires perturbant l’identité ne pourrait-on renverser la proposition et envisager que tout se passe comme si le virus avait sa propre identité et considérait la cellule hôte comme un adversaire immunitaire dont il faut de défaire. Pour les virions, les éléments ribosomiaux et histosomiaux sont considérés comme des éléments étrangers dont il faut se défaire. Ce que font du reste les virus en « neutralisant » parfois les dispositifs immunitaires de l’hôte. La vie est une lutte des essences qui sont aussi des puissances. Mais les essences sont aussi des identités et la vie se présente sous un angle identitaire. « Etre c’est lutter, vivre c’est vaincre » affirmait Le Dantec en 1906 dans le sillage du darwinisme. A l’ère post-darwinienne de l’information et des virus, vivre c’est aussi défendre son identité biologique, produire une immunité afin de conserver son identité, son être. En ce sens, les ravages induits par le SARS-CoV-2 s’interprètent comme une défaillance dans le combat immunitaire de la vie chez les patients gravement affectés.
Un philosophe facétieux pourrait noter que si le XXe siècle fut celui des gènes et des bactéries, le XXIe siècle sera celui des codes moléculaires, de la sémantique et des virus. Si en risquant l’abus de langage nous considérons le virus comme un ennemi, alors cet ennemi est sémantique. Un virus n’est au fond qu’un ensemble de codes qui se communiquent, se multiplient, se modifient, lorsque les virions infectent les cellules et même, ce sont les cellules qui participent à la fabrication de ces codes pouvant devenir plus efficace et jouer au gain de fonction sémantique, ce jeu étant en partie celui de la vie. Le jeu de l’immunité. Un jeu qui du reste a été transposé dans nos sociétés, avec la crise sanitaire du Covid, comme si chaque membre de la communauté des hommes était devenu lui-même un virus pouvant contaminer l’ordre sanitaire devenu un nouvel ordre immunitaire.
Après Darwin
L’étude transversale des virus a dévoilé un secret mal gardé sur la dynamique et les puissances en œuvre dans l’évolution. L’évolution repose sur une tension, une pression vitale en quête de gain de fonction et parfois, consentant à une perte de fonction lorsqu’elles deviennent un obstacle, un fardeau, inutiles à la survie. Les fonctions appartiennent à deux catégories, (i) technique, déclinées en mécaniques, métaboliques, architectoniques, (ii) cognitives, avec la déclinaison immunitaire. Les virus sont alors des particules privées des fonctions techniques mais conservant une fonction immunitaire. Les virus sont des particules immunitaires non vivantes mais capables de détourner le vivant. Les axes conceptuels se révèlent. Augmentation de puissance et gain de fonction. Puissance mécanique, technique mais aussi fonctions cognitives. Ce qui signifie puissance sémantique. Les virus ont une puissance sémantique, ce sont des unités protéonucléiques immunitaires capables de changer l’identité des cellules infectées avec l’usage de codes situés à la surface des protéines.
BIBLIOGRAPHIE
Abrescia N.G.A. et al. ; Structure Unifies the Viral Universe ; Annual Review of Biochemistry 2012 81:1, 795-822.
https://doi.org/10.1146/annurev-biochem-060910-095130
Barbosa I.C.R. et al. ; Phospholipid composition and a polybasic motif determine D6 PROTEIN KINASE polar association with the plasma membrane and tropic responses ; Development 2016 143: 4687-4700
https://doi.org/10.1242/dev.137117
Bouchard-Lévesque V. et al. ; Structure et fonction de la partie unique de la protéine VP1 du parvovirus porcin. In: Congrès Armand-Frappier, 6e édition, 5-7 novembre 2009, Bromont.
http://espace.inrs.ca/id/eprint/6073/1/36.pdf
Bouhaddou M. et al. ; The Global Phosphorylation Landscape of SARS-CoV-2 Infection ; Cell, 2020, 182, 3, 685-712. https://doi.org/10.1016/j.cell.2020.06.034
Braun, E., Sauter D. ; Furin‐mediated protein processing in infectious diseases and cancer ; Clinical & Translational Immunology, 2019 ; 8: e1073
https://doi.org/10.1002/cti2.1073
Coutard B. et al. ; The spike glycoprotein of the new coronavirus 2019-nCoV contains a furin-like cleavage site absent in CoV of the same clade ; Antiviral Res. 2020 Apr; 176.
https://doi.org/10.1016/j.antiviral.2020.104742
Diller J.R. et al. ; Rotavirus Species B Encodes a Functional Fusion-Associated Small Transmembrane Protein ; Journal of Virology Sep 2019, 93 (20)
https://doi.org/10.1128/JVI.00813-19
Dugué B. ; Information and the world stage, Wiley, 2017. (Dugué B. ; L’information et la scène du monde, Iste éditions, 2017)
Dugué B. ; Time, emergences and communications, Wiley, 2018. (Dugué B. ; Temps, émergences et communications, Iste éditions, 2017)
DuShane, J.K., Maginnis, M.S. ; Human DNA Virus Exploitation of the MAPK-ERK Cascade. Int. J. Mol. Sci. 2019, 20, 3427. https://doi.org/10.3390/ijms20143427
Follis K.E. et al. ; Furin cleavage of the SARS coronavirus spike glycoprotein enhances cell–cell fusion but does not affect virion entry ; Virology. 2006 Jul 5 ; 350(2): 358–369. https://dx.doi.org/10.1016%2Fj.virol.2006.02.003
Forterre, P. ; Viruses in the 21st Century: From the Curiosity-Driven Discovery of Giant Viruses to New Concepts and Definition of Life ; Clinical Infectious Diseases, 2017. Volume 65, Issue suppl_1, 15, pp. S74–S79, https://doi.org/10.1093/cid/cix349
Gordon, D.E., Jang, G.M., Bouhaddou, M. et al ; A SARS-CoV-2 protein interaction map reveals targets for drug repurposing ; Nature 583, 459–468 (2020). https://doi.org/10.1038/s41586-020-2286-9
Grant, B.M.M.; Enomoto, M.; Ikura, M.; Marshall, C.B ; A Non-Canonical Calmodulin Target Motif Comprising a Polybasic Region and Lipidated Terminal Residue Regulates Localization ; Int. J. Mol. Sci. 2020, 21, 2751.
https://dx.doi.org/10.3390%2Fijms21082751
Hara, H., Sakaguchi, S. ; N-Terminal Regions of Prion Protein: Functions and Roles in Prion Diseases. Int. J. Mol. Sci. 2020, 21, 6233.
https://doi.org/10.3390/ijms21176233
Izaguirre G. ; The Proteolytic Regulation of Virus Cell Entry by Furin and Other Proprotein Convertases ; Viruses. 2019 Sep; 11(9): 837. https://dx.doi.org/10.3390%2Fv11090837
Keck F., Ataey P., Amaya M., Bailey C. ; Narayanan A. Phosphorylation of single stranded RNA virus proteins and potential for novel therapeutic strategies ; Viruses. 2015 ; 7:5257–5273
https://dx.doi.org/10.3390%2Fv7102872
Krupovic M., Koonin E. V. ; Cellular ancestors of viral capsids ; PNAS. 2017, 114 (12) E2401-E2410. https://doi.org/10.1073/pnas.1621061114
Kuo L., Godeke G-J, Martin J. B. et al. ; Retargeting of Coronavirus by Substitution of the Spike Glycoprotein Ectodomain: Crossing the Host Cell Species Barrier; Journal of Virology. 2000, 74 (3) 1393-1406. https://doi.org/10.1128/jvi.74.3.1393-1406.2000
Labadie, T.; Jegouic, S.; Roy, P ; Bluetongue Virus Nonstructural Protein 3 Orchestrates Virus Maturation and Drives Non-Lytic Egress via Two Polybasic Motifs ; Viruses 2019, 11, 1107.
https://doi.org/10.3390/v11121107
Liu X. et al. ; Human Virus Transcriptional Regulators ; Cell (2020) REVIEW| 182 (1)1, 24-37.
https://doi.org/10.1016/j.cell.2020.06.023
Madu I.G. et al. ; Characterization of a highly conserved domain within the severe acute respiratory syndrome coronavirus spike protein S2 domain with characteristics of a viral fusion peptide ; J Virol. 2009 Aug;83(15):7411-21
https://doi.org/10.1128/jvi.00079-09
Matsuyama, T., Kubli, S.P., Yoshinaga, S.K. et al. An aberrant STAT pathway is central to COVID-19. Cell Death Differ. 2020 27, 3209–3225. https://doi.org/10.1038/s41418-020-00633-7
Maynard-Smith J. ; La construction du vivant ; Casini, 2000.
McBride R., van Zyl M., Fielding B.B. ; The Coronavirus Nucleocapsid Is a Multifunctional Protein ; Viruses. 2014 Aug; 6(8): 2991–3018.
https://dx.doi.org/10.3390%2Fv6082991
Millet JK, and Whittaker G.R. ; Host cell proteases: Critical determinants of coronavirus tropism and pathogenesis ; Virus Res. 2015 Apr 16; 202: 120–134.
https://dx.doi.org/10.1016%2Fj.virusres.2014.11.021
Mughal, F., Nasir, A. & Caetano-Anollés, G. ; The origin and evolution of viruses inferred from fold family structure ; Arch Virol. 2020. 165, 2177–2191. https://doi.org/10.1007/s00705-020-04724-1
Nan Y, Wu C and Zhang Y-J ; Interplay between Janus Kinase/Signal Transducer and Activator of Transcription Signaling Activated by Type I Interferons and Viral Antagonism. Front. Immunol. 2017. 8:1758. https://dx.doi.org/10.3389%2Ffimmu.2017.01758
Nao N. ; Genetic Predisposition To Acquire a Polybasic Cleavage Site for Highly Pathogenic Avian Influenza Virus Hemagglutinin ; mBio. 2017 Jan-Feb; 8(1): e02298-16. Published online
https://dx.doi.org/10.1128%2FmBio.02298-16
Nasir A., Romero-Severson E., Claverie J.M. ; Investigating the Concept and Origin of Viruses
Trends Microbiol. 2020 28 (12) 959-967
https://doi.org/10.1016/j.tim.2020.08.003
Nathan, K.G., Lal, S.K. ; The Multifarious Role of 14-3-3 Family of Proteins in Viral Replication. Viruses 2020, 12, 436. https://doi.org/10.3390/v12040436
Oikawa, D., Sato, Y., Ito, H., Tokunaga, F. ; Linear Ubiquitin Code: Its Writer, Erasers, Decoders, Inhibitors, and Implications in Disorders. Int. J. Mol. Sci. 2020, 21, 3381.
https://doi.org/10.3390/ijms21093381
Ravantti, J.J.; Martinez-Castillo, A.; Abrescia, N.G. Superimposition of Viral Protein Structures: A Means to Decipher the Phylogenies of Viruses. Viruses 2020, 12, 1146.
https://dx.doi.org/10.3390%2Fv12101146
de Rocquigny H, Rat V, Pastor F, Darlix JL, Hourioux C, Roingeard P ; Phosphorylation of the Arginine-Rich C-Terminal Domains of the Hepatitis B Virus (HBV) Core Protein as a Fine Regulator of the Interaction between HBc and Nucleic Acid ; Viruses. 2020, 12(7):738.
https://doi.org/10.3390/v12070738
Soler N., Forterre P. ; Vesiduction: the fourth way of HGT ; Environ Microbiol. 2020, 22(7) : 2457-2460. https://doi.org/10.1111/1462-2920.15056
Takemura M. ; Medusavirus Ancestor in a Proto-Eukaryotic Cell: Updating the Hypothesis for the Viral Origin of the Nucleus ; Front. Microbiol. 2020. 11:571831.
https://doi.org/10.3389/fmicb.2020.571831
Tscherne D.M. and García-Sastre A. ; Virulence determinants of pandemic influenza viruses ; J Clin Invest. 2011;121(1):6-13. https://doi.org/10.1172/JCI44947
Wang M. et al. ; SARS-CoV Infection in a Restaurant from Palm Civet ; Emerg Infect Dis. 2005 Dec; 11(12): 1860–1865. https://dx.doi.org/10.3201%2Feid1112.041293
Xu W, Wang M, Yu D and Zhang X ; Variations in SARS-CoV-2 Spike Protein Cell Epitopes and Glycosylation Profiles During Global Transmission Course of COVID-19 ; Front. Immunol. 2020, 11:565278. https://doi.org/10.3389/fimmu.2020.565278
Yamada Y, Liu1 D-X ; Proteolytic Activation of the Spike Protein at a Novel RRRR/S Motif Is Implicated in Furin-Dependent Entry, Syncytium Formation, and Infectivity of Coronavirus Infectious Bronchitis Virus in Cultured Cells ; J Virol. 2009 Sep; 83(17): 8744–8758.
https://dx.doi.org/10.1128%2FJVI.00613-09
Zhou H. et al. ; A Novel Bat Coronavirus Closely Related to SARS-CoV-2 Contains Natural Insertions at the S1/S2 Cleavage Site of the Spike Protein ; Current biology, 2020, 30, 2196–2203
https://doi.org/10.1016/j.cub.2020.05.023
NLMS
https://www.news-medical.net/health/What-is-a-Polybasic-Cleavage-Site.aspx
Matériel supplémentaire : séquences protéines
- Coronavirus, sites de clivage S1/S2
SARS-CoV-2
671 casyqtqtnsprrar↓svasqsiiaytmslgaensvaysnnsiaiptnfti
Spike OC-43 GenBank: QDH43726.1 (2019)
721 pinyfdsylgcvvnaynstaisvqtcdltvgsgycvdysktrrsrr↓aittgyrftnfepf
- Coronavirus humains : sites de clivage S’2
Bêta, SARS-CoV-ZJ0301 ; GenBank: ABA02260.1 (2003)
781 gfnfsqilpdplkptkr↓sfiedllfnkvtladagfmkqygeclgdinardlicaqkfngl
Bêta, SARS-CoV-2 ; GenBank: QIG55857.1 (2020)
801 nfsqilpdpskpskr↓sfiedllfnkvtladagfikqygdclgdiaardlicaqkfngltv
Bêta, H-CoV-HKU1 ; GenBank: AYN64561.1 (2018)
881 nidfksllgclgsqcgsssr↓slledllfnkvklsdvgfveaynnctggseirdllcvqsfngikvlppil
Bêta, H-CoV-OC43 ; GenBank: AIX10761.1 (2015)
881 gvnfnvddinfspvlgclgsecskassr↓saiedllfdkvklsdvgfveaynnctggaeir
Bêta, MERS-CoV ; PDB: 6Q04_A (2019)
881 gdfnltllepvsistgsrsar↓saiedllfdkvtiadpgymqgyddcmqqgpasardlica
Alpha, Corona NL-63 ; PDB: 5SZS_C (2016)
841 vlpqrnirssriagr↓saledllfskvvtsglgtvdvdyksctkglsiadl acaqyyngim
Alpha, H-CoV-229E ; GenBank: ABB90516.1 (2006)
661 vssfgdynlssvipslprsgsrvagr↓saiedilfsklvtsglgtvdadykkctkglsiad
III. Coronavirus mammifères
Bêta, Civette ; GenBank: AAU04646.1 (2005)
781 yktptlkdfggfnfsqilpdplkptkr↓sfiedllfnkvtladagfmkqygeclgdinard
841 tvlpplltddmiaaytaalvsgtatagwtfgagaalqipfamqmayrfngigvtqnvlye
Bêta, Pangolin ; GenBank: QLR06869.1 (2017)
781 yktppikdfggfnfsqilpdpskpskr↓sfiedllfnkvtladagfikqygdclgdiaard
841 licaqkfngltvlpplltdemiaqytsallagtitsgwtfgagaalqipfamqmayrfng
Bêta, chauve-souris, ZC45 GenBank: AVP78031.1 (2018)
761 iyktppikdfggfnfsqilpdpskpskr↓sfiedllfnkvtladagfikqygdclggisar
Bêta, chauve-souris, RatG13 ; QHR63300.2 (2020)
781 vkqiyktppikdfggfnfsqilpdpskpskr↓sfiedllfnkvtladagfikqygdclgdi
Bêta, chauve-souris, norbecovirus, HKU9-1, GenBank: ABN10911.1 (2006)
721 kitidcarylcgdssrclnvllhygtfcndinkalsrvstildsallslvkelsintrde
781 vttfsfdgdynftglmgclgpncgattyrsafsdllydkvritdpgfmqsyqkcidsqwg
841 gsirdllctqtyngiavlppivspamqalytsllvgavassgytfgitsagvipfatqlq
Delta ; Munia coronavrirus : YP_002308506.1 (2009)
661 ilsnkigek↓sviedllfnkvvtnglgtvdqdykacskdmaiadlvcsqyyngimvlpgvv
IV Parvovirus
Parvovirus canin, VP1 ; GenBank: ALC79644.1 (2015)
61 spadqrfidqtkdakdwggkighyffrakkaiapvltdtpdhpstsrptkptkrsrppph
Parvovirus (entérique) du vison, VP1 ; GenBank: ALO18548.1 (2016)
61 rfidqtkdakdwggkighyffrakkaiapvltdtpdhpstsrptkptkrskppphifinl
Parvovirus félin (entérique), VP1 ; GenBank: QOR32241.1 (2020)
61 spadqrfidqtkdakdwggkighyffrakkaiapvltdtpdhpstsrptkptkrskppph
Parvorivus (minute) de souris, VP1, GenBank: AAA69569.1 (1986)
61 saadqrfidqtkdakdwggkvghyffrtkrafapklatdsepgtsgvsragkrtrppayi
Parvovirus (aléoutien) du vison VP1; GenBank: ANC70145.1 (2017)
61 taeasggggg gggggggggg vgnstggfnn ttefkvinne vyitchatrm vhinqadtde
Bocaparvovirus félin, VP1 ; YP_008802582.1 (2013)
121 kyyfsrqyprkpkeaktnntdmgdaaelngvdggdgggqaragggggsgvggsgggghgv
- Pneumovirus non corona
RSV syncytial, protéine F ; GenBank: GenBank: AFM55332.1 (2012)
101 patnnrarrelprfmnytlnntkntnvtlskkrkrrflgfllgvgsaias
HMPV Métapneumovirus, F2 ; PDB: 5L1X_C ; (2016)
61 relrtvsadqlareeqienprqskkrkrr
VI Grippe
A(H1N1) HA ; GenBank: ACQ84451.1 (2009)
301 gaintslpfqnihpitigkcpkyvkstklrlatglrnvpsiqsrglfgaiagfieggwtg
A(H5N1) HA ; GenBank: BAE46949.1 (2005)
301 inssmpfhnihpltigecpkyvksnrlvlatglrnspqrerrkkrglfgaiagfieggwq
VII Protéine N
SARS-CoV-2 ; N ; GenBank: QJQ39988.1 (2020)
Bêta, sarbecovirus
1 msdngpqnqrnapritfggpsdstgsnqngersgarskqrrpqglpnntaswftaltqhg
61 kedlkfprgqgvpintnsspddqigyyrratrrirggdgkmkdlsprwyfyylgtgpeag
121 lpygankdgiiwvategalntpkdhigtrnpannaaivlqlpqgttlpkgfyaegsrggs
181 qassrsssrsrnssrnstpgssrgtsparmagnggdaalalllldrlnqleskmsgkgqq
241 qqgqtvtkksaaeaskkprqkrtatkaynvtqafgrrgpeqtqgnfgdqelirqgtdykh
301 wpqiaqfapsasaffgmsrigmevtpsgtwltytgaiklddkdpnfkdqvillnkhiday
361 ktfpptepkkdkkkkadetqalpqrqkkqqtvtllpaadlddfskqlqqsmssadstqa
SARS-CoV human ; N ; GenBank: AAP13445.1 (2003)
Bêta, sarbecovirus
1 msdngpqsnqrsapritfggptdstdnnqnggrngarpkqrrpqglpnntaswftaltqh
61 gkeelrfprgqgvpintnsgpddqigyyrratrrvrggdgkmkelsprwyfyylgtgpea
121 slpygankegivwvategalntpkdhigtrnpnnnaatvlqlpqgttlpkgfyaegsrgg
181 sqassrsssrsrgnsrnstpgssrgnsparmasgggetalalllldrlnqleskvsgkgq
241 qqqgqtvtkksaaeaskkprqkrtatkqynvtqafgrrgpeqtqgnfgdqdlirqgtdyk
301 hwpqiaqfapsasaffgmsrigmevtpsgtwltyhgaiklddkdpqfkdnvillnkhida
361 yktfpptepkkdkkkktdeaqplpqrqkkqptvtllpaadmddfsrqlqnsmsgasadst
421 qa
OC-43 ; N ; GenBank: AIL49482.1 (2013)
Embecovirus
1 msftpgkqsssrassgnrsg ngilkwadqsdqfrnvqtrgrraqpkqtatsqqpsggnvv
61 pyyswfsgitqfqkgkafefaegqgvpiapgvpateakgywyrhnrrsfktadgnqrqll
121 prwyfyylgtgpyakdqygtdidgvywvasnqadvntpadivdrdpssdeaiptrfppgt
181 vlpqgyyiegsgrsapnsrstsrtssrassagsrsransgnrtptsgvtpdmadqiaslv
241 laklgkdatkpqqvtkhtakevrqkilnkprqkrspnkqctvqqcfgkrgpnqnfgggem
301 lklgtsdpqfpilaelaptagafffgsrlelakvqnlsgnpdepqkdvyelryngairfd
361 stlsgfetimkvlsenlnayqqqdgmmnmspkpqrqrghkngqvendnisvavpksrvqq
421 nksieltaedisllkkmdepytedtsei
VIII protéine ORF6 des sarbecovirus
RaTG13 (2013)
mfhlvdfqvt iaeilliimr tfkvsiwnld yiinliiknl sksltenkys qldeeqpmei d
SARS-CoV-2 (2020)
mfhlvdfqvt iaeilliimr tfkvsiwnld yiinliiknl sksltenkys qldeeqpmei d
Rc-o319, GenBank: BCG66631.1 (2020)
mfhlvdfqit iaeilmmimr tfkvsilnld yiisvivrhl sksltenkys qldeeqpmet d
Pangolin GenBank: QIG55949.1 (2020)
mfhlvdfqvt iaeilliimr tfkvsiwnld yiinliiksl skpltenkys qldeeqpmei d
SARS Bat GenBank: ABD75318.1 (2004)
mfhlvdfqvt iaeiliiimr tfriaiwnld vlissivrql fkpltkkkyp qlddeepmel dyp
SARS Bat (HKU1) GenBank: QND76039.1 (2008)
mfhlvdfqvt iaeiliiimk tfrvaiwnld ilissivrql fkpltkknys elddeepmel dyp