Des chercheurs du CNIO revoient à la baisse l’estimation de la taille du génome humain

Toutes les séquences de notre ADN ne sont pas “codantes” et ne sont donc pas exprimées sous forme de protéine. La détection et la caractérisation des millions de gènes présents dans l’immense masse d’information représentée par les quelques 3 milliards de paires de base azotées qui composent notre ADN est une tâche extrêmement complexe, et qui continue encore aujourd’hui à faire débat depuis les tous premiers essais de séquencement systématique réalisés dans le cadre du Projet Génome Humain lancé en 1990.

Une étude dirigée par Alfonso Valencia, et Michael Tress du groupe de recherche Biologie Informatique Structurelle au CNIO, a récemment actualisé le nombre de gènes humains -qui sont traduits en protéines- à 19.000, soit 1 700 de moins que le dernier chiffre estimé, et un chiffre très inférieur aux 100.000 gènes estimés le Prix Nobel Walter Gilbert, de l’université Harvard, dans les années 1980 [1]. Ce travail, publié dans la revue Human Molecular Genetics, conclue que la quasi-totalité de ces gènes ont une origine antérieure à l’apparition des premiers primates il y a plus de 50 millions d’années.

Les scientifiques se sont basé sur des analyses protéomiques à grande échelle pour déterminer une “carte” des protéines humaines, à partir de laquelle identifier les gènes à l’origine de la production de ces protéine et ainsi vérifier leur existence. Pour cela, ils ont intégré les données de 7 précédents travaux de spectrométrie de masse -qui est l’outil le plus puissant de détection de molécules, qui avaient pour objectif l’identification de protéines provenant de plus de 50 tissus humains.

Les résultats obtenus ont mis en lumière un peu plus de 12.000 protéines que les scientifiques ont ensuite pu relier aux régions correspondantes du génome humain. Suite à cela, ils ont analysé des milliers de gènes qui apparaissaient dans d’autres bases de données mais pas dans leur étude. Il leur est alors apparu qu’un total de 1 700 gènes qui étaient considérés comme tel n’en était pas en réalité, pour différentes raisons. Une hypothèse dérivée de ce travail est que plus de 90% des gènes humains codant pour des protéines sont apparu chez des métazoaires ou des organismes pluricellulaires du règne animal il y a plus de 100 millions d’années.

Pour David de Juan, un des auteurs de l’étude, les chiffres obtenus indiquent que le nombre de gènes qui séparent l’homme de la souris (qui est apparue avant les primates sur l’échelle de l’évolution) pourrait être inférieur à 10. La source de la complexité de notre organisme réside d’avantage dans la manière dont nos gènes sont utilisés et dans les modifications chimiques qui affectent les protéines qui en sont issues, que dans leur nombre. Le projet international ENCODE, lancé en 2003, a également démontré que cette complexité réside aussi dans le contrôle de la production des protéines par des régions non codantes du génome – anciennement appelées “ADN poubelle” – qui constitue notre génome à 90%.

Les résultats de l’étude menée par le CNIO font partie des résultats de GENCODE, un consortium scientifique intégré au projet ENCODE, et auquel participent plusieurs groupes de recherche du monde entier, pour introduire les nouvelles annotations du génome humain [2]. Les données obtenues par l’équipe de Valencia sont actuellement étudiées par GENCODE pour être incorporées dans les nouvelles annotations.

[2] L’annotation d’un génome consiste à analyser la séquence nucléotidique qui constitue l’information brute pour en extraire l’information biologique. Cette analyse poursuit deux objectifs successifs, le premier est de localiser les gènes et les régions codantes et le second est, une fois ces gènes localisés, d’identifier ou de prédire leur fonction biologique.

 

Source: SINC-Un equipo del CNIO reduce el tamaño del genoma humano a 19.000 genes

Dans: Mathilde Arene – Chargée de Mission Scientifique, Ambassade de France en Espagne – mathilde.arene@diplomatie.gouv.fr