Révéler les Mystères de l’Organisation du Génome
Les génomes sont les fantastiques gardiens d’informations génétiques et sont le résultat de reproductions évolutionnaires, de mutations et sélections.
Les génomes organisent les fonctions au niveau cellulaire, par l’intermédiaire du niveau organismique, jusqu’aux bases complexes de l’esprit.
Dans les cellules humaines les informations génétiques contrôlant la plupart des processus du niveau cellulaire, de l’embryogenèse à la capacité cognitive, se manifeste dans un ensemble diploïde de 23 molécules d’ADN (chromosomes), combiné ils se composent d’environ 3x10E9 paires de base (bp) stockées dans environ 2.80 GB de données.
Ce génome entier, dont la somme moléculaire totale d’une longueur d’environ 2m, est maintenue dans un des plus petits noyaux de cellule avec un diamètre de 10µm, soit d’un volume d’environ 500 µm3.
L’organisation séquentielle du génome, c’est-à-dire les relations entre les paires de bases distantes et les régions à l’intérieur des séquences, et l’organisation architecturale tridimensionnelle du génome est toujours un problème en grande partie non résolu.
Correlizer a été créé pour démêler ces mystères. Nous avons trouvé des corrélations Longue portée / Loi de puissance sur presque l’entière échelle observable de 132 séquences complètes de chromosomes de 0,5 x 10E6 à 3,0 x 10E7 bp.
Passons d’Archaea, Bacteria, Arabidopsis thaliana, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Drosophila melanogaster, et Homo sapiens.
Les coefficients de corrélation locaux montrent un comportement spécifique d’espèce à différentes échelles : limité à des corrélations aléatoires sur l’échelle de quelques paires de bases, une première valeur limite de 40 à 3400 bp (pour Arabidopsis thaliana et Drosophile melanogaster divisé en deux sous-limites) et souvent d’une région d’une ou plusieurs valeurs maximales de 10E5 à 3 x 10E5 bp. Dans ce comportement à multi-graduation, une organisation supplémentaire est présente et attribuable à l’utilisation de codon sur tous, sauf sur les séquences humaines, où il se rapproche de la liaison Nucléosomal.
Les ordres aléatoires générés par ordinateur assumant une organisation de bloc des génomes, de l’utilisation de codon, et de liaison Nucleosomal expliquent ces résultats. La mutation par le remaniement d’ordre détruit toutes les corrélations. Ainsi, la stabilité des corrélations semble bien être contrôlée dans son évolution et connecté à l’organisation spatiale du génome, particulièrement sur des grandes échelles.
En résumé, nous avons constaté que les génomes montrent une organisation séquentielle complexe étroitement liée à leur organisation tridimensionnelle, qui a comme conséquence des aperçus complétement nouveaux dans les génomes. C’est important pour la compréhension générale des génomes, à partir desquels de nouveaux diagnostics et traitements peuvent être développés. Avec les techniques de séquencements modernes à grand rendement, des génomes entiers sont maintenant séquencés quotidiennement pour un très petit prix.
En réalité des milliers de génomes complètement séquencés remplissent les bases de données publiques. Par conséquent, l’analyse de l’ordre génétique devient de plus en plus importante aussi.