Présentation

biologie-moleculaire

Pseudo: mery AYCatégorie: ScienceDescription:
l'actualitée scientifique, des cours de microbiologie et de biologie generale,un espace pour des echanges scientifiques .
Recommander ce blog

Calendrier

Mars 2007
L M M J V S D
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  
<< < > >>

Recommander

Texte libre

Image aléatoire

1 2 3 4 5
Jeudi 15 Mars 2007

BCG : relancer des essais cliniques ?

Les souches de BCG utilisées pour la vaccination contre la tuberculose dans le monde n'auraient pas toutes la même efficacité. C'est la conclusion d'une étude menée par des chercheurs de l'Institut Pasteur, publiée aujourd'hui dans les " Proceedings of the National Academy of Science, USA ".

Plus de trois milliards d'individus ont été vaccinés avec le bacille de Calmette et Guérin (BCG), un dérivé atténué de Mycobacterium bovis, l'agent de la tuberculose bovine. Rappelons que le BCG est efficace pour prévenir les formes graves de la tuberculose chez l'enfant, mais que, chez l'adulte, la protection varie de 0 à 80% selon le pays. Il apparaît crucial aujourd'hui pour les chercheurs impliqués dans la lutte contre la tuberculose de comprendre les bases du pouvoir protecteur du BCG et donc d'étudier dans le détail les souches vaccinales.

L'étude réalisée par Roland Brosch* et ses collègues de l'unité de Génétique Moléculaire Bactérienne de l'Institut Pasteur, dirigée par le professeur Stewart Cole, en collaboration avec l'Agence des laboratoires vétérinaires à Surrey (G-B), et le Wellcome Trust Sanger Institute (G-B), visait à comparer différentes souches de BCG actuellement utilisées pour la vaccination anti-tuberculeuse dans le monde.

Le BCG avait été obtenu par les pasteuriens Calmette et Guérin par passages successifs, - ...pendant 13 ans ! -, de M. bovis sur des tranches de pommes de terre imbibées de glycérol, ce qui a conduit à une perte de la virulence de la bactérie (1921). Une fois son innocuité et son efficacité confirmées, le BCG fut ensuite distribué à travers le monde et maintenu par cultures successives dans différents pays. C'est la généalogie de toutes ces souches "filles" que les chercheurs ont réussi à établir aujourd'hui.

Ils ont en premier lieu obtenu la séquence totale du génome de la souche BCG Pasteur, ce qui leur a permis de comprendre certains facteurs de l'atténuation et de mener une étude comparative avec d'autres souches de BCG, qu'ils ont classées en deux catégories : des souches "précoces", - proches de l'ancêtre obtenu dans les années 20, dont certaines comme la souche Japon sont toujours utilisées pour la vaccination aujourd'hui - ; et des souches " tardives " distribuées plus récemment (Pasteur, Glaxo, Mérieux, Danoise....). Ces dernières montrent plus de variabilité génétique que les souches précoces.

"D'après nos observations, les souches précoces de BCG devraient conférer une meilleure protection que les souches tardives", souligne Roland Brosch. "Une étude immunologique parue très récemment avait d'ailleurs montré une meilleure réponse immunitaire chez des bébés vaccinés avec la souche Japon comparativement à la souche Danoise. Il nous paraît important que des essais cliniques soient menés afin de comparer l'efficacité des deux types de vaccins".

En 1996, trois souches "tardives" (Danoise, Glaxo et Pasteur) représentaient 66% des 335 millions de doses administrées dans le monde...

Les outils mis au point par les chercheurs vont permettre d'améliorer l'assurance qualité de la production du BCG, ce qui évitera les variabilités génétiques et immunologiques observées. Ils seront aussi précieux pour le suivi de BCG "recombinants", des BCG améliorés par voie génétique, actuellement à l'étude dans plusieurs laboratoires dans le monde, y compris à l'Institut Pasteur.


* Roland Brosch est lauréat du prix Georges, Jacques et Elias Canetti qui lui sera remis à l'occasion de la Journée Mondiale de la Tuberculose (voir communiqué).

Source :

- "Genome plasticity of BCG and impact on vaccine efficacity", PNAS on line, 12-16 mars 2007.
Roland Brosch (1), Stephen V. Gordon (2), Thierry Garnier (1), Karin Eiglmeier (1), Wafa Frigui (1), Philippe Valenti (1), Sandrine Dos Santos (1), Stéphanie Duthoy (1), Céline Lacroix (1), Carmen Garcia-Pelayo (2), Jacqueline K. Inwald (2), Paul Golby (2), Javier Nuñez Garcia (2), R. Glyn Hewinson (2), Marcel A. Behr (3), Michael A. Quail (4), Carol Churcher (4), Bart G. Barell (4), Julian Parkhill (4) et Stewart Cole (1)

1. Unité de Génétique Moléculaire Bactérienne, Institut Pasteur, Paris, France
2. Veterinary Laboratories Agency, Surrey, United Kingdom
3. McGill University Health Centre, Motréal, Canada
4. The Wellcome Trust Sanger Institute, Cambridge, United Kingdom

© News Press 2007

le 14-03-2007 12:18 | émis par : Institut Pasteur

catégorie : Associations et groupements

thème : Santé/ Médecine / Science/ Recherche

zone : 75-PARIS

Mercredi 14 Mars 2007

Un consortium de recherche international a entrepris de séquencer le génome de deux bactéries du groupe Polynucleobacter necessarius. Le but ? Comprendre la fonction écologique de ces dernières, et en apprendre plus sur l'évolution des bactéries.

De fait, les deux bactéries parentes, bien qu'appartenant à la même espèce, ont des modes de vie radicalement différents. L'une, endosymbiotique, vit en symbionte au sein de cellules de ciliés (ou ciliophora : protistes évolués, également appelés infusoires), et ne peut survivre hors de ces cellules-hôtes. L'autre, hétérotrophe, vit en toute indépendance, et prolifère dans les eaux de surface. Par ailleurs, cette seconde espèce a un rôle écologique important, compte tenu de sa distribution : des eaux douces non polluées, de tout type, peuvent contenir jusqu'à un milliard de ces bactéries par litre ; Polynucleobacter necessarius représente ainsi 60% du nombre de bactéries présentes dans les eaux douces pélagiques, et l'espèce a également été repérée dans des eaux souterraines.

Le projet, lancé par l'Académie autrichienne des sciences, est coordonné par Martin Hahn, de l'Institut de limnologie. Il réunit des scientifiques autrichiens (Martin W. Hahn), allemands (Wolfgang R. Hess, Université de Fribourg), italiens (Giulio Petroni, Université de Pise) et américains (Eric W. Triplett, Université de Floride et Katherine D. McMahon, Université de Wisconsin-Madison). Le Joint Genome Institute, propriété du Département américain de l'énergie, se chargera du séquençage, pendant que les autres scientifiques analyseront et compareront les génomes obtenus, pour y découvrir les modifications génétiques ayant permis l'adaptation de la bactérie à des modes de vie si distincts. Quant à Martin Hahn, il étudiera d'abord le métabolisme de la bactérie hétérotrophe et ses échanges avec le milieu, afin de cerner leur impact environnemental sur les eaux. La contribution de Polynucleobacter au cycle du carbone et au réchauffement climatique pourra alors être estimée.

Contacts : Martin W. Hahn, Institut für Limnologie, Österreichische Akademie der Wissenschaften, Mondseestraße 9, A-5310 Mondsee - tél : +43 6232 3125 29, fax : +43 6232 3578 - martin.hahn@oeaw.ac.at - www.oeaw.ac.at/limno/
Sources : APA 02/08/2005, JGI
Mercredi 14 Mars 2007
 

Evolution des génomes


Le génome des tres vivants a fortement évolué depuis l'apparition des premiers organismes. Il s'est progressivement différencié par sa taille, sa constitution et sa composition en nucléotides. A part pour certains procaryotes ou certains virus, le contenu et la composition exacte des génomes sont mal connus. On ne connait aussi qu'approximativement la fonction exacte d'une grande partie de l'ADN. Il est ainsi difficile de comparer des génomes d'espèces différentes, sauf pour quelques gènes homologues, les caryotypes, et la taille des génomes

Des efforts de recherche considérables sont actuellement portés sur la détermination de la séquence complète de certains organismes pour préciser l'organisation interne de leur génome ainsi que le nombre et l'emplacement des gènes.

Nous allons procéder ˆ la comparaison entre les génomes des procaryotes et des eucaryotes, ainsi qu'ˆ l'étude des mécanismes ˆ l'origine de ces différences.


Taille des génomes

On observe une extraordinaire variabilité de la taille des gémomes des organismes vivants. La taille haploide d'un génome est appellée valeur C, ou facteur C. Le C désigne une valeur Constante ou Caractéristique d'un génome d'une espèce donnée. Cette mesure est commode car elle est comparable entre organismes haploides et polyploides. La taille des génomes des eucaryotes est devenue considérablement plus grande que celle des procaryotes, grˆce ˆ différents mécanismes permettant l'augmentation de taille du génome.

Mesures

Il existe différentes mesures de la taille d'un génome. La taille est souvent exprimée en paires de bases (pb ou bp), en milliers de paires de bases ou kilobases (Kb), ou en picogrammes (poids). Un picogramme correspond approximativement ˆ 1 millions de Kb.

Exemples

  • Bactéries : La taille des génomes bactériens varie de ~ 650 Kb (mycoplasmes) ˆ ~13'000 Kb (cyanobactéries)
  • Eucaryotes : La valeur C varie de 8'800 Kb (champignons) ˆ 690 millions de Kb (amibes), soit un rapport de près de 80'000 ! Notez qu'il existe souvent une forte variabilité de la valeur C ˆ l'intérieur de chaque taxon. Les plus fortes variabilités sont observées dans l'ordre chez les protozoaires, les plantes et les animaux. Il existe cependant quelques groupes peu variables pour la valeur de C, soit les éponges, les mammifères, les reptiles et surtout les oiseaux.

Constitution des génomes

Dans les génomes on fait la distinction entre une portions ˆ fonctions spécifiques (gènes) et une portion apparemment aspécifique (ADN non génique).

Par gène, on entendra ici une portion d'ADN génomique qui est essentielle pour une fonction spécifique.

On peut considérer (entre autres) 3 types de gènes:

  • Gènes codant pour des protéines
  • Gènes spécifiant des ARN
  • Gènes de régulation
    • Gènes de réplication: Spécifient les sites d'initiation et de terminaison de la réplication de l'ADN.
    • Gènes de recombinaison: Sites de reconnaissance spécifique pour des enzymes impliqués dans la recombinaison.
    • Gènes de ségrégation: Sites d'attachement des chromosomes pendant la mitose ou la méiose.
    • Sites d'attachement pour des protéines, des hormones, des acides nucléiques, ou d'autres molécules.

Constitution du génome des bactéries

La plupart de l'ADN des bactéries a une fonction spécifique, mais le génome des bactéries est composé d'un petit nombre de gènes.

Exemple:

Mycoplasme

  • Environ 470 protéines incluant 50 protéines ribosomales
  • Deux jeux de gènes ribosomiques
  • Environ 33 gènes spécifiant des ARN de transfert

Soit environ 500 gènes, ce qui semble constituer un minimum pour avoir une vie autonome.

Mais généralement, chez les bactéries, le nombre de gènes varie entre 500 et 8'000 (voir limites du nombre de gènes). Ces gènes n'ont généralement pas d'intron.

On a aussi observé que la taille des génomes bactériens ne semble pas distribuée de faon continue, mais de faon discrète. On en a déduit que le génome des bactéries aurait évolué ˆ partir de petits génomes par une succession de duplication globales des génomes qui se seraient produites plusieurs fois au cours de l'évolution dans plusieurs lignages, vraisemblabement après l'apparition de l'oxygène sur la Terre (il y a ~ 2 milliards d'années).

Constitution du génome des eucaryotes

La taille des génomes des eucaryotes est généralement plus grande et plus variable que celle des procaryotes.

Ces différences sont essentiellement dues ˆ la nature répétitive du génome des eucaryotes.

Cependant, bien que l'on observe un accroissement du nombre de gènes entre les procaryotes et les eucaryotes, cet accroissement est proportionnellement bien inférieur ˆ celui de la taille du génome, il y a donc plus d'ADN que nécessaire pour les besoins des gènes. Ce phénomène est appellé paradoxe de la valeur C. En conséquence, il semble bien que la majorité du génome des eucaryotes n'a pas de fonction spécifique et qu'il est apparu indépendemment des besoins de l'organisme.

Nature répétitive du génome des eucaryotes

Une proportion très importante du génome des eucaryotes est formée d'ADN répété, mais la proportion d'ADN répété est variable selon les lignages.

  • Levure: ~ 20%
  • Mammifères: jusqu'ˆ 60%
  • Plantes: jusqu'ˆ 80 %

Par des techniques classiques de réassociation de brins d'ADN, on distingue grossièrement 4 fractions dans le génome des eucaryotes supérieurs.

  1. ADN autohybridant ("foldback")
    • 5 ˆ 10 % du génome
    • Palyndromes, formant des structures en épingle ˆ cheveux.
  2. ADN très répété
    • 10 ˆ 20 % du génome
    • Courtes séquences d'ADN (quelques nucléotides ˆ quelques centaines de nucléotides).
    • En moyenne répétées 500'000 fois.
  3. ADN moyennement répété
    • 20 ˆ 30 % du génome
    • Quelques centaines ˆ quelques milliers de nucléotides
    • Quelques centaines de copies
  4. ADN non répété
    • 40 ˆ 70 % du génome
    • Copies uniques

    Seule une partie de cet ADN est transcrit et éventuellement traduit en protéines. On estime qu'~ 3% de la portion de l'ADN non répété est transcrit dans une cellule donnée, ce qui correspond ˆ ~ 1 ˆ 2 % du génome total (notez toutefois que seule une partie des gènes codants sont transcrits dans une cellule donnée).

    On estime qu'il y a environ 50 ˆ 150'000 gènes fonctionnels chez les mammifères, correspondant ˆ environ 50 ˆ 150 millions de nucléotides, soit près de 5% du génome total.

    Cependant, tous les gènes transcrits ne sont pas dans la fraction non répétée, comme par exemple:

    • Gènes des histones
    • Gènes spécifiant les ARN
    • Familles multigéniques (HLA, Immunoglobulines, Globines, etc...)

Séquences répétées localement

Généralement, il s'agit de répétitions de séquences d'ADN les unes ˆ la suite des autres (en tandem). On les appelle aussi "tandem repeats" ou ADN satellite, et il existe différentes familles de séquences répétées en tandem ˆ travers tout le génome. Les séquence microsatellites, STR (Short tandem repeats), et minisatellites sont des exemples de séquences répétées en tandem.

Dans une espèce, le nombre de répétitions peut fortement varier d'un individu ˆ l'autre, mais semble tre transmis de faon mendélienne. C'est ce polymorphisme du nombre de répétitions de ces séquences qui est utilisé pour réaliser des empreintes génétiques.

Elles peuvent constituer une fraction importante du génome de certaines espèces (ex: Rat kangourou)

Exemple: Séquences répétées chez le rat kangourou

Environ 50% du génome du rat kangourou est constitué de 3 séquences répétées:

Séquence répétée

Nombre de répétitions
(en millions de nucléotides)

AAG

240

TTAGGG

220

ACACAGCGG

120

Localisation

Ces séquences sont généralement trouvées sur tous les chromosomes (exception: Drosophila nasutoides o 60% de son génome est de l'ADN satellite localisé sur le mme chromosome)

R™le

Le r™le fonctionnel de ces séquences est inconnu. On pense cependant que ces séquences n'affectent pas la fitness de leur porteur

Séquences répétées dispersées

Certaines séquences d'ADN très répétées sont dispersées sur l'ensemble du génome. On les trouve partout, dans les régions géniques, intergéniques, mme dans les introns. Elles sont groupées dans 2 classes principales:

  • SINEs (Short interspersed repeated sequences)
    • Longueur : < 500 pb
    • 100'000 copies

    La plupart sont des rétroséquences dérivées d'un processus de réverse transcription de l'ARN par une réverse transcriptase.

    Exemple: Famille Alu chez l'homme.

    300 pb, répétées environ toutes les 6'000 nucléotides tout au long du génome

  • LINEs (Long interspersed repeated sequences)
    • Séquence répétées longues de plus de 5 Kb
    • Environ 10'000 copies ou plus

    Exemple: Famille L1 chez l'homme.

    • Seule LINE connnue chez l'homme.
    • Longueur : ~ 6 Kb
    • ~ 100'000 copies

    Cette séquence contient 2 cadres de lecture ouverts: ORF1 : 373 codons, et ORF2: 1'300 codons (peut tre une réverse transcriptase)

    Suggère que cette séquence est produite par réverse transcription d'ARNm (rétroposon)

Paradoxe de la valeur C

La présence de nombreuses séquences répétées chez les eucaryotes peut donc expliquer la taille plus importante de leur génome par rapport ˆ celui des procaryotes. Mais entre les eucaryotes, il n'y a pas nécessairement de correspondance entre le nombre de gènes présent chez un organisme quelconque et la taille de son génome haploide (valeur C). Ce paradoxe est largement dž ˆ la présence de larges portions d'ADN non génique chez les eucaryotes.

Conséquence

La taille du génome d'un organisme n'est un bon estimateur ni de sa complexité ni de son degré d'évolution

Exemple

Il y a 50 fois plus de gènes chez les mammifères que chez l'un des organismes les plus simples, le mycoplasme, alors qu'il y a 3'000 fois plus d'ADN.

Note: Le nombre de gènes semble tre toutefois corrélé avec la complexité structurelle des organismes, mais pas forcément avec la taille de leur génome. Par contre, on trouve une corrélation entre le nombre de gènes spécifiant les ARN et la taille des génomes.

R™le de l'ADN non-génique

On a vu que souvent l'ADN non-génique constitue la majorité de l'ADN chez les eucaryotes. On peut donc légitimement se demander quel est son r™le.

Il y a plusieurs explications possibles

  1. Il aurait certaines fonctions essentielles, il serait notamment nécessaire pour la régulation globale de l'expression des gènes.
  2. Il serait inutile ("junk DNA"). Il serait alors porté passivement par les chromosomes, et il n'affecterait pas la fitness des individus.
  3. Il serait un parasite sans fonction, un ADN égoiste, qui se multiplierait sans se soucier de son h™te, le plus souvent par transposition.
  4. Il aurait une fonction nucléotypique, sans lien avec la t‰che de support d'information. Il agirait comme une sorte de nucléosquelette qui déterminerait le volume celulaire (les cellules sont plus grosses chez les polyploides). La sélection agirait sur la quantité d'ADN, et non sur son contenu.

On pense actuellement que la grande majorité de l'ADN non-codant est bien aspécifique.

Que se passerait-il s'il en avait une ? Cela impliquerait que le nombre de gènes présents dans le génome serait bien plus grand qu'on ne le croirait !

Limites du nombre de gènes pour un organisme: Fardeau génétique

S'il se produit des mutations dans une région soumise ˆ sélection, ces mutations ont de grandes chances d'tre désavantageuses et de réduire la fitness de l'individu et de la population o elles se sont produites. En fait, ˆ long terme, pour des mutations dominantes se produisant ˆ un taux u par génération, la fitness moyenne relative d'une population diploide devient

,

o le facteur 2u peut tre considéré conmme un fardeau de mutation qui représente la baisse de la fitness moyenne due aux mutations défavorables.

Si l'on considère n locus indépendants o le mme phénomène se produit simultanément, la fitness de la population devient

Exemple

Chez l'homme, on fait l'hypothèse qu'il existe environ 100'000 gènes codant pour des protéines, o l'on a un taux de mutation de u ~ 1x10-7 par gène par an (soit ~ 2x10-6 par génération). La fitness moyenne sera donc de

,

soit une réduction de la fitness d'un tiers par rapport ˆ une situation o il n'y aurait pas de mutation.

Que se passerait-il si l'on avait un million de gènes ?

La fitness moyenne de la population deviendrait inférieure ˆ 2%, soit une situation o près de 98% des individus seraient éliminés ˆ cause du fardeau de mutation. Cela ne serait pas supportable pour la majorité des organismes.

Notez que ces calculs sont valables sous l'hypothèse de l'indépendance des gènes, ce qui est loin d'tre le cas. Cependant, il semble bien que le nombre total de gènes qu'un organisme puisse tolérer soit soumis ˆ sélection.

Cela implique que pour qu'un organisme puisse augmenter le nombre de gènes qu'il porte sans porter atteinte ˆ la fitness de la population, il doit trouver un moyen pour diminuer le taux global de mutation ou alors ces nouveaux gènes doivent conduire ˆ une augmentation de la fitness moyenne maximum possible de la population.


Mécanismes permettant l'augmentation de la taille des génomes

Ils sont de deux types:

  1. Augmentation globale de la taille du génome
  2. Augmentation localisée de la taille du génome

1. Augmentation globale de la taille du génome par duplication

La duplication entière du génome d'un organisme est une cause majeure de l'augmentation de la taille des génomes des procaryotes aux eucaryotes.

Mécanisme

Non ségrégation des chromosomes fils lors de la méiose

Conséquence

Les gamètes ont la mme ploidie que les cellules somatiques.

On pense que ce mécanisme a été important au cours de l'évolution, car on constate, comme chez les bactéries, que certaines familles d'eucaryotes présentent des espèces o les tailles des génomes sont distribuées de faon non continue. Chez les plantes, en particulier, les polyploidisations sont fréquentes. Elles ont souvent lieu lors de phénomènes d'hybridisation. C'est un mécanisme efficace pour créer de nouvelles espèces en cas d'autofécondation (voir la partie du cours sur la sélection diversifiante).

2. Augmentation localisée de la taille du génome

Plusieurs mécanismes ont permis aux eucaryotes d'augmenter considérablement la taille de leur génome:

  • Crossing-over inégal
    Ce mécanisme peut augmenter le nombre de copies de certains gènes, surtout chez les gènes des familles multigéniques déjˆ répétés. On obtient ainsi des gènes répétés en tandem.
  • Glissement lors de la réplication de l'ADN
    Ce phénomène peut se produre dans des régions o l'on a des répétitions en tandem de motifs courts de l'ADN (2 ˆ 10 nucléotides) (microsatellites). Il est dž ˆ un mauvais appariement (décalé) entre motifs homologues. Lors d'un mauvais appariement, la polymérase va insérer une ou plusieurs copies du motif répété.
  • Amplification par enroulement circulaire
    Mécanisme de duplication de l'ADN impliquant la formation d'une copie d'un séquence d'ADN extrachromosomique circulaire. Il y aurait ensuite réplication de nombreuses copies, linéarisation et insertion ultérieure dans le génome. Ce mécanisme est observé pour amplifier le nombres de gènes de l'ARNr dans les oocytes d'amphibiens.
  • Transposition
    Copie ou mouvement d'une séquence d'ADN ˆ un autre endroit du génome. Nécessite la réverse transcription d'une séquence d'ARN.

Composition des génomes en acides nucléiques

Les procaryotes et les eucaryote diffèrent aussi par la composition en nucléotides de leur génome. Bien que d'une taille très supérieure ˆ celui des procaryotes, le génome des eucaryotes et surtout celui des vertébrés présente très peu de variation du contenu global en GC (~ 40%), alors que le contenu global en GC chez les bactéries est très variable (~ 25% chez certains mycoplasmes ˆ plus de 75% chez Micrococcus luteus). Cependant, si l'on divise les bactéries en différents groupes évolutifs, on remarque que le contenu global en GC ˆ l'intérieur de chaque groupe est également assez peu variable. On pense donc que cette variabilité interspécifique en % de GC est liée ˆ la diversité et l'ancienneté des groupes de bactéries.

L'apparente homogénéité globale des eucaryote cache en fait une microhétérogénéité (nature composite) du contenu en GC pour différentes portions du génome, surtout chez les animaux ˆ sang chaud.

Diversité interspécifique du contenu en GC chez les bactéries

La variabilité du contenu en GC des bactéries peut tre expliqué selon 2 types d'hypothèses.

  1. Hypothèse sélectionniste, adaptation ˆ l'environnement
    • Liaison G-C plus stable que liaison A-T. Les régions riches en en GC seraient moins sensibles aux UV et plus stables ˆ haute température. Les bactéries exposées aux UV et celles vivant en milieu chaud devraient donc avoir un contenu en GC plus élevé que les autres. Cependant, ces prédictions ne sont pas toujours vérifiées.
    • Les codons riches en GC (Alanine, Arginine) sont plus thermiquement plus stables que des codons riches en AT (Sérine, Lysine). Les protéines ainsi codées seraient plus résistantes ˆ la chaleur (chez les bactéries thermophiles)
  2. Hypothèse mutationiste
    • Le contenu en GC dépendrait du taux de mutation G,C Ç A,T. Si le taux de mutation est équilibré, on aurait environ 50% de Gc, sinon on aurait d'autres pourcentages de GC. Cependant on ignore si le taux observé de subtitution n'est pas simplement le reflet de contraintes fonctionnelles.

Nature mosaïque du génome des eucaryotes. Notion d'isochore

Chez les eucaryotes, on a observé que différentes régions du génome possédaient différents contenus en GC. Cela a été mis en évidence par digestion de l'ADN total en fragments de 30 ˆ 100 Kb et distinction de fragments riches en GC plus lourd que les fragments riches en AT. Les différentes régions possédants des densités relativements homogènes en % de GC sont appellées isochores et couvrent de longs segments d'ADN. Le génome des eucaryotes présente donc une structure mosaïque.

Chez les animaux ˆ sang chaud (mammifères et oiseaux), environ 30 ˆ 60% du génome présente cette structure composite en isochores. Ces isochores représentent des segments contigus d'ADN de plus de 300 Kb en moyenne, possédant des densités en GC très hétérogènes. Chez les vertébrés ˆ sang froid, les différences de % en GC entre isochores sont beaucoup moins marquées, et on n'atteint jamais les contenus en GC les plus élevés reportés chez les mammifères

Il existe ainsi plusieurs familles d'isochores chez les mammifères, définies en fonction de leur densité en GC.

  • Familles L1 et L2 : pauvres en GC
  • Familles H1 et H2 : riches en GC
  • Famille H3 : très riche en GC

On a constaté que les isochores correspondaient approximativement aux régions des chromosomes définies par les bandes claires (riches en GC) et foncées (pauvres en GC) obtenues après coloration au Giemsa. Cela est aussi cohérent avec le fait que les bandes des chromosomes sont faibles ou absentes chez les vertébrés ˆ sang froid.

D'autre part, la grande majorité des gènes se trouvent dans la fraction d'ADN la plus riche en GC (H3). Par exemple, le cluster des gène de l'a-globine se trouve dans une région globalement riche en GC (~ 60%), alors que les gènes de la b-globine se trouvent dans une région pauvre en GC (~ 40%) De plus, les régions géniques ont en général tendance ˆ avoir un contenu en GC plus riche que les régions adjacentes.

Origine des isochores

Cette origine est assez controversée.

  1. Hypothèse sélectioniste
    • Les régions GC riches seraient favorisées chez les animaux ˆ sang chaud car elles seraient plus stables.
    • On a fait récemment l'hypothèse que l'organisation des génomes des mammifères en isochores hétérogènes favorisait les réarrangements caryotypiques et la formation des espèces. En effet, les frontières entre les bandes riches en GC et les bandes pauvres en GC sont des "hot spot" pour les chiasmata et les translocations. Cette hypothèse est en accord avec le fait que la diversité caryotypique et le taux de formation des espèces par changement caryotypique sont plus faibles chez les vertébrés inférieurs que chez les animaux ˆ sang chaud.
    • Il semble qu'il y ait une pression évolutive (inconnue) favorisant un certain contenu en GC pour un génome donné, car on a remarqué que la teneur en GC des 3èmes positions des codons était bien supérieure ˆ celle des séquences codantes environnantes. Cela peut tre expliqué par le fait que les séquences codantes ont un choix limité par des pressions sélectives pour les nucléotides codants pour les 2 premières positions des codons, mais moins pour la troisième, qui serait donc plus souvent un C ou un G de manière ˆ rétablir l'équilibre en GC pour l'ensemble du gène. Notez toutefois que les régions géniques ont tendance ˆ avoir globalement un contenu en GC plus élevé que les régions non géniques.
  2. Hypothèse mutationiste
    • Il existerait un biais mutationnel dž ˆ un changement de composition dans le pool en nucléotides pendant la réplication (durant environ 8 heures chez les mammifères) de l'ADN des lignées germinales. Les régions riches en GC sont répliquées au début du cycle lorsqu'il y a beaucoup de nucléotides GC. Une erreur de réplication provoquera donc plus souvent un remplacement d'un A-T en G-C. Les régions riches en AT sont répliquées plus tard, et ˆ ce moment le pool de nucléotides est plus riche en AT. Cette règle n'est cependant pas absolue pour l'ensemble des gènes: certaines régions riches en GC sont répliquées en fin de cycle (ex: ADN satellite, chromosome X inactivé).

Actuellement, on pencherait plut™t pour l'hypothèse mutationiste.


© Laurent Excoffier (1998), Laboratoire de Génétique et Biométrie, Département d'Anthropologie, Université de Genève

Dernière mise ˆ jour: 29.03.00 ˆ 08:54

 

1 2 3 4 5

Portail de l'emploi 100% gratuit

Créer un blog sur dzblog.com - Contact - C.G.U. - Reporter un abus