Colloques du Groupement des
Anthropologistes de Langue Française (GALF)
Giovannoni, L., Falchi, A., Piras, I.S., Amoros, J.P, Moral, P., Ghiani M.E., Calo’, C.M., Paoli, G., Varesi, L., Vona, G., 2006, Structure génétique de la population Corse. Antropo, 11, 37-50. www.didac.ehu.es/antropo
Structure génétique de la population Corse
Genetic structure of Corsican population
Giovannoni L1., Falchi A1., Piras I.S2.,
Amoros J.P1, Moral P3., Ghiani M.E2., Calo’
C.M2., Paoli G4., Varesi L1., Vona G2
1Université de Corse, laboratoire de Génétique Humaine, Faculté des Sciences 20250 Corte (F)
2Département de Biologie Expérimentale, section Anthropologie, Citadella Universitaria 09042 Monserrato (I)
3Département de Biologie Animale-Anthropologie, Faculté de Biologie Av. Diagonal 645 08028 Barcelone (E)
4Université de Pise, Département Ecologie et Evolution, Unité d’Anthropologie, Via S..Maria 55, 56126 PISA – (I)
Auteur chargé de la correspondance: Varesi Laurent, Université de Corse, laboratoire de génétique humaine,
Faculté des Sciences, 20250 Corte (F). Tél: 0495450027. adresse électronique:
varesi@univ-corse.fr.
Mots clés: Corse, génétique, ADNmt, isoenzymes, ß
Thalassémie
Key-words: Corsica, genetic, mtDNA, isoenzymes, ß Thalassaemias
Résumé
Les fréquences de 18 marqueurs érythrocytaires et plasmatiques ont été analysées dans des populations originaires de quatre micro régions de l’île de Corse: le Nord-est, le Nord-ouest, le centre et l’extrême sud.
L’analyse effectuée dans le contexte méditerranéen,
à partir de l’ensemble de l’échantillonnage insulaire, montre, en premier lieu
une faible influence des populations continentales sur la structure génétique
de la population Corse et en second lieu, une similitude génétique entre les
populations corse et sarde.
Parallèlement, l’analyse du polymorphisme de la
zone hypervariable I de l’ADN mitochondrial, montre les mêmes similitudes,
renforçant ainsi l’hypothèse de la communauté de peuplement des deux îles.
Cette similitude se reflète également dans
le déterminisme génétique d’une pathologie très fréquente en Méditerranée: la ß
Thalassémie (3,1% en Corse). Les populations des deux îles se caractérisent par
une forte fréquence de la mutation ß°-39. L’étude de la répartition des
mutations ß°-39 et ß+IVS1-110 présentes en Corse montre la prédominance du
codon non-sens (88,40%) et la rareté de la mutation ß+IVS1-110 (2,33%) pourtant
majoritaire dans l’est méditerranéen. L’analyse des haplotypes associés à cette
mutation révèle une association préférentielle avec l’haplotype II, en Corse et
en Sardaigne, contrairement aux populations continentales. Ceci suggère
l’origine commune et la sélection par effet fondateur de cette mutation, dans
le bloc corso-sarde.
Abstract
The frequencies of 18 erythrocytary and
plasmatic marker were studied in sample of individuals born and residing in
four micro areas of Corsica island: Eastern-North, Western-North, Centre and
extreme South. Compared to the other Mediterranean populations, Corsica appears
to be greatly differentiated from the populations of regions such as France and
Italy, which have had great political and cultural influence. The Mediterranean
population most comparable to Corsica is Sardinia. Despite their common origin,
they do not prove to be absolutely identical. The genetic characteristics of
Corsica and their relationship with the Mediterranean populations are
interpreted in terms of demographic structure, isolation, and genetic drift.
The mtDNA sequence variation of the
hypervariable segment I of the control region was studied in unrelated
individuals of Corte (Corsica, France). The study confirms results obtained
with classic genetic markers.
In the Corsican population, the incidence of ß Thalassemia traits is reported to be 3.1%. We
have investigated the 2 more important ß Thalassemia mutations present in the Corsican population: ߺ-39 and ß+IVS1-110. Seven polymorphic sites in the b-globin gene cluster were analyzed. Among the Corsican
patients analyzed, the nonsense codon is predominant (88.40%), whereas the ß+IVS1-110 mutation, the most common in the
eastern part of the Mediterranean basin, is underrepresented (2.33%). The other
individuals were not positive for the two tested mutations (9.27%). The ߺ-39 mutation in the studied population shows a
strong association with haplotype II. This strong association was also found in
Sardinia, suggesting that the mutation on the two islands have the same origin.
These data support the hypothesis of a western Mediterranean origin of the ߺ-39 mutation.
Introduction
Par sa superficie la Corse est la troisième île de la
Méditerranée occidentale, après la Sicile et la Sardaigne. Face au golfe de
Gênes, elle se situe à environ 90 km de la Toscane et à 12 km de la Sardaigne.
La Corse possède une altitude moyenne de 568m, avec un point culminant, le
Monte Cinto, à 2710m au-dessus du niveau de la mer.
Les données archéologiques estiment les premières traces
humaines à 6570 avant JC (Camps 1988). Cependant, des traces du Paléolithique
en Sardaigne suggèrent l’existence de communautés ayant peuplé le bloc
Corso-Sarde à différentes périodes, du Pléistocène moyen au Pléistocène récent.
Le passage le plus probable, d’un point de vue géographique, pourrait être
l’archipel toscan (Melillo 1971).
A l’age du bronze, la culture "Torreana",
caractérisée par de nombreux monuments Mégalithiques: dolmens, menhirs,
"Castelli" a laissé de nombreuses traces dans l’ensemble de l’île. Ce
type de culture montre de grandes similitudes avec la culture des
"Nuraghe" de Sardaigne.
L’Histoire commence officiellement en 565 avant JC avec la
fondation de Alalia, l’actuelle Aléria, par une colonie grecque. L’occupation
romaine débuta en 269 avant JC. Après les invasions Vandales et la domination
Byzantine, la Corse fut sous le contrôle du Vatican pendant un certain temps,
avant les dominations Pisane (1077-1284) et du roi d’Aragon (1284-1346). Gênes
conquit ensuite l’île et la contrôla jusqu’au milieu du 18ème siècle
où la Corse connut une brève période d’indépendance avant d’être annexée à la
France par le traité de Versailles de 1768.
La Corse a donc été habitée par différentes populations
comme des Ligures, Phéniciens, Grecs, Romains, Byzantins, Pisans, Génois et
Français.
Elle appartient ainsi au système linguistique italien et
est sous-divisée en quatre zones selon l’affinité au dialecte Toscan. Ce
système montre un certain degré de conservation du Latin et du langage pré-romain
(Rolhfs 1972).
Durant les deux derniers siècles, la Corse a subi une
profonde évolution démographique. De 1800 à 1884, on observa une croissance
démographique constante avec un point culminant en 1884: 276000 habitants
comparés à 125000 en 1729 et 162000 en 1801. Après 1884, une sévère crise
démographique débuta pour atteindre 170000 habitants au début du 19éme siècle.
Une nouvelle croissance démographique commença après 1955 pour atteindre 250371
habitants en 1990.
L’évolution démographique a aussi affecté le mode
d’occupation du territoire. Dans beaucoup de centres urbains, et en particulier
pour Ajaccio et Bastia, la population a augmenté de façon significative, alors
que beaucoup de villages de l’intérieur se sont dépeuplés: en 1990, quatre
communautés rurales sur dix comptaient moins de 100 habitants.
D’un point de vue environnemental la Corse, comme la
Sardaigne, subit durant des millénaires les influences néfastes de la Malaria.
Le parasite ne fut éradiqué qu’à la fin de la seconde guerre mondiale.
La population d’aujourd’hui est d’environ 250000 habitants
avec un passé de forte endogamie, ce qui offre de nombreux avantages pour une
étude génétique. Ainsi, la présence d’allèles, avec des fréquences plus élevées
que dans des populations ouvertes, rend plus facile l’étude du déterminisme
génétique de pathologies ou d’un effet environnemental. Elle est aussi de ce
fait propice à des études d’anthropologie moléculaire comme la recherche de
similitudes inter ou intra régionales, en mettant en lumière des flux géniques
corrélés à des flux migratoires.
Afin d’essayer de comprendre l’histoire du peuplement de
cette île, différents marqueurs génétiques ont été étudiés sur la
population actuelle:
- des marqueurs neutres pour tenter de mettre en lumière
des flux migratoires: autosomiques (protéines érythrocytaires et plasmatiques)
et à transmission maternelle (ADN mitochondrial).
- des marqueurs sélectifs, liés à la pression de la
Malaria, représentés par les mutations responsables des ß-Thalassémies, ainsi
que les haplotypes associés à ces mutations.
Matériel
et méthodes
Marqueurs autosomiques
990 échantillons sanguins originaires de quatre
micro régions ont été examinés: Nord-est, Nord-ouest, Centre et Sud-ouest. Les
individus des deux sexes étaient tous non apparentés, sains, originaires de la
micro région étudiée depuis au moins trois générations (lignées paternelle et
maternelle).
Les génotypes de 18 marqueurs génétiques ont été déterminés
par des techniques d’enzymoélectrophorèse pour les enzymes érythrocytaires
(ACP, ADA, AK, DIA, ESD, GLO, PGD, PGM) , d’immunoélectrophorèse pour les
protéines plasmatiques (Gc, C3, HP, PLG, ORM et PI) et d’agglutination pour les
marqueurs de groupes sanguins (ABO, Kell et Rhésus). Ces marqueurs sont
répartis sur 12 chromosomes différents et représentent un total de 55 allèles.
ADNmt
L’ADN a été extrait de 47 échantillons sanguins de Corse du
Centre examinés pour les marqueurs génétiques classiques. L’extraction a été
réalisée à partir de sang total selon la méthode phénol-chloroforme.
La zone hypervariable I de ADNmt a été amplifiée par PCR
avec les amorces: L15996 (5’-CTCCACCATTAGCACCCAAAGC-3’) et H16401
(5’-TGATTTCACGGAGGATGGTG-3’), produisant un fragment de 445 bases.
Les produits de PCR ont été purifiés et 10 µl de ADNmt ont
été séquencés (ABI 377, Perkin Elmer) avec les amorces H et L utilisées pour la
PCR Les séquences ainsi obtenues couvraient un total de 360 bases, de L15981 à
L16340 et ont été comparées à la séquence de référence d’Anderson (1981).
Etude des ß Thalassémies
Les échantillons étaient composés de 43 hétérozygotes
ß-Thalassémiques non apparentés originaires du centre de l’île. Les patients
ont été sélectionnés à l’Hôpital de Bastia sur la base des paramètres
hématologiques suivants: MCV < 84 fL, MCH < 27 pg, HbA2 >
3.5%. Chaque donneur a été informé et a donné son accord pour participer à ce
programme de recherche.
A partir de l’ADN extrait, les mutations les plus
fréquemment rencontrées en Méditerranée ont été recherchées par dot-blot avec
des sondes oligonucléotidiques (ASO) (Ristaldi et al. 1989), par l’utilisation
d’enzymes de restriction et par la
méthode amplification refractory mutation system (ARMS) (Old 1990).
Les haplotypes ont été déterminés par l’analyse des sites de restriction polymorphes,
situés dans le domaine des gènes ß-Globine: (1) HincII 5’ de ; (2) HindIII 5’ de ; (3) HindIII dans la région 5’ de IVSII de ; (4) HincII de ; (5) HincII 3’ de ; (6) AvaII de ß; et (7) HinfI 5’ de ß (Orkin et al. 1982). Les fragments contenant
chacun de ces sites ont été amplifiés puis digérés avec les enzymes appropriés.
Analyses statistiques
Marqueurs classiques
La différentiation entre la Corse et les autres populations Européennes et Méditerranéennes a été analysée avec la méthode R-Matrix (Harpending and Jenkins 1973) et les distances génétiques de Reynolds (Reynolds et al. 1983). L’ensemble des micro régions corses a été comparé avec des populations d’Afrique du Nord, d’Espagne, de France, de Grèce, d’Italie, du Pays Basque, du Portugal, de Sardaigne et de Turquie. Les distances génétiques ont été utilisées pour construire un arbre Neighbor Joining. La robustesse de ce dernier a été testée avec la méthode du Bootstrap en utilisant le programme PHYLIP 3.5 (Felsenstein 1989).
Les analyses statistiques ont été menées avec les
programmes PHYLIP 3.5c et ARLEQUIN 1.1 (Schneider et al. 1997). Le nombre
attendu de fréquences et la taille effective de la population ont été estimés
par le modèle des allèles infinis avec les moyennes des nombres d’individus et
de séquences (Hartl and Clark 1989). La variabilité interne des échantillons a
été analysée par l’indice de diversité de Shannon dans sa forme standardisée H’
(Magurran 1988).
La distribution du nombre moyen de différences et les
erreurs standards ont été calculées après 1000 itérations avec le programme
ARLEQUIN 1.1. Les paramètres et ont été calculés
en accord avec le modèle de Harpending et al. (1993). Les temps d’expansion ont
été estimés avec le paramètre en utilisant les
fréquences de mutation citées dans la littérature (Vigilant et al. 1991 ;
Ward et al. 1991).
Les séquences d’ADNmt relatives à la Corse ont été comparées avec celles des populations suivantes: Pays Basque (Bertranpetit et al. 1995), Sardaigne (Di Rienzo and Wilson 1991), Toscane (Francalacci et al. 1996), Turquie (Comas et al. 1996), Caucase (Stoneking 1993), Moyen Orient (Di Rienzo and Wilson 1991), Afrique (Vigilant et al. 1989), et Asie (Stoneking 1993). La comparaison a été effectuée par la méthode des distances basée sur le nombre moyen de substitution (Horai et Hayasaka 1990) et un arbre Neighbor Joining a été construit avec la matrice de distance obtenue (Saitou et Nei 1987).
ß Thalassémies
La fréquence de chaque mutation est déterminée par simple
comptage après analyse moléculaire.
Les fréquences haplotypiques à partir des 7 sites
polymorphes ont été déterminées par la méthode du maximum de vraisemblance
(Excoffier et Slatkin 1995). Cette analyse a été effectuée sur un
échantillonnage homogène caractérisé par la mutation majoritaire ß¼-39 et
comparée à un échantillonnage sain de même origine.
Résultats
Marqueurs autosomiques
Sur les 18 marqueurs étudiés seulement 5 se trouvent être en
déséquilibre selon la loi de Hardy-Weinberg: ESD et Tf (P<0,05), PGM1, PI et
Gc (P<0,01).
Les fréquences géniques (http://fst.univ-corse.fr/,
rubrique "La recherche", sous-rubrique "Lab génétique
humaine") obtenues à partir de l’ensemble de nos échantillons sont
comparées aux fréquences géniques relatives à l’Afrique du Nord, à l’Espagne, à
la France, à la Grèce, à l’Italie, au Pays Basque, au Portugal, à la Sardaigne
et à la Turquie.
L’analyse R-MATRIX
avec les populations citées montre que 54,25% de la variabilité est expliquée
par les deux premières composantes (38,99% pour la première et 15,26% pour la
seconde)
La Figure 1
visualise la projection des populations par rapport à ces deux premiers axes.
Hormis l’Afrique du Nord, toutes les autres populations sont rassemblées par la
première composante, par contre la seconde différencie les populations corse et
sarde des autres populations.
Les distances génétiques (Tableau 1, valeurs en haut de la diagonale) pour
la seule population corse, montrent que la plus faible distance est décelée
avec la Sardaigne, et la plus élevée avec le Portugal. De plus, les distances
moyennes les plus élevées sont trouvées pour l’Afrique du Nord (0,0347), la
Sardaigne (0,0282) et la Corse (0,0252), traduisant une dérive génétique plus
importante, comparativement aux autres populations, pour lesquelles la distance
moyenne s’échelonne entre 0,0150 et 0,0180.
Figure 1. Projection des populations par rapport aux deux premières composantes de l’analyse R-Matrix.
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1. Corse |
0,0156 |
0,0116 |
0,0205 |
0,0307 |
0,0242 |
0,0233 |
0,0317 |
0,0327 |
0,0182 |
0,0340 |
2. Sardaigne |
0,0104 |
0,0196 |
0,0177 |
0,0350 |
0,0296 |
0,0137 |
0,0492 |
0,0350 |
0,0259 |
0,0362 |
3. Grèce |
-0,0021 |
0,0015 |
0,0064 |
0,0156 |
0,0091 |
0,0051 |
0,0341 |
0,0088 |
0,0155 |
0,0099 |
4. France |
-0,0048 |
-0,0050 |
-0,0015 |
0,0051 |
0,0030 |
0,0162 |
0,0348 |
0,0166 |
0,0080 |
0,0083 |
5. Espagne |
-0,0029 |
-0,0046 |
-0,0005 |
0,0049 |
0,0064 |
0,0125 |
0,0316 |
0,0112 |
0,0087 |
0,0062 |
6. Italie |
-0,0028 |
0,0035 |
0,0026 |
-0,0015 |
-0,0012 |
0,0065 |
0,0344 |
0,0093 |
0,0177 |
0,0170 |
7; Afrique Nord |
-0,0007 |
-0,0144 |
-0,0060 |
-0,0072 |
-0,0062 |
-0,0048 |
0,0519 |
0,0316 |
0,0275 |
0,0378 |
8. Turquie |
-0,0065 |
-0,0053 |
0,0016 |
-0,0017 |
-0,0009 |
0,0026 |
-0,0023 |
0,0067 |
0,0195 |
0,0156 |
9. Pays Basque |
0,0007 |
-0,0005 |
-0,0040 |
0,0030 |
0,0011 |
-0,0042 |
-0,0015 |
-0,0040 |
0,0099 |
0,0132 |
10. Portugal |
-0,0070 |
-0,0053 |
0,0020 |
0,0037 |
0,0039 |
-0,0007 |
-0,0088 |
-0,0004 |
-0,0004 |
0,0110 |
Tableau
1. Distances de Reynolds (au dessus de la
diagonale) ; contribution à l’hétérogénéité de la représentation R-MATRIX
pour chaque population (en italique sur la diagonale). Valeurs de rij en
dessous de la diagonale.
Ces distances génétiques sont utilisées pour construire un arbre de
type Neighbor Joining après cent itérations (Figure 2). Cette représentation
confirme en partie la configuration de l’analyse R-MATRIX. Le groupe
Corse-Sardaigne éloigné des populations continentales et présentant une
communauté génétique d’importance croissante avec principalement l’Italie, le
Pays Basque et l’Afrique du Nord. Les valeurs de "bootstrap" aux
noeuds de l’arbre traduisent une robustesse suffisante de la représentation.
Figure 2. Arbre de type Neighbor Joining pour les populations comparées.
ADNmt
Les 47 individus étudiés présentent 31 séquences différentes avec en totalité 40 sites variables (http://fst.univ-corse.fr/, rubrique "La recherche", sous-rubrique "Lab génétique humaine").
Deux sites semblent spécifiques à la population corse et n’ont pas été
trouvés dans les populations envisagées pour cette étude: site 16179 (C®T) et 16252 (A®G).
Certaines mutations spécifiques des caucasoïdes montrent un gradient
d’est en ouest:
16069: Basques 4,4%, Sardes 5,8%, Corses 6,4%, Toscans 13,5%, Turcs
15,6%, Moyen Orient 19,0%.
16126: Basques 6,7%, Corses 8,5%, Sardes 13,0%, Toscans 23,1%, Turcs
26,7%, Moyen Orient 47,6%.
La mutation 16223 définit elle aussi un gradient significatif depuis
l’occident jusqu’à l’Afrique: Basques 4,4%, Corses 6,4%, Sardes 7,2%, Toscans
13,5%, Moyen Orient 23,8%, Turcs 26,7%,Asiatiques 47,8%, Africains 86,4%.
La variabilité des séquences est mesurée par l’indice de Shannon H’
(Magurran 1988) et est égal à 0,903 (Tableau 2), valeur intermédiaire comparée
aux autres populations caucasoïdes (0,899 pour la Toscane, 0,991 pour le Moyen
Orient).
La population corse présente un nombre moyen de substitution de 3,71
avec une variance de 6,13.
|
N |
K |
a |
b |
H' |
Corse |
47 |
31 |
40 |
3,18 |
0,903 |
Toscane |
52 |
40 |
54 |
5,03 |
0,899 |
Sardaigne |
69 |
46 |
52 |
4,22 |
0,930 |
Pays Basque |
45 |
27 |
32 |
3,15 |
0,912 |
Moyen Orient |
42 |
36 |
59 |
7,08 |
0,991 |
Asie |
23 |
23 |
59 |
8,28 |
1,000 |
Caucasoides |
18 |
16 |
29 |
5,15 |
0,976 |
Afrique |
22 |
12 |
34 |
8,66 |
0,946 |
Turquie |
45 |
38 |
56 |
5,38 |
0,987 |
Tableau 2. Paramètres de divergence nucléotidique. N= nombre d’individus ; k = nombre de séquences différentes ; a= nombre de sites polymorphes ; b= nombre moyen de substitutions. ; H’ = indice de Shannon.
La période d’expansion est déterminée en utilisant les trois taux de
mutations cités dans la littérature et avec q0 = 1.556, q1 = 14.869 et = 2.15 (Tableau 3), donnant ainsi une date moyenne de
27643 ans avant le présent, correspondant au paléolithique supérieur.
Les différences de distribution sont utilisées pour définir des
distances génétiques (Horai et Hayasaka 1990) entre les populations définies
dans Matériel et Méthodes. Ces distances (Tableau 4) sont utilisées pour
construire l’arbre de type Neighbor Joining (Saitou et Nei 1987) représenté à
la Figure 3.
|
|
µ= 4.14 x 10-6 |
µ= 2.16 x 10-6 |
µ= 1.44 x 10-6 |
Corse |
2.152 |
14443 |
27743 |
41584 |
Sardaigne |
4.052 |
27174 |
52083 |
78234 |
Toscane |
4.800 |
32206 |
61728 |
92593 |
Pays Basque |
2.138 |
14467 |
28074 |
42619 |
Caucasoides |
5.045 |
33859 |
65039 |
97587 |
Turquie |
5.385 |
38556 |
74566 |
102960 |
Moyen Orient |
7.019 |
47101 |
90278 |
135605 |
Asie |
7.555 |
50190 |
97172 |
145960 |
Afrique |
3.065 |
20361 |
39422 |
59215 |
Tableau 3. Temps de divergence calculés à partir de t, avec différents taux de mutation µ.
Les populations africaine et asiatique se détachent nettement des
populations européennes. Ces dernières plus homogènes, se positionnent selon un
gradient Est-Ouest. La population corse se trouvant étroitement liée à la
population basque et sarde, suivie ensuite par la Toscane.
|
Corse |
Sardaigne |
Toscane |
Pays Basque |
Caucasoïdes |
Turquie |
Moyen Orient |
Asie |
Afrique |
Corse
|
3.71 |
3.993 |
4.419 |
3.450 |
4.267 |
4.603 |
5.745 |
6.305 |
9.271 |
Sardaigne |
0.028 |
4.22 |
4.633 |
3.694 |
4.695 |
4.845 |
5.850 |
6.500 |
9.475 |
Toscane |
0.043 |
0.018 |
5.03 |
4.100 |
5.120 |
5.245 |
6.155 |
6.885 |
10.044 |
Pays basque |
0.020 |
0.009 |
0.010 |
3.15 |
4.280 |
4.334 |
5.553 |
6.055 |
9.610 |
Caucasoïdes |
0.117 |
0.020 |
0.030 |
0.130 |
5.15 |
5.306 |
5.980 |
6.275 |
9.740 |
Turquie |
0.058 |
0.045 |
0.040 |
0.069 |
0.041 |
5.38 |
6.321 |
6.995 |
9.832 |
Moyen Orient |
0.350 |
0.200 |
0.100 |
0.438 |
0.160 |
0.091 |
7.08 |
7.900 |
10.765 |
Asie |
0.310 |
0.250 |
0.230 |
0.340 |
0.140 |
0.165 |
0.220 |
8.28 |
10.655 |
Afrique |
5.821 |
5.770 |
5.930 |
6.340 |
5.570 |
5.547 |
5.630 |
4.920 |
3.19 |
Tableau
4. Distances génétiques basées sur le nombre moyen de
substitutions. Sur la diagonale (en italique) nombre moyen de substitution
intrapopulation. Au dessus de la diagonale: nombre moyen de substitution
interpopulation. Au dessous de la diagonale: distance Dij = dij - ((di+dj)/2).
Figure 3. Arbre de type Neighbor Joining construit à partir des distances génétiques Dij.
Etude des ß Thalassémies
Sur les 43 individus testés, 38 présentent une mutation en position
codon 39 (88,40 %), 1 individu seulement est caractérisé par la mutation IVS I-
110 (2,33%) et 4 individus n’ont pu être typés (9,30 %).
L’homogénéité mutationnelle dans cette micro-région centrale, est
légèrement supérieure à celle établie pour l’ensemble de la Corse du Nord
(Varesi et al. 2000).
Ceci peut être expliqué par l’origine géographiquement limitée des
individus.
Ces deux mutations se retrouvent dans toutes les populations
méditerranéennes avec des fréquences variables.
Les populations insulaires présentent en général une homogénéité très
importante: la Corse et la Sardaigne pour la mutation ߺ-39, et Chypre pour la
mutation IVS I-110. Dans ces régions une ou deux mutations représentent 90 % environ
des ß Thalassémies, ce qui facilite le dépistage prénatal éventuel.
Les fréquences haplotypiques liées à la mutation ߺ-39, sont établies à
partir des 38 thalassémiques ߺ-39 et de 47 individus sains, originaires de la
même région (Falchi et al. 2005).
La mutation ߺ-39 se retrouve dans le centre de la Corse avec une
prévalence de 88,40 %, en seconde position, par ordre d’importance, après la
Sardaigne voisine (95,40 %).
Cette mutation prépondérante, dans la partie méditerranéenne occidentale, semble avoir dans les deux îles subi l’influence d’un effet fondateur.
La répartition des deux principales mutations, ߺ-39 et IVS I- 110,
dans des pays principalement méditerranéens à partir des données issues de la
littérature est illustrée par la Figure 4 (Cao et al. 1989 (a; b); Giambona et
al. 1995; Zahed et al. 1997; Perrin et al. 1998; Cabeda et al. 1999).
Ces deux mutations se répartissent différemment d’Est en Ouest, la
partie occidentale caractérisée par la mutation ߺ-39 et la partie orientale
par la mutation IVS I-110.
Figure 4. Répartition géographique des deux principales mutations du gène de la b globine dans la zone euroméditerranéenne.
La plupart des régions et pays étudiés ci dessus ont, durant des
siècles, voire des millénaires subis la pression sélective de la malaria. Or,
les ß Thalassémies sont connues pour donner un effet protecteur vis-à-vis du
Plasmodium (Cavalli Sforza et al. 1994).
La question est de savoir si ces mêmes mutations sont apparues, sous
l’effet de la même pression, d’une façon indépendante dans des populations
isolées les unes des autres (origine mutationnelle multicentrique). Ou bien
ont-elles pour origine, un ou quelques foyers humains, et se sont ensuite
répandues grâce à des évènements migratoires.
L’étude des haplotypes associés à la mutation majoritaire ߺ-39
pourrait apporter quelques éléments de réponse. Les associations haplotypiques
ont été définies en utilisant la méthode du maximum de vraisemblance. Les
résultats obtenus sont reportés sur le Tableau 5
La mutation ߺ-39 se trouve être associée majoritairement avec
l’haplotype II (fréquence: 0,187).
Des associations minoritaires sont détectées avec l’ haplotypes I
(fréquence: 0,023) et l’haplotype VII (fréquence: 0,021).
Des études de corrélation entre ß Thalassémies et haplotypes ont permis
d’établir que la mutation ߺ-39 est, dans de nombreuses populations
méditerranéennes préférentiellement associée à l’haplotype II, et à l’haplotype
I.
La mutation IVS I-110 a très souvent été décrite comme étant associée
presque exclusivement à l’haplotype I (Thein et al. 1987).
Les associations minoritaires semblent plutôt être issues de
recombinaisons méiotiques (Fullerton et al. 1994).
Haplotypes |
Fréquences |
Hinc-II
|
Hind-III |
Hind-III |
Hinc-II |
Hinc-II |
Ava-II |
Hinf-I |
ߺ39 |
||
I |
0,236 |
±0,012 |
+ |
- |
- |
- |
- |
+ |
+ |
- |
|
I |
0,023 |
±0,001 |
+ |
- |
- |
- |
- |
+ |
+ |
+ |
|
II |
0,109 |
±0,008 |
- |
+ |
+ |
- |
+ |
+ |
+ |
- |
|
II
|
0,187 |
±0,014 |
- |
+ |
+ |
- |
+ |
+ |
+ |
+ |
|
III |
0,123 |
±0,010 |
- |
+ |
- |
+ |
+ |
+ |
- |
- |
|
V |
0,066 |
±0,004 |
+ |
- |
- |
- |
- |
+ |
- |
- |
|
VII |
0,048 |
±0,005 |
+ |
- |
- |
- |
- |
- |
+ |
- |
|
VII |
0,021 |
±0,002 |
+ |
- |
- |
- |
- |
- |
+ |
+ |
|
VIII |
0,026 |
±0,004 |
- |
+ |
- |
+ |
- |
+ |
- |
- |
|
IX |
0,009 |
±0,001 |
- |
+ |
- |
+ |
+ |
+ |
+ |
- |
|
1 |
0,092 |
±0,006 |
+ |
- |
- |
- |
+ |
+ |
+ |
- |
|
2 |
0,028 |
±0,004 |
- |
+ |
- |
- |
+ |
+ |
- |
- |
|
3 |
0,032 |
±0,006 |
+ |
- |
+ |
+ |
- |
+ |
+ |
- |
|
Tableau
5. Fréquences haplotypiques des échantillons étudiés
avec la nomenclature de ORKIN et al. (1982).
Discussion et conclusions
L’étude des marqueurs classiques montre un certain nombre de
caractéristiques génétiques:
- Une forte similitude relie les populations corse et sarde (Figure 2).
- Une hétérogénéité est décelée au sein de ces mêmes populations
(Tableau 1), probablement liée à l’isolement et à leur structure démographique.
- La répartition des autres populations sur l’arbre (Figure2), du fait
des valeurs de Boostrap peu significatives, est à considérer avec précaution.
La population d’Afrique du Nord avec une valeur de Boostrap à la limite de la
significativité (46%) occupe une position qui semble en désaccord avec
l’analyse R matrix (Figure 1). Si l’on considère la forte distance génétique
entre cette population et le groupe corso sarde, il serait logique de ne pas
considérer ce rapprochement. Le cas de la population du pays Basque est différent, malgré la valeur de
Bootstrap, également proche de la significativité (48%), elle présente une
faible distance génétique avec le groupe insulaire (Tableau 1). De plus ce
rapprochement est également visualisé avec l’ analyse R matrix et surtout avec
l’étude de l’ADNmt (Figure 3).
- Une influence modérée est visualisée avec les populations de la
péninsule italienne.
- L’influence française demeure pratiquement inexistante, sans doute
trop récente. De plus l’enquête généalogique permet, à travers les noms,
d’éliminer les migrants ou leurs descendants.
Si les généticiens s’accordent sur l’origine ancestrale de la structure
génétique actuelle des populations méditerranéennes, ils restent par contre
partagés entre une origine paléolithique et néolithique.
Cavalli-Sforza et al. (1994) en utilisant les fréquences géniques de
nombreux marqueurs protéiques, ont démontré que leurs variations étaient corrélées
géographiquement aux sites néolithiques. Leur modèle assure que notre structure
génétique actuelle provient de la lente expansion des fermiers néolithiques à
partir du Moyen Orient. Le nouveau mode économique a permis une croissance
démographique qui déplaça (ou absorba) le faible nombre de chasseurs cueilleurs
mésolithiques.
Un modèle opposé (Richard et al. 1996) propose, au contraire, une
simple diffusion culturelle avec une intrusion minimale des peuples du Moyen
Orient.
L’analyse de l’ADNmt de la population corse semble confirmer les
observations publiées par un certain nombre d’auteurs, montrant, en Europe, un
gradient Est-Ouest à partir d’une population ancestrale unique (Francalacci et
al. 1996 ; Comas et al. 1997). Les
valeurs de l’indice de Shannon H’ et du nombre moyen de substitution vont
également dans ce sens (Tableau 2).
La date d’expansion démographique de la population corse, une des plus
récentes, se situerait entre 14443 et 41584 ans avant présent (AP), durant le
paléolithique, sensiblement durant la même période que l’expansion de la
population basque: 14467 à 42619 (Bertranpetit et al. 1995).
L’expansion sarde, plus ancienne, se situerait entre 27174 et 78234 ans
AP (Comas et al. 1997).
La structure génétique des populations étudiées semble quasiment
établie au paléolithique supérieur, ceci est donc en accord avec le second
modèle décrit par Richards et al. (1996).
Le peuplement se serait donc effectué, depuis le Moyen Orient, à partir de 35000 ans environ avant notre ère, qui correspond à la première phase du retrait des glaciers en Europe. L’occupation des territoires par nos ancêtres a dû certainement n’être que sporadique. En Europe, le véritable essor démographique a dû intervenir à la fin de la dernière glaciation, il y a 15000 ans environ. Les expansions des fermiers du néolithique, à partir de 10000 ans avant notre ère, auraient eu, en Méditerranée, une influence technologique plus que génétique.
En considérant
l’unité du bloc corso-sarde et les facteurs climatiques au paléolithique, ainsi
que les caractéristiques géographiques, il serait logique de penser que le
peuplement le plus ancien concerna la partie la plus propice à une implantation
humaine: la Sardaigne actuelle. Ces conditions sont attestées par les traces de
glaciers quaternaires en Corse, indiquant la présence de trois épisodes
glaciaires durant le paléolithique. Ces traces ne se retrouvent pas en
Sardaigne, qui à la même époque, connu des épisodes de forte pluviométrie
(Vardabasso-Bonicelli 1968). Ce climat, plus favorable, aurait attiré les
groupes humains vers la partie méridionale du bloc corso-sarde, par la suite,
le réchauffement progressif, à partir de 15000 ans environ AP, en supprimant
les "ponts" avec l’Italie continentale, aurait favorisé une expansion
vers le Nord. Cette hypothèse semble être confortée par les données obtenues à
partir de marqueurs protéiques (Varesi et al. 1996, Vona et al. 1995; Moral et
al. 1996; Memmi et al. 1998), et nucléaires (Calo et al. 1998, Vona et al.
1996).
Ce scénario semble
conforté par le gradient des temps de divergence, obtenus avec l’étude de
l’ADNmt, depuis la Sardaigne centrale jusqu’au centre de la Corse.
La similitude génétique entre Corses et Sardes, révélée avec
différentes approches, peut s’expliquer par les échanges constants qui ont eu
lieu entre les deux populations depuis la Préhistoire jusqu’au Moyen Age.
L’influence des mêmes envahisseurs aux même périodes n’a été que très limitée,
comme le montre nos résultats. En complétant notre raisonnement, nous pouvons avancer
l’hypothèse que les deux populations insulaires ont eu la même origine de
peuplement, et que cette similitude génétique actuelle n’est autre que le
reflet d’un patrimoine génétique ancestral commun. Ceci semble confirmé par les
nombreuses ressemblances archéologiques sur plusieurs millénaires (Tanda 1995;
Lilliu 1988; Mazzia 1975). Par la suite, les visées politiques de la République
de Gènes d’une part, et des Aragonais d’autre part, initièrent le
ralentissement des échanges entre les deux îles. Le facteur démographique
accentua l’effet de dérive pour les deux populations insulaires, ce qui se
traduit par la différenciation mise en évidence dans notre étude.
Cette similitude est également décelée avec des marqueurs sélectifs
tels que les mutations du gène de la ß globine.
Dans les régions méditerranéennes l’apparition de la malaria a
probablement eu lieu lorsque les conditions géoclimatiques étaient favorables
au Plasmodium, c’est-à-dire lors de la montée des eaux (formation de zones
lacustres) associée à un réchauffement terrestre. Cette période eut lieu il y a
3 000 ans environ avant notre ère, à la fin du néolithique (Conchon 1987).
Cette période correspond également à un échange de cultures, de
techniques et d’idées dans tout le bassin méditerranéen: agriculture, industrie
du cuivre, culture mégalithique, etc. (Camps 1988).
Ces contacts humains étaient très fréquents entre peuples de la
Méditerranée occidentale, comme le démontrent les découvertes archéologiques.
La mutation ߺ-39 dans la population du centre de la Corse montre donc
une forte association avec l’haplotype II, les valeurs de fréquences obtenues,
soulignent l’importante homogénéité génétique de cette micro-région, tout au
moins au niveau du complexe bêta globine. Cette association quasi exclusive se
retrouve également en Sardaigne, laissant supposer que les habitants des deux
îles ont été en contact avec un seul foyer humain thalassémique ߺ-39 et que le
maintient de cette mutation a été favorisé par un effet fondateur du à
l’insularité et à la présence endémique de la malaria.
Remerciements. Ces recherches ont été financées par les programmes
de l’Union Européenne INTERREG 1, 2 et 3.
Anderson, S., Bankier, A.T., Barrell, B.G., De Bruijn,
M.H.L., Coulson, A.P., Drouin, J., Eperon, I.C., Nierlich, D.P., Roe, B.A.,
Sanger, F., Schreier, P.H., Smith, A.J.H., Staden, R., Young, I.G., 1981,
Sequence and Organisation of the Human Mitochondrial Genome. Nature, 290,
457-465.
Bertranpetit, J., Sala, J., Calafell, F., Underhill,
P.A., Moral, P., Comas, D., 1995, Human Mitochondrial DNA Variation and the
Origin of Basques. Ann.Hum.Genet, 59, 63-81.
Cabeda, J.M., Correia, C., Estevinho, A., Simoes, C.,
Amorim, M.l., Pinho, L., Justica, B., 1999, Unexpected pattern of beta globin
mutations in beta thalassemia patients from northern Portugal. Br. J.
Haematology, 105(1), 68-74.
Calo, C.M., Autori, L., Di Gaetano, C., Latini, V.,
Mameli, G.E., Memmi, M., Varesi, L. , Vona, G., 1998, The polymorphism of the
Apo B 3’ VNTR in the Western Mediterranean. Anthrop Anz , 56(3 ), 1-11.
Camps, G. 1988, Préhistoire d’une île. Editions
Errance. Paris.
Cao, A., Pirastu, M., Ristaldi, M.S., Leoni, G.B.,
Rosatelli, M., 1989a, ß thalassemias: Mediterranean aspects. Molecular probes,
Ed. Raven Press NY, pp257.
Cao, A., Rosatelli, C., Galanello, R., Monni, G.,
Olla, G., Cossu, P., Ristaldi, S., 1989b, The prevention of thalassemia in
Sardinia. Clinical Genetics, 36, 277-285.
Cavalli-Sforza, L.L., Menozzi, P., Piazza A., 1994,
History and Geography of Human Genes. Princeton, NJ: Princeton Univ.Press,
518p.
Comas, D,. Calafell, F., Mateu, E., Perez-Lezun, A.,
Bertranpetit, J., 1996, Geographic Variation in Human Mt DNA Control Region
Sequence: the Population History of Turquey and its Relationship to the
European Populations. Mol. Biol. Evol., 13, 1067-1077.
Comas, D., Calafell, F., Mateu, E., Perez-Lezaun, A.,
Bosch, E., Bertranpetit, J., 1997, Mitochondrial DNA variation and the origin
of the Europeans. Hum. Genet., 99(1), 443-449.
Conchon, O., 1987, Corrélations entre les formations
glaciaires, fluviatiles et marines de Corse et les sédiments sous marins de
Méditerranée occidentale au Pléistocène supérieur. Revue Géol. Dyn. Géogr.
Phys., 27(2), 85-93.
Di Rienzo, A., Wilson, A.C., 1991, Branching Pattern
in the Evolutionary Tree for Human Mitochondrial DNA. Proc.Natl.Acad.Sci.USA.,
88, 1597-1601.
Excoffier, L., Slatkin, M., 1995, Maximum likelihood
estimation of molecular haplotype frequencies in a diploid population. Mol.
Biol. Evol., 12(5), 921-927.
Falchi, A., Giovannoni, L., Vacca, L., Latini, V.,
Vona, G., Varesi, L., 2005, Beta-globin gene cluster haplotypes associated with
beta-thalassemia on Corsica island. Am J Haematol, 78(1), 27-32.
Felsentein, J., 1989, PHYLIP, Physiology influence
package (version 3.2). Clastic 5, 164-166.
Francalacci, P., Bertranpetit, J., Calafell, F.,
Underi11, P.A., 1996), Sequence Diversity of the Control Region of
Mitochondrial DNA in Tuscany and its Implications for the Peopling of Europe.
Am.J.Phys Anthropol, 100, 443-460.
Fullerton, S.M., Harding R.M., Boyce A.J., Clegg J.B.,
1994, Molecular and population genetic analysis of allelic sequence diversity
at the human beta-globin locus. Proc. Natl. Acad. Sci. USA, 91(5), 1805-1809.
Giambona, A., Lo Gioco, P., Marino, M., 1995, The
great heterogeneity of thalassemia molecular defects in Sicily. Hum. Genet.,
95, 526-530.
Harpending, H.C., Jenkins, T., 1973, Genetic distance
among Southern African populations. Methods and theories in Anthropological
Genetics, University of New Mexico Press, Albuquerque, 177-199.
Harpending, H.C., Sherry, S.T., Rogers, A.R.,
Stoneking, M., 1993, The genetic structure of ancient human populations.
Current Anthropology, 34, 483-496.
Hartl, D.L., Clark, A.G., 1989, Principles of
population genetics. Sunderland, MA: Sinauer Associates.
Horai, S., Hayasaka, K., 1990, Intraspecific
Nucleotide Sequence Differences in the Major Noncoding Region of Human
Mitochondrial DNA. Am. J. Hum. Genet., 46, 828-842.
Lilliu, G., 1988, La civilità dei Sardi. TORINO NUOVA
RI 3n ed., 320p.
Magurran, A.E., 1988, Ecological diversity and its
measure. Princeton: Princeton University Press.
Mazzia, C., 1975, Uomo e ambiante in Corsica dalla
preistoria ai tempi attuali. Rendiconti del seminario della Facoltà di Scienze
dell’ Univerisità di CAGLIARI, XLV, 253-323.
Melillo, A.M., 1971, Profilo dei dialetti italiani:
Corsica. Pisa Ed Pacini.
Memmi, M., Moral, P., Calo, C.M., Autori, L., Mameli,
G.E., Succa, V., Varesi, L., Vona, G., 1998, Genetic structure of southwestern
Corsica (France). American Journal of Human Biology, 10, 567-577.
Moral, P., Varesi, L., Memmi, M., Mameli, G.E., Succa,
V., Guttierrez, B., Lutken, N., Vona, G., 1996, Study on the variability of
seven serum protein genetic markers in Corsica (France). Anthropologisher
Anzeiger, 54(2), 97-107.
Old, J.M., Varawalla, N.Y., Weatherall, D.J., 1990,
Rapid detection and prenatal diagnosis of ß thalassemia: studies in Indian and
Cypriot population in the UK. The Lancet, 336, 834-837.
Orkin, S.H., Kazazian H.H., Antonarikis S.E., 1982,
Linkage of ß-thalassemia mutations and ß-globin gene polymorphism in human
globin gene cluster. Nature, 296, 627-631.
Perrin, P., Bouhassa, R., Mselli, L., Garguier, N.,
Nigon, V.M., Bennani, C., Labie, D., Trabuchet, G., 1998, Diversity of sequence
haplotypes associated with beta thalassemia mutations in Algeria: implication
for their origin. Gene, 213(1-2), 169-177.
Reynolds, J.B., Weir, B.S., Cokerham, C.C, 1983,
Estimation of coancestry coefficient:basis of a short-term genetic distance.
Genetics, 105, 767-779.
Richards, M., Corte-Real, H., Forster, P., Maccaulay,
V., Wilkinson-Herbots, H., Demaine, A., Papiha S., Hedges, R., Bandelt, H.J.,
Skyes, B., 1996, Paleolithic and Neolithic Lineages in the European
mitochondrial gene pool. Am. J. Hum. Genet., 59, 185-203.
Ristaldi, M.S., Pirastu, M., Rosatelli C., Monni, G.,
Erlich, H., Saiki, R., Cao, A., 1989, Prenatal diagnosis of beta-thalassemia in
Mediterranean populations by dot blot analysis with DNA amplification and
allele specific oligonucleotide probes. Prenat. Diagn., 9(9), 629-638.
Rohlfs, G., 1972, Studi e Ricerche su Lingua e
Dialetti d’Italia. Firenze Ed Sensoni.
Saitou, N., Nei, M., 1987, The Neighbor-joining
Method: a New Method for Reconstructing Phylogenetic Trees. Mol. Biol. Evol.,
4(4), 406-425.
Schneider S., Kueffer J.M., Roessli D., Excoffier L.,
1997, Arlequin 1.1: A software for population genetic data analysis. User
manual. Genetics and Biometry Lab, University of Geneva.
Stoneking, M., 1993, DNA and Recent Human Evolution.
Evol. Anthropol., 2, 60-73.
Tanda, G., 1995, I siti del neolitico antico e
l’ambiante in Sardegna. Anthropologia Contemporanea, 18(3-4), 5-17.
Thein, S.L., Wainscoast, J.S., Sampietro, M., Old,
J.M., Cappellini, D., Fiorelli, G., Modell, B., Weatherall, D.J., 1987,
Association of thalassemia intermedia with a beta-globin gene haplotype. Br. J.
Haematol., 65(3), 367-373.
Vardabasso-Bonicelli, S., 1968, Il quartenario lungo
la facscia costiera della Sardegna. Atti del X Congresso di Studi Sardi Ed.
Sarda Fossataro Cagliari.(I).
Varesi, L., Memmi, M., Moral, P., Mameli, G.E., Succa,
V., Vona, G., 1996, La Distribution de Quatorze Marqueurs Génétiques dans la
Population de l'Ile de Corse. Bulletin et Mémoires de la Société
d'Anthropologie de PARIS, 1(2), 5-14.
Varesi, L., Vona, G., Memmi, M., Marongiu, M.F.,
Ristaldi, M.S., 2000, Beta thalassemia mutations in Corsica. Hemoglobin, 24(3),
239-244.
Vigilant, L., Pennington, R., Harpending, H., Kocher,
T.D., Wilson, A.C., 1989, Mitochondrial DNA sequences in single hairs from a
Southern African population. Evolution, 86, 9350-9354.
Vigilant, L., Stoneking, M., Harpending, H., Hawkes,
K., Wilson, A.C., 1991, African Populations and the Evolution of Mitochondrial
DNA. Science, 253, 1503-1507.
Vona, G., Memmi, M., Varesi, L., Mameli, G.E., Succa,
V., 1995, Study of several red cell enzyme markers in Corsica. Antropologisher
Anzeiger, 53(2), 125-132.
Vona, G., Varesi, L., Memmi, M., Mameli, G.E., Calo,
C.M., Esteban, E., Moral, P., 1996, Genetic structure of Corsica (FRANCE). 10th
Congress of the European Anthropological Association, Brussels (B).
Ward, R.H., Frazier, B.L., Dew-Jager, K., Pääbo, S.,
1991, Extensive mitochondrial diversity within a single Amerindian tribe. Proc.
Natl. Acad. Sci. USA, 88, 8720-8724.
Zahed, L., Talhouk, R., Saleh, M., Abou-Jaoudeh, R., Fisher, C., Old, J., 1997, The spectrum of ß thalassemia in the Lebanon. Hum. Hered., 47, 241-249.