Tout d'abord il faut comprendre qu'il existe 3 grandes familles de tests

Chacune de ces familles de tests à plusieurs variantes, pour cet opus et afin de ne pas vous noyer sous les détails techniques, je resterais à un niveau généraliste.

Le point commun à ces trois tests est l'échantillon de départ et souvent la machine de séquençage. Ainsi un même échantillon peut permettre de générer les trois types de données. Ces données sont inclusives dans l'ordre descendant, c'est à dire qu'un séquençage complet contient toutes les informations nécessaires à une emprunte, qui elle même contient les infos du test de généalogie génétique.

Le premier séquençage complet date de 2003, a nécessité le travail de 20000 personnes pendant 13 ans et a couté 3 milliards de dollars. Actuellement il dure quelques heures pour quelques centaines d'euros. En conséquence le nombre de profils séquencés dans le monde a explosé. Ils étaient une centaine en 2009, 200 000 en 2013 et on estime que le milliard d'individus devrait être atteint en 2022. Dès 1998, voyant le potentiel financier derrière la détention d'un fichier de données génétiques d'un pays à la population génétiquement très homogène, la société DeCODE Genetics a persuadé le gouvernement islandais de lui louer 12 ans l'accès aux données génétiques de sa population de 300 000 habitants. En 2003, la Cour suprême islandaise annule ce contrat, jugé anticonstitutionnel. En Angleterre, le programme Genomics England a été lancé en aout 2014 pour séquencer le génome de 100 000 personnes. En France c'est l'Assistance Publique - Hôpitaux de Paris qui prépare avec la société IntegraGen la future biobanque génétique nationale.

Les empruntes génétiques sont, elles, utilisées depuis 1985. On utilise couramment treize loci (régions de séquence répétée) pour une identification. Chaque locus est composé d’une certaine séquence de répétition (microsatellite) et le nombre de répétitions est parfaitement indépendant des répétitions sur les autres locus. La probabilité d’identification est de 1 chance sur 3x10^12 (parce que 0,2 % de la population mondiale est constituée de jumeaux monozygotes). En France au 1er janvier 2015, le Fichier national automatisé des empreintes génétiques comptait 2 752 953 profils génétiques de personnes dûment identifiées, soit approximativement 4 % de la population française, plus 254 038 traces non identifiées. 83 % des personnes sont fichées en tant que mis en cause — et donc présumées innocentes ; leurs empreintes sont conservées pendant vingt-cinq ans —, 17 % en tant que personnes « condamnées » (leurs empreintes seront conservées quarante ans). Pour aller plus loin et comprendre les enjeux sociaux de l'identification ADN, je vous invite à lire ces deux articles 1 & 2

Les tests de généalogie génétique sont eux apparus en 2007. Un des pionniers du secteur 23andMe appartient à Google. Les 5 plus grosses sociétés possèdent à elles seules 16 millions de profils ! Une association américaine de généalogie génétique propose un comparatif.

Ces bases comme montré dans notre opus précédent ne sont pas étanches. Juste deux petits exemples : en 2015, Genentech, une filiale des laboratoires Roche a signé un contrat de 60 millions de dollars pour avoir accès à l’ADN de 12 000 clients de 23andMe atteints de Parkinson ou non et ayant donné leur consentement. La même année, la société californienne a vendu les données génétiques de ses clients à Pfizer dans le cadre de recherche sur les maladies de l’intestin. Le montant de la transaction n’a pas été rendu public.

Le business de l'ADN tourne à fond dans notre dos et les entreprises du secteur ne semblent pas s'encombrer systématiquement de la notion de vie privée et de consentement à la réutilisation des données.