samedi 25 janvier 2020

L'intelligence artificielle au service de l'identification des individus sur les photos anciennes

L'identification des individus sur les photos anciennes est un casse-tête auquel tous les généalogistes sont confrontés. Kurt Luther, un professeur de l'université américaine VirginiaTech a lancé avec deux autres passionnés un site qui utilise des algorithmes pour identifier les photos des militaires en uniforme datant de la guerre de Sécession (1861-1865)

Ulysses_simpson_grant.jpg Ulysse Grant, général de l'Union

La guerre de Sécession fut sans doute l'un des premiers conflits largement photographiées. L'un des fondateurs de ce projet, Ron Coddington (éditeur du magazine Military Images) donne les estimations suivantes :

  • pour les 2,2 millions de soldats de l'Union, 40 million de photographies furent prises (soit en moyenne une vingtaine de photo par soldat réparties sur les 4 ans de guerre).
  • la survie de ces photos est d'environ 10%, soit quand même 4 million de photos qui seraient majoritairement détenues par des descendants.
  • seules 10 à 20% des photos sont identifiées, soit environ 400 000.

Le site qu'ils ont développé se nomme Civil War Photo Sleuth (CWPS), c'est un site collaboratif qui se base sur des algorithmes de reconnaissance faciale et d'identification d'uniformes pour essayer d'identifier les photos qui ne le sont pas. Le premier mois de fonctionnement à l'été 2017, sur les 88 identifications réalisées, 77 sont considérées comme correctes par les gens ayant déposé les photos, mais ce nombre pourrait être plus élevé car certains internautes n'ont pas confirmé l'identification.

Faire fonctionner ces algorithmes n'a pas été chose aisée, les photos en noir et blanc ou sépia ne permettent en effet pas d'identifier complètement les couleurs de la peau, des yeux ou des cheveux. D'autre part le nombre de photos de profil dans les images anciennes est beaucoup plus élevé, et les algorithmes n'en tenaient pas compte. Enfin les barbes et moustaches ne facilitent pas les identifications. Les humains sont donc encore largement sollicités pour trancher lorsque plusieurs identifications sont vues comme possibles par la machine.

La première objection qui peut se poser est n'y a-t-il pas d'identification ratée ? Nous vous parlions en 2011 sur ce même blog des ressemblances insolites entre des personnes ayant vécu pendant cette même guerre de Sécession et des acteurs actuels. Cela prouve que l’œil humain peut voir des ressemblances incorrectes, reste à savoir si c'est le cas également pour la machine.

Plus d'infos en anglais sur le site CWPS ici

Dernière remarque, pourquoi ce système n'existe-t-il pas en France, pourquoi les archives nationales ne tenteraient pas d'identifier les photos de la guerre de 1870, voire d'autres photos anciennes ?

dimanche 12 janvier 2020

ADN et Généalogie XXIIe

Notre dernier article en octobre dernier sur le sujet essayait de démontrer que les arguments de la tribune de DNA Pass dans le journal Le Monde étaient fallacieux. Or depuis nous avons assisté en décembre à l'audition au sénat de la FFG, de DNA-Pass et de Geneanet et Filae puis il y a quelques jours au vote d'un amendement en faveur des tests ADN récréatifs. Comme le dit la revue française de généalogie (RFG) Quant à savoir si les tests ADN seront réellement autorisés en France, il est un peu tôt pour le dire. La Commission spéciale sur la bioéthique a voté certes deux amendements favorables, mais cela ne préjuge en rien des débats qui vont se tenir à partir de la semaine prochaine. Ils pourraient remettre en question cette autorisation. Et puis le texte sera revu à l'Assemblée, {où} les députés {peuvent initier} un nouvel amendement pour révoquer les amendements du Sénat.

Lire la suite

samedi 11 janvier 2020

Listes de diffusion VIe

Quelques semaines après Yahoo c'est au tour de Rootsweb de jeter l'éponge. En octobre dernier nous vous informions qu'Oath changeait les conditions d'utilisation de Yahoo, réduisant drastiquement les capacités des listes (perte de l'historique, plus de pièces jointes, plus d'invitations)... Le mouvement semble malheureusement être un mouvement de fond.

Lire la suite

mercredi 1 janvier 2020

Blog & réseaux sociaux de FGW : bilan 2019 (IIe)

Comme l'an dernier, voici la deuxième partie qui s'intéresse à ce qui a moins marché. Comme dit hier, contrairement à l'an dernier, sur les articles écrits cette année, aucun ne se dégage comme étant le plus commenté, il en va de même pour le moins commenté.

Lire la suite

mardi 31 décembre 2019

Blog & réseaux sociaux de FGW : bilan 2019

En cette fin d'année les blogueurs généalogiques font le bilan. L'occasion pour moi de vous signaler 2 bilans, celui de Jimbo et celui de Céline Souef. En y regardant de plus près, ces bilans sont d'ailleurs plus rédigés comme des objectifs pour 2020, le bilan 2019 étant celui de l'éparpillement pour Céline, celui de l'inaction pour Jimbo. Je comprends ce constat, mais je ne pense pas qu'il soit un échec, un projet généalogique n'est pas un projet fini, il y a toujours plus a chercher (en dehors de l'état-civil par exemple) et donc l'avancement n'est pas linéaire. Jimbo nous indique également dans ses objectifs, participer à la recherche de son sosa 2020, reproduisant la recherche du 2019 lancée par la FFG sur twitter en début d'année 2019

Lire la suite

jeudi 26 décembre 2019

Une autre façon de visualiser sa généalogie ?

gramps.JPG

M Wynands l'un des utilisateurs de Gramps vient de mettre en ligne une approche différente pour partager sa généalogie. Pour mieux comprendre, je vous propose de faire un clic droit sur les images afin de les ouvrir dans d'autres onglets de votre navigateur.

Lire la suite

jeudi 19 décembre 2019

Associations généalogiques : tout à réinventer (Ve) ?

Middle_Ages-b.jpg

Ce billet annuel fait série à celui de 2018, celui de 2017, celui de 2016 et celui de 2015. A vrai dire, l'annualité de la publication n'était pas inhérent au thème, mais depuis 5 ans, des articles de blog (Tom Prat, Brigitte Snejkovsky), un président d'association (Pierre Le Clercq) puis la fermeture de Bigenet ont alimenté le débat.

Lire la suite

samedi 23 novembre 2019

La notion de biens communs (VIIe)

7e opus de cette série qui a commencé en 2011. 3 épisodes (1, 2 et 4) centrés sur le sujet, 2 épisodes (3 et 5) croisés avec le droit d'auteur et un (6) croisé avec les notions de vie privée. Aujourd'hui intéressons nous à différencier bien commun et bien public

Lire la suite

dimanche 17 novembre 2019

Le généalogiste : égoïste ou altruiste IIe

Le premier opus se penchait sur les notions de travail dans un but personnel ou dans but collectif

Lire la suite

samedi 9 novembre 2019

Gedcom évolue

La norme Gedcom est la norme avec laquelle nos logiciels de généalogie peuvent s'échanger des informations. Cette norme n'avait pas évolué depuis 10 ans et elle vient de subir une (malheureusement) petite révision. Nos logiciels favoris suivront-ils ? Cela dépend un peu de leur bonne volonté et de l'instance que leurs utilisateurs mettent à demander cette fonction.

Lire la suite

dimanche 20 octobre 2019

ADN et Généalogie XXIe

Après le rejet en première lecture à l'assemblée des amendements à la loi de bioéthique autorisant les tests ADN récréatifs, Nathalie Jovanovic-Floricourt présidente de l’association DNA Pass a publié une tribune dans Le Monde. Je voudrais revenir sur certains éléments de cette tribune

Lire la suite

samedi 19 octobre 2019

Listes de diffusion Ve

Cinquième opus de ce fil consacré aux "listes de diffusion", le premier sous la plume de Fred nous montrait une évolution de l'interface en 2005, le second qui date de janvier 2009 posait le constat d'une utilisation abondante et regrettait la faiblesse de l'archivage et des moteurs de recherche, le troisième sous la plume de Bertrand Crepel qui date de mars 2010 annonçait une érosion du nombre de groupes et de messages, le quatrième en 2012 s'inquiétait de la dépendance à Yahoo

Lire la suite

dimanche 6 octobre 2019

ADN et Généalogie XXe

Cette semaine les amendements concernant la généalogie génétique dans la révision de la loi bioéthique étaient au menu de la première lecture des députés. Ces amendements ont été rejetés, sauf celui interdisant la publicité pour ces tests. Cela a donné lieu dans les temps précédents à un grand nombre de débats. Quelques points méritent d'être soulignés.

Lire la suite

lundi 30 septembre 2019

Du droit d'auteur (XXIIIe)

Vous l'avez peut-être remarqué le site enenvor.fr site d'histoire contemporaine en Bretagne et ses comptes Facebook/Twitter ont annoncé leur prochaine disparition.

Lire la suite

samedi 14 septembre 2019

ADN et Généalogie XIXe

Le sujet devenant vaste, je vous invite à retrouver sous forme abrégée les numéros précédents épisode 1, épisode 2, épisode 3, épisode 4, épisode 5, épisode 6, épisode 7, épisode 8, épisode 9, épisode 10, épisode 11, épisode 12, épisode 13, épisode 14, épisode 15, épisode 16, épisode 17, épisode 18

Lire la suite

dimanche 25 août 2019

Les archives militaires du département des Forêts

Connaissez-vous le département des Forêts ? C'est un ancien département français, qui exista du 1er octobre 1795 au 30 mai 1814, Il correspond aux territoires actuels de la province de Luxembourg, en Belgique, du grand-duché de Luxembourg et de l'ouest de la Rhénanie-Palatinat ainsi qu'à la commune de Manderen (57)

Lire la suite

dimanche 11 août 2019

ADN et Généalogie XVIIIe

Petit résumé des thématiques abordées dans les épisodes précédents dans le texte mais aussi dans les commentaires :

  • épisode 1 : la pub biaisée des sociétés de généalogie génétique.
  • épisode 2 : les dérives de racisme et de fichage sous prétexte d'étude sociologique et de santé. L'intelligence artificielle permet d'associer un ADN à une reconnaissance faciale
  • épisode 3 : les universités américaines travaillent sur un outil probabilistique de répartition géographique et des résultats sur la longévité, la fertilité, les schémas de migration et, dans certains cas, des caractéristiques faciales.
  • épisode 4 : le mythe des enfants adultérins démonté.
  • épisode 5 : le cas particulier de Hans Jonathan, antillais en Islande en 1802, le portrait robot ADN (couleur de peau, présence/absence de taches de rousseur, présence d'alopécie), les dérives racistes.
  • épisode 6 : les résolutions de cold cases à partir des fichiers d'ADN récréatif, les dérives de fichage, les dérives des assurances, les accords entre entreprises d'ADN et FBI. Le premier procès suite à une de ces arrestations s'ouvre et les avocats contestent la fiabilité du test.
  • épisode 7 : comparaison des séquençage complet, emprunte FNAEG et test récréatif. Dérives de revente des données à des fins médicales, incident de cybersécurité, le fichage d'état en Estonie, l'édition des gènes chez des enfants chinois, la technologie d'édition des gènes balbutiante et les effets "hors cibles", le séquençage complet de loisir.
  • épisode 8 : le sondage Geneanet et sa faible représentativité, biais et paradoxes des comparaisons (avec nos contemporains uniquement, avec des échantillons non représentatifs ou en sous nombre...) La fiabilité déplorable des interprétations, le problème des naissances sous X, l'amélioration génétique, l'eugénisme, la suppression du gène CCR5 et ses problèmes d'éthique, Ancestry qui déroute ses clients en changeant les origines ethniques, le conseil d’éthique UK dit qu'il est moralement permissible de créer des bébés génétiquement modifiés, les experts de l'OMS demandent un encadrement international de la correction du génome humain. L'idée que nous sommes nos gènes est fausse, les gènes ne contiennent aucun marqueur racial, ethnique ou culturel.
  • épisode 9 : la non toute puissance de prédiction médicale, la désinformation médicale des tests, la cybersécurité, la porosité entre les bases et les enquêtes de police, le fichage d'état en Angleterre, Ancestry poursuivi aux USA pour mésinformation et tromperie
  • épisode 10 : Geneanet se lance dans la bataille, résumé des dérives médecine, assurances, employeurs, police, racisme. Cybesécurité. Récréation avec Spotify, taille du marché de l'ADN, un premier site de rencontre à base de correspondance ADN de phéromones !
  • épisode 11 : le problème des naissances sous X, anciens vs nouveaux (tout en ligne) généalogistes, la perte d'information forte au delà de la 6e génération, le fichage généralisé, les dérives racistes dénoncées par les universitaires, les problématiques vues par les universitaires, l'impossibilité de renouvellement des données en cas de compromission.
  • épisode 12 : le marché de l'ADN : la fin de la gratuité des transferts de données brutes, les caractéristiques physiques héritées de vos ancêtres, les voyages sur mesure fonction des résultats ADN, la prédiction de la mortalité et la probabilité de contracter des maladies à partir de l'expression des gènes, la monétisation de l'ADN avec des entreprises de recherche prêtes à l'acheter, la publicité qui promet aux américains des réductions sur les billets d'avion fonction de leur pourcentage d'ADN mexicain. Sous prétexte d’études scientifiques, les laboratoires de généalogie génétiques étrangers vous font participer à la création d’une société façonnée par notre patrimoine génétique. Les monopoles de données qui se créent au profit d'industries privées. L'étude sur le marché des tests ADN de KPMG.
  • épisode 13 : le peu de fiabilité des résultats ADN les résultats entre des jumelles ou triplées homozygotes chez un même fournisseur de test ne sont pas identiques, les résultats sont différents d'une entreprise à l'autre
  • épisode 14 : les risques sur la cybersécurité, la volonté des chercheurs français d'avoir une base de données en France, une proposition de fichage généralisé dans l'Arizona, et un professeur d'Harvard qui nous rappelle qu'aucun ADN n'est "pur". L'abandon de la proposition en Arizona, son codicille étonnant sur le prélèvement de l'ADN des morts. Le lobby des entreprises de généalogie génétique pour promouvoir leur business auprès du législateur américain et leurs dizaines de milliers de dollars de financement
  • épisode 15 : l'audition à l'assemblée nationale, d'un généticien, de la FFG et de sociétés de généalogie dans le cadre de la future loi de bioéthique, la CNIL rappelle que ces tests récréatifs ne sont pas inoffensifs, l'appel des sociétés américaines à se ficher pour confondre les meurtriers, l'étude ADN sur les descendants des habitants des villes pillées aux Pays-Bas par l'infanterie espagnole au 16e siècle, l'appel au bannissement des sites de généalogie génétique par un professeur d'université pour protéger la vie privée des donneurs de sperme.
  • épisode 16 : l'ADN des morts au dos des timbres et des enveloppes. La non-fiablité de la source. Les questions éthiques qui s'y rapportent. La question de la vie privée des morts. La ruée vers l'os des anthropologues. L'ADN de Léonard de Vinci testable par tous. L'autorisation d'un tribunal américain faite à des parents concernant le sperme de leur fils unique mort dans sa deuxième décennie
  • épisode 17 : les quatre problèmes à ce que la police exploite les données ADN des sites de généalogie génétique : portée, consentement éclairé, vie privée, collecte à partir des élements abandonnés. Les compléments très fumeux aux tests généalogiques par réanalyse. Le partenariat Airbnb / 23andMe pour visiter les régions de ses ancêtres et sa portée en France analysée par un juriste. Les USA qui veulent changer leur droit sur les brevets pour autoriser les entreprises à breveter les gènes humains.

Lire la suite

dimanche 4 août 2019

Archéologie ou profanation ?

Nous nous sommes déjà intéressés plusieurs fois aux sujets de l'archéologie (ici ou ) ainsi que trois fois de la profanation des tombes (1,2,3), mais n'avions pas encore exploré le lien entre les deux

Lire la suite

samedi 13 juillet 2019

Ce qui est gratuit n'aurait-il pas de valeur ? (IIe)

Un peu plus de 10 ans après le premier opus (qui reste d'actualité et que je vous invite à relire), un article sur The Conversation relance le sujet avec de nouveaux arguments que nous reprenons ci-dessous

Lire la suite

samedi 22 juin 2019

ADN et Généalogie XVIIe

Petit résumé des thématiques abordées dans les épisodes précédents dans le texte mais aussi dans les commentaires :

  • épisode 1 : la pub biaisée des sociétés de généalogie génétique.
  • épisode 2 : les dérives de racisme et de fichage sous prétexte d'étude sociologique et de santé. L'intelligence artificielle permet d'associer un ADN à une reconnaissance faciale
  • épisode 3 : les universités américaines travaillent sur un outil probabilistique de répartition géographique et des résultats sur la longévité, la fertilité, les schémas de migration et, dans certains cas, des caractéristiques faciales.
  • épisode 4 : le mythe des enfants adultérins démonté.
  • épisode 5 : le cas particulier de Hans Jonathan, antillais en Islande en 1802, le portrait robot ADN (couleur de peau, présence/absence de taches de rousseur, présence d'alopécie), les dérives racistes.
  • épisode 6 : les résolutions de cold cases à partir des fichiers d'ADN récréatif, les dérives de fichage, les dérives des assurances, les accords entre entreprises d'ADN et FBI. Le premier procès suite à une de ces arrestations s'ouvre.
  • épisode 7 : comparaison des séquençage complet, emprunte FNAEG et test récréatif. Dérives de revente des données à des fins médicales, incident de cybersécurité, le fichage d'état en Estonie, l'édition des gènes chez des enfants chinois, la technologie d'édition des gènes balbutiante et les effets "hors cibles", le séquençage complet de loisir.
  • épisode 8 : le sondage Geneanet et sa faible représentativité, biais et paradoxes des comparaisons (avec nos contemporains uniquement, avec des échantillons non représentatifs ou en sous nombre...) La fiabilité déplorable des interprétations, le problème des naissances sous X, l'amélioration génétique, l'eugénisme, la suppression du gène CCR5 et ses problèmes d'éthique, Ancestry qui déroute ses clients en changeant les origines ethniques, le conseil d’éthique UK dit qu'il est moralement permissible de créer des bébés génétiquement modifiés, les experts de l'OMS demandent un encadrement international de la correction du génome humain. L'idée que nous sommes nos gènes est fausse, les gènes ne contiennent aucun marqueur racial, ethnique ou culturel.
  • épisode 9 : la non toute puissance de prédiction médicale, la désinformation médicale des tests, la cybersécurité, la porosité entre les bases et les enquêtes de police, le fichage d'état en Angleterre, Ancestry poursuivi aux USA pour mésinformation et tromperie
  • épisode 10 : Geneanet se lance dans la bataille, résumé des dérives médecine, assurances, employeurs, police, racisme. Cybesécurité. Récréation avec Spotify, taille du marché de l'ADN, un premier site de rencontre à base de correspondance ADN de phéromones !
  • épisode 11 : le problème des naissances sous X, anciens vs nouveaux (tout en ligne) généalogistes, la perte d'information forte au delà de la 6e génération, le fichage généralisé, les dérives racistes dénoncées par les universitaires, les problématiques vues par les universitaires, l'impossibilité de renouvellement des données en cas de compromission.
  • épisode 12 : le marché de l'ADN : la fin de la gratuité des transferts de données brutes, les caractéristiques physiques héritées de vos ancêtres, les voyages sur mesure fonction des résultats ADN, la prédiction de la mortalité et la probabilité de contracter des maladies à partir de l'expression des gènes, la monétisation de l'ADN avec des entreprises de recherche prêtes à l'acheter, la publicité qui promet aux américains des réductions sur les billets d'avion fonction de leur pourcentage d'ADN mexicain. Sous prétexte d’études scientifiques, les laboratoires de généalogie génétiques étrangers vous font participer à la création d’une société façonnée par notre patrimoine génétique.
  • épisode 13 : le peu de fiabilité des résultats ADN les résultats entre des jumelles ou triplées homozygotes chez un même fournisseur de test ne sont pas identiques, les résultats sont différents d'une entreprise à l'autre
  • épisode 14 : les risques sur la cybersécurité, la volonté des chercheurs français d'avoir une base de données en France, une proposition de fichage généralisé dans l'Arizona, et un professeur d'Harvard qui nous rappelle qu'aucun ADN n'est "pur". L'abandon de la proposition en Arizona, son codicille étonnant sur le prélèvement de l'ADN des morts.
  • épisode 15 : l'audition à l'assemblée nationale, d'un généticien, de la FFG et de sociétés de généalogie dans le cadre de la future loi de bioéthique, la CNIL rappelle que ces tests récréatifs ne sont pas inoffensifs, l'appel des sociétés américaines à se ficher pour confondre les meurtriers, l'étude ADN sur les descendants des habitants des villes pillées aux Pays-Bas par l'infanterie espagnole au 16e siècle, l'appel au bannissement des sites de généalogie génétique par un professeur d'université pour protéger la vie privée des donneurs de sperme.
  • épisode 16 : l'ADN des morts au dos des timbres et des enveloppes. La non-fiablité de la source. Les questions éthiques qui s'y rapportent. La question de la vie privée des morts. La ruée vers l'os des anthropologues. L'ADN de Léonard de Vinci testable par tous. L'autorisation d'un tribunal américain faite à des parents concernant le sperme de leur fils unique mort dans sa deuxième décennie

Lire la suite

- page 1 de 35