Tester (gedcom)

De WikiGenWeb
Aller à : navigation, rechercher

Tester son fichier GEDCOM

Fichier pour une première évaluation

Le fichier [http://web.archive.org/web/20041129133748/http://perso.club-internet.fr/sypey/gtest/testeval.ged testeval.ged] est construit en réunissant les données usuelles traitées dans les logiciels les plus diffusés. Il répond aux besoins de généalogistes exigeants et expérimentés.
Si certains logiciels ne traitent pas la totalité, ils ne sont pas pour autant à rejeter.
Ce test généraliste est conçu pour une première évaluation.

Nature des données

L'entité de base est une personne. Chaque personne est caractérisée par un patronyme et un ou plusieurs prénoms. Parfois elle est connue par un surnom. Il arrive que l'un des éléments évolue. Il est souhaitable d'en rendre compte par référence à une identification de base, qui doit être unique pour assurer la cohérence des enregistrements.
Les données correspondent à des événements. Ils sont décrits par rapport à une personne et aussi par rapport à une famille à laquelle participe cette personne. Il faut pouvoir préciser la nature de l'événement avec son contexte date et lieu. Le généalogiste connait ces événements à partir de sources qui doivent être enregistrées avec les documents soit de preuve (reproductions des sources) soit documentaire (photos). L'événement peut concerner d'autres personnes, participantes ou seulement témoins, et générer des relations qui doivent aussi figurer dans les données.

Structure des données

La structure arborescente définie par les règles gedcom excède largement les besoins tels qu'on les observe dans les logiciels y compris ceux réputés les plus complets. Il faut faire des choix pour atteidre le compromis décrivant l'objectif d'évaluation. Les voici :

  • --> Identification de la personne par une structure NAME avec toutes ses composantes. Une personne peut réunir plusieurs structures de ce type pour enregistrer l'évolution d'une des composantes, par exemple changement de patronyme, modification du prénom ou apparition d'un surnom. Rares sont les logiciels ayant cette capacité et il est important de vérifier.
  • --> Identification de la famille par une structure FAM précisant les membres mari, femme et enfants.
  • --> Description des événements par une structure EVEN pour les personnes et les familles. Ce tag générique permet de traiter les événements spécifiques avec une désignation définie par l'utilisateur. Cependant des structures de même contenu sont prévus avec des tags standards pour les situations fréquentes, par exemple BIRT pour la naissance d'une personne, MARR pour le mariage d'un couple. La liste complète est détaillée à la page décrivant le modèle gedcom.

Dans le cas des personnes une seconde catégorie de tags est désignée par attributs ( parfois caractéristiques ) pour enregistrer un élément durable, voire permanent, comme la religion ou un titre. Une liste des standards est également détaillée dans la page modèle gedcom.

  • --> Enregistrement de notes dans une structure NOTE pour recueillir tous les renseignements qui ne trouvent pas place dans les autres structures. Une note est un texte libre qui peut aussi contenir les remarques du chercheur. Gedcom prévoit deux possibilités: note intégrée ou note séparée. Dans ce fichier échantillon la structure intégrée est retenue. La première raison découle de la nature même d'une note qui est un détail ou un complément et il est logique de l'associer au renseignement qu'elle documente. Une autre raison plus technique que généalogique est que l'espace consommé dans le fichier est beaucoup plus petit. Ce choix est retenu dans la majorité des logiciels.
  • --> Enregistrement des sources dans une structure SOUR pour rapporter la preuve, la justification d'un événement ou d'une situation. Deux structures sont possibles: intégrée ou séparée. La structure intégrée est mieux adaptée avec son mécanisme de citation qui permet de référencer la même source à plusieurs autres structures. Par exemple un acte de mariage contient beaucoup d'informations et pour chaque information c'est le même enregistrement de source qui sera appelé. Cette structure séparée permet de faire appel à plusieurs sources différentes pour un même renseignement. La convergence de renseignements participe à l'obtention de la certitude, l'idéal du généalogiste. Un logiciel sérieux doit être organisé selon cette structure et c'est la seule présente dans le fichier d'évaluation.
  • --> Structures complémentaires

D'autres renseignements usuels figurent dans une base de données sont organisés en structure: les relations entre personnes dans une structure ASSO en mode intégré Les références a des documents externes au fichier dans une structure OBJE Pour les documents multimédias le fichier contient les deux modes intégré et séparé. En effet les logiciels du marché utilisent plus souvent le mode intégré, ce qu'on ne peut ignorer. Pourtant le mode séparé est plus efficace, par exemple pour relier une photo de groupe à chaque personne

  • --> Structures multiples: Le fichier est un assemblage des structures décrites ci-dessus, qui sont toutes présentes. Il suffit qu'elles apparaissent au moins une fois pour que le test soit significatif de l'interprétation. Par ailleurs le concept de base prévoit un usage multiple pour toutes les structures. Pour les enregistrements INDI et FAM c'est évident. Pour les structures imbriquées cela doit être vérifié. Alors le fichier contient plusieurs usages de chacune des structures de ce type; en particulier plusieurs noms pour une personnes, plusieurs professions pour un même individu, plusieurs événements de chaque type pour les personnes et les familles, plusieurs relations et plusieurs documents multimédias. Les notes et sources participent à plusieurs niveaux. Les cas retenus sont mentionnés dans la présentation des données généalogiques qui suit.

Données généalogiques

La base d'évaluation contient six personnes:

   ind1 Joseph Delpech
   ind2 Marie Delcros
   ind3 Baptiste Delpech
   ind4 René Sergent
   ind5 Rose Vergne
   ind6 Pierre Duval
  • Baptiste est enfant du couple Joseph Delpech et Marie Delcros cette famille FAM1 enregistre les événements :ENGA, MARB, MARR, MARC, DIV, EVEN et Voyage (création)
  • Marie née DELCROS est aussi enregistrée sous DUCROS soit deux fois NAME pour la même personne. Son enregistrement contient 4 notes intégrées distinctes et 4 sources séparées.
  • Joseph Delpech reçoit les attributs :OCCU (3 fois), PROP, RELI, RESI, TITL et les événements BURI, CREM, WILL
  • Baptiste Delpech supporte BIRT CHR DEAT et maladie (création) avec 3 sources pour la personne, 2 pour la naissance et 3 pour le baptême
  • Pierre Duval est adopté par Joseph Delpech et Marie Delcros selon détail sous ADOP.
  • Rose Témoin est locataire du couple Joseph Delpech et Marie Delcros par ASSO dans INDI elle est unique témoin dans DIV ENGA MARB MARC
  • Rose Vergne est témoin dans BURI EVEN CREM WILL BIRT CHR DEAT ADOP
  • Rose Vergne et Rose Témoin sont les deux témoins dans MARR EVEN

Une source est présente dans le fichier bien qu'elle ne soit jamais appelée.

La structure du fichier est limitée de la façon suivante
enregistrement d'en tête HEAD réduit à l'indispensable suppression des enregistrement submitter et submission concernant seulement la gestion du fichier les éléments spécifiques LDS sont écartés tous les textes sont limités à un ligne La limitation à une ligne dans NOTE, sauf dans le premier enregistrement, ne réduit pas la performance du test. En effet la répétition des tags CONC et CONT serait seulement encombrante. Il suffit de s'assurer que le logiciel sait décomposer un texte dans un fichier quelconque et d'admettre qu'il saura le faire chaque fois que nécessaire.

Méthode d'évaluation

La vraie question qui vous préoccupe : comment réagit mon logiciel. Pour y répondre, vous importez le fichier échantillon préalablement téléchargé par le lien ci-avant.

La consultation directe dans votre logiciel vous permettra un rapprochement avec les données décrites au précédent paragraphe  : données généalogiques.

Pour une analyse rigoureuse vous devrez exporter dans un autre fichier gedcom depuis votre logiciel. Avec l'utilitaire GedProfil vous obtiendrez la liste complète des données restituées que vous comparerez à celles du fichier échantillon.

Exemples de résultats

Cette procédure est appliquée à des logiciels soit gratuit soit en version évaluation pour que chacun puisse tester par lui même et acquérir un expérience.

  • Généatique MX démo 1.0.7
  • Heredis démo 7.1
  • PAF 4.0.4
  • Brothers Keeper 6.1.15
  • Legacy 4


Les résultats sont présentés dans le tableau de la page [http://web.archive.org/web/20040812100833/http://perso.club-internet.fr/sypey/gtest/evaltablo.html test évaluation] .

Ces résultats n'ont aucun intérêt pour vous, si votre logiciel n'est pas dans la liste ou si sa version est différente. Quelques minutes vous suffiront pour executer le test. Et pour l'avenir vous pourrez vérifier les mises à jour de votre logiciel avec la même facilité.

Fichiers pour test import gedcom

Les éditeurs de logiciels ne publient pas la liste des données importables par la fonction gedcom. C'est pourtant un élément essentiel pour l'utilisateur. Pour compenser cette négligence un moyen consistera à importer un fichier test et à répertorier les données réellement importées.

Données généalogiques

La base contient six personnes:

   ind1 Joseph Delpech
   ind2 Marie Delcros
   ind3 Baptiste Delpech
   ind4 René Sergent
   ind5 Rose Vergne
   ind6 Pierre Duval
  • Joseph Delpech et Marie Delcros se sont mariés et sont parents de Baptiste.

Ce couple FAM1 enregistre les 11 événements : ANUL CENS DIV DIVF ENGA MARR MARB MARC MARL MARS EVEN

  • Marie née DELCROS est aussi enregistrée sous DUCROS soit deux fois NAME pour la même personne.
  • Joseph Delpech reçoit 12 attributs : CAST DSCR EDUC IDNO NATI NCHI NMR PROP RELI RESI SSN TITL

et 3 métiers différents sous OCCU pour tester son usage multiple.

Pour les événements individuels:

  • Baptiste Delpech supporte BIRT CHR et DEAT
  • Joseph Delpech supporte :

BAPM BARM BASM CHRA BLES BURI CENS CONF CREM EMIG EVEN FCOM GRAD IMMI NATU ORDN PROB RETI WILL

  • Pierre Duval est adopté par Joseph Delpech et Marie Delcros selon détail sous ADOP.

Pour liens et relation

  • René Sergent est locataire du couple Joseph Delpech et Marie Delcros par ASSO dans INDI

ASSO dans un événement pour décrire:

  • René Sergent et Rose Vergne était le premier présent et la seconde témoin d'un événement sans désignation du dit événement.
  • Les mêmes étaient déclarants au décès de Joseph Delpech

Autres renseignements

Le détail des éléments ci dessus est disponible dans SOUR NOTE OBJE et REPO intégré dans les enregistrements en respectant les structures de la grammaire.

Les tags SOUR NOTE OBJE REPO peuvent contenir soit une référence à un enregistrement soit un texte descriptif. Cette seconde formule est maintenue dans la version 5.5 pour compatibilité avec les versions précédentes. Elle est moins performante mais certains logiciels continuent à la retenir. Les deux méthodes sont présentes chaque fois que cela est possible.

Les tags utilisés

Les règles de la grammaire conduisent à une liste de 4142 combinaisons ( 10 pour les enregistrements et 4132 pour les données ). En pratique elles ne sont pas présentes dans tous les fichiers, certaines sont usuelles d'autres exceptionnelles.

Ainsi trois fichiers de portée progressive sont proposés. Le premier, le plus léger, teste la capacité à transmettre la filiation. Il correspond aux logiciels simples contenant les données sans mention de commentaires ou indication de sources. Le second fichier contient des sources et des notes et décrit tous les événements tant pour les familles que pour les personnes. Le troisième est étendu à tout le potentiel de la grammaire gedcom pour les données proprement dites.

Le détail est exposé dans un tableau synoptique pour une vision globale.

La structure du fichier global est correcte mais le nombre des combinaisons est limité par les choix suivants: enregistrement d'en tête réduit à l'indispensable suppression des enregistrement submitter et submission concernant seulement la gestion du fichier les éléments spécifiques LDS sont écartés tous les textes sont limités à un ligne La limitation à une ligne, sauf dans l'enregistrement NOTE, ne réduit pas la performance du test. En effet la répétition des tags CONC et CONT n'est pas significative. Il suffit de s'assurer que le logiciel sait décomposer un texte dans un fichier quelconque et d'admettre qu'il saura le faire chaque fois que nécessaire.

Le nombre total des combinaisons est ramené à 2932. Cette réduction entraine un gain sur les temps de traitement sans amoindrir la performance du test.

Tableau synoptique de test

Portée repérée par caractère mini moyen max

INDI NOTE txt SOUR ptr OBJE CHAN/DATE
INDI/NAME NOTE txt SOUR ptr
INDI/NAME+surnom,préfixe,suffixe plusieurs
FAMSINDI/SEX+FAMC+FAMS
(INDI/BIRT & = INDI/DEAT)+DATE+PLAC NOTE txt SOUR ptr OBJE
INDI/OCCU plusieurs
INDI/ASSO+RELA+TYPE NOTE txt
INDI/ATTR+TYPE+DATE+PLAC NOTE txt SOUR ptr OBJE ADDR
INDI/EVEN+TYPE+DATE+PLAC NOTE txt SOUR ptr OBJE ADDR
INDI/EVEN/ASSO + RELA NOTE txt
FAM NOTE txt SOUR ptr OBJE CHAN/DATE
FAM/HUSB+WIFE+CHIL
FAM/MARR+DATE+PLAC NOTE txt SOUR ptr OBJE
FAM/EVEN+TYPE+DATE+PLAC NOTE txt SOUR ptr OBJE ADDR
FAM/EVEN/ASSO + RELA NOTE tx
SOUR+TEXT+REPO NOTE txt OBJE CHAN/DATE
NOTE SOUR ptr
OBJE+FILE+TITL NOTE txt SOUR ptr


TEST MINI

C'est vraiment le minimum. Il couvre la filiation seulement. Des notes texte sont associées à FAM, FAM/MARR, INDI, INDI/BIRT et INDI/DEAT.

TEST MOYEN

Il complète le précédent par la présence d'attributs pour les personnes et d'événements pour les personnes et les familles. Tous les éléments spécifiques sont inclus, ainsi que le tag générique autorisant l'enregistrement de renseignements définis par l'utilisateur, si toutefois le logiciel le permet.

La vérification concerne l'enregistrement de notes et de sources chaque fois que cela est possible. Pour les notes seule la structure en mode texte est retenue. C'est la plus légère et c'est aussi le choix de la majorité des logiciels. Par contre pour les sources c'est la stucture liée qui est préférée car une source fournit généralement plusieurs informations. Le mécanisme de citation donne toute souplesse pour minimiser le temps de saisie et l'espace consommé par les données.

Il contient aussi plusieurs noms et ses composantes pour le même individu et également plusieurs métiers toujours pour une même personne, avec mention de date et lieu.

TEST MAX ou GLOBAL Le complément essentiel est l'introduction de documents multimédia, en particulier photos pour les personnes et reproductions de documents d'archive pour les références et la documentation. Pour note source et objet les deux structures, texte et liée, sont disponibles pour tester toutes les situations des versions 4 et 5 des règles gedcom.

Également, bien que peu utilisées, sont présentes les adresses et dates de mise à jour de chaque type d'enregistrements.

La Procédure de test avec des exemples de résultats

COMMENT TESTER Les fichiers échantillons sont disponibles pour téléchargement ci dessous.

vérification filiation testmini testmini.zip les événements et les relations de personnes testmoyevas testmoyevas.zip controle de toute l'étendue gedcom testmax testmax.zip

Les résultats d'essais Consulter les relevés avec les fichiers mini moyen Le test complet conduit à beaucoup d'erreurs, pour des situations marginales en l'état actuel des logiciels, mais sans retombées pratiques. Ces détails dépasseraient le cadre de ce site.

L'adage
qui peut le plus peut le moins, ne s'applique pas. Le test complet déclenche des erreurs inattendues face aux défaillances des logiciels. Il en serait autrement avec des logiciels conformes aux règles.

Il suffit d'importer dans le logiciel pour lequel vous rechercher une évaluation de performance. Généralement un relevé des éventuelles difficultés est disponible dans un fichier texte ( extension lst, log le plus souvent).

Vous devrez exporter le résultat de l'importation. Si vous désirez pouvoir consulter le fichier obtenu dans un éditeur il est préférable de paramétrer votre logiciel sur caractères ANSI plutôt que ANSEL. Pour mesurer le résultat vous devez maintenant lire le fichier exporté dans GedProfil qui vous fournira la liste des tags et le nombre d'apparitions de chacun d'eux. Si votre logiciel fait appel à des tags de sa création ils seront également reportés. Cette liste résultat peut être enregistrée en format html pour consultation dans votre navigateur habituel.

COMMENT INTERPRETER Vous disposez d'une mesure objective qui montre ce que votre logiciel a exporté. La comparaison à la liste du fichier test indique si tout est bien importé puis exporté. Si oui vous trouverez:

  • 27 combinaisons pour le test mini
  • 496 combinaisons pour le test moyen
  • 2929 combinaisons pour le test maxi

EXEMPLES DE RESULTAT ATTENTION - Votre logiciel est peut-être capable d'exporter d'autres données en faisant appel à d'autres combinaisons qui lui sont spécifiques. Il est aussi possible que des données présentes dans la base ne soient pas exportées. Vous ne pouvez pas conclure sur ces points à partir des fichiers tests.

Par contre GedProfil appliqué à vos fichiers extraits de votre logiciel vous fournira des éléments d'appréciation au dela des fonctions strictement gedcom.

Enregistrement des images Dans la suite seul le mot image sera utilisé pour décrire les médias, en général. Pour la majorité il s'agit de photos de personnes ou de reproductions des sources.

L'objectif consiste à vérifier la capacité de transmission des images par chaque logiciel. Ces images ont d'abord été enregistrées dans la base de données par les fonctions de saisie de chaque logiciel. La situation est celle d'un utilisateur qui souhaite transférer au moyen d'un fichier gedcom.

Contrairement à ce que la portée générale de gedcom évoque, chaque logiciel est spécifique. J'avoue ne pas comprendre pourquoi les éditeurs ne retiennent pas la règle, sauf à rendre leurs clients captifs. Cette page se termine par un souhait : [ attente des utilisateurs ] et j'invite tous les lecteurs à exprimer leur désir.

Rappel de la grammaire gedcom pour les médias La version gedcom 5.5 présente deux possibilités ; Intégration dans les enregistrements à documenter Liaison par citation dans l'enregistrement à illustrer vers une sructure média

Exemple d'intégration 2 OBJE description 3 FORM format du fichier 3 TITL désignation du média 3 FILE fichier avec chemin

Exemple de citation 2 OBJE @OBJ1@ 0 @OBJ1@ OBJE 1 FILE fichier avec chemin 2 FORM format du fichier 3 TYPE support 2 TITL désignation 1 NOTE note objet 1 SOUR @SOUR1@

attente des utilisateurs Un codage intégré, conforme et minimal, donnerait satisfaction appliqué dans tous les logiciels:

1 OBJE 2 FILE averc chemin et nom du fichier

L'indication correspondant à FORM est contenue dans l'extension du nom de fichier. La mention TITL pour introduire le titre et/ou la désignation serait un plus et favoriserait la gestion.

Quant à une note et une source, comme prévu dans la règle, ce serait un luxe apprécié.

Cependant la production d'un répertoire avec les documents associés au gedcom est quasi indispensable. Son contenu devrait être transféré, à charge pour le destinataire de prendre soin à l'implanter au bon endroit.

Auteur

Ensemble de page réalisées par Sylvain Peyrichou (décédé en 2005).

Son site a fermé.

Il est encore consultable dans les archives du web http://web.archive.org/web/20041015225404/http://perso.club-internet.fr/sypey/
et aussi sur les pages de Bertrand Maillard: http://bertrand-maillard.pagesperso-orange.fr/sylvain/index-2.html

A voir aussi

  • Transfert (protocoles) Gedcom est largement utilisé à travers le monde entier, mais d'autres sont envisageables.