Message posté par : Christophe Vergon (christophe.vergon(a)protonmail.com)
----------------------------------------
Bonjour,
Une première remarque, parler de base de données en lieu est place de formats
d'échanges me chagrine toujours un peu.
Certes c'est un jeu de données mais pour moi j'associe à base de données un
système de gestion. Je sais c'est discutable.
La BD-Topo est pour moi un (des) jeux de données dans un format d'échange X.
Et c'est au moment de l'intégration dans un SGB que le contenu des fichiers de
données est formaté selon les choix du gestionnaire du système.
Ensuite en tant que développeur et codeur depuis de nombreuses années, je trouve souvent
le point de vue "géomatique" très centré sur les besoins,
envies de l'utilisateur métier et éloigné, souvent par ignorance, des notions et
contraintes "informatiques" partagées mondialement par les développeurs.
Je suis en accord avec AI3+ sur les points évoqués en matière de redondance et de coût.
Le contenu d'une données est conditionné par son codage, qui lui même dépend de deux
choses :
L'encodage (UTF8 et consorts)
Le séparateur décimal et le système de date heure.
Ces deux points sont des casse tête récurrents pour les codeurs du monde entier.
Donc le
-----------------
Citation :
"Libellé affichable conforme aux normes d'orthographe et d'orthotypographie
de la langue française de France" (pour faire court).
-----------------
c'est du WIN1252 pour les uns ou de l'ISO 8859 pour certains autres et
j'arrête là la liste des encoding utilisables.
Demander des modifications à l'IGN pour pouvoir afficher telle ou telle donnée en
fonction de ses envies est inopportun, pourquoi vous ne demandez pas à Microsoft et Excel
de générer des fichiers conformes à vos attentes ? Qui n'a pas perdu du temps pour
retravailler les csv en Open Data ???
Chaque producteur de données y va de la sienne ... et qui séparateur "," pour
les nombres réels, qui win1252 et qui LATIN1 pour les champs texte ...
Commençons par éviter les majuscules dans les noms de champs, les ' et autres "
dans les contenus des champs ce serait déjà un réel progrès.
Donc parler d'universalité (et de WORM) c'est souvent une vision très française
hexagonale.
La phase d'intégration de données issues de fichiers d'échange dans un Système de
Base de Données sera toujours présente et c'est le lieu du formatage, du contrôle et
pour les systèmes relationnels de celui de l'intégrité. Ce, pour se conformer au MCD
choisi par le concepteur de la BD en accord avec ses utilisateurs.
----------------------------------------
Le message est situé
https://georezo.net/forum/viewtopic.php?pid=369190#p369190
Pour y répondre : donnees(a)ml.georezo.net ou reply de votre messagerie
Pour vous désabonner connectez-vous sur le forum puis Profil / Abonnement
--
Association GeoRezo - le portail géomatique
https://georezo.net