Le format CSVM, dérivé du CSV, développé à la fin des années 90s, permet de stocker des données tabulaires accompagnées de métadonnées. Le format est adapté à la gestion agile et à l’échange de données brutes de type (ilots de données) dans tout contexte. Il s’agit d’un format pivot et générique, qui n’impose pas de types de données, qui s’appuie sur un jeu minimal de données et qui permet des annotations. Un fichier CSVM est lisible, modifiable, annotable à la fois par les humains et les machines, sans dispositions particulières (un éditeur de texte ou un tableur suffisent). Néanmoins, une boite à outils Python, un parseur, des extensions ont été développés pour une exploitation opérationnelle, notamment dans le cadre processus orientés données. Cette section regroupe des articles présentant le format, ses évolutions, des applications dans différent cas de figure …
Version 1.1 – Mise à jour octobre 2025
- CSVM : historique et conception
À la fin des années 1990, nous avions de nombreux problèmes conceptuels liés aux ensembles de données, brutes ou finalisées. C’était le cas en sciences de l’environnement ou nous avions ...
- Spécification CSVM-1
Cet article décrit les spécifications associées au format CSVM dans sa première version. Il s’agit à la fois du cadre de conception initiale du CSVM et d’une base permettant les ...
- Lecture et édition manuelle de fichiers CSVM
Un fichier CSVM peut être lu/édité avec un éditeur de texte ou un tableur, sous réserve de compatibilité avec les délimiteurs. En cas d’édition via un tableur, une table CSVM ...
- CSVM : CSVFileView une liseuse presque parfaite
Nirsoft utilities est une source d’outils freeware dédiés à l’administration système sous Windows, mais on y trouve aussi une liseuse CSV très intéressante : CSVFileView. Cet utilitaire est dédié à ...
- CSVM : interface Perl
Je n’utilise plus Perl, mais ce langage à servi pour la mise au point d’un premier parseur CSVM opérationnel (module build::csvm) et d’outils associés (développés en 2002-2004) . Les codes ...
- CSVM : interface Python
L’API Python permet une gestion souple et complète des fichiers CSVM, elle est opérationnelle depuis le début des années 2000, et succède à une couche expérimentale écrite en Perl. Les ...
- CSVM : dictionnaires
Les dictionnaires CSVM permettent de mettre en œuvre un système de transformation s’appliquant à des tables CSVM. Ces manipulations peuvent inclure des conversions dans les métadonnées (par exemple changer le ...
- CSVM : annotations et surcharges
Une extension du parseur (standard) Python permettent de gérer des annotations (par exemple des lignes de commentaires) portant sur la table, des blocs de lignes, ou des lignes individuelles. Des ...
CSVM c’est aussi la matérialisation d’une démarche orientée ‘données’ avec presque 20 d’avance sur les principes FAIR, avec une vraie opérationnalité. En effet se concentrer sur un paradigme précis, en l’occurrence des tables, permet de concevoir et de développer des outils pour toute la chaine : depuis la collecte jusqu’à la conservation à long terme.
Terminologie: CSVM pour CSV with Metadata. Dans le contexte CSVM, un îlot de données (data island) correspond généralement à une table, dont le nombre de lignes (inférieur à 10000) et de colonnes (inférieur à 100) sont limités. Il s’agit des données manipulées ‘au quotidien’ dans beaucoup de disciplines expérimentales ou descriptives.
Logs
- Rédaction en cours.