Premier avertissement sans frais : toute cette partie du site est en chantier permanent, vérifiez la date de modification des données en bas de chaque table.

Second avertissement : certains des fichiers peuvent être un peu longuets à charger sur des connexions poussives.

Troisième (et dernier) avertissement : toutes ces classifications ont peu ou prou à voir avec la qualité des vins. Ça peut paraître évident, mais l'AOC (ou autre) ne garantit rien. Partout se côtoient le meilleur et le pire (bien que le meilleur soit parfois absent pour diverses raisons comme le "manque de typicité"). On aura donc (en général) une indication de provenance, parfois aussi de cépage, mais pour savoir si on va avoir affaire à un vin de qualité ou à une infâme cochonnerie, il faudra chercher ailleurs.

À quoi ça sert?
Le but final (on peut rêver) est d'intégrer ces données à un logiciel de gestion de cave. Mais comme je passe plus de temps sur la structure de la base de données que sur l'interface qui permettrait son utilisation, autant publier ce que j'ai déjà et éviter à d'autres de devoir tout créer. J'ai aussi l'espoir qu'une bonne âme (charitable ou non, mais compétente de préférence) consente à y jeter un œil averti et à me communiquer la liste des erreurs grossières et manifestes qui ne peuvent manquer d'y foisonner.

Comment ça marche?
Mauvaise question. À l'heure actuelle, il n'y a encore aucune application pour exploiter les données. Le jour où j'aurai résolu mes problèmes majeurs, je me bricolerai un programme local pour tester le bidule, ce qui entraînera vraisemblablement quelques (…) modifications fondamentales.

(Comment) est-ce organisé?
Là, c'est à la fois très simple et très compliqué. Au sommet, un fichier des pays basé sur la norme ISO 3166 et complété par des données spécifiques : producteur de vin ou non (pour faciliter un filtrage) et le cas échéant liste (pas toujours) hiérarchique des entités (généralement) géographiques qui le composent. Exemple français : région et sous-région.
Un autre fichier auxiliaire reprend les différents niveaux de qualité (à l'échelle nationale). Pour exemple, AOC, AO-VDQS, vin de pays, etc., mais pas premier cru ou grand cru pour la seule Bourgogne.
Enfin, les fichiers nationaux (éventuellement regroupés in fine en une seule table) détaillent ce que j'ai pu butiner un peu partout sur une flopée de sites vineux, mais aussi et surtout des sites légaux du style Legifrance, EUR-Lex et autres.

Structure des fichiers par pays
Clé: identificateur unique de la ligne
A3: le code alpha-3 du pays dans ISO 3166, qui est aussi le nom du fichier lui-même
Nom: l'appellation
TP: le type d'entité (défini dans le champ Chn de la table Pays)
NV: le niveau de l'appellation (défini dans le champ Nom de la table Niveau)
ParPtr: la clé du parent (nul pour l'entité la plus générale du pays)
SynPtr: la clé du synonyme que j'ai plus ou moins arbitrairement choisi comme norme (Hermitage pour Ermitage, L'Hermitage et L'Ermitage)
Parent: le nom du parent (redondant, mais bien pratique pour qui veut contrôler les relations sans avoir à écrire un utilitaire)
Synonyme: le nom du synonyme de base, aussi redondant que le parent

Ce qui est déjà là
Les pays (40 kB)
Les niveaux d'appellation (4 kB)
Les fichiers nationaux; s'il n'y a pas de taille, c'est que le fichier n'est pas encore publié, ou que j'ai oublié de mettre à jour
AUS Australie (15 kB)
AUT Autriche (283 kB)
BEL Belgique (2 kB)
BGR Bulgarie (19 kB)
CHE Suisse (130 kB)
CHL Chili (10 kB)
DEU Allemagne (387 kB)
ESP Espagne (218 kB)
FRA France (340 kB)
FRA France nouvelle version (AOP et IGP) (191 kB)
FRA quelques petites herreurs (ou orreurs) (51 kB)
GBR Royaume-Uni (2 kB)
GRC Grèce (51 kB)
HUN Hongrie (63 kB)
ITA Italie (658 kB)
LUX Luxembourg (5 kB)
NZL Nouvelle-Zélande (5 kB)
PRT Portugal (11 kB)
ROU Roumanie (84 kB)
USA États-Unis
ZAF Afrique du Sud (23 kB)

et, en rawète, les Bordeaux classés (33 kB), même si les bourgeois c'est comme les cochons.

Ce qui n'est pas (encore) là
Pour la France, les restrictions sur les types de vin (pas d'AOC Sauternes rouge ou Fitou blanc). J'ai les données, c'est juste une question de tout retravailler pour les incorporer, sans doute par le biais de nouvelles tables.
Pour l'Allemagne et l'Autriche, les couplages valides entre Großlage ou Einzellage et commune. En chantier pour l'Allemagne.
Pour beaucoup d'autres, beaucoup de choses. En particulier les termes locaux.

Les pépins
En dehors des données elles-mêmes, l'os majeur est à chercher du côté des caractères exotiques. Je n'ai pas encore réussi à exporter les caractères grecs (entre autres) d'Excel vers une table Access (pardon), FireBird ou MySQL. De là le format HTML. Je ne désespère pas (encore). Les correcteurs au fait des subtilités du hongrois, du roumain et généralement de tout, y compris le français, sont les bienvenus et leurs remarques itou.

Last update 2014-12-09