Lorsque Google a acheté Metaweb, l’été dernier, ils ont aussi fait l’acquisition de Freebase Gridwork, un outil de nettoyage des bases de données. Aujourd’hui Google sort une nouvelle version de cet outil et le renomme Google Refine. Comme son prédécesseur, Google Refine reste open-source. Il s’agit d’un outil de travail sur les lots de données, qui ne se limite pas à Freebase. D’après Google, il peut être utilisé pour « nettoyer les incohérences, transformer les données en les changeant de format, les étendre par d’autres données ».
Les évolutions les plus importantes :
- Une nouvelle architecture d’extension
- Standardisation du modèle de réconciliation qui autorise les services de réconciliation tierces.
- De nouvelles commandes et expressions.
Pour bien comprendre l’éntérêt de Google Refine, voici trois vidéos faites par Google :
Via ReadWriteWeb