Data set

Image data-set: Technical description

Both training and test data-sets consists of grey-level images in TIFF format at 300 dpi, picturing a 100 x 150 mm part of a manuscript.

The training set consists of 2000 images. The test set consists of 1000 images for task 1, and 2000 images for task 2.

The list of classes is provided in a CSV file with 2 columns: “FILENAME,SCRIPT_TYPE”.

Sources

The image collection used for the competition is mainly based on the collection of 9800 images from the French catalogues of dated and datable manuscripts[16]–[24]. This image collection is described and discussed in D. Stutzmann, “Clustering of medieval scripts through computer image analysis: towards an evaluation protocol,” Digital Medievalist, vol. 10, 2015.
It has been increased with the on-line documentation from the BVMM (http://bvmm.irht.cnrs.fr/) and Gallica (http://gallica.bnf.fr/) in order to build classes of the same size (cardinality).

Works cited

[16] C. Samaran, R. Marichal, M.-C. Garand, and J. Metman, Catalogue des manuscrits en écriture latine: portant des indications de date, de lieu ou de copiste, Tome I: Musée Condé et bibliothèques parisiennes, 2 vols. Paris: Centre national de la recherche scientifique, 1959.

[17] C. Samaran, R. Marichal, M.-C. Garand, and M. Mabille, Catalogue des manuscrits en écriture latine: portant des indications de date, de lieu ou de copiste, Tome II: Bibliothèque Nationale, fonds latin Nos.1 à 8000, 2 vols. Paris: CNRS, 1962.

[18] C. Samaran, R. Marichal, M.-C. Garand, and M. Mabille, Catalogue des manuscrits en écriture latine: portant des indications de date, de lieu ou de copiste, Tome V: Est de la France, 2 vols. Paris: CNRS, 1964.

[19] M.-C. Garand and M. Mabille, Catalogue des manuscrits en écriture latine portant des indications de date, de lieu ou de copiste. Tome VI, Bourgogne, centre, sud-est et sud-ouest de la France. Paris: CNRS, 1968.

[20] C. Samaran, R. Marichal, and M. Mabille, Catalogue des manuscrits en écriture latine: portant des indications de date, de lieu ou de copiste, Tome III: Bibliothèque Nationale, fonds latin Nos. 8001 à 18613, 2 vols. Paris: CNRS, 1974.

[21] C. Samaran, R. Marichal, M.-C. Garand, M. Mabille, and D. Muzerelle, Catalogue des manuscrits en écriture latine: portant des indications de date, de lieu ou de copiste, 4: Bibliothèque nationale Fonds latin (Supplément), nouvelles acquisitions latines, petits fonds divers, 2 vols. Paris: Centre national de la recherche scientifique, 1981.

[22] C. Samaran and R. Marichal, Catalogue des manuscrits en écriture latine: portant des indications de date, de lieu ou de copiste, Tome VII: Ouest de la France et pays de Loire, 2 vols. Paris: CNRS, 1985.

[23] D. Muzerelle, Manuscrits datés des bibliothèques de France. 1. Cambrai. Paris: CNRS Editions, 2000.

[24] D. Muzerelle, Manuscrits datés des bibliothèques de France, 2: Laon, Saint-Quentin, Soissons, 1 vols. Paris: CNRS éd, 2013.