ALTO XML является стандартом хранения данных электронных коллекций для большинства библиотек, а также для организаций, занятых в оцифровке документов. Формат можно сравнить с PDF файлами с текстовым слоем, расположенным под слоем изображения.
ALTO XML сохраняет точные координаты текстовых, а также других элементов документа относительно исходного изображения, что очень важно при выделении искомого текста в результатах поиска.
ALTO XML должен присутствовать в арсенале профессионалов и любителей, занятных распознаванием и предоставлением распознанных данных для публикаций в электронном виде.