El reconocimiento automático de textos en letra gótica del Siglo de Oro: creación de un modelo HTR basado en libros de caballerías del siglo XVI en la plataforma Transkribus

Stefano Bazzaco

Università di Verona (Italia)
stefano.bazzaco.1@gmail.com
JANUS 9 (2020)
Fecha recepción: 14/10/20, Fecha de publicación: 29/10/20
Resumen

La presente investigación se centra en los principales aspectos de la digitalización masiva de textos y el reconocimiento automático de las imágenes digitalizadas por medio de software de OCR/HTR. Se presenta pues un experimento de reconocimiento HTR con libros de caballerías del siglo XVI y se propone un modelo apto para transcribir los textos de forma semi-automática y colaborativa.

Palabras clave
Reconocimiento automático de caracteres; OCR; HTR; libros de caballerías; letra gótica; Transkribus; Proyecto READ
Title

Automatic Text Recognition applied to Spanish Golden Age gothic script: creation of an HTR model based on 16th century Spanish Romances of Chivalry on the Transkribus platform

Abstract

The present investigation centres on the main aspects of massive digitalization of texts and the automated recognition of digitalized images thanks to OCR/HTR softwares. Finally, we present an experiment on HTR recognition dealing with XVI Century Spanish Romances of Chivalry and is delivered a model to transcribe in a semi-automated and collaborative way these texts.

Keywords
Automated Character Recognition; OCR; HTR; Spanish Romances of Chivalry; gothic script; Transkribus; READ Project
Visitas: 7447
Descargas: 1965