Sprachwissenschaften und LiteraturwissenschaftenSpanischWordPress

Lucidarios

Lucidarios
Editando el «Lucidario» de Sancho IV
StartseiteAtom-FeedISSN 2952-1580
language
EntradasBiblioteca Nacional De EspañaEditores ModernosJosé Amador De Los RíosLucidario ASprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

En la entrada anterior había identificado dos testimonios del Lucidario , B y C, anotados por la misma mano en el siglo 19, periodo en el que ambos formaron parte de la Real Biblioteca. La meticulosa naturaleza de las comparaciones, sin mencionar el privilegiado acceso de esta persona a la biblioteca, permite reducir la lista de potenciales culpables a unos cuantos próceres de la filología decimonónica.

EntradasCopistaEditores ModernosErrorLucidario BSprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

En la entrada anterior presenté el trabajo de un misterioso profanador del testimonio C del Lucidario . Decía ahí que el comentarista anotaba pasajes que diferían o faltaban en otro testimonio del Lucidario que consultó y a menudo introducía enmiendas en pasajes donde encontraba errores. Sin embargo, su trabajo no fue perfecto, pues en algunos casos propuso correcciones erróneas. Así ocurre en el fol.

EntradasCopistaEditores ModernosErrorLucidario ASprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

Volviendo de la pausa de dos semanas, quiero hablar ahora de un tema que llamó mi atención cuando comencé a trabajar con los testimonios A, B y C del Lucidario : la existencia de dos anónimos profanadores –modernos– que anotaron los manuscritos a su gusto, sin importarles su antigüedad ni su valor.

EntradasEscrituraHumanidades DigitalesLucidario CModelo De TranscripciónSprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

Retomo el hilo de Transkribus para discutir algunas cuestiones que surgen tras la transcripción. En la última entrada teníamos un modelo entrenado (y re-entrenado) y listo para ser utilizado en la transcripción automatizada del testimonio D del Lucidario . No hay más que hacer que decirle a Transkribus: ahora transcríbelo todo.

EntradasCopiaCopistaErrorEscrituraSprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

En la entrada anterior comencé a hablar de los errores por sustitución, cuya revisión terminaré en esta. El sexto tipo es la sustitución de palabras o frases, cuando el escriba establece mal el corte sintáctico de lo que aparece en su modelo.

EntradasCopiaCopistaErrorEscrituraSprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

En la entrada anterior hablé sobre los errores por alteración del orden. En esta entrada me dedicaré a los errores por sustitución. A diferencia de los errores por adición, omisión y alteración del orden, los errores de sustitución afectan palabras enteras.

EntradasEscrituraHumanidades DigitalesLucidario DModelo De TranscripciónSprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

En la entrada anterior expliqué los contenidos de la ventana de resumen del entrenamiento y la importancia de los valores de los CER de entrenamiento y de validación. En la primera versión del modelo, Lucid D 0.1, utilicé 3374 líneas de texto (o 50 páginas), logrando un CER de entrenamiento de 1.15% y un CER de validación de 2.97%. Este es el paso final del entrenamiento en Transkribus.

EntradasEscrituraHumanidades DigitalesLucidario DModelo De TranscripciónSprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

Al final de la entrada anterior habíamos recibido un correo de confirmación sobre la finalización exitosa del entrenamiento de un modelo de transcripción de letra manuscrita. Como dije entonces, el correo contiene un corto resumen y los datos más relevantes del nuevo modelo: los porcentajes de error de caracteres o CER ( character error rate ) en el set de entrenamiento y en el set de validación.

EntradasEscrituraHumanidades DigitalesLucidario DModelo De TranscripciónSprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

En la entrada anterior escribí sobre cómo comenzar un entrenamiento de un modelo CITLab HTR+ en Transkribus. Continúo aquí con el proceso. Lo último que había hecho era seleccionar el set de entrenamiento ( training set ) y el set de validación ( validation set ). Como dije entonces, este último set permite a la máquina evaluar la precisión del aprendizaje en el modelo que está desarrollado.

EntradasEscrituraHumanidades DigitalesLucidario CLucidario DSprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

Tras tres entradas de presentación sobre el trabajo con Transkribus –que en realidad son los sucesivos párrafos de introducción que me vi forzado a ampliar para darle un poco de sentido al trabajo que viene a continuación–, llego finalmente al punto más importante del trabajo con Transkribus: la creación y entrenamiento de un modelo de transcripción.

EntradasEscrituraHumanidades DigitalesLucidario DModelo De TranscripciónSprachwissenschaften und LiteraturwissenschaftenSpanisch
Veröffentlicht

Finalmente llegamos al momento en el que toca hablar sobre cómo realizar una transcripción automatizada. En esta entrada comienzo a describir el trabajo para el desarrollo de un modelo de transcripción para el testimonio D del Lucidario , el códice de Puñonrostro.