Polyglot Concordance / Metodología

Acerca de Polyglot Concordance

Esto es un piloto. El alcance actual es solo el Evangelio de Marcos. El plan completo — libros adicionales del NT, la Biblia hebrea como proyecto insignia, más testigos, formatos de exportación y dos subproyectos previstos — se detalla en la hoja de ruta abajo.

Una alineación palabra por palabra del Evangelio de Marcos entre tres testigos textuales — NT griego, Peshitta siríaca y Vulgata Clementina latina — con una nota de aparato de una o dos oraciones en cada divergencia.

Autor Jossi Fresco Benaim 0009-0000-2026-0836

Metodología

Cada versículo de Marcos ha sido alineado palabra por palabra entre los tres testigos por Claude Sonnet 4.5 de Anthropic mediante la Batch API. Cada grupo de alineación registra un veredicto de variantealigned, minor, major, omitted o added — más un tipo semántico (concordancia, construcción, armonización, sustitución, modismo, etc.) y, para cada grupo no alineado, una o dos oraciones aptas para un aparato crítico.

Los resultados se calculan previamente y se almacenan como archivos JSON por versículo en el repositorio — el visor en ejecución no tiene ninguna dependencia de LLM en tiempo de ejecución.

Validación de la metodología (y sus límites)

Hemos verificado el razonamiento de alineación de Claude frente a la Berean Interlinear Bible en la subtarea acotada de alineación palabra a palabra griego→inglés. En las 673 versículos de Marcos (6175 tokens evaluados), Claude coincidió con las glosas eruditas de Berean en el 67.7% de los tokens (4182 / 6175). Registrado el 2026-04-23T06:26:59.983024+00:00 con claude-sonnet-4-5.

El ~32% restante de no coincidencias corresponde en su mayoría a diferencias de elección léxica entre Berean y la WEB (las dos traducciones inglesas implicadas) — p. ej. Berean “crowd” frente a WEB “people” para el mismo griego ὄχλος — y no a errores de alineación.

Qué significa esto: es una verificación de coherencia transferible, no una garantía de exactitud. La lógica de alineación griego→inglés de Claude es coherente con un interlineal académico establecido, lo que descarta modos de fallo catastróficos y sugiere que las alineaciones tripartitas griego / Peshitta / Vulgata de este visor utilizan el mismo razonamiento razonable. No mide directamente la calidad de las alineaciones de la Peshitta o de la Vulgata (no existe una referencia de verdad de base), ni mide la calidad de las notas del aparato, la clasificación de variantes o la corrección de las etiquetas de tipo.

Berean se utiliza únicamente como referencia metodológica — nunca como datos visibles en el visor.

Inspiración del visor

El concepto de columnas paralelas y la codificación cromática de variantes en verde / rojo (menor frente a mayor) están inspirados en el visor paralelo bible-mt5 creado por Dr. Zhan Chen (Profesor Asociado de Ciencias Sociales Digitales y Distinguido Investigador Asociado en el Centro de Investigación de Historia y Cultura, United International College — BNU-HKBU UIC, Zhuhai). La propia investigación del Dr. Chen se centra en los textos bíblicos siríacos (tesis: An Investigation into the Peshitta of Isaiah, Harvard NELC, 2020) y en las traducciones chinas de la Biblia.

Fuentes de datos

NT griego (etiquetado)
STEP Bible TAGNT de Tyndale House Cambridge, CC BY 4.0, vía github.com/STEPBible/STEPBible-Data
Peshitta NT
Vía el corpus Aramaic Root Atlas (Jossi Fresco Benaim) — texto siríaco, empaquetado en CSV.
Vulgata Clementina
Dominio público, vía seven1m/open-bibles (USFX)
Glosa inglesa del versículo
World English Bible (WEB), dominio público
Raíces, cognados y raíces hermanas de la Peshitta
Aramaic Root Atlas (Jossi Fresco Benaim) — extracción de raíces triliterales, detección de raíces hermanas y mapeo de cognados hebreos / árabes. Lo utiliza la capa de tooltip al clic de este visor sobre los tokens de la Peshitta.
Referencia de validación de la alineación
Berean Interlinear Bible — solo verificación metodológica (67.7% de coincidencia sobre una muestra de 673 versículos).
Generación de la alineación
Anthropic Claude Sonnet 4.5

API

Los mismos artefactos que alimentan el visor se exponen como una API JSON pública y de solo lectura en /api/v1/. CORS abierto, con caché en el edge y documentación OpenAPI — cualquier herramienta puede obtener los datos de alineación, el índice de búsqueda o el manifest del corpus sin necesidad de raspar HTML ni clonar el repositorio.

Todos los endpoints son CORS-abiertos y están cacheados en el edge. Licencia: CC BY 4.0 para los datos de alineación derivados; redistribuir con atribución a las fuentes originales.

Obras relacionadas

Peshitta Constellations
peshitta.onrender.com — proyecto complementario que explora el corpus de la Peshitta.
Aramaic Root Atlas
aramaic-root-atlas.onrender.com — explorador de raíces triliterales semíticas entre corpus, con mapeo de cognados hebreos y árabes. Aporta los datos de raíces de la Peshitta que consume la capa de tooltip de este visor.
BibCrit
bibcrit.app — espacio de trabajo de crítica bíblica para análisis textual.

Para qué sirve esta aplicación

El motor subyacente es un visor de textos paralelos multitestigo con aparato crítico. Allí donde un texto exista en más de una versión, esta herramienta puede mostrarlo en paralelo con alineación palabra por palabra y divergencias anotadas.

Estudios bíblicos

Docencia

Trabajo de traducción

Descubrimiento orientado al lector

Hoja de ruta

Próximamente

Ampliar la cobertura de libros

Nuevo Testamento (continuando el alcance actual):

Biblia hebrea / Tanaj (un proyecto insignia aparte):

Deuterocanónicos / Apócrifos:

Ampliar la cobertura de testigos (dentro de los libros actuales)

Funciones del visor

Exportación

Subproyectos

Versificación

Las etiquetas de versículo siguen la numeración de NA28. La Vulgata Clementina utiliza una división de versículos distinta en algunos capítulos; donde es necesario (en particular Marcos 9 y Marcos 4:40–41) hemos remapeado el texto de la Vulgata a los límites de NA28. Véase known-issues.md en el repositorio para la lista completa de ediciones.

Licencia y reutilización

Está previsto que el código del visor se publique bajo una licencia de código abierto una vez que el proyecto cuente con financiación pública. El JSON de alineación derivado se produce a partir de fuentes con licencias mixtas (CC BY 4.0, dominio público); cualquier redistribución futura acreditará a las fuentes originales.

Contacto

Comentarios bienvenidos — jossi@somosunodigital.com.