Acerca de Polyglot Concordance

Esto es un piloto. El alcance actual es solo el Evangelio de Marcos. El plan completo — libros adicionales del NT, la Biblia hebrea como proyecto insignia, más testigos, formatos de exportación y dos subproyectos previstos — se detalla en la hoja de ruta abajo.

Una alineación palabra por palabra del Evangelio de Marcos entre tres testigos textuales — NT griego, Peshitta siríaca y Vulgata Clementina latina — con una nota de aparato de una o dos oraciones en cada divergencia.

Autor Jossi Fresco Benaim 0009-0000-2026-0836

Metodología

Cada versículo de Marcos ha sido alineado palabra por palabra entre los tres testigos por Claude Opus 4.8 de Anthropic mediante la Batch API. Cada grupo de alineación registra un veredicto de variante — aligned, minor, major, omitted o added — más un tipo semántico (concordancia, construcción, armonización, sustitución, modismo, etc.) y, para cada grupo no alineado, una o dos oraciones de anotación tipo aparato. El resultado es un borrador de alineación generado por máquina, pensado como punto de partida para revisión erudita y no como una edición crítica autoritativa.

Los resultados se calculan previamente y se almacenan como archivos JSON por versículo en el repositorio — el visor en ejecución no tiene ninguna dependencia de LLM en tiempo de ejecución.

Validación de la metodología (y sus límites)

Hemos verificado el razonamiento de alineación de Claude frente a la Berean Interlinear Bible en la subtarea acotada de alineación palabra a palabra griego→inglés. En las 673 versículos de Marcos (6175 tokens evaluados), Claude coincidió con las glosas eruditas de Berean en el 67.7% de los tokens (4182 / 6175). Registrado el 2026-04-23T06:26:59.983024+00:00 con claude-sonnet-4-5.

El ~32% restante de no coincidencias corresponde en su mayoría a diferencias de elección léxica entre Berean y la WEB (las dos traducciones inglesas implicadas) — p. ej. Berean “crowd” frente a WEB “people” para el mismo griego ὄχλος — y no a errores de alineación.

Qué significa esto: es una verificación de coherencia transferible, no una garantía de exactitud. La lógica de alineación griego→inglés de Claude es coherente con un interlineal académico establecido, lo que descarta modos de fallo catastróficos y sugiere que las alineaciones tripartitas griego / Peshitta / Vulgata de este visor utilizan el mismo razonamiento razonable. No mide directamente la calidad de las alineaciones de la Peshitta o de la Vulgata (no existe una referencia de verdad de base), ni mide la calidad de las notas del aparato, la clasificación de variantes o la corrección de las etiquetas de tipo.

Berean se utiliza únicamente como referencia metodológica — nunca como datos visibles en el visor.

La estabilidad entre ejecuciones está medida, y es imperfecta. El corpus publicado (v2.0.0, Claude Opus 4.8) es una sola muestra de un proceso de generación que aún varía entre ejecuciones: dos ejecuciones independientes de Marcos 13 en Opus 4.8 coinciden en solo ~76 % de las membresías de grupo de alineación, con un 90 % de acuerdo en el veredicto y un 76 % de acuerdo en el tipo semántico sobre los grupos compartidos — es decir, aproximadamente una cuarta parte de todos los grupos son inestables entre ejecuciones. La confianza autoinformada del modelo (~0,86) no está calibrada frente a la corrección y no debe leerse como una señal de calidad. La actualización de Sonnet 4.5 (corpus v1.0.0) a Opus 4.8 (v2.0.0) mejoró de forma medible tanto la exactitud — 4 de 4 errores de aparato verificados a mano evitados, incluido uno que Sonnet repetía de forma sistemática — como la consistencia (+11 pp de acuerdo en la membresía de grupo), pero no eliminó ninguna de las dos. Este corpus se trata mejor como un borrador de alineación generado por máquina, no como una edición crítica autoritativa.

Inspiración del visor

El concepto de columnas paralelas y la codificación cromática de variantes en verde / rojo (menor frente a mayor) están inspirados en el visor paralelo bible-mt5 creado por Dr. Zhan Chen (Profesor Asociado de Ciencias Sociales Digitales y Distinguido Investigador Asociado en el Centro de Investigación de Historia y Cultura, United International College — BNU-HKBU UIC, Zhuhai). La propia investigación del Dr. Chen se centra en los textos bíblicos siríacos (tesis: An Investigation into the Peshitta of Isaiah, Harvard NELC, 2020) y en las traducciones chinas de la Biblia.

Fuentes de datos

NT griego (etiquetado): STEP Bible TAGNT de Tyndale House Cambridge, CC BY 4.0, vía github.com/STEPBible/STEPBible-Data
Peshitta NT: Vía el corpus Aramaic Root Atlas (Jossi Fresco Benaim) — texto siríaco, empaquetado en CSV.
Vulgata Clementina: Dominio público, vía seven1m/open-bibles (USFX)
Glosa inglesa del versículo: World English Bible (WEB), dominio público
Raíces, cognados y raíces hermanas de la Peshitta: Aramaic Root Atlas (Jossi Fresco Benaim) — extracción de raíces triliterales, detección de raíces hermanas y mapeo de cognados hebreos / árabes. Lo utiliza la capa de tooltip al clic de este visor sobre los tokens de la Peshitta.
Referencia de validación de la alineación: Berean Interlinear Bible — solo verificación metodológica (67.7% de coincidencia sobre una muestra de 673 versículos).
Generación de la alineación: Anthropic Claude Opus 4.8

API

Los mismos artefactos que alimentan el visor se exponen como una API JSON pública y de solo lectura en /api/v1/. CORS abierto, con caché en el edge y documentación OpenAPI — cualquier herramienta puede obtener los datos de alineación, el índice de búsqueda o el manifest del corpus sin necesidad de raspar HTML ni clonar el repositorio.

/api/docs — Swagger UI interactivo renderizado a partir de la especificación OpenAPI 3.0.
/api/v1/manifest — Metadatos del corpus: testigos, ediciones de glosa, versión del esquema, enumeración completa de versículos y procedencia de la generación de alineaciones con la referencia Berean.
/api/v1/alignment/{book}/{chapter}/{verse} — JSON canónico de alineación para un versículo — grupos de alineación con veredicto, tipo semántico, prosa de aparato y puntuación de confianza.
/api/v1/verse/{book}/{chapter}/{verse} — Diccionario del versículo en forma de presentación — testigos con tokens etiquetados por alineación, variantes y el gloss_map multilingüe.
/api/v1/search?q={query} — Búsqueda de texto completo a nivel de versículo en todos los testigos y tipos de variante. Se admiten saltos por referencia (p. ej. 13:14).

Todos los endpoints son CORS-abiertos y están cacheados en el edge. Licencia: CC BY 4.0 para los datos de alineación derivados; redistribuir con atribución a las fuentes originales.

Obras relacionadas

Peshitta Constellations: peshitta.onrender.com — proyecto complementario que explora el corpus de la Peshitta.
Aramaic Root Atlas: aramaic-root-atlas.onrender.com — explorador de raíces triliterales semíticas entre corpus, con mapeo de cognados hebreos y árabes. Aporta los datos de raíces de la Peshitta que consume la capa de tooltip de este visor.
BibCrit: bibcrit.app — espacio de trabajo de crítica bíblica para análisis textual.

Para qué sirve esta aplicación

El motor subyacente es un visor de textos paralelos multitestigo con alineación y anotaciones de aparato generadas por IA. Allí donde un texto exista en más de una versión, esta herramienta puede mostrarlo en paralelo con alineación palabra por palabra y divergencias anotadas.

Estudios bíblicos

Estudio crítico-textual — observe dónde un versículo del NT griego, su traducción en la Peshitta y su versión en la Vulgata divergen, con cada divergencia tipificada (armonización, sustitución, modismo, cambio gramatical, etc.) y explicada en una o dos oraciones.
Comparación sinóptica — una vez que se publiquen Mateo / Marcos / Lucas, comparar la misma perícopa entre los tres evangelios sinópticos en tres lenguas cada uno.
Lectura paralela en lenguas semíticas — Peshitta junto al AT hebreo junto al Targum Onkelos; los tooltips de raíz / raíz hermana hacen visible la estructura de los cognados.
Estudio de la técnica de traducción — ¿cómo trata la Peshitta los participios griegos? ¿Cómo trata la Vulgata los infinitivos absolutos hebreos? El aparato tipificado permite responder con rapidez a este tipo de preguntas.
Rastreo de armonizaciones — cuando una tradición importa material de un pasaje paralelo (p. ej. la Peshitta de Marcos 13:14 toma "por Daniel el profeta" de Mt 24:15), el aparato lo señala explícitamente.

Docencia

Pedagogía de lenguas antiguas — los estudiantes iniciales de griego / hebreo / siríaco / latín pueden pasar el cursor sobre cualquier palabra para ver Strong's / lema / morfología. El aparato de variantes convierte cada versículo en una lección de crítica textual.
Religión comparada — una superficie neutra para mostrar cómo distintos linajes canónicos transmiten el mismo texto base.
Formación en edición crítica — los lectores aprenden la *forma* de un aparato erudito (siglas, veredictos, tipos) haciendo clic en ejemplos trabajados, antes de afrontar las densas convenciones de un NA28 / BHS impreso. El aparato mostrado aquí es generado por máquina y pedagógico, no un sustituto de una edición autoritativa.

Trabajo de traducción

Cotejar una nueva traducción frente a los testigos antiguos — ¿una versión contemporánea en español o en chino coincide con la mayoría de las tradiciones antiguas o diverge de manera significativa?
Informar las decisiones de los comités — los equipos de traducción de la Biblia pueden señalar un patrón de divergencia concreto (p. ej. "MT + LXX + Peshitta leen X; solo la Vulgata lee Y") en una única referencia clicable.

Descubrimiento orientado al lector

Lectura de las Escrituras con dimensión crítica — los lectores pueden ver que una expresión familiar tiene una historia disputada sin abrir un manual.
Comparación litúrgica — las liturgias ortodoxas orientales utilizan eslavo + griego bizantino; la católica utiliza la Vulgata; las Iglesias del Oriente utilizan la Peshitta. Las tres pueden mostrarse en paralelo.

Hoja de ruta

Próximamente

Selección de tipografía siríaca — tipografía elegida por el usuario (Noto Sans Syriac, Estrangelo Edessa, Serto / Jacobita, Siríaco oriental / Nestoriano, Madnhaya) con vista previa de glifos y persistencia por usuario.
Panel de ajustes en la barra superior — consolida el idioma, la tipografía siríaca, el tema y la visibilidad del panel lateral tras un único icono de engranaje; las preferencias persisten entre sesiones.

Ampliar la cobertura de libros

Nuevo Testamento (continuando el alcance actual):

Los cuatro evangelios — Mateo / Lucas / Juan. El corpus y el pipeline de alineación ya lo admiten.
Hechos — narrativa histórica del NT griego; la Vulgata y la Peshitta ya lo cubren.
Epístolas paulinas — desde Romanos hasta Filemón.
Epístolas universales y Apocalipsis — Santiago, 1–2 Pedro, 1–3 Juan, Judas, Apocalipsis.

Biblia hebrea / Tanaj (un proyecto insignia aparte):

Torá (Pentateuco) — el punto de partida natural. Génesis, Éxodo, Levítico, Números, Deuteronomio alineados entre el masorético (Leningrado / Alepo) + LXX (Rahlfs o Swete) + Peshitta AT + Vulgata AT + Pentateuco samaritano (~6.000 variantes significativas frente al MT) + Targum Onkelos + Targum Pseudo-Jonatán.
Profetas anteriores — Josué, Jueces, Samuel, Reyes.
Profetas posteriores — Isaías (foco de la propia tesis del Dr. Chen, con abundante erudición disponible sobre la Peshitta), Jeremías, Ezequiel, los Doce Profetas Menores.
Testigos de los Manuscritos del Mar Muerto donde se conserven (1QIsaᵃ, 4QSamᵇ, etc.) — las lecturas variantes a menudo se alinean de forma interesante frente al MT / LXX / Peshitta.
Escritos (Ketuvim) — Salmos, Proverbios, Job, Megillot (Cantar de los Cantares, Rut, Lamentaciones, Eclesiastés, Ester), Daniel, Esdras-Nehemías, Crónicas.

Deuterocanónicos / Apócrifos:

Sabiduría de Salomón, Eclesiástico (Sirácida), Tobías, Judit, Macabeos, Baruc, etc. — relevantes para los cánones católico, ortodoxo y etíope.

Ampliar la cobertura de testigos (dentro de los libros actuales)

Inglés (WEB) como cuarta columna de primer nivel, con alineaciones regeneradas entre las cuatro tradiciones.
Griego bizantino (Texto Mayoritario / TR) — las diferencias frente a NA28 aparecen como una quinta columna de testigo, útil para lectores de tradición ortodoxa oriental y de la línea KJV.
Conjunto chino ortodoxo — eslavo 1751 (Biblia Isabelina) + Küri 1864 (固里, archimandrita Gury Karpov) + Innokenti 1910 (英诺肯提乙, obispo Innokenti Figurovsky). Los tres conforman una familia de alineación de traducciones al chino clásico de la misión ortodoxa rusa frente al texto litúrgico eslavo eclesiástico + griego.
Copto (sahídico + bohaírico).
Armenio (Biblia de Zohrab).
Etiópico (ge'ez).
Vetus Latina / Latín antiguo — testigos latinos prejeronimianos para investigación de variantes sinópticas.
Targum Onkelos + arameo bíblico + Peshitta AT — ya en el corpus de Aramaic Root Atlas; conectar cuando se incorpore el alcance del AT hebreo.

Funciones del visor

Auditoría de accesibilidad — pasada completa de aria, navegación solo por teclado, pulido de alto contraste / modo oscuro.
Referencias cruzadas en las notas de variante (p. ej. "cf. Mt 24:15") representadas como saltos clicables entre versículos paralelos.
Panel de navegación por capítulo con conteo de versículos, marcas de baja confianza y marcadores de revisión manual.
Marcadores / enlaces permanentes — el enlace profundo a una variante concreta se mantiene estable; afordancia compartible de "copiar enlace".
Pulido móvil — disposición responsiva en una columna, áreas de toque más amplias, deslizamiento entre versículos.
Tarjeta de raíz peshitta al pasar el cursor — al posar el cursor sobre cualquier token de la Peshitta (sin necesidad de hacer clic) aparece una tarjeta compacta con la raíz triliteral, el gloss, las raíces hermanas y los cognados hebreos / árabes obtenidos del Aramaic Root Atlas. El clic sigue abriendo el tooltip completo estilo Strong's.

Exportación

Exportación a TEI XML del aparato crítico siguiendo las convenciones <app>/<rdg> de TEI P5.
Exportación de citas en BibTeX por versículo / por variante.
Exportación masiva en CSV de todas las alineaciones para análisis posterior.

Subproyectos

Machine Annotation Engine — alineación en vivo y bajo demanda para versículos no cubiertos por el piloto. Endpoint REST /api/align con confianza por solicitud, almacenamiento en caché, limitación de tasa y sustitución de texto personalizado.
Scholar Review Workflow — cuentas + autenticación (ORCID / GitHub / Google), roles de estudiante / erudito / editor, cola de revisión que toma del motor y de los versículos marcados como de baja confianza, comentarios encadenados por versículo, publicación por umbral de consenso, exportación de referencia en TEI / BibTeX / CSV, citación del conjunto de datos mediante DOI de Zenodo.

Versificación

Las etiquetas de versículo siguen la numeración de NA28. La Vulgata Clementina utiliza una división de versículos distinta en algunos capítulos; donde es necesario (en particular Marcos 9 y Marcos 4:40–41) hemos remapeado el texto de la Vulgata a los límites de NA28. Véase known-issues.md en el repositorio para la lista completa de ediciones.

Licencia y reutilización

Está previsto que el código del visor se publique bajo una licencia de código abierto una vez que el proyecto cuente con financiación pública. El JSON de alineación derivado se produce a partir de fuentes con licencias mixtas (CC BY 4.0, dominio público); cualquier redistribución futura acreditará a las fuentes originales.

Contacto

Comentarios bienvenidos — jossi@somosunodigital.com.