關於 Polyglot Concordance

這是一項試點。 當前範圍僅限馬可福音。完整計劃 — 包括其他新約書卷、希伯來聖經的旗艦專案、更多文字見證、匯出格式以及兩個規劃中的子專案 — 已在下方路線圖中列出.

馬可福音的逐詞對齊，跨越三種文字見證 — 希臘文新約、敘利亞文別西大譯本與拉丁文克萊孟版武加大譯本 — 並在每一處歧異處附有一至兩句的批註說明。

作者 Jossi Fresco Benaim 0009-0000-2026-0836

方法論

馬可福音的每一節經文都已透過 Anthropic 的 Claude Opus 4.8（經由 Batch API）在三種文字見證之間逐詞對齊。每個對齊組都記錄了一項異文判定 — aligned、minor、major、omitted 或 added — 加上一種語義型別（一致、構造、協和化、替換、習語等），並對每一個未對齊組提供一至兩句的批註式註釋。其輸出是一份機器生成的對齊草稿，意在作為學者審閱的起點，而非權威性的批判版。

結果均為預先計算並以每節經文一份 JSON 檔案的形式存於程式碼庫中 — 執行中的瀏覽器無任何執行時 LLM 依賴。

方法論驗證（及其侷限）

我們在希臘文→英文逐詞對齊這一狹義子任務上，將 Claude 的對齊推理與 Berean Interlinear Bible 進行了合理性核驗。在全部 673 節馬可福音經文（共 6175 個計分詞元）中，Claude 與 Berean 的學術性英譯註解在 67.7% 的詞元上保持一致（4182 / 6175）。該結果記錄於 2026-04-23T06:26:59.983024+00:00，使用 claude-sonnet-4-5。

其餘約 32% 的不一致主要源自 Berean 與 WEB（涉及的兩種英文譯本）在選詞上的差異 — 例如對同一希臘詞 ὄχλος，Berean 譯作 “crowd”，WEB 譯作 “people” — 而非對齊錯誤。

這意味著什麼：它是一項可遷移的合理性檢驗，並非正確性的保證。Claude 的希臘文→英文對齊邏輯與一份成熟的學術性逐行對照譯本一致，這排除了災難性的失敗模式，並表明本瀏覽器中的希臘文 / 別西大 / 武加大三方對齊採用的是同樣合理的推理。它並不直接衡量別西大或武加大對齊的質量（不存在可作基準的真值參照），也不衡量批註說明的質量、異文分類或型別標籤的正確性。

Berean 僅作為方法論的基準使用 — 絕不會作為瀏覽器中的展示資料。

執行間的穩定性已經測量，且並不完美。已發布的語料（v2.0.0，Claude Opus 4.8）是一次仍會因執行而變化的生成過程的樣本：在 Opus 4.8 上對馬可福音第 13 章進行的兩次獨立執行，對齊組成員關係僅有約 76% 重合，共享組上的判定一致率為 90%，語義型別一致率為 76% — 也就是說，約有四分之一的組在不同次執行之間不穩定。模型自報的置信度（約 0.86）未經過對正確性的校準，不應被視作品質訊號。從 Sonnet 4.5（語料 v1.0.0）升級到 Opus 4.8（v2.0.0），在準確性（4 個人工核驗的批註錯誤全部避免，其中一個是 Sonnet 系統性重複的）和一致性（組成員關係一致率 +11 個百分點）兩方面都帶來了可測量的改進，但兩者都未被消除。本語料最好被視為機器生成的對齊草稿，而非權威性的批判版。

瀏覽器靈感來源

本檢視採用平行列的呈現方式與綠 / 紅（輕微對比重大）異文配色，靈感來自 Dr. Zhan Chen（陳博士，United International College — BNU-HKBU UIC，珠海，數字社會科學副教授兼歷史與文化研究中心特聘副研究員）所打造的 bible-mt5 平行檢視。陳博士本人的學術研究聚焦於敘利亞文聖經文字（博士論文：An Investigation into the Peshitta of Isaiah，Harvard NELC，2020）以及漢語聖經翻譯。

資料來源

希臘文新約（帶標註）: STEP Bible TAGNT，來自 Tyndale House Cambridge，CC BY 4.0，經由 github.com/STEPBible/STEPBible-Data
別西大新約: 經由 Aramaic Root Atlas 語料庫（Jossi Fresco Benaim） — 敘利亞文文字，以 CSV 形式打包。
克萊孟版武加大譯本: 公有領域，經由 seven1m/open-bibles（USFX）
經文英文譯註: World English Bible（WEB），公有領域
別西大詞根、同源詞與姊妹根: Aramaic Root Atlas（Jossi Fresco Benaim） — 三輔根抽取、姊妹根辨識以及希伯來文 / 阿拉伯文同源詞對映。本檢視在別西大詞元上的點選浮窗即依賴這一層資料。
對齊驗證基準: Berean Interlinear Bible — 僅用於方法論核驗 (在 673 節經文的抽樣上達到 67.7% 的一致率).
對齊生成: Anthropic Claude Opus 4.8

API

驅動渲染版瀏覽器的同一份產物，也以公開唯讀的 JSON API 形式開放在 /api/v1/。CORS 全開放、邊緣快取、附 OpenAPI 文件 — 任何工具都可直接取得對齊資料、搜尋索引或語料 manifest，而無需抓取 HTML 或複製程式碼庫。

/api/docs — 由 OpenAPI 3.0 規範渲染的互動式 Swagger UI。
/api/v1/manifest — 語料元資料：文字見證、經文譯本、模式版本、完整經節枚舉，以及對齊生成的來源說明（含 Berean 基準）。
/api/v1/alignment/{book}/{chapter}/{verse} — 單節經文的規範對齊 JSON — 含每一對齊組的判定、語義型別、批註說明與置信度評分。
/api/v1/verse/{book}/{chapter}/{verse} — 面向展示形態的經文字典 — 文字見證（其 token 已帶對齊標籤）、異文，以及多語言 gloss_map。
/api/v1/search?q={query} — 跨所有文字見證與異文型別的逐節全文搜尋。支援引用跳轉（如 13:14）。

所有端點均為 CORS 開放且邊緣快取。許可：派生對齊資料採用 CC BY 4.0；再分發時請致謝上游來源。

本應用的適用場景

底層引擎是一個帶 AI 生成對齊與批註的多見證平行文字瀏覽器。任何文字只要存在多個版本，本工具就能將它們並排呈現，附以逐詞對齊與已註解的歧異。

聖經學術研究

文字批判研究 — 觀察希臘文新約的某節經文與其別西大譯文、武加大譯文在何處不一致；每一處歧異都被標註型別（協和化、替換、習語、語法變化等），並以一至兩句話加以解釋。
對觀比較 — 一旦馬太 / 馬可 / 路加全部上線，便可在三種語言下逐一比對三卷對觀福音中的同一段記述。
閃族語平行閱讀 — 別西大與希伯來文舊約、塔爾古姆 Onkelos 並列；詞根 / 姊妹根的浮窗使同源結構清晰可見。
翻譯技巧研究 — 別西大如何處理希臘文分詞？武加大如何處理希伯來文絕對不定詞？已分類的批註讓此類問題能夠迅速得到回答。
協和化追蹤 — 當某一傳統從平行段落引入材料時（例如別西大本馬可福音 13:14 從馬太福音 24:15 引入「藉先知但以理所說的」），批註會明確標示。

教學

古代語言教學 — 希臘文 / 希伯來文 / 敘利亞文 / 拉丁文的入門學生可在任意詞上懸停以獲取 Strong's / 詞元 / 詞法。異文批註讓每節經文都成為一堂文字批判課。
比較宗教學 — 一箇中立的呈現介面，用以展示不同正典傳統如何傳抄同一份基礎文字。
批判版訓練 — 讀者透過點選經過整理的示例，先學習學術性批註的*形態*（符號、判定、型別），再去面對印刷版 NA28 / BHS 中密集的體例。本處展示的批註是機器生成的、用於教學目的，不能替代權威版本。

翻譯工作

用古代文字見證檢驗新譯本 — 一份當代的西班牙文或中文譯本是否與古代傳統的多數一致，還是存在顯著歧異？
為委員會決策提供依據 — 聖經翻譯團隊可以在一個可點選的引用中指出某一具體的歧異模式（例如「MT + LXX + 別西大都讀作 X；唯有武加大讀作 Y」）。

面向讀者的探索

帶批判性維度的聖經閱讀 — 讀者無需翻開教科書，便能看到一句熟悉的話語其實有著具有爭議的傳抄歷史。
禮儀比較 — 東正教禮儀使用斯拉夫文 + 希臘文拜占庭文字；天主教使用武加大；東方教會使用別西大。三者皆可並排呈現。

路線圖

近期規劃

敘利亞文字型選擇 — 由使用者選擇字型（Noto Sans Syriac、Estrangelo Edessa、Serto / Jacobite、East Syriac / Nestorian、Madnhaya），附字形預覽與按使用者持久化儲存。
頂欄中的設定面板 — 將語言、敘利亞文字型、主題與側欄可見性合併到一個齒輪圖示之下；偏好設定在多次會話間保持。

擴充套件書卷覆蓋範圍

新約（延續當前範圍）：

四福音書 — 馬太福音 / 路加福音 / 約翰福音。語料庫與對齊流水線已支援。
使徒行傳 — 希臘文新約的歷史敘事；武加大與別西大已涵蓋。
保羅書信 — 羅馬書至腓利門書。
普通書信與啟示錄 — 雅各書、彼得前後書、約翰一二三書、猶大書、啟示錄。

希伯來聖經 / 塔納赫（獨立的旗艦專案）：

律法書（摩西五經） — 自然的起點。創世記、出埃及記、利未記、民數記、申命記跨馬所拉文字（列寧格勒 / 阿勒頗）+ LXX（Rahlfs 或 Swete）+ 別西大舊約 + 武加大舊約 + 撒瑪利亞五經（與 MT 間約有 6,000 處具有意義的異文）+ 塔爾古姆 Onkelos + 塔爾古姆 Pseudo-Jonathan 進行對齊。
前先知書 — 約書亞記、士師記、撒母耳記、列王記。
後先知書 — 以賽亞書（陳博士本人博士論文的研究焦點，相關的別西大學術成果豐富）、耶利米書、以西結書、十二小先知書。
死海古卷文字見證（凡現存者，1QIsaᵃ、4QSamᵇ 等） — 其異文讀法常與 MT / LXX / 別西大形成頗具研究意義的對照。
聖文集（Ketuvim） — 詩篇、箴言、約伯記、五卷（雅歌、路得記、耶利米哀歌、傳道書、以斯帖記）、但以理書、以斯拉記—尼希米記、歷代志。

次經 / 旁經：

所羅門智訓、便西拉智訓、多比傳、猶滴傳、馬加比書、巴錄書等 — 與天主教、東正教及衣索比亞正典相關。

擴充套件文字見證覆蓋範圍（在當前書卷之內）

英文（WEB）作為頭等的第四列，對齊將在四種傳統之間重新生成。
希臘文拜占庭文字（多數文字 / TR） — 與 NA28 的差異作為第五列文字見證呈現，對東正教讀者與 KJV 譜系讀者尤為有用。
東正教中文文字群 — 1751 年斯拉夫文（伊麗莎白聖經）+ 1864 年固裡譯本（固裡，固裡·卡爾波夫修士大司祭）+ 1910 年英諾肯提乙譯本（英諾肯提乙，英諾肯提乙·菲古羅夫斯基主教）。這三者構成俄國東正教傳教士所譯古典中文譯本的一個對齊家族，對應教會斯拉夫文 + 希臘文禮儀文字。
科普特文（沙希迪克 + 波海里克）。
亞美尼亞文（佐赫拉布聖經）。
衣索比亞文（吉茲文）。
古拉丁 / Latin Vetus — 哲羅姆之前的拉丁文文字見證，供對觀異文研究使用。
塔爾古姆 Onkelos + 聖經亞蘭文 + 別西大舊約 — 已收入 Aramaic Root Atlas 語料庫；待希伯來文舊約範圍落地後接入。

瀏覽器功能

無障礙審計 — 完整的 aria 檢查、純鍵盤導航、高對比度 / 暗色模式打磨。
異文註釋中的交叉引用（例如「參馬太福音 24:15」）將渲染為可點選的跳轉，在平行經節之間切換。
按章導航面板，包含經節計數、低置信度標記與人工複核標記。
書籤 / 永久連結 — 指向特定異文的深度連結保持穩定；提供可分享的「複製連結」功能。
移動端打磨 — 單列響應式佈局、更大的點選目標、經節間滑動切換。
懸停即顯的別西大詞根卡 — 懸停於任一別西大詞元（無需點選）即可顯示一張緊湊的卡片，包含三輔根、字面譯義、姊妹根，以及取自 Aramaic Root Atlas 的希伯來文 / 阿拉伯文同源詞。點選仍可開啟完整的 Strong's 風格浮窗。

匯出

按 TEI P5 的 <app>/<rdg> 約定匯出批判性批註的 TEI XML。
按經節 / 按異文匯出 BibTeX 引文。
全部對齊資料的 CSV 批次匯出，便於下游分析。

子專案

Machine Annotation Engine — 針對試點未涵蓋的經節，提供實時按需對齊。REST 介面 /api/align，附按請求的置信度、快取、限速及自定義文字覆蓋。
Scholar Review Workflow — 賬號 + 鑑權（ORCID / GitHub / Google）、學生 / 學者 / 編輯角色、來自引擎與被標記低置信度經節的複核佇列、按節展開的執行緒式評論、達成共識閾值後的釋出、TEI / BibTeX / CSV 黃金標準資料匯出，以及透過 Zenodo DOI 進行的資料集引用。

節次劃分

經節標號遵循 NA28 的編號方式。克萊孟版武加大譯本在某些章節中採用了不同的分節方式；在必要之處（尤其是馬可福音第 9 章及馬可福音 4:40–41），我們已將武加大文字重新對映至 NA28 的邊界。完整的修改清單參見程式碼庫中的 known-issues.md。

許可與再利用

本瀏覽器程式碼計劃在專案獲得公共資助後以開源許可釋出。所派生的對齊 JSON 來自混合許可的資料源（CC BY 4.0、公有領域）；任何未來的再分發都將致謝上游來源。

聯絡方式

歡迎反饋 — jossi@somosunodigital.com.