關於 Polyglot Concordance
這是一項試點。 當前範圍僅限馬可福音。完整計劃 — 包括其他新約書卷、希伯來聖經的旗艦專案、更多文字見證、匯出格式以及兩個規劃中的子專案 — 已在下方
路線圖中列出.
馬可福音的逐詞對齊,跨越三種文字見證 — 希臘文新約、敘利亞文別西大譯本與拉丁文克萊孟版武加大譯本 — 並在每一處歧異處附有一至兩句的批註說明。
方法論
馬可福音的每一節經文都已透過 Anthropic 的 Claude Sonnet 4.5(經由 Batch API)在三種文字見證之間逐詞對齊。每個對齊組都記錄了一項異文判定 — aligned、minor、major、omitted 或 added — 加上一種語義型別(一致、構造、協和化、替換、習語等),並對每一個未對齊組提供一至兩句適合作為批判性批註的說明。
結果均為預先計算並以每節經文一份 JSON 檔案的形式存於程式碼庫中 — 執行中的瀏覽器無任何執行時 LLM 依賴。
方法論驗證(及其侷限)
我們在希臘文→英文逐詞對齊這一狹義子任務上,將 Claude 的對齊推理與 Berean Interlinear Bible 進行了合理性核驗。在全部 673 節馬可福音經文(共 6175 個計分詞元)中,Claude 與 Berean 的學術性英譯註解在 67.7% 的詞元上保持一致(4182 / 6175)。該結果記錄於 2026-04-23T06:26:59.983024+00:00,使用 claude-sonnet-4-5。
其餘約 32% 的不一致主要源自 Berean 與 WEB(涉及的兩種英文譯本)在選詞上的差異 — 例如對同一希臘詞 ὄχλος,Berean 譯作 “crowd”,WEB 譯作 “people” — 而非對齊錯誤。
這意味著什麼:它是一項可遷移的合理性檢驗,並非正確性的保證。Claude 的希臘文→英文對齊邏輯與一份成熟的學術性逐行對照譯本一致,這排除了災難性的失敗模式,並表明本瀏覽器中的希臘文 / 別西大 / 武加大三方對齊採用的是同樣合理的推理。它並不直接衡量別西大或武加大對齊的質量(不存在可作基準的真值參照),也不衡量批註說明的質量、異文分類或型別標籤的正確性。
Berean 僅作為方法論的基準使用 — 絕不會作為瀏覽器中的展示資料。
瀏覽器靈感來源
本檢視採用平行列的呈現方式與綠 / 紅(輕微對比重大)異文配色,靈感來自 Dr. Zhan Chen(陳博士,United International College — BNU-HKBU UIC,珠海,數字社會科學副教授兼歷史與文化研究中心特聘副研究員)所打造的 bible-mt5 平行檢視。陳博士本人的學術研究聚焦於敘利亞文聖經文字(博士論文:An Investigation into the Peshitta of Isaiah,Harvard NELC,2020)以及漢語聖經翻譯。
資料來源
- 希臘文新約(帶標註)
- STEP Bible TAGNT,來自 Tyndale House Cambridge,CC BY 4.0,經由 github.com/STEPBible/STEPBible-Data
- 別西大新約
- 經由 Aramaic Root Atlas 語料庫(Jossi Fresco Benaim) — 敘利亞文文字,以 CSV 形式打包。
- 克萊孟版武加大譯本
- 公有領域,經由 seven1m/open-bibles(USFX)
- 經文英文譯註
- World English Bible(WEB),公有領域
- 別西大詞根、同源詞與姊妹根
- Aramaic Root Atlas(Jossi Fresco Benaim) — 三輔根抽取、姊妹根辨識以及希伯來文 / 阿拉伯文同源詞對映。本檢視在別西大詞元上的點選浮窗即依賴這一層資料。
- 對齊驗證基準
- Berean Interlinear Bible — 僅用於方法論核驗 (在 673 節經文的抽樣上達到 67.7% 的一致率).
- 對齊生成
- Anthropic Claude Sonnet 4.5
API
驅動渲染版瀏覽器的同一份產物,也以公開唯讀的 JSON API 形式開放在 /api/v1/。CORS 全開放、邊緣快取、附 OpenAPI 文件 — 任何工具都可直接取得對齊資料、搜尋索引或語料 manifest,而無需抓取 HTML 或複製程式碼庫。
所有端點均為 CORS 開放且邊緣快取。許可:派生對齊資料採用 CC BY 4.0;再分發時請致謝上游來源。
相關工作
- Peshitta Constellations
- peshitta.onrender.com — 探索別西大語料庫的姊妹專案。
- Aramaic Root Atlas
- aramaic-root-atlas.onrender.com — 跨語料的閃族語三輔根瀏覽器,附希伯來文與阿拉伯文同源詞對映。本檢視浮窗層所使用的別西大詞根資料即來自此處。
- BibCrit
- bibcrit.app — 用於文字分析的聖經批判工作臺。
本應用的適用場景
底層引擎是一個帶批判性批註的多見證平行文字瀏覽器。任何文字只要存在多個版本,本工具就能將它們並排呈現,附以逐詞對齊與已註解的歧異。
聖經學術研究
- 文字批判研究 — 觀察希臘文新約的某節經文與其別西大譯文、武加大譯文在何處不一致;每一處歧異都被標註型別(協和化、替換、習語、語法變化等),並以一至兩句話加以解釋。
- 對觀比較 — 一旦馬太 / 馬可 / 路加全部上線,便可在三種語言下逐一比對三卷對觀福音中的同一段記述。
- 閃族語平行閱讀 — 別西大與希伯來文舊約、塔爾古姆 Onkelos 並列;詞根 / 姊妹根的浮窗使同源結構清晰可見。
- 翻譯技巧研究 — 別西大如何處理希臘文分詞?武加大如何處理希伯來文絕對不定詞?已分類的批註讓此類問題能夠迅速得到回答。
- 協和化追蹤 — 當某一傳統從平行段落引入材料時(例如別西大本馬可福音 13:14 從馬太福音 24:15 引入「藉先知但以理所說的」),批註會明確標示。
教學
- 古代語言教學 — 希臘文 / 希伯來文 / 敘利亞文 / 拉丁文的入門學生可在任意詞上懸停以獲取 Strong's / 詞元 / 詞法。異文批註讓每節經文都成為一堂文字批判課。
- 比較宗教學 — 一箇中立的呈現介面,用以展示不同正典傳統如何傳抄同一份基礎文字。
- 批判版訓練 — 讀者透過點選真實的例證來學習閱讀學術性批註,而不必去解讀印刷版 NA28 / BHS 中密集的符號系統。
翻譯工作
- 用古代文字見證檢驗新譯本 — 一份當代的西班牙文或中文譯本是否與古代傳統的多數一致,還是存在顯著歧異?
- 為委員會決策提供依據 — 聖經翻譯團隊可以在一個可點選的引用中指出某一具體的歧異模式(例如「MT + LXX + 別西大都讀作 X;唯有武加大讀作 Y」)。
面向讀者的探索
- 帶批判性維度的聖經閱讀 — 讀者無需翻開教科書,便能看到一句熟悉的話語其實有著具有爭議的傳抄歷史。
- 禮儀比較 — 東正教禮儀使用斯拉夫文 + 希臘文拜占庭文字;天主教使用武加大;東方教會使用別西大。三者皆可並排呈現。
路線圖
近期規劃
- 敘利亞文字型選擇 — 由使用者選擇字型(Noto Sans Syriac、Estrangelo Edessa、Serto / Jacobite、East Syriac / Nestorian、Madnhaya),附字形預覽與按使用者持久化儲存。
- 頂欄中的設定面板 — 將語言、敘利亞文字型、主題與側欄可見性合併到一個齒輪圖示之下;偏好設定在多次會話間保持。
擴充套件書卷覆蓋範圍
新約(延續當前範圍):
- 四福音書 — 馬太福音 / 路加福音 / 約翰福音。語料庫與對齊流水線已支援。
- 使徒行傳 — 希臘文新約的歷史敘事;武加大與別西大已涵蓋。
- 保羅書信 — 羅馬書至腓利門書。
- 普通書信與啟示錄 — 雅各書、彼得前後書、約翰一二三書、猶大書、啟示錄。
希伯來聖經 / 塔納赫(獨立的旗艦專案):
- 律法書(摩西五經) — 自然的起點。創世記、出埃及記、利未記、民數記、申命記跨馬所拉文字(列寧格勒 / 阿勒頗)+ LXX(Rahlfs 或 Swete)+ 別西大舊約 + 武加大舊約 + 撒瑪利亞五經(與 MT 間約有 6,000 處具有意義的異文)+ 塔爾古姆 Onkelos + 塔爾古姆 Pseudo-Jonathan 進行對齊。
- 前先知書 — 約書亞記、士師記、撒母耳記、列王記。
- 後先知書 — 以賽亞書(陳博士本人博士論文的研究焦點,相關的別西大學術成果豐富)、耶利米書、以西結書、十二小先知書。
- 死海古卷文字見證(凡現存者,1QIsaᵃ、4QSamᵇ 等) — 其異文讀法常與 MT / LXX / 別西大形成頗具研究意義的對照。
- 聖文集(Ketuvim) — 詩篇、箴言、約伯記、五卷(雅歌、路得記、耶利米哀歌、傳道書、以斯帖記)、但以理書、以斯拉記—尼希米記、歷代志。
次經 / 旁經:
- 所羅門智訓、便西拉智訓、多比傳、猶滴傳、馬加比書、巴錄書等 — 與天主教、東正教及衣索比亞正典相關。
擴充套件文字見證覆蓋範圍(在當前書卷之內)
- 英文(WEB)作為頭等的第四列,對齊將在四種傳統之間重新生成。
- 希臘文拜占庭文字(多數文字 / TR) — 與 NA28 的差異作為第五列文字見證呈現,對東正教讀者與 KJV 譜系讀者尤為有用。
- 東正教中文文字群 — 1751 年斯拉夫文(伊麗莎白聖經)+ 1864 年固裡譯本(固裡,固裡·卡爾波夫修士大司祭)+ 1910 年英諾肯提乙譯本(英諾肯提乙,英諾肯提乙·菲古羅夫斯基主教)。這三者構成俄國東正教傳教士所譯古典中文譯本的一個對齊家族,對應教會斯拉夫文 + 希臘文禮儀文字。
- 科普特文(沙希迪克 + 波海里克)。
- 亞美尼亞文(佐赫拉布聖經)。
- 衣索比亞文(吉茲文)。
- 古拉丁 / Latin Vetus — 哲羅姆之前的拉丁文文字見證,供對觀異文研究使用。
- 塔爾古姆 Onkelos + 聖經亞蘭文 + 別西大舊約 — 已收入 Aramaic Root Atlas 語料庫;待希伯來文舊約範圍落地後接入。
瀏覽器功能
- 無障礙審計 — 完整的 aria 檢查、純鍵盤導航、高對比度 / 暗色模式打磨。
- 異文註釋中的交叉引用(例如「參 馬太福音 24:15」)將渲染為可點選的跳轉,在平行經節之間切換。
- 按章導航面板,包含經節計數、低置信度標記與人工複核標記。
- 書籤 / 永久連結 — 指向特定異文的深度連結保持穩定;提供可分享的「複製連結」功能。
- 移動端打磨 — 單列響應式佈局、更大的點選目標、經節間滑動切換。
- 懸停即顯的別西大詞根卡 — 懸停於任一別西大詞元(無需點選)即可顯示一張緊湊的卡片,包含三輔根、字面譯義、姊妹根,以及取自 Aramaic Root Atlas 的希伯來文 / 阿拉伯文同源詞。點選仍可開啟完整的 Strong's 風格浮窗。
匯出
- 按 TEI P5 的
<app>/<rdg> 約定匯出批判性批註的 TEI XML。
- 按經節 / 按異文匯出 BibTeX 引文。
- 全部對齊資料的 CSV 批次匯出,便於下游分析。
子專案
- Machine Annotation Engine — 針對試點未涵蓋的經節,提供實時按需對齊。REST 介面
/api/align,附按請求的置信度、快取、限速及自定義文字覆蓋。
- Scholar Review Workflow — 賬號 + 鑑權(ORCID / GitHub / Google)、學生 / 學者 / 編輯角色、來自引擎與被標記低置信度經節的複核佇列、按節展開的執行緒式評論、達成共識閾值後的釋出、TEI / BibTeX / CSV 黃金標準資料匯出,以及透過 Zenodo DOI 進行的資料集引用。
節次劃分
經節標號遵循 NA28 的編號方式。克萊孟版武加大譯本在某些章節中採用了不同的分節方式;在必要之處(尤其是馬可福音第 9 章及馬可福音 4:40–41),我們已將武加大文字重新對映至 NA28 的邊界。完整的修改清單參見程式碼庫中的 known-issues.md。
許可與再利用
本瀏覽器程式碼計劃在專案獲得公共資助後以開源許可釋出。所派生的對齊 JSON 來自混合許可的資料源(CC BY 4.0、公有領域);任何未來的再分發都將致謝上游來源。
聯絡方式
歡迎反饋 —
jossi@somosunodigital.com.