系統架構說明

OceanRAG 系統說明

專為台灣中小企業打造,零外部依賴的企業知識問答平台

一句話說明: OceanRAG 就像公司裡面的 ChatGPT,但資料不會外洩、每個人只看得到自己被授權的內容,而且 AI 回答會自動標明「根據哪份文件」。

為什麼公司需要 OceanRAG?

  • 資料不出境:裝在公司自己的機器上,文件不會傳到任何外部服務,符合台灣個資法要求。
  • 誰看什麼,清清楚楚:每份文件都有機密等級和部門歸屬。業務看不到人資的薪資單,人資看不到研發的專利文件。
  • 操作紀錄全留底:誰查了什麼、什麼時候查的,紀錄不可刪除、不可竄改,稽核的時候直接匯出。
  • AI 不會亂講話:三道關卡把關,信心不夠就不回答,避免 AI 瞎掰(幻覺)誤導員工。

簡單來說:讓員工用「問問題」取代「翻資料夾」,省下的時間拿來做更有價值的事。

為什麼選擇 OceanRAG

跟市面上其他方案比較,OceanRAG 的核心差異:

比較面向 一般 AI 方案 OceanRAG
資料安全 機密文件上傳雲端,有外洩風險 可完全私有化部署,資料不離開公司
回答品質 無法驗證,可能產生錯誤資訊 三道品質關卡自動把關,信心不足不回答
權限管控 全公司看同樣內容,或只有簡單分類 文件等級 × 部門 × 角色,精確到每份文件
稽核追蹤 查詢紀錄可刪改,或根本沒有紀錄 所有操作不可竄改,隨時可匯出
外部依賴 需安裝多種外部服務才能運作 零外部依賴,裝完就能用
使用成本 按人頭按月收費,規模越大越貴 AI 模型運行近乎零成本
費用優勢: 使用開源模型在公司機器上運行,AI 運行費用接近零。即使搭配雲端 API,品質把關機制也能攔截不必要的查詢,整體費用比傳統方案省 50%~70%

系統如何運作

員工只需要「問問題」,系統在背後自動完成所有搜尋、驗證和回答的工作。

員工提問 理解意圖 搜尋知識庫 品質把關 回答 + 出處
(圖片:系統查詢主畫面截圖)

自動文件處理

上傳檔案後,系統自動完成解析、切割、品質檢測和入庫,不需要人工整理。支援 PDF、Word、Excel 等常見格式。

品質把關機制

OceanRAG 設了三道關卡,確保不該回答的問題不會回答、品質不夠的答案不會送出:

1
問題過濾
跟公司知識庫無關的問題(閒聊、寫程式等)直接攔截。約 10%~15% 的查詢在這裡就被擋住,節省系統資源。
2
搜尋品質檢查
系統檢查搜尋到的資料是否足夠。品質不夠好時會嘗試其他方式;真的找不到就告訴員工「資訊不足」,不硬掰答案。
3
回答驗證
AI 回答後自動評估可信度:高信心直接送出、中等信心標示提醒、信心不足直接擋掉。六成以上查詢一次通過,只有低信心回答才觸發更深入的來源溯源比對。

每個回答都會附上一段人看得懂的信心說明,讓員工知道 AI 為什麼有信心回答,不是黑箱作業。

安全防護

假設你的公司有 30 位員工,分成業務部、人資部、研發部。以下是 OceanRAG 在日常營運中如何保護你的企業:

「公司機密文件會不會外洩?」

不會。系統完全部署在公司自己的機器上,所有文件、對話紀錄、搜尋索引都存在本地。即使 AI 模型也可以選擇跑在本地,完全不需要把資料傳到外部服務。符合台灣個資法對資料在地化的要求。

「人資的薪資單會不會被業務看到?」

不會。每份文件都有機密等級(L1~L5)和部門歸屬。業務部的員工搜尋時,人資的薪資文件根本不會出現在搜尋結果裡 — 不是搜到後才隱藏,而是連搜都不搜。即使有人嘗試直接用連結存取,系統也會擋回來。

「有人一直猜密碼怎麼辦?」

系統自動保護。連續輸錯密碼會自動鎖定帳號,同一 IP 短時間內太多登入嘗試直接擋回。外部 IP 登入自動標記為可疑,管理員會收到通知。而且攻擊者無法從回應速度判斷帳號是否存在。

「AI 會不會亂講話影響決策?」

三道品質關卡:第一關攔截與公司知識庫無關的問題,第二關確認搜尋到的資料品質夠好,第三關驗證 AI 回答的可信度。信心不足就不回答。每個回答都附上出處和一段人看得懂的信心說明。

「員工短時間下載大量文件?」

系統自動偵測。每一次文件預覽和下載都有紀錄,短時間大量下載、跨部門存取、高機密文件存取都會自動標記,即時通知管理員。系統還會持續追蹤每位員工的行為風險分數。

「員工離職要怎麼處理?」

管理員一鍵強制登出,所有登入狀態即時撤銷。但操作紀錄永久保留,不會因帳號停用而消失。角色或部門變更也會立刻讓舊的登入狀態失效。

「還有哪些安全措施?」

OceanRAG 採用「多層防禦」設計 — 每一層各自獨立,就算某層被突破,其他層還是照擋:通訊加密、檔案用特徵碼驗真偽、AI 有指令注入防護、網頁有安全標頭防護、所有操作紀錄用密碼雜湊鏈串連防竄改。

權限管理

同樣以 30 人的公司為例,「誰能看什麼」是最常被問的問題。用三個實際場景來說明:

場景一:新進業務員工報到

管理員建帳號時設定:角色「一般員工」、部門「業務部」、機密等級「L2」。從此這位員工只能搜到業務部 L2 以下的文件。人資的薪資單(L4)和研發的專利文件(L3)完全看不到。

場景二:業務主管需要看跨部門資料

系統管理員可以授權特定員工看指定部門的指定等級文件。授權範圍精確控制,不是「全部打開」。

場景三:員工調部門或離職

管理員修改部門或角色後,該員工所有正在使用的登入狀態即時失效。重新登入後自動套用新權限,舊部門的文件立刻看不到了。

(圖片:權限管理後台截圖)

三級角色

  • 系統管理員:看得到所有資料、管得到所有人。通常是 IT 主管或老闆。
  • 部門管理員:只管自己部門的文件和員工。
  • 一般員工:只能查詢,只看得到被授權的文件。

稽核日誌

當稽核人員來訪,或懷疑有資料被不當存取時,OceanRAG 能提供完整的追溯紀錄。

場景:稽核人員要看操作紀錄

管理員直接從後台匯出 CSV 或 JSON,內容包含:誰、什麼時候、做了什麼、從哪個 IP 登入。這些紀錄不可刪除、不可竄改 — 資料庫層級自動擋掉所有刪除操作,每筆紀錄用密碼雜湊鏈串連,改一筆就整條鏈驗證失敗。

場景:懷疑有人不當存取機密文件

管理員可查詢特定員工的所有紀錄:問了什麼、AI 怎麼回答、引用了哪些文件、信心分數、文件下載紀錄和行為風險分數,全部一目了然。

兩套互補的紀錄

  • 對話紀錄:每一筆 AI 查詢的完整過程 — 問題、回答、引用文件、信心分數。
  • 操作紀錄:登入登出、上傳文件、審閱通過、權限變更等所有管理操作。

部署方式

環境需求

  • 作業系統:Windows / macOS / Linux 都可以
  • 推薦硬體:Mac Mini(最新升級版,約兩萬台幣起)是最推薦的選擇,效能與性價比兼具
  • 外部依賴:零。不需要額外安裝資料庫或其他服務

怎麼上線

  • 辦公室內架機器:最簡單,Docker Compose 一鍵啟動,前面放一個入口就好。
  • 私有雲部署:如果公司有多個據點,可以把後端放在私有雲,前端透過 VPN 連。

發展藍圖

v0.6 已推出下列功能:

MCP 伺服器

讓各種 AI 工具(如 Claude、ChatGPT)都能直接查詢公司知識庫,把 OceanRAG 變成企業的「知識中樞」。

技能系統(Skill)

定義可重複執行的工作流程,讓 AI 按照步驟完成重複性任務,例如固定格式的報表彙整、資料摘要等。

文件代理(Document Agent)

AI 主動協助整理、摘要、歸檔新進文件,減少人工處理負擔,讓知識庫始終保持最新狀態。