這一章整理了本教材中出現的核心技術名詞。不需要全部背起來——遇到不熟悉的詞時,回來這裡查就好。


Semantic Layer(語意層)

替資料加上「業務定義」,讓 AI 知道每筆數字代表什麼意思。

Semantic Layer 是介於原始資料和 AI 之間的翻譯層。它記錄了每個資料集的用途、每個欄位的業務定義、每個指標的計算方式,讓 AI 能「看懂」資料的語境,而不只是看到一堆數字和欄位名稱。

在 Aralia 系統中,Semantic Layer 整合了 Embedding、Knowledge Graph 與 RAG 三種技術,共同完成「讓 AI 理解資料」這件事。


Embedding 與向量資料庫

把文字的「意思」轉換成數字座標,讓系統能比較語意的相似程度。

Embedding 是一種 AI 技術,能把一段文字(例如「電影售票」)轉換成一串數字(稱為向量),讓意思相近的詞彙在數字空間裡的距離也更近。

向量資料庫(Vector Database) 則是專門存放這些數字座標的資料庫,讓系統能快速找出「語意最相關」的資料。

舉例:你輸入「票房表現」,系統透過 Embedding 能找到「售票金額」、「觀影人次」等相關欄位,即使這些欄位名稱裡沒有「票房」這兩個字。


RAG(Retrieval-Augmented Generation,檢索增強生成)

先查資料,再讓 AI 根據查到的資料回答你,確保回覆有據可查。

RAG 解決的問題是:AI 如果只靠自己的訓練知識回答,容易產生沒有根據的內容。RAG 的做法是每次回答前先去查詢真實資料,讓 AI 的回覆建立在實際數據上。

流程:

  1. 使用者提問
  2. 系統用 Embedding 找到語意最相關的資料
  3. 把資料和問題一起送給 AI