這一章整理了本教材中出現的核心技術名詞。不需要全部背起來——遇到不熟悉的詞時,回來這裡查就好。
替資料加上「業務定義」,讓 AI 知道每筆數字代表什麼意思。
Semantic Layer 是介於原始資料和 AI 之間的翻譯層。它記錄了每個資料集的用途、每個欄位的業務定義、每個指標的計算方式,讓 AI 能「看懂」資料的語境,而不只是看到一堆數字和欄位名稱。
在 Aralia 系統中,Semantic Layer 整合了 Embedding、Knowledge Graph 與 RAG 三種技術,共同完成「讓 AI 理解資料」這件事。
把文字的「意思」轉換成數字座標,讓系統能比較語意的相似程度。
Embedding 是一種 AI 技術,能把一段文字(例如「電影售票」)轉換成一串數字(稱為向量),讓意思相近的詞彙在數字空間裡的距離也更近。
向量資料庫(Vector Database) 則是專門存放這些數字座標的資料庫,讓系統能快速找出「語意最相關」的資料。
舉例:你輸入「票房表現」,系統透過 Embedding 能找到「售票金額」、「觀影人次」等相關欄位,即使這些欄位名稱裡沒有「票房」這兩個字。
先查資料,再讓 AI 根據查到的資料回答你,確保回覆有據可查。
RAG 解決的問題是:AI 如果只靠自己的訓練知識回答,容易產生沒有根據的內容。RAG 的做法是每次回答前先去查詢真實資料,讓 AI 的回覆建立在實際數據上。
流程: