LLMs

人工智能開卷考試系統

基於自託管大語言模型(LLM)的人工智能(AI)開卷考試系統

定位:解決傳統開卷考試缺陷,同時培養AI時代的核心能力適用場景:香港的大學、高等學院以至高校專業課程期末考評 一、傳統開卷考試的四大痛點 痛點 具體問題 作弊風險高 學生夾帶未授權資料、在書籍內頁手寫答案、交換書籍 資料攜帶低效 法學考試需攜帶10+本判例集,工程科攜帶公式手冊+圖紙,搬運耗時易出錯 評核目標偏移 教師為防作弊,出題偏向冷門細節,反而偏離應用能力考核初衷 評分標準不一 開放題因教師主觀判斷產生評分差異,學生申訴率高 ▶ 自託管LLM的核心價值:將實體書數位化+AI監考,既保留開卷考試優勢(測深度能力),又根除物理作弊場景 二、為何需要變革開卷考試?——聚焦未來能力的必要性 三、系統設計:AI作為「智能考試伴侶」 (1)架構核心創新 模組 功能 數位資料庫 考前上傳指定材料(教材/筆記/判例),AI自動OCR辨識+建立索引 安全沙盒環境 考試時僅可查詢預存資料,禁用互聯網搜索(隔離維基百科/谷歌/LLMs等外部源) 動態評分系統 記錄學生每次查詢的prompt質量作為評分項… Read More »基於自託管大語言模型(LLM)的人工智能(AI)開卷考試系統

3分鐘解釋甚麼是大型語言模型

3分鐘給你解釋甚麼是大型語言模型LLM

大型語言模型(Large Language Model或簡稱LLM)是一種覆雜的人工智能類型,擅長處理、理解和生成類似人類的文本。這些模型建立在深度學習技術之上,並且是在龐大的數據集上訓練的,通常以拍字節為單位,使它們能夠執行廣泛的自然語言處理任務。 架構和訓練大型語言模型基於變換器神經網絡架構,使用自注意力機制並行處理整個文本序列。這種設計使它們能夠比早期模型更高效地學習語言內的覆雜模式和關系。 大型語言模型的訓練過程包括:無監督學習:最初,模型暴露在大量未標記的文本數據中,這些數據來自書籍、文章和網站等多樣化的來源。自監督學習:模型學習預測序列中的下一個詞,發展對語法、語義和上下文的理解。微調:一些模型在特定數據集上進行額外訓練,以專門化於特定領域或任務。 關鍵組件大型語言模型由多個神經網絡層組成,包括:嵌入層:捕獲輸入文本的語義和句法意義前饋層:將輸入嵌入轉換以獲得更高層次的抽象遞歸層:按順序解釋單詞以捕獲關系注意力機制:允許模型專注於輸入文本的相關部分 大型語言模型的類型有幾種類型的大型語言模型,每種都有特定的特性:零樣本模型:無需額外訓練即可執行任務的通用模型微調模型:專門用於特定領域或任務多模態模型:能夠處理文本和圖像 能力和應用大型語言模型展現出了顯著的靈活性,能夠執行多種任務,包括:– 文本生成和補全– 語言翻譯– 摘要– 問答– 情感分析– 代碼生成和審查 這些能力使大型語言模型成為各種行業的寶貴工具,從客戶服務和內容創作到軟件開發和科學研究。 大型語言模型如何工作當LLM接收到輸入時,它通過以下步驟處理文本:– 分詞:輸入文本被分解為標記(單詞或子詞)。– 編碼:標記被轉換為數值表示(嵌入)。– 處理:編碼信息通過多個神經網絡層傳遞。– 解碼:處理後的信息被轉換回人類可讀的文本。– 這個過程使大型語言模型能夠對廣泛的提示和問題生成上下文相關和連貫的回應。 挑戰和考慮因素雖然大型語言模型提供了強大的能力,但它們也帶來了挑戰:– 偏見(bias):模型可能反映其訓練數據中的偏見。– 幻覺(hullicination):大型語言模型可能會生成聽起來合理但錯誤的信息。– 資源密集性:訓練和運行大型模型需要大量的計算資源,這意味著只有小部份資金充裕的誇國大企業能開發和運用,最終導致行業和知識層面的壟斷。–… Read More »3分鐘給你解釋甚麼是大型語言模型LLM