港聞

港聞二

劃分知識領域融合小模型 理大研低規格晶片訓練優質AI

【明報專訊】本港早前被納入美國的出口管制框架,高性能人工智能(AI)晶片進口受限。曾參與內地多個AI模型開發的理大計算及數學科學學院副院長楊紅霞表示,理大Co-GenAI項目希望透過將世界知識分為數千個領域,每個領域訓練一個小模型,並最終透過融合模型(Model Fusion),把小模型形成基礎模型(Foundation Model),稱可用較低規格的AI晶片、更少的時間,也可訓練出優質的AI模型,毋須依賴高性能顯示晶片。

不同算力中心訓練 需時大大縮短

楊紅霞說,團隊融合目前市面上所有開源AI模型,發現得到的最終模型推理能力更高,這或表明AI模型毋須集中式訓練。目前AI模型訓練主要使用搭載高性能晶片的顯卡進行,楊紅霞強調,集中訓練大模型動輒調用數千張顯卡,而若採用融合模型辦法,將模型交到不同的算力中心分別訓練,所需的時間亦大大縮短,亦毋須使用大量的及高規格的顯卡。研究顯示,訓練70億參數的小模型只需64至128張顯卡,而超過1000億的大模型亦只需512至1024張顯卡,節省逾九成的資源。

另外,楊紅霞表示,在特定領域應用AI時,毋須調用擁有數千億參與的大模型。楊指出,ChatGPT、DeepSeek等AI大模型使用互聯網數據訓練,無法訪問到專業數據,專業人士使用時表現不佳,而項目團隊透過讓AI模型學習特定領域的數據,如集中於醫療、金融領域訓練,令小模型變得更加專業,強調經過大量領域核心優質數據持續預訓練的小模型,在特定領域的表現要優於市面上的大模型;她又引述Meta團隊研究,強調擁有70億參數的小模型已足夠裝載單個領域內的所有知識。楊認為,本港在建造、金融等行業方面的數據有優勢,提及團隊目前正積極與醫療、建造、金融等多個領專業人士溝通合作以推進項目。

專攻特定領域 小模型更專業

至於本港發展AI模型的優勢和劣勢,楊紅霞指出,本港雖在人才方面有優勢,但同時人力成本較貴,發展AI模型亦需要顯卡資源,而目前也缺乏算力資源,希望政府多投資基礎設施,形容仍需資源傾斜。而對於美國制裁下本港面臨的困難,楊紅霞表示,目前本港與美國的顯卡存在一到兩代的代差,但又指科技發展總面臨阻力,相信本港可以克服。

相關字詞﹕

上 / 下一篇新聞