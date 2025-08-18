AI搜索：從單次搜索到深度研究

生成式AI模型存在根本局限——其知識庫完全受限於訓練數據，既無法得知數據外的世界，也缺乏實時更新能力。這是廣為人詬病的「幻覺」問題（模型在回答自己不熟悉的問題時憑空揑造事實）的根源之一。

為改善此問題，以ChatGPT為首的AI聊天機械人，於2024年已普遍整合了搜索功能。其運作模式，是在回答前先透過搜索引擎取得即時資訊，再基於這些實時外部資料作答，而非單純依賴其固有靜態知識庫。這種被稱為「檢索增強生成」（retrieval-augmented generation）的技術，顯著拓寬了AI之知識邊界。到了2025年，推理模型的出現，更是令AI搜索應用從單次搜索（search），提升至深度研究（deep research）層次。具備強大推理能力的AI，不再只限於一次過的搜索與總結，而是能夠化身為AI研究代理（AI research agent），執行複雜的多步驟研究任務。

試想像：一個市場分析師需撰寫行業競爭報告，過去可能要花費數天時間，手動搜索主要競爭對手名單、逐一查找各公司最新季度財報、閱讀多份市場分析報告以找出關鍵趨勢，最後再整合所有資料，撰寫摘要與洞見。如今，一個先進AI研究代理，僅需接收一個簡單精確的指令，例如「分析香港電動車市場競爭格局及未來5年趨勢」，便能夠自主地將任務分解、規劃搜索路徑、多層次地蒐集和交叉驗證資料，最終生成一份結構完整、水平接近初級全職分析師的深度分析報告。

無論是處理外部資訊的市場調研、財報分析，還是整合內部海量文件的知識管理任務，這種深度研究能力，都為白領上班族帶來前所未有的效率提升。筆者本人日常工作，亦經常受惠於此。

AI編程：從「副駕駛」到「數碼員工」

編程一直被視為最適合AI落地的領域，原因有三：（1）互聯網上存在海量開源程式碼，為模型提供了大量高質量訓練數據；（2）程式有明確對錯標準（能否成功運行），易於透過強化學習技術持續改進；（3）軟件工程師人力成本高昂，自動化的商業價值巨大。

事實上，程式員是全球最早大規模擁抱AI工具的專業群體。早在ChatGPT面世之前，GitHub Copilot等AI工具已開始改變編程生態。發展至今，如Cursor這類深度整合AI的開發環境，已成為許多工程師不可或缺的工具，帶來數以倍計生產力躍升。據市場研究機構估算，AI編程輔助工具市場規模在近3年以驚人速度擴張，已達百億美元級別。

與AI搜索進化軌迹相似，推理模型的出現，也令AI編程迎來質變，催生了編程代理（coding agent）的普及。過去的AI編程工具像一個稱職助手，在程式員編寫程式碼時提供建議、自動補完或生成單個函數，主導權仍在人類手上；相比之下，Claude Code之類的新一代編程代理，更像一個初級軟件工程師，能夠理解高階開發需求（例如「為我的網站建立一個用戶註冊系統」），然後自主地規劃、編寫整個程式庫、創建文件、運行測試、發現並修正錯誤，最後發布系統。

這種從「副駕駛」（copilot）到「數碼員工」的轉變，正重塑軟件開發價值鏈。儘管頂級編程代理的單個帳號費用可高達數千港元，但其所節省時間與人力成本，使許多開發者及公司仍視之為極具價值的投資。廣受程式員歡迎之Claude模型背後的科技公司Anthropic，最近便公開表示，他們的模型其實已經是年化收入達數十億美元的盈利業務。

結語：非結構化數據的自動化時代

AI帶來的最大變革，是人類歷史上首次出現了能夠大規模理解並處理非結構化數據（unstructured data）的機器。過去的資訊科技，擅長處理數字、表格這類結構化數據（structured data）；但對於文字、圖像、程式碼這些非結構化數據，只能夠儲存和傳輸，無法真正理解其內涵。生成式AI的核心突破，正是賦予了機器理解這些複雜抽象資訊的能力。

正如Nvidia創辦人黃仁勳在10多年前洞察神經網絡潛力時的斷言：「如果它能夠做圖像識別，最終它就能夠處理一切。」隨着AI模型不斷得到更多高質量訓練數據，及推理能力不斷提升，各行各業那些曾經簡單的工作，很快就會被徹底自動化；那些曾經較困難、較複雜的工作，將在AI賦能下變成新的「簡單」；以前的「不可能」，會變成接下來的「困難」。現實的巨輪正不斷推動我們向前，我們熟悉的技能標準與價值判斷，將被重塑。

浪潮之下，我們應如何重新審視自身價值，投資哪些在未來依然保值，甚至更有價值的核心能力？這將是筆者在往後文章繼續探討的議題。

作者是AI企業創辦人、大學AI課程導師

