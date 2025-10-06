擊敗Google模型

LMArena由加州大學柏克萊分校研究人員建立，平台以「盲測」方式比較AI模型表現。用戶輸入相同提示後，系統隨機展示兩個匿名模型的回覆，用戶只需投票選出較佳答案，投票完成後才會顯示模型名稱。這種盲測方式相比傳統性能跑分，更能體現用戶層面的感受與偏好。另外，排名榜會在不同任務類型或題材範疇中進行對戰，例如聊天問答、自然語言回覆、多模態對戰等。例如，「Nano Banana」在「影像編輯」榜單中位居首位。

騰訊在微信公眾號回應稱：「這個排名沒有任何『演算法濾鏡』，靠的是全球用戶兩兩對比投票，每一票都藏着真實體驗和偏好。」

近期多間內地企業發布新AI模型，例如阿里巴巴（9988）上月發布AI服務技術體系，包括推出Qwen3系列大模型，並指其中Max版部分性能超越OpenAI旗下最新旗艦模型GPT-5，排名全球前三。