2025/01/30

中國AI新創DeepSeek日前公佈以低成本開發出媲美ChatGPT的模型,震驚市場,但OpenAI表示掌握了DeepSeek盜用其模型協助訓練開發證據,學者則評論盜用技術不意外且要完全防堵困難度十分高。
ChatGPT的開發商OpenAI向英國「金融時報」(Financial Times)表示,DeepSeek疑似利用「蒸餾」(distillation)技術來模仿或複製GPT-4的能力,亦即無須從零訓練自己開發中的較小AI模型,則能利用較低算力來達到大型模型能力,從而減少支出成本並提升效率。微軟維安研究員2024年已發現部分疑似屬於DeepSeek的帳戶,經調查有違規使用OpenAI API進行未經授權的訓練,違反了OpenAI用戶不得「複製」的服務條款,隨後已將該等用戶封鎖,但未進一步說明具體細節。
此外,DeepSeekeek雖聲稱僅使用2048張輝達H800顯示卡,訓練成本約美金560萬元,成本僅為OpenAI和Google類似規模模型的幾十分之一。但美國Scale AI執行長汪滔(Alexandr Wang)卻表示DeepSeek很有可能繞道採購至少5萬多顆輝達(Nvidia)H100高階晶片來開發現有模型,形同直接挑戰美國出口管制規定,美國政府未來恐加強管制。
而學者與業界評論小型的企業藉此技術「搭便車」是常見做法,如此可以免費獲得人類回饋訓練的結果。【記者 林宜然整理報導】