北京時間1月14日,韓國一心想要發展本土AI大模型,但是被寄予厚望的國產大模型卻被發現使用了中國公司的大模型代碼。這件事表明,韓國想要擺脫對美國或中國科技巨頭的依賴是何其困難。
去年6月,韓國政府發起了一場競賽,希望打造一個使用韓國技術開發的全新、獨立的AI模型。在美國和中國主導AI領域的全球格局下,開發這樣的本土工具對于確保韓國技術自主至關重要。
但事實證明,說起來容易,做起來難。在這項為期三年的競賽中,五家入圍決賽的公司里有三家被發現至少使用了部分來自外國AI模型的開源代碼,其中包括中國的模型。
這些公司和AI專家辯稱,刻意回避現有AI模型、試圖從零開始構建一切并不明智。但反對者表示,任何對外國工具的使用都會帶來潛在的安全風險,并削弱培育真正屬于本國的AI模型的希望。
哈佛大學電氣工程教授魏裕炎(Gu-Yeon Wei,音譯)表示,在推進AI模型開發時,要求每一行代碼都完全自主編寫并不現實。他熟悉這項韓國競賽,但并未直接參與任何參賽公司。
“若放棄開源軟件,無異于將海量技術紅利置于一旁。”他表示。
眼下,全球各國越來越重視減少對外國技術的依賴,并提升自身在AI領域的能力。AI可能深刻影響這些國家的經濟競爭力與國家安全。
韓國擁有眾多芯片巨頭、軟件公司,而且發展AI也獲得了政治支持,是所謂“主權AI”的最積極推動者之一。上述競賽旨在2027年前評選出兩款本土勝出模型,其性能能達到或超過OpenAI、谷歌等領先AI模型的95%。獲勝者將獲得政府提供的數據和人才招聘資金支持,并有權使用政府采購的、對AI計算至關重要的芯片。
中國代碼
近日,入圍決賽企業之一的Upstage引發了爭議。韓國本土競爭對手Sionic AI的CEO高錫賢(Ko Suk-hyun,音譯)稱,Upstage AI模型的部分模塊與中國智譜AI的開源模型存在相似之處。他聲稱,Upstage的部分代碼中甚至還留有智譜AI的版權標記.
“一款被懷疑是根據中國模型微調的套殼模型,卻提交到由納稅人資金資助的項目中,這令人深感遺憾。”高錫賢在領英上表示。Sionic也曾參與韓國這一競賽,但未能進入決賽名單。

智譜AI
對此,Upstage舉行了一場直播驗證會,公開了其開發日志以證明其模型是從零開始,采用自有方法進行開發和訓練的。但其用于運行模型的推理代碼確實使用了源自智譜AI的開源元素,這些元素在全球范圍內被廣泛采用。高錫賢隨后就此道歉。
這場爭議也促使韓國對其他入圍決賽的模型進行更嚴格的審視。 Naver公司AI模型的視覺與音頻編碼器被指與中國阿里巴巴及美國OpenAI的產品存在相似之處。視覺與音頻編碼器負責將圖像和聲音轉換為機器可理解的格式。
韓國SK電訊也遭到批評,原因是其用于運行AI模型的推理代碼被指與中國DeepSeek的代碼存在相似之處。
Naver承認使用了外部編碼器,但解釋稱這是采用標準化技術的戰略決策,并強調決定模型如何學習和訓練的核心引擎完全由該公司自主開發。SK電訊也提出了類似觀點,著重說明其模型核心的獨立性。

SK電訊在韓國IT展會上的展臺
該競賽的規則并未明確說明是否允許使用外國企業的開源代碼。自爭議出現以來,負責監督此次競賽的韓國科學部尚未發布任何新的指導方針。韓國科學部長裴慶勛(Bae Kyung-hoon)對此番激烈討論表示歡迎。
“當我看到攪動我國AI行業的技術辯論時,我實際上看到了韓國AI的光明未來。”裴慶勛本月早些時候在社交媒體上寫道。
韓國科學部拒絕就此置評,該部門計劃按原定安排在本周從五家決賽入圍企業中淘汰一家。
首爾國立大學AI研究所所長李在武(Jae W. Lee,音譯)稱,AI模型的開發是通過設定和微調內部數值以獲得輸出,而在受到質疑的入圍決賽模型中,這些核心任務似乎并未依賴外國工具。
“他們是從零開始訓練的。”他表示。