事情是這樣的,近日,斯坦福AI團(tuán)隊(duì)被曝出了抄襲事件,而且抄襲的還是中國(guó)國(guó)產(chǎn)的大模型成果,模型結(jié)構(gòu)和代碼,幾乎一模一樣。
斯坦福的Llama3-V項(xiàng)目在5月29日發(fā)布,宣稱僅需500美元就能訓(xùn)練出一個(gè)性能超越GPT-4V、Gemini Ultra、Claude Opus等的多模態(tài)大模型。

Llama3-V 的 3 位作者或許是擁有名校頭銜加持,又有特斯拉、SpaceX 的大廠相關(guān)背景,這個(gè)項(xiàng)目短短幾天就受到了不小的關(guān)注。
然而,一位網(wǎng)友發(fā)現(xiàn),Llama3-V的模型結(jié)構(gòu)和代碼與出自清華系明星創(chuàng)業(yè)公司面壁智能的MiniCPM-Llama3-V 2.5幾乎一模一樣,只是變量名有所變化。
面對(duì)抄襲的指控,斯坦福團(tuán)隊(duì)選擇了刪庫(kù)跑路,目前在GitHub和HuggingFace上的相關(guān)項(xiàng)目均顯示404,無(wú)法訪問(wèn)。

面壁智能的MiniCPM-Llama3-V 2.5項(xiàng)目具有獨(dú)特的功能,如識(shí)別清華簡(jiǎn)一種罕見(jiàn)的中國(guó)古代文字。
Llama3-V在未公開(kāi)的實(shí)驗(yàn)性特征上與MiniCPM-Llama3-V 2.5表現(xiàn)出高度相似的行為,這些特征是根據(jù)MiniCPM-Llama3-V 2.5團(tuán)隊(duì)內(nèi)部數(shù)據(jù)訓(xùn)練的。
面對(duì)抄襲的質(zhì)疑,斯坦福團(tuán)隊(duì)最初辯稱,他們的工作早于面壁智能的MiniCPM,只是使用了他們的tokenizer。
然而,隨后他們?cè)贛edium上的聲明被刪除,且最新的回應(yīng)也被撤回。
面壁智能CEO李大海對(duì)此事件做出了正式回應(yīng),要求Llama3-V作者對(duì)這個(gè)問(wèn)題給出一個(gè)正式的解釋,目前,此事仍在持續(xù)發(fā)酵中。