
460萬(wàn)美元訓(xùn)練成本是真是假?K3何時(shí)發(fā)布?AGI還有多遠(yuǎn)?楊植麟團(tuán)隊(duì)一口氣回答了數(shù)十個(gè)問(wèn)題。
最近AI圈又炸了!月之暗面的Kimi K2 Thinking模型一經(jīng)發(fā)布,就讓海外開(kāi)發(fā)者社區(qū)徹底沸騰。
這款模型在Humanity's Last Exam、TAU-Bench等多項(xiàng)核心基準(zhǔn)測(cè)試中超越了OpenAI的GPT-5和Anthropic的Claude Sonnet 4.5,而API調(diào)用價(jià)格遠(yuǎn)低于兩者。
Hugging Face聯(lián)合創(chuàng)始人Thomas Wolf直接驚呼:"這是又一次DeepSeek式的輝煌時(shí)刻嗎?"

就在全球開(kāi)發(fā)者熱議之際,北京時(shí)間11月11日凌晨,當(dāng)國(guó)內(nèi)大部分人還在睡夢(mèng)中時(shí),月之暗面創(chuàng)始人楊植麟,以及聯(lián)合創(chuàng)始人周昕宇、吳育昕,在Reddit社群平臺(tái)進(jìn)行了一場(chǎng)長(zhǎng)達(dá)數(shù)小時(shí)的AMA(Ask Me Anything)問(wèn)答。

這也是三位聯(lián)創(chuàng)首次共同露面,面對(duì)海外開(kāi)發(fā)者的各種尖銳提問(wèn)。
問(wèn)答持續(xù)數(shù)小時(shí),從460萬(wàn)美元訓(xùn)練成本傳聞到K3何時(shí)發(fā)布,從開(kāi)源策略到行業(yè)競(jìng)爭(zhēng),從技術(shù)路徑到AGI時(shí)間表,楊植麟團(tuán)隊(duì)一口氣回答了數(shù)十個(gè)問(wèn)題。
460萬(wàn)美元傳聞不實(shí),真實(shí)成本難以量化
最受關(guān)注的問(wèn)題莫過(guò)于傳聞中的460萬(wàn)美元訓(xùn)練成本。面對(duì)這個(gè)讓整個(gè)硅谷都震驚的數(shù)字,楊植麟直接回應(yīng):
"這不是官方數(shù)據(jù)。由于訓(xùn)練成本中很大一部分是研究和實(shí)驗(yàn),所以很難量化具體數(shù)字。"

這一回應(yīng)打破了業(yè)界對(duì)K2 Thinking"超低成本"的猜測(cè)。盡管具體數(shù)字未公布,但從技術(shù)實(shí)現(xiàn)來(lái)看,該模型確實(shí)在成本控制上有所突破:
K2 Thinking采用1萬(wàn)億參數(shù)的混合專(zhuān)家架構(gòu),但每次推理僅激活320億參數(shù),并使用原生INT4量化技術(shù),將推理速度提升約2倍。
在硬件配置方面,楊植麟透露團(tuán)隊(duì)使用配備Infiniband的H800 GPU進(jìn)行訓(xùn)練。"雖然不如美國(guó)的高端GPU,我們?cè)跀?shù)量上也不占優(yōu)勢(shì),但我們把每張顯卡的性能都榨取得淋漓盡致。"

據(jù)悉,K2 Thinking的API調(diào)用價(jià)格為每百萬(wàn)token輸入1-4元,輸出16元,僅為GPT-5的四分之一,真正做到了性能與成本的完美平衡。
這種性?xún)r(jià)比優(yōu)勢(shì),正在吸引越來(lái)越多的企業(yè)用戶(hù)從閉源模型轉(zhuǎn)向開(kāi)源方案。
K2 Thinking過(guò)于“話(huà)癆”?專(zhuān)注Agent能力
面對(duì)眾多開(kāi)發(fā)者關(guān)于K2 Thinking"過(guò)于話(huà)嘮"的質(zhì)疑,團(tuán)隊(duì)給出了明確回應(yīng)。

楊植麟表示:"當(dāng)前版本中,我們更看重絕對(duì)性能而非token效率。后續(xù)會(huì)嘗試將效率納入獎(jiǎng)勵(lì)機(jī)制,讓模型學(xué)會(huì)壓縮思考過(guò)程。"

這種設(shè)計(jì)理念反映了月之暗面的技術(shù)取舍:為了確保復(fù)雜任務(wù)的完成質(zhì)量,可以適當(dāng)犧牲token效率。K2 Thinking能夠連續(xù)執(zhí)行200-300次工具調(diào)用來(lái)解決復(fù)雜問(wèn)題,在"思考-工具-思考-工具"的交替模式中保持穩(wěn)定性。
開(kāi)發(fā)過(guò)程中的最大挑戰(zhàn)
在技術(shù)實(shí)現(xiàn)上,團(tuán)隊(duì)采用端到端智能體強(qiáng)化學(xué)習(xí)訓(xùn)練方式,使模型在數(shù)百個(gè)步驟的工具調(diào)用以及包括檢索在內(nèi)的中間步驟中表現(xiàn)更佳。這種訓(xùn)練方式的核心是讓AI模仿人類(lèi)解決問(wèn)題的過(guò)程,在反復(fù)迭代中逐步接近最優(yōu)解。
月之暗面聯(lián)合創(chuàng)始人吳育昕在回答中透露,支持交錯(cuò)的"思考-工具-思考-工具"模式是開(kāi)發(fā)過(guò)程中的主要挑戰(zhàn)之一,"這在LLM中是一種相對(duì)較新的行為,需要大量工作才能正確實(shí)現(xiàn)。"

K3什么時(shí)候發(fā)布?
當(dāng)有網(wǎng)友問(wèn)及K3的發(fā)布時(shí)間時(shí),楊植麟給出了一個(gè)頗具幽默感的回答:
"在Sam(山姆·奧特曼)的萬(wàn)億級(jí)數(shù)據(jù)中心建成之前。"

有人調(diào)侃:“所以,永遠(yuǎn)等不到了,反正他永遠(yuǎn)也搞不定那個(gè)爛尾工程?開(kāi)個(gè)玩笑啦~”
為什么先推純文本模型?
對(duì)于多模態(tài)能力的發(fā)展,楊植麟表示:"訓(xùn)練視覺(jué)語(yǔ)言模型需要時(shí)間獲取數(shù)據(jù)和調(diào)整訓(xùn)練,所以我們決定先發(fā)布一個(gè)文本模型。"

AGI有那個(gè)范兒了
在開(kāi)源動(dòng)機(jī)方面,楊植麟給出了頗具理想主義色彩的回答:"我們擁抱開(kāi)源,因?yàn)槲覀兿嘈臕GI應(yīng)該是一種導(dǎo)致團(tuán)結(jié)而不是分裂的追求。"

K2 Thinking采用Modified MIT許可證,在保留標(biāo)準(zhǔn)MIT許可證大部分自由的基礎(chǔ)上,添加了一項(xiàng)關(guān)鍵限制:當(dāng)模型被用于超過(guò)一億月活用戶(hù)或2000萬(wàn)美元月收入的商業(yè)產(chǎn)品時(shí),需要注明使用了Kimi K2模型。
當(dāng)被問(wèn)及AGI時(shí)間線(xiàn)時(shí),楊植麟給出了相對(duì)謹(jǐn)慎的回答:"AGI這件事很難定義,但大家已經(jīng)能感覺(jué)到那個(gè)范兒了,未來(lái)會(huì)有更多更強(qiáng)大的模型。"

是否會(huì)發(fā)布更大規(guī)模閉源模型?
對(duì)于是否會(huì)發(fā)布更大規(guī)模閉源模型的問(wèn)題,楊植麟給出了一個(gè)耐人尋味的回答:"如果它變得太危險(xiǎn)的話(huà):)"

這既暗示了對(duì)模型安全性的考慮,也為未來(lái)的商業(yè)化策略留下了想象空間。
當(dāng)前,K2 Thinking在發(fā)布后不到48小時(shí)內(nèi)下載量已超過(guò)5萬(wàn),成為Hugging Face最熱門(mén)的開(kāi)源模型。
與DeepSeek的技術(shù)路徑分歧:OCR和KDA
面對(duì)不同技術(shù)路線(xiàn)的選擇,月之暗面團(tuán)隊(duì)展現(xiàn)出了明確的技術(shù)偏好。對(duì)于DeepSeek近期備受關(guān)注的OCR路線(xiàn),周昕宇表達(dá)了不同看法:
"我個(gè)人覺(jué)得這條路走得有點(diǎn)重了,我更傾向于繼續(xù)在特征空間里下功夫,去找到更通用、并且與具體模態(tài)無(wú)關(guān)的方法,來(lái)提升模型效率。"
在未來(lái)發(fā)展方向上,團(tuán)隊(duì)透露KDA是他們最新的實(shí)驗(yàn)性架構(gòu),相關(guān)理念很可能會(huì)應(yīng)用于K3中。KDA采用3:1的比例將KDA和MLA路線(xiàn)混合,在傳統(tǒng)Transformer基礎(chǔ)上讓模型學(xué)會(huì)"抓重點(diǎn)信息",在性能、速度、顯存占用方面實(shí)現(xiàn)優(yōu)化。

楊植麟表示,團(tuán)隊(duì)已內(nèi)部試驗(yàn)Kimi Linear新結(jié)構(gòu)(架構(gòu)的核心是KDA,一種表達(dá)能力更強(qiáng)的線(xiàn)性注意力模塊),初步結(jié)果看起來(lái)有前景,并可進(jìn)一步與稀疏化技術(shù)組合。

市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。
海量資訊、精準(zhǔn)解讀,盡在新浪財(cái)經(jīng)APP
股票配資股票配資公司提示:文章來(lái)自網(wǎng)絡(luò),不代表本站觀點(diǎn)。