网站av,久久久久中文字幕,日本a不卡,色呦呦网页,四季av一区二区三区,天天爽天天爽,国产视频在线免费观看

<tbody id="zgklk"></tbody>

<tbody id="zgklk"></tbody>

<tbody id="zgklk"></tbody>

放大資金，增加盈利可能

配資是一種為投資者提供杠桿資金的金融服務(wù)！

冠盈配資再給老外億點(diǎn)點(diǎn)震撼？Kimi楊植麟：啥時(shí)發(fā)K3? 奧特曼的萬(wàn)億數(shù)據(jù)中心建成前

冠盈配資來(lái)源：股票配資平臺(tái)官網(wǎng) 網(wǎng)站：股票配資股票配資公司日期：2025-12-24 13:22:55 查看：113

冠盈配資再給老外億點(diǎn)點(diǎn)震撼？Kimi楊植麟：啥時(shí)發(fā)K3? 奧特曼的萬(wàn)億數(shù)據(jù)中心建成前

460萬(wàn)美元訓(xùn)練成本是真是假？K3何時(shí)發(fā)布？AGI還有多遠(yuǎn)？楊植麟團(tuán)隊(duì)一口氣回答了數(shù)十個(gè)問(wèn)題。

最近AI圈又炸了！月之暗面的Kimi K2 Thinking模型一經(jīng)發(fā)布，就讓海外開(kāi)發(fā)者社區(qū)徹底沸騰。

這款模型在Humanity's Last Exam、TAU-Bench等多項(xiàng)核心基準(zhǔn)測(cè)試中超越了OpenAI的GPT-5和Anthropic的Claude Sonnet 4.5，而API調(diào)用價(jià)格遠(yuǎn)低于兩者。

Hugging Face聯(lián)合創(chuàng)始人Thomas Wolf直接驚呼："這是又一次DeepSeek式的輝煌時(shí)刻嗎？"

就在全球開(kāi)發(fā)者熱議之際，北京時(shí)間11月11日凌晨，當(dāng)國(guó)內(nèi)大部分人還在睡夢(mèng)中時(shí)，月之暗面創(chuàng)始人楊植麟，以及聯(lián)合創(chuàng)始人周昕宇、吳育昕，在Reddit社群平臺(tái)進(jìn)行了一場(chǎng)長(zhǎng)達(dá)數(shù)小時(shí)的AMA（Ask Me Anything）問(wèn)答。

這也是三位聯(lián)創(chuàng)首次共同露面，面對(duì)海外開(kāi)發(fā)者的各種尖銳提問(wèn)。

問(wèn)答持續(xù)數(shù)小時(shí)，從460萬(wàn)美元訓(xùn)練成本傳聞到K3何時(shí)發(fā)布，從開(kāi)源策略到行業(yè)競(jìng)爭(zhēng)，從技術(shù)路徑到AGI時(shí)間表，楊植麟團(tuán)隊(duì)一口氣回答了數(shù)十個(gè)問(wèn)題。

460萬(wàn)美元傳聞不實(shí)，真實(shí)成本難以量化

最受關(guān)注的問(wèn)題莫過(guò)于傳聞中的460萬(wàn)美元訓(xùn)練成本。面對(duì)這個(gè)讓整個(gè)硅谷都震驚的數(shù)字，楊植麟直接回應(yīng)：

"這不是官方數(shù)據(jù)。由于訓(xùn)練成本中很大一部分是研究和實(shí)驗(yàn)，所以很難量化具體數(shù)字。"

這一回應(yīng)打破了業(yè)界對(duì)K2 Thinking"超低成本"的猜測(cè)。盡管具體數(shù)字未公布，但從技術(shù)實(shí)現(xiàn)來(lái)看，該模型確實(shí)在成本控制上有所突破：

K2 Thinking采用1萬(wàn)億參數(shù)的混合專(zhuān)家架構(gòu)，但每次推理僅激活320億參數(shù)，并使用原生INT4量化技術(shù)，將推理速度提升約2倍。

在硬件配置方面，楊植麟透露團(tuán)隊(duì)使用配備Infiniband的H800 GPU進(jìn)行訓(xùn)練。"雖然不如美國(guó)的高端GPU，我們?cè)跀?shù)量上也不占優(yōu)勢(shì)，但我們把每張顯卡的性能都榨取得淋漓盡致。"

據(jù)悉，K2 Thinking的API調(diào)用價(jià)格為每百萬(wàn)token輸入1-4元，輸出16元，僅為GPT-5的四分之一，真正做到了性能與成本的完美平衡。

這種性?xún)r(jià)比優(yōu)勢(shì)，正在吸引越來(lái)越多的企業(yè)用戶從閉源模型轉(zhuǎn)向開(kāi)源方案。

K2 Thinking過(guò)于“話癆”？專(zhuān)注Agent能力

面對(duì)眾多開(kāi)發(fā)者關(guān)于K2 Thinking"過(guò)于話嘮"的質(zhì)疑，團(tuán)隊(duì)給出了明確回應(yīng)。

楊植麟表示："當(dāng)前版本中，我們更看重絕對(duì)性能而非token效率。后續(xù)會(huì)嘗試將效率納入獎(jiǎng)勵(lì)機(jī)制，讓模型學(xué)會(huì)壓縮思考過(guò)程。"

這種設(shè)計(jì)理念反映了月之暗面的技術(shù)取舍：為了確保復(fù)雜任務(wù)的完成質(zhì)量，可以適當(dāng)犧牲token效率。K2 Thinking能夠連續(xù)執(zhí)行200-300次工具調(diào)用來(lái)解決復(fù)雜問(wèn)題，在"思考-工具-思考-工具"的交替模式中保持穩(wěn)定性。

開(kāi)發(fā)過(guò)程中的最大挑戰(zhàn)

在技術(shù)實(shí)現(xiàn)上，團(tuán)隊(duì)采用端到端智能體強(qiáng)化學(xué)習(xí)訓(xùn)練方式，使模型在數(shù)百個(gè)步驟的工具調(diào)用以及包括檢索在內(nèi)的中間步驟中表現(xiàn)更佳。這種訓(xùn)練方式的核心是讓AI模仿人類(lèi)解決問(wèn)題的過(guò)程，在反復(fù)迭代中逐步接近最優(yōu)解。

月之暗面聯(lián)合創(chuàng)始人吳育昕在回答中透露，支持交錯(cuò)的"思考-工具-思考-工具"模式是開(kāi)發(fā)過(guò)程中的主要挑戰(zhàn)之一，"這在LLM中是一種相對(duì)較新的行為，需要大量工作才能正確實(shí)現(xiàn)。"

K3什么時(shí)候發(fā)布？

當(dāng)有網(wǎng)友問(wèn)及K3的發(fā)布時(shí)間時(shí)，楊植麟給出了一個(gè)頗具幽默感的回答：

"在Sam（山姆·奧特曼）的萬(wàn)億級(jí)數(shù)據(jù)中心建成之前。"

有人調(diào)侃：“所以，永遠(yuǎn)等不到了，反正他永遠(yuǎn)也搞不定那個(gè)爛尾工程？開(kāi)個(gè)玩笑啦～”

為什么先推純文本模型？

對(duì)于多模態(tài)能力的發(fā)展，楊植麟表示："訓(xùn)練視覺(jué)語(yǔ)言模型需要時(shí)間獲取數(shù)據(jù)和調(diào)整訓(xùn)練，所以我們決定先發(fā)布一個(gè)文本模型。"

AGI有那個(gè)范兒了

在開(kāi)源動(dòng)機(jī)方面，楊植麟給出了頗具理想主義色彩的回答："我們擁抱開(kāi)源，因?yàn)槲覀兿嘈臕GI應(yīng)該是一種導(dǎo)致團(tuán)結(jié)而不是分裂的追求。"

K2 Thinking采用Modified MIT許可證，在保留標(biāo)準(zhǔn)MIT許可證大部分自由的基礎(chǔ)上，添加了一項(xiàng)關(guān)鍵限制：當(dāng)模型被用于超過(guò)一億月活用戶或2000萬(wàn)美元月收入的商業(yè)產(chǎn)品時(shí)，需要注明使用了Kimi K2模型。

當(dāng)被問(wèn)及AGI時(shí)間線時(shí)，楊植麟給出了相對(duì)謹(jǐn)慎的回答："AGI這件事很難定義，但大家已經(jīng)能感覺(jué)到那個(gè)范兒了，未來(lái)會(huì)有更多更強(qiáng)大的模型。"

是否會(huì)發(fā)布更大規(guī)模閉源模型?

對(duì)于是否會(huì)發(fā)布更大規(guī)模閉源模型的問(wèn)題，楊植麟給出了一個(gè)耐人尋味的回答："如果它變得太危險(xiǎn)的話:)"

這既暗示了對(duì)模型安全性的考慮，也為未來(lái)的商業(yè)化策略留下了想象空間。

當(dāng)前，K2 Thinking在發(fā)布后不到48小時(shí)內(nèi)下載量已超過(guò)5萬(wàn)，成為Hugging Face最熱門(mén)的開(kāi)源模型。

與DeepSeek的技術(shù)路徑分歧：OCR和KDA

面對(duì)不同技術(shù)路線的選擇，月之暗面團(tuán)隊(duì)展現(xiàn)出了明確的技術(shù)偏好。對(duì)于DeepSeek近期備受關(guān)注的OCR路線，周昕宇表達(dá)了不同看法：

"我個(gè)人覺(jué)得這條路走得有點(diǎn)重了，我更傾向于繼續(xù)在特征空間里下功夫，去找到更通用、并且與具體模態(tài)無(wú)關(guān)的方法，來(lái)提升模型效率。"

在未來(lái)發(fā)展方向上，團(tuán)隊(duì)透露KDA是他們最新的實(shí)驗(yàn)性架構(gòu)，相關(guān)理念很可能會(huì)應(yīng)用于K3中。KDA采用3:1的比例將KDA和MLA路線混合，在傳統(tǒng)Transformer基礎(chǔ)上讓模型學(xué)會(huì)"抓重點(diǎn)信息"，在性能、速度、顯存占用方面實(shí)現(xiàn)優(yōu)化。

楊植麟表示，團(tuán)隊(duì)已內(nèi)部試驗(yàn)Kimi Linear新結(jié)構(gòu)（架構(gòu)的核心是KDA，一種表達(dá)能力更強(qiáng)的線性注意力模塊），初步結(jié)果看起來(lái)有前景，并可進(jìn)一步與稀疏化技術(shù)組合。

風(fēng)險(xiǎn)提示及免責(zé)條款

市場(chǎng)有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議，也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資，責(zé)任自負(fù)。

海量資訊、精準(zhǔn)解讀，盡在新浪財(cái)經(jīng)APP

股票配資股票配資公司提示：文章來(lái)自網(wǎng)絡(luò)，不代表本站觀點(diǎn)。

相關(guān)文章

冠盈配資貓咪兩歲相當(dāng)于人類(lèi)的幾歲？

冠盈配資貓咪兩歲相當(dāng)于人類(lèi)的幾歲？

冠盈配資剛見(jiàn)完普京，伊朗還是放心不下，邀請(qǐng)中國(guó)代表，前往德黑蘭一敘

冠盈配資剛見(jiàn)完普京，伊朗還是放心不下，邀請(qǐng)中國(guó)代表，前往德黑蘭一敘

冠盈配資德國(guó)嚴(yán)謹(jǐn)撞上中國(guó)速度，大眾的這場(chǎng)豪賭贏麻了

冠盈配資德國(guó)嚴(yán)謹(jǐn)撞上中國(guó)速度，大眾的這場(chǎng)豪賭贏麻了

相關(guān)評(píng)論

本文評(píng)分*

評(píng)論內(nèi)容*

你的昵稱(chēng)*

你的郵箱*

滬深京指數(shù)

熱點(diǎn)資訊

推薦資訊

冠盈配資解放軍艦隊(duì)進(jìn)逼菲律賓，下個(gè)目標(biāo)是誰(shuí)？澳方來(lái)探口風(fēng)，被中國(guó)2句話打發(fā)

冠盈配資解放軍艦隊(duì)進(jìn)逼菲律賓，下個(gè)目標(biāo)是誰(shuí)？澳方來(lái)探口風(fēng)，被中國(guó)2句話打發(fā)

?股票配資股票配資公司復(fù)旦附中：“五育并舉”培育西藏學(xué)子

?冠盈配資花笙生殖試管分享：眾多多囊女性有過(guò)排卵障礙問(wèn)題，該怎么辦才好？_患者_(dá)治療_技術(shù)

?冠盈配資經(jīng)濟(jì)隨筆｜從七個(gè)“更”讀懂中國(guó)經(jīng)濟(jì)

?冠盈配資女子竟在孩子?jì)雰很?chē)?yán)锊鼗钌?！網(wǎng)友：可怕

?冠盈配資從“憂居”到“優(yōu)居”的改變 ——探訪洛扎縣農(nóng)村老舊房屋改造提升行動(dòng)_大皖新聞 | 安徽網(wǎng)

<acronym id="jj7ns"><pre id="jj7ns"></pre></acronym>