打不過(guò)就加入!英偉達(dá)宣布使用DeepSeek公開(kāi)表示其推理能力“最先進(jìn)”
24直播網(wǎng)
體育資訊2月1日?qǐng)?bào)道宣稱 DeepSeek的R1模型推出后,引起了廣泛關(guān)注,更是一度讓美股大跌,英偉達(dá)一日蒸發(fā)6000億美元。
而近日英偉達(dá)宣布已在其網(wǎng)站上發(fā)布了采用DeepSeek R1 671b的“英偉達(dá)NIM微服務(wù)”預(yù)覽版,公開(kāi)表示DeepSeek-R1推理能力“最先進(jìn)”
英偉達(dá)表示 DeepSeek-R1 模型是最先進(jìn)、高效的大型語(yǔ)言模型,在推理、數(shù)學(xué)和編碼方面表現(xiàn)出色。NIM 微服務(wù)在單個(gè) HGX H200 系統(tǒng)上,每秒能處理多達(dá) 3872 個(gè) tokens,這既得益于 H200 的 HBM3e 高帶寬內(nèi)存等硬件,也離不開(kāi)采用 DeepSeek R1 671b 后在軟件層面的優(yōu)化,如動(dòng)態(tài)批處理、量化、TensorRT 加速等。
一方面,英偉達(dá)此舉是為了完善 NIM 生態(tài),吸引更多開(kāi)發(fā)者依賴它的全棧解決方案,鞏固自己在 AI 基礎(chǔ)設(shè)施領(lǐng)域的地位;另一方面,也是在和 AWSBedrock、Azure Al Model Catalog 這些云服務(wù)巨頭競(jìng)爭(zhēng),靠靈活的本地化部署選項(xiàng),爭(zhēng)奪企業(yè) AI 市場(chǎng)份額。