DeepSeek最新論文:訓練速度提升9倍,推理速度快11倍!
電子發燒友網報道(文/梁浩斌)周二xAI發布了Grok3,這個馬斯克稱之為“地球上最聰明的AI”搶占了所有人的眼球。 ? 為了打造最強AI大模型,xAI投入了20萬塊H100 GPU,計算資源是上一代Grok2的15倍左右。在Benchmarks中,Grok3毫無懸念成功地領先Deepseek R1、o3 mini等對手。 ? 不過用如此大規模的算力集群,花費上一代15倍的計算資源投入,業界認為Grok3的性能只是略微提升了大模型能力上限,實際提升幅度低于算力投入的預期。這或許也預示著大模型的Scaling L
發表于02-20 11:25 ? 1851