DeepSeek这款中国人工智能模型声称在成本效率方面大大超过了美国的竞争对手,人工智能大战由此进入白热化阶段。它的开源聊天机器人已将该应用推向了51个国家的AppStore榜首位置,现在又有消息称它是在华为人工智能芯片上运行的。
该信息来自@Dorialexander,他表示,DeepSeekR1LLM(大型语言模型)是在NVIDIAH100上进行的训练,但使用了Ascend910C芯片进行推理,即使用训练好的模型生成回复。由于Ascend芯片不涉及训练,因此对GPU的功耗要求并不高。
不过,Ascend910C相对较低的性能限制了它在训练方面的适用性。华为计划通过即将推出的920C芯片来解决这一问题,旨在与NVIDIA用于人工智能操作的领先芯片组BlackwellB200竞争。