这本来应该是摩尔科技的活儿,但张明振知道,核心的东西一定还是卷耳智能提供的,正好纪弘现在就在家里,他就顺口问了一句。
“我们设计了一种全新的架构,摩尔科技正根据我这边提供的进行开发,完成也就在近日,不会耽误进度的。”
纪弘说着,还拿出了自己的手机打开了一页资料,张明振教授结借过一看:
。
“类思维架构?ctca?”张明振点了点头:“你们对性能有预期吗?”
“智算中心采用的是摩尔科技的ai卡s4000,仅从规模上看,ai性能大约有4090的30%左右。
“但毕竟s4000是专业的ai卡,直接搞了48g的超大显存和768gb/s的显存带宽,如果用cuda架构,能发挥出4090显卡20%的水平就算高了。
“我们的最低目标是,单卡性能超过4090的35%,片上互联之后,以千卡规模计,达到同等数量4090集群算力水平的一半左右。”
张明振教授并没有很惊讶,以30%的硬件规模发挥出35%的性能水平,以卷耳智能科技的水平,他甚至觉得纪弘说的有点儿保守。
至于千卡集群的整体算力,那会更加依赖于片间互联的综合调度了,这就更是智能调度的强势领域了。
gpu智算中心张明振目前没有相关的行业数据。
但从cpu超算的经验来看,两片cpu联合能发挥出2*70%的性能就算高的了,如果是一万片cpu联合,每片能发挥出的水平甚至不足30%。
所以,超算的算力是有瓶颈的,会存在一个数字,达到这个数字之后,无论再怎么增加芯片,超算的整体性能都不会再提升,甚至还会有所下降。
gpu智算中心应该也有类似的问题,能做到什么程度,调度算法在一定程度上甚至比硬件豆更加重要。
“性能是可以的。”张明振教授一看纪弘这轻松的模样,就知道他肯定是按保守预计的,真实的性能还得落地了再看,也是接着问道:
“我上次跟你说的那个关于教育行业人才培养类的模型……”