AI观察 | Groq芯片爆火给我国AI芯片产业发展带来的3个启示

近日,硅谷初创企业Groq推出一款全新的AI芯片,声称实现了“地表最强推理”——在Groq上运行大模型的推理速度较英伟达GPU提高10倍甚至更高。该消息一出,迅速攻占了各大科技媒体板块头条。

近日,硅谷初创企业Groq推出一款全新的AI芯片,声称实现了“地表最强推理”——在Groq上运行大模型的推理速度较英伟达GPU提高10倍甚至更高。该消息一出,迅速攻占了各大科技媒体板块头条。这样的推理速度无疑是AI芯片领域的一次技术飞跃,也为国产AI芯片企业如何突围发展带来一些新启示。

启示一:可专注特定场景建立“比较优势”

Groq芯片是一种LPU(语言处理单元),其优越的推理性能,再一次展示了专用AI芯片在特定场景中的应用价值。因此,参考Groq芯片在某个应用场景做到替代或者超过英伟达,将有可能是国产AI芯片现阶段一条行之有效的发展路径。

比如这款推理芯片主打一个“快”。常规生成式AI主要使用英伟达A100、H100芯片来进行训练与推理工作,大模型推理过程中等待是相对比较正常的事情,字符一个个蹦出,半天才能回答完毕。但在Groq的演示平台上,模型收到提示词后,几乎能够立即生成答案。这些答案不仅相对质量较高,还附有引用,长度更是达到数百个单词。更令人惊讶的是,它超过3/4的时间是用于搜索信息,而生成答案的时间却短到只有几分之一秒。

虽然暂时有着种种缺点,但是Groq芯片的优势点太为突出,足以在某些场景下完全替代英伟达,甚至能做得更为优秀,自然而然吸引了大量关注及认可。可以想象,在Groq芯片的成本控制优化至合适区间后,将会有大量实际应用场景前来适配和使用。

启示二:需重视应用场景中的“性能匹配”

Groq芯片凭借推理速度脱颖而出,充分说明了其性能与应用场景之间的强相关性,这也再次提醒我们应用场景的重要性。国产AI芯片产业应当重视在实际应用场景中的性能匹配度,并在这一基础上开展芯片的优化和创新。

语言推理赛道上,谁是冠军也尚未一锤定音。目前来看,Groq芯片综合素质仍有相当的不足。比如Groq芯片每张卡的内存是230MB,在运行Llama-2 70B模型时,需要305张Groq卡才足够,而用H100则只需要8张卡。从目前的价格来看,这意味着在同等吞吐量下,Groq的硬件成本是H100的40倍,能耗成本是10倍。另外,Groq芯片目前只能适配少数几个大模型的推理工作,并且需要大量调试,广泛应用性还相对较差。其中的差距,也是中国企业的创新机会。

最终,一种AI芯片产品能否胜出,和多种因素密切相关,包括芯片本身的技术路线、产品推出的时间点,以及大模型的成熟度,等等。对于大模型来说,目前有观点认为大模型已经开始趋向稳定了,在这个基础上开发芯片是有机会的;也有观点认为大模型变化还很快,过两年大模型一改,所有的投入又得重新开始。这些争论还有待时间检验。

启示三:借助第三方评测体系“精准定位”

当前,美国政府对我国芯片出口管制的层层加码对国产AI芯片行业既是挑战又是机遇。从产业发展的整体视角来看,亟需构建一个中立、客观并具有权威性的评测体系,为各种芯片提供一个公平竞技的舞台和场景匹配的渠道。

在2023年世界人工智能大会上,人民日报社传播内容认知全国重点实验室(人民网)与中国电子技术标准化研究院共同发起的“智越计划”提出,要共同推动建立包含人工智能芯片性能评测、场景评测与综合评测的整体评估评测标准体系。其中的场景评测就是测试不同人工智能应用场景中各款芯片的实际使用效果。

“智越计划”将最终形成针对特定应用场景的综合报告和产品推荐目录,从而助力优化市场供需匹配,为政府、企业和研究机构建设智算中心提供芯片选型的重要参考和决策依据。

随着AI技术的飞速进步,市场对芯片产品的性能、稳定性和适用性有了更高要求。一个科学完善的评测体系将有效地指引企业研发方向,推动生态的繁荣发展和行业的整体进步。

THE END
免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
相关阅读
  • 资深业者推测:NS不采用最领先芯片并延期是为避免缺货

    资深业者推测:NS不采用最领先芯片并延期是为避免缺货

    日本资深游戏业者多根清史于3月3日今天发表最新评论文章,谈到了被游戏玩家期待已久的Switch2。在文章中,多根清史表示:“(NS2)目前可靠的情报是将会在25年3月发售,传言Switch2搭载T239芯片组导致性能并不出众

    1分钟前
  • 光子芯片来了 处理速度提升1000倍

    光子芯片来了 处理速度提升1000倍

    集成铌酸锂微波光子芯片不仅速度比传统电子处理器快1000倍,且具有超宽处理带宽和极高的计算精确度,能耗也更低。日前,香港城市大学副教授王骋团队与香港中文大学研究人员合作,利用铌酸锂为平台,开发出处理速度更快、能耗更低的微波光…

    3分钟前
  • 三星据悉将使用英伟达数字孪生技术提高芯片良率

    三星据悉将使用英伟达数字孪生技术提高芯片良率

    3月5日消息,三星将开始测试英伟达的数字孪生(Digital Twin)技术(基于Omniverse平台),以提高半导体芯片制造工艺的产量。数字孪生技术是在虚拟空间中,构建物理实体的“克隆体”,人工智能和大数据可用于分析和预测情况。

    4分钟前

栏目精选

  • 快讯 资深业者推测:NS不采用最领先芯片并延期是为避免缺货

    资深业者推测:NS不采用最领先芯片并延期是为避免缺货

    日本资深游戏业者多根清史于3月3日今天发表最新评论文章,谈到了被游戏玩家期待已久的Switch2。在文章中,多根清史表示:“(NS2)目前可靠的情报是将会在25年3月发售,传言Switch2搭载T239芯片组导致性能并不出众

    1分钟前
  • 快讯 越南涨超了日股、标普生科比芯片更牛

    越南涨超了日股、标普生科比芯片更牛

    2 月 23 日— 3 月 1 日当周,受 OPEC+ 考虑延长减产消息影响,原油领涨全球大类资产。越南股市傲视全球,日股续创新高触及 4 万点关口。本周欧美日股指一度齐创历史新高。其中美股三大指数连涨四个月,标普和道指创 2019 年来最大年度前…

    昨天 10:27