超速芯片LPU震撼登场！成本直降，正面挑战英伟达LLM霸主地位！

HyperAccel首席技术官李镇元上个月11日在首尔瑞草区公司总部与《朝鲜商业》会面时，透露了这一蓝图。即便无法完全取代当前由英伟达GPU主导的AI基础设施架构，公司也立志以专为大语言模型推理设计的“高性价比”专用半导体展开竞争。

李镇元曾是三星电子系统LSI事业部的系统半导体设计工程师，设计过充当智能手机“大脑”的应用处理器。他于2021年曾在AI半导体初创公司Newbla工作，随后于2023年加入新成立的AI半导体初创公司HyperAccel，担任CTO。目前他负责AI半导体架构开发。

HyperAccel是一家本土无晶圆厂初创公司，正在开发专为LLM推理（结果生成）设计的AI半导体“Verda”。该芯片采用三星电子4纳米代工工艺生产，其设计理念与现有GPU从根本上就不同。关键在于其专有架构“LPU（语言处理单元）”，以及采用了比昂贵的高带宽内存更便宜的低功耗DRAM（LPDDR5X）。

李镇元指出当前AI半导体的主要瓶颈在于“内存访问”。他解释说：“速度慢并非因为计算性能不足，而是因为从内存读写数据的过程过于复杂，导致拥堵。GPU需要反复将数据从HBM移至内部SRAM，然后再送到处理单元，这个过程产生了瓶颈。”

HyperAccel彻底重新设计了这一结构。Verda最大限度地减少了中间存储（缓冲区），设计为将数据直接从外部内存发送到处理单元LPU。李镇元表示：“GPU的内存带宽利用率大约在50%左右，而我们的目标是将这一数字提升至90%。”

这种结构变革带来了“成本”创新。对于运营AI服务的企业而言，最大的负担是包含设备价格和电费在内的总拥有成本。李镇元指出：“英伟达H100 GPU每块价格接近7000万至8000万韩元，配置一台服务器常常超过10亿韩元。Verda通过利用LPDDR来同时降低设备成本和功耗，目标是将TCO降至GPU的三分之一水平。”

HyperAccel的目标不止于数据中心。公司也瞄准了在家电、机器人等设备本地处理AI的“端侧AI”市场。目前正与LG电子合作开发家电用AI加速器，该策略旨在利用Verda的高能效架构，这对于在电力受限环境下进行实时处理至关重要。不过，这目前仍处于概念验证阶段，双方正为未来商用产品集成持续合作。

HyperAccel预计在Verda量产后将开始产生营收。公司计划初期以数据中心客户为中心扩大供应，随后扩展至云服务提供商和端侧AI市场。以下是对李镇元的问答实录。

―芯片开发目前处于哪个阶段？

“芯片设计已经完成，预计本月内推出。在实际环境中验证性能和可靠性后，我们的目标是今年下半年量产。”

―LPU与GPU有何不同？

“如果说GPU是样样精通、多才多艺的‘通用加速器’，那么LPU就是将所有火力集中于LLM推理任务的‘专用结构’。芯片架构本身针对Transformer模型的数据流进行了优化。”

―使用LPDDR而非HBM，速度不会变慢吗？

“虽然原始带宽较低，但我们的策略是通过优化数据移动路径来提升‘实际效率’。这使得我们能够在相同预算下服务更多的并发用户。”

―与三星电子代工厂、设计公司等国内半导体生态系统是如何合作的？

“我认为AI半导体不仅仅是设计，更是一种涵盖代工、设计、封装和服务器在内的‘综合艺术’。在此次Verda开发过程中，我们与三星电子代工厂合作，并与设计公司共同进行设计工作。我认为，国内此类经验的积累，从长远来看能够为系统半导体生态系统创造良性循环。”

―主要客户是哪些？

“数据中心运营商是核心。我们已经与Naver Cloud进行了概念验证，并计划结合K-Cloud项目扩大合作案例。我们将在特定领域展现出明确的高性价比竞争力。”

超速芯片LPU震撼登场！成本直降，正面挑战英伟达LLM霸主地位！

相关文章

发布评论取消回复

大龙

民主党对金氏访问表示尊重，但拒绝恢复其名誉

油价三月暴涨60%后或将持续飙升，市场迎来新一轮涨价潮！

密歇根大学69比63力克康涅狄格，问鼎NCAA男篮总冠军！

韩华集团考虑出售韩国锌业股份，全力支持韩华解决方案业务发展

英国会议坚持霍尔木兹海峡自由通行，引发全球关注

超速芯片LPU震撼登场！成本直降，正面挑战英伟达LLM霸主地位！

相关文章

发布评论 取消回复

大龙

发布评论取消回复