超速芯片LPU震撼登场!成本直降,正面挑战英伟达LLM霸主地位!

2026.04.19 08:20 1 0 品评

HyperAccel首席技术官李镇元上个月11日在首尔瑞草区公司总部与《朝鲜商业》会面时,透露了这一蓝图。即便无法完全取代当前由英伟达GPU主导的AI基础设施架构,公司也立志以专为大语言模型推理设计的“高性价比”专用半导体展开竞争。

李镇元曾是三星电子系统LSI事业部的系统半导体设计工程师,设计过充当智能手机“大脑”的应用处理器。他于2021年曾在AI半导体初创公司Newbla工作,随后于2023年加入新成立的AI半导体初创公司HyperAccel,担任CTO。目前他负责AI半导体架构开发。

HyperAccel是一家本土无晶圆厂初创公司,正在开发专为LLM推理(结果生成)设计的AI半导体“Verda”。该芯片采用三星电子4纳米代工工艺生产,其设计理念与现有GPU从根本上就不同。关键在于其专有架构“LPU(语言处理单元)”,以及采用了比昂贵的高带宽内存更便宜的低功耗DRAM(LPDDR5X)。

李镇元指出当前AI半导体的主要瓶颈在于“内存访问”。他解释说:“速度慢并非因为计算性能不足,而是因为从内存读写数据的过程过于复杂,导致拥堵。GPU需要反复将数据从HBM移至内部SRAM,然后再送到处理单元,这个过程产生了瓶颈。”

HyperAccel彻底重新设计了这一结构。Verda最大限度地减少了中间存储(缓冲区),设计为将数据直接从外部内存发送到处理单元LPU。李镇元表示:“GPU的内存带宽利用率大约在50%左右,而我们的目标是将这一数字提升至90%。”

这种结构变革带来了“成本”创新。对于运营AI服务的企业而言,最大的负担是包含设备价格和电费在内的总拥有成本。李镇元指出:“英伟达H100 GPU每块价格接近7000万至8000万韩元,配置一台服务器常常超过10亿韩元。Verda通过利用LPDDR来同时降低设备成本和功耗,目标是将TCO降至GPU的三分之一水平。”

HyperAccel的目标不止于数据中心。公司也瞄准了在家电、机器人等设备本地处理AI的“端侧AI”市场。目前正与LG电子合作开发家电用AI加速器,该策略旨在利用Verda的高能效架构,这对于在电力受限环境下进行实时处理至关重要。不过,这目前仍处于概念验证阶段,双方正为未来商用产品集成持续合作。

HyperAccel预计在Verda量产后将开始产生营收。公司计划初期以数据中心客户为中心扩大供应,随后扩展至云服务提供商和端侧AI市场。以下是对李镇元的问答实录。

―芯片开发目前处于哪个阶段?

“芯片设计已经完成,预计本月内推出。在实际环境中验证性能和可靠性后,我们的目标是今年下半年量产。”

―LPU与GPU有何不同?

“如果说GPU是样样精通、多才多艺的‘通用加速器’,那么LPU就是将所有火力集中于LLM推理任务的‘专用结构’。芯片架构本身针对Transformer模型的数据流进行了优化。”

―使用LPDDR而非HBM,速度不会变慢吗?

“虽然原始带宽较低,但我们的策略是通过优化数据移动路径来提升‘实际效率’。这使得我们能够在相同预算下服务更多的并发用户。”

―与三星电子代工厂、设计公司等国内半导体生态系统是如何合作的?

“我认为AI半导体不仅仅是设计,更是一种涵盖代工、设计、封装和服务器在内的‘综合艺术’。在此次Verda开发过程中,我们与三星电子代工厂合作,并与设计公司共同进行设计工作。我认为,国内此类经验的积累,从长远来看能够为系统半导体生态系统创造良性循环。”

―主要客户是哪些?

“数据中心运营商是核心。我们已经与Naver Cloud进行了概念验证,并计划结合K-Cloud项目扩大合作案例。我们将在特定领域展现出明确的高性价比竞争力。”

版权声明

本文由 大龙嗨森网 原创发布,未经许可,不得转载。

本文链接: https://sx.haiose.cn/ffes/3913/

相关文章

土耳其籍第三艘货轮成功穿越霍尔木兹海峡,部长证实安全通行
大麻委员会或将迎来重大变革,你的持有量有望翻倍!
特朗普与马克龙“兄弟情”因伊朗争端破裂
马刺季后赛形势解析:2026赛季晋级之路与赛程全揭秘
Circle首席执行官Allaire将赴首尔与KB金融集团会晤
特朗普最后通牒逼近,伊朗若封锁霍尔木兹海峡将遭“地狱”报复

发布评论