--- title: "Skymizer Taiwan Inc.发布突破性架构,使超大型 LLM 推理能够在单张卡上实现" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/283817787.md" description: "Skymizer Taiwan Inc. 推出了 HTX301 推理芯片,使得在单个 PCIe 卡上进行超大规模 LLM 推理成为可能,能够运行 700B 参数模型而无需 GPU 集群。这一创新简化了 AI 基础设施,提供低延迟、数据隐私和操作控制。HyperThought 平台允许灵活扩展,并与现有的 GPU 设置互补,提升整体效率。HTX301 旨在支持各种企业应用,包括金融、医疗保健和软件工程,同时通过支持本地 AI 工作流程确保数据安全" datetime: "2026-04-23T11:00:00.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/283817787.md) - [en](https://longbridge.com/en/news/283817787.md) - [zh-HK](https://longbridge.com/zh-HK/news/283817787.md) --- # Skymizer Taiwan Inc.发布突破性架构,使超大型 LLM 推理能够在单张卡上实现 _提供行业领先的性能效率,并在单个 PCIe 卡上支持 700B 参数模型——无需 GPU 集群或强力冷却_ , /PRNewswire/ -- 在 2026 年 COMPUTEX 展会前夕,Skymizer 台湾公司,作为 AI 推理解决方案的先驱,今天预览了一项在本地 AI 部署方面的重大进展,推出了其 **HTX301 推理芯片**,该芯片集成了 **HyperThought™**——一个在 2025 年 COMPUTEX 首次推出的软件/硬件协同设计平台。HTX301 是 HyperThought IP 的第一个参考芯片,定义了 AI 推理的长期架构。这个首个硅片提供了卓越的性能效率,同时显著简化了超大模型推理所需的基础设施。 **打破超大模型推理的 GPU 垄断** 在本地部署超大模型历史上,通常需要庞大的 GPU 集群、高速互连(如 NVLink/NVSwitch)和强力冷却系统——这导致了高昂的成本和操作复杂性。 **_Skymizer 首次在行业内实现了这一目标。_** 通过一张 PCIe 卡——由 **六个 HTX301 芯片和 384 GB 内存** 提供支持——企业现在可以在本地以约 240W 的功耗运行 **700B 参数模型推理**。 HyperThought 旨在 **在不同形态之间灵活扩展**——以 **SoC 或卡片** 的形式,从 **边缘到迷你数据中心**。从 **单个芯片扩展到单卡上的 6 个芯片**,内存容量范围从 **32GB 到 384 GB**,HyperThought 支持从 **4B 到 700B 参数** 的模型——让企业能够根据实际工作负载需求合理配置部署,而无需过度配置。 _"推理已成为主导的 AI 工作负载,基础设施需要反映这一现实。"_ _"需要超标量 GPU 集群来处理超大 LLM 的时代已经结束。HyperThought 将 AI 从仅限于超大规模的复杂性转变为每个企业都能实现的单卡简单性。"_ **— William Wei, Skymizer 首席营销官** **消除企业 AI 的隐性税负** 结果:企业获得数据隐私、低延迟和完全的操作控制——无需 GPU 集群的基础设施负担。 本地推理还消除了每个令牌支出的焦虑,这已成为企业 AI 采用的隐性税负。基于云的推理迫使团队限制查询和调节代理。HyperThought 消除了这一限制:一旦部署,企业可以以固定的基础设施成本进行无限推理。 HyperThought 补充现有的 GPU 基础设施,而不是取而代之。通过将解码密集型推理从 GPU 中卸载,企业提高了整体集群的利用率和能效。 **推动企业中的代理 AI 工作流** HyperThought 和 HTX301 旨在满足迅速成为企业自动化支柱的代理 AI 工作负载。结合 **OpenClaw** 等代理框架——HTX301 提供了这些系统所需的推理吞吐量,确保数据主权和确定性延迟。 这使得各行业和领域的代理工作流和自动化成为可能,包括: **金融服务**(合规、欺诈检测、投资组合推理);**医疗保健与生命科学**(临床决策支持、药物相互作用分析);**制造业**(预测性维护、质量检查);**法律与专业服务**(合同审查、机密知识检索);**政府与国防**(主权 AI、机密分析);**零售**(服务自动化、库存推理);**软件工程**(私有代码助手、自动化 CI/CD);以及 **半导体与 IC 设计**(本地 RTL 助手、验证代理、基于专有 IP 的设计知识检索)。 **聚焦:本地 AI 编码。** AI 辅助编码已经成为现代软件团队的基本要求,需求在源代码是公司瑰宝的领域中加速增长。IC 设计公司无法将专有 RTL 发送到基于云的助手,而不冒着暴露数十亿美元硅 IP 的风险;软件公司在处理机密代码库和客户数据时面临同样的考量。HTX301 提供了所需的吞吐量,以完全在本地运行私有代码助手、RTL 生成器和验证代理——消除云暴露风险,同时保留 AI 辅助工程的全部生产力提升。 除了代理工作负载,单个 HTX301 芯片还支持设备上的推理——转录、翻译、视觉理解和多模态 AI——适用于边缘服务器、AI 工作站、智能 NAS 系统和智能终端。 **由 LISA™ 和 HyperThought™ 提供支持** HyperThought 由 **LISA™(语言指令集架构)** 提供支持,这是 Skymizer 的专有语言中心 ISA,针对变换器推理进行了优化。LISA 驱动从边缘设备到企业集群的性能、能效和可扩展性。 本地 HTX301 卡与 HyperThought 的设备 LPU 共享相同的 LISA 架构基础——一个 ISA,一个部署工作流,从边缘到数据中心。 **预填/解码分离:HyperThought P/D 策略** LLM 推理由两个根本不同的阶段组成:**预填**(处理输入提示,计算密集型)和 **解码**(逐个生成令牌,内存带宽密集型)。以 GPU 为中心的基础设施将两者强行结合在同一硅片上,导致在任何给定时刻计算或带宽的浪费。HyperThought 通过设计将这些阶段分离。 **硬件堆栈——解码优先的硅片。** HTX301 专为解码而设计——内存带宽密集型的令牌生成主导了现实世界的推理延迟。现有的 GPU 处理计算密集型的预填;HTX301 卡处理解码。每个硅片与其阶段相匹配。 **软件栈 — 统一的 P/D 协调。** Skymizer 的统一软件栈 — KV 缓存管理器、阶段感知调度器和动态放置引擎 — 协调预填充和解码池,在节点之间传递 KV 缓存状态,并在工作负载变化时实时重新平衡 P:D 比率。 _"专为解码而设计的硬件与智能软件栈相结合,协调每个推理工作负载 — 这就是如何在规模上解耦 P/D。"_ **— Luba Tang,Skymizer 首席技术官** **定义 AI 部署的下一个时代** 随着模型参数从数十亿激增至数万亿,行业对粗暴 GPU 扩展的依赖正面临瓶颈。Skymizer 的构建旨在超越这一点 — 结合深厚的编译器专业知识与解码优化的硅片,定义 AI 基础设施的下一个时代。 _关于 HyperThought 扩展平台路线图的详细信息将在 Skymizer 于 COMPUTEX 2026 的新闻发布会上分享。_ **请求提前访问 HTX301: skymizer.ai/press** **关于 Skymizer 台湾有限公司** Skymizer 成立于 2013 年,是一家 AI 推理公司。其旗舰产品 HyperThought 平台将编译驱动的软件栈与优化的变压器硬件相结合,以在设备、边缘和本地环境中提供高效的推理。 查看原始内容:https://www.prnewswire.com/news-releases/skymizer-taiwan-inc-unveils-breakthrough-architecture-enabling-ultra-large-llm-inference-on-a-single-card-302751485.html 来源 Skymizer 台湾有限公司 ### 相关股票 - [SMH.US](https://longbridge.com/zh-CN/quote/SMH.US.md) - [TWN.US](https://longbridge.com/zh-CN/quote/TWN.US.md) - [XSD.US](https://longbridge.com/zh-CN/quote/XSD.US.md) - [PSI.US](https://longbridge.com/zh-CN/quote/PSI.US.md) - [FTXL.US](https://longbridge.com/zh-CN/quote/FTXL.US.md) - [IXN.US](https://longbridge.com/zh-CN/quote/IXN.US.md) - [SOXL.US](https://longbridge.com/zh-CN/quote/SOXL.US.md) - [SOXX.US](https://longbridge.com/zh-CN/quote/SOXX.US.md) - [EWT.US](https://longbridge.com/zh-CN/quote/EWT.US.md) ## 相关资讯与研究 - [拆掉 Token 暴利墙,云厂商下场造芯 | 企服国际观察](https://longbridge.com/zh-CN/news/286999372.md) - [字节凭什么又牛了?](https://longbridge.com/zh-CN/news/287045541.md) - [Claude Code 产品负责人:AI 时代最稀缺的人什么样?](https://longbridge.com/zh-CN/news/287042434.md) - [智能体重塑 AI 算力新秩序 CPU 或成英伟达下一个增长引擎](https://longbridge.com/zh-CN/news/287152761.md) - [00 后清华博士,5 个月融了 5 个亿](https://longbridge.com/zh-CN/news/287203679.md)