---
title: "Skymizer Taiwan Inc.发布突破性架构，使超大型 LLM 推理能够在单张卡上实现"
type: "News"
locale: "zh-CN"
url: "https://longbridge.com/zh-CN/news/283817787.md"
description: "Skymizer Taiwan Inc. 推出了 HTX301 推理芯片，使得在单个 PCIe 卡上进行超大规模 LLM 推理成为可能，能够运行 700B 参数模型而无需 GPU 集群。这一创新简化了 AI 基础设施，提供低延迟、数据隐私和操作控制。HyperThought 平台允许灵活扩展，并与现有的 GPU 设置互补，提升整体效率。HTX301 旨在支持各种企业应用，包括金融、医疗保健和软件工程，同时通过支持本地 AI 工作流程确保数据安全"
datetime: "2026-04-23T11:00:00.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/283817787.md)
  - [en](https://longbridge.com/en/news/283817787.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/283817787.md)
---

# Skymizer Taiwan Inc.发布突破性架构，使超大型 LLM 推理能够在单张卡上实现

_提供行业领先的性能效率，并在单个 PCIe 卡上支持 700B 参数模型——无需 GPU 集群或强力冷却_

, /PRNewswire/ -- 在 2026 年 COMPUTEX 展会前夕，Skymizer 台湾公司，作为 AI 推理解决方案的先驱，今天预览了一项在本地 AI 部署方面的重大进展，推出了其 **HTX301 推理芯片**，该芯片集成了 **HyperThought™**——一个在 2025 年 COMPUTEX 首次推出的软件/硬件协同设计平台。HTX301 是 HyperThought IP 的第一个参考芯片，定义了 AI 推理的长期架构。这个首个硅片提供了卓越的性能效率，同时显著简化了超大模型推理所需的基础设施。

**打破超大模型推理的 GPU 垄断**

在本地部署超大模型历史上，通常需要庞大的 GPU 集群、高速互连（如 NVLink/NVSwitch）和强力冷却系统——这导致了高昂的成本和操作复杂性。

**_Skymizer 首次在行业内实现了这一目标。_**

通过一张 PCIe 卡——由 **六个 HTX301 芯片和 384 GB 内存** 提供支持——企业现在可以在本地以约 240W 的功耗运行 **700B 参数模型推理**。

HyperThought 旨在 **在不同形态之间灵活扩展**——以 **SoC 或卡片** 的形式，从 **边缘到迷你数据中心**。从 **单个芯片扩展到单卡上的 6 个芯片**，内存容量范围从 **32GB 到 384 GB**，HyperThought 支持从 **4B 到 700B 参数** 的模型——让企业能够根据实际工作负载需求合理配置部署，而无需过度配置。

_"推理已成为主导的 AI 工作负载，基础设施需要反映这一现实。"_

_"需要超标量 GPU 集群来处理超大 LLM 的时代已经结束。HyperThought 将 AI 从仅限于超大规模的复杂性转变为每个企业都能实现的单卡简单性。"_

**— William Wei, Skymizer 首席营销官**

**消除企业 AI 的隐性税负**

结果：企业获得数据隐私、低延迟和完全的操作控制——无需 GPU 集群的基础设施负担。

本地推理还消除了每个令牌支出的焦虑，这已成为企业 AI 采用的隐性税负。基于云的推理迫使团队限制查询和调节代理。HyperThought 消除了这一限制：一旦部署，企业可以以固定的基础设施成本进行无限推理。

HyperThought 补充现有的 GPU 基础设施，而不是取而代之。通过将解码密集型推理从 GPU 中卸载，企业提高了整体集群的利用率和能效。

**推动企业中的代理 AI 工作流**

HyperThought 和 HTX301 旨在满足迅速成为企业自动化支柱的代理 AI 工作负载。结合 **OpenClaw** 等代理框架——HTX301 提供了这些系统所需的推理吞吐量，确保数据主权和确定性延迟。

这使得各行业和领域的代理工作流和自动化成为可能，包括：

**金融服务**（合规、欺诈检测、投资组合推理）；**医疗保健与生命科学**（临床决策支持、药物相互作用分析）；**制造业**（预测性维护、质量检查）；**法律与专业服务**（合同审查、机密知识检索）；**政府与国防**（主权 AI、机密分析）；**零售**（服务自动化、库存推理）；**软件工程**（私有代码助手、自动化 CI/CD）；以及 **半导体与 IC 设计**（本地 RTL 助手、验证代理、基于专有 IP 的设计知识检索）。

**聚焦：本地 AI 编码。** AI 辅助编码已经成为现代软件团队的基本要求，需求在源代码是公司瑰宝的领域中加速增长。IC 设计公司无法将专有 RTL 发送到基于云的助手，而不冒着暴露数十亿美元硅 IP 的风险；软件公司在处理机密代码库和客户数据时面临同样的考量。HTX301 提供了所需的吞吐量，以完全在本地运行私有代码助手、RTL 生成器和验证代理——消除云暴露风险，同时保留 AI 辅助工程的全部生产力提升。

除了代理工作负载，单个 HTX301 芯片还支持设备上的推理——转录、翻译、视觉理解和多模态 AI——适用于边缘服务器、AI 工作站、智能 NAS 系统和智能终端。

**由 LISA™ 和 HyperThought™ 提供支持**

HyperThought 由 **LISA™（语言指令集架构）** 提供支持，这是 Skymizer 的专有语言中心 ISA，针对变换器推理进行了优化。LISA 驱动从边缘设备到企业集群的性能、能效和可扩展性。

本地 HTX301 卡与 HyperThought 的设备 LPU 共享相同的 LISA 架构基础——一个 ISA，一个部署工作流，从边缘到数据中心。

**预填/解码分离：HyperThought P/D 策略**

LLM 推理由两个根本不同的阶段组成：**预填**（处理输入提示，计算密集型）和 **解码**（逐个生成令牌，内存带宽密集型）。以 GPU 为中心的基础设施将两者强行结合在同一硅片上，导致在任何给定时刻计算或带宽的浪费。HyperThought 通过设计将这些阶段分离。

**硬件堆栈——解码优先的硅片。** HTX301 专为解码而设计——内存带宽密集型的令牌生成主导了现实世界的推理延迟。现有的 GPU 处理计算密集型的预填；HTX301 卡处理解码。每个硅片与其阶段相匹配。

**软件栈 — 统一的 P/D 协调。** Skymizer 的统一软件栈 — KV 缓存管理器、阶段感知调度器和动态放置引擎 — 协调预填充和解码池，在节点之间传递 KV 缓存状态，并在工作负载变化时实时重新平衡 P:D 比率。

_"专为解码而设计的硬件与智能软件栈相结合，协调每个推理工作负载 — 这就是如何在规模上解耦 P/D。"_

**— Luba Tang，Skymizer 首席技术官**

**定义 AI 部署的下一个时代**

随着模型参数从数十亿激增至数万亿，行业对粗暴 GPU 扩展的依赖正面临瓶颈。Skymizer 的构建旨在超越这一点 — 结合深厚的编译器专业知识与解码优化的硅片，定义 AI 基础设施的下一个时代。

_关于 HyperThought 扩展平台路线图的详细信息将在 Skymizer 于 COMPUTEX 2026 的新闻发布会上分享。_

**请求提前访问 HTX301: skymizer.ai/press**

**关于 Skymizer 台湾有限公司**

Skymizer 成立于 2013 年，是一家 AI 推理公司。其旗舰产品 HyperThought 平台将编译驱动的软件栈与优化的变压器硬件相结合，以在设备、边缘和本地环境中提供高效的推理。

查看原始内容：https://www.prnewswire.com/news-releases/skymizer-taiwan-inc-unveils-breakthrough-architecture-enabling-ultra-large-llm-inference-on-a-single-card-302751485.html

来源 Skymizer 台湾有限公司

### 相关股票

- [SMH.US](https://longbridge.com/zh-CN/quote/SMH.US.md)
- [TWN.US](https://longbridge.com/zh-CN/quote/TWN.US.md)
- [XSD.US](https://longbridge.com/zh-CN/quote/XSD.US.md)
- [PSI.US](https://longbridge.com/zh-CN/quote/PSI.US.md)
- [FTXL.US](https://longbridge.com/zh-CN/quote/FTXL.US.md)
- [IXN.US](https://longbridge.com/zh-CN/quote/IXN.US.md)
- [SOXL.US](https://longbridge.com/zh-CN/quote/SOXL.US.md)
- [SOXX.US](https://longbridge.com/zh-CN/quote/SOXX.US.md)
- [EWT.US](https://longbridge.com/zh-CN/quote/EWT.US.md)

## 相关资讯与研究

- [拆掉 Token 暴利墙，云厂商下场造芯 | 企服国际观察](https://longbridge.com/zh-CN/news/286999372.md)
- [字节凭什么又牛了？](https://longbridge.com/zh-CN/news/287045541.md)
- [Claude Code 产品负责人：AI 时代最稀缺的人什么样？](https://longbridge.com/zh-CN/news/287042434.md)
- [平头哥：未来两年将陆续推出算力更强的真武 V900、真武 J900 两代芯片](https://longbridge.com/zh-CN/news/287009122.md)
- [智能体重塑 AI 算力新秩序 CPU 或成英伟达下一个增长引擎](https://longbridge.com/zh-CN/news/287152761.md)