Tether推边缘AI新框架，手机可跑130亿参数模型

38币圈• 区块链• 2026-03-18 10:10:53•

摘要：

Tether发布集成BitNet LoRA的QVAC Fabric技术，实现消费级设备上数十亿参数模型的本地微调与推理。在Pixel 9、Galaxy S25及iPhone 16等旗舰机型上完成最高130亿参数模型训练，显著提升边缘计算能力，标志着其从稳定币发行商向数字基础设施提供商的战略转型。

Tether发布跨平台边缘AI框架，推动手机端大模型本地化运行

Tether公司正式推出集成BitNet LoRA技术的QVAC Fabric系统，首次实现在消费级显卡与高端移动设备上对数十亿参数规模的语言模型进行微调与推理，将关键人工智能任务从云端迁移至终端设备，开启边缘智能新阶段。

该框架已适配AMD与Intel GPU、苹果Metal架构以及主流移动GPU，据官方披露，在旗舰设备上推理速度相较传统CPU基准提升2至11倍，内存占用降低高达90%。这一优化对于资源受限的移动端和轻薄笔记本尤为关键，使更大规模模型的并发执行成为可能。

测试数据显示，Tether团队已在Pixel 9、Galaxy S25和iPhone 16等最新机型上成功完成最高达38亿参数模型的本地微调，并在iPhone 16上实现130亿参数模型的训练。此举远超当前行业普遍采用的30亿参数以下模型范式，预示着设备端个性化与领域自适应能力的重大飞跃。

此次发布是Tether持续深化基础设施角色的关键一步。此前推出的包含4100亿token的Genesis I数据集与本地AI Workbench已构成基础支撑体系。如今通过开源其QVAC与BitNet LoRA代码库，公司正构建一个开放的开发者生态，旨在打破大型科技企业在AI工具链上的垄断地位。

尽管技术潜力巨大，但核心问题仍待解答：与llama.cpp、MLC或高通自有SDK相比，其实际能耗表现、散热控制能力以及许可条款是否适合企业级部署。即便仅实现宣称效果的一半，该方案也已实质性推进智能手机作为中型语言模型训练平台的可能性，为去中心化数字基础设施注入新动能。

⚠️ 免责声明：本文内容仅为区块链技术资讯与知识分享，不构成任何投资建议。虚拟货币相关活动属国家明令禁止的非法金融活动，请严格遵守法律法规，理性判断，风险自担。