边缘AI驱动微型模型在智能设备上运行
仿生大脑模型让推理能力走向边缘计算
大型语言模型功能强大,但通常需要巨大的计算资源,这意味着它们一般必须在数据中心的高端GPU集群上运行。如今,初创公司Multiverse Computing开发出了据称可与鸡脑和果蝇大脑相媲美的模型,使该公司能够将强大的大型语言模型压缩到可以在家用电器、智能手机或汽车上运行的程度。
总部位于西班牙多诺斯蒂亚的Multiverse公司正在人工智能和量子计算这两个最热门的技术领域交汇处开展工作。该公司的旗舰产品是名为Singularity的软件平台,旨在让非专业人士能够使用量子算法,同时还开发了名为CompactifAI的压缩技术来缩小神经网络。
创新的压缩技术
该软件依赖于张量网络——这是最初为在经典硬件上模拟量子系统而开发的数学工具。但它们将复杂多维系统提炼成更紧凑、更易于处理形式的能力,也使其成为压缩大型AI模型的有前途途径。
Multiverse现在使用CompactifAI创建了一个新的”纳米模型”系列,称为Model Zoo,每个模型都以理论上具有相当处理能力的动物大脑命名。
首批发布的两个模型是:
- ChickenBrain(鸡脑):Meta Llama 3.1模型的压缩版本,可以为树莓派带来推理能力
- SuperFly(超级果蝇):开源模型SmolLM2 135M的压缩版本,小到可以在智能手机上运行
超小型模型的巨大潜力
“SuperFly是一个9400万参数的模型,非常微型。它绝对是目前最小的大型语言模型之一,”Multiverse首席技术官Sam Mugel说道。”任何昂贵到值得放置树莓派的设备都能够运行像SuperFly这样的大型语言模型。”这意味着像洗衣机或冰箱这样的昂贵电器现在可以拥有原本无法集成的AI功能。
该公司表示,这可以为广泛的家电带来AI功能,特别是使用自然语言控制设备的能力。Mugel说,能够在本地而非通过云端运行大型语言模型有许多好处,包括显著降低延迟,以及由于数据在设备上处理而减少安全和隐私风险。
在互联网连接可能不稳定的应用中,它们可能特别有用。SuperFly足够小,可以直接嵌入汽车仪表板中,这样即使在隧道中行驶或网络覆盖较差的地区,也能实现不间断的自然语言控制。
独特的压缩方法
如今,由于人们对最大模型的能源和硬件占用日益关注,压缩模型已成为标准做法。神经网络是出奇低效的学习者,包含大量冗余信息,这为优化留下了很大空间。
这通常通过量化(使用更少位数来表示模型权重)或修剪神经网络中对性能贡献不大的连接等技术来完成。但Mugel表示,Multiverse的量子启发张量网络方法可以超越这些更传统的方法,还可以与量化结合使用来进一步推进压缩。
压缩过程包括三个步骤:
- 扫描分析:识别最适合压缩的模型层
- 重组优化:将这些层重组为张量网络,保留层权重中最重要的模式,同时丢弃对整体性能贡献不大的冗余信息
- 恢复训练:压缩后的模型经过”愈合”步骤,在特定任务上进行简短的重新训练
令人印象深刻的性能表现
通过这个过程创建的SuperFly模型比压缩前的模型小约30%。仅有9400万参数,其大小相当于两个果蝇的大脑,据Mugel说,果蝇大脑大约有5000万个神经连接。当研究人员将其安装在iPhone 14 Pro上时,它只占用了191MB的磁盘空间,并能以每秒115个令牌的可观速度处理信息。
ChickenBrain要大得多,有32亿参数,Mugel承认这与其他较小的语言模型大小相似。但这比压缩前的80亿参数Llama模型减少了60%。尽管体积显著缩小,团队还能够为模型添加推理技能,不过Multiverse拒绝解释如何实现这些新功能。
这意味着ChickenBrain在类似硬件上运行时,在一系列基准测试中实际上超越了被压缩的原始模型,包括专注语言的MMLU-Pro、专注数学的Math-500和GSM8K,以及专注常识的GPQA-Diamond。
未来展望与挑战
复旦大学人工智能创新与孵化研究院教授徐增林表示,张量网络是一种有前途的压缩工具,通常比试图简化神经网络层的类似技术提供更好的结果。然而,以这种方式压缩的模型如何处理更复杂的推理任务仍不清楚。
“特别是对于推理链较长的问题,性能可能不如其他技术最优,”徐增林补充道。
尽管到目前为止取得了压缩成就,Mugel承认在当今的前沿模型能够压缩到边缘设备上之前还有很长的路要走。但他表示,改进Multiverse压缩技术还有很大空间,同时更高效的架构正在为越来越小的模型带来尖端功能。
“我们还能从30亿参数中压榨出多少?这真的很难说,但我确实相信我们将在不久的将来看到更好的性能表现。”
这项技术的发展标志着AI向边缘计算设备普及迈出了重要一步,为智能家居、车载系统和移动设备带来了新的可能性。随着压缩技术的不断改进,我们有望看到更多功能强大而体积小巧的AI模型出现在日常生活的各个角落。找有价值的信息,请记住Byteclicks.com