好望角:让你的每次点击都有价值:byteclicks.com | 搜索引擎正在被AI污染信息源,中文优质信息越来越少了 |

新一代AI芯片设计灵感来自人脑,引领未来技术趋势

人工智能是一个依赖大量计算能力的“能量吸血鬼”。实时运行行为监控、面部识别和对象跟踪等AI应用,需要一个更快、更准确的推理计算系统。为此,大型AI模型必须与数据源密切合作。

这类在计算机和内存之间移动大量数据的问题,可以追溯到最早的电子数字计算机EDVAC。由于系统的计算和内存基于不同技术,必须单独操作以满足需求。

为了解决这个问题,研究人员开发了一种交叉芯片架构创新,它结合了人脑启发的计算理念及半导体技术。新一代AI芯片将计算与单片机内存集成,有效处理数据并大幅减少能耗。这使AI模型能与数据源更紧密合作,实现更快更高效的计算。

这种新的架构在处理大数据和复杂计算任务时,既可以节约能源,也可以提高效率。

此外,这种架构也可以应对日益增长的数据量。在当前社会中,无论是社交媒体,环境监控,还是医疗诊断,或者是其他任何应用领域,数据量都以指数级别增长。要想对这些大规模的数据进行处理,便消耗大量的计算资源和能量。

IBM发布名为NorthPole的新AI芯片,设计灵感来自人脑

该芯片模仿了人脑的白质连接,这些连接,连接了大脑皮层的不同部分。

IBM表示,NorthPole 比市场上任何其他芯片更节能、更节省空间,并且延迟更低,其速度比其前身 TrueNorth 快约 4000 倍。

以 ResNet-50 模型为基准,NorthPole 的能效比领先的 12 纳米 GPU 和 14 纳米 CPU 高出 25 倍,延迟也低得多。

NorthPole 芯片是由 IBM 在加利福尼亚州的圣何塞研究所开发的,该架构在能效、速度和可扩展性方面具有重大突破。NorthPole芯片紧密集成了处理单元和内存,从而极大地提高了数据的移动效率。

工作原理和特点

1、内存和计算集成:NorthPole 芯片将内存和处理能力结合在一起,从而大大提高了图像识别和其他计算任务的性能。

2、能效高:该芯片在执行任务时,几乎不需要频繁访问外部内存,因此能效极高。

3、解决冯·诺依曼瓶颈:传统的计算架构需要在计算单元和外部内存之间传输数据,这一过程被称为冯·诺依曼瓶颈,会减慢计算速度并增加能耗。NorthPole 芯片通过在每个核心中集成内存来缓解这一问题。

4、神经网络运行:该芯片运行多层的神经网络,用于识别数据中的模式。

5、高度可扩展和节能:如果使用最新的制造工艺,其效率将比当前设计高出25倍。

应用与局限:

然而,NorthPole 的优势(其板载内存)也是其局限性。如果芯片必须从其他地方获取数据,其效率就会受到影响。为了解决这个问题,NorthPole 采用了“横向扩展”方法,通过将更大的神经网络分割成更小的、可管理的子网络来管理它们。

因此其不足以运行大型语言模型(例如 ChatGPT)。

但是NorthPole 的可能应用集中在人工智能推理上,特别是实时传感处理。

在试验阶段,由于部分资金来自美国国防部,该芯片主要用于计算机视觉任务。这可能包括对象识别、追踪和场景解析等,这些都是军事和安全应用中常见的需求。

然而,NorthPole的多功能性也延伸到自然语言处理和语音识别等领域。这意味着它不仅可以用于图像和视频分析,还可以用于理解和解析人类语言,这在聊天机器人、语音助手或自动翻译服务中可能非常有用。

自主系统、机器人学、监视以及其他需要即时分析高带宽数据的边缘用例(edge use cases)都是理想的应用场景。在这些场景中,快速和准确的数据分析是至关重要的。例如,NorthPole芯片可以使自动驾驶汽车更好地处理复杂的现实世界场景,如交通拥堵、行人穿越等。

总体而言,NorthPole芯片在设计上具有高度的灵活性和速度,使其适用于多种需要实时数据处理和分析的应用场景。这种多功能性和速度优势使其在各种实时应用中具有巨大的潜力。

上一篇:

下一篇:


标签