Hi!请登陆

Imagination推具有500TOPS性能神经驾驶辅助新平台

2020-11-13 42 11/13

英国芯片设计公司 Imagination Technologies,刚刚推出了面向高级辅助驾驶(ADAS)市场、名为 IMG Series4 NNA 的神经网络新平台。 在今日的公告中,该公司称:随着电动汽车的出现,已经蜂窝移动车联网(C-V2X)连接平台的兴起,汽车行业正在更加积极地拥抱新平台。

据悉,Imagination 的 IMG Series4 NNA 平台建立在三大基础上。公司宣称这不仅使之能够大规模扩展性能,还可减少延迟和带宽功耗管理等工作负载。

性能方面,Imagination 预计 Series4 神经加速器核心可达成介于每秒 12.5 ~ 500 万亿次的运算(TOPS)。

此外通过高带宽互连方案将单个 Series4 与其它内核彼此相连,Imagination 还能够组建最高 8 路的系统集群。

集群中的内核不仅支持互连,也可通过系统总线来分隔出一组四个内核,辅以 DDR DRAM 和内核上的缓存(OCM)。

Imagination 还承诺 Series4 平台可提供高达 30 TOPS / Watt 的能效,以及 12 TOPS / mm的性能/单位面积。

更重要的是,这些芯片将基于最新的 5nm 工艺节点制造(比如台积电或 三星 等巨头代工)。

其次,张量平铺设计使得 Series4 NNA 平台能够进一步减少延迟。多核 / 多集群设计允许核心同时执行多项工作负载,或专注于单个工作负载。

若所有内核都被调配用于单一任务,则系统等待时间(处理器接收输入至生成输出的时间间隔),会在一定程度上减少已分配给该任务的内核数量。

如此一来,预计执行单一任务的单个内核,与执行相同任务的八核集群之间的延迟差异,会被拉大至 8 倍左右。

此外内存管理也是 Series4 NNA 平台上一个不可或缺的功能,Imagination 将之称作 Tensor Tiling(等待专利审批中),可节省高达 90% 的带宽开销。

因其允许将神经网络数据隔离为一个子集的子集,层数越多,神经网络的构建也就更复杂。

接着通过张量平铺来批处理划分子集,并经由 NNA 核心进行处理,以减少等待延迟和整体事务处理过程中对外部存储器的依赖。

最后,Imagination 揭示了在添加更多内核情况下,Series4 平台的性能指标也可大致维持线性增长。

数据表明,对于某些类型的工作负载(34 层 @ 2400&times1200 的残量网络),其性能亦可完美地线性缩放。

当层数增加到 50,且输入图像分辨率降低至 224&times224 时,线性缩放可近似至六个核心,之后这一梯度曲线才会开始向下弯曲。

此外 Series4 也符合 ISO2626 标准,能够为汽车制造商达成更高的自动辅助驾驶水平而提供助力,以及为开发者提供处理各项应用时的张量平铺优势。

【来源:cnBeta.COM】

相关推荐