当前位置:首页>焦点 > >正文

天天滚动:大模型需求暴增,NPU有望在端边落地部署

  • 2023-06-06 11:29:39来源:互联网

ChatGPT的火爆,让人们意识到AI其实有着更高的上限,也让业界更多关注到其背后的Transformer大模型。除了云端、除了自然语言处理,业界正在思考:是否可以让Transformer在端侧、边缘侧高效部署?是否可以让Transformer在计算机视觉领域发挥出更大潜能?

可能吗?爱芯元智已经开始了这一尝试。


(资料图)

Transformer何方神圣?

GPT大模型,全称Generative Pre-training Transformer,是一种使用自回归模型进行语言建模的预训练模型。当下大火的ChatGPT,以及一系列AI模型,其实都离不开Transformer,它是当前各种大模型所采用的主要结构。

要理解这个模型,可以先追溯一下历史。业界很早就在探索一件事——如果计算机能够像人类一样理解语言该有多好,出于这个目的,业界开始了对自然语言处理/NLP的研究。

Transformer模型是谷歌在2017年推出的,可以说,这是深度算法领域的关键一跃,奠定了当下通用人工智能的基础。这个模型可以同时处理输入序列中所有位置的信息,避免了传统的逐个处理输入序列的方式,从而可以更加高效地进行文本处理。

接下来,综合了各种技术和语言模型之后,Transformer模型越来越强大,并在此基础上诞生了BERT、GPT等,这些语言模型应用在自然语言生成、机器翻译、问答系统等,为人工智能领域的发展带来了新的活力。

为什么要在端侧、边缘侧落地大模型?

爱芯元智联合创始人、副总裁刘建伟认为,大模型正在使行业进入开发新范式的拐点,它也将带来一些新机会。首先从需求角度来看,业界对端侧和边缘侧AI加速是有强需求的。只不过一直以来,AI落地标准化场景效果较好,而在一些通用场景中,除非增加针对性的投入,才能进一步提升应用效果,但这同时意味着更高的成本,成为AI加速应用落地的主要困难。

其次,从大模型能够带来的改变来看,它能够降低边际场景的AI成本,因为它不需要对长尾场景做专门的、从头到尾的适配,通过部署预训练的大模型就能达到比较好的效果,这将使AI在端侧和边缘侧的应用再上一个台阶。

如何在端侧、边缘侧高效部署Transformer?

相比于在云端用GPU部署Transformer大模型,在边缘侧、端侧部署Transformer最大的挑战首先来自功耗,什么平台能够“接得住”它?这是核心考量。

当前,业界通过跑SwinT模型来看平台对Transformer的支持情况。爱芯元智今年3月推出的第三代高算力、高能效比SoC芯片——AX650N,在运行SwinT时表现出色:361 FPS的高性能、80.45%的高精度、199 FPS/W的低功耗以及原版模型且PTQ量化的易部署能力,这些特性使其成为端侧和边缘侧部署Transformer的首选平台。

具体来看,361帧的高性能可媲美汽车自动驾驶领域基于GPU的高端域控SoC;80.45%的高精度成绩同样高于市面平均水平;199 FPS/W的速度体现出低功耗的特点,对比于目前基于GPU的高端域控SoC,有数倍优势。此外,AX650N部署方便,GitHub上的原版模型可以在爱芯元智平台上高效运行,不需要对模型做修改,不需要QAT重新训练。

并且,AX650N支持低比特混合精度,用户如果采用INT4,可以极大减少内存和带宽占用率,可以有效控制端侧边缘侧部署的成本。这些特性都保证了AX650N最终落地效果更好用、更易用,大幅提升了用户的效率。

据介绍,AX650N已适配包括ViT/DeiT、Swin/SwinV2、DETR在内的Transformer模型,在DINOv2也达到30帧以上运行结果,这也使得用户在下游进行检测、分类、分割等操作更加方便。基于AX650N的产品也已经在智慧城市、智慧教育、智能制造等计算机视觉领域发挥出重要作用。

Transformer在视觉领域的潜力?

谈及Transformer在视觉领域的潜力,刘建伟表示,视觉应用凡是对环境有感知、理解需求的,比如智慧城市、智能机器人、自动驾驶等领域需要用摄像头去看画面的,对Transformer都有比较强的需求。

不过,视觉应用场景非常碎片化,这也是以往CNN网络遇到的一个普遍问题,这对Transformer来说是否能发挥所长?

爱芯元智认为,Transformer模型具有一定的画面语意理解能力,无论是什么场景,它已经具备了基本的理解。在以往的应用中,常见的问题是:这个场景没见过,或是这个场景下的数据没有标注过,因此就无法落地了。而Transformer让大家看到了解决这个问题的希望。

以河道垃圾监测为例:当河道上出现了一种垃圾,传统流程是采集数据—标注—训练,如果突然出现一种新的垃圾,是之前数据标注/训练没有覆盖的,系统就无法识别,就必须重新采集。但有了采用无监督训练的大模型之后,无论出现什么样新类型的垃圾,系统都能自主推理和判断。

事实上,Transformer在视觉领域的尝试其实一直都有,比如SwinT就是把Transformer用在视觉领域的一个模型。它和传统CNN训练方法一样,只是上限更高,并且随着NLP领域突飞猛进的发展,新的趋势包括通过无监督、自监督的训练方式。

接下来,爱芯元智AX650N将会针对Transformer结构进行持续优化,并且探索更多的Transformer大模型,例如多模态大模型,不断让Transformer在爱芯元智平台上得到更好的落地效果。值得一提的是,爱芯元智还将推出开发板,满足开发者对Transformer深度研究的需求,探索更丰富的产品应用。

NPU在端侧、边缘侧部署大模型的挑战是什么?

爱芯元智认为,基于NPU在端侧、边缘侧部署Transformer大模型,其挑战可以从软硬件两方面来看。从硬件架构角度来讲,NPU、TPU等都属于特定领域相关的架构,需要早期定位就比较准,后续才能进行更有针对性的功能优化。

软件方面,相对于CNN,Transformer是一个比较新的网络,推理时一般要求做量化,这往往要求一定的工程经验。爱芯元智在这方面探索较早,例如SwinT量化精度、浮点精度在1%以内的误差,都属于业内领先。

“从目前的反馈来看,客户的体验是觉得我们的平台比较好用、易用,好用是指性能较高,能够实时跑更多的应用、对场景的适应性比较强;易用是上手速度比较快,想跑的应用基本上都能跑起来,量产周期也能缩短”,爱芯元智相关负责人表示。

“爱芯元智将继续努力打造基于芯片+软件的端侧、边缘侧人工智能算力平台,加速基于Transformer的大模型在端侧、边缘侧落地的节奏,最终实现普惠AI造就美好生活的企业愿景”,爱芯元智创始人、CEO仇肖莘女士如是说。

标签:

延伸阅读

推荐阅读

天天滚动:大模型需求暴增,NPU有望在端边落地部署

ChatGPT的火爆,让人们意识到AI其实有着更高的上限,也让业界更多关注

【天天热闻】古唐飞天 南阳红茶

古唐飞天南阳红茶古唐苍苍,翠芽凝芳;秀水泱泱,佳茗飘香。在南阳,谈

人造电子皮肤破损后可自行修复 世界最新

据发表在最新一期《科学》杂志上的论文报道,美国斯坦福大学研究人员首

V观财报|捷安高科总经理高志生收警示函:超额减持4.47万股_全球热消息

捷安高科5日盘后公告,公司董事、高级管理人员高志生于近日收到河南证

天天快资讯:福特e450房车价格(e450怎么样)

来为大家解答以上问题,福特e450房车价格,e450怎么样很多人还不知道,

(国际·图文互动)中国戚继光舰抵达文莱进行友好访问

执行远海远域实习访问任务的中国海军戚继光舰5日上午抵达文莱摩拉港,

今日聚焦!6月5日基金净值:嘉实稳固收益债券A最新净值1.119,涨0.09%

6月5日,嘉实稳固收益债券A最新单位净值为1 119元,累计净值为1 285元

聚焦:气门室盖垫渗油有必要修吗_气门室盖垫

1、汽车上的气门室盖垫子漏油90%以上是因为油封腐蚀老化导致的。2、漏

喜讯|光雾山荣获四川“最受消费者喜爱的5A景区”荣誉称号 每日消息

6月2日,由四川省旅游协会、四川省旅游景区管理协会主办的“四川省十佳

天天观天下!安庆市德久精密技术有限公司

1、安庆市德久精密技术有限公司于2019年10月24日成立。2、法定代表人魏

屁是什么气体?(精选3条)

一、屁是什么气体?①答:屁的主要成分是氮气、氢气、二氧化碳、甲烷、

全球快看:ai渐变色制作 ai渐变色

1、AI里设置渐变色的步骤如下:在AI的操作页面上选取椭圆工具,在页面

含羞草可以养多久 视焦点讯

我是东方时讯的客服小方,我来为大家解答以上问题。含羞草可以养多久的

iPhone 15系列将于本月在郑州富士康量产:备货量巨大_环球微动态

快科技6月5日讯,转眼已是6月份,按计划,明天凌晨1点,iOS17将正式登

国家残疾运动员_杨琴 中国残疾人运动员|全球讯息

杨琴。中国残疾人运动员。本文到此结束,希望对大家有所帮助。

焦点资讯:陕西农信咸阳农合机构开展“坚守主责主业依法合规经营”警示教育系列活动

陕西农信咸阳农合机构通过正面引导坚定初心,反面警示警钟长鸣,开展了

李立群康复出院!戴呼吸机差点立遗嘱,儿女无一人回来_世界聚焦

近日,知名影星李立群因首阳肺部感染住院,经过5天治疗后终于康复出院

每日热讯!千岛湖欢乐水世界回应游客溺亡:事故发生原因正在调查中

6月5日,千岛湖欢乐水世界发布说明,回应游客溺亡事件。内容如下:2023

当前热讯:云顶之弈S9赛恩羁绊技能介绍

可能有许多云顶之弈小伙伴还不清楚云顶之弈S9赛恩羁绊技能介绍,接下来

天天精选!提前谋划,外高桥边检站为“爱达·魔都”号出境(港)制定“一船一策”预案

提前谋划,外高桥边检站为“爱达·魔都”号出境(港)制定“一船一策”

蚬子怎么做才能好吃_蚬子怎么读

1、蚬蚬xiǎn小蛤的一类[clam]。2、软体动物,介壳圆形或心脏形,表面有

到底怎么了?变异了?张一山眼球怎么了

【到底怎么了?变异了?张一山眼球怎么了】今日,张一山在其个人社交平

香港高院将大发地产的清盘呈请聆讯押后至7月24日进行

原呈请人中国通海证券与大发地产达成协议,撤回其清盘呈请;另一名债权

环球观察:我市举行2023年“安全生产月”咨询日暨“关注消防 生命至上”系列活动启动仪式

今年6月是第22个全国“安全生产月”,主题是“人人讲安全、个个会应急

环球热门:台湾爷孙恋后续:林靖恩家中大闹“惊动警察”,李坤城儿曝光现场录音

资深音乐人李坤城与小40岁林靖恩的“爷孙恋”曾轰动一时,上月男方不幸

2023年云南省养老金调整方案计算公式最新消息 2022~2023年云南省养老金调整具体细则新消息(全文)

根据人社部最新消息:全国调整比例按照2022年退休人员月人均基本养老金

可爱的小金鱼五年级作文600字

乐乐学教研网精心为你收集整理了可爱的小金鱼五年级作文600字(精选26

不锈钢锅可以炖大骨头吗?-当前讯息

可以的,大骨头跟不锈钢汤锅是没冲突的,可以用不锈钢汤锅熬汤的,熬完以

财通证券:城市表现持续分化,民企拿地有所恢复

财通证券:城市表现持续分化,民企拿地有所恢复,财通证券,一线城市,三

猜您喜欢

Copyright ©  2015-2022 北方服装网版权所有  备案号:京ICP备2021034106号-50   联系邮箱: 55 16 53 8@qq.com