早报网

網站地圖 - 關于我們
您的當前位置: 首頁 > 科技 > 業內 正文

超星未來梁爽:軟硬件協同優化,賦能AI 2.0新時代

作者:網絡 時間:2024-07-22 12:47 點擊:
導讀:近日,第三屆清華大學汽車芯片設計及產業應用研討會暨校友論壇在蕪湖成功舉行。作為本次活動的特邀嘉賓,超星未來聯合創始人、CEO梁爽博士出席并發表主題演講《軟硬件協

近日,第三屆清華大學汽車芯片設計及產業應用研討會暨校友論壇在蕪湖成功舉行。作為本次活動的特邀嘉賓,超星未來聯合創始人、CEO梁爽博士出席并發表主題演講《軟硬件協同優化,賦能AI 2.0新時代》


超星未來梁爽:軟硬件協同優化,賦能AI 2.0新時代(圖1)


大模型是AI 2.0時代的“蒸汽機”

AI+X應用落地及邊緣計算將成為關鍵


自ChatGPT發布以來,大模型引爆“第四次工業革命”,成為AI 2.0時代的“蒸汽機”,驅動著千行百業智能化變革。保爾·芒圖曾說:“蒸汽機并不創造大工業,但是它卻為大工業提供了動力”,大模型也是如此,本身不會直接創造新的產業,而是與已有的行業應用場景及數據結合創造價值。


WAIC 2024落幕后,有媒體評論:大模型再無新玩家,AGI下半場是計算與應用。梁爽認為,AGI下半場將是AI+X應用落地和邊緣計算。AI 1.0時代,服務器側的神經網絡模型,在安防、智能駕駛等應用領域里逐步下沉到邊緣端,這一趨勢也一定會在AI 2.0的時代再演繹一次,并且將在智慧城市、汽車、機器人、消費電子等領域創造出更為廣闊的增量市場。


超星未來梁爽:軟硬件協同優化,賦能AI 2.0新時代(圖2)


回顧AI的演進歷史,可以看到,AI 1.0時代的主要模式是通過單一模型完成單一任務,例如安防、人臉識別、語音識別,以及基于感知-決策-控制分模塊的智能輔助駕駛方案。梁爽認為,現在正進入一個“AI 1.5時代”,在智能駕駛、機器人等復雜系統中,統一用神經網絡完成各個模塊功能的實現,盡量減少人工規則,并通過數據驅動的范式提升性能,大幅降低人工處理各種長尾問題的難度。在AI 2.0時代,系統將由一個統一的通用基礎大模型來應對多源數據輸入,完成多種復雜任務,這一基礎模型應該具備感知萬物、知曉常識和理解推理的能力,智能駕駛、機器人的基礎模型本質上是同一類基礎模型。


端到端與大模型上車進行時

智能汽車是邁向通用機器人的必要階段


近年來,智駕系統正在從傳統的單傳感器CNN感知,逐步升級到多傳感器CNN BEV,基于Transformer的BEV和Occupancy方案,并正在向端到端大模型演進。隨著規控部分逐步模型化,中間沒有規則介入,因而在海量高質量數據驅動下,性能天花板會大幅提升,并大幅降低了應對長尾問題的人工參與度,使得軟件工程量最多可下降99%。此外,視覺大模型的上車,幫助智駕系統進一步增加了對物理世界復雜語義的理解,使駕駛的行為更接近于人,提升了對未知場景的泛化處理能力。


超星未來梁爽:軟硬件協同優化,賦能AI 2.0新時代(圖3)


梁爽指出,智能汽車將是未來邁向通用機器人的一個必要階段,例如TESLA的Optimus機器人和智能汽車采用了同樣的FSD平臺,并且在系統配置、功能任務上相同。雖然兩者的系統組成和迭代升級高度相似,但機器人的維度更高、任務更復雜,大模型下沉部署到邊緣側的設備里,形成一個“Robot-Brain”,會成為行業發展的關鍵。


大模型落地邊緣側存在較大挑戰

軟硬件協同優化是現實可行的落地路徑


過去十年被稱為AI加速器的黃金十年,CNN加速器的能效已經提升到了100TOPS/W級別。大模型的規模以及參數增長速度遠超CNN時代,大幅超出了傳統計算硬件的增長速度。而當前大模型的處理器能效仍小于1TOPS/W,與邊緣側應用需求存在兩個數量級的差距,嚴重限制了大模型的落地。


超星未來梁爽:軟硬件協同優化,賦能AI 2.0新時代(圖4)

(摘選自汪玉教授發表于2024年1月的報告《端側大模型推理,智能芯片的現狀與展望》)


目前很多手機端本地部署的2B以內的“小”模型,在應用到邊緣側場景時,通常會出現歷史信息遺忘等能力限制,而需求量更大、效果顯著提升的7B量級以上的大模型,通常難以部署到現有的邊緣側芯片上,主要原因包括:(1)傳統架構矩陣算力缺口明顯,大模型中50-80%算力需求在Attention層中的各類矩陣計算,并且KV矩陣有明顯稀疏性,需要專項支持;(2)大模型的參數量和帶寬需求巨大,單7B級別的浮點模型就需要28GByte的存儲空間,且權重的局域性比較低,所以大模型計算處理的過程需要頻繁地對外存進行讀取,每個Token的帶寬需求都會大于10GB/s;(3)當前架構精度類型不足,計算精度傳統的CNN網絡通常可以用INT8實現較好的處理效果,而大模型中的各類算子會需要諸如INT4/FP8/BF16等不同精度的計算支持,并且像激活層、Norm層等的數據動態范圍大,導致很多已有的量化算法也不能很好地支持。


超星未來梁爽:軟硬件協同優化,賦能AI 2.0新時代(圖5)


從提升大模型在邊緣側處理能效的方法來看,一種是通過提升工藝水平scaling down,但受摩爾定律和國際形勢的影響,很難再繼續持續;另一種是通過新器件和新系統,但應用的成熟度還有待技術上的進一步提升與完善。但在當下來看最為現實的實現手段,就是針對大模型應用來做軟硬件協同優化,軟件上通過新的混合量化方法以及稀疏化處理,硬件上則針對大模型中常見的算法結構進行加速設計,從而整體上實現2-3個數量級的能效提升。


針對大模型任務新需求深度優化

超星未來實現邊緣側AGI計算行業領先


超星未來主要面向各類邊緣智能場景,提供以AI計算芯片為核心、軟硬件協同的高能效計算方案,致力于成為邊緣側AGI計算的引領者。


「平湖/高峽」NPU團隊十年磨一劍,實現性能行業天花板


針對智能駕駛及大模型所需要的神經網絡計算任務,超星未來自研了高性能AI處理核心「平湖」和「高峽」。「平湖」NPU主要針對以CNN和少量Transformer的感知類任務提供高效的計算,「高峽」NPU則是面向高階智駕以及大模型的實時處理專門設計的加速核心。


其中「平湖」NPU針對主流CNN/Transformer模型的推理延遲以及幀率均為行業最領先水平,與某款市場上被廣泛認可的競品相比,單位算力的推理幀率在CNN任務上提高10倍,Transformer任務提高25倍。


「高峽」NPU架構采用了混合粒度的指令集設計,單Cluster可實現40TOPS算力,支持INT4/INT8/FP8/BF16多種不同計算精度,并且在內部緩存設計上做了優化設計,另外針對Sparse Attention和三維稀疏卷積,設計了專用的加速結構。通過這些優化設計,「高峽」NPU實現了對典型的生成式大模型的實時計算支持,LLaMA3-8B生成速度最高可達60tokens/s。此外,「高峽」NPU可以用相較NVIDIA Orin芯片1%的計算邏輯面積,來實現近乎等同的三維稀疏卷積處理速率。


「驚蟄」系列芯片已于多領域批量落地,最新產品實現大模型邊緣側實時計算


基于自研的NPU核心,超星未來在2022年底發布了邊緣側AI計算芯片「驚蟄R1」,NPU算力為16TOPS@INT8,典型功耗僅7-8W,從而可以支撐起各類系統方案的自然散熱設計。「驚蟄R1」目前已在汽車、電力、煤礦以及機器人等領域實現了批量落地


超星未來梁爽:軟硬件協同優化,賦能AI 2.0新時代(圖6)


超星未來也即將發布「驚蟄」系列下一代芯片,可實現對大模型的實時處理,在12nm制程下將等同于驍龍8Gen3、天璣9300等SOTA手機芯片的處理效果。按照超星未來的芯片產品發展路徑圖,公司將繼續保持產品矩陣的可擴展性,從邊緣感知到智駕升級,逐步邁向“Robot-Brain”。


「魯班」模型部署工具鏈集成大模型優化新方法,軟件協同實現40倍性能提升


在高效硬件架構的基礎上,超星未來面向神經網絡應用打造深度優化的「魯班」工具鏈,可使邊緣側推理速度提高40倍以上,具體包括:


(1)業內領先的混合精度量化工具,支持PTQ/QAT/AWQ功能,支持INT4/INT8/FP8/BF16精度,量化損失小于1%;

(2)高效模型優化工具,支持敏感度分析、蒸餾、Lora,在精度損失小于1%的情況下,模型壓縮率超10倍;

(3)高性能編譯工具,提供豐富的計算圖優化技術及面向異構核心的高效指令調度,推理效率可提高4-5倍以上。


特別針對大模型任務,「魯班」通過特有的稀疏離群點保持和混合位寬量化的方法,可將權重位寬下探到平均2.8bit。基于稀疏掩膜的方法,可實現在模型處理能力相當的情況下,將LLaMA3-8B壓縮90%以上,大幅縮減了模型的參數和計算量。


「倉頡」數據閉環平臺實現數據自動化生產,構建應用迭代閉環


在大模型時代,高質量算法迭代需要功能強大的數據閉環工具。因此超星未來打造了「倉頡」平臺,包括數據管理、數據挖掘、數據增強、真值生產、模型生產和算法評測等功能,并且在多個環節都應用了大模型來提供功能上的增強。


基于該平臺,通過構建完整流程,客戶可以從環境中獲取有效數據,并盡可能降低人工的參與程度,實現自動的數據挖掘和標注,從而助力客戶實現數據驅動算法的迭代。目前「倉頡」平臺已為車企、Tier1等客戶提供了服務,同時也在延伸為機器人客戶提供支持的能力。


腳踏實地,快步向前

為客戶提供高效的“AI+”


基于團隊在AI領域十余年的研發與實踐經歷,超星未來緊跟AI 1.0到AI 2.0的發展路徑,不斷打磨核心產品,實現AI+X應用落地。


在邊緣側場景,超星未來已在電力、煤礦等泛安防領域實現了芯片產品的批量落地,實現了規模化的營收回報,并通過落地,持續迭代產品相關生態,形成對智能駕駛與AGI等長周期方向的反哺。“在當前惡劣的市場環境下,實現快速的落地才是生存的王道。”


超星未來梁爽:軟硬件協同優化,賦能AI 2.0新時代(圖7)


在智能駕駛場景,「驚蟄」系列芯片可支持多維智駕解決方案,如智能前視一體機、雙目前視方案、5-7V高性價比行泊一體、11V1L高性能行泊一體等,并涵蓋主流的行車、泊車以及智能駕駛和機器人通用的雙目功能。相關產品的參考解決方案已基于實車完成了打通和工程優化。目前,超星未來已與某行業頭部商用車OEM合作上車,同時與多家乘用車OEM客戶達成業務合作,預計最早于2025年實現批量上車。


在邊緣側大模型推理場景,基于「魯班」工具鏈的軟硬件協同優化能力,超星未來最新芯片產品在驗證平臺上實測ChatGLM-6B可以達到超過15tokens/s的生成速度,10W量級的芯片即可支持高性能大模型的邊緣落地;「高峽」NPU平臺Stable Diffusion 1.5版本可以在3.5s內完成圖片生成。基于以上能力,超星未來已與行業頭部的機器人客戶、大模型廠商等達成合作。


道阻且長,行則將至

共同構建AI 2.0新時代


“我們對技術發展的預估和意識通常是低估和滯后的,技術的發展一旦突破某個閾值,就會爆炸式地增長、覆蓋,比如從ChatGPT的發布到現如今的‘千模大戰’。不論是高階的智能駕駛,還是通用機器人應用,只要技術范式是正確的,人員與資金持續投入,‘ChatGPT時刻’就一定會到來,而且這個時刻或許會比我們想象得來得更快。”梁爽表示,“超星未來期待與各位合作伙伴攜手,從AI 1.0時代逐步邁進,共建AI 2.0的新時代。”




打賞

取消

感謝您的支持,我會繼續努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

相關推薦:

網友評論:

推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

欄目分類
Copyright ? 2021 早報網 版權所有
蘇ICP備2024138443號

蘇公網安備32130202081338號

本網站所刊載信息,不代表早報網觀點。如您發現內容涉嫌侵權違法立即與我們聯系客服 106291126@qq.com 對其相關內容進行刪除。
早報網登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。
《早報網》官方網站:www.www.amdoc.cn互聯網違法和不良信息舉報中心
Top 主站蜘蛛池模板: 急救箱-应急箱-急救包厂家-北京红立方医疗设备有限公司 | 智能型高压核相仪-自动开口闪点测试仪-QJ41A电雷管测试仪|上海妙定 | 武汉画册印刷厂家-企业画册印刷-画册设计印刷制作-宣传画册印刷公司 - 武汉泽雅印刷厂 | 热熔胶网膜|pes热熔网膜价格|eva热熔胶膜|热熔胶膜|tpu热熔胶膜厂家-苏州惠洋胶粘制品有限公司 | 建大仁科-温湿度变送器|温湿度传感器|温湿度记录仪_厂家_价格-山东仁科 | 福兰德PVC地板|PVC塑胶地板|PVC运动地板|PVC商用地板-中国弹性地板系统专业解决方案领先供应商! 福建成考网-福建成人高考网 | 魔方网-培训咨询服务平台 | 风淋室生产厂家报价_传递窗|送风口|臭氧机|FFU-山东盛之源净化设备 | 胶原检测试剂盒,弹性蛋白检测试剂盒,类克ELISA试剂盒,阿达木单抗ELISA试剂盒-北京群晓科苑生物技术有限公司 | 立刷【微电签pos机】-嘉联支付立刷运营中心 | 变位机,焊接变位机,焊接变位器,小型变位机,小型焊接变位机-济南上弘机电设备有限公司 | 钢格栅板_钢格板网_格栅板-做专业的热镀锌钢格栅板厂家-安平县迎瑞丝网制造有限公司 | 盐水蒸发器,水洗盐设备,冷凝结晶切片机,转鼓切片机,絮凝剂加药系统-无锡瑞司恩机械有限公司 | 阿里巴巴诚信通温州、台州、宁波、嘉兴授权渠道商-浙江联欣科技提供阿里会员办理 | 点胶机_点胶阀_自动点胶机_智能点胶机_喷胶机_点胶机厂家【欧力克斯】 | KBX-220倾斜开关|KBW-220P/L跑偏开关|拉绳开关|DHJY-I隔爆打滑开关|溜槽堵塞开关|欠速开关|声光报警器-山东卓信有限公司 | 附着力促进剂-尼龙处理剂-PP处理剂-金属附着力处理剂-东莞市炅盛塑胶科技有限公司 | 直齿驱动-新型回转驱动和回转支承解决方案提供商-不二传动 | 江西自考网 | 法兰连接型电磁流量计-蒸汽孔板节流装置流量计-北京凯安达仪器仪表有限公司 | 武汉刮刮奖_刮刮卡印刷厂_为企业提供门票印刷_武汉合格证印刷_现金劵代金券印刷制作 - 武汉泽雅印刷有限公司 | 蜂窝块状沸石分子筛-吸附脱硫分子筛-萍乡市捷龙环保科技有限公司 | 恒温恒湿试验箱厂家-高低温试验箱维修价格_东莞环仪仪器_东莞环仪仪器 | 新中天检测有限公司青岛分公司-山东|菏泽|济南|潍坊|泰安防雷检测验收 | 有机肥设备生产制造厂家,BB掺混肥搅拌机、复合肥设备生产线,有机肥料全部加工设备多少钱,对辊挤压造粒机,有机肥造粒设备 -- 郑州程翔重工机械有限公司 | 博莱特空压机|博莱特-阿特拉斯独资空压机品牌核心代理商 | 电镀整流器_微弧氧化电源_高频电解电源_微弧氧化设备厂家_深圳开瑞节能 | 集装箱标准养护室-集装箱移动式养护室-广州璟业试验仪器有限公司 | 亮化工程,亮化设计,城市亮化工程,亮化资质合作,长沙亮化照明,杰奥思【官网】 | 天津暖气片厂家_钢制散热器_天津铜铝复合暖气片_维尼罗散热器 | 岛津二手液相色谱仪,岛津10A液相,安捷伦二手液相,安捷伦1100液相-杭州森尼欧科学仪器有限公司 | 垃圾压缩设备_垃圾处理设备_智能移动式垃圾压缩设备--山东明莱环保设备有限公司 | 电渗析,废酸回收,双极膜-山东天维膜技术有限公司 | AGV无人叉车_激光叉车AGV_仓储AGV小车_AGV无人搬运车-南昌IKV机器人有限公司[官网] | OpenI 启智 新一代人工智能开源开放平台 | 鹤壁创新仪器公司-全自动量热仪,定硫仪,煤炭测硫仪,灰熔点测定仪,快速自动测氢仪,工业分析仪,煤质化验仪器 | 超声骨密度仪,双能X射线骨密度仪【起草单位】,骨密度检测仪厂家 - 品源医疗(江苏)有限公司 | 海外整合营销-独立站营销-社交媒体运营_广州甲壳虫跨境网络服务 焊管生产线_焊管机组_轧辊模具_焊管设备_焊管设备厂家_石家庄翔昱机械 | 卫生人才网-中国专业的医疗卫生医学人才网招聘网站! | 德国BOSCH电磁阀-德国HERION电磁阀-JOUCOMATIC电磁阀|乾拓百科 | 长沙广告公司_制作,长沙喷绘_发光字_招牌制作_长沙泓润广告官网 长城人品牌官网 |