啊~cao死你个小sao货视频_成人免费av在线_最近更新中文字幕MV_大菠萝福建导航导入2023_国产高清一级毛片在线视_亚洲无码综合图片_无码专区免费一区_99久久精品国产片_一道本视频专区_激情五月网插插综合

投遞商業(yè)計劃書
熱門推薦

瑞見——投資人說

2022年02月25日

瑞見——動態(tài)

2022年02月25日

瑞見——瑞鵬行研

2022年02月25日

瑞見——瑞鵬行研

2022年02月25日

瑞見——動態(tài)

2022年02月25日

瑞見——瑞鵬行研

2022年02月25日

異構(gòu)計算之風(fēng)起云起

瀏覽次數(shù):243

發(fā)布時間:2022-02-25

返回列表
作為當(dāng)前科技巨頭爭奪超高性能計算領(lǐng)域技術(shù)的制高點,數(shù)據(jù)中心、云計算和無人駕駛代表了超高性能計算最重要的應(yīng)用場景和市場。在面向民眾的消費端,以智能手機、智能汽車為代表的主流消費產(chǎn)品均對處理器算力的需求、功耗、穩(wěn)定性和小型化提出了越來越高的要求。并且隨著處理器處理的信息維度越來越復(fù)雜,單一類型和架構(gòu)的處理器已經(jīng)無法勝任多線數(shù)據(jù)的處理整合的能力。對于用戶來講既要保證算力和性能,又要具備多類型任務(wù)的處理能力,還要控制好功耗和成本,這對超高性能的異構(gòu)處理器提出了非常高的要求。能同時滿足這些復(fù)雜要求的,只能通過異構(gòu)計算架構(gòu)來實現(xiàn)。也就是在一個處理器系統(tǒng)內(nèi),需要集成如CPU、GPU、FPGA、AI、通信總線和接口等多種功能模塊。

異構(gòu)計算(Heterogeneous Computing)是指使用不同類型指令集和體系架構(gòu)的計算單元組成的計算系統(tǒng)。異構(gòu)計算是性能、成本和功耗均衡的技術(shù),同時也是讓最適合的專用硬件去做最適合的事如密集計算或外設(shè)管理等,從而達(dá)到性能和成本的最優(yōu)化。
微信圖片_20230619163935
由于高性能計算領(lǐng)域?qū)Ξ悩?gòu)計算的需求非常迫切,近年來,處理器行業(yè)三大頭部廠商英特爾、AMD和英偉達(dá)都在基于自身的技術(shù)積累和產(chǎn)品優(yōu)勢的領(lǐng)域不斷擴充技術(shù)和產(chǎn)品邊界,以滿足市場極其龐大并且飛速發(fā)展中下游三大應(yīng)用場景自動駕駛、數(shù)據(jù)中心和云計算對異構(gòu)處理器的需求。  先說GPU王者英偉達(dá),英偉達(dá)多年來憑借其GPU在AI訓(xùn)練方面的先天優(yōu)勢,在數(shù)據(jù)中心的各類AI應(yīng)用方面如魚得水。但隨著計算任務(wù)的多元化需求不斷延伸,單靠單一GPU機構(gòu)還不足夠。因此,英偉達(dá)一直在覬覦由英特爾和AMD統(tǒng)治的CPU市場以及和GPU良好結(jié)合的NPU市場。近年來英偉達(dá)為了擴充產(chǎn)品體系鞏固高性能計算的地位動作頻頻,比如近期收購800億美金收購ARM的大事件(反壟斷沒有成功)。
英特爾與英偉達(dá)正相反,其在基于X86架構(gòu)的非移動級CPU方面具有絕對統(tǒng)治力。但在牙膏廠始終在高性能GPU方面落后較多,近兩年也在大力投入獨立GPU顯卡業(yè)務(wù)并收購以色列無人駕駛AI芯片巨頭MobileEye,以補齊其在超高算力芯片方面的短板。
AMD則介于兩者之間,CPU和GPU技術(shù)和產(chǎn)品相對均衡,且隨著近幾年技術(shù)和產(chǎn)品力的提升,市占率和營收打著滾地向上升,弄得英特爾如坐針氈,盡管AMD的業(yè)務(wù)發(fā)展非常均衡,AMD并沒有滿足于已經(jīng)擁有的良好發(fā)展勢頭,要在CPU和GPU之外,再開辟出一片全新的超級賽道,將異構(gòu)計算的性能發(fā)揮到極致。此時,智能汽車、自動駕駛的發(fā)展引領(lǐng)著這些超級巨頭的高度重視。汽車發(fā)展的趨勢從過去的燃油時代到如今的電動時代再到未來的智能時代,這離不開異構(gòu)計算對于未來多維度、高復(fù)雜和超高算力的三大需求。與此同時,異構(gòu)計算芯片成為了行業(yè)中絕對的熱點。

對于業(yè)界目前最火的異構(gòu)計算芯片,今天跟著“瑞見”詳細(xì)拆解下異構(gòu)計算的技術(shù)細(xì)節(jié)、未來趨勢尤其在在汽車自動駕駛中的應(yīng)用吧。


什么是異構(gòu)計算
微信圖片_20230619163947
異構(gòu)計算“Heterogeneous Computing”是一種特殊的并行分布式計算系統(tǒng)。它能夠經(jīng)濟有效地實現(xiàn)高計算能力,可擴展性強,能夠非常高效地利用計算資源。與之相對的概念就是同構(gòu)計算“Homogeneous Computing”,也就是為大家熟知的多核理念。為了突破計算算力受制于功耗的瓶頸,多核CPU技術(shù)得到越來越多的應(yīng)用。強大的CPU采用越來越多的CPU內(nèi)核這就是傳統(tǒng)同構(gòu)計算系統(tǒng)。很快人們就發(fā)現(xiàn)在AI人工智能和自動駕駛爆炸式增長的計算需求下,傳統(tǒng)同構(gòu)計算系統(tǒng)已經(jīng)無法滿足要求,GPU、DSP、FPGA和ASIC由于特定需求下高效性越來越多的被應(yīng)用。而異構(gòu)計算技術(shù)應(yīng)運而生,像一個大廚將CPU、GPU、DSP、FPGA和ASIC這些優(yōu)良食材制成一道融合各方口味特點的佳肴。
微信圖片_20230619163951
自動駕駛中的攝像頭視覺圖像處理的計算需求為例,它分為圖像獲取、特征抽取、特征處理、模式識別和動作反饋等步驟。其中對大量圖像數(shù)據(jù)的高速并行實時處理比如像素處理、圖像金字塔和梯度檢測等需要GPU和ISP圖像信號處理器這樣專用內(nèi)核來高速計算。而DSP和專用加速器則偏向卷積或傅里葉等數(shù)學(xué)計算加速,CPU更傾向通用計算和復(fù)雜動作反饋決策。依托異構(gòu)計算技術(shù)能夠整合這些不同架構(gòu)的內(nèi)核到單一芯片中從而適配自動駕駛的復(fù)雜計算要求。
微信圖片_20230619163955

那么到底什么樣的芯片是典型的異構(gòu)計算芯片呢?
蘋果作為科技界的先鋒,在2021款的Mac Book和IPAD均采用了自研的M1芯片。M1 SoC集成了16核心CPU、DDR4內(nèi)存、IO接口芯片、T2加密芯片和雷電Thunderbolt接口以及眾多控制功能芯片核心。具體包括12個CPU內(nèi)核、8個GPU核心和16個神經(jīng)網(wǎng)絡(luò)加速引擎。并且這些不同架構(gòu)的內(nèi)核可以通過標(biāo)準(zhǔn)內(nèi)存訪問架構(gòu)UMA進(jìn)行高速數(shù)據(jù)共享。正是由于異構(gòu)計算技術(shù)的應(yīng)用,才使得眾多不同類型的計算核心可以高效協(xié)同。蘋果M1以優(yōu)異的性能功耗比開創(chuàng)了自研異構(gòu)計算芯片在筆記本電腦市場商用的先河。
異構(gòu)計算在自動駕駛中的迭代
微信圖片_20230619163959
特斯拉作為新能源電動車頭部車企,在無人駕駛領(lǐng)域多年來一直深耕。作為純視覺派無人駕駛的領(lǐng)軍者,特斯拉人工智能駕駛輔助系統(tǒng)(ADAS)中最為核心的技術(shù)就是深度學(xué)習(xí)引擎Deep Neural Networks (DNN)。這套DNN引擎通過各類算法的模擬和積累,通過對攝像頭采集圖像進(jìn)行分層學(xué)習(xí),從圖像中可以抽取相應(yīng)的目標(biāo)位置,基于對于前方目標(biāo)辨認(rèn)標(biāo)識出的安全空間完成路線規(guī)劃。通過多次的試錯與積累形成最優(yōu)解,標(biāo)記算法模型的數(shù)據(jù)源,再通過深度學(xué)習(xí)算法不斷優(yōu)化與完善,最終規(guī)劃出的最優(yōu)路徑。
微信圖片_20230619164003
特斯拉無人駕駛方案迭代至Autopilot3.0代可以說是自動駕駛中央計算模塊的里程碑事件。因為采用自研異構(gòu)芯片F(xiàn)SD,使得芯片內(nèi)部集成了4個ARM A72 CPU核心加1個GPU和2組神經(jīng)網(wǎng)絡(luò)處理單元NPU。它能更高速且低能耗地處理1個毫米波雷達(dá)和8個攝像頭信號,系統(tǒng)算力大幅提升至244TOPS。這其中異構(gòu)計算架構(gòu)功不可沒。
最后我們來看看作為最佳算力單元的GPU王者英偉達(dá)
微信圖片_20230619164007

英偉達(dá)自動駕駛異構(gòu)芯片

作為通用圖形處理單元GPU領(lǐng)軍者英偉達(dá),老黃早在2014年就意識到對浮點型數(shù)據(jù)具備強大計算能力的GPU在深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)DNN的巨大優(yōu)勢。在GPU領(lǐng)域絕對的領(lǐng)先,使得英偉達(dá)在自動駕駛領(lǐng)域占盡了優(yōu)勢。開發(fā)了基于異構(gòu)計算架構(gòu)領(lǐng)域一系列的無人駕駛定制SOC芯片。比如小鵬P7采用的Xavier芯片算力為30TOPS,它具有強大的八核ARM64處理核心和512核Volta GPU,并且能夠達(dá)到汽車安全所需要功能安全ASIL-D(最高等級)的級別。相對整車級別優(yōu)化了功耗性能比。而即將量產(chǎn)的蔚來ET7配備了ADAM超算平臺,算力達(dá)到1016TOPS。ADAM超算平臺采用了4組英偉達(dá)最新的Orin自動駕駛異構(gòu)計算技術(shù)SOC芯片。每組Orin芯片集成了12個ARM A76 CPU核心和算力在200TOPS左右的GPU內(nèi)核。

總結(jié)

人類在人工智能領(lǐng)域的研究已經(jīng)持續(xù)了60多年。近年來隨著AI下游應(yīng)用不斷呈現(xiàn)出的爆發(fā)趨勢,AI進(jìn)入了一個新的紀(jì)元。這不僅歸功于算法的改進(jìn)、龐大數(shù)據(jù)的積累,更重要的是計算能力的大幅提升和變革。進(jìn)入2022這個新紀(jì)元,數(shù)據(jù)成為了每個企業(yè)的資產(chǎn)和財富。而在數(shù)據(jù)的背后,算法、算力、功耗、成本都成為制約AI能否快速發(fā)展的瓶頸。

隨著硅基芯片逐漸逼近物理的極限以及成本很難再大幅下降,可以判定的是摩爾定律已趨近失效。在此背景下使用通用處理器來覆蓋全場景的高復(fù)雜需求已無法滿足,人工智能的各種應(yīng)用不斷爆發(fā)對高計算能力和復(fù)雜任務(wù)并行處理以及功耗等提出需求。
因此,具有GPU、ASIC、FPGA或其它加速器(Accelerator)等高并行、高密集的計算能力的異構(gòu)計算持續(xù)火熱,而異構(gòu)計算也將成為支撐先進(jìn)和以后更復(fù)雜AI 應(yīng)用的必然的選擇。









區(qū)塊鏈當(dāng)前的垂直應(yīng)用場景及發(fā)展趨勢

基于國內(nèi)上市公司的文旅行業(yè)研究報告(一)