啊~cao死你个小sao货视频_成人免费av在线_最近更新中文字幕MV_大菠萝福建导航导入2023_国产高清一级毛片在线视_亚洲无码综合图片_无码专区免费一区_99久久精品国产片_一道本视频专区_激情五月网插插综合

投遞商業(yè)計劃書
熱門推薦

瑞見——投資人說

2022年02月25日

瑞見——動態(tài)

2022年02月25日

瑞見——動態(tài)

2022年02月25日

瑞見——投資人說

2022年02月25日

瑞見——動態(tài)

2022年02月25日

瑞見——投資人說

2022年02月25日

異構計算之風起云起

瀏覽次數(shù):520

發(fā)布時間:2022-02-25

返回列表
作為當前科技巨頭爭奪超高性能計算領域技術的制高點,數(shù)據(jù)中心、云計算和無人駕駛代表了超高性能計算最重要的應用場景和市場。在面向民眾的消費端,以智能手機、智能汽車為代表的主流消費產(chǎn)品均對處理器算力的需求、功耗、穩(wěn)定性和小型化提出了越來越高的要求。并且隨著處理器處理的信息維度越來越復雜,單一類型和架構的處理器已經(jīng)無法勝任多線數(shù)據(jù)的處理整合的能力。對于用戶來講既要保證算力和性能,又要具備多類型任務的處理能力,還要控制好功耗和成本,這對超高性能的異構處理器提出了非常高的要求。能同時滿足這些復雜要求的,只能通過異構計算架構來實現(xiàn)。也就是在一個處理器系統(tǒng)內(nèi),需要集成如CPU、GPU、FPGA、AI、通信總線和接口等多種功能模塊。

異構計算(Heterogeneous Computing)是指使用不同類型指令集和體系架構的計算單元組成的計算系統(tǒng)。異構計算是性能、成本和功耗均衡的技術,同時也是讓最適合的專用硬件去做最適合的事如密集計算或外設管理等,從而達到性能和成本的最優(yōu)化。
微信圖片_20230619163935
由于高性能計算領域對異構計算的需求非常迫切,近年來,處理器行業(yè)三大頭部廠商英特爾、AMD和英偉達都在基于自身的技術積累和產(chǎn)品優(yōu)勢的領域不斷擴充技術和產(chǎn)品邊界,以滿足市場極其龐大并且飛速發(fā)展中下游三大應用場景自動駕駛、數(shù)據(jù)中心和云計算對異構處理器的需求。  先說GPU王者英偉達,英偉達多年來憑借其GPU在AI訓練方面的先天優(yōu)勢,在數(shù)據(jù)中心的各類AI應用方面如魚得水。但隨著計算任務的多元化需求不斷延伸,單靠單一GPU機構還不足夠。因此,英偉達一直在覬覦由英特爾和AMD統(tǒng)治的CPU市場以及和GPU良好結合的NPU市場。近年來英偉達為了擴充產(chǎn)品體系鞏固高性能計算的地位動作頻頻,比如近期收購800億美金收購ARM的大事件(反壟斷沒有成功)。
英特爾與英偉達正相反,其在基于X86架構的非移動級CPU方面具有絕對統(tǒng)治力。但在牙膏廠始終在高性能GPU方面落后較多,近兩年也在大力投入獨立GPU顯卡業(yè)務并收購以色列無人駕駛AI芯片巨頭MobileEye,以補齊其在超高算力芯片方面的短板。
AMD則介于兩者之間,CPU和GPU技術和產(chǎn)品相對均衡,且隨著近幾年技術和產(chǎn)品力的提升,市占率和營收打著滾地向上升,弄得英特爾如坐針氈,盡管AMD的業(yè)務發(fā)展非常均衡,AMD并沒有滿足于已經(jīng)擁有的良好發(fā)展勢頭,要在CPU和GPU之外,再開辟出一片全新的超級賽道,將異構計算的性能發(fā)揮到極致。此時,智能汽車、自動駕駛的發(fā)展引領著這些超級巨頭的高度重視。汽車發(fā)展的趨勢從過去的燃油時代到如今的電動時代再到未來的智能時代,這離不開異構計算對于未來多維度、高復雜和超高算力的三大需求。與此同時,異構計算芯片成為了行業(yè)中絕對的熱點。

對于業(yè)界目前最火的異構計算芯片,今天跟著“瑞見”詳細拆解下異構計算的技術細節(jié)、未來趨勢尤其在在汽車自動駕駛中的應用吧。


什么是異構計算
微信圖片_20230619163947
異構計算“Heterogeneous Computing”是一種特殊的并行分布式計算系統(tǒng)。它能夠經(jīng)濟有效地實現(xiàn)高計算能力,可擴展性強,能夠非常高效地利用計算資源。與之相對的概念就是同構計算“Homogeneous Computing”,也就是為大家熟知的多核理念。為了突破計算算力受制于功耗的瓶頸,多核CPU技術得到越來越多的應用。強大的CPU采用越來越多的CPU內(nèi)核這就是傳統(tǒng)同構計算系統(tǒng)。很快人們就發(fā)現(xiàn)在AI人工智能和自動駕駛爆炸式增長的計算需求下,傳統(tǒng)同構計算系統(tǒng)已經(jīng)無法滿足要求,GPU、DSP、FPGA和ASIC由于特定需求下高效性越來越多的被應用。而異構計算技術應運而生,像一個大廚將CPU、GPU、DSP、FPGA和ASIC這些優(yōu)良食材制成一道融合各方口味特點的佳肴。
微信圖片_20230619163951
自動駕駛中的攝像頭視覺圖像處理的計算需求為例,它分為圖像獲取、特征抽取、特征處理、模式識別和動作反饋等步驟。其中對大量圖像數(shù)據(jù)的高速并行實時處理比如像素處理、圖像金字塔和梯度檢測等需要GPU和ISP圖像信號處理器這樣專用內(nèi)核來高速計算。而DSP和專用加速器則偏向卷積或傅里葉等數(shù)學計算加速,CPU更傾向通用計算和復雜動作反饋決策。依托異構計算技術能夠整合這些不同架構的內(nèi)核到單一芯片中從而適配自動駕駛的復雜計算要求。
微信圖片_20230619163955

那么到底什么樣的芯片是典型的異構計算芯片呢?
蘋果作為科技界的先鋒,在2021款的Mac Book和IPAD均采用了自研的M1芯片。M1 SoC集成了16核心CPU、DDR4內(nèi)存、IO接口芯片、T2加密芯片和雷電Thunderbolt接口以及眾多控制功能芯片核心。具體包括12個CPU內(nèi)核、8個GPU核心和16個神經(jīng)網(wǎng)絡加速引擎。并且這些不同架構的內(nèi)核可以通過標準內(nèi)存訪問架構UMA進行高速數(shù)據(jù)共享。正是由于異構計算技術的應用,才使得眾多不同類型的計算核心可以高效協(xié)同。蘋果M1以優(yōu)異的性能功耗比開創(chuàng)了自研異構計算芯片在筆記本電腦市場商用的先河。
異構計算在自動駕駛中的迭代
微信圖片_20230619163959
特斯拉作為新能源電動車頭部車企,在無人駕駛領域多年來一直深耕。作為純視覺派無人駕駛的領軍者,特斯拉人工智能駕駛輔助系統(tǒng)(ADAS)中最為核心的技術就是深度學習引擎Deep Neural Networks (DNN)。這套DNN引擎通過各類算法的模擬和積累,通過對攝像頭采集圖像進行分層學習,從圖像中可以抽取相應的目標位置,基于對于前方目標辨認標識出的安全空間完成路線規(guī)劃。通過多次的試錯與積累形成最優(yōu)解,標記算法模型的數(shù)據(jù)源,再通過深度學習算法不斷優(yōu)化與完善,最終規(guī)劃出的最優(yōu)路徑。
微信圖片_20230619164003
特斯拉無人駕駛方案迭代至Autopilot3.0代可以說是自動駕駛中央計算模塊的里程碑事件。因為采用自研異構芯片F(xiàn)SD,使得芯片內(nèi)部集成了4個ARM A72 CPU核心加1個GPU和2組神經(jīng)網(wǎng)絡處理單元NPU。它能更高速且低能耗地處理1個毫米波雷達和8個攝像頭信號,系統(tǒng)算力大幅提升至244TOPS。這其中異構計算架構功不可沒。
最后我們來看看作為最佳算力單元的GPU王者英偉達
微信圖片_20230619164007

英偉達自動駕駛異構芯片

作為通用圖形處理單元GPU領軍者英偉達,老黃早在2014年就意識到對浮點型數(shù)據(jù)具備強大計算能力的GPU在深度學習神經(jīng)網(wǎng)絡DNN的巨大優(yōu)勢。在GPU領域絕對的領先,使得英偉達在自動駕駛領域占盡了優(yōu)勢。開發(fā)了基于異構計算架構領域一系列的無人駕駛定制SOC芯片。比如小鵬P7采用的Xavier芯片算力為30TOPS,它具有強大的八核ARM64處理核心和512核Volta GPU,并且能夠達到汽車安全所需要功能安全ASIL-D(最高等級)的級別。相對整車級別優(yōu)化了功耗性能比。而即將量產(chǎn)的蔚來ET7配備了ADAM超算平臺,算力達到1016TOPS。ADAM超算平臺采用了4組英偉達最新的Orin自動駕駛異構計算技術SOC芯片。每組Orin芯片集成了12個ARM A76 CPU核心和算力在200TOPS左右的GPU內(nèi)核。

總結

人類在人工智能領域的研究已經(jīng)持續(xù)了60多年。近年來隨著AI下游應用不斷呈現(xiàn)出的爆發(fā)趨勢,AI進入了一個新的紀元。這不僅歸功于算法的改進、龐大數(shù)據(jù)的積累,更重要的是計算能力的大幅提升和變革。進入2022這個新紀元,數(shù)據(jù)成為了每個企業(yè)的資產(chǎn)和財富。而在數(shù)據(jù)的背后,算法、算力、功耗、成本都成為制約AI能否快速發(fā)展的瓶頸。

隨著硅基芯片逐漸逼近物理的極限以及成本很難再大幅下降,可以判定的是摩爾定律已趨近失效。在此背景下使用通用處理器來覆蓋全場景的高復雜需求已無法滿足,人工智能的各種應用不斷爆發(fā)對高計算能力和復雜任務并行處理以及功耗等提出需求。
因此,具有GPU、ASIC、FPGA或其它加速器(Accelerator)等高并行、高密集的計算能力的異構計算持續(xù)火熱,而異構計算也將成為支撐先進和以后更復雜AI 應用的必然的選擇。









區(qū)塊鏈當前的垂直應用場景及發(fā)展趨勢

基于國內(nèi)上市公司的文旅行業(yè)研究報告(一)