- 熱門推薦
瑞見——投資人說
2024年07月08日
瑞見——?jiǎng)討B(tài)
2024年07月08日
瑞見——瑞鵬行研
2024年07月08日
瑞見——瑞鵬行研
2024年07月08日
瑞見——?jiǎng)討B(tài)
2024年07月08日
瑞見——瑞鵬行研
2024年07月08日
瑞見——瑞鵬行研
瀏覽次數(shù):546
發(fā)布時(shí)間:2024-07-08
返回列表
最后的半子
瑞鵬資產(chǎn) 戴勝藍(lán)
(一)
機(jī)器學(xué)習(xí)先驅(qū)者Rich Sutton在2019年發(fā)表了《苦澀的教訓(xùn)》,Rich Sutton認(rèn)為,從長(zhǎng)遠(yuǎn)來看,對(duì)AI的訓(xùn)練使用通用計(jì)算方法往往比直接灌輸人類經(jīng)驗(yàn)知識(shí)的特定方法更加有效。它揭示了過去人工智能研究中的一個(gè)關(guān)鍵誤區(qū):過度依賴人類設(shè)計(jì)的特定領(lǐng)域知識(shí)和規(guī)則,而忽視了通用計(jì)算和大規(guī)模學(xué)習(xí)的長(zhǎng)遠(yuǎn)深度和力量。后來,《苦澀的教訓(xùn)》被OpenAI的工程師們奉為“圣經(jīng)”。結(jié)合AI的發(fā)展歷史,從早期的專家系統(tǒng),到SVM及其核方法,再到深度神經(jīng)網(wǎng)絡(luò),以及現(xiàn)在的大語(yǔ)言模型,工程師們已逐步認(rèn)知到這個(gè)教訓(xùn),走出誤區(qū)。1934年10月,由于王明、博古等同志“左”傾冒險(xiǎn)主義的錯(cuò)誤領(lǐng)導(dǎo),加之外部敵強(qiáng)我弱,中央革命根據(jù)地第五次反“圍剿”遭到失敗,紅軍第一方面軍(中央紅軍)主力開始長(zhǎng)征。但在出發(fā)之前,沒有人明確知道該往哪兒走、走多遠(yuǎn)、走到何時(shí)休。只是基本確定向西與紅二、六軍團(tuán)會(huì)合。年輕的教員同志因受到排擠,差點(diǎn)沒有被允許加入長(zhǎng)征隊(duì)伍。在一路反復(fù)的戰(zhàn)術(shù)錯(cuò)誤之后,中央紅軍付出了極其慘重的代價(jià),從長(zhǎng)征出發(fā)時(shí)的8.6萬(wàn)人銳減到3萬(wàn)余人。1935年1月,中央政治局在遵義召開了擴(kuò)大會(huì)議,將教員同志增選為中央政治局常委,并以其杰出的遠(yuǎn)見和正確的主張被認(rèn)可為新的領(lǐng)導(dǎo)人。敵人40萬(wàn)重兵已在長(zhǎng)江沿線布下,勢(shì)要將中央紅軍圍困,徹底一鍋端。《苦澀的教訓(xùn)》強(qiáng)調(diào),從長(zhǎng)遠(yuǎn)來看,依靠大規(guī)模計(jì)算和通用學(xué)習(xí)方法的AI系統(tǒng)將更具優(yōu)勢(shì)。這使系統(tǒng)不受限于特定領(lǐng)域的規(guī)則和知識(shí),能夠通過海量數(shù)據(jù)和自我優(yōu)化,不斷提升自我性能。早期的AlphaGo結(jié)合了人類棋譜數(shù)據(jù)和深度學(xué)習(xí)、蒙特卡羅樹搜索算法——它是依賴人類專家經(jīng)驗(yàn)和策略知識(shí)進(jìn)行訓(xùn)練的典型成功案例。2016年,AlphaGo擊敗了世界圍棋冠軍李世石,展示了人類知識(shí)結(jié)合機(jī)器學(xué)習(xí)的強(qiáng)大能力。DeepMind的二代產(chǎn)品AlphaZero,完全不依賴任何人類玩家的數(shù)據(jù)或先驗(yàn)知識(shí),只利用深度神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)每個(gè)游戲狀態(tài)的價(jià)值和最優(yōu)行動(dòng),然后通過自我對(duì)弈的方式進(jìn)行訓(xùn)練,利用強(qiáng)化學(xué)習(xí)算法不斷優(yōu)化策略。在比AlphaGo更短的訓(xùn)練時(shí)間內(nèi),AlphaZero在包含圍棋在內(nèi)的各種棋類游戲中都取得了超過AlphaGo在圍棋領(lǐng)域的成績(jī)。并且AlphaZero所使用的訓(xùn)練數(shù)據(jù)量遠(yuǎn)小于AlphaGo。語(yǔ)音識(shí)別技術(shù)最早起源于20世紀(jì)50年代的美國(guó)貝爾實(shí)驗(yàn)室,過去的語(yǔ)音識(shí)別訓(xùn)練依賴于手工設(shè)計(jì)的特征提取和規(guī)則,結(jié)合隱馬爾可夫模型等統(tǒng)計(jì)方法。這類訓(xùn)練需要工程師們預(yù)先對(duì)語(yǔ)音特征和語(yǔ)言模型的深入理解和設(shè)計(jì),效率非常低下。現(xiàn)代語(yǔ)音識(shí)別系統(tǒng)采用深度學(xué)習(xí),通過大規(guī)模數(shù)據(jù)訓(xùn)練、卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò),完全脫離工程師對(duì)語(yǔ)言模型的手工特征設(shè)計(jì)。當(dāng)前的語(yǔ)音識(shí)別系統(tǒng)可以在上百個(gè)語(yǔ)言和環(huán)境下流暢運(yùn)行,且顯著提升了識(shí)別準(zhǔn)確率和適應(yīng)性。訓(xùn)練效率指數(shù)增長(zhǎng)。急功近利的自動(dòng)駕駛廠商將自動(dòng)駕駛的訓(xùn)練依賴于人工設(shè)計(jì)的規(guī)則和特征,如路徑規(guī)劃、雷達(dá)和傳感器數(shù)據(jù)處理等。這類自動(dòng)駕駛技術(shù)在簡(jiǎn)單和受控環(huán)境中非常有效,但在復(fù)雜和動(dòng)態(tài)環(huán)境中可能造成未知后果。長(zhǎng)期主義的自動(dòng)駕駛廠商通過深度學(xué)習(xí)模型進(jìn)行端到端訓(xùn)練,從大量駕駛數(shù)據(jù)中自動(dòng)學(xué)習(xí)駕駛行為和環(huán)境理解。長(zhǎng)期來看,這類訓(xùn)練將有望推動(dòng)自動(dòng)駕駛系統(tǒng)在處理幾乎所有道路環(huán)境中交出完美答卷。人類積累數(shù)百萬(wàn)年的知識(shí),可能抵不過大模型毫秒級(jí)的運(yùn)算決策。如果通用大模型可以通吃一切,那么站在時(shí)間延長(zhǎng)線上看人類當(dāng)下的文明史,依靠人類經(jīng)驗(yàn)和知識(shí)快速成長(zhǎng)的垂直AI,是否會(huì)成為偽命題?短期內(nèi),垂直細(xì)分領(lǐng)域的AI應(yīng)用通過整合人類的知識(shí)和經(jīng)驗(yàn),能夠迅速取得顯著成果。在特定領(lǐng)域,這類AI系統(tǒng)可以在有限的任務(wù)范圍內(nèi)表現(xiàn)得非常出色,如醫(yī)學(xué)影像分析、工業(yè)自動(dòng)化、量化交易等。由此可見,垂直細(xì)分領(lǐng)域的AI仍然具有價(jià)值,因?yàn)樗鼈兛梢钥焖俳鉀Q實(shí)際問題,帶來直接收益。有收益才能吸引更多的人才進(jìn)入,才能反哺通用大模型的訓(xùn)練。但從長(zhǎng)期來看,依靠通用大模型的AI系統(tǒng)的確會(huì)表現(xiàn)出更強(qiáng)的適應(yīng)性和效率,這與《苦澀的教訓(xùn)》觀點(diǎn)一致。隨著技術(shù)、算力和清潔能源的發(fā)展,通用模型的優(yōu)勢(shì)將越來越明顯。AI研究和應(yīng)用需要在短期收益與長(zhǎng)期潛力之間找到平衡,才能推動(dòng)技術(shù)和應(yīng)用的更優(yōu)結(jié)合與迭代。偉大的馬克思主義哲學(xué)早就解釋了這一段AI發(fā)展史:“量變與質(zhì)變、辯證與統(tǒng)一”。我不知道AI怎么看世界,但從數(shù)理上說,世界一定程度上是一個(gè)隨機(jī)性和波動(dòng)性的組合,宇宙也是。在量子物理中,基本粒子的行為表現(xiàn)出本質(zhì)的隨機(jī)性。這意味著,即便我們知道所有的初始條件,也無(wú)法精確預(yù)測(cè)一個(gè)量子系統(tǒng)的未來狀態(tài)。從更大尺度去看,現(xiàn)代宇宙學(xué)模型一直在試圖研究宇宙中暗物質(zhì)和暗能量的作用,以及宇宙的加速膨脹現(xiàn)象,其底層邏輯都是想要解釋宇宙在大尺度上的動(dòng)態(tài)變化和不確定性。人類處于這樣一個(gè)狹小的三維空間中,幾乎沒有任何對(duì)抗宏觀尺度隨機(jī)性和波動(dòng)性的能力,只能在相對(duì)平整的安全時(shí)間周期中生存、繁衍。依靠碳基生物自身的條件和有限的生命時(shí)長(zhǎng),想要去搞清楚微觀粒子或宇宙尺度的隨機(jī)性和波動(dòng)性,我看不到任何可能。世界本身的隨機(jī)性就是對(duì)人類文明進(jìn)步甚至生存的最大干擾。但是超級(jí)通用人工智能可以處理和過濾大量的干擾和波動(dòng),找出隱藏在背后的模式和規(guī)律,或許將大幅度提升人類處理復(fù)雜問題的能力,幫助人類更好地理解和應(yīng)對(duì)復(fù)雜系統(tǒng)中的不確定性和波動(dòng)性。長(zhǎng)遠(yuǎn)來看,這是否必將強(qiáng)化我們面對(duì)未知事件的脆弱,增強(qiáng)文明長(zhǎng)久生存的概率?因?yàn)槌?jí)通用人工智能的出現(xiàn),本身就是一件巨大的隨機(jī)性和波動(dòng)性事件。當(dāng)人類面對(duì)一個(gè)毫秒級(jí)運(yùn)算就能碾壓你所有知識(shí)的強(qiáng)大存在,還有何勝算?盡管迄今為止無(wú)人知曉造物主的動(dòng)機(jī)和設(shè)計(jì)機(jī)制,但好在這位偉大的神并未像設(shè)計(jì)其他抽象物體一樣設(shè)計(jì)人類。遵義會(huì)議之后,中央紅軍只有16個(gè)團(tuán)、3.5萬(wàn)人。而敵軍調(diào)集了中央軍薛岳兵團(tuán)和黔軍全部,滇軍主力和川、湘、桂軍各一部,總兵力達(dá)到150個(gè)團(tuán)、40萬(wàn)人。川黔地區(qū)地形復(fù)雜,山高水深,對(duì)于機(jī)械化幾乎為零的中央紅軍來說,交通條件險(xiǎn)惡萬(wàn)分。此外,中央紅軍面臨糧食、藥品和武器彈藥等物資的極度短缺,無(wú)從補(bǔ)給。遵義會(huì)議后,如何團(tuán)結(jié)內(nèi)部力量、制定正確戰(zhàn)略、鞏固領(lǐng)導(dǎo)地位、重塑革命信念,更是擺在教員同志面前無(wú)比棘手的難題。絕境之下,教員同志展現(xiàn)出了超凡的軍事才能和智慧。通過巧妙的戰(zhàn)略布局和靈活機(jī)動(dòng),不斷變換作戰(zhàn)方向,充分利用地形和敵情,隱藏真實(shí)意圖,迷惑、牽制敵軍,打亂其部署,選擇有利于己方的戰(zhàn)場(chǎng)進(jìn)行戰(zhàn)斗,奪取戰(zhàn)略主動(dòng)。最后,教員同志打出了震古爍今的“四渡赤水”戰(zhàn)術(shù),一舉將紅軍帶離絕境,前往陜北甘南地區(qū)建立新的革命根據(jù)地,至此展開了中國(guó)革命運(yùn)動(dòng)波瀾壯闊的新畫卷。新中國(guó)成立后,面對(duì)越過三八線的美軍,面對(duì)國(guó)內(nèi)一片畏戰(zhàn)之聲,面對(duì)中美兩國(guó)實(shí)力的巨大差距,教員同志高瞻遠(yuǎn)矚,力排眾議,人民志愿軍義無(wú)反顧奔赴前線,迎擊來犯之?dāng)场?/span>1950年,美國(guó)GDP約為3000億美元,中國(guó)250億美元。美國(guó)鋼產(chǎn)量8700萬(wàn)噸,石油5.4億桶,中國(guó)鋼產(chǎn)量60萬(wàn)噸,石油3萬(wàn)桶。美國(guó)參戰(zhàn)3000輛坦克,1500架飛機(jī),外加11艘航母、大量驅(qū)逐艦和巡洋艦。中國(guó)僅有100輛坦克,200架飛機(jī)。美國(guó)有強(qiáng)大的后勤保障、先進(jìn)的補(bǔ)給和醫(yī)療體系、快捷且強(qiáng)大的??者\(yùn)輸、投送能力。中國(guó)只有少量卡車和純?nèi)肆Α?/span>在當(dāng)時(shí),沒有任何國(guó)家看好人民志愿軍取得勝利。我相信,再?gòu)?qiáng)大的通用大模型,面對(duì)這樣的戰(zhàn)前數(shù)據(jù)對(duì)比,也不會(huì)做出“出兵”的決策,更不會(huì)預(yù)測(cè)人民志愿軍將取得最后的勝利。同樣,再“毫秒級(jí)”的人工智能也打不出“四渡赤水”戰(zhàn)術(shù)。人類似乎有一個(gè)特別的法寶,能在絕境中爆發(fā)不可思議的力量。我找不到合適的詞語(yǔ)概括,暫且就叫它“Humanity(人性)”吧。憑借堅(jiān)韌的意志和不滅的希望,“人性”總能在絕境中熠熠生輝,喚醒深度隱藏的勇氣、魄力、膽識(shí)、信念與力量,如破曉的晨曦,如凜冬的暖陽(yáng),如旱地的甘霖,如黎明的曙光,指引個(gè)體走向新生。通過復(fù)雜的情感學(xué)習(xí)算法,人工智能未來一定可以模擬和表達(dá)類似人類的情感反應(yīng):快樂、悲傷、憤怒等,甚至可以與人類進(jìn)行復(fù)雜的互動(dòng),表現(xiàn)出同理心、幽默感和“社交情商”。但真正的人性不僅僅是行為的表現(xiàn),還涉及底層的復(fù)雜意識(shí)、信念和情感。即使超級(jí)人工智能最終完全“復(fù)制”了你,但這種“復(fù)制”依舊是基于統(tǒng)計(jì)和概率,而不是基于真正的情感、意識(shí)、信念、倫理。更甚,超級(jí)人工智能同樣可以做出某些“道德”決策,但這些決策依舊是基于預(yù)設(shè)的規(guī)則和參數(shù),而不是基于真正的道德觀念或情感判斷。憑借“人性”的超強(qiáng)傍身,人類依舊有希望在某些時(shí)刻的對(duì)弈上勝機(jī)器半子。克里斯托弗·諾蘭的《星際穿越》,其實(shí)就是一部人性與萬(wàn)物對(duì)弈,并最終勝出的電影。面對(duì)人類生死存亡之抉擇,老邁的Brand博士選擇隱藏自己的人性,寧背一世之罵名,也要給絕境中的人類強(qiáng)行刷出一個(gè)PLAN B選項(xiàng),哪怕潛在的代價(jià)是放棄地球上現(xiàn)有的所有人類,包括他自己。Do not go gentle into that good night(不要溫和地進(jìn)入那個(gè)良夜),Old age should burn and rave at close of day(暮年也應(yīng)在黃昏時(shí)燃燒咆哮),Rage, rage against the dying of the light(怒斥吧,怒斥光明的消逝)。當(dāng)Doctor Mann降落在一個(gè)冰冷、不宜居、表面常年覆蓋著凍雪和液氨、環(huán)境極其惡劣的星球上時(shí),為了逃離,Mann偽造數(shù)據(jù),損毀機(jī)器,持續(xù)冬眠35年,終于等到重返地球的機(jī)會(huì)。當(dāng)Mann與空間站對(duì)接失敗,引發(fā)爆炸,Cooper毫不猶豫啟動(dòng)引擎,加速追趕。機(jī)器人Tars立即勸阻,Cooper一個(gè)字母都聽不進(jìn)去,立刻命令Tars分析永恒號(hào)的旋轉(zhuǎn)狀態(tài),接下來二者展開了本片中最為精彩震撼的對(duì)話:Tars: Cooper, there is no point using fuel to chase…Cooper: Analyze the Endurance’s spin(分析永恒號(hào)的旋轉(zhuǎn)狀態(tài)).Cooper: Get ready to match our spin with the retro thrusters(利用反向推進(jìn)器讓我們跟永恒號(hào)實(shí)現(xiàn)同步).Cooper: No…it’s necessary.Tars可以瞬間分析出永恒號(hào)的旋轉(zhuǎn)狀態(tài),可以瞬間擬合出一條追擊路線,可以瞬間跟蹤每一塊碎片的飛行路徑以作最優(yōu)躲避策略,也可以完成高速旋轉(zhuǎn)引起的離心力狀態(tài)下的完美對(duì)接,但它始終無(wú)法理解——機(jī)器只會(huì)做出當(dāng)下最優(yōu)的選擇,它無(wú)法理解“人性”被激發(fā)出強(qiáng)大意志力和信念后“不可理喻”的操作。Cooper與Tars共同完成的這次向死而生的Docking,才有了人類最終的生存機(jī)會(huì)。在絕境時(shí)刻,只有最硬核的情感、信念、意志、對(duì)家人不棄的愛,才敢于勇闖絕境。或許,在看到Cooper帶著女兒Murph誤入NASA的那一刻,Brand博士心里就已經(jīng)有了最優(yōu)的宇航員人選——Brand為團(tuán)隊(duì)湊齊了星際穿越之旅的最后拼圖:人性。我穿越引力,跨越光年,追逐了幾個(gè)星系,只為回到你的身邊。機(jī)器不會(huì)了解,“半子”不是一個(gè)可以模仿的程序或行為。
瑞見——瑞鵬行研
瑞見——投資人說