商湯科技董事長徐立:整個AI行業(yè)都有兩條生死線

2024-12-26 11:33:48 來源: 商湯科技SenseTime官微 作者:量子位

  在MEET2025智能未來大會上,商湯科技董事長兼CEO徐立博士與量子位總編輯李根展開對話,分享了他對AGI征程第二個十年的感受與思考。量子位(ID:QbitAI)整理刊登文章如下:

  核心觀點

  AI發(fā)展的兩個關(guān)鍵要素:基礎(chǔ)設(shè)施建設(shè)的完備性和技術(shù)深入應(yīng)用場景。

  算力供給的成本線和開源模型性能線是AI行業(yè)的兩條生死線。

  未來中國的AI行業(yè)應(yīng)用百花齊放需要實現(xiàn)一個重要目標(biāo):計算資源平權(quán)。

  無論是當(dāng)前的語言模型還是垂直行業(yè)應(yīng)用,可能都只是一個前奏,我們可能會迎來通用人工智能的“超級時刻”

  真正通往廣泛智能的路線(AGI),很可能不會局限于人類的視角和能力。

  AI十年發(fā)展的兩個關(guān)鍵要素

  李根:很高興邀請您進(jìn)行分享,創(chuàng)業(yè)十年的感覺怎么樣?

  徐立:今年也是商湯的第十個年頭,可以說見證了人工智能的發(fā)展、變化。

  十幾年前看AI的時候,大家還沒有現(xiàn)在這么強(qiáng)的廣泛認(rèn)知,還是一個相對比較模糊的概念。

  但今天,大眾對于AI的認(rèn)知變化,讓我們感覺到這個時代在突破的臨門一腳上。包括剛才咱們活動上提到了很多人工智能的發(fā)展趨勢,這些趨勢和技術(shù),甚至就是討論的這些關(guān)鍵詞本身,如果放到十年前,可能大部分的人一頭霧水,但今天所有人都耳熟能詳,這就是一個時代的進(jìn)步。

  對新技術(shù)認(rèn)知的快速迭代,是推動時代進(jìn)步的基礎(chǔ)要素。

  李根:讓我印象一直很深刻,你說所有紅利最前面是認(rèn)知的紅利。如果我們總結(jié)過去的十年,或商湯創(chuàng)業(yè)的十年,我們現(xiàn)在回過頭得出的結(jié)論有哪些?

  徐立:從我們看來,這個時代的發(fā)展或過往十年,可能有兩個要素是推動行業(yè)發(fā)展進(jìn)步的基礎(chǔ)。

  第一個要素是基礎(chǔ)設(shè)施發(fā)展要素,為行業(yè)往前走提供了核心支撐。

  過往我認(rèn)為移動互聯(lián)網(wǎng)發(fā)展得很好,得益于我們的產(chǎn)品和開發(fā)人才密度高等因素,這些當(dāng)然是事實。但最關(guān)鍵的一點是,在這之前我們已經(jīng)建立了完善的基礎(chǔ)設(shè)施。移動互聯(lián)網(wǎng)的爆發(fā)得益于移動通信大規(guī)模的建設(shè)和發(fā)展。它的成本能夠以非常快的速度降低,甚至是在世界范圍之內(nèi)以領(lǐng)先的成本優(yōu)勢推動下游的應(yīng)用百花齊放,并最終遴選出今天的頭部互聯(lián)網(wǎng)。這完全是基礎(chǔ)設(shè)施迭代的紅利。

  事實上,回望AI1.0時代全球的技術(shù)發(fā)展,差不多中國是同步推動了ImageNet時刻的行業(yè)落地。在ImageNet時刻之前,許多人對AI在現(xiàn)實世界任務(wù)上的能力存有疑問。但如果AI能夠在視覺領(lǐng)域,特別是基于互聯(lián)網(wǎng)數(shù)據(jù)的任務(wù)上取得突破,就能吸引很多人投身其中。當(dāng)然,這里ImageNet時刻也得益于互聯(lián)網(wǎng)基礎(chǔ)設(shè)施的完善從而獲得大量的互聯(lián)網(wǎng)數(shù)據(jù)。

  那場景為什么是中國?這得益于中國早期在基礎(chǔ)設(shè)施建設(shè)上的完備性。比如做視覺相關(guān)工作,攝像頭的數(shù)量;又如進(jìn)行任務(wù)檢測時,早期通信連接和數(shù)字化儲備,這些都為我們在數(shù)字化轉(zhuǎn)型中帶來了一波紅利。

  然而,回過頭看,當(dāng)時創(chuàng)業(yè)者普遍take for granted,認(rèn)為基礎(chǔ)設(shè)施的發(fā)展是自然條件。今天我們發(fā)展AI2.0,更需要注重基礎(chǔ)設(shè)施的建設(shè)和發(fā)展。

  第二個要素是:無論技術(shù)再通用、再基礎(chǔ),“場景化”始終是技術(shù)走向大眾、實現(xiàn)真正意義上商用的核心關(guān)鍵。

  接下來的AGI(AI2.0)時代,無論技術(shù)多通用,“場景化”依然會成為推動技術(shù)迭代的核心驅(qū)動力,因為技術(shù)本身只是一個工具。

  今年的諾貝爾獎很有意思,把物理獎和化學(xué)獎同時頒給了AI。物理獎把人工智能作為目的、作為一門科學(xué),用物理學(xué)的知識推進(jìn)人工智能的發(fā)展;而化學(xué)獎則把人工智能作為工具,用它推動計算化學(xué)、蛋白質(zhì)預(yù)測領(lǐng)域的突破。

  我理解這兩個獎項應(yīng)該分屬于不同的階段:先有技術(shù)作為工具推動行業(yè)進(jìn)步,之后再將其本身作為學(xué)科研究的目標(biāo)。然而,它們卻同時發(fā)生。這反映了AI技術(shù)發(fā)展很快凝聚了共識并在場景化應(yīng)用中的快速迭代,極大提升了學(xué)科的認(rèn)可度,使人工智能本身也成為獨立研究的對象,這是非常有趣的現(xiàn)象。

  基礎(chǔ)科學(xué)的突破往往體現(xiàn)“無用之用”。有個傳聞?wù)f,學(xué)生問歐幾里得:“我學(xué)習(xí)這些有什么用?”歐幾里得回答:“如果是教你有用的東西,你就不該來這里”,然后把學(xué)生趕了出去。這當(dāng)然是個傳聞,但確實說明了基礎(chǔ)學(xué)科或技術(shù)突破往往在早期難以直接看到實用價值。但今天如果我們要讓技術(shù)走進(jìn)千家萬戶,實現(xiàn)商業(yè)化,僅靠“無用之用”已無法推動應(yīng)用變革。一定是通過場景化的應(yīng)用深入,才能促進(jìn)行業(yè)真正發(fā)展。而場景化是AI凝聚認(rèn)知共識的起點。因此,無論技術(shù)多么基礎(chǔ),多么通用,我過往十年的觀察是,技術(shù)的細(xì)分場景化深入才是真正的破局點。

  整個AI行業(yè)都有兩條生死線

  李根:所以聽起來1.0時代更多還是做AI基礎(chǔ)設(shè)施構(gòu)建工作,包括大裝置,到2.0現(xiàn)在用的LLM這樣新的范式,可以更加把場景化的問題解決好。

  徐立:我們現(xiàn)在的認(rèn)知是,在1.0時代,如果AI能夠進(jìn)入到行業(yè),通常是因為行業(yè)已經(jīng)構(gòu)建了完善的基礎(chǔ)設(shè)施,并充分利用了這些基礎(chǔ)設(shè)施的優(yōu)勢。比如,有了攝像頭網(wǎng)絡(luò),視覺相關(guān)的AI應(yīng)用才能快速推進(jìn)。如果要讓視覺企業(yè)負(fù)責(zé)建設(shè)攝像頭網(wǎng)絡(luò)的話,那么應(yīng)用迭代將會非常緩慢,也算不過來經(jīng)濟(jì)賬。就像如果開發(fā)移動互聯(lián)網(wǎng)產(chǎn)品的企業(yè)還要自行搭建4G、5G通信網(wǎng)絡(luò),這也是算不過來經(jīng)濟(jì)賬的。

  這引出2.0時代的一個挑戰(zhàn):如果2.0時代的AI發(fā)展極度依賴計算基礎(chǔ)設(shè)施,也就是算力的建設(shè),那么2.0時代的基礎(chǔ)設(shè)施應(yīng)該如何構(gòu)建?在構(gòu)建過程中,如何確保它真正能夠為大眾所用?這是2.0時代的一個核心命題,或者也是當(dāng)前技術(shù)發(fā)展所面臨的一項挑戰(zhàn)。

  李根:今年我們也做了戰(zhàn)略上的升級,商湯做了一個大裝置、大模型以及應(yīng)用的“三位一體”,跟這個判斷有關(guān)系嗎?

  徐立:從9月以來,硅谷做了很多有意思的事。比如,9月3日,馬斯克的xAI宣布用4個月建成了100K的集群, 算力超越了OpenAI。最近,他們更宣布計劃將Colossus超算擴(kuò)容十倍,集成超過100萬塊GPU。20萬張卡,不知道大家有沒有概念,僅建設(shè)就大概要600億元。這個時代,可以看像馬斯克xAI這樣的創(chuàng)業(yè)公司,是以如此的閉環(huán)節(jié)奏往前推進(jìn)。

  9月12日,白宮宣布將成立智算中心基礎(chǔ)設(shè)施特別工作組。政府把所有涉及計算資源和基礎(chǔ)設(shè)施的企業(yè)招來,成立聯(lián)盟來推動相關(guān)發(fā)展。這一系列事件,將基礎(chǔ)設(shè)施的重要性提升到了一個新的高度——輸入是能源,輸出是數(shù)字智能,相當(dāng)于對計算基礎(chǔ)設(shè)施進(jìn)行了重新定義和高度強(qiáng)化。同時,谷歌、甲骨文投入了大量資源在核電;微軟和貝萊德成立了300億美元的AI基礎(chǔ)設(shè)施基金;特斯拉一年之內(nèi)GPU增加了9倍,24年底達(dá)9萬塊H100。

  這對中國來說也是一個重要命題。如果中國想實現(xiàn)端到端自動駕駛,需要具備什么條件?按照馬斯克的第一性原理思考,他一定認(rèn)為9萬張卡是實現(xiàn)端到端自動駕駛的必要條件,那我們是否具備對等的邏輯與資源投入?

  很多人將1.0和2.0時代的差異定義為專有AI與通用AI的轉(zhuǎn)變。但在我看來,1.0和2.0最大的區(qū)別在于資源的側(cè)重。1.0時代是人力密集型,所有資源都集中在人才招攬上,當(dāng)時GPU的使用實際是解放了CPU,大幅降低了成本,計算的成本占AI公司的占比不足5%。到了2.0時代,計算的權(quán)重反了過來,在訓(xùn)練大模型任務(wù)中,成本中計算占比達(dá)到95%,人力只占5%。

  這就帶來了一個核心問題:在2.0時代,如何更高效地利用基礎(chǔ)設(shè)施?

  我們提出的“三位一體”——大裝置、模型和應(yīng)用的無縫集成,強(qiáng)調(diào)了AI2.0發(fā)展的核心路徑。首先,“場景化”一定是驅(qū)動力。沒有場景應(yīng)用,你無法明確市場上的模型會以何種形態(tài)發(fā)展。其次,模型研發(fā)是驅(qū)動基礎(chǔ)設(shè)施建設(shè)的核心動力,因為今天任何一個模型的變化,都會帶來基礎(chǔ)設(shè)施成本價值的巨大變化。

  現(xiàn)在做AI,我常說行業(yè)內(nèi)存在兩條“生死線”。

  第一條是算力供給的成本線。

  英偉達(dá)為什么能達(dá)到3萬億美元的市值?因為過往10年,他們把算力的成本降低了100萬倍。而未來,他們同樣計劃實現(xiàn)算力成本再降低100萬倍的目標(biāo)。這樣的基礎(chǔ)設(shè)施變革,以10年100萬倍的成本下降速度,是史無前例的。

  2018年,我曾推薦過一本書《Prediction Machines》,它提出一個有趣的觀點:當(dāng)生產(chǎn)要素的成本下降百倍時,會迎來時代的轉(zhuǎn)折點。例如,電力成本下降100倍,開啟了電氣時代;通信成本下降100倍,推動了移動互聯(lián)網(wǎng)時代。

  如果今天算力成本下降100萬倍,我們會進(jìn)入一個怎樣的時代?這就給從業(yè)者帶來一個很大的挑戰(zhàn)。

  對于從業(yè)者而言,進(jìn)入的時機(jī)尤為關(guān)鍵。如果晚幾年投入,可能只需要1/1000的資源就能完成相同的任務(wù)。那么,在什么時間節(jié)點投入、投入的資源是否能夠沉淀為持久的價值,就成為行業(yè)發(fā)展的第一條生死線。

  第二條就是開源模型性能線。

  在過去的行業(yè)發(fā)展中,大模型開源已成為一個重要的前提,尤其是在從事基礎(chǔ)設(shè)施建設(shè)或銷售硬件的公司中。例如,英偉達(dá)在推動開源方面不遺余力,他們將所有過程、數(shù)據(jù)和細(xì)節(jié)開源。

  模型開源除了推動行業(yè)進(jìn)步,一般有三類玩家:

  第一類是基礎(chǔ)設(shè)施提供方,開源的目標(biāo)是讓用戶掌握這項技術(shù),然后通過銷售硬件或服務(wù)(比如算力或者模型的調(diào)用)獲利。這種模式可能在模型本身上不盈利,但通過配套的業(yè)務(wù)模式實現(xiàn)收益。

  第二類內(nèi)容平臺。生成式AI越多生成內(nèi)容,平臺的內(nèi)容生態(tài)就越豐富。這也是為什么像Meta 有Facebook和Instagram等內(nèi)容平臺,也會大力推動開源。實際上生成內(nèi)容越豐富,平臺價值就越高。

  第三類是創(chuàng)業(yè)公司的開源。這些公司通常在有限的資源下,將開源作為快速提升行業(yè)影響力的路徑,吸引投資者。

  不過,這三類積極開源的企業(yè)帶來一條性能增長線,而這條性能線已經(jīng)接近甚至追平了閉源模型,如果行業(yè)開源模型投入的平均水平較高,而企業(yè)的投入不足,就必須走差異化路線,為行業(yè)提供獨特的價值。

  比如,可以選擇了以行業(yè)應(yīng)用的垂直領(lǐng)域為切入點,通過差異化模型發(fā)展,包括差異化的場景數(shù)據(jù)發(fā)展,推動行業(yè)的變化。商湯在這一定位中,既要完成基礎(chǔ)模型的迭代,又要為行業(yè)客戶提供差異化的價值,我們的目標(biāo)是以同等甚至更低的成本,為市場提供優(yōu)質(zhì)的計算資源和模型使用。

  未來中國的AI行業(yè)應(yīng)用需要實現(xiàn)一個重要目標(biāo),即計算資源平權(quán)。訓(xùn)練基礎(chǔ)模型還是少數(shù)企業(yè)的責(zé)任,但是使用大模型一定是百花齊放,所以使用模型需要的計算資源必須要高性價比,才能推動行業(yè)的發(fā)展。

  當(dāng)前,我們面臨很多挑戰(zhàn),例如連接硬件技術(shù)的難題、國產(chǎn)化能力的限制等。這些挑戰(zhàn)使得應(yīng)用方難以平等獲取低成本的計算資源。如何解決這些問題,是商湯在“三位一體”戰(zhàn)略轉(zhuǎn)型中深入思考的方向。

  大裝置、大模型、場景應(yīng)用的“三位一體”

  李根:商湯之所以具有AI的代表性也是因為這樣的“三位一體”不是每家公司都具有或者都有這樣實踐的可能性。我們在做大裝置算力、大模型以及應(yīng)用的“三位一體”過程中,您是怎么去看這三個要素當(dāng)前的成熟度?

  徐立:如果討論成熟度,現(xiàn)在計算成本在AI領(lǐng)域占據(jù)了極大的比重,無論是訓(xùn)練還是推理環(huán)節(jié)都如此。這個變化是Scaling在不同領(lǐng)域驗證的結(jié)果,我認(rèn)為Scaling Law經(jīng)歷了三個重要的驗證時刻,這三件事情的驗證塑造了今天對它的認(rèn)識。

  第一個驗證是大語言模型上的應(yīng)用,這是非常有意思的點。大家如今普遍認(rèn)為資源越多性能越好是常識,但實際上,在Scaling Law提出之前,這在AI領(lǐng)域是一個反共識的觀點。在小數(shù)據(jù)、小模型上表現(xiàn)優(yōu)秀的算法,往往在大數(shù)據(jù)、大模型上效果不佳。過去,從未有人宣稱某種方法能夠適用于不同尺度的模型,這也是為什么Scaling Law被稱為“尺度定律”。這一驗證首次明確了算力資源的重要性和正相關(guān)性。

  第二個驗證是跨模態(tài)的適用性。不管是Sora還是4o等其他跨模態(tài)系統(tǒng),Scaling Law的作用不僅限于語言模型,也適用于視覺等其他模態(tài)。這在過往非常不常見,因為在傳統(tǒng)AI領(lǐng)域,算法往往在跨數(shù)據(jù)、跨模態(tài)時失效。

  第三個驗證是推理時間上的Scaling Law。推理時間越長,模型性能越容易提升。這個可能是在單一模型Scaling Law放緩的節(jié)奏下,帶來的又一個新的增長引擎。

  可以說這三次驗證從根本上明確了算力資源在整個鏈路中所扮演的核心商業(yè)角色。

  這里還有一個關(guān)鍵點,模型本身的架構(gòu)和設(shè)計直接決定了計算資源的配置和使用。算力、模型和應(yīng)用這三大要素中,大模型是貫穿上下的核心紐帶,既牽動著上層應(yīng)用的發(fā)展,也影響著下層計算資源的配置。而計算資源的優(yōu)化和投入,則是決定整個商業(yè)模式能否實現(xiàn)閉環(huán)的關(guān)鍵所在。

  李根:我也是想要進(jìn)一步問一下更賺錢的問題,我們大眾對于AI的感情好像是很復(fù)雜的,比如像OpenAI最初成立的時候,有幾個富豪可以拍10億美金在那說你們啥也不用干,你們就研究AGI就完了,不用考慮任何的事情。后來等這個事情成了,我們很多人就會追問說,中國為啥沒有OpenAI這樣的公司?但是可能過了兩年又會追問說,你們燒了那么多錢,究竟賺錢了嗎?究竟能不能賺錢?所以我感覺當(dāng)前階段,如果像您講的很多基礎(chǔ)設(shè)施都成熟了,那在2.0的階段,我們是不是有更多商業(yè)化的進(jìn)展可以出來?或者對于商湯而言,有沒有商業(yè)化的進(jìn)展是可以分享的?

  徐立:商湯作為上市公司發(fā)展技術(shù)的同時還有一個重要責(zé)任就是,對股東的負(fù)責(zé)。所以在走向AGI的過程中,要有成熟的商業(yè)化的變現(xiàn)模式。

  對于商湯來講,我們通過“三位一體”的方式將計算成本降得更低,這部分很挑戰(zhàn),在于必須結(jié)合應(yīng)用、模型和算力,但是一旦迭代完成,就能獲取足夠的市場份額,實現(xiàn)客觀商業(yè)回報。因為當(dāng)前無論是模型服務(wù)還是應(yīng)用服務(wù),最后都等價于計算資源的變現(xiàn)。而在中國,資源變現(xiàn)的商業(yè)模式相對更加成熟。

  關(guān)于商業(yè)模式,還有一個有趣的現(xiàn)象:為什么在海外,一個標(biāo)準(zhǔn)化的軟件可以長期保持固定價格,而在國內(nèi)則需要加入更多服務(wù),甚至進(jìn)行貼身化的定制開發(fā)?這其實也是認(rèn)知上的差異。如果想在中國真正做好商業(yè)化變現(xiàn),就必須深刻理解這一市場的普遍認(rèn)知。認(rèn)知的改變也有路徑依賴。如果行業(yè)認(rèn)知與設(shè)計的商業(yè)模式不能匹配,形成商業(yè)文化上的差異,就會導(dǎo)致商業(yè)路徑不清晰。

  大眾被打臉的時刻就形成了超級時刻

  李根:確實很感慨,因為我們好像第一次經(jīng)歷AI這樣的技術(shù)原創(chuàng)周期,就是完全不是一個舶來品狀態(tài)的時候,沒有配套的整體的資源,以前更多還是靠著應(yīng)用為核心或應(yīng)用為大頭的一個商業(yè)模式變現(xiàn)。我發(fā)現(xiàn)在 “三位一體”中提了大裝置、大模型,沒有提大應(yīng)用或者是超級應(yīng)用,這是有什么思考嗎?

  徐立:大裝置是一種算力集約式建設(shè),其重要性在于只有通過集約化建設(shè),才能實現(xiàn)訓(xùn)練和推理的彈性支持。而大模型則體現(xiàn)了其通用性的特點。

  至于應(yīng)用,本身并沒有大小之分,而是通過“小見大”的方式逐步成長。因此,單純以應(yīng)用或場景來判斷其早期規(guī)模比較困難。超級應(yīng)用從來不是一開始就打造出來的,而是從細(xì)分的小切入點起步,逐漸演化而成。

  直到今天,中國的超級應(yīng)用依然主要集中在解決國計民生中的小的垂直問題,通過這些小點的突破,逐步形成平臺化的優(yōu)勢。

  李根:但我也觀察到您之前提了一個“超級時刻”的概念,我們大眾來判斷的話,什么事情發(fā)生可以確認(rèn)這個超級時刻到來了?

  徐立:超級時刻的關(guān)鍵在于大眾對這件事情的認(rèn)知發(fā)生了重大轉(zhuǎn)折。事后回看,這些時刻往往成為技術(shù)或理念發(fā)展的轉(zhuǎn)折點。

  我一直認(rèn)為超級時刻與應(yīng)用是強(qiáng)綁定的關(guān)系。例如,ChatGPT之所以成為超級時刻,是因為過去很多人認(rèn)為AI在自然語言處理上還很遙遠(yuǎn)。但ChatGPT突然出現(xiàn),突然超越了圖靈測試,讓大眾認(rèn)知發(fā)生了劇變。同樣,AlphaGo之所以是超級時刻,是因為它真正推動了人類去探索世界的本源。

  回想AlphaGo的時刻,我還有些感慨。AlphaGo對戰(zhàn)李世石時的第二盤第37手,當(dāng)時人類包括圍棋專家普遍認(rèn)為這是一步臭棋,但AlphaGo卻認(rèn)為這是它整盤棋的勝負(fù)手,事實證明機(jī)器是對的。這是人類歷史上第一次有一臺機(jī)器超越所有人的認(rèn)知,給出了正確的答案。

  這個時刻啟發(fā)了一個問題:我們是否可以通過類似的方式去探索世界的本源?這也為后來的“AI for Science”奠定了基礎(chǔ)。

  今天的o1就是AlphaGo方法的一種延續(xù)。我后來覺得“超級時刻”可以換個詞來形容,那就是“打臉時刻”。在人類被徹底打臉的瞬間,超級時刻就誕生了。例如,iPhone時刻:當(dāng)時所有人都認(rèn)為手機(jī)必須要有鍵盤,但iPhone的出現(xiàn)顛覆了這一認(rèn)知。

  這種認(rèn)知上的反轉(zhuǎn)、升級,正是超級時刻的典型特征。

  李根:你剛剛講這個超級時刻的時候,我是覺得非常感慨的,因為想到AlphaGo比賽的時刻,37手那一天,當(dāng)時我就站在演播室,請了嘉賓而且是圍棋國家隊的總教練,37手下出來的時候,我記得非常深刻,教練說你看不會下棋吧,機(jī)器畢竟是機(jī)器。但等到后來第一局結(jié)束了之后,李世石認(rèn)輸了,就結(jié)束了。當(dāng)時國家隊教練因為剛從外地回來,他要打開他的打車軟件,他找不到打車軟件,他整個大腦空白了。那個時候我不懂圍棋,但我知道可能對于他們而言是一個職業(yè)性的打臉時刻,可能有點像失業(yè)時刻。

  徐立:所以我在想,通用人工智能時代,不管是當(dāng)前的語言模型還是垂直行業(yè)的應(yīng)用,可能都只是一個前奏。隨著這些技術(shù)的發(fā)展,我們對于世界本質(zhì)的理解以及基礎(chǔ)科學(xué)探索的突破,可能會迎來通用人工智能的“超級時刻”,或者說屬于這個時代的“37手”。那將是真正意義上的人類的“打臉時刻”。

  李根:對,可能37這個數(shù)字會跟42一樣載入AI發(fā)展的時刻。徐立博士,您分享了很多非常精彩的認(rèn)知,但我還有一個最后的問題,可能需要您脫下上市公司的董事長、CEO的帽子,戴上您科學(xué)家的帽子來回答這個問題。我們現(xiàn)在都要面向AGI,或者是我們都在談?wù)揂GI,那在您心目中,您覺得AGI是什么?它的實現(xiàn)可能有哪幾個階段?我們現(xiàn)在處于它的哪個階段?

  徐立:人工智能已經(jīng)發(fā)展了大約70年,至今仍未完全跳出圖靈的定義。圖靈在1950年提出了一個問題:“機(jī)器會不會思考?”在給AI下定義時,圖靈并沒有給出明確的定義,而是采用了一種判別式的方法:如果無法區(qū)分對面是人還是機(jī)器,就認(rèn)為它具有智能,這就是著名的圖靈測試。

  直到今天,AGI的定義邏輯仍然類似:我區(qū)分不開它到底是人干的還是機(jī)器干的,它就叫AGI。只不過,早期的圖靈測試往往針對單一任務(wù),而現(xiàn)在的AGI測試擴(kuò)展到了更多任務(wù),更廣泛的應(yīng)用。所以,人類在這一過程中依舊將智能的定義局限于與人的比較,有些狹隘。

  有一篇著名的文章叫《大象不會下象棋》,這是1990年由MIT的一些研究者寫的。他們“嘲笑”人工智能研究過于模擬人類,比如研究下棋這種特定能力。大象很聰明,也有智能,但它不會下象棋——那你研究的究竟是智能本身,還是僅僅研究“下棋”這個具體問題?這表明我們對于智能的定義過于以人類為中心。AGI的定義也顯得self-oriented,因為我們始終將人類視為衡量智能的核心標(biāo)準(zhǔn)。

  然而,未來智能的發(fā)展路徑未必是線性的,甚至可能與現(xiàn)在的方向完全相反。真正通往廣泛智能的路線,很可能不會局限于人類的視角和能力。但這并不妨礙我們利用現(xiàn)有技術(shù)推動當(dāng)下的進(jìn)步,實現(xiàn)一個百花齊放的時代。

關(guān)注同花順財經(jīng)(ths518),獲取更多機(jī)會

0

+1
  • 創(chuàng)維數(shù)字
  • 實益達(dá)
  • 電光科技
  • 國星光電
  • 福龍馬
  • 萬豐奧威
  • 同星科技
  • 中百集團(tuán)
  • 代碼|股票名稱 最新 漲跌幅