GOGOGO高清国语完整,GOGOGO免费高清完整版,GOGOGO国语版免费播放,GOGOGO免费国语完整版,GOGOGO免费完整国语版,GOGOGO日本高清国语完整

孫凝暉:關于信息基礎設施的思考

孫凝暉

2025年2月20日

一、信息基礎設施的演變

基礎設施是人類社會發(fā)展的基石。人類社會經歷了農業(yè)時代、工業(yè)時代、信息時代,如今來到了智能時代,這四個時代分別孕育出了關鍵的基礎設施,滿足了人類對資源的基本需求,也反映出人類對資源進行抽象的能力(如圖1)。農業(yè)時代孕育了交通基礎設施,集裝箱這個人造物成為實現貨物全球交通運輸的關鍵抽象;工業(yè)時代孕育了能源基礎設施,電力是人類發(fā)明的一種二次能源,作為標準化能源的抽象,成就了能源轉換、儲存、傳輸、使用的能源基礎設施;信息時代孕育了信息基礎設施,網頁作為數據的抽象,成為信息全球共享的主要載體。當前智能時代無論是大數據、還是深度學習以及人工智能大模型,都是構建在數據空間之上的,新的數據基礎設施正在形成過程中,其中數據流通、智能算力和AI模型與網絡基礎設施日益融合,將催生新的抽象。


圖1:關鍵基礎設施的演進圖

信息時代最大的變化是人類構建了賽博空間(Cyberspace),它可以簡單地被看成一個三層架構(如圖2)。第一層是計算機空間,其核心目標是實現對計算設備的互聯,以及對人類符號化數理知識的加工處理;第二層是信息空間,其核心目標是實現對網頁的互聯,以及對人類社會向網絡空間映射的各類數字化信息的加工處理;第三層是數據空間,其核心目標是實現對以數據為核心的人工智能要素的互聯,以及對數據進行分析、壓縮等深度加工以生成模型。

信息基礎設施是賽博空間中基礎的公共服務平臺。


圖2:賽博網絡空間的演進

第一層計算機空間的核心功能是對知識的加工處理(如圖3)。自20世紀60年代起,經歷了四個階段。初始階段為大型計算機的互聯;第二個階段是個人計算機的互聯,個人計算機的普及促進了機與機之間的緊密聯系;第三個階段,智能手機的興起進一步推動了人與人之間的廣泛互聯;在第四個階段,各種物端設備被納入互聯網絡,實現了人、機、物的全面互聯。在計算機空間,信息處理的主要對象為人類符號化的數理知識,超級計算機作為加工知識的核心裝備,其基礎設施化就是網格計算。在計算機空間的發(fā)展初期,美國國防部的阿帕網(ARPANET)計劃成為率先推動者。


圖3:計算機空間

第二層信息空間的核心功能是對信息的加工處理(如圖4)。自20世紀80年代起,經歷了三個階段,最初是網頁的靜態(tài)互聯,隨后是信息流的動態(tài)連接,未來還要實現對元宇宙中數字人的連接,實現賽博空間中信息的無縫互聯互通。在信息空間,主要對象可以歸納為人類社會活動向數字空間的投影,數據中心計算機作為信息加工處理的核心裝備,其基礎設施化就是云計算的基礎設施。在信息空間的發(fā)展初期,美國的信息高速公路計劃是率先推動者。


圖4:信息空間

第三層數據空間的核心功能是模型的加工處理(如圖5)。自2010年起,大數據分析與機器學習技術使得數據的廣譜關聯成為可能,GPT大模型的出現則促進了算力的互聯互通,未來,隨著成千上萬模型的涌現和AGI通用人工智能的出現,將實現模型與智能體間的廣泛連接。當前,計算資源的進一步基礎設施化是算力網,使得20世紀60年代超前提出的技術理念Utility Computing正逐漸變成現實。在數據空間的發(fā)展初期,中國在這一輪信息技術變革中沒有落后,人工智能2.0、東數西算工程、數據流通利用基礎設施等國家計劃,使得中國成為率先推動者。


圖5:數據空間

信息基礎設施的變化,主要在于智能三要素——算力、數據、算法的基礎設施化,以及對網絡基礎設施帶來的影響。下面從行動計劃、終端、超級入口、通信網絡、互聯網絡、計算、數據、電力等八個關鍵特征分析信息基礎設施的演變規(guī)律(如圖6)。

行動計劃。計算時代以“機”為中心,在ARPANET政府行動計劃的推動下,實現了計算機全球連接;互聯網時代以“人”為中心,在信息高速公路政府行動計劃的推動下,實現了信息資源全球共享;智能時代以“物和數”為中心,主要目標是實現智能三要素即算力、算法和數據的公用事業(yè)化(utility)。計算所在2018年組建網絡計算創(chuàng)新研究院時,制定了信息高鐵計劃,有組織地開展這方面的科研工作,并在南京麒麟區(qū)建設了信息高鐵綜合試驗場。

終端。計算時代經歷了從啞終端向個人計算機(PC)的轉變;互聯網時代則見證了從功能手機向智能手機的演進;智能時代的終端形態(tài)主要包括智能物端和具身計算機,其中智能硬件、可穿戴設備、VR設備等屬于智能物端,智能機器人、人形機器人、自主無人系統(tǒng)等屬于具身計算機。

超級入口。計算時代訪問信息基礎設施的主要入口是操作系統(tǒng);互聯網時代訪問信息基礎設施的主要入口是瀏覽器(browser)和移動應用程序(APP);智能時代訪問信息基礎設施的新入口還沒有形成,智能體(Agent)可能是模型基礎設施的使用入口,模型工廠(AI Foundry)可能是算力和數據基礎設施的一種超級使用入口。

通信網絡。計算時代的通信基礎設施主要是光網絡,提供了骨干級數據傳輸;互聯網時代的通信基礎設施主要是WiFi網和蜂窩通信網,提供了終端的廣泛接入;智能時代的通信基礎設施主要目標是物端的泛在連接,其中物聯網連接了多種多樣的傳感器,工業(yè)通信網提供了工業(yè)環(huán)境里有保障的連接,衛(wèi)星通信網則提供了地球空間范圍內全覆蓋性連接,這些共同保障了信息系統(tǒng)對物理世界的全面感知與實時操縱。

互聯網絡。計算時代的計算機網絡以IP網絡為核心,技術策略是地址驅動;互聯網時代構造了完整的全球互聯網,技術策略是盡力而為,出現了域名服務、P2P網絡、CDN等眾多網絡基礎設施技術;智能時代的網絡基礎設施還在發(fā)展過程中,確定與彈性傳輸的技術策略逐漸成為共識,在網絡的控制面、策略面需要有新的路由機制?;ヂ摼W絡需要增加新的特性以適應數據流通、分布式AI算法、算力服務化的需求。安全是一項伴生需求,在信息基礎設施的發(fā)展過程中,同步地發(fā)展出了網絡連接安全、信息內容安全、智能算法安全等基礎設施。

計算。計算時代的算力中心是超算中心,它的公用事業(yè)化是網格計算;互聯網時代的算力中心是邊緣計算節(jié)點和互聯網數據中心(IDC),它的公用事業(yè)化是公有云;智能時代的算力中心則變?yōu)橹撬阒行?,算力(超算、智算、通算)的全面公用事業(yè)化、服務化就是算力網,云計算變成算力網中的一個算力站,算力網需要有新的全局命名機制,以及超越容器的新資源抽象(如任務閉包)。前兩個時期均未形成明確的基礎設施調度體系,直至智能時代出現了對全局調度中心的強烈需求,包括區(qū)域一體化算力網、全國一體化算力網的調度中心、以及算力與網絡、算力與電力、算力與數據、算力與模型等融合調度能力。

數據。計算時代沒有形成數據基礎設施,數據被結構化抽象成文件、記錄后,組織成文件系統(tǒng)、數據庫和數據倉庫,在局域環(huán)境中被加工利用;互聯網時代誕生了萬維網這樣的數據基礎設施,數據被結構化抽象成為網頁,組裝成網站,再通過WWW協(xié)議在廣域環(huán)境中關聯與加工利用,并誕生了如Web搜索引擎、推薦引擎這樣的超級網站,也是應用層基礎設施。智能時代正在建立數據流通利用基礎設施,服務大數據分析、人工智能等新型應用;文件、網頁、數據庫記錄等數據被結構化抽象成數據件(Dateware),再通過數據工程組裝成數據場,數據場構建于同一個組織內,權屬可以通過行政手段認定,在這里就可以被加工利用了;進一步,基于多種可信流通協(xié)議(如數聯網、IDS、數據登記、數據交易所)在開放環(huán)境中構建可信數據空間,實現私域數據在公域環(huán)境中的共享復用、廣譜關聯與可信流通,進行深度加工利用。數據件的基本標識可作為數據空間的全局命名信息。

模型是智能時代出現的一類新型數據,未來將出現模型基礎設施,它是智能三要素中算法的公用事業(yè)化。隨著人工智能技術的發(fā)展,模型基礎設施從Hugging Face形式,演進至基礎大模型,再演進到模聯網。模聯網類似于企業(yè)信息化的SOAP等服務計算技術,通過對模型的操作與互操作協(xié)議,將多種多樣的模型連接起來,為智能體等智能任務提供服務。

電力。前兩個時期電力基礎設施主要體現在UPS供電、風冷、液冷、相變冷卻等機房基礎設施上;智能時代則催生了綠電直供,大幅降低電力成本。


圖6:信息基礎設施的演變

信息高鐵計劃設想的終極目標是:在智能時代,信息基礎設施達到與工業(yè)時代的物流、電流、信息流等基礎設施相仿的低成本水平,大幅降低全社會在AI賦能的應用層創(chuàng)新的門檻,使得全球發(fā)達經濟體外的60億人能從中獲益。

當前可以從以下八個方面,降低構建信息基礎設施的成本:1)采用28-12nm成熟工藝制造芯片,相較于7-3nm先進工藝,成本降低了一個數量級,再通過芯粒集成技術彌補了芯片集成度的不足;2)推動開源芯片的廣泛使用,顯著降低了CPU和NPU處理器的設計成本,使得場景定制芯片的設計門檻大幅降低;3)推動開源軟件如操作系統(tǒng)、AI框架等的發(fā)展,顯著降低了智能系統(tǒng)軟件棧的成本;4)中國在通信與互聯網基礎設施建設方面已取得了低成本優(yōu)勢,當前亟需提升其安全性與網絡彈性;5)推動數據要素化與數據流通利用技術,有效降低了數據的全社會使用成本;6)推動區(qū)域一體化算力網、全國一體化算力網和模型工廠等全局共享技術的發(fā)展,顯著降低AI應用的算力資源成本與人力資源成本;7)普及DeepSeek等開源的基礎大模型,性能與國際頂尖大模型相媲美,成本呈數量級降低,促進場景定制模型的普及,以及大模型推理的私有化部署;8)提高采用綠色電力的比例,使算力中心電價降低至化石能源的三分之一。

二、信息高鐵綜合試驗場

信息高鐵濃縮了我們對智能時代信息基礎設施的認知,建設信息高鐵綜合試驗場,對形成信息基礎設施的中國技術體系能起到十分重要的作用。這些年信息高鐵行動計劃的實踐為信息基礎設施增加了幾個新的技術特征:低熵高通量(算力)、全局調度、模型工廠(超級入口),并在信息高鐵綜合試驗場上進行了部署與驗證。

我國對自然科學領域服務科學發(fā)現的大科學裝置給予了高度重視,促進了基礎學科的繁榮發(fā)展,然而在技術發(fā)明領域的工程技術試驗平臺方面,長期缺乏足夠的關注。對比一下美國在這方面的布局情況,自2000年以來,美國持續(xù)構建服務信息技術創(chuàng)新的試驗平臺,如emulab、CloudLab、GINI等,為原始性創(chuàng)新提供了豐富的土壤。歷史證明,美國通過前瞻性布局技術試驗平臺推動了美國在超級計算機、互聯網、云計算、網格計算、分布式計算、星鏈等技術上的領先。

信息高鐵綜合試驗場目前已經部署了九大試驗場(如圖7),布局在算力層、網絡層、數據與應用層,分別是:國產算力芯片試驗場、算力并網試驗場、空天地無線接入試驗場、CENI未來網絡試驗場、全國一體化算力網調度試驗場、端邊云低熵計算試驗場、合肥可信數據空間試驗場、模型工廠試驗場、鄭州/南京城市一體化算力網試驗場。


圖7:信息高鐵綜合試驗場布局

三、算力

為什么算力會在智能時代熱起來?簡單對比一下互聯網時代和智能時代的一個代表性應用對算力的需求,可以得到答案。一次典型的用戶搜索,對計算資源的消耗在G量級(即10的9次方),而執(zhí)行一次典型的LLM推理,對計算資源的消耗則上升至T量級(即10的12次方)。由此可見,LLM推理過程對計算資源消耗相較于用戶搜索高出三個數量級,算力的重要性凸顯出來。對計算資源的顯著需求,成為制約人工智能技術普及到互聯網應用那樣程度的關鍵因素。盡管DeepSeek顯著降低對計算資源的需求接近一個數量級,但相較于互聯網應用,仍存在巨大差距。

算力的提法是借鑒電力,那么計算性能等同于算力嗎?我們對算力這個術語的內涵,以及對應的英文單詞Computility進行了闡述(見《中國計算機學會通訊》,2022年12月)。人們對計算能力的關注從早期單一的計算速度變到計算性能,關注的維度增加了,再演進到算力,內涵更加豐富。算力的簡單理解是計算性能的通俗化表述(從算力產生的視角),其內涵拓展為消耗計算資源產生效益的能力(從算力消耗的視角),其本質是計算資源的共享與服務化。電力作為一種二次能源,由發(fā)電、輸電、變電、配電及用電等環(huán)節(jié)構成了一個能源的生產與消費系統(tǒng)。類似地,算力也可視為計算資源的一種二次封裝,而算力網則是由算力站、算力并網、算網融合調度、算力任務編排、算力數據傳輸及算力終端等環(huán)節(jié),共同組成了計算資源的生產與消費系統(tǒng)。

計算成為算力需要核心三要素:計算二次封裝、算力基礎設施化、算力終端。

第一個核心要素,計算的二次封裝,涉及對計算資源、計算架構、計算消耗的封裝技術。計算資源的封裝技術包括容器、任務閉包(task closure)、算力池等;計算架構的封裝技術包括跨平臺虛擬機JVM、CVM等;計算消耗的封裝技術包括超算、智算、通算的算力單一計量方法(如BOPs),算力供給能力的量化單位(算力的“瓦”),用戶端算力消耗的量化單位(算力的“度”)。

算力網中計算的基本抽象將會發(fā)生哪些改變?如圖8所示,算力基本抽象包括原子化編排、資源空間管理、算力資源封裝三個層次,按照技術的演進,算力基本抽象從<線程,進程,CPU時間片>,發(fā)展到<微服務,容器,虛擬機池>,再發(fā)展到<任務閉包,網程,算力池>。在IT 1.0的大型主機階段,并行與分布式應用是在線程抽象的基礎上構建,進程是對計算資源分配與調度的基本單元,可以跨CPU時間片運行;在IT 2.0的云計算階段,實現了計算能力的虛擬化,微服務是云原生應用原子化編排的抽象,容器是對基礎軟硬件資源的封裝,云應用可以跨虛擬機運行;在IT 3.0的算力網階段,對全網計算資源要用“一臺大電腦”的思想提供新的抽象,任務閉包可以在端邊云異構平臺上流動和運行;網程是對端上的物理機、邊上的虛擬機、云上并網的算力池,進行統(tǒng)一封裝,形成一個智能應用的私有資源空間;算力網上的異地、異屬、異構的算力資源并網后,形成可一體化調度的算力池。


圖8:計算的基本抽象演變

第二個要素,算力基礎設施化,如圖9所示,類比于電力的源網儲荷,可以依次分解成四層:算力站、算力并網與算力數據輸運、算網融合調度與算力任務編排、算力終端。


圖9:算力基礎設施化結構圖

第三個要素,算力終端,這部分還沒有收斂,使用算力的超級入口可能是AI4S模型工廠、AI終端、智能物端等。智能手機(移動終端)是云計算得以普及化的基石,同理,人工智能終端(算力終端)將成為算力服務普及化的基石。

四、數據空間

智能時代,數據發(fā)生了什么根本改變?

數據是一種客觀存在(being),一直都是信息技術的關鍵要素,在智能時代,它被賦予了資源要素與價值加工兩重新屬性。資源要素屬性是從經濟學角度,強調作為經濟要素數據的流通性,內容涵蓋數據匯聚、處理、流通、應用、運營、安全保障等多個方面(參考“數據20條”政策)。數據要素化是數據生命周期不斷外延的必然結果。如圖10所示,數據的生命周期逐漸從單個應用,外延到組織,最終外延到整個社會。在第一個階段,數據存在于特定的業(yè)務信息系統(tǒng)的邊界內,產生了多種數據庫;到了第二個階段,數據需要在一個組織的企業(yè)信息系統(tǒng)的各個業(yè)務系統(tǒng)中共享流動,產生了數據倉庫、數據中臺技術;到了第三個階段,數據存在于社會化信息系統(tǒng)中,需要最大范圍地共享與流動,產生了數字對象、數據登記與數據交易所、數據件等技術。


圖10:數據生命周期演化圖

價值加工屬性是從IT技術角度,強調對數據的深度加工與增值利用;智能大模型就是數據的百煉成鋼,數據加工的需求涉及加工組件(如數據標注、數據件)、加工工藝(如廣譜關聯分析、深度學習算法)、加工動力(如算力網)等。

兩個屬性由此催生了新的技術體系,在數據“供得出”方面催生了物聯網(數據獲?。?、數據標注等;在數據“流得動”方面催生了數聯網、可信數據空間等;在數據“用得好”方面催生了數據件與數據場、AI-ready數據工程等。

在智能時代,數據的組織、流通、使用都發(fā)生了改變。

首先,智能時代數據是如何被組織起來的?不同時代的數據組織體系如圖11所示。在計算時代,數據被抽象成文件,組織成文件系統(tǒng),在網絡文件系統(tǒng)中實現共享。在網絡時代,數據被抽象成網頁,組織成網站,海量網頁被搜索和推薦引擎進一步重構成信息流,最終在萬維網中實現了信息的全球共享。在智能時代,我們的構想是將數據件定義為數據的最小抽象單元,類似于鋼鐵加工中的鑄件,它是鐵礦石經過粗加工后形成標準化產品;數據場是數據件匯集的組織形式,在數據場中可以便利地進行數據深加工;在此基礎上構建可信數據空間,支持在廣域范圍內進行私域數據的流通利用;在更高的監(jiān)管層,形成國家數據空間,在此需要考慮體現出國家主權屬性,如管轄權與治理權;進一步構建國際數據空間,依據國際社會形成的規(guī)范,實現數據的跨境流動。


圖11:不同時代數據體系的構成

如圖12所示,對比分析了國家主權屬性在網絡空間與數據空間的不同體現。在對外防衛(wèi)方面,網絡空間需要網絡關防系統(tǒng),數據空間需要數據跨境流通關防系統(tǒng)。對內治理可分成物理層、邏輯層以及內容層。在物理層,網絡空間涉及網絡基礎設施的建設與運營,數據空間則關注數據樞紐、行業(yè)數倉等數據基礎設施的建設與運營;在邏輯層,網絡空間國家承擔了IP地址分配、網站備案等管理職責,數據空間則涵蓋了數據登記、數據交易所、戰(zhàn)略數據儲備等管理職能;在內容層,網絡空間國家負責互聯網內容的監(jiān)管,數據空間則著重于數據安全的治理,如基礎大模型預訓練數據的安全治理。


圖12:國家主權屬性:網絡空間 vs 數據空間

其次,智能時代的數據是如何流通利用的?相比于互聯網時代的信息全球共享,智能時代的數據流通更加關注可信與價值釋放模式。用于數據流通的可信數據空間應歸納成若干基本型,其定義可由<基本單元、空間結構、價值釋放模式>三個維度進行界定。類比地,原子場、電磁場、引力場等物理場由<基本粒子或物體、力的相互作用、運動規(guī)律>三個維度界定了基本型。可信數據空間分為四個基本型,分別是:互聯互操作型、可用不可見型、可信交換型、聚合加工型。

第一種類型為互聯互操作型(如圖13),其典型技術體系為數聯網,可用<數據對象、數聯網協(xié)議、Web信息流通模式>三元組歸納,該體系的核心思想是通過數據的相互聯結、相互操作,實現數據價值的釋放。第二種類型為可用不可見型(如圖14),其典型技術體系為數據金庫,可用<數據元件、數據金庫、銀行資金流通模式>三元組歸納,該體系的核心思想是通過集中式監(jiān)管,實現對高價值數據的控制,支持數據的可用不可見。第三種類型為可信交換型(如圖15),其典型技術體系為IDS,可用<數據集、IDS連接器、土地/房屋流通模式>三元組歸納,該體系的核心思想是通過一個具有公信力的組織或協(xié)會,實現數據的可信交換,數據交易所也屬于這種類型。第四種類型為聚合加工型(如圖16),其典型技術體系為數場,可用<數據件、數據場、圖書館知識流通模式>三元組歸納,該體系的核心思想是數據加工方主導數據流通,以類似于網絡主播的商業(yè)模式實現廣域范圍內數據的有序匯聚,支撐數據的深加工。


圖13:互聯互操作型


圖14:可用不可見型


圖15:可信交換型


圖16:聚合加工型

智能時代數據的使用方式主要是機器學習與大模型訓練,需要發(fā)明一套數據件系統(tǒng)將原始數據變成AI-ready數據。數據件(Dataware)是數據流動與使用的基本單位,通過對異質多源數據的語義、結構、基本操作等進行標準化封裝,使得數據本體與數據主體、數據應用“解耦”,讓數據在不同使用主體、不同應用系統(tǒng)間可信流轉。在云計算中,容器(docker)是對應用程序及其資源依賴的封裝,讓算法可以在不同平臺上一鍵運行,同理,數據件讓數據可以在不同的機器學習平臺上被方便地加工利用(如圖17)。


圖17:容器(docker)和數據件(Dataware)

以AI大模型精調場景為例,通過數據件構造IDE實現預訓練、指令微調、向量數據件的快速構造與組裝,被大模型訓練直接調用,可大幅簡化傳統(tǒng)數據工程的工作量(如圖18)。


圖18:AI-ready數據件組裝工具

五、模型工廠

智能體(Agent)是模型基礎設施的使用入口,模型工廠(AI Foundry)則是使用算力和數據基礎設施來加工模型、部署智能應用的超級入口。

DeepMind公司研制的AlphaFold系列軟件,在已經研究了70年的“蛋白質折疊”問題上,作出了突破性貢獻,其領導者Hassabis 和 Jumper獲得了2024年的諾貝爾化學獎。AlphaFold的獲獎代表了科研范式的重大改變,是融合大模型、大算力、大數據、大團隊服務科學研究的典范。那么,在科研領域如何支撐起成千上萬個AlphaFold-Like團隊呢?AI賦能行業(yè)應用如何達到互聯網賦能那樣的普及程度?這就需要為智能時代信息基礎設施提供一個使用算力、算法、數據來加工模型的低門檻通用入口,模型工廠就是這樣的一個平臺。

模型工廠概念的提出借鑒了芯片代工廠在集成電路產業(yè)的定位與功能。芯片產業(yè)模式的變遷如圖19所示,它從設計-制造一體化模式,演變到無制造廠(Fabless)模式(即Foundry),再演變到今天的集成芯片模式。其中,Foundry即芯片代工廠的意思,為芯片設計的普及起到了關鍵作用,促使了英偉達、高通等芯片企業(yè)的崛起。借鑒芯片產業(yè),大模型的開發(fā)也可以分割成兩個生態(tài):場景與業(yè)務相關的大模型設計生態(tài),和智能計算技術相關的大模型代工廠生態(tài)。


圖19:芯片產業(yè)模式的變遷

在當前人工智能產業(yè)中,設計-制造一體化的IDM模式占據主導地位,國家與地方政府提供的大模型訓練基礎設施仍處于算力供應的初級階段,商湯AI云、百度千帆等平臺正逐步向大模型代工廠的角色邁進。當人工智能產業(yè)孕育出類似于芯片領域臺積電、中興國際這樣的代工企業(yè)時,將催生出眾多專注于大模型設計的創(chuàng)新型企業(yè),專注于用好大模型的行業(yè)應用也會更加繁榮。相較于IDM企業(yè),芯片代工廠擁有各自獨特的優(yōu)勢,例如豐富的IP資源、多類型且極致優(yōu)化的生產線、物理設計服務、制造產能、成品率等。同理,每個大模型代工廠也需構建自身的競爭優(yōu)勢,例如數據AI-ready能力、高效訓練或推理流水線、彈性或輕量化部署能力、智算中心的性價比、算力網調度能力、豐富的Build-in模型庫、開源模型儲備庫等(如圖20)。國家數據流通利用基礎設施在這個生態(tài)中可以起到為各行各業(yè)提供大模型代工所需的基礎材料的作用。


圖20:芯片代工與大模型代工

模型工廠的參考架構如圖21所示,算力網是基礎底座,功能區(qū)主要包括AI-ready數據件、AI訓推平臺、模型集市、智能應用等。圖22給出了AI4S模型工廠更細化的架構,底層是模型、數據、算力三個基礎設施,中間開發(fā)環(huán)境層包括五條AI生產流水線,上層是科學智能的三類用戶接口。目前,AI4S模型工廠系統(tǒng)已經開發(fā)了七個子系統(tǒng),包括:AI-ready數據件、高效訓推平臺、基于算力統(tǒng)一度量的算力優(yōu)選、模型集市、算力網云函數開發(fā)平臺、多智能體開發(fā)框架、智能應用服務平臺。


圖21:模型工廠的參考架構


圖22:AI4S模型工廠架構

六、智能計算機

智能時代的終端包括智能硬件、可穿戴設備、VR設備等智能物端,智能機器人、人形機器人、自主無人系統(tǒng)等具身計算機,以及位于云端的智能超算,它們可以統(tǒng)稱為智能計算機。

智能計算包含三個緊密耦合的核心要素:人工智能范式、核心智能應用、智能計算架構。歸納總結一下智能計算機的發(fā)展規(guī)律,在人工智能發(fā)展的初期(AI 1.0),符號主義范式占據主導地位,應用以專家系統(tǒng)為代表,曙光高性能計算機(HPC)是計算架構上的代表性成果,數值計算、數理邏輯和數據庫等傳統(tǒng)應用亦可視為屬于符號主義技術路線。深度神經元網絡出現后,連接主義范式成為主流(AI 2.0),深度學習與大語言模型成為核心應用,寒武紀神經網絡處理器(NPU)是智能計算架構上的代表性成果。未來,當AGI來臨時(AI 3.0),智能計算的核心要素三元組該如何演變呢?我們猜測,行為主義范式可能成為主要特征,具身智能應用與科學發(fā)現的智能范式將成為應用焦點,機器記憶機有望成為智能計算架構上的代表性成果。

李德毅院士在他的《認知機器如何創(chuàng)造》一書中提出了機器認知的四種基本模式(如圖23),他認為:“在人類歷史長河中,使用較多的是記憶驅動的經驗模式(OOA),當人們對事物有了一定的認知,就能夠運用知識對事物作出判斷和推理,即運用知識驅動的推理模式(OODA),解決實際問題。人類的高級智能活動,無論是創(chuàng)造還是發(fā)現,都需要聯想驅動的創(chuàng)造模式(OOCA)和假設驅動的發(fā)現模式(OOHA),這也是社會不斷前進的真正動力。人類記憶是四種模式的共同交集。”


圖23:機器認知的四種基本模式

再看一下人類是如何產生和加工記憶的。人類的記憶(memory)是一種信息加工系統(tǒng),它對信息進行編碼(encoding)、存儲(storage)和提?。╮etrieval),記憶是形成人們的思維和行為的原料。Richard Atkinson與Richard Schiffrin率先提出記憶的三階段模型,將記憶過程劃分為三個主要階段:感覺記憶(持續(xù)數秒)、工作記憶(持續(xù)20至30秒)以及長時記憶(長期)。信息都必須先經過感覺記憶和工作記憶的加工,最終進入長時記憶。工作記憶在這一模型中扮演著至關重要的角色,它負責信息的臨時處理和操縱。從心理學的視角,Transformer模型正是基于對工作記憶機制的模仿與借鑒。

對人類來說,記憶是十分重要的智能,沒有機器記憶,恐怕也很難創(chuàng)造出通用人工智能(AGI)。大模型只為AI提供了以“概念、常識和事實”為主的語義記憶(知識),完全不具備具身體驗型記憶。為此,需要研究機器記憶機制,基于腦科學關于感覺記憶、工作記憶和長時記憶的三階段記憶模型,針對程序性記憶、時空情景記憶、情感記憶和社會記憶等具身型記憶,構建記憶編碼、存儲和提取的計算模型,實現智能體的自主學習和持續(xù)發(fā)展。機器記憶系統(tǒng)通過積累與整合其與物理世界的交互經驗,形成動態(tài)可擴展的世界模型和認知智能模型。

我們提出一個猜想,未來將會發(fā)明一種行為主義通用計算機——機器記憶機(如圖24)。符號主義下的通用計算機就是傳統(tǒng)計算機,也可以稱之為布爾代數機,其核心組件是CPU和存儲體;連接主義下的通用計算機就是機器學習機,其核心組件是GPU和模型庫;那么行為主義下的通用計算機就是機器記憶機,其核心組件可能是PIM(Processor in Memory)和記憶體。PIM能夠直接對內存中的數據進行原位處理,無需將數據頻繁地傳輸到CPU進行處理,它結合新型存儲器件,可實現數據的即時存儲和即時處理,為智能計算機的發(fā)展帶來革命性的突破。


圖24:機器智能的通用計算機

圖25給出一種具身計算機(EC)的參考架構,主要思想是基于不同的存儲器件支持不同階段的記憶模型,形成一個高效的OODA智能處理流程,并且將符號主義、連接主義、行為主義的技術路線緊耦合起來。智能流的輸入是傳感器,輸出是執(zhí)行器。在認知的OODA環(huán)中,物理感知小模型負責處理短期記憶任務(Observe),深度學習大模型承擔工作記憶的處理(Orient),場景知識提取機制專注于長期記憶的管理(Decide),復雜運動控制則通過定制硬件操作PLC庫實現(Act)。在通用CPU/GPU分區(qū)則運行智能體、數理邏輯、數值計算、數據庫這些基于嚴格的數學符號表達的應用。


圖25:具身計算機參考架構

最后,討論一下對科研發(fā)現的智能范式(第五范式)的認識,它將影響Z級智能超算的技術路線。

我們將科學發(fā)現的五種范式統(tǒng)一到以信息流為流通媒介的OOHV范式上(如圖26)。在觀測階段(Observe),通過觀測儀器進行數據采集;在模擬階段(Orient),借助數值計算與大數據分析技術進行數據處理;在猜想階段(Hypothesis),依托科學家的專業(yè)知識與科學理論進行假設構建;在實驗階段(Verify),則利用科學裝置進行實驗驗證。從信息科學的視角看,科學發(fā)現的過程就是OOHV不斷循環(huán)交換信息的過程。不同的科學范式,就是從不同的切入點進入OOHV循環(huán),科學實驗范式從O1或V進入循環(huán),科學理論范式從H進入循環(huán),科學計算范式和科學數據范式從O2進入循環(huán),分別利用數值計算和大數據分析輔助科學發(fā)現,而在每個環(huán)節(jié)都利用到了信息技術。第五種科學研究范式——科學智能范式,就是通過人工智能技術賦能OOHV的每個環(huán)節(jié),主要用到的AI技術包括:科學數據機器學習、HPC+AI計算、科學猜想大語言模型、具身智能等。


圖26:科學智能范式

AI賦能高度依賴訓練數據,AI4S在OOHV的不同階段的數據來源與AI技術挑戰(zhàn)如圖27所示。在觀測階段(O1),從不同學科的觀察儀器獲取的觀測數據,由AI模型處理,給科研人員使用,技術挑戰(zhàn)是AI模型要跟物理性質錨定;在模擬階段(O2),訓練數據是由數值計算算法生成的,構建AI模型的難點是對高階函數的擬合,AI模型嵌入到HPC程序中;在猜想階段(H),結合學科知識與行業(yè)手冊構建大型語言模型,由科研人員進行推理,技術挑戰(zhàn)是強邏輯鏈,不能出現幻覺;在實驗階段(V),從不同專業(yè)的實驗裝置獲取的傳感數據,由AI模型處理,給控制系統(tǒng)使用,技術挑戰(zhàn)是AI模型要跟數學控制模型耦合。


圖27:科學智能的數據來源? ?

(根據孫凝暉院士在2025年計算所春季戰(zhàn)略規(guī)劃會上的報告整理)

附件:
阿合奇县| 抚远县| 紫阳县| 宁阳县| 阳信县| 隆尧县| 平顶山市| 赤峰市| 平江县| 健康| 绥芬河市| 岐山县| 海城市| 巴里| 无棣县| 屏东市| 洪泽县| 涞源县| 隆昌县| 阿合奇县| 丰台区| 怀来县| 枞阳县| 南皮县| 吴川市| 西安市| 东乌珠穆沁旗| 洞口县| 绥棱县| 宜宾县| 寻乌县| 常宁市| 东乡县| 白玉县| 若尔盖县| 四平市| 通渭县| 彭泽县| 曲阜市| 宁明县| 广州市|