日前,2024中關(guān)村論壇系列活動――第二屆北京人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展大會舉辦。會上,國家發(fā)展改革委黨組成員,國家數(shù)據(jù)局黨組書記、局長劉烈宏受邀發(fā)言,分享了他基于數(shù)據(jù)和算力等角度對人工智能高質(zhì)量發(fā)展的一些思考,并表示下一步,國家數(shù)據(jù)局將把握數(shù)字化、網(wǎng)絡(luò)化、智能化發(fā)展的趨勢,大力推進(jìn)數(shù)據(jù)資源的整合共享和開發(fā)利用。
讓數(shù)據(jù)成為人工智能發(fā)展的催化劑
劉烈宏指出,2023年,以ChatGPT為代表的生成式人工智能在語言對話領(lǐng)域率先取得巨大突破,并陸續(xù)在計算機(jī)、生物、化學(xué)等領(lǐng)域取得顯著進(jìn)展。國內(nèi)諸多企業(yè)相繼推出大模型及相關(guān)的產(chǎn)品,并在互聯(lián)網(wǎng)服務(wù)和行業(yè)數(shù)據(jù)化場景中加速落地,展現(xiàn)出巨大的應(yīng)用前景。2024年2月,視頻生成大模型取得突破性進(jìn)展,引起全球廣泛關(guān)注和討論。大模型技術(shù)具有規(guī)模擴(kuò)展性強(qiáng)、多任務(wù)適應(yīng)性、能力可塑性強(qiáng)的特點(diǎn),并仍在快速迭代、持續(xù)研究,有望成為通用人工智能的可行路徑之一。
劉烈宏指出:“我們要充分發(fā)揮數(shù)據(jù)的基礎(chǔ)資源作用和創(chuàng)新引擎作用,構(gòu)建滿足人工智能發(fā)展需要的數(shù)據(jù)開放、共享、流通、交易的模式,全面提高數(shù)據(jù)資源開發(fā)利用水平,讓數(shù)據(jù)‘供得出、流得動、用得好’,真正成為人工智能發(fā)展的催化劑,推動做強(qiáng)、做優(yōu)、做大數(shù)字經(jīng)濟(jì)?!?
劉烈宏表示,將數(shù)據(jù)作為生產(chǎn)要素,是我國首次提出的重大理論創(chuàng)新,這也為我們搶抓人工智能戰(zhàn)略機(jī)遇奠定了堅實的基礎(chǔ)。大模型驅(qū)動的人工智能發(fā)展對于高質(zhì)量數(shù)據(jù)供給提出了更高要求,數(shù)據(jù)要素的市場化配置和開發(fā)利用顯得尤為重要。我們要充分發(fā)揮數(shù)據(jù)的基礎(chǔ)資源作用和創(chuàng)新引擎作用。
劉烈宏首談人工智能高質(zhì)量發(fā)展
大會現(xiàn)場,劉烈宏分享了他基于數(shù)據(jù)和算力等角度對人工智能高質(zhì)量發(fā)展的一些思考。
高質(zhì)量數(shù)據(jù)是人工智能發(fā)展的根基。
在他看來,高質(zhì)量數(shù)據(jù)是人工智能發(fā)展的根基。人工智能技術(shù)的歷次突破都離不開高質(zhì)量數(shù)據(jù)集的支撐。
回顧歷史,由七萬張手寫數(shù)字圖片組成的數(shù)據(jù)集,促進(jìn)了圖像識別領(lǐng)域的發(fā)展,快速推動了數(shù)據(jù)自動分類和聚類技術(shù)的發(fā)展;由1400萬張各類互聯(lián)網(wǎng)圖片組成的數(shù)據(jù)集開啟了深度學(xué)習(xí)的時代,極大地提升了人工智能感知技術(shù)的能力;由自然語言、編程語言、網(wǎng)絡(luò)數(shù)據(jù)等組成的萬億級多模態(tài)高質(zhì)量數(shù)據(jù)級開啟了大模型時代,人工智能開始具備一定的認(rèn)知交付能力,使得機(jī)器認(rèn)知,甚至通用智能成為可能。
劉烈宏指出,今天數(shù)據(jù)的“質(zhì)”和“量”是推動大模型不斷進(jìn)步的關(guān)鍵。例如,在前提條件不變的前提下,使用更高質(zhì)量的數(shù)據(jù)集來做訓(xùn)練,能使20億參數(shù)量級的模型超過100億參數(shù)量級的模型。
高性能算力是人工智能發(fā)展的基礎(chǔ)。
高性能算力是人工智能發(fā)展的基礎(chǔ)。劉烈宏認(rèn)為,面對生成式人工智能服務(wù)和大模型的迅速興起帶來的旺盛的算力需求,需要從算力供給和算力網(wǎng)絡(luò)調(diào)度等方面來做好統(tǒng)籌協(xié)調(diào)。從算力供給來看,需要加大低成本、高質(zhì)量、易使用的算力供給;從算力網(wǎng)絡(luò)的調(diào)度來看,需要做好人工智能、模型訓(xùn)練推理、離線分析等高時延業(yè)務(wù)等資源匹配,切實提升計算資源的整體使用率。
2023年12月,國家數(shù)據(jù)局聯(lián)合有關(guān)部門共同印發(fā)了《深度實施東數(shù)西算工程加快構(gòu)建全國一體化算力網(wǎng)的實施意見》,從“通用算力、智能算力、超級算力的一體化布局”“東中西部算力一體化協(xié)同”“算力數(shù)據(jù)算法一體化應(yīng)用”“算力與綠色電力一體化融合”“算力發(fā)展與安全保障一體化推進(jìn)”等五個統(tǒng)籌出發(fā),推動建設(shè)聯(lián)網(wǎng)調(diào)度、普惠易用、綠色安全的全國一體化算力網(wǎng)。
行業(yè)應(yīng)用是人工智能落地的關(guān)鍵。
劉烈宏指出,行業(yè)應(yīng)用是人工智能落地的關(guān)鍵?!拔覈笠?guī)模市場為人工智能行業(yè)應(yīng)用提供了豐富的土壤,這是我國推動人工智能應(yīng)用邁向更高水平的重要優(yōu)勢?!眲⒘液暾f道。
例如在交通物流行業(yè),人工智能技術(shù)應(yīng)用可以助力企業(yè)提升運(yùn)輸效率,降低全社會物流的成本;在文化旅游行業(yè)開發(fā)文化大模型,能夠貫通各類文化機(jī)構(gòu)的數(shù)據(jù)中心,充分挖掘文化數(shù)據(jù)的價值;在科技創(chuàng)新領(lǐng)域以科學(xué)數(shù)據(jù)支撐大模型的開發(fā),可以更深入地挖掘各類科學(xué)數(shù)據(jù)和科技的文獻(xiàn)。
國家數(shù)據(jù)局與16個部門共同印發(fā)《“數(shù)據(jù)要素×”三年行動計劃(2024―2026年)》,提升數(shù)據(jù)利用水平,推動人工智能行業(yè)應(yīng)用落地,推動社會各界共同挖掘市場的需求。這為人工智能技術(shù)的行業(yè)應(yīng)用奠定了基礎(chǔ)。
安全治理是人工智能發(fā)展的保障。
另外,劉烈宏還指出,安全治理是人工智能發(fā)展的保障。人工智能在對經(jīng)濟(jì)社會發(fā)展帶來深遠(yuǎn)影響的同時也蘊(yùn)含著隱私保護(hù)、算法安全、設(shè)施安全和技術(shù)耐用等潛在的風(fēng)險隱患。
目前,國內(nèi)多家企業(yè)已經(jīng)設(shè)立了數(shù)據(jù)倫理安全委員會,積極落實行業(yè)自律,并取得了初步的成效?!霸诖嘶A(chǔ)上,我們還應(yīng)該多維布局,匯聚政府、行業(yè)、企業(yè)等各主體,從科技倫理、立法、技術(shù)實踐等維度推動人工智能安全治理,堅持創(chuàng)新發(fā)展和安全治理統(tǒng)籌原則,持續(xù)優(yōu)化完善人工治理安全風(fēng)險的防范?!眲⒘液暾f道。
保障體系是人工智能發(fā)展的支撐。
最后,保障體系是人工智能發(fā)展的支撐。人工智能高質(zhì)量發(fā)展離不開人才的建設(shè)、標(biāo)準(zhǔn)規(guī)范和國際合作等保障體系。其中復(fù)合型人才是發(fā)展的強(qiáng)效動力,需要以社會需求和產(chǎn)業(yè)發(fā)展為導(dǎo)向,培養(yǎng)兼具理論和實踐,掌握數(shù)據(jù)、算法、分布式計算等技能的跨專業(yè)人才隊伍。
“統(tǒng)一的標(biāo)準(zhǔn)規(guī)范體系是發(fā)展的重要基礎(chǔ),需要構(gòu)建關(guān)于人工智能數(shù)據(jù)、算力和算法的標(biāo)準(zhǔn)體系,有效提升高質(zhì)量數(shù)據(jù)和高質(zhì)量算力的供給。”劉烈宏表示,“開放的國際合作是發(fā)展的必經(jīng)之路,需要積極開展人工智能國際合作,打造互聯(lián)互通、互利共贏的人工智能的命運(yùn)共同體。”
劉烈宏表示,下一步,國家數(shù)據(jù)局將把握數(shù)字化、網(wǎng)絡(luò)化智能發(fā)展的趨勢,大力推進(jìn)數(shù)據(jù)資源的整合共享和開發(fā)利用,讓數(shù)據(jù)賦能人工智能的發(fā)展,讓數(shù)據(jù)真正實現(xiàn)“供得出、流得動,用得好”。同時打造全國一體化的算力調(diào)度體系,加速算力的高質(zhì)量發(fā)展。
三部門共同研究提升“東數(shù)西算”網(wǎng)絡(luò)傳輸效能
3月1日晚,國家數(shù)據(jù)局公號發(fā)文稱,國家數(shù)據(jù)局等三部門共同研究提升“東數(shù)西算”網(wǎng)絡(luò)傳輸效能。
文章說,近日,為深入貫徹黨中央、國務(wù)院決策部署,加快落實《深入實施“東數(shù)西算”工程 加快構(gòu)建全國一體化算力網(wǎng)的實施意見》,國家數(shù)據(jù)局會同國家發(fā)展改革委、工業(yè)和信息化部圍繞充分發(fā)揮“東數(shù)西算”網(wǎng)絡(luò)傳輸效能,進(jìn)一步提高企業(yè)網(wǎng)絡(luò)傳輸性價比,聽取國家樞紐節(jié)點(diǎn)企業(yè)、數(shù)據(jù)傳輸需求企業(yè),以及電信運(yùn)營商等方面的意見建議,研究建立專用于國家樞紐節(jié)點(diǎn)間的公共傳輸通道,有效提升“東數(shù)西算”網(wǎng)絡(luò)傳輸效能。
文章披露,下一步,國家發(fā)展改革委、國家數(shù)據(jù)局、工業(yè)和信息化部將引導(dǎo)中國電信、中國聯(lián)通、中國移動等企業(yè)加強(qiáng)創(chuàng)新探索,近期將在部分樞紐節(jié)點(diǎn)間試點(diǎn)開通“東數(shù)西算”的“公共傳輸通道”,探索采用多種服務(wù)方式,增強(qiáng)普惠易用水平,切實提升企業(yè)主體獲得感。
“東數(shù)西算”工程自啟動以來,國家政策支持力度不斷加強(qiáng),《數(shù)字中國建設(shè)整體布局規(guī)劃》《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》等一系列重磅政策措施的發(fā)布,加強(qiáng)算力、數(shù)據(jù)、算法協(xié)同應(yīng)用,算力得以更快地走進(jìn)千行百業(yè)。
據(jù)中國信息通信研究院測算,算力每投入1元,將帶動3元至4元的GDP經(jīng)濟(jì)增長。加快算力建設(shè),將有效激發(fā)數(shù)據(jù)要素創(chuàng)新活力,加快數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化進(jìn)程,催生新技術(shù)、新業(yè)態(tài)、新模式,實現(xiàn)對經(jīng)濟(jì)發(fā)展效能的放大、疊加、倍增作用。
AI的“三駕馬車”:數(shù)據(jù)、算法、算力
人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,數(shù)據(jù)、算法和算力被公認(rèn)為人工智能的三大核心要素。
數(shù)據(jù)是人工智能發(fā)展的基礎(chǔ)。人工智能領(lǐng)域作為一個數(shù)據(jù)密集的領(lǐng)域,離不開數(shù)據(jù)的支持,其發(fā)展以海量數(shù)據(jù)作為基礎(chǔ),數(shù)據(jù)越多越優(yōu),場景特點(diǎn)越豐富,算法性能越高,模型也就更高效。
算法可比喻為人工智能發(fā)展的大腦。是通過一系列人工智能算法,比如機(jī)器學(xué)習(xí)從海量數(shù)據(jù)中獲得規(guī)律,并利用規(guī)律對位置數(shù)據(jù)某些特性進(jìn)行預(yù)測與判斷,是處理數(shù)據(jù)信息的規(guī)則與方式。
算法是實現(xiàn)人工智能的根本途徑,是挖掘數(shù)據(jù)智能的有效方法。當(dāng)前,以深度學(xué)習(xí)為代表的算法快速發(fā)展拉開了人工智能浪潮的序幕,在計算機(jī)視覺、智能語音、自然語言處理、生物特征識別等領(lǐng)域廣泛應(yīng)用,相繼超過人類識別水平。
在數(shù)據(jù)、算力和算法的進(jìn)步與驅(qū)動下,近年來人工智能商業(yè)成熟度不斷提升,行業(yè)進(jìn)入加速發(fā)展階段。與此同時,人工智能與傳統(tǒng)產(chǎn)業(yè)的融合發(fā)展,彰顯出了巨大的市場潛力,吸引了包括國內(nèi)外科技巨頭、解決方案及設(shè)備供應(yīng)商、傳統(tǒng)行業(yè)龍頭企業(yè)以及人工智能企業(yè)等各類企業(yè),積極參與到各個層面及細(xì)分領(lǐng)域的發(fā)展布局和市場競爭中。
根據(jù)畢馬威發(fā)布的《人工智能全域變革圖景展望:躍遷點(diǎn)來臨(2023)》顯示,從全球范圍來看,人工智能企業(yè)數(shù)量經(jīng)歷了由爆發(fā)式增長轉(zhuǎn)入穩(wěn)步增長的階段變化。從2017年開始,全球當(dāng)年新增AI注冊企業(yè)數(shù)量逐年下降,已從2017年的3714家下降到2022年的1106家。
結(jié)合各國對比情況來看,截至2023年6月底,全球人工智能企業(yè)共計3.6萬家,中美英企業(yè)數(shù)量名列前茅。美國人工智能企業(yè)數(shù)量約1.3萬家,在全球占比達(dá)34%,中國占比16%,英國7%%,美中英三國的人工智能企業(yè)數(shù)量合計占全球的56%。從人工智能獨(dú)角獸企業(yè)情況來看,截至2023年6月底,全球人工智能領(lǐng)域獨(dú)角獸總數(shù)達(dá)291家,美國和中國企業(yè)數(shù)量獨(dú)占鰲頭并基本平分秋色,分別為131家和108家。
中國人工智能領(lǐng)域企業(yè)密集誕生在2015年至2018年之間,約三分之二的人工智能領(lǐng)域核心企業(yè)成立年限在5-10年,隨著有效投資增長乏力,人工智能領(lǐng)域新增注冊企業(yè)數(shù)量在2017年達(dá)到峰值528家后,逐年下降,到2022年新增注冊企業(yè)數(shù)減少至63家。
結(jié)合區(qū)域布局來看,中國人工智能企業(yè)主要集聚于北京、廣東、上海、浙江等地,形成京津冀、長三角、粵港澳三足鼎立的格局,其中北京市人工智能企業(yè)數(shù)量有1,600余家。從人工智能獨(dú)角獸企業(yè)來看,北京市有41家,位居全國首位。上海市和廣東省數(shù)量位列二、三,分別有24家和23家。
當(dāng)前我國人工智能產(chǎn)業(yè)加速發(fā)展,從基礎(chǔ)支撐、核心技術(shù)到行業(yè)應(yīng)用的產(chǎn)業(yè)鏈條基本形成,一批創(chuàng)新活躍、特色鮮明的創(chuàng)新企業(yè)加速成長,新模式、新業(yè)態(tài)不斷涌現(xiàn),整體呈現(xiàn)蓬勃發(fā)展態(tài)勢。政策支持、投資引導(dǎo)和巨頭布局將推動中國AI 產(chǎn)業(yè)的結(jié)構(gòu)調(diào)整,進(jìn)一步擴(kuò)大市場規(guī)模。根據(jù)國際數(shù)據(jù)公司IDC數(shù)據(jù)顯示,2020 年,中國人工智能產(chǎn)業(yè)規(guī)模達(dá)到 68.36 億美元,預(yù)計 2023 年將達(dá)174.68 億美元,年復(fù)合增長率達(dá)到 40.52%。