開年以來 ChatGPT、GPT-4 的相繼面世再度掀起計算機科學領域通用人工智能(AGI)研究熱潮,也不斷刷新我們對 AI 的認知。
作為具有人類水平表現的大型多模態模型,GPT-4 被視為邁向 AGI 的重要一步,標志著創新范式的深度變革和生產力的重新定義,也必將帶來更多元的產品遷移。
截至目前,全球已經有超百萬家初創公司聲稱使用這一秘密武器來創造新產品,而這些產品將徹底改變從法律到股票交易,從游戲到醫療診斷的近乎一切領域。
盡管其中很多是營銷泡沫,但與所有技術突破一樣,總會存在炒作周期和意想不到的遠期效果。
事實上在另一邊,進入 2023 年智能汽車領域同樣十分熱鬧。
智能化已然成為上海車展全場關注的最大焦點,除了激光雷達等關鍵傳感器的單點式突破,各大巨頭也紛紛展示智春神能駕駛全產品矩陣,城市場景輔助駕駛量產落地加速推進。
更加值得注意的是,BEV、大模型、超算中心等計算機熱詞正在與自動駕駛、行泊一體、城市 NOA 等智駕焦點火速排列組合,頗有相互交融、雙向奔赴的味道。
在這背后,一方面是近年來智駕、智艙持續升級對 AI 在汽車場景落地的數據、算法、算力不斷提出更高要求,另一方面,AGI 的重大突破也已將觸角伸向智能汽車,將其視為實現閉環應用的重要場景,很多企業布局已經相當高調。
日前,商湯科技 SenseTime 舉辦技術交流日活動,分享了以「大模型+大算力」推進 AGI 發展的戰略布局,并公布該戰略下的「日日新 SenseNova」大模型體系。
在「大模型+大算力」加持下,本次上海車展商湯絕影駕、艙、云一體產品體系已全棧亮相,近 30 款合作量產車型集中展出,商湯也再度分享了智能汽車時代的 AGI 落地新思考。
本次上海車展亮相的部分絕影合作車型展示
01、算法:AI 正式步入大模型時核森叢代
如商湯科技聯合創始人、首席科學家、絕影智能汽車事業群總裁王曉剛所言,「AGI 催生了新的研究范式,即基于一個強大的多模態基模型,通過強化學習和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務。」
通用大模型并非為自動駕駛而生,或為滿足自動駕駛的特定任務需求而設計。但智能駕駛開發的諸多新需求已在推動算法從專用小模型向通用大模型快速演進。
首先是應對海量數據處理和 Corner Case 問題的迫切需求。
對于感知系統低頻出現但至關重要的小目標及帶來的潛在安全隱患,算法開發需要面對海量數據,傳統的 AI 小模型將難以同時處理大數據量和高復雜度的任務。通用大模型則可用在長尾目標的初篩過程,并疊加語料文字處理得到很好的效果。
再比如智駕算法開發對自動化數據標注、降低人工成本的訴求。相比于人工標注,通用大模型將自動化對海量數據完成標注任務,大幅降低標注數據獲取的時間成本和本身的金錢成本,從而縮短研發周期、提升成本效益。
處于類似的考量,近年來國內外巨頭企業已圍繞大模型紛紛展開各自智駕布局。
繼 Google 于 2017 年提出將 Transformer 結構應用在 CV 領域圖像分類,大模型已在 GPT-2、GPT-3、BERT 等當中不斷證明實力,特斯拉率先站臺 Transformer 大模型征戰圖像視覺。
國內企業也緊隨其后:
毫末智行已宣布自動駕駛認知大模型正式升級為 DriveGPT,百度表示利用大模型來提升自動駕駛感知能力改櫻并將大模型運用到數據挖掘,華為也已宣布加入大模型爭霸賽,自研「盤古」即將對外上線。
作為行業領先的人工智能公司,商湯在大模型領域可謂乘風破浪,過去一兩年則全面將大模型能力在各業務線 20 多個場景落地,包括智能駕駛。
商湯「日日新 SenseNova」大模型體系背后是大模型研發中深厚的積累。商湯有自己的全棧大模型研發體系,其中就包括針對大模型的底層訓練及實施過程中的各種系統性優化。
例如,商湯近期向社區發布的用于真實感知、重建和生成的多模態的數據集 OmniObject3D 中包含 190 類 6000 個物體,數據質量非常高。
再比如,商湯在 2019 年就已首次發布 10 億參數的視覺大模型,到 2022 年參數規模已達到 320 億,這也是世界上迄今為止最大的視覺模型。
此外,商湯也在智駕領域持續展示大模型能力。2021 年開發的 BEV 感知算法在 Waymo 挑戰賽以絕對優勢取得冠軍,2021 年 BEV Former 的 Transformer 結構至今仍是行業最有影響力的 BEV 工作,今年開發的 UniAD 是業內首個感知決策一體化的端到端自動駕駛解決方案。
在技術實力的另一端是量產進度。商湯也給出了自己的智能駕駛量產公式:
自動駕駛技術能力=場景數據 x 數據獲取效率 x 數據利用效率² =場景數據 x 數據獲取效率 x 先進算法 x 先進算力。
而先進的算法大模型不僅將通過跨行業數據匯聚提升駕駛場景數據資源,通過數據閉環開發模式和自動數據標注提升數據獲取效率,更將大幅提升感知精度和感知豐富度進而成倍提升數據利用效率。
依托原創 AI 算法和模型積累,商湯領先的 BEV 感知算法推進國內首批量產應用,并采用 Domain Adaption 算法有效解決跨域泛化問題。商湯首創的自動駕駛 GOP 感知體系將目標數據獲取的人力成本降低 94%,實現低成本的車端模型開發,目前也已投入量產應用。
02、算力:智能汽車時代的重要基礎設施
隨電子電氣架構技術由分布式不斷向集中式演進,大算力芯片成為新型電子電氣架構實現的物理基礎。
近年來車端芯片算力發展突飛猛進,如英偉達規劃中的 Atlan 單顆芯片算力超 1000TOPS,THOR 單顆算力超 2000TOPS,將大幅提升單車感知決策能力。
而在云端,AGI 在自動駕駛、網聯等場景的泛化應用將提出比車端指數級更高的算力要求——從數據標注到模型訓練,從場景仿真到算法迭代。
算力將是智能汽車時代的新型基礎設施。
在此背景下,近年來主流企業紛紛開啟雙線并行探索,車端自研算力平臺,云端建立超算中心。而進入大模型時代后,數據量隨著多模態的引入也將大規模增長,因此必然也會導致 AGI 對算力需求的劇增。
可以看到,英偉達車端云端同步布局并將提供端到端的全棧式 AI 加速計算解決方案,特斯拉也早在 2021 年 8 月發布自研云端超算中心 Dojo。
據近期報道,埃隆·馬斯克也將成立一家人工智能公司來與 OpenAI 競爭,已購買數千個英偉達 GPU 并一直招募 AI 研究人員和工程師。
國內方面,吉利、蔚來、特斯拉、毫末智行、小鵬等企業也已跟進布局云端算力集群,投入巨大以提升智駕開發算力儲備。
對于商湯來說,如果說大模型將是支撐智能駕駛的上層建筑,那么大算力就是數字基座。
商湯科技董事長兼 CEO 徐立表示,目前大模型對基礎算力、基礎設施的需求非常旺盛,基礎算力對并行效率的要求也非常高,但真正好用的基礎設施其實十分稀缺。
出于這一原因,商湯歷時五年自建了業界領先的 AI 大裝置 SenseCore,完成 2.7 萬塊 GPU 的部署并實現 5.0 exa FLOPS 的算力輸出能力,是亞洲目前最大的智能計算平臺之一,可同步支持 20 個千億規模參數量的超大模型同時訓練。
位于上海臨港的 AIDC 人工智能計算中心將為智能汽車的數據存儲、標注、脫敏、仿真訓練、算法迭代到部署的閉環提供算力支持,打通基于數據驅動的算法生產全流程,加速高級別智能駕駛技術的 AI 模型生產和持續迭代,推動實現規模化量產。
在 AIDC 的基礎上,AI 大裝置也將提供支持大模型生產的一系列服務:
處理大模型需要的自動化數據標注,將使智能標注效率提升百倍;大模型推理部署,使得推理效率提升 100% 以上;大模型并行訓練,最大 4000 塊卡并聯的單集群,可訓練參數量超 5000 億的稠密模型,可訓練超萬億參數;大模型增量訓練,增量微調成本降低 90%;開源模型和大模型訓練開發者工具,大規模提升開發效率。如此規模的算力設施即使特斯拉同期也尚難以望其項背,也必將推動大模型的高效閉環。
03、「大模型+大算力」推動智能汽車行業整體進程
汽車行業正在面臨百年未有之大變革。盡管此次以「大模型+大算力」推進 AGI 發展是商湯提出的戰略布局,但事實上,這一理念早已在行業層面達成共識。
基于感知、決策規控和 AI 云三大核心能力,商湯「大模型+大算力」已賦能絕影駕、艙、云三位一體產品體系量產落地:
除智能駕駛領域的全棧能力和行泊一體量產解決方案外,「大模型+大算力」也正在助力商湯打造智能座艙跨場景生態。
車展期間,與商湯「日日新 SenseNova」大模型體系深度融合的絕影未來展示艙升級亮相,語言大模型「商湯商量 SenseChat」以及 AIGC 文生圖平臺「商湯秒畫 SenseMirage」也已上車,多點融合重構人車交互方式,打造第三空間。
以「商量」為例,作為千億級參數的自然語言處理模型,其使用大量數據訓練并充分考慮中文語境,展示出出色的多輪對話和超長文本的理解能力。
商湯也展示了語言大模型支持的諸多汽車場景創新應用,如在行車過程中化身「郵件助手」自動提煉關鍵信息,作為「會議助理」自動生成會議紀要,大大節省用戶行車時處理工作的時間和精力,為未來出行的應用場景拓展帶來豐富的想象空間。
此外,以人工智能大模型開發、生產、應用為核心,一站式
【本文來自易車號作者汽車之心,版權歸作者所有,任何形式轉載請聯系作者。內容僅代表作者觀點,與易車無關】
上一篇
下一篇
制作趣味龍舟模型、慢嘆非遺休閑驛站、齊玩真人龍舟棋……來自廣州、珠海、惠州、汕尾、東莞、江門、肇慶七個市的非遺項目及傳承人,與景區游客共度端午。記者在現場看到,本次節慶“嘆”非遺活動體現了濃郁的嶺南端午特色。包粽子和賽龍舟是嶺南端午不可缺少
如果說圖片視頻只能記錄非遺技藝的形態,這項實驗通過采集非遺傳承人創作時的身體特征數據,將原本看不見摸不著的技藝本身“量化”,揭開了技藝的“基因密碼”。大數據揭開非遺技藝“基因密碼”“如果人工智能可以復制出非遺技藝,那非遺的價值又何在?”一旦
隨著科技的發展,我覺得也有可能會代替許多的員工磨告的。未來,「生成式AI」將在很多領域代替人類的基礎工作。專家交談和進行研究后,整理了一份被人工智能技術取代風險最高的工作類型清單:1、技術類工作:程序員、軟件工程師、數據分析師像 ChatG
是的,從宏觀經濟學的角度來說,ChatGPT可能引發的失業屬于典型的技術性失業,即原來由人完成的工作被搭沒跡機器來代替完成。一、采用ChatGPT和其他類似的語言模型,可能會導致某些行業出現失業或變化。一些領域的自動化、以及語言模型分析大量