在9月14日“高端化新力量專題論壇六:全鏈科技賦能高端汽車產品競爭力”中,中科創達執行總裁、智能汽車事業群總裁常衡生發表題為“AIOS賦能高端汽車產品競爭力”的演講。

中科創達執行總裁、智能汽車事業群總裁 常衡生
以下為演講實錄:
各位專家、各位領導、各位媒體朋友、各位來賓,大家上午好!我是中科創達的常衡生。今天非常榮幸能有這么一個機會,在這里分享一下我們對于操作系統,特別是在AI時代對操作系統的理解。
其實在智能化發展的過程中,一直有兩個非常關鍵的因素:芯片和操作系統。今天的操作系統發展,其實與AI是相互促進的。因為AI時代的交互邏輯在很多地方出現了很大的變化,也導致AI時代的操作系統會發生巨大的變革。今天我想分享的是,AI時代的操作系統如何賦能汽車的品牌力建設。
首先,我簡單介紹一下中科創達。中科創達成立17年以來,一直專注于智能汽車的操作系統領域,也是目前國內最大的座艙領域汽車軟件公司。我們也是一家全球化的公司,目前有1500人分布在16個國家和43個城市,同時我們在海外的收入占到了整個公司收入的接近一半。至今,我們與全球絕大多數主機廠有良好的合作關系,與高通、地平線、大眾、吉利等都成立了合資公司,有深度的合作。
首先,談操作系統離不開交互。過去幾十年,每次操作系統的變革都帶來了人機交互方式的變革,而人機交互方式的變革也推動了操作系統的變革——從Unix鍵盤、Windows時代的鼠標,再到如今智能手機時代的多點觸控。
如今已經達成基本共識:汽車未來的發展方向一定是具身智能,未來會成為汽車機器人。人與車的交互就從過去的操控邏輯轉變為自然交互,就像人與人之間的溝通和交流。我們知道,操作系統的交互邏輯發生了巨大變化,整個邏輯變化之后,操作系統本身也發生了巨大的變革。
大家都在講AI,無處不談AI。在汽車上,從去年開始到今年,我們已經看到AI上車后真正為汽車用戶體驗帶來了差異化的改變。什么是在車上的AI體驗?我們總結了一下。
首先是主動服務。從過去人找功能,到現在功能會主動提示人、服務于人。這背后一定是融合了各種設備與服務,當然也要保證最基本的功能和隱私安全要求。其中非常重要的一點是,汽車一定要主動感知你,識別你當前的情緒,并且存在記憶,知道過去做了什么,根據當前場景理解你,為你提供差異化的服務。
所以我們總結下來,就是以場景為中心,以主動服務作為基本特征。
我們講體驗,體驗實際上是圍繞人機交互展開的。用戶體驗是要在人和機器交互之間才能感受到的。從過去以操控為主的邏輯,到今天的自然交互,或者說人與人之間的交互,差別到底在什么地方?大概有三點:
第一,從控制邏輯的復雜性來說,過去人和機器是命令式或串聯式的,一個一個操作,一個個反饋,最后形成一個結果。但到今天,只需非常簡單的輸入,系統就會自動融合各種服務和設備,做一系列操作,最后給你立體化的反饋。從過去的線性操作,變成網狀、立體化、有上下文的交互。
今天大家都講多模態的感知,其實不僅僅是多模態的感知,還是多模態的輸出,多模態的交互。
第二,從過去人控制設備,到今天人和機器共同成長。隨著你的使用,機器會更懂你的習慣,知道你要干什么。機器不再是一個冷冰冰的機器,它開始有記憶、有情感,也懂你。
第三,現在大家談到AI主要談模型是什么、談數據。但我們知道,其實在車上工程落地非常難,光有模型和數據很難打造出比較好的用戶體驗。我們一定不是單一系統的突破,一定是面向系統性、整體協同性的創新。
總結下來,我們首先講的一個非常重要的關鍵詞叫“全景交互”。從過去線性、面向操控為主的交互,到今天的全景交互。Context(上下文)有很多不同的來源,總結為三個關鍵詞:
第一,融合貫通。一定融合了各種服務、各種設備,不僅在單點的控制器上。
第二,一目了然。一定是簡潔、易懂,不是非常復雜的操作和輸出,不需要花很大時間理解,也不需要很高的學習成本。
第三,體貼入微。一定根據上下文、所熟悉的環境、根據時間點給你更好的主動服務。
操作系統與交互強相關。另一個比較重要的概念是,隨著交互方式從過去的操控為主轉向自然交互為主,操作系統因為與交互邏輯強相關,在自然交互的場景下會發生巨大的變化。操作系統在未來有巨大的變革,因為整個邏輯變了,不再是操控邏輯,而是服務邏輯。
大家經常講算力、數據、底層設備、邏輯推理,大家都講算力、算法和數據。剛才講了,我們要系統性地看怎么幫助AI在車上落地。這里面還有一個非常重要的點:全景交互一定跟人相關。除了全景交互以外,還有一個非常重要的就是服務。在你的手機上面是以滿屏的各種各樣的應用呈現的,但我們知道,自然交互天然不需要這么多。你為什么需要那么多的觸屏操作,需要一層一層遞進?
今天講Agent非常重要。去年我們就在說,基于這個邏輯判斷,自然交互的邏輯一定會逐步去APP化。短時間內所有APP消失還有非常長的一段時間,但是APP一定會逐漸變少,APP會變成Agent,會變成服務。這是服務的第一層含義。
過去十年我們一直講軟件定義汽車,其實有個技術叫SOA,實際上是把車上很多設備或功能服務化。再擴展一下,這個服務還涉及到根據不同的車廠、不同的需求、不同場景需要做定制化的工程服務。
我們總結下來,關注系統不僅僅要關注算力、算法和數據這些資源的管理,系統等于資源管理,加上全景的展示,再加上服務。基于這個概念再具體一點,操作系統的架構你看到服務變成兩塊:第一塊是左邊的,系統本身與車端側本身的服務;右側是與云側上下游合作伙伴提供的Agent服務,經過底層的融合,最后形成一個個Agent。這里面有執行,在各個場景里面的Agent,也有面向用戶全景展示的AI Agent。
前面我們講了AI時代操作系統的變革,其中的關鍵點我們認為是要系統性地看待,更加關注與用戶的關聯。我們在過去十年打造了面向整車的操作系統,在新時代、AI時代,新的變革中開發了面向新一代的AIOS,在慕尼黑車展上聯合英偉達和吉利發布了新一代系統。
剛才與全景強相關的是超真實,給用戶感知的。剛才講我們要去APP化,我們的操作、交互變得更加簡單直接。車上面數據非常多,需要融合展示,深層次根據不同用戶給予不同的界面,千人千面。
這是我們在量產開發當中的系統。這里面融合了地圖、激光雷達的數據,也融合了Camera,在認為比較危險的時候就會把實際數據接進來,根據不同的地方、不同的切換、不同場景,比如泊車的時候自動把周邊的實景狀況接進來。
你可以看到沒有那么多的按鈕,所有的事情都融合了各種數據,完全是一鏡到底的沉浸式體驗,但層次非常豐富,一看就非常清晰、簡單明了。未來與用戶的接口一定是這個方向,結合生成式UI。
結合過去在視覺算法、AI方面的投入,同時結合在端側操作系統方面的積累,我們也打造了眾多在車端的用戶場景,一是快速響應,二是用戶的隱私安全。
關于車上的AI場景,我們有一個基本觀點:你不是把云端原來很多云側的大模型功能移到車上,這就叫車上的場景。車的AI場景一定是與車和出行強相關,如果不是,很難帶來差異化的變化。手機或智能手機實現的AI場景、AI功能,嫁接到車上面可能吸引力不會那么大。我們在這個里面打造了目前大概50個場景,從上車、行車、泊車、駐車的過程,到下車的識別、自動控制,根據記憶、根據過去的習慣所形成的記憶,行車車外的危險感知和車外記錄,車內的駕乘人員監控,以及泊車時的輔助,包括行車之后增強的哨兵模式,停車過程中的第三空間場景全覆蓋。背后的積累技術包括長短期的記憶,車內車外的多模態感知,情緒和感知識別。
因為我們剛剛與吉利和英偉達發布了AIOS,我們也把其中的一小部分場景做了一個視頻,給各位做一個分享。這是一家三口,從一上來就會自動識別你是誰,這時把你過去的設定設置好。開出停車場的時候自動掃描二維碼,幫你問一下要不要交費,有各種模式,比如嬰幼兒模式。
這里講哨兵模式。現在大多數哨兵模式是拍了一堆照片,有人接近就報警。事實上,用大模型之后有推理能力,一定是識別到真正有威脅的時候才做警告,這樣做到小事不打擾,大事不漏。推理會告訴你大概是什么事。這是主動的提示,有熟悉的人接近的時候就會告訴你。
在行駛的過程中還有很多場景,包括停下來之后,周邊有障礙物也會識別提醒。這只是簡單的展示,隨著數據的積累、模型的不斷優化和迭代,包括端側算力的不斷提升,會有越來越多的場景逐步增加。
最后,我強調一下,因為操作系統在今天對于中國來說已經不是技術難題,技術上能夠開發操作系統的公司非常多。它的問題在于生態、開放和開發的生態合作。在過去的十來年當中,通過我們的OS和上下游幾十家合作伙伴形成了在操作系統領域的合作。未來也呼吁和期待能夠與更多的上下游合作伙伴一起聯合創新。