作者|周雅
如果四年前被推上臺前的鴻蒙1.0,還只是構圖簡單的“Try it Possible”,那么如今的鴻蒙4.0,已經可以讓華為終端BG CEO、智能汽車解決方案BU CEO余承東一臉從容的念出“Make it Possible”。
Make It Possible(以行踐言),是華為消費者業務10年前對外公布的品牌理念,其實在每一年的華為開發者大會(HDC),這個口號都會響徹全場,但是今年鴻蒙4的到來,卻讓這話聽起來多了一絲堅定意味。
自初出茅廬,鴻蒙就開辟了一條極具特色的基調,有別于通信領域——手機操作系統的iOS、Android,也不是計算領域——桌面操作系統的Windows、MacOS,它更是一個“橫跨通信與計算兩大技術領域的,面向智能全場景的分布式系統”。從我們一直以來的觀察看,鴻蒙從第一代起,它定下的基調,就是——
面向人與人、物與物、人與物三種交互場景并進的「新交互方式」演進之路。
物理世界到數字世界的“橋”
操作系統有我們看不見的一面,是對計算系統底層資源的管理。但是對于大多數用戶而言,操作系統看得見的另一面,則更為重要,它就是——人機交互方式。
操作系統,本質上是連接硬件與軟件、人與機器的橋。而每一個操作系統的交替,都伴隨著人機交互方式的革新。
「鍵盤」承擔了這個使命最長的歲月。在古老的MS-DOS和Unix時代,人們通過鍵盤輸入命令,盡管這種方式在當時已經足夠先進,但它既復雜性又不直觀,對普通用戶來說是一道障礙。計算機的早期用戶,上機之前幾乎都要先進行打字軟件的訓練。
后來出現的Windows和MacOS,讓人機交互方式從「鍵盤和命令行」進化到「圖形用戶界面和鼠標」。到了移動互聯網時代,Android和iOS通過觸摸界面,又讓「觸屏交互」成為主流??梢哉f,當年智能手機出現的奇點轟動,離不開“多點觸控”這一開創性的人機交互方式。
顯然,從鍵盤鼠標、到觸摸屏、到語音,每一次人機交互方式的轉變,都是一次操作系統使用效率的提升。
在HDC2023,鴻蒙4(HarmonyOS 4)強調了它的六項創新能力——分布式、原子化(元服務)、智慧(盤古大模型)、流暢(方舟引擎)、安全、個性。
其中,「分布式」不用多說,它是鴻蒙開天辟地的亮點,意味著各種設備能夠在一個系統中協同工作,手機、電腦、平板、智能穿戴、微波爐、冰箱等可以一鍵互聯、無縫切換,像是在終端之間建了一條高速公路,它們共享資源、共享信息、協同工作,形成了一個完整系統。
但鴻蒙4的六藝之中,最讓我們感觸最深的,其實是它最新實現的一項能力:「智慧」,鴻蒙4通過內置盤古大模型,讓語音助手“小藝”脫胎換骨。
如果說我們可以將分布式定義為鴻蒙的一個支點,讓物與物交互地更好。那么AI就相當于是鴻蒙的另一個支點,可以讓人與物交互地更好。左手分布式、右手AI,兩個支點的連線,構成了鴻蒙發展的一條主線。
華為盤古大模型的能力,則是鴻蒙新支點的底座。自然語言能力的加持,讓人機交互第一次不是以人適應機器的方式進行,而是機器適應人的方式進行。
換言之,大模型出現后,自然語言成為了人機交互的新媒介,計算機第一次“直接”理解了人類語言,而可以借由復雜的軟硬中間件,這種“直接”,讓人機交互離“自然交互”又近了一點。
不過需要強調的是,盡管我們一直在說大模型,小藝跟我們日常用的ChatGPT、文心一言等AI工具是不同的,后者是通過調用云端算力,實現了圖靈測試級交流的通用工具;而小藝,則是云端和終端相互配合,把手機等移動終端的算力資源利用起來,去匹配個人用戶的智慧全場景需求,成了操作系統的一個智能化身。
它是操作系統界面的一大進化,也開創了人機交互的一個先河。
同樣參與了這次HDC2023的和鯨科技CEO范向偉在其中一場分論壇中提到:“小藝的特殊之處在于,此前國內沒有一家同類廠商,能夠在消費者終端,提供這樣普適的用戶需求。”
按照華為的官方說法,盤古大模型主要在三個方向增強了小藝的能力——智慧交互(更聰明)、高效生產力(更能干)、個性化服務(更貼心)。而拆解來看,小藝的三個能力,似乎可以給人機交互的進化帶去兩個思路。
思路1:它是操作系統的化身。
人與人在交流過程中,通過說話、眼神、肢體動作都可以,怎么自然怎么來。同理,人機交互的方式,其實也不用只局限于單一的一種。升級后的小藝,能在語音交互的原有基礎上,新增了文字、圖片、文檔等多種交互形式,它是一種自然的交流。
第一,小藝有強大的理解能力。例如,你想要把換成天氣壁紙,可是記不起來功能名字,或者不知道在哪個菜單欄里去找,這時候只需要問小藝“怎么換一個帶天氣效果的壁紙?”,或者直接說“把手機壁紙設置成實時天氣。”只要意思表達到了,小藝都能聽懂,然后自動幫你換好。
或者,假設此時的你在某處看到一篇英文論文,但你來不及完整的看完,這就可以讓小藝理解這篇英文論文、再提煉出中文摘要,甚至,你可以挑其中某個關鍵詞問它,小藝會到論文中去找答案,精簡之后再回答你。
第二,小藝有一定的創作能力。鴻蒙4的創新之處在于,小藝融合了AIGC的能力,可以做一些摘要總結、信息檢索、多語種翻譯、郵件擬寫、內容創作等工作,帶來生產效率的提升。
比如開會場景,你要向甲方發一份會邀,就可以讓小藝幫你快速生成一份商務版的郵件;再比如圖像場景,基于多模態的能力,用戶可以直接選中手機中的圖片或者一些廢片,召喚出小藝,告訴它喜歡什么風格的藝術創作,讓小藝進行二次創作,可以直接得到一張藝術風格的圖像。
這樣的功能,雖然在ChatGPT等聊天機器人應用中很常見,但小藝的調用是基于操作系統層面,這就比“先把會邀或圖像發送到某個聊天機器人的對話框里-再寫一段prompt-最后再得到答案“要方便多了。因為場景自身,已經天然構成了prompt的上下文。
第三,小藝相當于一個超級應用。傳統的語音助手,僅僅停留在“用戶發出一次指令、它完成一次指令”的簡單操作,而鴻蒙4的創新之處在于,小藝不但具有大模型的泛化能力,還可以與手機功能進行聯動。
比如存檔場景,你可以直接給小藝發一張圖片,讓小藝按照圖片里的文字添加會議時間提醒,或者將圖片里的聯系人信息直接添加到手機通訊錄中;或者用餐場景,你晚上想請人吃飯,可以直接告訴小藝“找一家在松山湖附近評分比較高的海鮮餐廳,最好有適合 4 個人的優惠套餐”,小藝可以直接調取美團服務。
小藝之所以既能聽懂自然語言,又能調用手機應用,背后有兩個關鍵因素。華為終端BG AI與智能全場景業務部總裁賈永利解釋道,一方面,大語言模型具備泛化能力,能夠幫助智能助手提升理解能力。另一方面,大模型Plug-in的插件能力,可以在手機內部打通各應用之間的壁壘,借助工具拓展能力。
思路2:它是個人模型的化身。
小藝不僅代表了操作系統的底層功能,是終端交互的新界面,它其實也是用戶的數字化身,讓機器更懂我們。
華為指出,小藝將擁有一個強大的能力「記憶能力」,隨著長時間的陪伴,小藝會越來越懂你,那么它給出的「小藝建議」也會更貼心。
比如父母的金婚紀念日,用戶可以告訴小藝幫他記住,并且提前兩周時間提醒用戶準備,那么“小藝建議”會在臨近之時推出一張應用組合卡片,里面聚合了訂餐信息、禮物導購、生日策劃等信息。
比如針對經常出差的用戶。假設你即將去納米比亞出差,在訂票過程中曾經與小藝交流過,那么當真正出差的時候,小藝建議會自動生成一個“納米比亞之旅”的出行卡,里面聚合了天氣預報、行程攻略、打車服務等應用,且這些都是你習慣的應用。
再比如針對喜歡跑步的用戶。小藝可以根據你用自然語言發出的需求,基于自己的編程能力,自動創建出一個完整的晨跑場景:每天早上6:30幫我播報天氣,6:30-7:00如果我帶上藍牙耳機,就自動播放我收藏的音樂,并把手機調成靜音。小藝接收指令,并且每天照做。
華為強調,所有這些相關的數據和學習,都是在端側推理,以保障用戶的安全和隱私。“AI 大模型技術的發展,將會帶來下一代智能終端操作系統的智慧體驗。”余承東在會上強調。
當然,無論是哪種化身,作為一種新智能體,它需要持續持續進化的能力。這方面,小藝得益于華為技術棧的底層加持。
據悉,小藝的大模型,基于盤古L0大模型+終端消費者的場景數據和精調模型后的L1層對話模型。所謂盤古大模型(盤古Chat),是華為自研的大模型,它近期另一項輝煌成就,來自它在天氣預報中的表現:今年7月初,《自然》雜志發表了華為《三維神經網絡用于精準中期全球天氣預報》論文,論文中顯示,盤古氣象大模型是首個精度超過傳統數值預報方法的AI模型,速度相比傳統數值預報提速1萬倍以上。
《自然》評價認為:“盤古氣象大模型讓人們重新審視氣象預報模型的未來。”顯然,盤古大模型將對小藝帶來持續增益。
“現在每個月至少有2億手機用戶與小藝交互。在搭載鴻蒙座艙的汽車中,87.6%的座艙操作都由小藝完成。每臺智慧屏小藝平均每天被喚醒7次。”華為終端BG首席運營官何剛分享了這樣一組數據。而有了大模型,小藝的未來,可能不再需要喚醒,而是常駐。
生態成,則鴻蒙成
不過,鴻蒙究竟能否能引領操作系統變革,除了技術精進之外,還需要一個必要條件,它就是生態。
鴻蒙操作系統的誕生,起源是在制裁的重壓下一條拓荒之路,而華為正以自己的方式向外界證明,企業若要走出一條屬于自己的路,就必須構建“根”和“魂”。“根”是生態,不可動搖;“魂”是創新,不可停歇。
在這次HDC2023臨近結束,華為終端BG軟件部總裁龔體表示,“如果說打造一套成熟的操作系統需要有堅實的底座、繁榮的生態、極致的體驗的話,那么,鴻蒙已經完成了兩大戰役,還剩一個戰役是生態,生態成則鴻蒙成。”
操作系統的生態,是由多個組成部分構成,包括但不限于硬件制造商、軟件開發者、最終用戶、以及其他相關合作伙伴。這些不同的組成部分相互協作、共同支持,也推動操作系統的成功。生態,不是企業的一畝三分地,而是趨于持續擴大、持續創新的圈。
所幸,鴻蒙生態也在路上。“截至目前,搭載鴻蒙生態設備超過7億臺,HarmonyOS注冊開發者達到220萬以上,API日調用達到590億次以上,開發工具DevEco活躍用戶數超過40萬人。”余承東分享說道。
中國農業銀行研發中心副總經理徐偉在HDC2023現場演講時,提到了農業銀行手機銀行搭載鴻蒙操作系統的心得:“之所以選擇鴻蒙,主要是兩方面因素,一方面,我們統計了現有客戶的手機類型,有超過20%以上的用戶使用搭載鴻蒙的設備。另一方面。鴻蒙的萬物智能理念符合未來趨勢,潛力巨大。”
根據Counterpoint數據顯示,在中國智能手機市場,2021年三季度,鴻蒙系統份額僅為1%,而安卓、iOS的份額分別為86%、13%。到2023年一季度,鴻蒙份額升至8%,而安卓和蘋果分別是72%、20%。
而華為消費者業務AI與智慧全場景業務部副總裁楊海松曾公開說:“對于一個生態來講,特別是操作系統這類的底層平臺,軟件使用量、市場占有率是它能否活下來、能否成功的最核心的因素,16%的市占率是一個生死線。”
所以,鴻蒙還需再翻番,而AI可能就是新的加速踏板。
好文章,需要你的鼓勵
想象一下,你有一個非常聰明的朋友,他知道很多知識,但每當需要使用計算器、搜索引擎或查詢最新天氣時,卻變得像個笨手笨腳的孩子。這正是當前大語言模型(簡稱LLMs,如ChatGPT這類AI系統)面臨的尷尬處境。
想象一下,你擁有一個聰明的助手,它知道很多知識,但在面對需要使用計算器、搜索引擎或查詢最新信息時卻顯得笨手笨腳。這正是當前大語言模型(LLMs)面臨的困境。雖然這些模型已經通過監督微調(SFT)學會了使用工具的基本能力,但它們常常在面對復雜或不熟悉的場景時表現不佳。
想象你正在和一個智能助手聊天。如果你直接要求它提供有害信息,它很可能會禮貌拒絕。但如果你通過一系列看似無害的對話,逐步引導它走向你的真實目標呢?這就是當前AI安全領域面臨的一個嚴峻挑戰——多輪對話中的安全漏洞。
想象你在使用一個非常聰明的AI助手完成一項復雜任務,比如解決一道數學難題。你可能注意到這個助手會花很長時間"思考",一步一步寫下大量推理過程,最后才給出答案。雖然這種詳細的思考過程確實幫助AI做出了更準確的判斷,但同時也帶來了一個明顯的問題:它太"啰嗦"了,消耗了大量的計算資源和時間。