如果仔細觀察會發(fā)現(xiàn),大家似乎很少再提“AIGC”,取而代之的是“生成式AI”、“LLaMA 2”以及“AI大模型”等新詞。
這場由“Chat GPT”引發(fā)的內(nèi)容生產(chǎn)力大革命,已經(jīng)慢慢走出了單一的“對話式場景”,并迅速蔓延到商業(yè)應用的各個場景,尤其是“AI數(shù)字員工”的出現(xiàn),更是打響了互聯(lián)網(wǎng)大廠AI大模型應用第一槍。“企業(yè)需要快速建立‘收入增長飛輪’并通過AI構(gòu)建更加高效的組織協(xié)同和作戰(zhàn)能力?!边@是見實和360 集團副總裁、N 世界負責人梁志輝深聊時的一段話。可見,面對這波新的AI大浪潮,行業(yè)似乎更加克制和理性,當然,這也和稍顯窘迫的大環(huán)境密切相關。作為一名互聯(lián)網(wǎng)老兵,梁志輝經(jīng)歷了從PC互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng)的完整周期,這波AI浪潮的出現(xiàn),不由得讓他找回了剛進入PC 互聯(lián)網(wǎng)時代的感覺,只是這次變革的速度遠比上次快。對此,梁志輝喜憂參半。喜的是,能在幾十年短暫的職業(yè)生涯中,同時經(jīng)歷兩次行業(yè)大浪潮,并跟隨360這家企業(yè)沖在時代最前沿;憂的是,一大波不行動的企業(yè)即將被加速淘汰,部分看似牢固的商業(yè)模式也在加速崩塌。深聊中,梁志輝分享了大模型在企業(yè)數(shù)字化過程中的應用和未來發(fā)展趨勢,并稱這次不可逆的底層技術大變革充滿了機遇和挑戰(zhàn):無論企業(yè)大小,接入AI技術的門檻將越來越低,大模型可以為企業(yè)帶來十倍速的提升,但這種提升并不會立即體現(xiàn)在營收上。因此,企業(yè)在接入大模型時需要權衡好ROI,確保大模型能夠為企業(yè)帶來實際的經(jīng)濟效益。這也是為什么360會選擇切入數(shù)字員工領域的原因,企業(yè)應該先打造一支具備數(shù)字化思維的“AI鐵軍”,率先建起一支懂AI的團隊,或許才能在未來商業(yè)戰(zhàn)場上提前占據(jù)有利地勢。一邊是百年之未有之大變局;另一邊,大模型應用也面臨著一些挑戰(zhàn),如數(shù)據(jù)安全、成本控制和技術門檻等。尤其對于中小企業(yè)而言,如何在保證效果的前提下降低使用成本是一個亟待解決的問題?;诖?,360提出了“人工+大模型知識庫+AI”的組合策略,確保數(shù)據(jù)安全的同時,還能大大降低企業(yè)自建大模型的成本。如今的大模型已經(jīng)成為企業(yè)提高效率的新利器,資本、用戶和場景都發(fā)生了翻天覆地的變化,如果仍然堅持過去的產(chǎn)品和項目,那么回報率肯定會大打折扣。企業(yè)如何擁抱新技術,不斷提升自身的數(shù)字化能力,以應對市場競爭帶來的挑戰(zhàn)呢?在明天(9月20日)的AIGC大會上,我們邀請了梁志輝一起來現(xiàn)場交流,歡迎你在文末報名或點擊菜單欄報名,到時一起面對面交流更多。接下來,讓我們回到對話現(xiàn)場,聽聽360 AI大模型的落地與實踐,或許會給您在AI布局上帶來新的參考。如下,Enjoy:360 集團副總裁、N 世界負責人梁志輝01
巨變:局部10倍速增長
360開始“猛撲”AI數(shù)字員工
見實:接入大模型后,企業(yè)效率普遍提升多少?市場反饋如何?
梁志輝:市場對AI的歡迎程度實際上比我們想象的更強烈。今年3月,Chat GPT引發(fā)AI浪潮之初,大眾對AI有一種科幻的想象。我們切身的體會是,因為大模型業(yè)務我們接觸了很少遇到的化工企業(yè)客戶。技術變革的同時,也涌現(xiàn)了一批在長尾端的高價值客戶。據(jù)觀察,接入AI后,以前 4 個人的工作可能只需要1人就能完成,這意味著,企業(yè)可以吞吐更大規(guī)模的業(yè)務量。然而,實際情況可能并不樂觀,更多老板可能會選擇先優(yōu)化員工,雖然沒有通過AI接到更多訂單,但起碼可以通過AI降低企業(yè)員工成本。我們內(nèi)部有一種觀點:AI是企業(yè)的發(fā)展優(yōu)先權。以前,采用數(shù)字化工具可以顯著提高企業(yè)績效和效率,現(xiàn)在輪到AI領域。大模型讓我們學會重新審視現(xiàn)有業(yè)務。在內(nèi)容理解方面,AI可以幫我們提高十倍工作效率,但企業(yè)營收是否會因為局部10倍速增長而增長,依然需要一段時間檢驗。見實:無論企業(yè)大小,接入AI技術的門檻在逐漸降低,你認為企業(yè)未來的決勝點會偏向于哪?產(chǎn)品、服務還是品牌?
梁志輝:誠然,技術壁壘已經(jīng)被打破,很多開源軟件和社區(qū)。企業(yè)如何快速建立“收入增長飛輪”以及如何通過AI構(gòu)建更加高效的組織協(xié)同和作戰(zhàn)能力變得非常重要。
一方面是商業(yè)模式的創(chuàng)新,另一方面則是向內(nèi)看組織協(xié)同能力。這也是為什么360會切入數(shù)字員工的原因,只有員工率先完成AI能力的升級,只有一支具備數(shù)字化思維的“AI鐵軍”才能在未來的商業(yè)戰(zhàn)場上更快占領優(yōu)勢地位。見實:360 布局大模型業(yè)務是何時開始的?定位是怎樣的?
梁志輝:實際上,360很早就開始涉足人工智能領域,特別是深度人工智能領域,2016年開始組建360人工智能研究院。今年3月29號正式發(fā)布360AI大模型,按照我們創(chuàng)始人當時的說法——把剛出生的孩子抱出來讓大家看看。
今年5月,360發(fā)布了針對to B市場的千億通用大模型,并在多個行業(yè)成功落地應用,尤其是企業(yè)數(shù)字員工方面的應用,是當前的主營業(yè)務;到了六七月份,發(fā)布360大模型行業(yè)聯(lián)盟以及企業(yè)大模型解決方案。目前,以“企業(yè)數(shù)字員工”為出發(fā)點,我們已經(jīng)組建了面向To B和To C兩個不同領域的大模型團隊進行研究。其中To B業(yè)務中的AI數(shù)字人和AI數(shù)字員工等生成式AI產(chǎn)品是當前開發(fā)的主力軍。不僅如此我們也有部分 To G 業(yè)務,也會有和合作伙伴共同完成一些垂直大模型,基本上覆蓋了大模型領域的上中下游,但“安全”依舊是360的核心關鍵詞。見實:和同類型通過大模型技術做數(shù)字員工的企業(yè)相比,360作為協(xié)同領域的新人具備哪些優(yōu)勢?
梁志輝:一直以來,360占據(jù)著國內(nèi)辦公電腦最大的市場份額,具備C端應用場景與B端安全經(jīng)驗,如,360安全導航首頁、瀏覽器搜索等這幾個主要產(chǎn)品為我們帶來了大量的關注量和使用量。
上周,我們發(fā)布了AI瀏覽器和AI搜索功能。在這個過程中,潛移默化的讓 C 端用戶通過低成本甚至免費的方式使用大模型的技術,B端企業(yè)也可以通過性價比更高的SaaS解決方案,選擇月租的方式完成大模型商用。02
實踐:高效自建大模型
“人+知識庫+AI”三方協(xié)同
見實:在 To B業(yè)務的數(shù)字員工業(yè)務中,必定會涉及大量企業(yè)內(nèi)部文檔或數(shù)據(jù),數(shù)據(jù)安全問題是否會成為影響效率的阻力?你們是如何解決的?
梁志輝:確實會涉及到,但也要看企業(yè)的性質(zhì)。我們會分三類企業(yè)來看:
一是,絕大多數(shù)中小企業(yè),他們可能沒有太多機密數(shù)據(jù),也不會把銷售數(shù)據(jù)放入大模型進行計算,這類企業(yè),只要提供一個專有的數(shù)據(jù)空間,實現(xiàn)數(shù)據(jù)隔離即可。二是,規(guī)模較大的企業(yè),一般都有自己的信息安全管理規(guī)定和內(nèi)部要求,他們不太可能將內(nèi)部數(shù)據(jù)存儲在公共云上,即使是專有云環(huán)境也有疑慮。因此,我們會提供一個“大模型知識庫”解決方案。企業(yè)可以將所有需要大模型處理和訪問的數(shù)據(jù)放入這個知識庫中,這個知識庫可以在企業(yè)內(nèi)部環(huán)境中部署為云服務,僅在提問時才與大模型進行部分交互。從成本角度看,配置獨立的大模型推理節(jié)點成本相對較高(一臺約150萬),并且一臺推理節(jié)點通常無法滿足所有需求,知識庫的中轉(zhuǎn)策略是相對而言“高質(zhì)價比”的解決方案。三是,高度保密的企業(yè),原則上他們連簡單的交互也是不允許的,在這種情況下,我們會提供一個相對低成本的獨立大模型推理節(jié)點,并與大模型工具捆綁銷售。見實:企業(yè)需要提供多大數(shù)據(jù)量才能實現(xiàn)智能化?接入大模型并使其運行,需要多長時間?
梁志輝:我們曾為一家對數(shù)據(jù)保密要求極高的企業(yè)提供服務,大約花費了一個半月時間,對于企業(yè)級的大項目而言,時間周期剛剛好。
數(shù)據(jù)量的需求因企業(yè)需求不同而異,對于某些具體任務,如營銷寫稿,可能提供3篇文章即可;但對于大型企業(yè)的數(shù)據(jù)協(xié)同,那可能就需要提供數(shù)萬份文檔。見實:那如果想達到Chat GPT的智能水平,需要滿足哪些硬性或軟性要求?
梁志輝:國內(nèi)大模型目前基本都是自研,備案制度也已經(jīng)不允許套殼。所以,在具體應用中,你可能發(fā)現(xiàn)國內(nèi)產(chǎn)品不如海外產(chǎn)品,這背后至少受三方面影響:
一是,缺乏對大規(guī)模超算中心的運營和管理經(jīng)驗。算法實際上是開源的,大家缺少的是實際經(jīng)驗,使用1000張顯卡與1萬張顯卡會產(chǎn)生完全不同的問題,所需的基礎計算中心架構(gòu)也會有所不同,這些經(jīng)驗只能通過實踐來積累。因此,懂得如何構(gòu)建硬件架構(gòu)以支持上千甚至上萬張顯卡的人才就變得非常重要,這方面知識國內(nèi)廠商仍然需要多交學費,多實踐才能掌握,只要有一個人掌握了關鍵知識,國內(nèi)的學習速度會很快。二是,數(shù)據(jù)因素。Chat GPT的確有先發(fā)優(yōu)勢,他們的數(shù)據(jù)訓練樣本是國內(nèi)廠商望塵莫及的,國內(nèi)的優(yōu)勢是離用戶場景更近。實際上,大模型訓練數(shù)據(jù)量并不是越多越好,而是數(shù)據(jù)質(zhì)量越高越好,一些高質(zhì)量的文本,如代碼、論文和法律文書,才是真正能提升大模型邏輯推理能力的內(nèi)容。有些人可能誤以為百度貼吧或知乎上的內(nèi)容是高質(zhì)量數(shù)據(jù),但在實際操作中,這些平臺可能包含大量不相關的信息,對大模型的邏輯處理能力無益,即便是知乎內(nèi)容,很多內(nèi)容也算不上高質(zhì)量。還有一部分人會拿聊天對話來訓練,也是非常低效的,聊天記錄可以幫助大模型獲得更加口語化的表達,但無法真正拿來解決問題。核心原因是人與人之間的對話往往是主觀無邏輯的,AI很難梳理出背后的對話邏輯,除非單人的樣本量足夠大,但這依舊很難實現(xiàn)。曾經(jīng)有一個AI聊天機器人在上線后,由于接受了推特和Facebook中大量負面評論的訓練數(shù)據(jù),幾天后它學會了說不當言論并采取了不當行為。三是,沒有足夠多的顯卡資源,AI算法高度依賴高端顯卡,設備采買的價格比以前從事計算和存儲密集型數(shù)據(jù)中心的設備要高出大約5到10倍。所以,大家都在關注“國產(chǎn)高容量顯卡”的研發(fā)進度,一旦研發(fā)出來,成本將大幅度降低,國內(nèi)AI 大模型的進展將實現(xiàn)質(zhì)的飛躍。我們非常期待華為能降低這方面的價格,或者隨著其他中國廠商加入,能否將價格降低一半或降至四分之一,這一天的到來令人期待。見實:目前,大模型處理哪些工作會比較低效?
梁志輝:大模型在內(nèi)容生成和理解方面,比我們見過的所有技術方案都強大很多,但如果要讓大模型完成一些類似信息抽取能力或者強大推理能力的工作,目前來說僅靠大模型的一次交互是無法實現(xiàn)的。
比如我讓大模型編寫一份行業(yè)研究報告,如果人工操作,大約能拆出1000 多步,如果讓大模型通過Auto GPT的方式進行推理拆解,分步執(zhí)行,可能處理一半時就會斷掉,AI很難理解這1000多步的內(nèi)在邏輯,以至于直接中斷生成。尤其在大模型“幻覺”問題上,當你問它一個問題時,它可能會“不懂裝懂”,編一個新故事來回答你。例如,我嘗試過讓GPT幫我推薦北京飯館,他就編了一些我從未聽過的地方,實際上是杭州飯店,這里就出現(xiàn)了一種幻覺。見實:為什么會出現(xiàn)幻覺?
梁志輝:主要是大模型基于的是大量語料進行訓練,但大量語料無法與搜索引擎相比。引擎是基于現(xiàn)實世界,有人真正寫過。
盡管有很多事實信息,但我們會發(fā)現(xiàn)大模型在涉及到一些他不了解的事實信息時,會立即開始胡編。想讓大模型完成復雜任務,僅靠一個prompt 是無法實現(xiàn)的,即使給出一個可編程的解決方案,大模型在一次交互中仍然無法解決問題。所以,我們正在考慮通過AI Agent(人工智能代理,一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體。比如,告訴AI Agent幫忙下單一份外賣,它就可以直接調(diào)用 APP 選擇外賣,再調(diào)用支付程序下單支付,無需人類去指定每一步的操作。)的解決方案,讓大模型專注于他最擅長的事。見實:這種 AI“幻覺”可能是大量數(shù)據(jù)“涌現(xiàn)”出的結(jié)果,但有時這種“涌現(xiàn)”數(shù)據(jù)反倒成了冗余信息,這么理解對嗎?另外,請您具體展開講講360在AI Agent方面的實踐。
梁志輝:是的,如果無法解決“幻覺”問題,企業(yè)貿(mào)然接入大模型的風險會很大,360在對抗大模型幻覺或推理能力不足的方式是采用AI Agent的方式來處理,也就是先把整個項目“人為劃分出詳細的工作流”,讓大模型執(zhí)行工作流中每個子任務,我們只要教大模型學會調(diào)用外部搜索、計算以及其他工具即可,發(fā)揮了大模型最擅長的部分。
基于事實信息進行總結(jié),提供更優(yōu)質(zhì)的語料,且是一件非常具體的事,那么99.9%的情況下,大模型的表現(xiàn)都會特別穩(wěn)定,底層思維就是把大項目拆分成小項目,把小項目拆分成具體步驟來處理。比如,做一份旅游規(guī)劃,你可以讓AI同時打開200個網(wǎng)頁,讓它快速理解,并同時讓他總結(jié)涉及到的內(nèi)容深層部分,包括搜索關鍵詞,閱讀網(wǎng)頁內(nèi)的所有內(nèi)容,如攜程、機票等。至于如何實時抓取動態(tài)的航班信息,我們可以通過調(diào)用第三方API,讓大模型在規(guī)定的流程中執(zhí)行準確的分支跳轉(zhuǎn)即可。這其實還催生了一個有趣的現(xiàn)象,就是企業(yè)內(nèi)部可以自定義工作流,員工之間可以把做好的工作流分享給彼此。這意味著,以后AI Native APP可能不一定是現(xiàn)在移動端的APP,它可以是一個用于Agent 的工作流。這個工作流已經(jīng)把大模型要做的事的工作流程和框架穩(wěn)定下來,那它就可以幫你很穩(wěn)定處理需要幾百步才能完成的任務,這在我們內(nèi)部的測試效果非常好。整個過程中,我們希望用戶不要寫 prompt,只有基于我的低代碼平臺,就能建立起自己的大模型。就像是小學生使用的編程軟件,在配置大模型工作流的過程中,您只需添加一些控件和框架,無需具體編寫具體代碼,通過拖拽幾個邏輯運算點,大模型就可以按照指定步驟完成任務。03
趨勢:大模型下一個拐點
或在半年內(nèi)到來
見實:一派聲音是“無AI不投資”,另一派則認為早期AI項目的風險太高,必須先賺到錢才能投,對此您怎么看?
梁志輝:國內(nèi)和國外要分開看,國外許多產(chǎn)品已經(jīng)從流量和收入方面取得了很好的成績;國內(nèi)To B端則集中在營銷和辦公領域,To C個人付費用戶的意愿相對較低,C端用戶往往需要的是情感陪伴方向,真正實現(xiàn)這些需求還是有很大挑戰(zhàn)的。
一是,對于深處AI賽道的企業(yè)而言,不要舍本求末做一款強AI產(chǎn)品,而要學會用AI解決實際問題。AI提高效率有其優(yōu)勢,但必須確保與現(xiàn)有業(yè)務和需求結(jié)合,不脫離實際才是根本。二是,積極擁抱新事物,從PC互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng)的變革,當前整個市場正在發(fā)生大的變革,正如當初從塞班到安卓系統(tǒng)的轉(zhuǎn)變,甚至很快就可能出現(xiàn)“iPhone時刻”,如果資本、用戶和整個使用場景都發(fā)生了變化,企業(yè)仍然堅持過去的產(chǎn)品和項目,回報率肯定會大大折扣。見實:這會是一場正和游戲還是零和游戲?會出現(xiàn)一家獨大嗎?
梁志輝:我不認為會一家獨大,AI大模型的市場很大,國內(nèi)C端市場競爭尤為激烈。未來,每個行業(yè)都可能會有自己的大模型,有各自的開源算法和數(shù)據(jù),但仍需要時間來調(diào)優(yōu)以確保數(shù)據(jù)算力和用戶效果。
國內(nèi)的廠商今年已經(jīng)真正下場,需要時間來適應新技術。見實:也就意味著大模型并不存在先發(fā)優(yōu)勢?
梁志輝:實際上,盡管市面有大量數(shù)據(jù)可用于訓練,但如果你無法獲得垂直領域的精準數(shù)據(jù),那么大模型仍然只是一個剛剛?cè)胄械男率?,就像是一個剛畢業(yè)的高考狀元,依舊不懂如何開中藥。
如果對于某些特定領域的專業(yè)知識不足,很難真正產(chǎn)生價值,數(shù)據(jù)本身就是一個壁壘。能夠提供精確有效的高質(zhì)量數(shù)據(jù),這將成為大模型能力的一個關鍵因素。例如,一些法院的判例是否公開數(shù)據(jù)?如果你想建立一個法律大模型,如果這些案例數(shù)據(jù)不可獲得,就會成為一個難以逾越的壁壘?見實:是否會“涌現(xiàn)”出新的商業(yè)模式?
梁志輝:確實有可能發(fā)生重大變革,比如,訂閱方式就是最直接的變化。過去,無論是銷售軟件還是訂閱服務,都與時間相關。
現(xiàn)在,技術計價單位不再是按月定價,而是按照計算能量點和算力券等方式,如果你希望更快獲得更多結(jié)果,需要支付更多費用,而不再像以前那樣采用固定費用或存儲空間來計費。見實:你認為國內(nèi)大模型會在什么時候迎來下一個拐點?
梁志輝:從實際情況來看,文生文的大語言模型,無論是訓練工具還是相應的內(nèi)容都不容樂觀。GPT雖然在開源過程中表現(xiàn)良好,但中途又關閉了開源。
慶幸的是,今年7月18日,Meta發(fā)布了開源大模型 LLaMA 2,性能接近GPT3.5,預訓練模型在2萬億tokens以上,精調(diào)Chat 模型是在100萬人類標記數(shù)據(jù)上訓練的。目前,如果一家公司想要做成一個大語言模型,需要備案大約1000臺服務器,還要高薪招聘工程師來撰寫大型訓練文件,成本實在太高了。不過,我們也看到一個向好的現(xiàn)象:比如,自然語言處理和圖像處理的領域,已經(jīng)具備了足夠多的工具和標準化云產(chǎn)品,幾乎人人都能構(gòu)建自己簡易的大模型;再比如,現(xiàn)在最火的“煉丹師”(深度學習領域的AI研究員)還不是上班族,很可能是一群高中或初中生,他們愿意為自己熱愛的二次元動漫深入研究,并常年活躍在QQ討論群里。一旦有一個開源工具或社區(qū),發(fā)展速度就會超越由幾個大公司壟斷的狀態(tài),在這種情況下,行業(yè)發(fā)展會更加迅速,這個狀態(tài)可能不需要一年,大約半年就可以實現(xiàn),加上不斷加強的開源大語言模型,未來可期!
-
END
-
聲明:本內(nèi)容為作者獨立觀點,不代表牛片立場。轉(zhuǎn)載此文是出于傳遞更多信息之目的。若有來源標注錯誤或侵犯了您的合法權益,請作者持權屬證明與本網(wǎng)聯(lián)系,我們將及時更正、刪除,謝謝。
-
原創(chuàng) 唐露堯 https://mp.weixin.qq.com/s/rU6YYm2jVTli8NbvttZVxQ
表情
添加圖片
發(fā)表評論