3月16日下午,百度發(fā)布新一代大語言模型、生成式AI產(chǎn)品文心一言。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏表示,文心一言的使用場(chǎng)景主要包含文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成。
同時(shí)百度還公布了文心一言的邀請(qǐng)測(cè)試方案。3月16日起,首批用戶可通過邀請(qǐng)測(cè)試碼,在文心一言官網(wǎng)體驗(yàn)產(chǎn)品,后續(xù)將陸續(xù)開放給更多用戶。
此外,百度智能云即將面向企業(yè)客戶開放文心一言API接口調(diào)用服務(wù)。3月16日起正式開放預(yù)約,搜索“百度智能云”進(jìn)入官網(wǎng),可申請(qǐng)加入文心一言云服務(wù)測(cè)試。
李彥宏在現(xiàn)場(chǎng)多次提及,這類大語言模型還遠(yuǎn)未到發(fā)展完善的階段,有賴于通過真實(shí)的用戶反饋而逐步迭代。
百度方面表示,文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬億級(jí)網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級(jí)的語音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識(shí)圖譜等。
據(jù)百度介紹,文心一言的視頻生成能力則因成本較高,現(xiàn)階段還未對(duì)所有用戶開放,未來會(huì)逐步接入。
“多模態(tài)是生成式AI一個(gè)明確的發(fā)展趨勢(shì)!崩顝┖瓯硎,“未來,隨著百度多模態(tài)統(tǒng)一大模型的能力增強(qiáng),文心一言的多模態(tài)生成能力也會(huì)不斷提升。”
百度公司首席技術(shù)官(CTO)王海峰表示,“文心一言”是新一代知識(shí)增強(qiáng)大語言模型,是在ERNIE及PLATO系列模型的基礎(chǔ)上研發(fā)的;它的關(guān)鍵技術(shù)包括有監(jiān)督精調(diào)、人類反饋的強(qiáng)化學(xué)習(xí)、提示、知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)。
王海峰稱,前三項(xiàng)是這類大語言模型都會(huì)采用的技術(shù),ERNIE和PLATO中也已經(jīng)有應(yīng)用和積累,在文心一言中又有了進(jìn)一步強(qiáng)化和打磨;后三項(xiàng)則是百度已有技術(shù)優(yōu)勢(shì)的再創(chuàng)新,也是文心一言未來越來越強(qiáng)大的基礎(chǔ)。
李彥宏表示,目前百度是全球大廠中第一個(gè)做出對(duì)標(biāo)ChatGPT產(chǎn)品的企業(yè),“無論是哪家公司,都不可能靠突擊幾個(gè)月就能做出這樣的大語言模型。深度學(xué)習(xí)、自然語言處理,需要多年的堅(jiān)持和積累,沒法速成!
他認(rèn)為,百度是全球?yàn)閿?shù)不多在“芯片-框架-模型-應(yīng)用”四層進(jìn)行全棧布局的人工智能公司;而百度AI全棧布局的優(yōu)勢(shì)在于,可以在技術(shù)棧的四層架構(gòu)中實(shí)現(xiàn)端到端優(yōu)化,大幅提升效率。尤其是框架層和模型層之間,有很強(qiáng)的協(xié)同作用,可以幫助構(gòu)建更高效的模型,并降低成本。
超大規(guī)模模型的訓(xùn)練和推理,給深度學(xué)習(xí)框架帶來了很大考驗(yàn)。為了支持千億參數(shù)模型的高效分布式訓(xùn)練,百度飛槳專門研發(fā)了4D混合并行技術(shù)。
百度官方信息顯示,自2月份百度官宣“文心一言”以來,已有超過650家企業(yè)宣布接入文心一言生態(tài)。
李彥宏預(yù)測(cè),大語言模型將帶來三大產(chǎn)業(yè)機(jī)會(huì)。
第一類是新型云計(jì)算公司,其主流商業(yè)模式從IaaS變?yōu)镸aaS。之前企業(yè)選擇云廠商更多看算力、存儲(chǔ)等基礎(chǔ)云服務(wù)。未來,更多會(huì)看框架好不好、模型好不好,以及模型、框架、芯片、應(yīng)用這四層之間的協(xié)同。
第二類是進(jìn)行行業(yè)模型精調(diào)的公司。這是通用大模型和企業(yè)之間的中間層,他們可以基于對(duì)行業(yè)的洞察,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。目前百度文心大模型已經(jīng)在電力、金融、媒體等領(lǐng)域,發(fā)布了10多個(gè)行業(yè)大模型。
第三類是基于大模型底座進(jìn)行應(yīng)用開發(fā)的公司,即應(yīng)用服務(wù)提供商。李彥宏斷言,對(duì)于大部分創(chuàng)業(yè)者和企業(yè)來說,真正的機(jī)會(huì)并不是從頭開始做ChatGPT和文心一言這樣的基礎(chǔ)大模型,這很不現(xiàn)實(shí),也不經(jīng)濟(jì)。
基于通用大語言模型搶先開發(fā)重要的應(yīng)用服務(wù),這可能才是真正的機(jī)會(huì);谖谋旧、圖像生成、音頻生成、視頻生成、數(shù)字人、3D等場(chǎng)景,可能會(huì)出現(xiàn)更多新機(jī)會(huì)。
“我們相信,人工智能會(huì)徹底改變我們今天的每一個(gè)行業(yè)。AI的長期價(jià)值,對(duì)各行各業(yè)的顛覆性改變,才剛剛開始。未來,將會(huì)有更多的殺手級(jí)應(yīng)用、現(xiàn)象級(jí)產(chǎn)品出現(xiàn),將會(huì)有更多的里程碑事件發(fā)生!崩顝┖瓯硎。
部分資訊信息轉(zhuǎn)載網(wǎng)絡(luò)或會(huì)員自己投稿發(fā)布,如果有侵犯作者權(quán)力,請(qǐng)聯(lián)系我們刪除處理,聯(lián)系QQ:770276607