文心一言(英文名:ERNIE Bot)是百度全新一代知識增強大語言模型,文心大模型家族的新成員,能夠與人對話互動,回答問題,協(xié)助創(chuàng)作,高效便捷地幫助人們獲取信息、知識和靈感。文心一言是知識增強的大語言模型,基于飛槳深度學習平臺和文心知識增強大模型,持續(xù)從海量數(shù)據(jù)和大規(guī)模知識中融合學習具備知識增強、檢索增強和對話增強的技術(shù)特色 [5] [38] [43-44] [46] 。
2023年3月16日,百度開啟文心一言邀請測試。 [46] 文心一言從數(shù)萬億數(shù)據(jù)和數(shù)千億知識中融合學習,得到預訓練大模型,在此基礎上采用有監(jiān)督精調(diào)、人類反饋強化學習、提示等技術(shù),具備知識增強、檢索增強和對話增強的技術(shù)優(yōu)勢。
2023年5月,百度文心大模型3.5版本已內(nèi)測可用。 [74] 在基礎模型升級、精調(diào)技術(shù)創(chuàng)新、知識點增強、邏輯推理增強、插件機制等方面創(chuàng)新突破,取得效果和效率的提升。
2023年8月31日,文心一言率先向全社會全面開放。 [76] 9月13日,百度發(fā)布文心一言插件生態(tài)平臺“靈境矩陣”。 [91] 文心一言面向全社會開放至百度世界2023召開,40多天的時間,文心一言用戶規(guī)模已經(jīng)達到4500萬,開發(fā)者5.4萬,場景4300個,應用825個,插件超過500個。
2023年10月17日,百度世界2023大會上,李彥宏宣布文心大模型4.0正式發(fā)布,開啟邀請測試。文心大模型4.0是迄今為止最強大的文心大模型,實現(xiàn)了基礎模型的全面升級,在理解、生成、邏輯和記憶能力上都有著顯著提升。
研發(fā)歷程
2010年,百度開始布局自然語言處理、機器翻譯領域的研究 [80] ;同年,百度自然語言處理部成立,開始全面推進自然語言處理技術(shù)的發(fā)展 [81] 。
2013年,百度成立深度學習研究院,由深度學習領域的著名專家吳恩達擔任主任 [82] 。
2016年,百度于百度世界大會上,宣布開放百度深度學習平臺飛槳,并開放了語音識別、圖像識別等人工智能技術(shù)的API接口,供開發(fā)者使用 [84] 。
2017年3月2日,由百度牽頭組建“深度學習技術(shù)及應用國家工程實驗室”正式成立 [83] ;3月22日,百度宣布進一步深度整合包括NLP、KG、IDL、Speech、Big Data等在內(nèi)的百度核心技術(shù),組成百度AI技術(shù)平臺體系(AIG),并任命百度副總裁王海峰為AIG總負責人 [82] 。
2019年3月,百度正式發(fā)布“ERNIE”人工智能系統(tǒng),該系統(tǒng)基于PaddlePaddle深度學習平臺打造,能夠進行自然語言處理、語音識別、圖像識別等操作;7月31日,ERNIE 2.0預訓練模型發(fā)布 [85] 。
發(fā)布歷程
2023年2月7日,百度官宣文心一言(英文名: ERNIE Bot)將在三月份完成內(nèi)測,面向公眾開放。據(jù)了解,百度CTO王海峰任項目總指揮,其他帶隊高管還包括:百度集團副總裁吳甜(同時擔任深度學習技術(shù)及應用國家工程研究中心副主任)、百度技術(shù)委員會主席吳華等人。 [3] [21]
2023年2月13日,百度消息,文心一言3月和大家正式見面 [4] 。
2023年2月17日,在2023 AI+工業(yè)互聯(lián)網(wǎng)高峰論壇上,百度智能云宣布“文心一言”將通過百度智能云對外提供服務,率先在內(nèi)容和信息相關的行業(yè)和場景落地。百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖表示,“文心一言”是基于百度智能云技術(shù)打造出來的大模型,它將根本性地改變云市場的游戲規(guī)則,云服務將從數(shù)字時代躍遷到智能時代。 [19]
2023年2月22日,李彥宏在發(fā)給百度全員的財報信中重點介紹了百度將在三月份推出的生成式AI產(chǎn)品文心一言,宣布計劃將多項主流業(yè)務與文心一言整合,將幫助百度增加用戶粘性。 [32-33]
2023年3月13日消息,百度將于 3 月 16 日 14:00 在北京總部召開新聞發(fā)布會,主題圍繞“文心一言”。百度官方表示,其讓文心一言寫了一封發(fā)布會的邀請函。 [42]
2023年3月16日,百度正式發(fā)布大語言模型、生成式AI產(chǎn)品“文心一言”,百度 CEO李彥宏表示:“生成式AI代表著新的技術(shù)范式,是任何企業(yè)都不應錯過的大機會。”李彥宏說,“這段時間不斷有人問我,為什么現(xiàn)在發(fā)布,你們是不是真的ready了?其實,百度在過去十幾年中持續(xù)在AI研發(fā)上堅持投入,文心大模型第一個版本2019年就發(fā)布了,此后的每一年都發(fā)布一個新版本,從這個意義上說,文心一言的發(fā)布只是我們過去多年努力的一個自然延續(xù)。” [1] [43-44] [47]
2023年3月20日,百度官微消息文心一言云服務將于3月27日上線。 [54]
2023年3月23日,百度官微發(fā)文回應對文心一言文生圖功能的相關反饋,一、文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模態(tài)大模型ERNIE-ViLG。二、在大模型訓練中使用的是互聯(lián)網(wǎng)公開數(shù)據(jù),符合行業(yè)慣例。 [59]
2023年3月24日消息,百度官方發(fā)布聲明,堅決譴責并嚴禁任何形式的測試賬號轉(zhuǎn)讓、販賣及各類利用測試賬號牟利的行為,并已展開全面核查。 [64]
2023年3月27日,百度文心一言升級,企業(yè)級大模型服務平臺“文心千帆”發(fā)布。 [62]
2023年4月,百度首席技術(shù)官、深度學習技術(shù)及應用國家工程研究中心主任王海峰再次做客CCTV-2 《中國經(jīng)濟大講堂》,闡釋文心一言這類大語言模型的產(chǎn)品能力、技術(shù)原理和產(chǎn)業(yè)價值。 [66]
2023年4月17日,文心一言在百度內(nèi)部全面應用在智能工作平臺“如流”。 [67]
2023年4月,從25日舉行的百度智能云文心一言技術(shù)交流會獲悉,文心一言開啟內(nèi)測一個月以來,已完成4次技術(shù)版本升級,大模型推理成本降為原來的十分之一。在企業(yè)服務方面,3月底開始,百度智能云大模型平臺啟動首批企業(yè)內(nèi)測,未來將針對不同客戶和開發(fā)者的需求,提供公有云服務、私有化部署兩種服務模式。百度智能云的六大智能產(chǎn)品系列,也將基于文心一言全面升級,未來將在安全評估完成后上線。 [68]
2023年4月21日消息,文心一言在百度內(nèi)部全面應用在智能工作平臺“如流”。據(jù)了解,百度已經(jīng)為全體員工開通使用。 [72]
2023年5月4日,文心一言內(nèi)測一個多月,完成了4次大的技術(shù)升級,大模型推理成本已降到原來的十分之一,推理性能提升近10倍。 [69]
2023年5月,百度首席技術(shù)官王海峰在中關村論壇中演示了“文心一言”尚未公開上線的通過文本生成視頻功能、智能總結(jié)聊天記錄功能、智能編程功能。“飛槳”與“文心”聯(lián)合優(yōu)化,近 1 個多月推理性能提升 10 倍。 [71]
2023年6月6日,文心大模型技術(shù)交流會第五站落地成都。 [73] “文心一言-Turbo”高性能模式正式開放邀測,在滿足同樣客戶需求的情況下,推理服務整體性能提升50倍。 [73] 6月20日消息,百度文心大模型3.5版本已內(nèi)測可用,實測得分超ChatGPT。 [74]
2023年7月3日,百度文心一言App已在蘋果App Store上架,用戶可免費下載安裝。 [75]
2023年8月16日,文心一言發(fā)布五個原生插件:百度搜索、覽卷文檔(基于文檔的交互)、E言易圖(數(shù)據(jù)洞察圖表生成)、說圖解畫(基于圖片的交互)、一鏡流影(文字轉(zhuǎn)視頻),并發(fā)布百度如流“超級助理”。同時面向開發(fā)者正式推出AI Studio星河大模型社區(qū)、插件機制以及文心大模型“星河”共創(chuàng)生態(tài)計劃。據(jù)介紹,文心一言目前可以支持一次同時使用3個插件,不但擴展了大模型能力邊界,也更適應場景需要 [88] 。
2023年8月31日,百度生成式人工智能產(chǎn)品文心一言正式向公眾開放服務。 [76-77]
2023年9月13日,百度集團資深副總裁、百度移動生態(tài)事業(yè)群組(MEG)總經(jīng)理何俊杰,在百度聯(lián)盟大會上發(fā)布文心一言插件生態(tài)平臺“靈境矩陣”,向開發(fā)者開啟邀測,并提供百億流量、億元基金等激勵措施,扶持插件生態(tài)建設。 [90]
2023年9月13日,北京百度網(wǎng)訊科技有限公司“文心一言軟件” 著作權(quán)獲登記批準,當前版本號為V1.0.0。“文心一言”為百度AI大語言模型。 [92]
2023年9月18日晚,文心一言大語言模型作為科技創(chuàng)新成果代表登上《新聞聯(lián)播》。 [93]
2023年10月17日,在百度世界大會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏宣布文心大模型4.0正式發(fā)布,同步開啟邀請測試。 [94]
2023年10月30日,百度文心一言專業(yè)版開啟邀測活動,點此進入官網(wǎng),每日早上 9 點開始申請,名額有限,領完即止。如成功獲得邀測名額,官方將在當日發(fā)送短信通知,邀測權(quán)限將直接發(fā)放至賬號,可體驗文心大模型 4.0。邀測權(quán)限自邀測名額發(fā)放之日起 30 天內(nèi)有效。活動時間:10 月 28 日-31 日。 [97]
2023年11月1日,文心一言正式上線會員服務。文心一言官網(wǎng)顯示,會員連續(xù)包月費用為49.9元,而單月購買為59.9元。此次會員服務對應的是文心大模型4.0,而文心大模型3.5仍可免費使用。
主體功能
百度文心一言定位于人工智能基座型的賦能平臺,將助力金融、能源、媒體、政務等千行百業(yè)的智能化變革,最終“革新生產(chǎn)力工具” [50] 。文心一言有五大能力,文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成。 [45]
文學創(chuàng)作
在文學創(chuàng)作場景中,“文心一言”可根據(jù)對話問題把文學作品的核心內(nèi)容進行了總結(jié),提出續(xù)寫作品的建議角度。對于新興的文學作品衍生版本,“文心一言”能夠回答相關事實性問題 [86] 。
商業(yè)文案創(chuàng)作
就商業(yè)文案創(chuàng)作而言,“文心一言”能夠滿足為公司起名、寫slogan、寫新聞稿等的要求 [86] 。
數(shù)理邏輯推算
以“雞兔同籠游戲”為例,“文心一言”在滿足理解題意、羅列解題思路并得出正確答案的基礎上,還能辨析題目本身是否正確 [86] 。
中文理解
在中文理解能力方面,“文心一言”能夠正確解釋成語的含義及其對應的理論知識,并能夠根據(jù)給定成語創(chuàng)作藏頭詩 [86] 。
多模態(tài)生成
“文心一言”能夠生成文本、圖片、音頻和視頻,甚至能夠生成諸如四川話的方言語音 [86] 。
模型升級
文心大模型 4.0對比基礎模型優(yōu)勢
文心大模型4.0是迄今為止最強大的文心大模型,實現(xiàn)了基礎模型的全面升級,在理解、生成、邏輯和記憶能力上都有著顯著提升。其中理解和生成能力的提升幅度相近,而邏輯和記憶能力的提升則更大,邏輯的提升幅度達到理解的近3倍,記憶的提升幅度也達到了理解的2倍多。 [96]
在理解能力方面,解決復雜任務能力有顯著提升,能夠處理更精細的多個指令;
在生成能力方面,風格文案創(chuàng)作表現(xiàn)更佳,可以輸出多種用戶期望的風格文案;可更為精準的遵循用戶中長文本字數(shù)限制輸出要求;
在邏輯能力方面,能夠解決較為復雜的推理問題、代碼解釋更加準確完善、能夠處理更加復雜的錯誤調(diào)試,錯誤識別更加精準;
在記憶能力方面,具有更長的上下文記憶能力,能夠更好的保持當前對話任務。
在識別思維陷阱能力方面,有顯著提升,能成功避開問題中較為隱蔽的思維陷阱;
在綜合分析能力方面,能更準確地結(jié)合外部知識與給定信息進行綜合分析,具有更強的概念辨析、比較分析、歸納提煉、原因分析等能力。
可處理更復雜的多任務復合型文本;有更強的、豐富的角色帶入能力。
文心大模型4.0在多個關鍵技術(shù)方向上進一步創(chuàng)新突破。在萬卡算力上運行飛槳平臺,通過集群基礎設施和調(diào)度系統(tǒng)、飛槳框架的軟硬協(xié)同優(yōu)化,支持了大模型的穩(wěn)定高效訓練。建設了多維數(shù)據(jù)體系,形成了數(shù)據(jù)挖掘、分析、合成、標注、評估閉環(huán),充分釋放數(shù)據(jù)價值,大幅提升模型效果。基于有監(jiān)督精調(diào)、偏好學習、強化學習等技術(shù)進行多階段對齊,保證模型更好地與人類的判斷和選擇對齊。可再生訓練技術(shù)通過增量式的參數(shù)調(diào)優(yōu),有效節(jié)省了訓練資源和時間,加快了模型迭代速度。
文心4.0在輸入和輸出階段都進行知識點增強。一方面,對用戶輸入的問題進行理解,并拆解出回答問題所需的知識點,然后在搜索引擎、知識圖譜、數(shù)據(jù)庫中查找準確知識,最后把這些找到的知識組裝進prompt送入大模型,準確率好,效率也高。另一方面,對大模型的輸出進行反思,從生成結(jié)果中拆解出知識點,然后再利用搜索引擎、知識圖譜、數(shù)據(jù)庫,以及大模型本身進行確認,進而對有差錯的點進行修正。
在強大的基礎大模型的基礎上,百度進一步研制了智能體機制,包括理解、規(guī)劃、反思和進化,能夠做到可靠執(zhí)行、自我進化,并一定程度上將思考過程白盒化,讓機器像人一樣思考和行動,自主完成復雜任務,在環(huán)境中持續(xù)學習實現(xiàn)自主進化。
看淘網(wǎng)是致力于中高端時尚群體的生活消費娛樂導向的垂直女性門戶,提供美容美白、減肥瘦身、娛樂八卦等資訊。
AI大模型正在全球掀起新一輪的技術(shù)革命與商業(yè)浪潮,從技術(shù)突破到應用落地,加速改變著我們的生活與產(chǎn)業(yè)。依托通用人工智能領域的持續(xù)深耕和系統(tǒng)性創(chuàng)新,科大訊飛于5月6...
文心一言(英文名:ERNIEBot)是百度全新一代知識增強大語言模型,文心大模型家族的新成員,能夠與人對話互動,回答問題,協(xié)助創(chuàng)作,高效便捷地幫助人們獲取信息、...