2024世界人工智能大會暨人工智能全球治理高級別會議于7月4日在上海舉行。百度創(chuàng)始人,董事長兼首席執(zhí)行官李彥宏出席并演講。
李彥宏指出,自人類文明誕生以來,永不停止的創(chuàng)新就是印刻在我們的DNA當(dāng)中的。從石器時代的手斧,到移動時代的手機,再到AI時代的大模型,人類不斷創(chuàng)造各種工具來改善生活,來提高生產(chǎn)力。但是它們永遠(yuǎn)只是工具,只有在被人類所使用的時候才有價值。
李彥宏強調(diào),“我們堅定地相信,AI不是人類的競爭對手,我們構(gòu)建和應(yīng)用人工智能技術(shù),是為了滿足人的需求,增強人的能力、讓人類的生活更美好”。
以下為演講實錄:
李彥宏:各位下午好,非常高興再次來到上海參加世界人工智能大會,我是這個會議的常客了。去年因為出國沒有來。所以我上一次來參加WAIC是2022年,我記得那年大會的主題是元宇宙,主辦方也跟我講,希望我講一講元宇宙,我說我還是講AI吧,我講不了元宇宙,所以我當(dāng)時講的主題是AIGC,就是AI Generated Content (Artificial Intelligence Generated Content)。我認(rèn)為AI的技術(shù)發(fā)展路線,發(fā)生了方向性的改變,就是從過去的辨別式人工智能,轉(zhuǎn)向了未來的生成式人工智能。
講這個話是在2022年的夏天,5個月之后,大家都知道,ChatGPT發(fā)布了,而后來的事情大家就更清楚,所以兩年的時間,恍若隔世,感覺整個世界都變了,人工智能可以說顛覆了絕大多數(shù)人的認(rèn)知。
2023年國內(nèi)出現(xiàn)了百模大戰(zhàn),造成了社會資源的巨大浪費,尤其是算力的浪費。但是也使得我們追趕世界上最先進(jìn)的基礎(chǔ)模型的能力得到了建立。
去年10月,我宣布文心4.0發(fā)布的時候說,文心4.0的能力跟GPT4相比毫不遜色,好多的同行還不以為然,今天大家可以看到,國內(nèi)已經(jīng)有多款閉源模型聲稱它們已經(jīng)追平或者是超越了GPT4的水平。
注意,我們說的是閉源大模型,不是開源大模型,這也是今年以來爭議比較多的一個話題。有些外行甚至混淆了模型開源和代碼開源這兩個概念。
所謂模型開源,是拿到的只是一大堆參數(shù),你還是要去做SFT,還是要去做安全對齊,你不知道這些參數(shù)是怎么來的,你是無法做到眾人拾柴火焰高的。即使你拿到對應(yīng)的源代碼,你也不知道他用了多少數(shù)據(jù),用了什么比例的數(shù)據(jù)去訓(xùn)練這些參數(shù)。所以拿到這些東西,并不能夠讓你站在巨人的肩膀上去迭代和開發(fā)。
所以,同樣參數(shù)規(guī)模之下,閉源模型的能力就比開源模型要更好,而如果開源要想能力追平閉源,那么它就需要有更大的參數(shù),這就意味著推理成本會更高,反應(yīng)速度會更慢。
很多人拿開源模型來改款,以為這樣可以更好的服務(wù)自己的個性化應(yīng)用,殊不知,這樣你就創(chuàng)造了一個孤本模型,既無法從基礎(chǔ)模型持續(xù)升級當(dāng)中獲益,也沒辦法跟別人去共享算力。
當(dāng)然,我也承認(rèn)開源模型在某些場景下是有自身價值的。比如說一些學(xué)術(shù)研究,或者在教學(xué)領(lǐng)域,大家想要研究大模型的工作機制,形成理論,這個時候可能是有價值的,因為大家也經(jīng)常聽到,我們覺得大模型能力很強,但是不知道為什么能力強,因為背后沒有理論來支持它,所以研究這個東西,用開源的我覺得沒問題。
但是,大多數(shù)的應(yīng)用場景,開源模型并不合適,當(dāng)你處在一個激烈競爭的市場環(huán)境當(dāng)中,你需要讓自己的業(yè)務(wù)效率比同行更高,成本更低,這個時候商業(yè)化的閉源模型是最能打的。
當(dāng)然,這些都不是最重要的,沒有應(yīng)用,光有基礎(chǔ)模型,不管是開源還是閉源都一文不值。
所以,我從去年下半年開始講,大家不要卷模型了,要去卷應(yīng)用。但是我看到很多人仍然把主要的關(guān)注點放在基礎(chǔ)模型上,一天到晚就是跑分,刷榜,誰誰誰又超越GPT4了,openAI又出來sora了,又出來GPT4o了等等。今天這個震撼發(fā)布,明天那個史詩級更新,但是我要問,應(yīng)用在哪里?誰從中獲益了?
應(yīng)用其實離我們并不遙遠(yuǎn),基于基礎(chǔ)模型的應(yīng)用在各行各業(yè)、各個領(lǐng)域都已經(jīng)開始了逐步的滲透,兩個多月前,我們宣布文心大模型的日調(diào)用量超過了2億,最近,文心的日均調(diào)用量超過了5億!
僅僅兩個多月的時間,調(diào)用量發(fā)生了這么大的變化,足見它背后代表了真實的需求,是有人在用,是有人真的從大模型當(dāng)中獲益了,得到了價值。
比如在快遞領(lǐng)域,讓大模型幫助處理訂單,做到了“一張圖、一句話寄快遞”,不再需要其他繁瑣的流程,時間從3分多鐘縮短到19秒。而且90%以上的售后問題,也都由大模型來解決,效率提升非常的明顯。
再比如在小說創(chuàng)作領(lǐng)域,一開始也用開源模型做出過一些效果,后來改用文心輕量級模型,經(jīng)過10輪上萬組數(shù)據(jù)的SFT和post pretrain,結(jié)果有了明顯的提升,最近又轉(zhuǎn)到文心4.0版本,僅用了數(shù)百條數(shù)據(jù),4.0就在情節(jié)和邏輯方面展現(xiàn)出了非凡的優(yōu)勢,生成的內(nèi)容無論是可用率還是優(yōu)質(zhì)率都大大超過了輕量級模型,網(wǎng)文作者們?nèi)缁⑻硪恚?/p>
其實更通用的領(lǐng)域,比如說代碼生成,文心快碼這樣的軟件,在各個領(lǐng)域,也在逐步的滲透,在百度內(nèi)部,我們有30%左右的代碼,已經(jīng)用AI生成的,代碼的采用率超過了44%。
不過,我們要避免掉入“超級應(yīng)用陷阱”,覺得一定要出現(xiàn)一個DAU10億的APP才叫成功,這是移動時代的思維邏輯。其實不一定,AI時代,“超級能干”的應(yīng)用比只看DAU的“超級應(yīng)用”恐怕要更重要,只要對產(chǎn)業(yè)、對應(yīng)用場景能產(chǎn)生大的增益,整體的價值就比移動互聯(lián)網(wǎng)要大多了。
隨著基礎(chǔ)模型的日益強大,開發(fā)應(yīng)用也越來越簡單了,最簡單的就是智能體,這也是我們最看好的AI應(yīng)用的發(fā)展方向。制作一個好的智能體通常并不需要編碼,只要用人話把智能體的工作流說清楚,再配上專有的知識庫,一般就是一個很有價值的智能體了。這比互聯(lián)網(wǎng)時代制作一個網(wǎng)頁還要簡單。
未來在醫(yī)療、金融、教育、制造、交通、農(nóng)業(yè)等等領(lǐng)域,都會依據(jù)自己的場景,自己特有的經(jīng)驗、規(guī)則、數(shù)據(jù)等等,做出各種各樣的智能體。將來會有數(shù)以百萬量級的智能體出現(xiàn),形成龐大的智能體生態(tài)。
而搜索是智能體分發(fā)的最大的入口。剛剛過去的高考季,很多大模型公司熱衷于去寫高考作文,我用AI寫一個作文能得多少分,其實這個使用價值是不大的,人家不會讓你帶一個大模型去參加高考,但是真正的需求是大量的考生在考完之后要報志愿,要選擇學(xué)校,選擇專業(yè),他們對一所大學(xué),一個專業(yè),會有各種各樣的問題,而每一個考生的情況又是不一樣的。這時候就是需要有一個智能體來回答每一個考生專有的問題。
在高峰時期,百度的高考智能體每天要回答超過兩百萬個考生的問題,我們總共只有1000萬的考生,在一天當(dāng)中有這么大比例的人在利用這個智能體。
AI正在以前所未有的速度向各行各業(yè)滲透,很多人擔(dān)心如果我們?nèi)粘5墓ぷ鞫甲孉I去做了,人是不是就沒有工作機會了,這種擔(dān)心不是沒有道理的,但是過去這段時間,我聽到的擔(dān)心,聽到的抱怨很多,聽到的建設(shè)性的意見比較少,很少有人去致力于發(fā)掘生成式AI帶來的新工作機會。
我在這算是拋磚引玉吧,我覺得一方面這次浪潮,AI更多是在扮演copilot的角色,是副駕駛,還要人來把關(guān),AI只是輔助人工作,而不是替代人工作,它讓人的工作效率更高,質(zhì)量更好;另一方面,我們也看到有一些全新的工作機會開始冒出來了,比如數(shù)據(jù)標(biāo)注師,過去幾年我們幫助全國20多個城市落地了數(shù)據(jù)標(biāo)注中心,提供了大量新的就業(yè)崗位,再比如提示詞工程師,以后不用編程了,但是做好一個智能體還需要把工作流說清楚,這里要有很強的邏輯性,要用提示詞對模型進(jìn)行調(diào)教,隨著智能體的大量涌現(xiàn),這個工種需求量也會飆升。這些工作機會,通常門檻并不高,你做的一般也能夠養(yǎng)家糊口,做得好的話,那上限可以年薪百萬。
自人類文明誕生以來,永不停止的創(chuàng)新就是印刻在我們的DNA當(dāng)中的。從石器時代的手斧,到移動時代的手機,再到AI時代的大模型,人類不斷創(chuàng)造各種工具來改善生活,來提高生產(chǎn)力。但是它們永遠(yuǎn)只是工具,只有在被人類所使用的時候才有價值。我們堅定地相信,AI不是人類的競爭對手,我們構(gòu)建和應(yīng)用人工智能技術(shù),是為了滿足人的需求,增強人的能力、讓人類的生活更美好。
來源于網(wǎng)絡(luò)