97情色五月天,人妻的色诱伦理片,曰韩AV久久AV,99视频在线播放,久久国产黄色电影,999美女激情,婷婷AV一区二区三区,久草精品视频网站,操青青在线观看

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給張進
發(fā)送

0

2024,智譜如何更快?

本文作者: 張進 2024-01-16 16:19
導(dǎo)語:國產(chǎn)“GPT-4”真的來了。

要問當前AI大型語言模型界萬眾期待的一件事,以及各通用大模型廠商都在暗自鉚足勁干的一件事,一定是追趕GPT-4。

 

回顧過去的2023年,國內(nèi)整個AI行業(yè)度過了繁忙而又充滿激情的一年。上半年經(jīng)歷了融資大戰(zhàn)、搶人組團隊,下半年迎來大模型井噴式爆發(fā),進入模型洶涌期和商業(yè)化落地探索初期。

 

據(jù)公開資料顯示,截至去年10月份國內(nèi)已經(jīng)發(fā)布了238個大模型,意味著中國過去每天都有一個新的大模型發(fā)布,我們會發(fā)現(xiàn)大家在介紹自家大模型時,紛紛提到模型能力“接近GPT-4”,有膽大者甚至宣稱“趕超GPT-4”。

 

一時間,仿佛中國大模型已經(jīng)領(lǐng)先國際先進水平,給不懂大模型技術(shù)、關(guān)注中國AI發(fā)展的投資者、用戶帶來許多不切實際的幻想與信心。

 

因為事實情況遠非如此。去年11月時,元象XVERSE科技創(chuàng)始人、騰訊公司前副總裁姚星曾告訴雷峰網(wǎng),大家都說接近GPT-4,顯然不符合實際情況,很多都是刷榜刷出來的,意義不大。

 

“刷榜是我們的一個陋習(xí)”,這導(dǎo)致的結(jié)果就是大家對中國大模型的能力沒有清晰的認知,實際上大家離GPT-4還差得遠。

 

雖然,隨著OpenAI大模型論文發(fā)布、Meta開源強勢入局,大模型的神秘面紗被一一揭下,我們與國外大模型的差距在逐步縮短,但別人模型的天花板GPT-4,我們依然還遠未觸達。

 

這依然是一個有很高門檻的事情,訓(xùn)練模型需要大量錢、需要寫過模型訓(xùn)練代碼的人、需要堅定的技術(shù)路線和公司戰(zhàn)略層面堅持不懈的投入,不是誰喊上一嗓子,中國大模型就能跟GPT-4同臺競技。

 

所以,在刷榜成習(xí)的時代,我們應(yīng)該把注意力、資源傾斜給那些真正為中國大模型事業(yè),不斷努力付出的團隊和人身上,而不需要魚目混珠之下的“盲目自吹自擂”。

 

追趕GPT-4已然是國產(chǎn)大模型當下最迫切的任務(wù),而對于通用大模型廠商,誰能率先訓(xùn)練出真正比肩GPT-4的大模型,誰就能“先入咸陽”,在商業(yè)化、生態(tài)上迎來進階。

 

對于誰能率先突破GPT-4門檻的猜測、討論和押注,在過去的一年中激烈地進行著,終于,直到今天智譜AI發(fā)布了新一代基座大模型GLM-4,模型性能相比上一代全面提升60%,各項指標逼近GPT-4,讓我們看到“國產(chǎn)GPT-4”真的來了。

 

意料之中的結(jié)果,但沒想到他們速度如此快。

最強大模型GPT-4,一直無人趕超

2023年春節(jié)后,辭舊迎新,一波關(guān)注AI的投資人偶然間使用了ChatGPT(GPT-3.5),被震驚,一傳十、十傳百,在投資圈帶起了一波ChatGPT熱潮,隨著時間不斷發(fā)酵,遂帶動了整個中文互聯(lián)網(wǎng)“膜拜”ChatGPT的熱潮。

 

當人們尚未從ChatGPT帶來的震驚中冷靜下來,一個月后,OpenAI又推出了新品GPT-4,一個更強大的大模型,再次點燃了人們對大模型的想象力。

 

它強大到什么程度呢?一張網(wǎng)站的手繪草圖,GPT-4能直接生成最終設(shè)計的網(wǎng)頁代碼;GRE考試接近滿分;模擬律師考試中GPT-4擊敗了90%的人類,取得了前10%的好成績,相比之下GPT-3.5是倒數(shù)10%。

 

GPT-4在各種專業(yè)測試和學(xué)術(shù)基準上的表現(xiàn)與人類水平相當。其中,GPT-4最大的突破是能夠處理圖像,并能準確理解圖片的含義,給出解答。

 

種種驚人表現(xiàn)導(dǎo)致GPT-4一問世,便成為最強的大模型,成為全球科技公司共同追逐的目標。

 

回歸自身,在這波大模型競爭中,一致認為中國的突破口和優(yōu)勢在于我們應(yīng)用場景豐富,擁有超大規(guī)模市場,是最能把大模型應(yīng)用起來的。

 

那我們直接用開源大模型不就行了嗎,為什么一定要耗費巨大精力去追逐GPT-4呢?

 

首先,正如智譜CEO 張鵬所說,一個好用的基座大模型,歸根結(jié)底要看基座大模型的能力夠不夠用。當前國產(chǎn)大模型真要落地到實際場景中,要給企業(yè)帶來業(yè)務(wù)價值,模型的通用能力還需要很大提升。

 

而放眼當前最先進的模型GPT-4,它雖然不斷在進化出新的類人能力,但目前依然連最基本的“模型幻覺”問題都沒能徹底攻克,AGI短期內(nèi)依然是一場人類自身的“顱內(nèi)狂歡”。

 

“真正落實到B端,光靠chat類產(chǎn)品好像也不夠?!倍鴱堸i認為,目前大模式商業(yè)化落地上遇到的挑戰(zhàn),本質(zhì)上還是模型能力的突破。

 

既然優(yōu)等生都還有上升空間,我們又有什么資格不進步,何況國產(chǎn)大模型的模型能力尚且還不足以支撐諸多業(yè)務(wù)場景的商業(yè)化落地,所以目前GPT-4依然是值得奮力追逐的目標。

 

其次,站在國家層面,技術(shù)自主可控是大勢所趨,仰望最遠大的技術(shù)理想依然是我們必須要達到的彼岸。

 

“現(xiàn)在主要看誰能趕上或者超過GPT-4,很有可能大部分廠商都過不去?!蹦成钊肓私獯竽P蜕鷳B(tài)的業(yè)內(nèi)人士表示,他還特別指出,Meta的Llama2發(fā)布后,模型能力一度接近GPT-3.5,但至今Meta一直沒有發(fā)布新進展,以此看來大模型技術(shù)門檻依然很高,這將對國內(nèi)很多團隊都是一個考驗。

 

而國內(nèi)很多廠商都是基于Llama開源來訓(xùn)練的模型。


GLM-4,性能直逼GPT-4

今天,1月16日,智譜AI(以下簡稱“智譜”)在北京舉辦了2024智譜AI技術(shù)開放日,發(fā)布了新一代基座大模型GLM-4。

 

據(jù)智譜透露,GLM-4在基礎(chǔ)能力上實現(xiàn)大幅提升,性能相比上一代GLM-3全面提升60%,而根據(jù)智譜提供的測評數(shù)據(jù)顯示,GLM-4性能逼近GPT-4。

 

首先是基礎(chǔ)能力上,MMLU 81.5 達到GPT-4 94% 水平,GSM8K 87.6 達到GPT-4 95% 水平,MATH  47.9 達到GPT-4 91%水平,BBH  82.25 達到 GPT-4 99% 水平,HellaSwag  85.4 達到GPT-4  90%水平,HumanEval 72 達到 GPT-4 100%水平。

2024,智譜如何更快?

圖源智譜開放日


指令跟隨能力上,和 GPT-4 相比,IFEval在Prompt提示詞跟隨(中文)方面達到 88% 水平;在指令跟隨(中文)方面,達到 90% 水平。大大超過GPT-3.5。

 

對齊能力上,基于AlignBench數(shù)據(jù)集,GLM-4超過了GPT-4在6月13日發(fā)布的版本,逼近GPT-4最新(11月6日版本)效果,在專業(yè)能力、中文理解、角色扮演方面超過GPT-4精度。在中文推理方面的能力還有待進一步提升。

 

令人訝異的是,智譜本次發(fā)布,展示了GLM-4過去一年里努力追趕GPT-4的成績,在多個模型測評中基礎(chǔ)能力都達到GPT-4的90%水平,取得的這個成績已然非常難得,但他們并沒有干脆稱“趕超GPT-4”,而是秉持著實事求是的低調(diào)態(tài)度,展示了GLM-4性能只是“逼近”GPT-4,與GPT-4仍然有差距,甚至還特地指出了自己當前的不足之處,需要“更進一步提升”。

 

與當下盛行的浮夸風(fēng)不同,智譜給人的感覺一直是那個“低調(diào)的學(xué)霸”。

 

除了性能上的提升,GLM-4支持帶來 128K 上下文窗口長度,單次提示詞可處理文本達到 300 頁。在 needle test 大海撈針測試中,128K 文本長度內(nèi) GLM-4 模型均可做到幾乎百分之百精度召回。

 

基于GLM模型擁有的強大的Agent能力,智譜推出了GLM-4-All Tools,能根據(jù)用戶意圖,自動理解、規(guī)劃復(fù)雜指令,自由調(diào)用WebGLM搜索增強、Code Interpreter代碼解釋器和多模態(tài)生成能力以完成復(fù)雜任務(wù)。

 

 

多模態(tài)已經(jīng)成為AI發(fā)展的重要方向和路徑,可以看到頭部大模型廠商都在往多模態(tài)發(fā)展,例如Meta的SAM、OpenAI的GPT-4V到谷歌Gemini,再到今天的CogView3,智譜一直在“對齊”世界先進水平。

 

模態(tài)指表達或感知事物的方式,每一種信息的來源或形式都可以稱為一種模態(tài)。視覺模態(tài)是直接從現(xiàn)實世界獲取的初級模態(tài),數(shù)據(jù)源豐富且成本低廉,相比語言模態(tài)更直觀更易于理解。

 

現(xiàn)實應(yīng)用中,文本、圖像、聲音是經(jīng)常穿插在一起交互的,并不都是純文本。在一些復(fù)雜的應(yīng)用場景中,純文本的交互方式會受到文本表達能力的限制,使得復(fù)雜的概念或需求難以傳達,相比之下,多模態(tài)模型中的圖像交互方式門檻就更低,更為直觀。

 

一位證券分析師認為,多模態(tài)技術(shù)的一小步將帶來產(chǎn)業(yè)應(yīng)用落地的一大步。多模態(tài)是大語言模型走向千行百業(yè)乃至通用人工智能重要的里程碑。

 

所以,AI要滲透到各行各業(yè),大模型向多模態(tài)發(fā)展是必然趨勢。

 

而此時,智譜在大模型產(chǎn)業(yè)落地上,已經(jīng)奔跑了十個多月。GLM-4的多模態(tài)能力也實現(xiàn)了明顯提升,文生圖和多模態(tài)理解都得到增強,CogView3效果明顯超過開源最佳的Stable Diffusion XL,逼近最新OpenAI發(fā)布的DALLE3。在對齊、保真、安全、組合布局等各個評測維度上,CogView3的效果都達到 DALLE3 90%以上水平。

 

智譜AI CEO張鵬在技術(shù)開放日上表示:GLM-4的推出標志著國產(chǎn)大模型水平看齊世界先進水平,為我們?nèi)骈_辟國產(chǎn)大模型產(chǎn)業(yè)新局面奠定了根本性基礎(chǔ)。

 

GLM-4的發(fā)布,將會成為國產(chǎn)大模型發(fā)展的一個分水嶺,給大模型商業(yè)化、產(chǎn)業(yè)落地帶來更多想象空間。


GLM-4讓大模型進入商業(yè)化加速時代

在去年ChatGPT剛剛點燃中文互聯(lián)網(wǎng)時,智譜就決定開始做商業(yè)化。據(jù)智譜透露,從今年3?以來,見過的客?超過2000家,與其中1000多家形成合作,與超過200家進行了深度共創(chuàng)。

 

站在整個大模型前進的歷程中,我們可以看到,智譜過去一年始終圍繞著商業(yè)化緊鑼密鼓地展開,相比較于其他頭部大模型創(chuàng)業(yè)公司10月以后才開始喊商業(yè)化,智譜的商業(yè)化差不多領(lǐng)先行業(yè)半年。

 

而商業(yè)化也一度面臨著挑戰(zhàn)。

 

CEO張鵬在去年10月底時曾坦誠地告訴雷峰網(wǎng)(公眾號:雷峰網(wǎng)),智譜的大模型面臨“叫好不叫座”的挑戰(zhàn),即很多人認可,但提到付費購買,就會打退堂鼓。

 

一方面是大家對大模型的認知不夠,另一方面的原因很現(xiàn)實,有GPT-4在前面擺著,用戶對大模型即便不甚了解,但都知道GPT-4,就會問智譜的模型離GPT-4還有多遠。

 

對于商業(yè)化,當時張鵬認為,如果某一天做到GPT-4的水平,當前面臨的很多問題都會迎刃而解,甚至連商業(yè)模式都不用考慮,只提供API就行。

 

沒想到僅僅只過去了兩個多月,GLM-4便能比肩GPT-4,這對智譜整體發(fā)展和商業(yè)化都將是重大利好。

 

而這次技術(shù)開放日上,智譜還推出了一系列推動GLM模型生態(tài)加速構(gòu)建的重要措施。其中最重要的就是GLMs個性化智能體。

 

基于GLM-4 模型強大能力,任何用戶用簡單的提示詞指令就能創(chuàng)建屬于自己的 GLM 個性化智能體。GLM模型智能體和智能體中心已經(jīng)于技術(shù)開放日當天上線。

 

除此,智譜AI還針對商業(yè)客戶、開源社區(qū)和大模型小微企業(yè)等合作伙伴推出多項針對性措施。

 

比如價格,GLM-4升級后,API調(diào)用價格維持0.1元/千tokens不變,這已經(jīng)是行業(yè)內(nèi)較低水平。另外,智譜AI還將成立總額1000萬元人民幣的大模型開源基金,以及對面向全球大模型創(chuàng)業(yè)者的智譜AI“Z計劃”進行升級,聯(lián)合生態(tài)伙伴發(fā)起總額10億人民幣的大模型創(chuàng)業(yè)基金用于支持大模型原始創(chuàng)新。

 

以上推動GLM模型生態(tài)的多種措施,為構(gòu)建智譜的生態(tài)圈,其本質(zhì)也是為智譜的商業(yè)化落地添磚加瓦。

 

根據(jù)智譜AI 首席運營官張帆所說,在過去的9個月里,他帶領(lǐng)著智譜走過了從最初“賣模型”到一整套商業(yè)化體系的搭建。

 

智譜的商業(yè)化體系呈一個金字塔,最基層是開源層,開源擁有千萬下載,非常大的群體,張帆在跟客戶聊的時候發(fā)現(xiàn),很多技術(shù)人員入門都是用ChatGLM;上一層是API層,核心的日常調(diào)用API的客戶;再往上一層是云端私有化,面向中型企業(yè),中型企業(yè)不但有使用模型的需求,它也希望能夠把業(yè)務(wù)中的數(shù)據(jù)資產(chǎn)轉(zhuǎn)化為自己的競爭壁壘;最高層就是本地私有化,很多企業(yè)對安全性要求極高,或者很多企業(yè)希望把模型能力轉(zhuǎn)化為自己的,希望自己能夠駕馭模型,這一類量會更少一些。

 

對于智譜來說,每一層都有自己的生態(tài)位,商業(yè)化目標是希望下層用戶不斷往上層移動,逐步豐盈智譜的商業(yè)化。

 

這非常符合智譜的發(fā)展策略:始終堅持技術(shù)與商業(yè)化兩條腿走路。

 

GLM-4的發(fā)布,將會給整個大模型行業(yè)帶來震動,促使大模型轉(zhuǎn)身進入商業(yè)化加速時代。


后記

2023年3月14日,GPT-4發(fā)布的同一天,智譜AI跟著便發(fā)布了基于千億基座模型的對話模型ChatGLM,并開源了中英雙語對話模型ChatGLM-6B,可支持在單張消費級顯卡上進行推理使用。

 

智譜AI對標OpenAI的野心就此凸顯。而今天GLM-4的成功發(fā)布,是智譜過去一年里踐行向世界最先進水平看齊的謙遜,也是智譜的決心與信心的實現(xiàn)。

 

智譜對標OpenAI的目標正在一步步實現(xiàn)。

 

而今天的GLM-4性能直逼GPT-4,讓我們對國產(chǎn)大模型追趕甚至超越GPT-5、GPT-6……在實現(xiàn)AGI這條道路上賦予了信心與堅持。

 

就像Sam altman說的,“永遠要更快”,大模型時代把一切都加速了,在2024年的第一個月智譜AI率先出擊??芍^給2024年的激烈競爭定下了基調(diào),不禁讓人更加期待未來人工智能行業(yè)還會帶給我們怎樣的驚喜。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

2024,智譜如何更快?

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說
利辛县| 黄龙县| 壤塘县| 灵山县| 宁远县| 邮箱| 华容县| 平南县| 双柏县| 忻州市| 双辽市| 固原市| 如皋市| 泰州市| 保靖县| 凤凰县| 平顶山市| 马关县| 镇原县| 呼图壁县| 开鲁县| 黄浦区| 辉南县| 祁连县| 错那县| 喀什市| 金塔县| 胶州市| 江油市| 雷波县| 安龙县| 兴宁市| 深州市| 望谟县| 邢台市| 雷波县| 龙陵县| 泾阳县| 忻城县| 西平县| 延安市|