97情色五月天,人妻的色诱伦理片,曰韩AV久久AV,99视频在线播放,久久国产黄色电影,999美女激情,婷婷AV一区二区三区,久草精品视频网站,操青青在线观看

<center id="uq6os"></center>

<strike id="uq6os"><abbr id="uq6os"></abbr></strike>

<th id="uq6os"></th>

<th id="uq6os"></th>

您正在使用IE低版瀏覽器，為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗，強烈建議使用更快更安全的瀏覽器

此為臨時鏈接，僅用于文章預(yù)覽，將在時失效

人工智能開發(fā)者正文

發(fā)私信給張進

發(fā)送

0

2024，智譜如何更快？

本文作者：張進

2024-01-16 16:19

導(dǎo)語：國產(chǎn)“GPT-4”真的來了。

要問當前AI大型語言模型界萬眾期待的一件事，以及各通用大模型廠商都在暗自鉚足勁干的一件事，一定是追趕GPT-4。

回顧過去的2023年，國內(nèi)整個AI行業(yè)度過了繁忙而又充滿激情的一年。上半年經(jīng)歷了融資大戰(zhàn)、搶人組團隊，下半年迎來大模型井噴式爆發(fā)，進入模型洶涌期和商業(yè)化落地探索初期。

據(jù)公開資料顯示，截至去年10月份國內(nèi)已經(jīng)發(fā)布了238個大模型，意味著中國過去每天都有一個新的大模型發(fā)布，我們會發(fā)現(xiàn)大家在介紹自家大模型時，紛紛提到模型能力“接近GPT-4”，有膽大者甚至宣稱“趕超GPT-4”。

一時間，仿佛中國大模型已經(jīng)領(lǐng)先國際先進水平，給不懂大模型技術(shù)、關(guān)注中國AI發(fā)展的投資者、用戶帶來許多不切實際的幻想與信心。

因為事實情況遠非如此。去年11月時，元象XVERSE科技創(chuàng)始人、騰訊公司前副總裁姚星曾告訴雷峰網(wǎng)，大家都說接近GPT-4，顯然不符合實際情況，很多都是刷榜刷出來的，意義不大。

“刷榜是我們的一個陋習(xí)”，這導(dǎo)致的結(jié)果就是大家對中國大模型的能力沒有清晰的認知，實際上大家離GPT-4還差得遠。

雖然，隨著OpenAI大模型論文發(fā)布、Meta開源強勢入局，大模型的神秘面紗被一一揭下，我們與國外大模型的差距在逐步縮短，但別人模型的天花板GPT-4，我們依然還遠未觸達。

這依然是一個有很高門檻的事情，訓(xùn)練模型需要大量錢、需要寫過模型訓(xùn)練代碼的人、需要堅定的技術(shù)路線和公司戰(zhàn)略層面堅持不懈的投入，不是誰喊上一嗓子，中國大模型就能跟GPT-4同臺競技。

所以，在刷榜成習(xí)的時代，我們應(yīng)該把注意力、資源傾斜給那些真正為中國大模型事業(yè)，不斷努力付出的團隊和人身上，而不需要魚目混珠之下的“盲目自吹自擂”。

追趕GPT-4已然是國產(chǎn)大模型當下最迫切的任務(wù)，而對于通用大模型廠商，誰能率先訓(xùn)練出真正比肩GPT-4的大模型，誰就能“先入咸陽”，在商業(yè)化、生態(tài)上迎來進階。

對于誰能率先突破GPT-4門檻的猜測、討論和押注，在過去的一年中激烈地進行著，終于，直到今天智譜AI發(fā)布了新一代基座大模型GLM-4，模型性能相比上一代全面提升60%，各項指標逼近GPT-4，讓我們看到“國產(chǎn)GPT-4”真的來了。

意料之中的結(jié)果，但沒想到他們速度如此快。

最強大模型GPT-4，一直無人趕超

2023年春節(jié)后，辭舊迎新，一波關(guān)注AI的投資人偶然間使用了ChatGPT（GPT-3.5），被震驚，一傳十、十傳百，在投資圈帶起了一波ChatGPT熱潮，隨著時間不斷發(fā)酵，遂帶動了整個中文互聯(lián)網(wǎng)“膜拜”ChatGPT的熱潮。

當人們尚未從ChatGPT帶來的震驚中冷靜下來，一個月后，OpenAI又推出了新品GPT-4，一個更強大的大模型，再次點燃了人們對大模型的想象力。

它強大到什么程度呢？一張網(wǎng)站的手繪草圖，GPT-4能直接生成最終設(shè)計的網(wǎng)頁代碼；GRE考試接近滿分；模擬律師考試中GPT-4擊敗了90%的人類，取得了前10%的好成績，相比之下GPT-3.5是倒數(shù)10%。

GPT-4在各種專業(yè)測試和學(xué)術(shù)基準上的表現(xiàn)與人類水平相當。其中，GPT-4最大的突破是能夠處理圖像，并能準確理解圖片的含義，給出解答。

種種驚人表現(xiàn)導(dǎo)致GPT-4一問世，便成為最強的大模型，成為全球科技公司共同追逐的目標。

回歸自身，在這波大模型競爭中，一致認為中國的突破口和優(yōu)勢在于我們應(yīng)用場景豐富，擁有超大規(guī)模市場，是最能把大模型應(yīng)用起來的。

那我們直接用開源大模型不就行了嗎，為什么一定要耗費巨大精力去追逐GPT-4呢？

首先，正如智譜CEO 張鵬所說，一個好用的基座大模型，歸根結(jié)底要看基座大模型的能力夠不夠用。當前國產(chǎn)大模型真要落地到實際場景中，要給企業(yè)帶來業(yè)務(wù)價值，模型的通用能力還需要很大提升。

而放眼當前最先進的模型GPT-4，它雖然不斷在進化出新的類人能力，但目前依然連最基本的“模型幻覺”問題都沒能徹底攻克，AGI短期內(nèi)依然是一場人類自身的“顱內(nèi)狂歡”。

“真正落實到B端，光靠chat類產(chǎn)品好像也不夠?！倍鴱堸i認為，目前大模式商業(yè)化落地上遇到的挑戰(zhàn)，本質(zhì)上還是模型能力的突破。

既然優(yōu)等生都還有上升空間，我們又有什么資格不進步，何況國產(chǎn)大模型的模型能力尚且還不足以支撐諸多業(yè)務(wù)場景的商業(yè)化落地，所以目前GPT-4依然是值得奮力追逐的目標。

其次，站在國家層面，技術(shù)自主可控是大勢所趨，仰望最遠大的技術(shù)理想依然是我們必須要達到的彼岸。

“現(xiàn)在主要看誰能趕上或者超過GPT-4，很有可能大部分廠商都過不去?！蹦成钊肓私獯竽Ｐ蜕鷳B(tài)的業(yè)內(nèi)人士表示，他還特別指出，Meta的Llama2發(fā)布后，模型能力一度接近GPT-3.5，但至今Meta一直沒有發(fā)布新進展，以此看來大模型技術(shù)門檻依然很高，這將對國內(nèi)很多團隊都是一個考驗。

而國內(nèi)很多廠商都是基于Llama開源來訓(xùn)練的模型。

GLM-4，性能直逼GPT-4

今天，1月16日，智譜AI（以下簡稱“智譜”）在北京舉辦了2024智譜AI技術(shù)開放日，發(fā)布了新一代基座大模型GLM-4。

據(jù)智譜透露，GLM-4在基礎(chǔ)能力上實現(xiàn)大幅提升，性能相比上一代GLM-3全面提升60%，而根據(jù)智譜提供的測評數(shù)據(jù)顯示，GLM-4性能逼近GPT-4。

首先是基礎(chǔ)能力上，MMLU 81.5 達到GPT-4 94% 水平，GSM8K 87.6 達到GPT-4 95% 水平，MATH 47.9 達到GPT-4 91%水平，BBH 82.25 達到 GPT-4 99% 水平，HellaSwag 85.4 達到GPT-4 90%水平，HumanEval 72 達到 GPT-4 100%水平。

2024，智譜如何更快？

圖源智譜開放日

指令跟隨能力上，和 GPT-4 相比，IFEval在Prompt提示詞跟隨（中文）方面達到 88% 水平；在指令跟隨（中文）方面，達到 90% 水平。大大超過GPT-3.5。

對齊能力上，基于AlignBench數(shù)據(jù)集，GLM-4超過了GPT-4在6月13日發(fā)布的版本，逼近GPT-4最新（11月6日版本）效果，在專業(yè)能力、中文理解、角色扮演方面超過GPT-4精度。在中文推理方面的能力還有待進一步提升。

令人訝異的是，智譜本次發(fā)布，展示了GLM-4過去一年里努力追趕GPT-4的成績，在多個模型測評中基礎(chǔ)能力都達到GPT-4的90%水平，取得的這個成績已然非常難得，但他們并沒有干脆稱“趕超GPT-4”，而是秉持著實事求是的低調(diào)態(tài)度，展示了GLM-4性能只是“逼近”GPT-4，與GPT-4仍然有差距，甚至還特地指出了自己當前的不足之處，需要“更進一步提升”。

與當下盛行的浮夸風(fēng)不同，智譜給人的感覺一直是那個“低調(diào)的學(xué)霸”。

除了性能上的提升，GLM-4支持帶來 128K 上下文窗口長度，單次提示詞可處理文本達到 300 頁。在 needle test 大海撈針測試中，128K 文本長度內(nèi) GLM-4 模型均可做到幾乎百分之百精度召回。

基于GLM模型擁有的強大的Agent能力，智譜推出了GLM-4-All Tools，能根據(jù)用戶意圖，自動理解、規(guī)劃復(fù)雜指令，自由調(diào)用WebGLM搜索增強、Code Interpreter代碼解釋器和多模態(tài)生成能力以完成復(fù)雜任務(wù)。

多模態(tài)已經(jīng)成為AI發(fā)展的重要方向和路徑，可以看到頭部大模型廠商都在往多模態(tài)發(fā)展，例如Meta的SAM、OpenAI的GPT-4V到谷歌Gemini，再到今天的CogView3，智譜一直在“對齊”世界先進水平。

模態(tài)指表達或感知事物的方式，每一種信息的來源或形式都可以稱為一種模態(tài)。視覺模態(tài)是直接從現(xiàn)實世界獲取的初級模態(tài)，數(shù)據(jù)源豐富且成本低廉，相比語言模態(tài)更直觀更易于理解。

現(xiàn)實應(yīng)用中，文本、圖像、聲音是經(jīng)常穿插在一起交互的，并不都是純文本。在一些復(fù)雜的應(yīng)用場景中，純文本的交互方式會受到文本表達能力的限制，使得復(fù)雜的概念或需求難以傳達，相比之下，多模態(tài)模型中的圖像交互方式門檻就更低，更為直觀。

一位證券分析師認為，多模態(tài)技術(shù)的一小步將帶來產(chǎn)業(yè)應(yīng)用落地的一大步。多模態(tài)是大語言模型走向千行百業(yè)乃至通用人工智能重要的里程碑。

所以，AI要滲透到各行各業(yè)，大模型向多模態(tài)發(fā)展是必然趨勢。

而此時，智譜在大模型產(chǎn)業(yè)落地上，已經(jīng)奔跑了十個多月。GLM-4的多模態(tài)能力也實現(xiàn)了明顯提升，文生圖和多模態(tài)理解都得到增強，CogView3效果明顯超過開源最佳的Stable Diffusion XL，逼近最新OpenAI發(fā)布的DALLE3。在對齊、保真、安全、組合布局等各個評測維度上，CogView3的效果都達到 DALLE3 90%以上水平。

智譜AI CEO張鵬在技術(shù)開放日上表示：GLM-4的推出標志著國產(chǎn)大模型水平看齊世界先進水平，為我們?nèi)骈_辟國產(chǎn)大模型產(chǎn)業(yè)新局面奠定了根本性基礎(chǔ)。

GLM-4的發(fā)布，將會成為國產(chǎn)大模型發(fā)展的一個分水嶺，給大模型商業(yè)化、產(chǎn)業(yè)落地帶來更多想象空間。

GLM-4讓大模型進入商業(yè)化加速時代

在去年ChatGPT剛剛點燃中文互聯(lián)網(wǎng)時，智譜就決定開始做商業(yè)化。據(jù)智譜透露，從今年3?以來，見過的客?超過2000家，與其中1000多家形成合作，與超過200家進行了深度共創(chuàng)。

站在整個大模型前進的歷程中，我們可以看到，智譜過去一年始終圍繞著商業(yè)化緊鑼密鼓地展開，相比較于其他頭部大模型創(chuàng)業(yè)公司10月以后才開始喊商業(yè)化，智譜的商業(yè)化差不多領(lǐng)先行業(yè)半年。

而商業(yè)化也一度面臨著挑戰(zhàn)。

CEO張鵬在去年10月底時曾坦誠地告訴雷峰網(wǎng)(公眾號：雷峰網(wǎng))，智譜的大模型面臨“叫好不叫座”的挑戰(zhàn)，即很多人認可，但提到付費購買，就會打退堂鼓。

一方面是大家對大模型的認知不夠，另一方面的原因很現(xiàn)實，有GPT-4在前面擺著，用戶對大模型即便不甚了解，但都知道GPT-4，就會問智譜的模型離GPT-4還有多遠。

對于商業(yè)化，當時張鵬認為，如果某一天做到GPT-4的水平，當前面臨的很多問題都會迎刃而解，甚至連商業(yè)模式都不用考慮，只提供API就行。

沒想到僅僅只過去了兩個多月，GLM-4便能比肩GPT-4，這對智譜整體發(fā)展和商業(yè)化都將是重大利好。

而這次技術(shù)開放日上，智譜還推出了一系列推動GLM模型生態(tài)加速構(gòu)建的重要措施。其中最重要的就是GLMs個性化智能體。

基于GLM-4 模型強大能力，任何用戶用簡單的提示詞指令就能創(chuàng)建屬于自己的 GLM 個性化智能體。GLM模型智能體和智能體中心已經(jīng)于技術(shù)開放日當天上線。

除此，智譜AI還針對商業(yè)客戶、開源社區(qū)和大模型小微企業(yè)等合作伙伴推出多項針對性措施。

比如價格，GLM-4升級后，API調(diào)用價格維持0.1元/千tokens不變，這已經(jīng)是行業(yè)內(nèi)較低水平。另外，智譜AI還將成立總額1000萬元人民幣的大模型開源基金，以及對面向全球大模型創(chuàng)業(yè)者的智譜AI“Z計劃”進行升級，聯(lián)合生態(tài)伙伴發(fā)起總額10億人民幣的大模型創(chuàng)業(yè)基金用于支持大模型原始創(chuàng)新。

以上推動GLM模型生態(tài)的多種措施，為構(gòu)建智譜的生態(tài)圈，其本質(zhì)也是為智譜的商業(yè)化落地添磚加瓦。

根據(jù)智譜AI 首席運營官張帆所說，在過去的9個月里，他帶領(lǐng)著智譜走過了從最初“賣模型”到一整套商業(yè)化體系的搭建。

智譜的商業(yè)化體系呈一個金字塔，最基層是開源層，開源擁有千萬下載，非常大的群體，張帆在跟客戶聊的時候發(fā)現(xiàn)，很多技術(shù)人員入門都是用ChatGLM；上一層是API層，核心的日常調(diào)用API的客戶；再往上一層是云端私有化，面向中型企業(yè)，中型企業(yè)不但有使用模型的需求，它也希望能夠把業(yè)務(wù)中的數(shù)據(jù)資產(chǎn)轉(zhuǎn)化為自己的競爭壁壘；最高層就是本地私有化，很多企業(yè)對安全性要求極高，或者很多企業(yè)希望把模型能力轉(zhuǎn)化為自己的，希望自己能夠駕馭模型，這一類量會更少一些。

對于智譜來說，每一層都有自己的生態(tài)位，商業(yè)化目標是希望下層用戶不斷往上層移動，逐步豐盈智譜的商業(yè)化。

這非常符合智譜的發(fā)展策略：始終堅持技術(shù)與商業(yè)化兩條腿走路。

GLM-4的發(fā)布，將會給整個大模型行業(yè)帶來震動，促使大模型轉(zhuǎn)身進入商業(yè)化加速時代。

后記

2023年3月14日，GPT-4發(fā)布的同一天，智譜AI跟著便發(fā)布了基于千億基座模型的對話模型ChatGLM，并開源了中英雙語對話模型ChatGLM-6B，可支持在單張消費級顯卡上進行推理使用。

智譜AI對標OpenAI的野心就此凸顯。而今天GLM-4的成功發(fā)布，是智譜過去一年里踐行向世界最先進水平看齊的謙遜，也是智譜的決心與信心的實現(xiàn)。

智譜對標OpenAI的目標正在一步步實現(xiàn)。

而今天的GLM-4性能直逼GPT-4，讓我們對國產(chǎn)大模型追趕甚至超越GPT-5、GPT-6……在實現(xiàn)AGI這條道路上賦予了信心與堅持。

就像Sam altman說的，“永遠要更快”，大模型時代把一切都加速了，在2024年的第一個月智譜AI率先出擊?？芍^給2024年的激烈競爭定下了基調(diào)，不禁讓人更加期待未來人工智能行業(yè)還會帶給我們怎樣的驚喜。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

分享：

相關(guān)文章

張進

主筆

發(fā)私信

當月熱門文章

從外購到自研：中國車企奪回底盤定義權(quán)

最新文章

熱門搜索

區(qū)塊鏈螞蟻金服李彥宏平板醫(yī)療AI 無線充電 saas CPU Netflix 任正非 Fitbit

為了您的賬戶安全，請驗證郵箱

您的郵箱還未驗證,完成可獲20積分喲！

重發(fā)郵箱修改郵箱

請驗證您的郵箱

立即驗證

完善賬號信息

您的賬號已經(jīng)綁定，現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄

立即設(shè)置 以后再說

利辛县| 黄龙县| 壤塘县| 灵山县| 宁远县| 邮箱| 华容县| 平南县| 双柏县| 忻州市| 双辽市| 固原市| 如皋市| 泰州市| 保靖县| 凤凰县| 平顶山市| 马关县| 镇原县| 呼图壁县| 开鲁县| 黄浦区| 辉南县| 祁连县| 错那县| 喀什市| 金塔县| 胶州市| 江油市| 雷波县| 安龙县| 兴宁市| 深州市| 望谟县| 邢台市| 雷波县| 龙陵县| 泾阳县| 忻城县| 西平县| 延安市|

<th id="gu6gm"></th>

<samp id="gu6gm"><dl id="gu6gm"></dl></samp>