AI技術正在從獨立功能向基礎設施轉(zhuǎn)變。
微信終于在聊天框放了個AI助手。
雖然名稱上還是「元寶紅包封面助手」,但在介紹里可以看到其是依托于騰訊混元大模型的AI服務,可以提供陪聊、答題、作圖以及定制紅包封面等功能。
微信作為國內(nèi)最大的社交平臺,這次內(nèi)置AI助手元寶或許意味著AI技術正在從獨立功能向基礎設施轉(zhuǎn)變,騰訊正在將微信的生態(tài)優(yōu)勢轉(zhuǎn)化到AI領域。
這會是騰訊重回AI牌桌的絕殺開端嗎?
圖片來源:極客公園
01實測,用AI更絲滑了
極客公園做了一番簡單實測。先是問了一下它和元寶app的異同有哪些:
圖片來源:極客公園
然后我丟入一篇極客公園昨天發(fā)布的公眾號文章鏈接,內(nèi)容是關于DeepSeek發(fā)布V3模型更新,「元寶紅包封面助手」回復說「收到,我問問元寶~」,這個回復有點人性化的。
隨后它也沒問我是否需要開啟深度思考,就直接進行了21秒的深度思考:
元寶的深度思考過程|圖片來源:極客公園
然后給出了我一份分析:
DeepSeek公司于2024年3月24日發(fā)布了V3模型的重要更新,該版本雖非預期的V4或R2迭代,但在性能表現(xiàn)和開源政策上實現(xiàn)了顯著突破。以下是本次更新的核心要點:
技術規(guī)格與發(fā)布信息
模型參數(shù)規(guī)模達6850億,屬于小版本升級(V3-0324)
基于全新32K GPU集群進行后訓練優(yōu)化
已通過官網(wǎng)、App及小程序等多渠道開放使用
開源版本同步上線,延續(xù)初代V3「557.6萬美元成本比肩Claude3.5」的高性價比特性
核心能力提升
前端開發(fā)能力接近Claude3.7專家級水平,用戶測試顯示:
能生成包含CSS動畫與JavaScript交互的完整HTML文件(如天氣卡片動態(tài)效果)
代碼質(zhì)量顯著優(yōu)于舊版R1模型(對比案例顯示視覺效果與功能實現(xiàn)差距明顯)
在網(wǎng)站搭建測試中生成效果與Claude3.7 Sonnet相當
支持復雜指令解析(如通過函數(shù)/按鈕組實現(xiàn)多天氣動畫切換)
上下文理解能力提升,尤其在多輪對話場景
可精準處理跨語言混合編程需求(示例未展示但文中暗示)
開源生態(tài)建設
采用更寬松的開源協(xié)議,降低商業(yè)應用限制
延續(xù)初代V3作為首個沖入Chatbot Arena榜單前十開源模型的優(yōu)勢
發(fā)布1小時內(nèi)即吸引全球開發(fā)者參與測試驗證
行業(yè)影響與用戶反饋
被專業(yè)用戶評價為「相當于Claude Sonnet3.5到3.6的升級幅度」
在無官方基準測試情況下,用戶實測數(shù)據(jù)成為主要驗證依據(jù)
開發(fā)者社區(qū)高度關注其開源協(xié)議調(diào)整帶來的商業(yè)化可能性
未來展望
官方未透露V4/R2研發(fā)進展,但用戶期待值持續(xù)升溫
當前版本已確立開源大模型領域新標桿,可能加劇行業(yè)競爭
該更新標志著DeepSeek在保持成本優(yōu)勢的同時,通過技術迭代縮小了與頂尖閉源模型的差距,特別是在編程領域展現(xiàn)出顛覆性潛力,其開源策略調(diào)整或?qū)⒅厮艽竽P蜕鷳B(tài)格局。
眼看清明節(jié)就要到了,我也問了問它「清明節(jié)做點什么好」,對這個問題它倒是沒回復「收到,去問元寶」,也沒開啟深度思考模式,而是很快就輸出了答案:
清明節(jié),作為中國傳統(tǒng)節(jié)日之一,不僅是緬懷先人、寄托哀思的時刻,也是親近自然、感受春天氣息的好機會。以下是一些清明節(jié)期間可以進行的活動建議:
祭掃祖先:前往祖墳或陵園,清掃墓地,獻上鮮花、紙錢等,表達對逝去親人的懷念和敬意。
踏青賞春:利用清明假期,與家人朋友一同外出踏青,欣賞春天的美景,呼吸新鮮空氣,放松心情。
植樹造林:參與植樹活動,為大地增添一抹新綠,既是對自然的回饋,也是對生命的禮贊。
品嘗清明食品:制作或購買清明節(jié)特有的食品,如青團、清明果等,體驗傳統(tǒng)節(jié)日的風味。
文化體驗:參觀博物館、文化遺址,了解清明節(jié)的歷史文化背景,增長知識。
家庭聚會:利用假期與家人團聚,共敘親情,享受家庭的溫馨。
靜思冥想:在寧靜的環(huán)境中,進行冥想或靜思,反思生活,規(guī)劃未來。
公益活動:參與社區(qū)或慈善機構(gòu)組織的公益活動,幫助需要幫助的人,傳遞正能量。
戶外運動:進行徒步、騎行、野餐等戶外活動,鍛煉身體,享受戶外的樂趣。
攝影創(chuàng)作:帶上相機,捕捉春天的美麗瞬間,進行攝影創(chuàng)作,記錄生活的美好。
無論選擇哪種方式,重要的是要用心感受節(jié)日的意義,珍惜與家人朋友相處的時光,同時也要注意安全和環(huán)保,讓清明節(jié)成為一個有意義且愉快的假期。
還有分析文件的功能我也試了一下,之前如果看到比較復雜的文件想讓AI先幫忙概括總結(jié)一下要點再去細讀的話,得先去打開AI產(chǎn)品或者去相應的網(wǎng)頁,但現(xiàn)在可以直接在微信里丟給這個助手,使用體驗更絲滑了一些。
這次「元寶紅包封面助手」也自行開啟了深度思考模式:
圖片來源:極客公園
在21秒的深度思考后,助手給出了出一份分析:
對文檔內(nèi)容的技術分析與行業(yè)洞察
一、語言模型技術演進
核心突破:
從N-gram到Transformer的范式轉(zhuǎn)變,語言模型參數(shù)量級從百萬級(GPT-1)躍升至萬億級(GPT-4)
自監(jiān)督學習(MLM/NSP)解決了海量數(shù)據(jù)標注難題,預訓練+微調(diào)模式成為行業(yè)標準
詞嵌入維度從768(BERT)擴展到12888(GPT-3),語義表征能力呈指數(shù)級提升
關鍵技術指標:
訓練數(shù)據(jù)量:GPT-3使用45TB數(shù)據(jù)(約1萬億詞),相當于1351萬本牛津詞典
算力成本:ChatGPT訓練需1萬張V100 GPU,成本超10億人民幣
模型效率:DeepSeek通過稀疏注意力等技術,將訓練成本降低至同規(guī)模模型的1/3
二、Transformer架構(gòu)創(chuàng)新
技術革命性:
自注意力機制實現(xiàn)O(n2)的全局關聯(lián)建模,相比RNN的序列依賴突破顯著
多頭注意力層數(shù)從12層(BERT)增至96層(GPT-3),上下文窗口從512擴展到32K(Llama2)
位置編碼從絕對位置(Sinusoidal)發(fā)展到相對位置(RoPE),更好處理長序列
工程實踐突破:
混合精度訓練(FP16/FP32)節(jié)省40%顯存消耗
梯度檢查點技術(Gradient Checkpointing)實現(xiàn)百倍序列長度擴展
張量并行+流水線并行將千億參數(shù)模型訓練效率提升80%
三、DeepSeek的技術突破
開源生態(tài)貢獻:
模型架構(gòu):提出動態(tài)稀疏注意力機制,推理速度較Llama提升2.3倍
訓練效率:MoE架構(gòu)實現(xiàn)萬億參數(shù)模型在千卡集群上的可行訓練
中文優(yōu)化:構(gòu)建包含2.6萬億token的中英雙語預訓練語料庫
性能指標對比:
數(shù)學推理:DeepSeek-Math-7B在GSM8K達到83.5%準確率(GPT-4為92%)
代碼生成:HumanEval得分68.9%(CodeLlama-34B為53.7%)
多模態(tài)理解:ViT-22B在ImageNet-21K上top-1準確率達88.7%
四、行業(yè)發(fā)展趨勢
技術前沿方向:
多模態(tài)融合:GPT-4o實現(xiàn)200ms級跨模態(tài)響應延遲(人類平均反應時間250ms)
推理能力突破:DeepSeek-V3在定理證明任務上達到IMO金牌選手水平
能源效率:新型混合架構(gòu)(如DeepSeek-R1)實現(xiàn)每瓦特算力提升5倍
中美競爭格局:
開源模型差距從12個月縮短至3個月(Llama3 vs DeepSeek-v2)
算力基建:中國在建智算中心規(guī)劃算力達2000EFLOPS(美國當前運營1200EFLOPS)
行業(yè)應用滲透率:中國制造業(yè)AI質(zhì)檢部署率達37%,超越美國29%
五、關鍵數(shù)據(jù)啟示
經(jīng)濟學視角:
大模型訓練邊際成本曲線:參數(shù)規(guī)模每提升10倍,單位token訓練成本下降28%
ROI周期:頭部企業(yè)模型商業(yè)化回報周期從36個月縮短至18個月
人才密度:頂尖AI研究員中美薪資差距從50%收窄至15%
技術倫理考量:
安全對齊:最新RLHF技術將有害輸出概率從3.2%降至0.07%
能耗優(yōu)化:液冷集群PUE值從1.5優(yōu)化至1.08,碳排放減少40%
可解釋性:因果歸因算法實現(xiàn)85%的決策路徑可視化
注:文中涉及企業(yè)及技術參數(shù)均來自公開資料,分析基于技術演進規(guī)律推導,具體實施需結(jié)合行業(yè)動態(tài)調(diào)整。建議關注浙江大學CCAI中心官網(wǎng)獲取最新研究成果。
看來關于是否開啟深度思考模式,「元寶紅包封面助手」有自己的判斷,如果任務很簡單,就不開啟,反之自動開啟。
02加速AI布局
過去一個月,騰訊在AI應用領域加速布局。
2月起,騰訊旗下多個核心產(chǎn)品,如微信、元寶、QQ瀏覽器、QQ音樂、ima(騰訊智能工作臺)、騰訊文檔、騰訊地圖等,均接入了DeepSeek模型,并同步支持自研的混元大模型;元寶走向日更級迭代,35天版本更新30次;混元大模型推出騰訊首個自研推理模型混元深度思考模型Thinker(T1)、發(fā)布新一代快思考模型TurboS、推出5個全新3D生成模型并全部開源……
業(yè)務線也作出整合,為了更好地發(fā)揮AI技術的協(xié)同效應,2月,騰訊將QQ瀏覽器、搜狗輸入法、ima等十余款AI產(chǎn)品及團隊從PCG(平臺與內(nèi)容事業(yè)群)劃歸CSIG(云與智慧產(chǎn)業(yè)事業(yè)群),形成以「元寶」為核心的「C端工具+B端服務」矩陣。
在資金投入上,騰訊也展現(xiàn)了其在AI基礎設施建設上的決心。在1月的2024年度員工大會上,馬化騰提到騰訊會持續(xù)投入資源進行算力的儲備。據(jù)報道,騰訊計劃在2025年加大算力基礎設施的投資,投資金額或達1000億,其中計算約580億(GPU約400億、服務器約110億、存儲設備約55億、網(wǎng)絡設備將近58億),IDC部分,自建及相關費用加起來將近131億,租用部分將近要花200億。3月19日,騰訊總裁劉熾平在財報后的電話會議上稱,資本支出占收入的百分比將上升到十幾個百分點,人工智能將成為戰(zhàn)略投資的重點。
微信這次將大模型產(chǎn)品「元寶」內(nèi)嵌于聊天界面,看似是功能升級,實則是騰訊對AI時代的戰(zhàn)略卡位。
通過將大模型產(chǎn)品以「AI版文件傳輸助手」形態(tài)嵌入高頻聊天場景,微信將用戶的工作流、信息流統(tǒng)一收束,通過總結(jié)公眾號文章、解析文件、圖片等剛需功能,微信在原有的功能之外,新增了一個可以持續(xù)產(chǎn)生價值的AI助手角色,這可能會讓用戶在微信的停留時長和打開頻次迎來結(jié)構(gòu)性增長。
微信作為國內(nèi)最大的社交平臺,這次內(nèi)置AI助手元寶或許意味著中國互聯(lián)網(wǎng)正式進入「AI原生應用」時代,AI技術正在從獨立功能向基礎設施轉(zhuǎn)變。
而隨著開源日漸成為行業(yè)趨勢,單純的大模型技術能力越來越難以成為產(chǎn)品和市場競爭的絕對壁壘。當微信這樣的龐大生態(tài),帶著海量用戶接入AI功能,對于所有的AI創(chuàng)業(yè)者來說可能都要思考:到底什么樣的功能和創(chuàng)新,可以讓小公司與微信這樣的生態(tài)競爭用戶接觸AI的入口;到底什么樣的壁壘,才能不被現(xiàn)有的超級產(chǎn)品生態(tài),以接入新功能的方式吞噬。
DeepSeek重塑了AI行業(yè)的格局,技術公司、大廠和AI原生創(chuàng)業(yè)者,都要重新思考自己的生態(tài)位。
本文來源:36氪
文章轉(zhuǎn)載于其他網(wǎng)絡,如有侵權(quán)請聯(lián)系我們及時刪除