一个色字综合网性爱视频无码一区|亚洲亚码一二区caob3344|青草久久久久久一级吹喷免费视频|日本久久免费电影一级二级色大片区|亚洲色图五月天igao国产精品|国产香蕉视频国产在线第二页|日韩欧美一区二一区 国产精品|另类专区亚洲欧州三级毛片

堅(jiān)持不做Sora,百度為何又開始重視多模態(tài)大模型?|界面新聞 · 科技

堅(jiān)持不做Sora,百度為何又開始重視多模態(tài)大模型?|界面新聞 · 科技

taohe 2025-05-26 嗶嗶 33 次瀏覽 0個評論

界面新聞記者 | 肖芳

界面新聞編輯 | 文姝琪

百度正在強(qiáng)化文心大模型多模態(tài)理解能力。

百度AI Day百度集團(tuán)副總裁吳甜詳細(xì)解釋了其最新發(fā)布的兩款模型文心大模型4.5 Turbo和深度思考模型X1 Turbo技術(shù)創(chuàng)新之處。

表示文心大模型4.5和4.5 Turbo實(shí)現(xiàn)了文本、圖像和視頻的混合訓(xùn)練。針對不同模態(tài)數(shù)據(jù)在結(jié)構(gòu)、規(guī)模、知識密度上的差異,通過多模態(tài)異構(gòu)專家建模、自適應(yīng)分辨率視覺編碼、時空重排列的三維旋轉(zhuǎn)位置編碼、自適應(yīng)模態(tài)感知損失計(jì)算等技術(shù),大幅提升跨模態(tài)學(xué)習(xí)效率和多模態(tài)融合效果,學(xué)習(xí)效率提高近2倍,多模態(tài)理解效果提升超過30%。

文心大模型4.5于今年3月16日正式發(fā)布,是百度首個原生多模態(tài)大模型。文心大模型4.5 Turbo在上個月舉辦的Create 2025百度AI開發(fā)者大會上對外發(fā)布,相比文心大模型4.5,其速度更快,價格下降80%,每百萬token的輸入價格僅為0.8元,輸出價格3.2元,僅為DeepSeek-V3的40%。

去年,百度CEO李彥宏多次公開表示,Sora這種視頻生成模型無論多火爆,百度都不去做。他給出的理由是,多模態(tài)模型尤其是視頻生成領(lǐng)域,幻覺問題尚未解決,這限制了大規(guī)模應(yīng)用。

堅(jiān)持不做Sora,百度為何又開始重視多模態(tài)大模型?|界面新聞 · 科技

但字節(jié)跳動和阿里巴巴卻沒有因?yàn)榛糜X問題停止布局多模態(tài)大模型的腳步:去年12月,字節(jié)跳動正式對外發(fā)布豆包視覺理解模型、豆包3D生成模型;今年9月和12月,阿里通義千問團(tuán)隊(duì)分別對外發(fā)布視覺理解模型Qwen2-VL和多模態(tài)推理模型QVQ-72B-Previe。

從市場反饋來看,這幾款模型在處理自然語言與圖像信息的結(jié)合上靈活性強(qiáng),能精準(zhǔn)識別圖像中的內(nèi)容,受到教育、自動駕駛領(lǐng)域企業(yè)的關(guān)注,在視覺-語言融合場景中展示出較大的潛力。

這意味著,此前百度多模態(tài)大模型上存在一些誤判,多模態(tài)模型布局競爭對手晚了數(shù)月。

百度正在積極補(bǔ)齊大模型布局短板

今年年初,DeepSeek走紅讓外界再次討論百度大模型領(lǐng)域是否再次陷入了“起個大早,趕個晚集”的尷尬境地

2021,百度對外發(fā)布文心大模型,行業(yè)屬于最早一批布局大模型公司。經(jīng)過幾年發(fā)展,百度大模型領(lǐng)域不僅沒能保持先發(fā)優(yōu)勢,還在開源降價、多模態(tài)問題出現(xiàn)誤判。

界面新聞多位百度內(nèi)部人士了解今年第一季度總監(jiān)會,李彥宏去年內(nèi)部沒有提到模型開源導(dǎo)致百度走了一些彎路。

DeepSeek走紅之后,百度此前關(guān)于開閉源問題進(jìn)行糾偏。今年新發(fā)布文心大模型4.5系列將于630正式開源

降價問題,去年豆包、通義大模型相繼大幅降低調(diào)用價格之后文心大模型的主力模型并未進(jìn)行跟進(jìn)。直到今年Create 2025百度AI開發(fā)者大會,百度正式宣布文心大模型4.5 Turbo文心大模型X1 Turbo價格大幅降低。

然而,今年基礎(chǔ)大模型競爭焦點(diǎn)價格一位大模型從業(yè)者看來,基礎(chǔ)信息處理能力的提升以及成本的下降讓豆包、通義幾款大模型去年獲得了快速增長。深度推理能力、視覺推理能力以及Agent相關(guān)技術(shù)將成為今年未來幾年基礎(chǔ)大模型競爭關(guān)鍵。

在當(dāng)下的競爭態(tài)勢下,百度放棄此前糾結(jié),積極布局多模態(tài)大模型不難理解了。文心大模型4.54.5 Turbo,文心大模型X1X1 Turbo,模型性能提升的同時,多模態(tài)能力也進(jìn)一步增強(qiáng)。

根據(jù)百度方面介紹,文心大模型4.5 Turbo多模態(tài)能力與GPT 4.1持平,不僅具有圖片理解能力,還能聽懂、看懂音視頻內(nèi)容;文心大模型X1 Turbo具備跨工具調(diào)用能力,能整合搜索引擎、數(shù)據(jù)庫等外部資源完成復(fù)雜任務(wù)。在多模態(tài)交互場景中,這種工具調(diào)用能力與多模態(tài)能力相融合,使其能夠更靈活地應(yīng)對各種實(shí)際問題

李彥宏Create 2025百度AI開發(fā)者大會談及布局多模態(tài)大模型價值DeepSeek也不是萬能的,它只能處理文本,還不能理解和生成圖片、音頻、視頻等多媒體內(nèi)容很多客戶都需要這種多模理解和生成能力。

對于李彥宏此前一直糾結(jié)幻覺問題吳甜此次百度AI Day進(jìn)行重點(diǎn)闡釋百度研制了自反饋增強(qiáng)的技術(shù)框架,基于大模型自身的生成和評估反饋能力,實(shí)現(xiàn)了“訓(xùn)練-生成-反饋-增強(qiáng)”的模型迭代閉環(huán),讓大模型擁有了自我迭代能力,顯著降低了模型幻覺,模型理解和處理復(fù)雜任務(wù)的能力大幅提升。

雖然過去諸多判斷進(jìn)行糾偏,不可否認(rèn)百度在大模型已經(jīng)脫離第一梯隊(duì)。很多業(yè)內(nèi)人士判斷未來基礎(chǔ)大模型領(lǐng)域?qū)?/span>只剩下DeepSeek、豆包通義三強(qiáng)爭霸這種競爭格局百度想要翻盤面臨挑戰(zhàn)不言而喻

數(shù)字人能否助力百度翻盤?

百度積極布局多模態(tài)大模型,除了當(dāng)下市場競爭需要之外另一個重要原因,多模態(tài)大模型承載百度AI應(yīng)用期待。

去年以來,李彥宏多次公開場合強(qiáng)調(diào)技術(shù)的商業(yè)價值在他看來一個沒有明確用途的AI模型,不過是一個吸引人的計(jì)算機(jī)科學(xué)展示。沒有應(yīng)用,芯片、模型都沒有價值。模型會有很多,但未來真正統(tǒng)治這個世界的是應(yīng)用。

今年以來AI應(yīng)用領(lǐng)域創(chuàng)業(yè)如火如荼,AI辦公、AI搜索、Agent都是熱門AI應(yīng)用落地方向李彥宏不一樣判斷,他在Create 2025百度AI開發(fā)者大會上表示,AI數(shù)字人年最令人激動的突破性應(yīng)用。聲形超擬真、內(nèi)容更專業(yè)、互動更靈活數(shù)字人,實(shí)現(xiàn)超越真人的體驗(yàn),在電商直播、游戲、消費(fèi)等領(lǐng)域,有著巨大的想象空間。

百度AI Day吳甜透露百度數(shù)字人方面布局百度研制了“劇本”驅(qū)動多模協(xié)同的超擬真數(shù)字人技術(shù),實(shí)現(xiàn)了語言、聲音、形象的協(xié)調(diào)一致。目前這套技術(shù)已經(jīng)支持超過10萬數(shù)字人主播,直播轉(zhuǎn)化率達(dá)31%,降低80%直播開播成本。

也有一些從業(yè)者數(shù)字人不同聲音尤其是一些電商商家,嘗試數(shù)字人直播之后,發(fā)現(xiàn)真實(shí)的直播帶貨效果不盡如人意。一家美妝類的商家此前告訴界面新聞,其從去年開始嘗試數(shù)字人直播帶貨,但數(shù)字人回復(fù)用戶留言時不僅生硬,還會出現(xiàn)答非所問的情況,不僅沒有帶來更高的轉(zhuǎn)化率,還引發(fā)了更多消費(fèi)者投訴。

在數(shù)字人服務(wù)商世優(yōu)科技CEO紀(jì)智輝看來,目前數(shù)字人直播帶貨并不好做,抖音快手等平臺的出發(fā)點(diǎn)依然是更好的內(nèi)容和體驗(yàn)?!叭绻脩粼谄脚_上刷到10個短視頻有9個都是數(shù)字人,這會破壞平臺的內(nèi)容生態(tài),各個平臺都對數(shù)字人直播進(jìn)行嚴(yán)格管控也是意料之中的事。”

不過,這些不同聲音沒有阻止百度積極布局數(shù)字人腳步根據(jù)百度此前公布信息,百度與羅永浩達(dá)成合作,聯(lián)手打造羅永浩的數(shù)字人形象用于直播帶貨,并于5月23日晚8點(diǎn)在百度電商開啟首場直播。

羅永浩數(shù)字人首場直播帶貨成績有待觀望。如果數(shù)據(jù)不錯,或許能改變一些商家數(shù)字人直播帶貨態(tài)度,能給百度帶來多大商業(yè)價值,仍然需要時間驗(yàn)證。

轉(zhuǎn)載請注明來自寧波市鄞州建筑有限公司,本文標(biāo)題:《堅(jiān)持不做Sora,百度為何又開始重視多模態(tài)大模型?|界面新聞 · 科技》

百度分享代碼,如果開啟HTTPS請參考李洋個人博客
每一天,每一秒,你所做的決定都會改變你的人生!

發(fā)表評論

快捷回復(fù):

驗(yàn)證碼

評論列表 (暫無評論,33人圍觀)參與討論

還沒有評論,來說兩句吧...

Top
 臺兒莊最新租房信息網(wǎng)  西寧立豪招聘信息最新  惠譽(yù)鴻坤最新信息  琴臺村拆遷信息最新  角社大橋最新的信息  蘭山區(qū)防疫最新信息電話  丹東國途招聘信息最新  開陽縣道路最新信息  阿克蘇船務(wù)最新招聘信息  經(jīng)河集團(tuán)招聘信息最新  佛山遠(yuǎn)泰招聘信息最新  211考研最新招生信息  花園湖附近租房信息最新  奎文飯店轉(zhuǎn)讓信息最新  遼寧最新高速中標(biāo)信息  通州白廟最新規(guī)劃信息  支付寶最新理財(cái)信息  平羅新安最新招聘信息  蘆城體育招聘信息最新  最新公租房信息合肥武漢  淄博蒲先農(nóng)最新信息  民營銀行最新拍賣信息價  嘉浪傳媒招聘信息最新  林芝市司機(jī)招聘信息最新  比善科技招聘信息最新  哈里和威廉最新信息  洞口養(yǎng)生最新招聘信息  小池汽車站最新信息  桐廬19樓最新租房信息  紹興108最新招工信息