硬剛閉源OpenAI：Meta發(fā)布“最強(qiáng)開源模型”Llama 3.1

快訊 2024年09月18日 17:38 1 admin

　　開源陣營迎來新的“大家伙”。

　　當(dāng)?shù)貢r(shí)間7月23日，Meta正式發(fā)布Llama 3.1。在官方博客中，Meta稱該模型是目前“最強(qiáng)大的開源基礎(chǔ)模型”，并表示：“直到今天，開源大模型在功能和性能方面大多落后于封閉模型?，F(xiàn)在，我們正在迎來一個(gè)開源引領(lǐng)的新時(shí)代?！?/p>

　　作為開源領(lǐng)域的常青樹，Llama系列一直在引領(lǐng)開源大模型的腳步，Meta也被奉為與OpenAI齊名的巨頭，分別代表著開源與閉源的技術(shù)走向。

　　發(fā)布Llama 3.1的同時(shí)，Meta創(chuàng)始人、CEO扎克伯格也發(fā)布長文強(qiáng)調(diào)了開源的意義，他表示，開源是AI積極發(fā)展的必要條件，“今天我們正邁出下一步——使開源AI成為行業(yè)標(biāo)準(zhǔn)?！?/p>

　　Llama 3.1包含8B、70B和405B三種參數(shù)規(guī)模，適用于多種場景，包括多語言代理、復(fù)雜推理和編碼助手等。該系列模型上下文窗口增加到了128K，擴(kuò)大16倍；支持多種語言，包括英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語等；提升了工具使用能力，支持搜索和Wolfram Alpha的數(shù)學(xué)推理；擁有更寬松的許可，允許使用模型輸出改進(jìn)其他LLMs。

　　評測結(jié)果顯示，Llama 3.1 405B可與GPT-4o、Claude 3.5 Sonnet和Gemini Ultra等業(yè)界頭部模型媲美，這也是Meta迄今為止最強(qiáng)大的模型。

　　Meta指出，最新一代的Llama將激發(fā)新的應(yīng)用程序和建模范式，包括利用合成數(shù)據(jù)生成來提升和訓(xùn)練更小的模型，以及模型蒸餾——這是一種在開源領(lǐng)域從未有過的能力。

　　其實(shí)在模型公布前一天，Llama3.1的模型和基準(zhǔn)測試結(jié)果已經(jīng)在Reddit等技術(shù)社區(qū)上泄露，Llama 3.1的磁力鏈接在HuggingFace等社區(qū)中流傳。“開源”“強(qiáng)大”成為業(yè)界人士使用感受中的高頻詞。

硬剛閉源OpenAI：Meta發(fā)布“最強(qiáng)開源模型”Llama 3.1

　　不少AI領(lǐng)域?qū)I(yè)人士在X上發(fā)表觀點(diǎn)，包括“這是開源Al最重要的時(shí)刻，其在基準(zhǔn)測試上已經(jīng)有多項(xiàng)超越了GPT-4o”，“將先進(jìn)的大模型開源，是擊敗那些傳播AGI恐怖論人員的最佳方式”等。此外，也有不少網(wǎng)友嘗試向Llama3.1提問“9.11和9.9誰大”這一經(jīng)典問題，不過，Llama3.1也出現(xiàn)了偶爾答錯(cuò)的情況。

　　不同于OpenAI對技術(shù)文檔的“惜字”，Meta還發(fā)布了長達(dá)92頁的論文，詳細(xì)披露了創(chuàng)造Llama 3.1的過程。HuggingFace首席科學(xué)家Thomas Wolf感慨說：“如果你是從零開始研究大模型，就從這篇論文讀起。”

　　技術(shù)論文也透露了一些訓(xùn)練細(xì)節(jié)，包括Llama 3.1在超過15萬億個(gè)token的數(shù)據(jù)上進(jìn)行訓(xùn)練，用了1.6萬塊英偉達(dá)H100芯片，預(yù)訓(xùn)練數(shù)據(jù)日期截止到2023年12月等。此外，為了保證訓(xùn)練穩(wěn)定性和便捷性，Meta只用了Transformer模型架構(gòu)進(jìn)行調(diào)整，而沒有采用現(xiàn)在流行的混合專家模型（MoE）架構(gòu)。

　　Llama 3.1發(fā)布之后，Meta與一系列公司迅速展開合作，以發(fā)展更廣泛的生態(tài)系統(tǒng)，亞馬遜、Databricks和英偉達(dá)正在推出全套服務(wù)，以支持開發(fā)人員微調(diào)和提煉他們自己的模型。Scale.AI、Dell、德勤等公司已準(zhǔn)備好幫助企業(yè)采用Llama，并用他們自己的數(shù)據(jù)訓(xùn)練定制模型。

　　國內(nèi)廠商方面，北京時(shí)間7月24日，騰訊云TI平臺(tái)適配并上架了Meta最新開源大模型Llama3.1，騰訊云對該系列模型進(jìn)行了精調(diào)、推理測試驗(yàn)證，保障模型的可用性、易用性，可覆蓋智能對話、文本生成、寫作等多個(gè)不同場景。

　　Llama 3.1面世，扎克伯格同一時(shí)間在官網(wǎng)發(fā)布長文《開源AI是前進(jìn)之路》，詳細(xì)闡釋了開源對所有開發(fā)者、對Meta、對世界的意義。

　　談及為何要開源，以及開源對于AI行業(yè)的意義，扎克伯格描繪了開發(fā)者、Meta以及世界三方共贏的開源之路。

　　他指出，對于開發(fā)者而言，開源模型可以幫助他們訓(xùn)練、微調(diào)和蒸餾自己的模型，掌控自己的命運(yùn)，而不是被閉源供應(yīng)商“鎖死”，可以保護(hù)他們的數(shù)據(jù)安全，并以更低的成本訓(xùn)練出屬于自己的高效率運(yùn)行模型。

　　對于Meta而言，為確保始終能夠獲取最佳技術(shù)，而不是被鎖定在競爭對手的封閉生態(tài)系統(tǒng)中，Llama需要發(fā)展成為一個(gè)完整的工具生態(tài)系統(tǒng)，包括效率提升、硅片優(yōu)化和其他集成等。扎克伯格預(yù)計(jì)，人工智能的發(fā)展將持續(xù)激烈，這意味著開源任何特定模型并不會(huì)在當(dāng)時(shí)喪失比下一個(gè)最佳模型更大的優(yōu)勢。Llama致力于通過持續(xù)保持競爭力、效率和開放性，逐步成為行業(yè)標(biāo)準(zhǔn)。

　　他還直白地表示：“Meta與閉源模型提供者的一個(gè)關(guān)鍵區(qū)別在于，出售AI大模型的訪問權(quán)并不是我們的商業(yè)模式。這意味著公開發(fā)布Llama并不會(huì)削弱我們的收入、可持續(xù)性或研究投資能力，而這對于閉源提供者來說則不然?！?/p>

　　對于世界而言，扎克伯格認(rèn)為，開源將確保全球更多的人能夠從AI的發(fā)展中獲得好處和機(jī)會(huì)，權(quán)力不會(huì)集中在少數(shù)幾家公司手中，技術(shù)能夠更均勻和安全地在社會(huì)中部署。

　　開源與閉源的爭論一直是技術(shù)領(lǐng)域的熱點(diǎn)話題。他在文中寫道：“我相信Llama 3.1的發(fā)布將成為行業(yè)的一個(gè)轉(zhuǎn)折點(diǎn)，大多數(shù)開發(fā)者將開始主要使用開源?！?/p>

　　從技術(shù)進(jìn)步的角度，360集團(tuán)創(chuàng)始人周鴻祎曾表示，在開源社區(qū)里，為了一個(gè)共同的目標(biāo)，凝聚起全球上千家公司、數(shù)十萬程序員和工程師，一起來解決問題，開發(fā)力量是一個(gè)閉源公司的數(shù)百倍。而且在開源的文化里，大家不用重復(fù)發(fā)明輪子，一個(gè)人在另一個(gè)人想法基礎(chǔ)上快速改進(jìn)，研發(fā)速度也特別快。

　　阿里云CTO周靖人告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者，開源對全球技術(shù)及生態(tài)的貢獻(xiàn)毋庸置疑，這一點(diǎn)也在全球范圍內(nèi)被多次證明，已經(jīng)沒有再討論的必要?！拔覀冋J(rèn)為，大模型的潛力還沒有真正被挖掘出來，企業(yè)和開發(fā)者能夠結(jié)合自己實(shí)際業(yè)務(wù)的需求，在開源體系里探索出一個(gè)翻天覆地的變化?！彼f。

　　科技巨頭們對AI的押注從未懈怠。Meta也從此前押注的元宇宙賽道積極往AI領(lǐng)域轉(zhuǎn)型。日前，Meta宣布削減其元宇宙部門Reality Labs的硬件預(yù)算，該部門負(fù)責(zé)AR、VR和元宇宙業(yè)務(wù)。Meta還將一些致力于AI的Reality Labs團(tuán)隊(duì)轉(zhuǎn)移到公司更廣泛的生成式AI團(tuán)隊(duì)，其中包括一個(gè)140人的AI語音開發(fā)團(tuán)隊(duì)。

　　就在Llama 3.1發(fā)布同一天，谷歌母公司Alphabet管理團(tuán)隊(duì)還在二季度財(cái)報(bào)電話會(huì)上強(qiáng)調(diào)了AI投資的重要性。Alphabet首席執(zhí)行官Sundar Pichai直言：“對AI‘投資不足’的風(fēng)險(xiǎn)遠(yuǎn)超‘投資過度’風(fēng)險(xiǎn)”，即使出現(xiàn)過度投資的情況，當(dāng)前用于數(shù)據(jù)中心等基礎(chǔ)設(shè)施的投資也可以用于其他任務(wù)，而不在AI競賽中保持領(lǐng)先地位將對公司造成更為嚴(yán)重的負(fù)面影響。”

　　GPT-4o剛剛刷過存在感，Llama 3.1又橫空出世。在這場AI競賽中，科技巨頭們步履不停，無論是閉源還是開源，未來都還有硬仗。

標(biāo)簽：開源最強(qiáng) 模型