
“最好的開源大模型”!報道稱 Meta 下週將推出 2 個小版本 Llama 3 為暑期推出正式版鋪路

我是 PortAI,我可以總結文章信息。
報道稱,正式版 Llama 3 將支持多模態處理,先行推出的兩個小版本則不具備這一能力。
當地時間週一,科技媒體 The Information 援引一位 Meta 員工消息報道稱,該公司計劃在下週推出兩個小型的 Llama 3 大語言模型(LLM),作為夏季推出正式版 Llama 3 的先行版本。
這兩個小模型的發佈,預計將為 Llama 3 的正式亮相進行鋪墊。Meta 在去年 7 月份發佈了 Llama 2,此後,包括谷歌、馬斯克旗下的 xAI 與 Mistral 等在內的數家公司發佈了開源的大語言模型,競爭十分激烈。
Llama 3 直接對標 OpenAI 的 GPT-4,後者已經成為一個強大的多模態模型,不僅能夠處理更長的文本,還支持圖像輸入。
報道稱,正式版 Llama 3 也將支持多模態處理,即同時理解和生成文本及圖片;而先行推出的兩個小版本則不具備這一能力。
一般而言,較小的模型成本更低,運行更快,尤其在運行大型模型成本高昂的當下,其價值尤為凸顯。小型模型還便於開發者在移動設備上開發人工智能軟件。
Meta 此前已推出三個版本的 Llama 2,其中最大的一個擁有 700 億個參數,另外兩個版本分別擁有 130 億和 70 億個參數。
據硬 AI 此前文章,Llama 3 的最大版本可能會擁有超過 1400 億個參數。
Meta 還將在 Llama 3 中改進 Llama 2 在響應爭議性話題時過於保守的問題,研究人員計劃放鬆大模型在這一方面的限制,以便它更多地與用户互動,提供背景信息,而不僅僅是拒絕回答。

