
“開源大模型新王者” 是誰?不是 Meta!

你見過比 Llama 2 參數小 10 倍、性能更好還支持開源的大語言模型嗎?Mistral 7B 做到了。更小的尺寸、更優的性能,成立 6 個月的 Mistral AI 對壘硅谷。
你見過比 Llama 2 參數小 10 倍、性能更好還支持開源的大語言模型嗎?
Mistral 7B 做到了。
根據媒體報道,Mistral 發佈的 “預告模型” 顯示,在參數量為 Llama 2 70B 的十分之一的基礎上,Mistral 7B 成功在 MT Bench 上擊敗了 Llama 2。
MT Bench 作為一個測試降準,由 80 個高質量的多輪對話問題組成,旨在測試多輪對話和指令遵循能力。
這意味着大語言模型(LLM)終於在參數尺寸和性能平衡的問題上找到了一個解決方案。據官方介紹,Mistral 7B 在所有標準英語和代碼基準測試中的性能優於當前可用的高達 13B 參數的 LLM。
今年 9 月,剛剛成立 6 個月的法國 AI 公司 Mistral AI 正式發佈 Mistral 7B;上週,作為唯一一家歐洲公司,Mistral AI 參加了 10 月在英國舉辦的人工智能工程師峯會,與 OpenAI、谷歌、Meta 等科技巨頭同台。
“技術先驅”
專業度讓 Mistral 成為 AI 投資界的新寵兒。
Mistral 的創始人 Arthur Mensch 在接受媒體採訪時表示,儘管作為一家年輕的初創公司,但 Mistral 對標的是包括谷歌、OpenAI 在內的整個 AI 行業:
“我們一直是這項技術的先驅。”
“我們與所有人競爭。”
Mistral 官方這樣形容 Mistral 7B 的成長速度:
“兩年內,它從 Gopher 到 Chinchilla,再到 Llama 2,以及 Mistral 7B。"
其中:Gopher 由 DeepMind 於 2021 年推出,280B 參數量;Chinchilla 由 DeepMind 由於 2022 年推出,70B 參數量;Llama 2 由 Meta 於 2023 年 7 月推出,34B 參數量。
目前,有消息稱 a16z 考慮向 Mistral 投資 2.5 億美元。據直接瞭解談判情況的人士透露,包括 General Catalyst 和 Andreessen Horowitz 在內的硅谷重量級企業正在考慮出資 4 億歐元,這可能會推升 Mistral 的估值達到 15-20 億歐元。
Lightspeed Venture Partners 的合夥人安託萬·莫伊魯德 (Antoine Moyroud) 主導了 Mistral 的第一輪融資,他表示:“他們的表現超出了我們的內部預期,” 並補充道 “對這項業務越來越感到興奮。”
和硅谷分庭抗禮?
目前,以谷歌、OpenAI 為首的硅谷 AI 公司正處於金字塔頂端,並不斷向上謀求發展,這些硅谷公司也是大多數投資者重點關注的對象。
據悉,OpenAI 正在嘗試以 860 億美元的估值出售員工股票;Anthropic 最近收到了谷歌和亞馬遜的投資承諾,投資總額可能達到 60 億美元。
Mistral 的異軍突起點亮了歐洲在 AI 領域的一盞燈。
因為市值超過 10 億歐元的公司在歐洲更為稀缺,而此前法國總統馬克龍也多次暗示對 AI 領域的雄心勃勃,希望能夠培育歐洲本土的 AI 企業。
Mistral 的優勢不止於技術面,Mensch 曾表示,相對於規模更大、資金更充足的競爭對手,Mistral 在效率上更有優勢。
他表示,該公司僅用 10 人的團隊就推出了第一個 LLM 模型,培訓成本不到 50 萬美元,而競爭對手則花費了數千萬美元。他補充道:“我們很高興成為資本效率最高的 LLM 公司。”
另一個優勢在於開源。因 Mistral 公開發布其 AI 模型,支持 Apache 2.0 開源協議,這能夠使企業客户更好地控制他們的數據,對其中的使用過程可見性更高,並且能夠吸引開發領域的專業人才。
不過,儘管 Mistral 在 6 月的種子輪融資中獲得了創紀錄的 1.05 億歐元,但其目前尚未盈利。Mensch 表示這種情況將在 “年底前” 發生改變,他預計將發佈一個新平台供客户訪問其 LLM 模型。
Mitral 投資方之一的 New Wave 的合夥人皮亞·德伊裏巴內 (Pia d'Iribarne) 表示,建立大型人工智能企業的 “基本面已經具備”。

