Chatgpt 卡頓、掉線,專業版還要付費?沒關係,“ChatGPT 平替” 已經來了! 當地時間 4 月 25 日,AI 社區 Hugging Face(抱抱臉)發佈了聊天機器人 HuggingChat,該機器人基於 300 億參數的 LLaMA 模型,號稱 “開源版 Android 應用商店”。 HuggingChat 不僅開源,而且免費,點進網頁即可實現與 HuggingChat 絲滑暢聊。 談到 HuggingChat,不得不提 Hugging Face,實際上這家 AI 開源平台本來就是以聊天機器人起家,Hugging Face 是如何 “火” 起來的?HuggingChat 相比 ChatGPT 又有什麼過人之處? 起底Hugging Face Hugging Face 成立於 2016 年,與其他同期創業公司類似,成立初期奔跑在聊天機器人賽道。 最初,Hugging Face 推出一款面向青少年的聊天機器人 APP,其用 AI 技術生成的表情和笑話,旨在為青少年提供情感疏導、娛樂服務。 例如,當用户發送自拍照,或者是一個悲傷的表情時,聊天機器人能夠做出相應的反應。 然而,公司發展並沒有很大起色,苦於破局的創始人轉向訓練聊天機器人的 NLP 能力,同時構建了一個底層庫來容納各種機器學習模型和數據集,並且作為開源項目公開發布。 無心插柳柳成蔭,Hugging Face 迅速走紅。 如今,聊天機器人早已從 App Store 中下架,而 Hugging Face 卻成為 GitHub 史上增長最快的機器學習庫,其 Transformer 開源庫累計有 96302 個 Star 和 20000 多個分支。此外,Hugging Face 提交共享了 166894 個訓練模型,26900 個數據集。 成立六年多時間裏,Hugging Face 估值一路衝高。 在去年的 C 輪融資中,公司估值達 20 億美元,由 Lux Capital 領投,紅杉基金等跟投,NBA 球星杜蘭特也入股了。 值得一提的是,Hugging Face 在 2021 年才開始初步探索商業化,現在已經擁有 5000 多家公司客户,其中包括英特爾、微軟、製藥巨頭輝瑞等,且自 2021 年以來一直處於正現金流狀態。 至於公司的創始人,個個都是硅谷創業老兵。 公司首席執行官 Clément Delangue 曾創立過筆記平台 VideoNot,首席技術官 Julien Chaumond 大學畢業就在硅谷創業,2015 年結束創業生涯從事起了 AI 開發,首席科學家 Thomas Wolf 則是一名自然語言處理界的大牛。 對於取得的這些成績,Clément 在機器學習播客中表示: Hugging Face 之所以快速增長是緣於彌補了科學與生產之間的鴻溝,通過搭建平台為開源界和科學界賦能,所產生的價值比通過搭建專有工具產生的價值要高上千倍。 某種程度上,Hugging Face 是在構建人工智能領域的 “GitHub”,讓其成為一個由社區開發者驅動的開源平台。 “重操舊業” 為開源而戰 瞭解完 Hugging Face 的發展史,可以看出,這次 Hugging Face 推出 HuggingChat,可以説是 “重操舊業”。 HuggingChat 在亞馬遜 AWS 雲服務平台運算,允許人們與 “開放助手”(Open Assistant)的開源聊天助手互動,這兩種模型的語言系統都是基於參數達 300 億個的 LLaMA 模型。 與 Alpaca 或 Vicuna 一樣,這些模型是經過指令微調的,而且與 ChatGPT 不同,沒有通過人類反饋的強化學習(RLHF)進行改進。 接下來,趕緊來實測一下 HuggingChat。 乍一看,界面與 ChatGPT 非常相似。左邊是一個有最新聊天記錄的欄,瀏覽器窗口的大部分被當前的聊天記錄所佔據。目前,用户不用註冊可以直接用,但不能保存對話紀錄。 與 ChatGPT 一樣,HuggingChat 可以根據要求生成自然語言或特定格式的文本,代碼也可以。 而且,HuggingChat 的響應速度很快。 美中不足的是,HuggingChat 中文水平不咋地,處理英文的能力要比中文好。 那麼,來 HuggingChat 它幾個問題,看看它表現如何? 首先是 HuggingChat 的 “自我介紹”,可以看出,回答簡明扼要。 當問及自身的優勢時,OpenAssistant 邏輯沒有硬傷,抓的點也比較準:開源、免費、輕量級。 作為一個由 LAION AI 製作的開源項目,我的主要優勢之一是可以免費使用和修改。這意味着研究人員、開發人員和其他任何人都可以很容易地在我的代碼庫基礎上進行開發,併為其發展做出貢獻。此外,由於我的設計是輕量級的,這使得沒有強大硬件的人有可能在他們自己的設備上運行。此外,作為一個免費的替代方案,我為那些買不起像 ChatGPT 這樣昂貴的付費模式的人提供了一個更方便的選擇。 那再來看看它的數能力什麼樣,結果太不準確。 其他的能力有待大家自己實測。 網友是怎麼看的? 其中不乏溢美之詞,Nvidia AI 科學家 Jim Fan 在推特上説: 下一步必須是 HuggingChat Apps,我認為 HuggingFace 正處於成為安卓應用商店的絕佳位置。事實上,HF 甚至比 OpenAI 更有優勢:應用程序可以是 HF 上已有的其他多模態模型。 有網友指出,HuggingChat 很擅長生成長故事。 也有網友稱,在寫代碼的時候會有 bug。 還有,關於 2020 年美國總統競選的獲勝者,它的回答模稜兩可。 此外,它還編造了一些關於自己的離奇事實。 不過,Hugging Face 認為,HuggingChat 並不是故事的終點,最終該平台希望通過一箇中心來集成所有 “高質量的聊天模型”。 開放、開源才是正解? 自 ChatGpt 爆火以來,AI 賽道風起雲湧。各大科技巨頭爭先恐後入局,搶奪領先地位。 在這一背景下,Hugging Face 扛起了 “開源” 的大旗,推出開源版 HuggingChat,打破閉源模式 ChatGPT 的主導地位。 在發佈 HuggingChat 的當天,Julien Chaumond 發推文稱: 有人説封閉的 API 正在獲勝,但我們永遠不會放棄為開源 AI 而戰; 今天是一個重要的日子,我們推出了開源的 ChatGPT 替代品。 分析指出,Hugging Face 平台提供了大量高質量的開源模型與工具,將研發成果最大程度地惠及全社區,極大地降低了人工智能的技術門檻,讓 AI 更加平民化,能夠惠及更多普通大眾。 事實上,一直有公司提出收購 Hugging Face,Clément Delangue 表示自己曾拒絕了多個 “有意義的收購要約”,並且不會像 GitHub 對微軟那樣出售自己的業務。 Clément Delangue 認為: 你也不需要從創造的價值中獲取 100% 的紅利,而是可以只將其中 1% 的價值變現,維持公司的經營。但即便只是 1%,也足夠讓你成為一家高市值的公司。 Elastic 和 MongoDB 都是以開源為核心,也都成功發展起來了,最近復旦 MOSS 大模型也開源上線。 關於未來,Clément Delangue 曾提到上市的想法: 我們希望成為第一家以表情符號上市的公司,而不是三個字母的股票代碼。