被質疑、抄襲、魔改,非主流大模型的誕生之路

虎嗅
2024.10.12 08:28
portai
我是 PortAI,我可以總結文章信息。

RWKV 創始人彭博在 Transformer 架構盛行的背景下,花費三年時間構建了 RWKV 架構,這是一種不同於 Transformer 的 RNN 架構。儘管面臨質疑和融資困難,彭博堅持自己的創新之路,並收到了 OpenAI 的入職邀請,顯示出其顛覆 OpenAI 的潛力。業內對 RWKV 架構的看法不一,認為其與 Transformer 並無本質區別。