200 萬上下文窗口創飛 Gemini 1.5!微軟來砸谷歌場子了

華爾街見聞
2024.02.24 01:55
portai
我是 PortAI,我可以總結文章信息。

微軟推出了名為 LongRoPE 的新方法,可以將上下文窗口拉長至 200 多萬 token,從而提高語言模型的長文本理解能力。這一方法在測試中表現出了較好的困惑度下降趨勢,優於基準。LongRoPE 由一名就讀於杭州電子科技大學的純華人團隊開發,訓練成本和時間也大大減少。這一消息屬於技術創新類信息。