<div id="readability-page-1">7 月 23 日凌晨，有人爆料，Meta 的 Llama 3.1-405B 評測數據遭遇泄漏，明天可能會發布 Llama 3 系列中最大的參數模型，同時還會發佈一個 Llama 3.1-70B 版本。 這也是在 3.0 版本基礎之上進行了功能迭代，即便是 70B 的基礎模型的性能也超過了 GPT-4o。 <img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/4c332a4b-5245-4d6f-ba6c-746b96f50e25.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="554" height="703" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/4c332a4b-5245-4d6f-ba6c-746b96f50e25.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw"/> 就連磁力鏈接都流出來了，「AIGC 開放社區」試了一下大約有 763.84G。本來 huggingface 上也有的，後來庫被刪除了。 下載速度也還可以，每秒 14M 左右，看來確實是有不少人在下這個模型。 <img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/4ace14d5-342b-4c63-86a6-2e40bf9cba86.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="554" height="104" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/4ace14d5-342b-4c63-86a6-2e40bf9cba86.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw"/> 但這個模型一般的 GPU 肯定是跑不起來，如此大的參數在部署方面個人開發者也負擔不起（如果你有一些 H100 也沒問題），估計是給企業、政務公共部門用的。 對於 Meta 即將發佈的模型，就有網友潑冷水。相比 OpenAI 最新的 GPT-4o mini 版本，Llama 3.1-70B 推理成本提升了 3 倍，但編碼的性能卻要差很多。 從性價比、功能來看，Meta 的新模型也沒什麼值得期待的。 <img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/5e66e1b5-9cca-4007-bb9d-fb93e007e17a.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="554" height="169" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/5e66e1b5-9cca-4007-bb9d-fb93e007e17a.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw"/> 還有人甚至在 GitHub 上看到了上述發佈的模型，但很快就拿下來了，估計有一些人可能已經能使用了。 <img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/2168d89a-a3af-4ef7-add2-3565096e8f67.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="554" height="107" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/2168d89a-a3af-4ef7-add2-3565096e8f67.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw"/> 也有人表示，對於這個泄漏事件他認為是真的，因為這是從微軟的 Azure Github 流出來的。 <img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/91187777-75ba-4470-9c33-fe4eaff81869.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="554" height="87" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/91187777-75ba-4470-9c33-fe4eaff81869.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw"/> 但是這個模型參數較大，對 GPU 的要求太高了，不如 GPT-4o mini 性價比高。 <img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/1cc15fbc-92f4-4235-a291-056f692ae7dc.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="554" height="105" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/1cc15fbc-92f4-4235-a291-056f692ae7dc.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw"/> <img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/1ebfa520-7255-488a-89e4-b3ba32e3ffa0.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="554" height="142" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/1ebfa520-7255-488a-89e4-b3ba32e3ffa0.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw"/> 雖然模型是免費的，想運行起來還是相當費勁的，沒有企業級的算力基礎真的無法使用。所以，這對於企業來説是一個不錯的好消息。 <img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/c7efd60f-da53-49e3-947c-9b33ab715844.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="554" height="204" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/c7efd60f-da53-49e3-947c-9b33ab715844.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw"/> 有人指出即便對 Llama 3.1-405B 模型進行大幅度優化，量化到 5 位數，仍然無法適用於消費級 GPU，真的是對硬件要求特別高。 <img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/e16c6390-edd7-4629-80c3-f9add76f1222.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="554" height="163" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/e16c6390-edd7-4629-80c3-f9add76f1222.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw"/> 如果這份評測數據是真的，那麼對於全球多數國家來説都是一個天大的福利。因為這是 Meta 的 Llama 3 系列的頂級模型並且是全部開放權重，也就是説人人都能用上免費的 AI 模型。 但是如果想開發生成式 AI 應用，也需要強大的 AI 算力基礎、高質量數據以及微調技術。 <img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/77068ff0-1456-45bc-b299-9399f4f8fdae.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="554" height="674" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/77068ff0-1456-45bc-b299-9399f4f8fdae.png/query-aW1hZ2VWaWV3Mi8yL3cvNjQw"/> 由於監管機構和各種法案的原因，Meta 一直在推遲 405B 系列模型的發佈。那麼，本次泄漏是否是 Meta 特意放出來的呢，因為這是他們的老傳統了，去年的 Llama 模型就幹過一次， 當時「AIGC 開放社區」也測試過，確實就是他的原模型。期待一波明天，看看 Meta 還能整啥花活。 本文作者：AIGC 開放社區，來源：AIGC 開放社區，原文標題：《Meta 的 Llama-3.1-405B 遭泄漏，可下載，性能超 GPT-4o！》 </div>