Meta推新一代開放式大型語言模型 推理能力更強

    前沿科技
    分享至
    評論

      Facebook母公司Meta今天推出新一代開放式大型Llama 3,初始的2個模型已可使用,包含預訓練和指令微調的,其中的8B(80億)和70B(700億)參數,可支持更多元的使用情境,提供更精準的推理能力。

    Meta推新一代開放式大型 推理能力更強

      Meta發布新聞稿指出,希望通過建立Llama 3回應開發人員的意見,並提高Llama 3的整體實用性,同時持續負責任地使用並部署大型。新模型也將推出供社交運用,鼓勵開發者開始建立專屬內容。

      Meta表示,今天推出以文字為基礎的模型,為Llama 3係列的第一波模型。Meta期待讓Llama 3在近期具備多語言和多模態、有更長的上下文語境,繼續提升推理和編寫程序碼等核心大型能力的整體表現。

      隨著生成式AI(人工智能)領域迅速發展,Meta認為,開放方式是整合生態係並減輕潛在危害的重要途徑之一。身為生態係一員,Meta正在更新負責任使用指南,提供負責任地開發大型的全麵性指南。

    THE END

    數碼評測