據上證報報道,4月21日,復旦大學自然語言處理實驗室開發的新版MOSS模型正式上線,成為國內首個插件增強的開源對話語言模型。
目前,MOSS模型已上線開源,相關代碼、數據、模型參數已在Github和Hugging Face等平臺開放,供科研人員下載。開源代碼涵蓋模型訓練和推理代碼,開源數據包括超100萬條對話訓練數據,開源模型包括160億參數中英雙語基座語言模型、對話模型以及插件增強的對話模型。
MOSS基于公開的中英文數據訓練,目前已經擁有200億參數,具有和人類對話的能力,并可以通過與人類交互實現迭代優化。
2月20日,復旦大學自然語言處理實驗室發布了國內第一個對話式大型語言模型MOSS,并通過邀請碼進行內測。
復旦大學自然語言處理實驗室稱,MOSS還是一個非常不成熟的模型,距離ChatGPT還有很長的路需要走。由于訓練數據中的多語言語料庫有限,MOSS 在理解和生成非英語文本方面表現不佳。目前正在開發一個改進版本,以提高其中文語言能力。
復旦MOSS網址:moss.fastnlp.top/
