瀾舟科技-孟子大模型

AI訓練模型
23年6月5日
編輯

AIHubAI布道師

孟子大模型是什么？

孟子預訓練模型是基于團隊自研的大規(guī)模預訓練語言模型。可處理多語言、多模態(tài)數據，同時支持多種理解和生成任務，能快速滿足不同領域、不同應用場景的需求。

官網：https://www.langboat.com/portal/mengzi-model

孟子大模型可以做什么？

孟子預訓練模型提供了一系列產品，包括孟子生成式大模型（孟子 GPT）、Mengzi-BERT-base、Mengzi-BERT-base-fin、Mengzi-T5-base、Mengzi-T5-base-MT、Mengzi-GPT-neo-base、Guohua Diffusion、句向量計算等，適用于各種自然語言處理任務，如文本分類、實體識別、關系抽取、閱讀理解、文案生成、新聞生成、文本續(xù)寫、小說生成等。

孟子大模型優(yōu)勢

一個模型，解決多種應用場景。

支持多種模型架構：如 GPT、BERT、T5 等。
輕量模型性能強化：通過多預訓練任務融合、SMART 對抗訓練、知識蒸餾等方式，提升模型性能。
基于知識圖譜增強：通過基于實體抽取的增強、知識圖譜增強（isa 關系）、知識圖譜轉文字等方式，增強模型的知識理解能力。
基于語言學知識增強：通過成分句法融合增強的 Mask 機制、語義角色 Embedding 融合增強、依存關系的注意力權重約束剪枝等方式，增強模型的語言理解能力。
小樣本/零樣本學習：通過 Prompts 模板構造、多任務學習技術等方式，提升模型的學習能力。
基于檢索增強：通過知識解耦、可解釋性強、外部知識組件實時更新等方式，提升模型的檢索能力。