
荀子系列模型是什么?
隨著科技的飛速發展,人工智能已深入到各個領域。為響應古籍活化利用號召,推動大語言模型與古籍處理深度融合,以古籍智能化的研究為目的,南京農業大學國家社科基金重大項目“中國古代典籍跨語言知識庫構建及應用研究”課題組與中華書局古聯公司推出了一系列古籍處理領域大語言模型:荀子古籍大語言模型。
荀子不僅是我國先秦時期偉大的樸素唯物主義的思想家,也是一位散文大家。他在語言學理論的闡述上又是一位開拓者、奠基人。荀子系列專為古籍智能處理而設計,這一系列模型的推出將推動古籍研究與保護工作的新發展,提高中華傳統文化傳承的效率與質量。
“荀子”古籍大語言模型整合了包含《四庫全書》在內絕大多數傳世古籍文獻在內的超過20億字的語料庫。它以推動古籍研究和保護創新發展、提高中華傳統文化傳承效率和質量、實現大語言模型與古籍處理深度融合為宗旨。
本次荀子系列模型開源包括兩個部分:基座模型XunziALLM與對話模型XunziChat,模型的調用方式與阿里云的Qwen系列大模型一致。用戶可以在GitHub和ModelScope等網站免費下載使用。
荀子系列模型可以做什么?
荀子系列模型主要功能包括:智能標引、信息抽取、詩歌生成、高質量翻譯、閱讀理解、詞法分析、自動標點等,可顯著提高古籍處理和研究的效率。
- 古籍智能標引,荀子模型具備強大的古籍文獻標引能力,能夠對古籍中的內容進行高質量主題標引,幫助研究人員快速了解文章主題。

- 古籍信息抽取,荀子模型能夠自動從古籍中抽取關鍵信息,如人物、事件、地點等,大大節省了研究人員的信息整理時間。

- 詩歌生成:荀子模型還具備詩歌生成的能力,能夠根據給定的主題或關鍵詞,自動生成符合語法規則和韻律要求的古詩,為詩詞愛好者提供創作靈感。

- 古籍高質量翻譯:對于那些難以理解的古籍文獻,荀子模型能夠提供高質量的翻譯服務,幫助研究人員更好地理解原文含義。

- 閱讀理解:荀子模型能夠對給出的古文文本進行分析解釋,實現對古籍文本的自動閱讀。

- 詞法分析:荀子模型可以完成古籍文本的自動分詞和詞性標注,能夠有效提升語言學工作者的研究效率。

- 自動標點:荀子大模型可以快速完成古籍文本的斷句和標點,提升研究者以及業余愛好者對古籍文本的閱讀體驗。

由于我們同時發布了基座模型,用戶也可以根據自己的需求,使用本地的訓練語料微調荀子基座模型,使得其能夠在古籍下游處理任務上取得更佳的處理性能。
如何使用荀子大模型?
你可以在GitHub和ModelScope等網站免費下載使用。
- 基座模型XunziALLM:https://modelscope.cn/models/Xunzillm4cc/Xunzi-Qwen
- 對話模型XunziChat:https://modelscope.cn/models/Xunzillm4cc/Xunzi-Qwen-Chat
- GitHub地址:https://github.com/Xunzi-LLM-of-Chinese-classics/XunziALLM/
