LawGPT介紹
LawGPT 是一系列基于中文法律知識的開源大語言模型。該系列模型在通用中文基座模型(如 Chinese-LLaMA、ChatGLM 等)的基礎上擴充法律領域專有詞表、大規模中文法律語料預訓練,增強了大模型在法律領域的基礎語義理解能力。在此基礎上,構造法律領域對話問答數據集、中國司法考試數據集進行指令精調,提升了模型對法律內容的理解和執行能力。
GitHub地址:https://github.com/pengxiao-song/LaWGPT/
LawGPT特色
- 基于中文法律知識的大語言模型:該模型在通用中文基座模型的基礎上,擴充了法律領域專有詞表,以及大規模的中文法律語料預訓練,從而增強了大模型在法律領域的基礎語義理解能力。
- 構造法律領域對話問答數據集:在預訓練模型的基礎上,構造了法律領域對話問答數據集,以及中國司法考試數據集進行指令精調,從而提升了模型對法律內容的理解和執行能力。
- 開源:該項目是開源的,持續開展,法律領域數據集及系列模型后續相繼開源,敬請關注。
如何使用
- 準備代碼,創建環境:下載代碼,創建環境,安裝所需的依賴。
- 啟動 web ui:執行服務啟動腳本,然后訪問指定的網址。
- 命令行推理:構造測試樣本集,執行推理腳本。
注意事項
- 模型局限性:由于計算資源、數據規模等因素限制,當前階段 LawGPT 存在諸多局限性,包括數據資源有限、模型容量較小,導致其相對較弱的模型記憶和語言能力。因此,在面對事實性知識任務時,可能會生成不正確的結果。該系列模型只進行了初步的人類意圖對齊。因此,可能產生不可預測的有害內容以及不符合人類偏好和價值觀的內容。自我認知能力存在問題,中文理解能力有待增強。
- 免責聲明:本項目任何資源僅供學術研究使用,嚴禁任何商業用途。模型輸出受多種不確定性因素影響,本項目當前無法保證其準確性,嚴禁用于真實法律場景。本項目不承擔任何法律責任,亦不對因使用相關資源和輸出結果而可能產生的任何損失承擔責任。
- 問題反饋:如有問題,請在 GitHub Issue 中提交。提交問題之前,建議查閱 FAQ 及以往的 issue 看是否能解決您的問題。請禮貌討論,構建和諧社區。
?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創發布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。
