HithinkGPT-同花順推出的問財(cái)大模型

AIHubAI布道師

AIH ub最新消息，2024年1月2日，同花順在微信公眾號(hào)宣布推出了問財(cái)HithinkGPT大模型。

此款大模型采用transformer的decoder-only架構(gòu)，提供7B、13B、30B、70B和130B五種版本選擇，最大允許32k文本輸入，支持API接口調(diào)用、網(wǎng)頁嵌入、共建、私有化部署等能力，并為用戶提供一站式標(biāo)注和評(píng)測(cè)服務(wù)。

現(xiàn)在，問財(cái)HithinkGPT大模型的內(nèi)測(cè)申請(qǐng)已經(jīng)啟動(dòng)，掃描下方二維碼即可申請(qǐng)內(nèi)測(cè)。

HithinkGPT測(cè)評(píng)效果

HithinkGPT在多個(gè)場(chǎng)景中有出色的表現(xiàn)，在金融領(lǐng)域中處于絕對(duì)領(lǐng)先的位置：

通用領(lǐng)域：HithinkGPT大模型在C-Eval、GSM8K、MMLU、MATH等10多個(gè)主流Benchmark測(cè)評(píng)集上的表現(xiàn)全面超越了主流開源模型Llama-2。

HithinkGPT-同花順推出的問財(cái)大模型

金融領(lǐng)域：同花順自建了HithinkFinEval數(shù)據(jù)集，涵蓋了證券從業(yè)考試、基金從業(yè)考試、會(huì)計(jì)師資格考試、CPA、CFA等17個(gè)金融行業(yè)考試。在這些考試中，問財(cái)HithinkGPT-70B大模型以平均75.9分的優(yōu)異成績通過考試，并且HithinkGPT在所有考試科目中都比開源模型更加優(yōu)秀。

HithinkGPT-同花順推出的問財(cái)大模型

據(jù)官方介紹，HithinkGPT針對(duì)大模型訓(xùn)練與推理做到了極致的優(yōu)化與技術(shù)探索，包括數(shù)據(jù)覆蓋、模型訓(xùn)練、高效推理以及智能安全：

1、金融數(shù)據(jù)的全面覆蓋：同花順利用自身過去十幾年的數(shù)據(jù)積累以及市場(chǎng)上公開的金融數(shù)據(jù)，預(yù)訓(xùn)練金融語料達(dá)到萬億級(jí)tokens。此外，我們擁有一套自動(dòng)化的流程，用于數(shù)據(jù)獲取、清洗以及數(shù)據(jù)質(zhì)量的驗(yàn)證，每月可新增數(shù)千億tokens優(yōu)質(zhì)預(yù)訓(xùn)練數(shù)據(jù)以及數(shù)十萬條優(yōu)質(zhì)微調(diào)數(shù)據(jù)，確保數(shù)據(jù)的實(shí)時(shí)性和準(zhǔn)確性。

2、模型訓(xùn)練的創(chuàng)新優(yōu)化：我們構(gòu)建了科學(xué)高效的大模型訓(xùn)練體系，包括：數(shù)據(jù)配比實(shí)驗(yàn)方案、scaling law實(shí)驗(yàn)體系、模型架構(gòu)優(yōu)化、分布式訓(xùn)練框架優(yōu)化、硬件加速技術(shù)等。使得我們的大模型訓(xùn)練效率提升了數(shù)倍，能以更低的訓(xùn)練成本高效地完成HithinkGPT大模型家族（7B、13B、30B、70B和130B）的訓(xùn)練。

3、AI算力的極致使用：同花順構(gòu)建了千卡異構(gòu)集群，為模型訓(xùn)練提供支持。推理上，我們通過應(yīng)用無損自適應(yīng)選層剪枝、通信及底層算子優(yōu)化，以及實(shí)現(xiàn)多數(shù)據(jù)中心負(fù)載均衡，使模型推理吞吐速度提高八倍以上。此外，我們自主研發(fā)了大模型量化算法，量化后的模型精度損失小于1%，同時(shí)部署顯存需求減半，推理的吞吐量進(jìn)一步提高了兩倍以上。

4、智能安全的堅(jiān)決守護(hù)：我們使用輕量高效的RLHF方案，將大模型對(duì)安全的認(rèn)知與人類拉齊。同時(shí)，我們獨(dú)創(chuàng)補(bǔ)丁式大模型熱修復(fù)技術(shù)，快速應(yīng)對(duì)并封堵安全漏洞，不斷提高模型的安全性。我們旨在構(gòu)建有用、無害、三觀正確的智能伙伴，確保每一位用戶都能安心使用。

全面升級(jí)-全能金融顧問：問財(cái)

原來就廣受投資者喜愛的投顧對(duì)話機(jī)器人——同花順問財(cái)，現(xiàn)基于HithinkGPT成功升級(jí)，是國內(nèi)金融領(lǐng)域首個(gè)應(yīng)用大模型技術(shù)的智能投顧產(chǎn)品。

大模型版本的問財(cái)涵蓋A股、基金、ETF、港股、美股、債券、宏觀等15個(gè)業(yè)務(wù)矩陣，包括七大投資環(huán)節(jié)的查詢、分析、對(duì)比、解讀、原因、預(yù)測(cè)、建議、回測(cè)等在內(nèi)的50余類技能，為用戶提供全面精準(zhǔn)、穩(wěn)定可控的投資決策支持。

大模型版本的問財(cái)與傳統(tǒng)模式的問財(cái)相比，具有以下五大特色優(yōu)勢(shì)：全面的實(shí)時(shí)金融數(shù)據(jù)、強(qiáng)大的語義理解、專業(yè)的投顧建議、生動(dòng)的表達(dá)形式、可控的內(nèi)容生成，致力于成為用戶的全能金融顧問：

1、更全面的實(shí)時(shí)數(shù)據(jù)：問財(cái)大模型可以實(shí)時(shí)獲取全球數(shù)百萬個(gè)實(shí)時(shí)更新的金融數(shù)據(jù)指標(biāo)以及每天產(chǎn)生的數(shù)十萬條金融相關(guān)資訊。這些數(shù)據(jù)涵蓋了股票、債券、期貨、外匯、商品價(jià)格、宏觀經(jīng)濟(jì)指標(biāo)、行業(yè)數(shù)據(jù)等各個(gè)方面，確保用戶始終能夠獲取到最新、最全的信息。

2、更強(qiáng)大的語義理解?：問財(cái)在十多年前就已經(jīng)涉足金融人機(jī)交互領(lǐng)域，積累了數(shù)十億條完整、專業(yè)、高質(zhì)量的結(jié)構(gòu)化金融數(shù)據(jù)，其對(duì)語義理解以及用戶個(gè)性化理解能力的提升具有先天優(yōu)勢(shì)；同時(shí)每天持續(xù)產(chǎn)生數(shù)千萬條金融數(shù)據(jù)，結(jié)合大模型自我進(jìn)化能力，使得大模型能夠更準(zhǔn)確的理解用戶意圖和需求。

3、更專業(yè)的投顧建議：圍繞用戶的投資目標(biāo)，基于“用戶的五大KYC標(biāo)簽體系、投資分析的六大維度、以及投資過程的七大步驟”，模擬了真人投顧服務(wù)邏輯，給用戶最科學(xué)合理的投資建議，讓投資變得更簡單。

4、更生動(dòng)的表達(dá)形式：同花順問財(cái)大模型已經(jīng)打破了行業(yè)常用的文本格式限制，截至目前，我們已經(jīng)擁有動(dòng)態(tài)折線圖、動(dòng)態(tài)雙柱圖等14種數(shù)據(jù)可視化組件以及圖片生成和視頻生成兩種富媒體可視化工具，并支持用戶自定義，覆蓋了投顧建議、宏觀、資訊、投教等15大核心業(yè)務(wù)領(lǐng)域，利用多模態(tài)技術(shù)讓信息傳遞更高效更人性。

5、更可控的內(nèi)容生成：安全性上通過內(nèi)置的智能風(fēng)險(xiǎn)識(shí)別系統(tǒng)，能夠?qū)崟r(shí)監(jiān)測(cè)和召回5大類31種潛在風(fēng)險(xiǎn)的提問意圖，通過系統(tǒng)對(duì)抗性訓(xùn)練和魯棒性評(píng)估，風(fēng)險(xiǎn)召回率超過99.5%。

如果你比較感興趣，可以掃描下方二維碼即可申請(qǐng)內(nèi)測(cè)。

?版權(quán)聲明：如無特殊說明，本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織，在未征得本站同意時(shí)，禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。否則，我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。