AIHub最新消息,2024年1月2日,同花順在微信公眾號(hào)宣布推出了問財(cái)HithinkGPT大模型。
此款大模型采用transformer的decoder-only架構(gòu),提供7B、13B、30B、70B和130B五種版本選擇,最大允許32k文本輸入,支持API接口調(diào)用、網(wǎng)頁嵌入、共建、私有化部署等能力,并為用戶提供一站式標(biāo)注和評(píng)測(cè)服務(wù)。
現(xiàn)在,問財(cái)HithinkGPT大模型的內(nèi)測(cè)申請(qǐng)已經(jīng)啟動(dòng),掃描下方二維碼即可申請(qǐng)內(nèi)測(cè)。
HithinkGPT測(cè)評(píng)效果
HithinkGPT在多個(gè)場(chǎng)景中有出色的表現(xiàn),在金融領(lǐng)域中處于絕對(duì)領(lǐng)先的位置:
通用領(lǐng)域:HithinkGPT大模型在C-Eval、GSM8K、MMLU、MATH等10多個(gè)主流Benchmark測(cè)評(píng)集上的表現(xiàn)全面超越了主流開源模型Llama-2。
金融領(lǐng)域:同花順自建了HithinkFinEval數(shù)據(jù)集,涵蓋了證券從業(yè)考試、基金從業(yè)考試、會(huì)計(jì)師資格考試、CPA、CFA等17個(gè)金融行業(yè)考試。在這些考試中,問財(cái)HithinkGPT-70B大模型以平均75.9分的優(yōu)異成績通過考試,并且HithinkGPT在所有考試科目中都比開源模型更加優(yōu)秀。
據(jù)官方介紹,HithinkGPT針對(duì)大模型訓(xùn)練與推理做到了極致的優(yōu)化與技術(shù)探索,包括數(shù)據(jù)覆蓋、模型訓(xùn)練、高效推理以及智能安全:
1、金融數(shù)據(jù)的全面覆蓋:同花順利用自身過去十幾年的數(shù)據(jù)積累以及市場(chǎng)上公開的金融數(shù)據(jù),預(yù)訓(xùn)練金融語料達(dá)到萬億級(jí)tokens。此外,我們擁有一套自動(dòng)化的流程,用于數(shù)據(jù)獲取、清洗以及數(shù)據(jù)質(zhì)量的驗(yàn)證,每月可新增數(shù)千億tokens優(yōu)質(zhì)預(yù)訓(xùn)練數(shù)據(jù)以及數(shù)十萬條優(yōu)質(zhì)微調(diào)數(shù)據(jù),確保數(shù)據(jù)的實(shí)時(shí)性和準(zhǔn)確性。
2、模型訓(xùn)練的創(chuàng)新優(yōu)化:我們構(gòu)建了科學(xué)高效的大模型訓(xùn)練體系,包括:數(shù)據(jù)配比實(shí)驗(yàn)方案、scaling law實(shí)驗(yàn)體系、模型架構(gòu)優(yōu)化、分布式訓(xùn)練框架優(yōu)化、硬件加速技術(shù)等。使得我們的大模型訓(xùn)練效率提升了數(shù)倍,能以更低的訓(xùn)練成本高效地完成HithinkGPT大模型家族(7B、13B、30B、70B和130B)的訓(xùn)練。
3、AI算力的極致使用:同花順構(gòu)建了千卡異構(gòu)集群,為模型訓(xùn)練提供支持。推理上,我們通過應(yīng)用無損自適應(yīng)選層剪枝、通信及底層算子優(yōu)化,以及實(shí)現(xiàn)多數(shù)據(jù)中心負(fù)載均衡,使模型推理吞吐速度提高八倍以上。此外,我們自主研發(fā)了大模型量化算法,量化后的模型精度損失小于1%,同時(shí)部署顯存需求減半,推理的吞吐量進(jìn)一步提高了兩倍以上。
4、智能安全的堅(jiān)決守護(hù):我們使用輕量高效的RLHF方案,將大模型對(duì)安全的認(rèn)知與人類拉齊。同時(shí),我們獨(dú)創(chuàng)補(bǔ)丁式大模型熱修復(fù)技術(shù),快速應(yīng)對(duì)并封堵安全漏洞,不斷提高模型的安全性。我們旨在構(gòu)建有用、無害、三觀正確的智能伙伴,確保每一位用戶都能安心使用。
全面升級(jí)-全能金融顧問:問財(cái)
原來就廣受投資者喜愛的投顧對(duì)話機(jī)器人——同花順問財(cái),現(xiàn)基于HithinkGPT成功升級(jí),是國內(nèi)金融領(lǐng)域首個(gè)應(yīng)用大模型技術(shù)的智能投顧產(chǎn)品。

大模型版本的問財(cái)涵蓋A股、基金、ETF、港股、美股、債券、宏觀等15個(gè)業(yè)務(wù)矩陣,包括七大投資環(huán)節(jié)的查詢、分析、對(duì)比、解讀、原因、預(yù)測(cè)、建議、回測(cè)等在內(nèi)的50余類技能,為用戶提供全面精準(zhǔn)、穩(wěn)定可控的投資決策支持。
大模型版本的問財(cái)與傳統(tǒng)模式的問財(cái)相比,具有以下五大特色優(yōu)勢(shì):全面的實(shí)時(shí)金融數(shù)據(jù)、強(qiáng)大的語義理解、專業(yè)的投顧建議、生動(dòng)的表達(dá)形式、可控的內(nèi)容生成,致力于成為用戶的全能金融顧問:
1、更全面的實(shí)時(shí)數(shù)據(jù):問財(cái)大模型可以實(shí)時(shí)獲取全球數(shù)百萬個(gè)實(shí)時(shí)更新的金融數(shù)據(jù)指標(biāo)以及每天產(chǎn)生的數(shù)十萬條金融相關(guān)資訊。這些數(shù)據(jù)涵蓋了股票、債券、期貨、外匯、商品價(jià)格、宏觀經(jīng)濟(jì)指標(biāo)、行業(yè)數(shù)據(jù)等各個(gè)方面,確保用戶始終能夠獲取到最新、最全的信息。
2、更強(qiáng)大的語義理解?:問財(cái)在十多年前就已經(jīng)涉足金融人機(jī)交互領(lǐng)域,積累了數(shù)十億條完整、專業(yè)、高質(zhì)量的結(jié)構(gòu)化金融數(shù)據(jù),其對(duì)語義理解以及用戶個(gè)性化理解能力的提升具有先天優(yōu)勢(shì);同時(shí)每天持續(xù)產(chǎn)生數(shù)千萬條金融數(shù)據(jù),結(jié)合大模型自我進(jìn)化能力,使得大模型能夠更準(zhǔn)確的理解用戶意圖和需求。
3、更專業(yè)的投顧建議:圍繞用戶的投資目標(biāo),基于“用戶的五大KYC標(biāo)簽體系、投資分析的六大維度、以及投資過程的七大步驟”,模擬了真人投顧服務(wù)邏輯,給用戶最科學(xué)合理的投資建議,讓投資變得更簡單。
4、更生動(dòng)的表達(dá)形式:同花順問財(cái)大模型已經(jīng)打破了行業(yè)常用的文本格式限制,截至目前,我們已經(jīng)擁有動(dòng)態(tài)折線圖、動(dòng)態(tài)雙柱圖等14種數(shù)據(jù)可視化組件以及圖片生成和視頻生成兩種富媒體可視化工具,并支持用戶自定義,覆蓋了投顧建議、宏觀、資訊、投教等15大核心業(yè)務(wù)領(lǐng)域,利用多模態(tài)技術(shù)讓信息傳遞更高效更人性。
5、更可控的內(nèi)容生成:安全性上通過內(nèi)置的智能風(fēng)險(xiǎn)識(shí)別系統(tǒng),能夠?qū)崟r(shí)監(jiān)測(cè)和召回5大類31種潛在風(fēng)險(xiǎn)的提問意圖,通過系統(tǒng)對(duì)抗性訓(xùn)練和魯棒性評(píng)估,風(fēng)險(xiǎn)召回率超過99.5%。
如果你比較感興趣,可以掃描下方二維碼即可申請(qǐng)內(nèi)測(cè)。
