欧美成人三级视频网站,国产一区国产二区国产三区,青青久久av北条麻妃黑人,亚州综合一区

即夢(mèng)AI
當(dāng)前位置:首頁>AI模型>彭博社-BloombergGPT金融大模型

彭博社-BloombergGPT金融大模型

BloombergGPT是什么?

根據(jù)彭博社最新發(fā)布的報(bào)告顯示,其構(gòu)建迄今為止最大的特定領(lǐng)域數(shù)據(jù)集,并訓(xùn)練了專門用于金融領(lǐng)域的LLM,開發(fā)了擁有500億參數(shù)的語言模型——BloombergGPT。

報(bào)告顯示,該模型依托彭博社的大量金融數(shù)據(jù)源,構(gòu)建了一個(gè)3630億個(gè)標(biāo)簽的數(shù)據(jù)集,支持金融行業(yè)內(nèi)的各類任務(wù)。該模型在金融任務(wù)上的表現(xiàn)遠(yuǎn)超過現(xiàn)有模型,且在通用場(chǎng)景上的表現(xiàn)與現(xiàn)有模型也能一較高下。

一般來說,在NLP領(lǐng)域,參數(shù)數(shù)量和復(fù)雜程度之間具有正相關(guān)性,GPT-3.5模型的參數(shù)量為2000億,GPT-3的參數(shù)量為1750億。

彭博社-BloombergGPT金融大模型

這篇論文介紹了一種針對(duì)金融領(lǐng)域的大型語言模型BloombergGPT,并且探討了其在金融業(yè)務(wù)應(yīng)用中的潛在用途。BloombergGPT基于GPT-2和BERT模型,使用大量金融文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。

BloombergGPT適合場(chǎng)景

作者認(rèn)為,BloombergGPT可以應(yīng)用于以下場(chǎng)景:

  • 金融預(yù)測(cè):BloombergGPT可以用于預(yù)測(cè)金融市場(chǎng)的趨勢(shì),例如股票價(jià)格、匯率等。
  • 金融風(fēng)險(xiǎn)控制:BloombergGPT可以用于分析潛在的金融風(fēng)險(xiǎn),并提供實(shí)時(shí)的警告和建議。
  • 自然語言處理:BloombergGPT可以使用金融數(shù)據(jù)進(jìn)行增強(qiáng),從而提高自然語言處理的效果和準(zhǔn)確率。

為了證明BloombergGPT在金融領(lǐng)域的有效性,作者進(jìn)行了一系列實(shí)驗(yàn)。結(jié)果表明,BloombergGPT在生成下文、問答任務(wù)、文本分類等任務(wù)中,都表現(xiàn)出優(yōu)異的性能。

總之,BloombergGPT是一種具有廣泛潛在應(yīng)用的大型語言模型,可以為金融界提供更加準(zhǔn)確的預(yù)測(cè)、風(fēng)險(xiǎn)控制和自然語言處理服務(wù)。

標(biāo)題:BloombergGPT: A Large Language Model for Finance

作者:Shijie Wu, Ozan Irsoy, Steven Lu, Vadim Dabravolski,?Mark Dredze, Sebastian Gehrmann,?Prabhanjan Kambadur, David Rosenberg,?Gideon Mann

彭博社-BloombergGPT金融大模型

彭博社-BloombergGPT金融大模型

BloombergGPT優(yōu)勢(shì)

特定領(lǐng)域模型仍有其不可替代性且彭博數(shù)據(jù)來源可靠

在論文中,彭博社指出,現(xiàn)階段,通用的自然語言處理模型可以涵蓋許多領(lǐng)域,但針對(duì)特定領(lǐng)域模型仍有其不可替代性,因彭博社的大多數(shù)應(yīng)用均為金融領(lǐng)域,著手構(gòu)建了一個(gè)針對(duì)金融領(lǐng)域的模型尤其優(yōu)勢(shì),同時(shí)可以在通用LLM基準(zhǔn)測(cè)試上保持競(jìng)爭力:

除了構(gòu)建金融領(lǐng)域的LLM外,本文的經(jīng)驗(yàn)也為其他研究領(lǐng)域的專用模型提供了參考。我們的方法是在特定領(lǐng)域和一般數(shù)據(jù)源上訓(xùn)練LLM,以開發(fā)在特定領(lǐng)域和通用基準(zhǔn)上表現(xiàn)優(yōu)異的模型。

此外,我們的訓(xùn)練數(shù)據(jù)不同于傳統(tǒng)的網(wǎng)絡(luò)爬取數(shù)據(jù),網(wǎng)絡(luò)上的數(shù)據(jù)總有重復(fù)和錯(cuò)誤,但我們的數(shù)據(jù)來源可靠。

彭博社-BloombergGPT金融大模型

BloombergGPT訓(xùn)練數(shù)據(jù)集

BloombergGPT的訓(xùn)練數(shù)據(jù)庫名為FINPILE,由一系列英文金融信息組成,包括新聞、文件、新聞稿、網(wǎng)絡(luò)爬取的金融文件以及提取到的社交媒體消息。

為了提高數(shù)據(jù)質(zhì)量,F(xiàn)INPILE數(shù)據(jù)集也使用了公共數(shù)據(jù)集,例如The Pile、C4和Wikipedia。FINPILE的訓(xùn)練數(shù)據(jù)集中大約一半是特定領(lǐng)域的文本,一半是通用文本。為了提高數(shù)據(jù)質(zhì)量,每個(gè)數(shù)據(jù)集都進(jìn)行了去重處理。

彭博社-BloombergGPT金融大模型

對(duì)金融領(lǐng)域的理解更準(zhǔn)

報(bào)告指出,在金融領(lǐng)域中的自然語言處理在通用模型中也很常見,但是,針對(duì)金融領(lǐng)域,這些任務(wù)執(zhí)行時(shí)將面臨挑戰(zhàn):

以情感分析為例,一個(gè)題為“某公司將裁員1萬人”,在一般意義上表達(dá)了負(fù)面情感,但在金融情感方面,它有時(shí)可能被認(rèn)為是積極的,因?yàn)樗赡軐?dǎo)致公司的股價(jià)或投資者信心增加。

彭博社-BloombergGPT金融大模型

報(bào)告指出,從測(cè)試來看,BloombergGPT在五項(xiàng)任務(wù)中的四項(xiàng)(ConvFinQA,F(xiàn)iQA SA,F(xiàn)PB和Headline)表現(xiàn)最佳,在NER(Named Entity Recognition)中排名第二。因此,BloombergGPT有其優(yōu)勢(shì)性。

測(cè)試一:ConvFinQA數(shù)據(jù)集是一個(gè)針對(duì)金融領(lǐng)域的問答數(shù)據(jù)集,包括從新聞文章中提取出的問題和答案,旨在測(cè)試模型對(duì)金融領(lǐng)域相關(guān)問題的理解和推理能力。

測(cè)試二:FiQA SA,第二個(gè)情感分析任務(wù),測(cè)試英語金融新聞和社交媒體標(biāo)題中的情感走向。

測(cè)試三:標(biāo)題,數(shù)據(jù)集包括關(guān)于黃金商品領(lǐng)域的英文新聞標(biāo)題,標(biāo)注了不同的子集。任務(wù)是判斷新聞標(biāo)題是否包含特定信息,例如價(jià)格上漲或價(jià)格下跌等。

測(cè)試四: FPB,金融短語庫數(shù)據(jù)集包括來自金融新聞的句子情緒分類任務(wù)。

測(cè)試五:NER,命名實(shí)體識(shí)別任務(wù),針對(duì)從提交給SEC的金融協(xié)議中收集金融數(shù)據(jù),進(jìn)行信用風(fēng)險(xiǎn)評(píng)估。

對(duì)于ConvFinQA來說,這個(gè)差距尤為顯著,因?yàn)樗枰褂脤?duì)話式輸入來對(duì)表格進(jìn)行推理并生成答案,具有一定挑戰(zhàn)性。

彭博社-BloombergGPT金融大模型

相關(guān)鏈接?https://wallstreetcn.com/articles/3685406#from=ios?ivk=1

?版權(quán)聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織,在未征得本站同意時(shí),禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。 Trae
主站蜘蛛池模板: 乌拉特前旗| 呈贡县| 贵南县| 冷水江市| 浦江县| 阆中市| 新兴县| 顺昌县| 汤原县| 宁都县| 图片| 新蔡县| 庆安县| 乐都县| 清镇市| 凌海市| 日喀则市| 祁门县| 潞西市| 鸡西市| 神农架林区| 普安县| 乌拉特中旗| 环江| 栖霞市| 特克斯县| 建昌县| 黄石市| 安化县| 潮安县| 石棉县| 皋兰县| 桑日县| 托克逊县| 和田市| 锦屏县| 青阳县| 永平县| 连城县| 台东市| 达州市|