欧美成人三级视频网站,国产一区国产二区国产三区,青青久久av北条麻妃黑人,亚州综合一区

訊飛智文
當(dāng)前位置:首頁>AI工具>AI對(duì)話聊天>Groq-全球速度最快的大模型推理服務(wù)

Groq-全球速度最快的大模型推理服務(wù)

Groq是什么?

Groq是一家美國(guó)AI芯片公司,專注于設(shè)計(jì)和制造高性能、高能效的AI處理器。

最近,Groq公司推出了一個(gè)免費(fèi)的在線大模型推理服務(wù),借助于自研的AI芯片LPU,每秒能夠輸出近 500 個(gè) token。相比之下,ChatGPT-3.5 每秒生成速度僅為 40 個(gè) token。

Groq并沒有研發(fā)新模型,它是一個(gè)模型啟動(dòng)器,推理服務(wù)部署的是開源模型Mixtral 8x7B-32k和Llama 270B-4k。

有網(wǎng)友將其與 GPT-4、Gemini 對(duì)標(biāo),看看它們完成一個(gè)簡(jiǎn)單代碼調(diào)試問題所需的時(shí)間。沒想到,Groq 完全碾壓兩者,在輸出速度上比 Gemini 快 10 倍,比 GPT-4 快 18 倍。

Groq-全球速度最快的大模型推理服務(wù)

如何使用Groq?

AIHub體驗(yàn)了一下,推理回復(fù)速度確實(shí)非常快,1000字的內(nèi)容,眨眼之間完成。

不需要注冊(cè)賬號(hào),任何人都可以免費(fèi)使用。

Groq體驗(yàn)地址:https://groq.com/

Groq-全球速度最快的大模型推理服務(wù)
Groq 使用界面

對(duì)于開發(fā)者,Groq 也提供了 API 服務(wù),完全兼容 OpenAI API。

Mixtral 8x7B SMoE 可以達(dá)到 480 token / S,100 萬 token 價(jià)格為 0.27 美元。極限情況下,用 Llama2 7B 甚至能實(shí)現(xiàn) 750 token / S。

Groq-全球速度最快的大模型推理服務(wù)
Groq API服務(wù)價(jià)格

關(guān)于Groq LPU芯片

根據(jù)Groq官網(wǎng)介紹,LPU是一種專為AI推理所設(shè)計(jì)的芯片。驅(qū)動(dòng)包括GPT等主流大模型的GPU,是一種為圖形渲染而設(shè)計(jì)的并行處理器,有數(shù)百個(gè)內(nèi)核,而LPU架構(gòu)則與GPU使用的SIMD(單指令,多數(shù)據(jù))不同,這種設(shè)計(jì)可以讓芯片更有效地利用每個(gè)時(shí)鐘周期,確保一致的延遲和吞吐量,也降低了復(fù)雜調(diào)度硬件的需求。

Groq-全球速度最快的大模型推理服務(wù)
?版權(quán)聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織,在未征得本站同意時(shí),禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。 Trae
0 條回復(fù) A文章作者 M管理員
    暫無評(píng)論內(nèi)容
error:
主站蜘蛛池模板: 原阳县| 宁南县| 宽甸| 清原| 聊城市| 建瓯市| 珠海市| 青田县| 杭锦旗| 大方县| 偃师市| 溆浦县| 邯郸县| 永兴县| 大港区| 金阳县| 梨树县| 应城市| 巨鹿县| 长葛市| 井研县| 岫岩| 来安县| 黑龙江省| 凤凰县| 浏阳市| 漳浦县| 望江县| 抚远县| 三都| 伊通| 中西区| 禄丰县| 金阳县| 淄博市| 旌德县| 淳化县| 罗山县| 隆子县| 自贡市| 江源县|