日韩免费一区二区三区,久久99精品久久久久久久青青日本,精品国产一区二区三区性色av

Groq是什么？

Groq是一家美國AI芯片公司，專注于設計和制造高性能、高能效的AI處理器。

最近，Groq公司推出了一個免費的在線大模型推理服務，借助于自研的AI芯片LPU，每秒能夠輸出近 500 個 token。相比之下，ChatGPT-3.5 每秒生成速度僅為 40 個 token。

Groq并沒有研發新模型，它是一個模型啟動器，推理服務部署的是開源模型Mixtral 8x7B-32k和Llama 270B-4k。

有網友將其與 GPT-4、Gemini 對標，看看它們完成一個簡單代碼調試問題所需的時間。沒想到，Groq 完全碾壓兩者，在輸出速度上比 Gemini 快 10 倍，比 GPT-4 快 18 倍。

如何使用Groq？

AIHub體驗了一下，推理回復速度確實非?？?，1000字的內容，眨眼之間完成。

不需要注冊賬號，任何人都可以免費使用。

Groq體驗地址：https://groq.com/

對于開發者，Groq 也提供了 API 服務，完全兼容 OpenAI API。

Mixtral 8x7B SMoE 可以達到 480 token / S，100 萬 token 價格為 0.27 美元。極限情況下，用 Llama2 7B 甚至能實現 750 token / S。

關于Groq LPU芯片

根據Groq官網介紹，LPU是一種專為AI推理所設計的芯片。驅動包括GPT等主流大模型的GPU，是一種為圖形渲染而設計的并行處理器，有數百個內核，而LPU架構則與GPU使用的SIMD（單指令，多數據）不同，這種設計可以讓芯片更有效地利用每個時鐘周期，確保一致的延遲和吞吐量，也降低了復雜調度硬件的需求。