AIHub最新消息,今天OpenAI 宣布對其實時 API 進行更新,目前該 API 仍處于測試階段。這次更新的亮點在于推出了五種新的語音選項,專為語音到語音應用而設計,同時還降低了相關的緩存費用,讓開發(fā)者在使用時更加經濟實惠。

在新推出的五種語音中,OpenAI 在 X 上的一篇文章中展示了其中三種新聲音,Ash、Verse 和聽起來像英國的 Ballad。這些聲音不僅更加生動和可調節(jié),還能夠提供更自然的交流體驗。OpenAI 在其 API 文檔中提到,這項原生的語音到語音功能省去了中間的文本格式處理,從而實現(xiàn)了低延遲和更具細膩度的輸出。
不過,OpenAI 也提醒用戶,由于實時 API 目前仍在測試階段,因此暫時無法提供客戶端的身份驗證。此外,實時音頻處理可能會受到網絡條件的影響,這也給大規(guī)模傳輸音頻帶來了挑戰(zhàn)。OpenAI 指出,當網絡條件不穩(wěn)定時,確保音頻可靠傳輸?shù)拇_是一項艱巨的任務。
Realtime API 開放文檔:https://platform.openai.com/docs/guides/realtime
