-
Genie-谷歌發(fā)布的AI基礎(chǔ)世界模型,一張圖片生成交互世界
Genie是由谷歌發(fā)布的根據(jù)互聯(lián)網(wǎng)視頻訓(xùn)練的基礎(chǔ)世界模型,該模型參數(shù)規(guī)模為11B,可以從合成圖像、照片甚至草圖生成無數(shù)種動作可控的交互式環(huán)境。- 9.5k
- 0
-
Gemma-谷歌發(fā)布的最新開放模型,小尺寸可商用
Gemma是谷歌最新發(fā)布的一款開放模型,屬于輕量級開放模型系列。它采用了與創(chuàng)建Gemini模型相同的研究和技術(shù),是一個小尺寸的大語言模型。- 16.6k
- 0
-
MobileDiffusion-谷歌推出的移動端AI繪畫模型
MobileDiffusion是谷歌推出的專為移動設(shè)備設(shè)計的高效潛在擴散模型,可以為各種領(lǐng)域生成高質(zhì)量的多樣化圖像- 5.2k
- 0
-
MusicFX-谷歌發(fā)布的免費AI音樂生成工具
MusicFX為音樂創(chuàng)作者提供了豐富的音效和聲音素材,用戶可以創(chuàng)作各種類型的音樂,同時支持調(diào)整音調(diào)、節(jié)奏和音量,還可以添加混響、回聲等效果。無論是想要營造舒緩的氛圍還是冒險緊張的氛圍,MusicFX都可以滿足。- 10.3k
- 0
-
Imagen 2:谷歌發(fā)布的AI繪畫模型
Imagen 2是Google DeepMind開發(fā)的最先進的文本到圖像擴散技術(shù)。它能夠生成高質(zhì)量、逼真的圖像,這些圖像與用戶的提示緊密對齊且一致。- 9.3k
- 0
-
W.A.L.T:通過擴散模型生成逼真視頻的AI模型
近日,谷歌與李飛飛的斯坦福團隊攜手推出了基于Transformer的視頻生成模型W.A.L.T。該模型利用因果編碼器和窗口注意的變壓器架構(gòu),成功將圖像和視頻壓縮到一個共享的潛在空間,實現(xiàn)了聯(lián)合訓(xùn)練和生成。這一創(chuàng)新性的模型不僅在已建立的視頻和圖像生成基準測試上取得了SOTA,還展示了在文本到視頻生成任務(wù)中的卓越性能。 這種方法有兩個關(guān)鍵的設(shè)計決策。首先,它使用因果編碼器共同壓縮圖像和視頻,使其在統(tǒng)一…- 3.7k
- 0
-
AlphaCode2-Google公布的基于Gemini的AI編程助手
谷歌日前發(fā)布了AlphaCode2,這是一款由Gemini模型驅(qū)動的AI編程工具,是對前代AlphaCode的改進版本。與Gemini模型同時亮相,AlphaCode2在編程競賽中表現(xiàn)出色,尤其在動態(tài)規(guī)劃等復(fù)雜問題上具備更強大的能力。 研究人員通過在CodeForces競賽網(wǎng)站上收集的約15000個問題和3000萬份人類編寫的代碼的數(shù)據(jù)集上對Gemini Pro系統(tǒng)進行精細調(diào)整,為AlphaCod…- 4.7k
- 0
-
Gemini-谷歌發(fā)布的多模態(tài)AI大模型
AIHub 12 月 6 日消息,谷歌宣布推出其認為規(guī)模最大、功能最強大的人工智能多模態(tài)AI模型 Gemini。意味著它可以理解、操作和結(jié)合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。- 31.6k
- 0
-
-
谷歌即將發(fā)布對話式人工智能軟件Gemini 挑戰(zhàn)OpenAI的GPT-4
據(jù)報道,谷歌即將發(fā)布其對話式人工智能軟件?Gemini。這家科技巨頭已經(jīng)讓一些選定的公司提前獲得 Gemini 的早期版本,該版本旨在與 OpenAI 的 GPT-4模型競爭。- 970
- 0
-
與 ChatGPT 展開競爭:谷歌聊天機器人 Bard 拓展至歐洲和巴西
北京時間7月14日早間消息 據(jù)報道,當(dāng)?shù)貢r間周四,谷歌公司表示將在歐洲和巴西推出人工智能聊天機器人Bard,這是該公司自今年2月推出該產(chǎn)品以來最大規(guī)模的擴張,并將與微軟支持的聊天機器人ChatGPT展開競爭。- 724
- 0
-