盡管谷歌的 Gemini AI 已經(jīng)可以處理圖片、PDF 文件甚至上傳視頻文件進(jìn)行分析,但谷歌此前并沒(méi)有帶來(lái)音頻文件的支持,對(duì)于喜歡使用 AI 總結(jié)會(huì)議音頻的用戶來(lái)說(shuō)是個(gè)遺憾。
所以現(xiàn)在谷歌要為用戶帶來(lái)音頻文件的支持,谷歌實(shí)驗(yàn)室副總裁兼 Gemini AI 團(tuán)隊(duì)負(fù)責(zé)人已經(jīng)確認(rèn)此次更新并將其稱為首要請(qǐng)求,用戶可以在 Gemini AI 網(wǎng)頁(yè)版、iOS 版和 Android 版上上傳音頻文件。
支持的音頻文件格式包括 MP3、WAV 及其他大多數(shù)常見(jiàn)的音頻格式文件,上傳音頻文件后可以交給 AI 將音頻內(nèi)容轉(zhuǎn)錄為文字,或者直接要求生成摘要例如會(huì)議的重點(diǎn)內(nèi)容等。
當(dāng)然付費(fèi)用戶和免費(fèi)用戶獲得的權(quán)益是不同的,其中免費(fèi)用戶每次最多可以上傳 10 個(gè)音頻文件片段,并且所有音頻文件的總和時(shí)長(zhǎng)不超過(guò) 10 分鐘,用戶也可以嘗試分次進(jìn)行上傳和分析。
如果是付費(fèi)用戶包括 Google AI Pro 或 Google AI Ultra 等訂閱,則可以上傳最多 3 小時(shí)也就是 180 分鐘的音頻文件,這可以滿足大多數(shù)會(huì)議音頻或其他音頻的分析需求。
對(duì)免費(fèi)用戶來(lái)說(shuō) 10 分鐘確實(shí)有些少,例如較長(zhǎng)的會(huì)議音頻錄音可能有 30 分鐘甚至更久,這種情況下用戶就需要考慮付費(fèi)訂閱 Google AI 服務(wù)以獲得更高的使用配額了。
以上就是“谷歌為Gemini新增上傳音頻功能 可以通過(guò)AI處理音頻并進(jìn)行轉(zhuǎn)錄和分析等”的詳細(xì)內(nèi)容,想要了解更多IT圈內(nèi)資訊歡迎持續(xù)關(guān)注編程學(xué)習(xí)網(wǎng)。
掃碼二維碼 獲取免費(fèi)視頻學(xué)習(xí)資料
- 本文固定鏈接: http://phpxs.com/post/13505/
- 轉(zhuǎn)載請(qǐng)注明:轉(zhuǎn)載必須在正文中標(biāo)注并保留原文鏈接
- 掃碼: 掃上方二維碼獲取免費(fèi)視頻資料