FunClip是什么?
FunClip是一款完全開源、本地部署的自動化視頻剪輯工具,通過調(diào)用阿里巴巴通義實驗室開源的FunASR?Paraformer系列模型進行視頻的語音識別,隨后用戶可以自由選擇識別結果中的文本片段或說話人,點擊裁剪按鈕即可獲取對應片段的視頻。
- GitHub項目地址:https://github.com/alibaba-damo-academy/FunClip
- 在線體驗地址:https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary

FunClip的功能特色
- FunClip集成了阿里巴巴開源的工業(yè)級模型Paraformer-Large,是當前識別效果最優(yōu)的開源中文ASR模型之一,Modelscope下載量1300w+次,并且能夠一體化的準確預測時間戳。
- FunClip集成了SeACo-Paraformer的熱詞定制化功能,在ASR過程中可以指定一些實體詞、人名等作為熱詞,提升識別效果。
- FunClip集成了CAM++說話人識別模型,用戶可以將自動識別出的說話人ID作為裁剪目標,將某一說話人的段落裁剪出來。
- 通過Gradio交互實現(xiàn)上述功能,安裝簡單使用方便,并且可以在服務端搭建服務通過瀏覽器使用。
- FunClip支持多段自由剪輯,并且會自動返回全視頻SRT字幕、目標段落SRT字幕,使用簡單方便。
如何使用FunClip?
方法一:在線體驗魔搭社區(qū)demo
訪問魔搭社區(qū)體驗鏈接:https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary,按照下方步驟使用:
- Step1: 上傳視頻或音頻文件(或使用下方的用例體驗),點擊?識別?按鈕
- Step2: 復制識別結果中所需的文字至右上方,或者右設置說話人標識,設置偏移與字幕配置(可選)
- Step3: 點擊?裁剪?按鈕或?裁剪并添加字幕?按鈕獲得結果
方法二:在本地啟動Gradio服務
確保本地已安裝Python和Git,在電腦終端執(zhí)行以下命令。
git clone https://github.com/alibaba-damo-academy/FunClip.git
cd FunClip
python funclip/launch.py
隨后在瀏覽器中訪問localhost:7860
即可看到如下圖所示的界面,按如下步驟即可進行視頻剪輯
- 上傳你的視頻(或使用下方的視頻用例)
- (可選)設置熱詞,勾選是否使用說話人識別功能
- 點擊識別按鈕獲取識別結果
- 將識別結果中的選段復制到對應位置,或者將說話人ID輸入到對應為止
- (可選)配置剪輯參數(shù),偏移量與字幕設置等
- 點擊“裁剪”或“裁剪并添加字幕”按鈕

?版權聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。
