关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013549人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

李想汽车研究院:让AI从"工具使用者"进化为"工具创造者"

科技行者 浏览 256 02-05

泽连斯基向特朗普展示俄境内潜在打击目标地图

环球网资讯 浏览 336 10-19

溢价24%仍失败!必和必拓被爆出价400亿英镑被拒,英美资源坚持自身并购计划

华尔街见闻官方 浏览 239 12-02

吉尔贝托:枪手要给道曼提供支持,不要给他施加太多的压力

懂球帝 浏览 359 10-13

理想i8内饰终于曝光!产品已无悬念,本周开始预定

爱范儿 浏览 3124 07-16

罗马诺:雷斯今日未出现在曼城阵容中,他即将租借加盟赫罗纳

直播吧 浏览 9818 08-06

风暴下的少林寺:方丈室被封死 黑衣人把守去僧院的门

齐鲁壹点 浏览 3429 07-31

英伟达、AMD股价开盘大涨,GPU出口“松绑”后仍需面临激烈竞争

第一财经资讯 浏览 4045 07-16

王力宏方否认新恋情,女子身份曝光是合作方女友,离婚三年仍单身

扒虾侃娱 浏览 408 09-11

F1、那尔那茜翻车、拉布布爆火、蔡澜去世、以伊冲突等

电影最TOP 浏览 7946 07-12

“分裂”的脱口秀

惊蛰研究所 浏览 4975 08-06

媒体:过过打仗瘾 特朗普动用三艘驱逐舰打击贩毒集团

新民周刊 浏览 907 08-20

谢广坤教诲女儿要自立:考证我同意 车你要自己买

小杨侃事 浏览 479 08-25

程思韵获批出任汇丰人寿董事长,公司刚获股东增资3.62亿元

蓝鲸Insurance 浏览 706 08-14

2025港姐三强颜值惹众怒

科学发掘 浏览 414 09-08

“北汽享界班”开班,确保学生所学即所用、毕业即上岗

IT之家 浏览 360 09-21

夏天衣服没必要买太多!这几条裤子和裙子准备好,舒适又百搭

静儿时尚达人 浏览 408 09-05

爽赚1个亿!切尔西官推回忆世俱杯夺冠:一周前的此刻

直播吧 浏览 3770 07-21

博主:此前杨瀚森屡屡被DNP时,很多当地球迷都要求退季票

懂球帝 浏览 268 12-29

苗原:山东泰山某领导坚持引进洛佩斯,教练组没要求换外援

懂球帝 浏览 2147 07-22

球迷态度:你觉得谁是本届全明星最大的遗珠?

懂球帝 浏览 225 02-02
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11