Autotiming让声音可逐句搜索视频内容碎片化分享
Autotiming是一个语音-文字匹配程序产品。最直接的效果是,它改变了两件事:视频、音频字幕的制作不用再人工逐字逐句校对匹配;另外,让语音搜索更智能。这个搜索不是通过视频、音频的标题或者标签文字,而是里面的每个词、每句话都可以作为视频搜索的线索。
这个产品由两名从事语音识别自主创业7年的科学家开发,曾分别供职于英特尔声音研究院和中科院声音研究所。而在此这前,语音分析领域已经对这个技术研究了27年。松禾资本的投资总监张春晖是其投资人。
经常看剧的朋友会注意到一点,在职员表里会有一个部门:字幕中心。他们的工作就是为视频甚至音频节目配上字幕。简单地说,他们的工作流程就是把文字脚本和声音一句一句地匹配上,然后编码在一起。如果文字脚本是要翻译的,比如美剧、韩剧等,则是先录下原来的字幕并标记时间,一句句翻译出来之后,再逐一对应。这个对应过程还需要人工调整字幕显示时间,而这个时间轴的调整通常是以毫秒为单位的,非常繁琐。
Autotiming的做法是通过技术手段,把音频或者是视频的语音句子分解成单词,然后将单词语音与文字词语对应起来。即把句对句变成了词对词。这样的效果是文字匹配和时间轴对应都更准确,并大大节省人力,提高效率。同时,反过来,由于文本信息与语音信息段节点的逐一对应,这就相当于把声音素材转换成一个文本信息库,于是可以用文字来检索视频内容。比如,直接搜某一个词句,就可以直接检索到视频或音频中间的某一个位置。类似于word里的查找效果。而不需要逐句逐句地翻下去。
并且,可以选择一定的文字范围,再点击分享,就可以将对应的这段视频内容分享出去。
这项技术的应用可能一些朋友已经接触过了,比如新东方在线教育,通过文字可以搜索网络课程的要点,就是运用的这项技术。
(图:创新中国2013文化创意专场,Autotiming团队现场展示)
出口退税流程图
注册公司多久
增值电信业务许可证
工商税务代办公司
- 多空交织天胶区间震荡链缝机粘合机铝合金管件模具定位片Frc
- 印刷经验之如何清除承印物上的杂质临江隔膜阀油画瓷片白酒轧钢Frc
- 凌华科技5月营收644万美元6月底将亮相反光纸扩音机宇航服升降台牛皮皮料Frc
- 测定纯水pH值的影响因素休闲食品斧头掌机水晶瓷片拼装模型Frc
- 国际铜市场依然短缺水井钻机移民咨询五菱配件非标螺钉力矩电机Frc
- 沙特阿拉伯扁平材市场需求仍然强劲阀门油船专业气体加热设备游泳池Frc
- 装载机超越离合器制造工艺改进石嘴山开发软件扩散剂方孔网壁挂机Frc
- 1月16日天津地区PVC市场延续平淡开沟机家庭护理金属加工木工机床干电池Frc
- 看卡特彼勒CEO的本命年第一件事做了什么日喀则蒸熏炉拉力废铁V型卡箍Frc
- 印度信实工业公司新建聚酯装置将投产绵竹水泥制品台锯粘合机带追光灯Frc