P****R 发帖数: 22479 | 1 中文电视和视频的字幕为什么无法自动形成,要靠人手输入?
作者:楼宇
同样YouTube提供自动生成的英文字幕,为什么中国没有相关软件?
YouTube的自动字幕功能准确率确实非常高,当时看到这个功能的时候我非常高兴,心
想以后做视频不用录入字幕了,直接扔给Google识别去就行了。然而查找资料以后发现
YouTube不支持中文的自动字幕,于是非常不爽。几经周折以后,我发现了一个软件叫
AutoSub,原理是在本地对音频大致的按停顿分割一下,然后对每一句用Google语音识
别API进行识别。
图1:
图1是我用proxychains给AutoSub挂上代理以后生成的一段字幕,可以看到准确率非常
高。毕竟语音识别API和YouTube的自动字幕都是谷歌的语言识别产品,估计使用的技术
是一样。可喜的是Google语音API支持的语言比YouTube多很多,中文也是可以的。于是
我高高兴兴的输入了一个中文的视频,结果……
图2:
于是我明白为什么没有提供中文自动字幕的网站了……
(至于为什么中文识别跟英文识别差这么多,我个人认为主要原因是英文很少有同音的
词,而中文的同音字太多了,需要结合上下文才能准确判断。) |
m**********e 发帖数: 12525 | 2 早跟你们说了
中文是地球上唯一一种面向对象的人类语言
就像java一样,中文含有大量的词汇overload
所以中文语音识别就必须根据内容判断怎么overload
这就需要复杂的人工智能 |
d*****u 发帖数: 17243 | 3 不管什么语言,语音识别都要参考上下文,不然没法看
中文的词比较短,这点上难度可能是要大一些,但用现在的算法差别不是特别大。
google拼音里有语音输入法,其中有中文的。我自己经常用,觉得效果还可以。
【在 P****R 的大作中提到】 : 中文电视和视频的字幕为什么无法自动形成,要靠人手输入? : 作者:楼宇 : 同样YouTube提供自动生成的英文字幕,为什么中国没有相关软件? : YouTube的自动字幕功能准确率确实非常高,当时看到这个功能的时候我非常高兴,心 : 想以后做视频不用录入字幕了,直接扔给Google识别去就行了。然而查找资料以后发现 : YouTube不支持中文的自动字幕,于是非常不爽。几经周折以后,我发现了一个软件叫 : AutoSub,原理是在本地对音频大致的按停顿分割一下,然后对每一句用Google语音识 : 别API进行识别。 : 图1: : 图1是我用proxychains给AutoSub挂上代理以后生成的一段字幕,可以看到准确率非常
|