由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 中文电视和视频的字幕为什么无法自动形成,要靠人手输入?
相关主题
中文电视和视频的字幕为什么无法自动形成,要靠人手输入?YouTube的自动字幕能翻译四川话了
再有中国科企涉嫌造假Re: 一个蠢问题...
见证强大的“人工智能”:iPhone 4S语音助理初体验一个中国公民的美国狱中日记(6)- 免费减肥班招生
有什么好的speak reminder APP这一定是错觉
狗狗的无人驾驶车要夭折了郑大世太不幸了
H这个字母到底怎么发音?普通话应该改革,去掉一些北京话元素
美国很有可能被所谓的AI搞死 将被泡沫拖死殡仪车追活人“超前服务”寒人心 sohu
曾經吹噓的很火的「同聲翻譯」,現集體失業了吧?韩国游行,高举"汉文万岁"!
相关话题的讨论汇总
话题: 字幕话题: 中文话题: youtube话题: 识别话题: 自动
进入Military版参与讨论
1 (共1页)
P****R
发帖数: 22479
1
中文电视和视频的字幕为什么无法自动形成,要靠人手输入?
作者:楼宇
同样YouTube提供自动生成的英文字幕,为什么中国没有相关软件?
YouTube的自动字幕功能准确率确实非常高,当时看到这个功能的时候我非常高兴,心
想以后做视频不用录入字幕了,直接扔给Google识别去就行了。然而查找资料以后发现
YouTube不支持中文的自动字幕,于是非常不爽。几经周折以后,我发现了一个软件叫
AutoSub,原理是在本地对音频大致的按停顿分割一下,然后对每一句用Google语音识
别API进行识别。
图1:
图1是我用proxychains给AutoSub挂上代理以后生成的一段字幕,可以看到准确率非常
高。毕竟语音识别API和YouTube的自动字幕都是谷歌的语言识别产品,估计使用的技术
是一样。可喜的是Google语音API支持的语言比YouTube多很多,中文也是可以的。于是
我高高兴兴的输入了一个中文的视频,结果……
图2:
于是我明白为什么没有提供中文自动字幕的网站了……
(至于为什么中文识别跟英文识别差这么多,我个人认为主要原因是英文很少有同音的
词,而中文的同音字太多了,需要结合上下文才能准确判断。)
m**********e
发帖数: 12525
2
早跟你们说了
中文是地球上唯一一种面向对象的人类语言
就像java一样,中文含有大量的词汇overload
所以中文语音识别就必须根据内容判断怎么overload
这就需要复杂的人工智能
d*****u
发帖数: 17243
3
不管什么语言,语音识别都要参考上下文,不然没法看
中文的词比较短,这点上难度可能是要大一些,但用现在的算法差别不是特别大。
google拼音里有语音输入法,其中有中文的。我自己经常用,觉得效果还可以。

【在 P****R 的大作中提到】
: 中文电视和视频的字幕为什么无法自动形成,要靠人手输入?
: 作者:楼宇
: 同样YouTube提供自动生成的英文字幕,为什么中国没有相关软件?
: YouTube的自动字幕功能准确率确实非常高,当时看到这个功能的时候我非常高兴,心
: 想以后做视频不用录入字幕了,直接扔给Google识别去就行了。然而查找资料以后发现
: YouTube不支持中文的自动字幕,于是非常不爽。几经周折以后,我发现了一个软件叫
: AutoSub,原理是在本地对音频大致的按停顿分割一下,然后对每一句用Google语音识
: 别API进行识别。
: 图1:
: 图1是我用proxychains给AutoSub挂上代理以后生成的一段字幕,可以看到准确率非常

1 (共1页)
进入Military版参与讨论
相关主题
韩国游行,高举"汉文万岁"!狗狗的无人驾驶车要夭折了
蹊跷的很。我老在北京买房时,都是有喷淋的。 (转载)H这个字母到底怎么发音?
美国教练带的队都有点蛮横美国很有可能被所谓的AI搞死 将被泡沫拖死
苏联元帅的名字起的都很有气势曾經吹噓的很火的「同聲翻譯」,現集體失業了吧?
中文电视和视频的字幕为什么无法自动形成,要靠人手输入?YouTube的自动字幕能翻译四川话了
再有中国科企涉嫌造假Re: 一个蠢问题...
见证强大的“人工智能”:iPhone 4S语音助理初体验一个中国公民的美国狱中日记(6)- 免费减肥班招生
有什么好的speak reminder APP这一定是错觉
相关话题的讨论汇总
话题: 字幕话题: 中文话题: youtube话题: 识别话题: 自动