i***1 发帖数: 2534 | 1 http://tech.xinmin.cn/tongxin/2011/11/03/12579027.html
http://www.zdnet.com/blog/btl/how-apples-siri-really-works/6246
当用户对iPhone说话后,语音将被立即编码,成为一个压缩的数字文件,其中包含着所
有有用的信息。这一信息将通过互联网服务提供商(ISP)的网络被发送至云计算服务器
,而服务器中的模块将识别用户所说的内容。
与此同时,用户的语音将在手机端被识别。安装在手机中的语音识别器将与云计算
服务器通信,了解指令是否适合在本地被处理。用户的指令可能要求手机播放一首歌曲
,而另一些指令则有可能需要手机连接至网络,寻求进一步的帮助。如果语音识别器认
为,手机内部模块足以处理用户的指令,那么将会告知云计算服务器,不再需要服务器
的支持。
根据用户的声调和语序,服务器将对语音进行静态对比,了解语音中包含哪些字母
。与此同时,本地的语音识别器也将对用户语音进行静态对比。在服务器端和手机端,
可能性最高的识别内容将优先获得处理。
此时,识别出的内容已经包含一系列的元音和辅音字母。随后这些内容将被发送至
一个语言模块,以评估用户的语音中包含哪些单词。根据不同的可信度,计算机将创建
一个用户所说内容的列表。
如果判断结果具有足够的可信度,那么计算机将能理解用户所说的内容,例如发送
短信或查找联系人列表中的联系人。随后用户将会看到手机屏幕上出现所需的内容,而
不必手动操作。在这一过程中,如果用户的语音含义过于模糊,那么计算机将会询问用
户,例如用户希望查找的联系人是埃里卡・奥尔森(Erica Olssen)还是埃里卡
12539;施密特(Erica Schmidt)。 |
r****y 发帖数: 26819 | 2 云计算服务器对同一个问题的回答是永远固定的,还是更新的?
比如不同人在不同时间反复问藏尸体的问题,云计算服务器是永远给出同一个回答,还
是已经被人为更新了?
【在 i***1 的大作中提到】 : http://tech.xinmin.cn/tongxin/2011/11/03/12579027.html : http://www.zdnet.com/blog/btl/how-apples-siri-really-works/6246 : 当用户对iPhone说话后,语音将被立即编码,成为一个压缩的数字文件,其中包含着所 : 有有用的信息。这一信息将通过互联网服务提供商(ISP)的网络被发送至云计算服务器 : ,而服务器中的模块将识别用户所说的内容。 : 与此同时,用户的语音将在手机端被识别。安装在手机中的语音识别器将与云计算 : 服务器通信,了解指令是否适合在本地被处理。用户的指令可能要求手机播放一首歌曲 : ,而另一些指令则有可能需要手机连接至网络,寻求进一步的帮助。如果语音识别器认 : 为,手机内部模块足以处理用户的指令,那么将会告知云计算服务器,不再需要服务器 : 的支持。
|
s********i 发帖数: 17328 | 3 machine learning.
【在 r****y 的大作中提到】 : 云计算服务器对同一个问题的回答是永远固定的,还是更新的? : 比如不同人在不同时间反复问藏尸体的问题,云计算服务器是永远给出同一个回答,还 : 是已经被人为更新了?
|
r****y 发帖数: 26819 | 4 yeah, it seems the machine still needs to learn a lot...
like this:
【在 s********i 的大作中提到】 : machine learning.
|