第225章 中文语音识别的难点
网上的讨论还在持续,随着越来越多人提现成功,讨论的人也变得越发多了。
而其中一部分反应较快的网民和科技圈人士,突然都反应过来,这个活动除了微聊以外,熊猫科技也加入了,甚至可以说这个活动主要发起人是熊猫科技才对。
不少人都好奇,熊猫科技这到底是在干啥。
“读10个短句就给1块钱,微聊用来做支付推广,那熊猫科技拿这些乱七八糟的录音干什么?”
“对啊,我也好奇,熊猫科技到底干啥,总不能就是为了给我们奖励吧。”
机锋网、威锋网等各大数码论坛上,关于熊猫科技意图的帖子迅速多了起来,一些懂技术的科技大v和程序员开始在围脖上发文分析。
“大家注意看那些句子的结构,包含了指令词、日常对话词,甚至还有标点停顿的测试,而且录音前还要求勾选家乡所在省份,这明显是在做大规模的中文语音采集。”
“对,肯定是做语音相关的技术,不然根本不需要收集这么多的语音。”
讨论着讨论着,一些长期关注海外科技动态的博主跟进了猜测。
“会不会是语音识别,大家还记得今年四月份,水果才刚刚收购了siri语音助手,准备将其整合进ios;谷歌的语音搜索也一直在安卓里推,熊猫科技现在搞这个,肯定是要给panda os开发属于自己的手机语音助手。”
“我去,好有道理哦,不然收集这么多语音干嘛,估计就是语音助手了。”
这个猜测一出,迅速得到了大部分网民的认同,越来越多人认为,熊猫科技的下一步动作就是要跟水果和谷歌一样,在手机里整合一个语音助手。
不少网友看到这一幕,内心也都期待起来,好奇有了语音助手后会不会更加便捷,是不是比起现在的手势操作还要便捷得多。
然而,在这一片期待声中,几家老牌的科技媒体却直接发布专栏文章,把网友的热情给降了下来。
其中一篇叫《海量数据救不了中文语音,panda os的语音助手难成气候》一下就火了起来。
“语音识别的核心在于声学模型,目前全球巨头采用的模型在英文处理上勉强及格,但在中文的处理上有着相当大的问题。”
“中文除了有四声以外,同音字也多,更加严重的是各地口音复杂,目前没有任何一个公司能够保证,自己的语音识别准确率能够突破80%,更不要说更加复杂的中文了。”
“熊猫科技靠收集大量的中文语音数据进行优化,这招确实很聪明,但在底层技术的桎梏面前,即便收集再多的数据,短时间内也绝不可能做出真正好用的语音助手。”
这篇文章的发布,让不少网友的热情也下降了不少,大部分人都认为,熊猫科技的技术确实强大,但在行业巨大的桎梏面前,熊猫科技也不可能在短时间内取得突破。
估计也就是先收集语音数据,只是为了帮助微聊推广微聊支付,顺便为以后做语音识别做准备。