朵朵妙芯
发表于 2005-5-27 18:18:00
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?快速注册
x
标贝科技是一家2016年2月组建,6月开始正式运营的语音合成公司。凭借不到30人的小团队和仅仅1人的市场兼销售,他们在成立当年便收回成本,实现收支平衡,更在2017年获得了2000万元以上的收入。+ b) l) D. h# }" \* l4 g
$ N& y5 _) } H1 p语音合成对多数人而言并不是多么陌生的技术,大家都知道这一技术应用在哪些地方。百度地图、滴滴出行等出行类app,喜马拉雅小雅音箱、Rokid若琪等智能音箱,出门问问等语音助手都被我们熟知。他们的声音背后,都有标贝的方案。
- {# d3 W. a. |. Y0 d* e: t1 ?% M- |) y5 y6 q4 T/ M& K
语音的背后是智能。标贝科技在产业中所处的位置,是人工智能的人机交互部分,这部分可进一步细分为语音识别、语义分析(2017年在国内骤然兴起的NLP)及语音合成三个领域。诚然,作为一家创业公司,标贝科技需要面对不少先行者乃至巨头;幸运的是,科大讯飞、捷通华声等老前辈把更多精力集中于语音识别,近些年国内的创业同行们也普遍专攻NLP,语音合成则相对是市场认知较晚、从业专家较少的领域。
* {2 M+ W1 L) ^' _
- M2 Q6 [) V0 ?" Z! c国内最早研究语音合成的团队,一些在国家机关如中科院,一些集中在高等学府如北大、清华、中科大等,一些则在科大讯飞、捷通华声等公司任职。最初的语音合成技术,应用于银行叫号机、火车站广播等跟互联网没啥关系的产品。严格来说,那个时代的语音合成并不是人工智能的细分领域;也因此,在需求变化后,当语音合成离不开人工智能,这个行业需要一定程度的「从头再来」,这也就给了标贝科技等创业公司以机会。4 Y7 w3 s* m- Y8 T! G- J; z, t
2 Y5 Z9 Y, _& F4 D( t; m* M4 m( H; `虽然尚属创业公司,但标贝科技的创始团队及其核心技术人员普遍有着六、七年以上的从业经历,他们来自科大讯飞、捷通华声、百度等大企业,不仅是这一曾经的冷门行业中为数不多的高级人才,彼此之间的合作也早有年月。此次出来创业,以创始人刘爽为首的标贝科技,打算带着语音合成的专业知识和经验,全面拥抱人工智能时代。, t5 s: o* }2 t! j6 l9 R* ~
+ b% i5 E# Y2 z G
仅仅提到「语音合成」,不足以描述标贝科技的垂直程度,实际上他们更专注于语音合成背后的数据库及其加工方式。简而言之,机器说话可以理解为对人类说话的一种模仿,但人类说话并没有一种固定的模式——拿高德地图来说,林志玲语音包和默认语音包能一样么?基于林志玲创建的语音数据库,可能就比来自其他人的更受欢迎一些。
3 V2 u& F0 f! S. K9 P$ N
! h% x1 w9 [6 t8 P1 R更细微的差别不止于此。一个成年人在兴奋时什么语气,沮丧时什么语气,正午什么音调,子夜什么音调,工作时如何用词,私密时如何用词,可能都会有显著区别。对于社会而言,10年前人们普遍的说话方式,及今天人们普遍的说话方式,差异也是一听便知。& M+ Z0 A* ^7 {4 f2 c" P
- j2 b p8 F# ?( V比如你现在走进屋子来录音。你刚刚进来时的声音,和你坐了一个小时后的声音,其实是不一样的。如果用这种有瑕疵的数据库来做语音合成,就很难避免不自然、不像人的地方。
2 G4 H# }- m7 U# V4 \7 G; H3 n- \! d( V; q! l) R' O
消除语音助手的「机器味」,或至少避免严重的违和感,产品背后的语音数据库就一定要与产品调性匹配,并且与时俱进——同样是神似真人的声音,你大概不希望打理日常琐事的语音助手,是2006年黄健翔解说足球比赛那个风味吧?
: c& r, w! g: _9 `! y: [' W6 Z& }6 q* p5 W- R' m
标贝所做的事情,就是通过构建更完善、更优质的数据库,让机器发声更自然、更贴近真人,也更适合产品自身的需要。使用过小雅音箱或若琪(这两款音箱的语音合成都来自标贝)的朋友大可自己判断,和其他产品相比,哪些声音听起来更舒服。) W+ J2 a9 F5 m/ y9 `0 ~
, O0 Z! O% e1 _+ R1 y9 h
标贝科技创始人刘爽表示,从数据库切入市场也有另一重考量,在于数据库更有说服力。比起对技术的解读,直接展示手中的资源更容易打动客户。不过,如今的标贝也推出了比数据库更直观的产品——免费、公开的测评工具,让不了解自己「为什么做不好语音合成」的客户明白问题出在哪儿。
% @" K5 `3 }( _& J% b3 ?
! p( I* M1 H$ Q: I9 @' ?) ^发现问题后,有些问题可以通过技术层面的改善解决,有些则必须调整数据库本身。这时,标贝积累的资源就能派上用场。基于更好的数据库,很多努力都可以事半功倍;对于企业来说,既然没必要重复造轮子,提前做好准备的标贝,就顺势成为了许多企业的首选。毕竟,时代已不同以往,想要在人工智能领域取得优势,细节非常重要。
. N. s8 E& t3 N5 P0 a
* s! j1 K% {+ u9 A6 f不管说的内容是什么,有人说话让你听着很舒服,有人则让你很烦躁。声音是一个与体验密切相关的东西,合格的就是合格,不合格的就是不合格。不合格的声音再怎么做些微改善,也达不到今天的要求。+ G2 L' I1 A C6 j1 P3 d& r
- C3 B2 v, T$ ^9 g |
|
|
|
|