马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?快速注册
x
最牛语音识别技术的公司9 F( n0 ]: w/ f2 m; d8 W# H
5 a0 A! h2 e9 |$ T' T7 {
任何时候提到语音识别,都不能避过Nuance这家公司,这家公司曾经在语音领域一统江湖,世界上有超过80%的语音识别都用过Nuance识别引擎技术,其语音产品可以支持超过50种语言,在全球拥有超过20亿用户,几乎垄断了金融和电信行业。就算现在,仍旧是瘦死的骆驼比马大,Nuance依旧是全球最大的语音技术公司,掌握着全球最多的语音技术专利。
# v- C$ B' `2 p1 D/ @9 o
2 O3 _, x+ d7 l# n 国外Google、Apple、 MSRA语音识别的基础研究做得比较久,技术上比较好。国内专门做语音识别的有“科大讯飞”和“云知声”,前者是上市公司,发展时间比较长。后者是新成立的公司,但技术上有独到的地方。云知声目前发展很强劲,技术很厉害。好像搜狗语音输入法、易信、乐视TV、小米等产品都采用了云知声的语音识别技术。
) V8 U* V. b3 A
0 V( p5 `0 k8 p% d1 a7 ~! j- K" f& x1 r4 o9 w
1、Nuance' W7 }+ b3 `4 U: Y: B
$ U: t+ S! Q8 t/ u+ Z( | Nuance公司(Nuance CommunicaTIons, Inc. (NASDAQ: NUAN)) 是最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。目前世界上最先进的电脑语音识别软件Naturally Speaking就出自于Nuance公司。用户对着麦克风说话,屏幕上就会显示出说话的内容。T9智能文字输入法作为旗舰产品,最大优势支持超过70种语言,超过30亿部移动设备内置T9输入法。已成为业内认同的标准输入法,被众多OEM厂商内置,包括诺基亚、索爱、三星、LG、夏普、海尔、华为等等。T9全球市场占有率超70%,中国超50%。
) z5 h* e+ c9 c, b" u7 b% [
6 Q# _- l) y! G% K6 ^) z( I m 自电脑问世以来,科学家们就一直致力于让电脑能够理解人们的讲话。几年前,除了实验室内的演示之外,这方面还没有什么进展。不过2010年来电脑的语音识别功能已经有了质的飞跃,随着语音识别技术慢慢走向成熟,驾驶员可以“告诉”全球定位系统(GPS)他们的目的地;手机用户不必按键,只需要对着手机发布命令即可;医生可以口述患者的病历,而旁边的设备就能自动记录下来,这一切通过口头指令来控制操作的应用已经不仅仅出现在科幻小说中了,而是真正成为了现实。4 m- D7 ?) v+ T c" C4 m$ n
& p1 ]. o* i/ u2 `; f( q8 F4 G: ]+ d0 q
2、Google
' Y- {% c/ u* N/ R& I& ?2 V7 |9 {1 ~1 x1 u8 k, V
谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和谢尔盖·布林共同创建,被公认为全球最大的搜索引擎。4 [5 ?9 |, b: f3 M9 X2 n R
5 k" |! }) E" `9 ^$ d) z
谷歌是一家位于美国的跨国科技企业,业务包括互联网搜索、云计算、广告技术等,同时开发并提供大量基于互联网的产品与服务,其主要利润来自于AdWords等广告服务。6 H7 U4 X Z( K! P* |4 B! t3 K; \
8 z/ ]2 j, v/ h- l- Q$ r
9 U; O7 ?: |6 t* D% @( \3 r 3、Apple( G2 J! m6 V/ c+ L" r$ I6 P
# b4 K2 Q Y, A4 w# L: o Siri成立于2007年,2010年被苹果以2亿美金收购,最初是以文字聊天服务为主,随后通过与全球最大的语音识别厂商Nuance合作,Siri实现了语音识别功能。
, c3 e% x' J; {( q- ~$ v
+ r* C& _" N7 `) @7 ~$ G9 x Siri可以支持自然语言输入,并且可以调用系统自带的天气预报、日程安排、搜索资料等应用,还能够不断学习新的声音和语调,提供对话式的应答。8 k! @% W( g: t' b: B9 N
* N& V$ v, |# ~' Y, d) Z5 J1 h 4、MSRA语音; I. [, C+ n6 V7 u, C: A: X' |
2 v: E. l- z! ~8 `
语音识别是众多研究团队和企业正在努力攻克的技术高地,有关识别准确率的竞争和比较从未停止。去年,微软率先实现语音识别系统5.9%的低错误率,在Switchboard对话语音识别任务中已经达到人类对等的水平。
; k* K e+ I# Z' O) k8 s. M
, I B/ J& S; |' u 微软语音和对话研究团队负责人黄学东宣布微软语音识别系统继微软对话语音识别技术达至人类专业水平,开启人工智能新征程之后再次取得重大突破,错误率由5.9%进一步降低到5.1%,可与专业速记员比肩。此次突破大幅刷新原先记录,并在语音识别行业树立新的里程碑。
7 T8 ~$ D, O- h& s6 q+ y. @' m9 j& d7 k! S6 |" D7 t5 \
在微软转录系统达到5.9%的错误率之后,其他研究人员在此基础上分别进行研究,采用了更多参与的多转录程序,成功在语音识别准确性道路上更进一步。
N* }- o; K: t2 Z) ^* b# {% i$ X; M# L( _/ s
$ G" g( l& D. T" ?
5、科大讯飞- P% y, G( A% B7 u3 F1 M. `6 X
+ T) C0 w" W; v% P 科大讯飞股份有限公司(IFLYTEK CO.,LTD.),前身安徽中科大讯飞信息科技有限公司,成立于1999年12月30日,2014年4月18日变更为科大讯飞股份有限公司 ,专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成。拥有灵犀语音助手,讯飞输入法等优秀产品。4 w, J1 A: Y1 H* z% k
) [- ` ]4 U5 o7 ~2 `: H( T4 g1 J: o
基于拥有自主知识产权的世界领先智能语音技术,科大讯飞已推出从大型电信级应用到小型嵌入式应用,从电信、金融等行业到企业和家庭用户,从PC到手机到MP3/MP4/PMP和玩具,能够满足不同应用环境的多种产品。科大讯飞占有中文语音技术市场70%以上市场份额,语音合成产品市场份额达到70%以上,在电信、金融、电力、社保等主流行业的份额更达80%以上,开发伙伴超过10000家,灵犀定制语音助手在同类产品中用户规模排名第一。以讯飞为核心的中文语音产业链已初具规模。0 [ \% R& h* K) z9 n( ]) I
9 @6 \( `& f% T2 ]% O9 V I! w
! W" F" s9 l: H+ j) P% z. V4 J
6、云知声0 G5 Z7 u. v, i9 Q8 m( j
* V0 e4 T5 h* j* Y4 M 云知声,是一家专注物联网人工智能服务,拥有完全自主知识产权、世界顶尖智能语音识别技术的高新技术企业 。总部位于北京,在上海、深圳设有分公司。主要产品包括智能家居、智能车载、智慧医疗、智能教育等语音技术解决方案、云知声输入法、语控精灵等。
& P. W( K2 g! g* E Z) F2 ^& [ a. v2 d& O$ W; Q( X
云知声自成立以来,发展迅速,备受人工智能行业及资本市场的广泛关注,累积融资近亿美元,合作伙伴数量也已经超过2万家。其中语音云平台覆盖的城市超过470个,覆盖设备超过9000万台。并且,云知声连续两年入选福布斯中国最快科技成长公司50强企业,是中国人工智能行业成长最快的创业公司之一。; |4 n7 c6 N. p6 v/ `0 Y
3 e& I) c7 d- K3 n
8 D% d: P: {$ ? b! F 7、百度语音
: h K. Y, q- z% [7 B
3 Y# D; e: y" @5 x' q 百度语音搜索,基于强大的语音识别能力,支持通过语音命令快速发起搜索,让搜索更快捷、更智能。
3 Z& ]0 e, X1 c% Q1 x" Q2 H. v8 j( [3 ^& c, A6 \
“世界很复杂,百度更懂你”,对比手机端的文本键盘输入,百度语音搜索是更自然的,符合移动设备的交互方式。在百度强大的人工智能技术支持下,语音搜索前景广阔。语音等现代搜索引擎要做的是连接人与信息及服务,它不仅会倾听,更懂得理解与思考,未来将更好地造福人类。 N" @7 g( `4 Q9 n9 d# m x1 S
+ A: L+ y' F! p
& ]3 K$ ~0 O/ {" A& k/ X+ q. R
|
|
|
|
|