hbsgz
发表于 2009-10-11 15:40:45
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?快速注册
x
语音识别简介
6 M: e3 @. l1 Z, e! l! c# ^+ }4 ~0 f1 x' t5 ?. i: D( H( k$ B
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。中国物联网校企联盟形象得把语音识别比做为“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用,例如在翼卡车联网中,只需按一键通客服人员口述即可设置目的地直接导航,安全、便捷。
+ I) T6 w' L% G/ J3 d) ?% T" g( n5 V4 S& c- |8 [) Q8 ^/ W/ G9 y' m$ v$ U
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。 语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。! J( F7 G5 v# `0 t$ k
$ `0 ]# m" h+ P3 ?: E# |# E4 e9 p/ x% f. n/ M
g0 Y7 y# n4 a6 V" F! ?
语音分类应用
6 y/ D; S; S# e& a. [% S% h( [
9 p5 l) A& ~7 l( J 根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolated word recogniTIon),关键词识别(或称关键词检出,keyword spotTIng)和连续语音识别。其中,孤立词识别 的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。
8 v9 T4 Q" V9 j% V# w+ p: e/ D" a7 E8 m* L4 ]% X
根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。
3 g9 i8 E- p1 ^6 X8 S- R5 j6 |1 W# Z V
另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。
2 V+ l( G; h; y
# Y* X' J$ S0 G4 K0 `9 c 语音识别的应用领域非常广泛,常见的应用系统有:语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等等。. g+ ~# H/ n% a: T0 g
% g; j) R( Q9 g% l$ ~. L3 _1 \9 @
; Q$ r! }( f7 h9 A3 T/ A+ u- H3 S9 f# t
语音识别原理- k/ u y0 P8 T# v+ T# O: K( S
( h6 t3 e5 g9 b: \1 i. n! ?
系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元,它的基本结构如下图所示:- s8 W7 o; D5 ^ b5 e U
! H7 a* B l3 V ]
. W$ w9 f, i1 l. o% [0 k" [9 A. b& w {+ I7 B* C
未知语音经过话筒变换成电信号后加在识别系统的输入端,首先经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型的好坏、模板是否准确都有直接的关系。
: V$ E& k0 k Y" u' i3 @
/ w1 N' w, U1 f( H0 q! L {
. A5 I2 F; ^: ^+ e: U7 O q 科大讯飞股份有限公司
3 w/ ?2 [( a% A 科大讯飞股份有限公司成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务及电子政务系统集成的国家级骨干软件企业。2008年,科大讯飞在深圳证券交易所挂牌上市,股票代码:002230。5 S3 t# F) a. _/ F# A! P
6 G% r9 B. H. z* Q- X0 J$ O2 c7 r 科大讯飞在智能语音核心技术研究领域,一直秉承“从市场中来、到市场中去”,“用正确的方法、做有用的研究”等核心理念,致力于建立智能语音及语言核心技术和核心技术应用产业化两大方面的竞争力。科大讯飞的核心技术主要包括:语音识别技术、语音合成技术、自然语言理解技术、语音评测技术、声纹语种技术、手写识别技术等。科大讯飞始终坚持提供国际领先的语音及语言整体解决方案,不断推出符合国家和社会需求的智能语音及语言技术产品及应用服务。
2 ^& P- q+ |7 J8 G0 ^' u9 A6 R0 z
0 v9 G7 K/ d1 R; Y$ T! T7 Q# Z# P7 J* e' J- Y2 W
7 y4 A) a: S% C7 j9 |# }, f 汇顶科技
- y7 l- a; c3 R' e; M8 ~ 汇顶科技成立于2002年,作为全球人机交互及生物识别技术领导者,目前已在包括手机、平板电脑和可穿戴产品等在内的智能移动终端领域构筑了领先优势,先后推出全球领先的单层多点触控芯片、全球首创的触摸屏近场通信技术Goodix LinkTM、全球首家应用于Android手机正面的按压式指纹识别芯片、全球首创的Invisible Fingerprint Sensor(IFSTM)、全球首创支持玻璃盖板的指纹识别芯片、全球首创应用于移动终端的活体指纹检测技术Live Finger DetecTIonTM、全球首创的显示屏内指纹识别技术等。- c5 @: S2 C5 Z! x+ y
; X8 c8 I& e9 h4 y8 L' F
其中,Live Finger DetecTIonTM凭借其卓越的创新应用价值斩获了2017国际消费电子展(CES)全球创新金奖,这是汇顶科技继2016年凭借IFSTM(触控与指纹识别一体化技术)和Goodix LinkTM(触摸屏近场通信技术)两项技术获得CES创新大奖后再次得到CES创新奖项,汇顶科技也由此成为首家荣获CES全球创新金奖的中国IC设计公司。目前,产品和解决方案主要应用于华为、OPPO、vivo、小米、中兴、魅族、联想、金立、锤子、TCL、Nokia、Dell、HP、LG、ASUS、acer、 TOSHIBA、Panasonic等国际国内知名品牌,服务全球数亿人群。) |* q0 n& U0 [6 g
) S8 `5 j5 t' K8 M3 v: u* s, G+ E" x3 `6 B' d& O4 l5 _' z% d
/ ~$ D6 s. u' M6 A+ F 汉王科技股份有限公司
+ G2 f7 T- m! a+ P 汉王科技股份有限公司成立于1998年,是全球文字识别技术与智能交互产品引领者,多年来,通过不断自主创新,在手写识别、光学字符识别(OCR)、笔迹输入等领域拥有多项具有自主知识产权的核心技术,综合技术水平在国内外均处于领先地位,手写汉字识别获得国家科技进步一等奖,OCR获得国家科技进步二等奖。
- d! w+ D" S5 a$ ?, m0 a: N1 u! d ~5 }% c: B! t7 m% O6 `6 P
汉王科技以核心技术为基础,面向市场需求,已形成了以识别技术为核心的、针对不同细分市场的软硬件产品系列,既有通用产品,如e典笔、汉王电纸书、汉王笔、文本王、名片通、绘图板等,也有针对教育、金融等行业应用的文表识别解决方案;既有手写手机、OCR等多种技术授权方案,也有辅助方案实施的硬件产品,如证照识别等。! E. f1 |2 \' k9 x* B
9 A' x5 }6 Z. H0 e) m
; p+ d, b9 S+ \% z3 q2 p7 u, M: {* ?) b; K! b1 z+ j
山东共达电声股份有限公司. O: {. Y% u [" a7 ?; \
山东共达电声股份有限公司是专业的电声元器件及电声组件制造商、服务商和电声技术整体解决方案提供商,是国家级高新技术企业、中国电子元件百强企业。
" g, ?) w) d* u5 a2 b7 \! I8 e, `$ m$ U* V/ G6 _; i/ v: K
公司始创于2001年,自设立以来,坚持“共融、共创、共享、共达”的企业核心价值观,秉承“和谐、超越、高效、求是”的企业精神,专注于电声元器件产品的研发和制造,致力于成为世界一流的电声技术整体解决方案提供商,主要产品包括微型麦克风、微型扬声器/受话器及其阵列模组,广泛应用于移动通讯设备及其周边产品、笔记本电脑、平板电视、个人数码产品、汽车电子等消费类电子产品领域。" i- K" v7 M5 M7 n. S
6 x( r2 K! J# M! N2 Z9 D& ]# S/ ^! s; q- {" Q) u. s
& b% K' Q7 }7 `' ?% S2 f/ S( u g 拓尔思
! U9 ?& X- {: T n 拓尔思是一家技术驱动型企业,历经二十余年的深耕和积累,在中文检索、自然语言处理等领域始终处于行业前沿,公司2011年在深交所创业板上市,股票代码300229,是第一家在A股上市的大数据技术企业。拓尔思以大数据+人工智能为发展战略,旨在帮助客户实现从数据洞察到智慧决策的飞跃。. s1 E6 M/ k" a9 [. j: V/ j0 u( q* [& m) D6 V
: G# e, W. e6 c) O1 H 拓尔思的核心业务包括软件产品研发,行业应用解决方案和数据分析挖掘云服务三大板块,涉及大数据管理、信息安全、互联网营销和人工智能等应用方向。7 Q a* P4 H* ? O$ S9 G; q/ u2 I3 g
/ U8 o/ ^1 T) Y 拓尔思是自主可靠软件产品领域的领军企业,TRS中文全文检索系统、WCM内容管理平台、CKM中文文本挖掘等软件均代表了国内相关领域自主创新的最高水平。同时拓尔思不断拓宽产品线和综合服务能力,为政府、媒体、安全、金融等多个行业提供领先的产品、技术和解决方案。为了迎接云计算时代的来临,公司近年来加快了基于云服务的数据分析和知识服务的发展步伐,旨在实现软件企业的战略转型和升级。8 e" U# ]* q* Y2 _# W' Z3 O: Q
, Y% E; D4 g' h1 w$ @6 B( H" I4 J
$ e2 N5 _. M! h5 h' R( U- {% H 精伦电子股份有限公司- @: B) P: Q9 ]) T
精伦电子股份有限公司是“武汉·中国光谷”国家级高新技术企业,成立于1994年,于2002年上市,是中国首家以全自然人作为发起人的上市公司,注册资本24,604.46万元,股票代码:600355。现有精伦工业园位于武汉总部,占地310亩。
_. R1 V! m6 t m$ N$ O1 \2 b* y7 ?+ v
精伦电子致力于各类电子智能终端的研发、设计与生产。目前公司主营产品包括:电子广告媒体终端;电子伺服系统终端;二代身份证阅读终端;电子交易终端;电力终端;家庭媒体娱乐终端;导航定位终端等。涵盖了:通讯、电力、传媒、三网融合、工业缝纫制造、公共安全等多个领域。并提供各类产品的服务平台、系统及整体设计、运营方案。
" N: e, C5 H# C( A# Y$ I6 ] q6 D1 i3 t+ `% k
精伦电子一直秉承自主知识产权和核心技术为基础的理念,每年投入销售利润的较大部分作为研发投入,与华中科技大学、上海浦东等地建立合作研发基地。拥有国家人事部批准的博士后科研工作站,在嵌入式操作系统、嵌入式硬件设计、嵌入式软件设计、音频视频信号处理、智能卡应用技术、大型数据库应用设计、网络信息安全设计技术等方面形成了自主核心技术体系。承建了多项国家高技术实施项目。公司正在逐步成为业界领先的智能终端研发与设计基地。
4 v4 `9 m$ l/ N D: q! p6 U1 ]. n2 L! Y! r6 a$ F
: y) e8 G; T' C. ^/ l3 Z8 o
; O" d* f% [8 I }; l3 t& f 上海益深电子有限公司
3 X# M& _2 ^, D% y: q. f* _ 上海益深电子有限公司,为专业从事语音芯片和家电控制芯片开发、生产、销售的高科技企业。主营单片机和DSP芯片以及相关电子产品和模组,承接各种专业控制方案开发。公司秉承“顾客至上,锐意进取”的经营理念,坚持的原则,为广大客户提供最优质的服务。业务范围:涉及汽车电子、多媒体、安全防盗、通信器材、家电控制、医疗器械、工业自动化控制、益智玩具及互动消费类产品等领域。
6 f, _: H2 u ]8 v7 ]0 f5 H9 P4 j! Z l5 n: m6 H- e6 E
& m$ C" b, ? r; J; z+ q
. D3 G4 K* M: l4 W 南京子佩软件科技有限公司2 C& U3 K& F9 i2 V: G9 T! [ y
南京子佩软件科技有限公司是是从事通讯类产品研发、生产、销售及提供相关通讯运营服务的高科技企业,公司拥有一批经验丰富、技术过硬,致力于语音通讯和数据通讯产品开发与应用的技术队伍,公司是目前国内最有影响的电话语音卡/电话语音盒/电话录音盒系列话务信息产品提供商之一,公司采用ISO9001质量保证体系和当前全球先进的语音通讯前沿技术,致力于为中国及全球企业提供高品质系列话务信息产品。. k- f5 t5 p, _" x; c3 P$ L0 k
+ \6 o1 B% j3 [6 u
广州科灵电子有限公司
3 b; n) D) E' r2 B 广州科灵电子有限公司是智能一卡通设备制造企业,主营:停车场收费管理系统、停车场设备、高清车牌识别一体机、远距离蓝牙系统、道闸/挡车器、人行通道闸(三辊闸、摆闸、翼闸)、电子巡更系统、车位/区位引导系统、电动伸缩门、岗亭、门禁考勤系统、梯控管理系统、交通辅助设施等系列产品,公司拥有完整、科学的质量管理体系。
3 ~ \8 J6 z( S1 G+ E1 D
4 x+ ]: O2 A) C/ e" @0 m
( U% I6 l# h0 z6 L* R2 D1 U- }; O5 O4 s" G Y
深圳伊兰度科技有限公司: ^ q9 c! @' L" M" V! m D( V
是专业从事停车场门禁设备研发,生产为一体的高科技公司。公司研发中心分为硬件、软件、机电三个研发部门,座落于深圳硅谷动力产业园内,主要从事停车场一卡通软件硬件产品的研发设计,并为客户提供软件,硬件个性化的定制服务。 产品有:道闸机、停车场系统、蓝牙远距离、车牌自动识别系统、地感控制器、票箱、售饭机、售饭系统、消费机、食堂售饭机、食堂刷卡机、巡更机、巡更棒、巡更器、巡更系统、巡检器等产品。9 x& \+ N$ O! C7 d9 b
6 U) p6 _3 q) F: T2 P% n& a7 O |
|
|
|
|