一种录音融合方法与流程_论坛事务_音频应用论坛 - Powered by AUIOAPP

音频应用论坛

 找回密码
 快速注册

QQ登录

只需一步,快速开始

搜索
热搜: 音频应用

[讨论] 一种录音融合方法与流程

[复制链接]
mfz 发表于 2009-5-5 14:05:35

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?快速注册

x
本发明涉及音频处理领域,具体涉及一种录音融合方法。


背景技术:
随着唱吧、全民K歌等手机软件及自助式KTV的流行,录音分享越来越普及。但一般用户反复唱同一首歌,很难录到一遍完整无瑕的演唱。经常碰到各处的抢拍、漏词、走调、甚至附近有人故意干扰、说话尖叫。因此有必要提供一种方法,帮助用户获取一个完整的效果最好的录音。


技术实现要素:
本发明的目的就是提供一种录音融合方法,其能够帮助用户获取一个完整的效果最好的录音。
为实现上述目的,本发明采用了以下技术方案:
一种录音融合方法,包括如下操作:
S1:获取同一歌曲的n次录音的录音文件,n≥2;
S2:采用同一切分方法将各个录音文件按照时序分别切分为m个唱段,m≥2,采用同一评分方法对各唱段分别进行评分,依次对相同时段的各唱段的评分进行比较并选取出评分最高的唱段;
S3:将各选取出的各评分最高的唱段按照时序进行融合拼接获取得到融合录音。
进一步的方案为:
步骤S2中录音文件切分方法为:录音文件的数据通过和原唱的对比并以最高得分唱段为中心点对齐;将对齐的录音文件的首尾不对齐的部分切除,并以不同唱段间隙中心点为分界将录音文件分成不同的唱段,这样不同的录音文件被切成了完全对齐的唱段。
步骤S3中融合拼接采用淡进淡出算法。
步骤S2中唱段评分的方法为:通过实时对比用户和原唱的每个发音基频和发音音长度来获得歌唱的匹配度,分析出用户是否走音、抢拍或漏拍,给出歌唱评分。亦即采用KTV的精确评分方法进行评分。
上述技术方案中,通过选取出各个时段评分最高的唱段,然后将各高评分的唱段进行融合拼接,从而帮助用户获取一个完整的效果最好的录音。
附图说明
图1为本发明的流程示意图;
图2为录音文件切分、拼接示意图;
图3为评分方法示意图;
图4为融合拼接的示意图。
具体实施方式
为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行具体说明。应当理解,以下文字仅仅用以描述本发明的一种或几种具体的实施方式,并不对本发明具体请求的保护范围进行严格限定。
本发明采取的技术方案如图1、2、3、4所示,一种录音融合方法,包括如下操作:
S1:获取同一歌曲的n次录音的录音文件,n≥2;各录音文件分别记为录音1、录音1……录音n;
S2:采用同一切分方法将各个录音文件按照时序分别切分为m个唱段,m≥2,采用同一评分方法对各唱段分别进行评分,依次对相同时段的各唱段的评分进行比较并选取出评分最高的唱段;如录音1切分后的唱段依次为C11、C12……C1m;录音2切分后的唱段依次为C21、C22……C2m……录音n切分后的唱段依次为Cm1、Cm2……Cmn;采用同样的评分方法对C11、C12……C1m、C21、C22……C2m……Cm1、Cm2……Cmn分别进行评分,比较同一时段各唱段的评分,如C11、C21……Cm1为同一时段的唱段,比较其评分选取出评分最高的记为C1-best;C12、C22……Cm2为同一时段的唱段,比较其评分选取出评分最高的记为C2-best; Cm1、Cm2……Cmn为同一时段的唱段,比较其评分选取出评分最高的记为Cm-best,如图2所示;
S3:将各选取出的各评分最高的唱段按照时序进行融合拼接获取得到融合录音。亦即将步骤S2中选取出的唱段C1-best、C2-best……Cm-best按照时序融合拼接获取得到录音文件。
上述技术方案中,通过选取出各个时段评分最高的唱段,然后将各高评分的唱段进行融合拼接,从而帮助用户获取一个完整的效果最好的录音。
步骤S2中唱段评分的方法为:通过实时对比用户和原唱的每个发音基频和发音音长度来获得歌唱的匹配度,分析出用户是否走音、抢拍或漏拍,给出歌唱评分。分数高代表歌唱的匹配度高、唱得好,分数低代表歌唱的匹配度低、唱得差,这个分数将在本发明中起到重要作用。
图3为一段典型的歌声(无伴奏)的分析:第一行是歌声,可以清晰的看到一段声音静息的分界点(红框),每个分界点代表一段歌词结束,歌唱者在换气或者等待第二段歌词出现;第二行是声音端点检测结果,每个小方块代表一个吐词,小方块的长短代表发音的长度,大的空隙是歌词的停顿处;第三行是每个声音的基频分析结果,基频代表了音调;这样的歌声分析我们获得了基频和发音长度两个基本参数,通过和原唱的参数的比对可以检测到歌唱者是否有抢拍、漏词、走调等问题,并给出具体的歌唱评分,而且是每个发音,每句歌词可以有单独的评分。
步骤S2具体的操作为:基于同一个MTV录音,至少需要有两个录音文件和相关的评分结果;基于同一首歌的录音一般是大致等长的,但声音不一定同步,每个录音文件的数据通过和原唱的对比并以最高得分唱段为中心点对齐;将对齐的文件首尾不对齐的部分切除,并以不同唱段间隙中心点为分界将录音数据分成不同的唱段,这样不同的录音文件被切成了完全对齐的唱段。
步骤S3中融合拼接采用淡进淡出算法,如图4所示,使用淡进淡出算法,并且只使用在唱段的间隙处,即前一唱段最后一个发音结束后,音量逐渐减少到0,后一唱段第一个发音前,音量从0逐渐增加到正常值,然后两个相加。
本发明利用了KTV的精确评分,将同一个人同一首歌的不同录音根据歌词的分界点切分成各唱段,然后将等分最高的几段拼接融合在一起,从而极大提高了唱歌的乐趣。
本发明未能详尽描述的设备、机构、组件和操作方法,本领域普通技术人员均可选用本领域常用的具有相同功能的设备、机构、组件和操作方法进行使用和实施。或者依据生活常识选用的相同设备、机构、组件和操作方法进行使用和实施。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在获知本发明中记载内容后,在不脱离本发明原理的前提下,还可以对其作出若干同等变换和替代,这些同等变换和替代也应视为属于本发明的保护范围。



技术特征:
1.一种录音融合方法,包括如下操作:
S1:获取同一歌曲的n次录音的录音文件,n≥2;
S2:采用同一切分方法将各个录音文件按照时序分别切分为m个唱段,m≥2,采用同一评分方法对各唱段分别进行评分,依次对相同时段的各唱段的评分进行比较并选取出评分最高的唱段;
S3:将各选取出的各评分最高的唱段按照时序进行融合拼接获取得到融合录音。
2.根据权利要求1所述的录音融合方法,其特征在于,步骤S2中录音文件切分方法为:录音文件的数据通过和原唱的对比并以最高得分唱段为中心点对齐;将对齐的录音文件的首尾不对齐的部分切除,并以不同唱段间隙中心点为分界将录音文件分成不同的唱段,这样不同的录音文件被切成了完全对齐的唱段。
3.根据权利要求1或2所述的录音融合方法,其特征在于,步骤S3中融合拼接采用淡进淡出算法。
4.根据权利要求1或2所述的录音融合方法,其特征在于,步骤S2中唱段评分的方法为:通过实时对比用户和原唱的每个发音基频和发音音长度来获得歌唱的匹配度,分析出用户是否走音、抢拍或漏拍,给出歌唱评分。
技术总结
本发明涉及一种录音融合方法,包括获取同一歌曲的n次录音的录音文件;采用同一切分方法将各个录音文件按照时序分别切分为m个唱段,采用同一评分方法对各唱段分别进行评分,依次对相同时段的各唱段的评分进行比较并选取出评分最高的唱段;将各选取出的各评分最高的唱段按照时序进行融合拼接获取得到融合录音。上述技术方案中,通过选取出各个时段评分最高的唱段,然后将各高评分的唱段进行融合拼接,从而帮助用户获取一个完整的效果最好的录音。
香诺菲 发表于 2009-5-5 15:42:53
点赞了,谢谢楼主发布
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

软硬产品代理咨询服务:声卡:雅马哈UR22C、罗兰声卡、福克斯特、艾肯、阿波罗 、M-audio 、普瑞声纳 、福克斯特、 达思冠系列 音箱:吸顶NS-IW560C、吸顶NS-IW660 、NS-AW350、低音NS-SW050、低音NS-SW100;JBL 吸顶8124、CSS-8006BM;香蕉猴 gibbon系列;普瑞声纳E5XT、E4.5、 E3.5BT 有线话筒:舒尔PGA27、PGA48、MV51、mv88、mv88+、SM27 ;森海E945 、MK4、E835S;舒伯乐top248s;罗德NT1-A、VIDEOMIC、VIDEOMIC GO、VideoMicro、VideoMic NTG 无线领夹麦克风:罗德 wireless go II 一拖一、一拖二;猛犸lark150 耳机:森海HD300 pro、美奇 CR-Buds 、索尼7506、爱科技K240S、K240 MKII、K271 MKII、K52、K72、K92、先锋、飞利浦 1:飞利浦会务通/会议摄像头/全向麦克风/执法仪/录音笔 2:洋铭便携式移动演播室 / 切换台 / 摄控一体摄像机 / 虚拟演播室 / 微金课教室 / 色键器 3:逻兰音视频切换台 / 声卡 / 电子鼓 /电钢琴 /耳机 4:Blackmagic专业摄影机 /调色台 / 切换台/ 广播级转换器 / 监视器 / 采集卡 5:索尼专业摄像机/佳能专业摄像机/松下专业摄像机/ insta360专业摄像机 6:话筒:铁三角/ 舒尔/ 森海塞尔 / AKG / RODE/ BBS 7:音响:YAMAHA/ 声艺 / 皇冠 /JBL / 真力/咪宝/BOSE /美奇 8:声卡:RME/羚羊/IXI /艾肯/PreSonus普瑞声纳/Focusrite福克斯特/YAMAHA/雅马哈/ickb 9:耳机:铁三角/beyerdynamic拜亚动力/AKG爱科技/索尼/RunningMan/美技 10:思锐三脚架 /防潮箱 /米泊三脚架/意美捷三脚架/曼富图三脚架 11:XSW系列,300.500代理商,EWD数字系列代理,6000.9000定制产品,还包销了全国三个型号:XSW1-825,EW100 G4-945,EWD- kk 205

小黑屋|手机版|Archiver|音频应用 (鄂ICP备13005321号-1)

Powered by Audio app

快速回复 返回顶部 返回列表