反向工程助力AI语音技术发展迅猛
来源:龙人计算机研究所 作者:站长 时间:2019-08-26 16:48:21
人工智能被认为是引领新一代科技革命和产业变革的战略性技术。近年来,随着各国对人工智能技术研发的强调及产业未来的关注,人工智能迎来了飞跃式的发展。
日前,我国连续第三次将人工智能写入政府工作报告之中,且提出“智能+”新概念;国内35所高校成功建设人工智能相关专业和学院;以及人社部等三部门发布人工智能有关新职业,共同推动了我国人工智能建设的进一步提速。
而作为人工智能重要分支之一的AI语音技术,当前在积极向上的大环境下也正迎来迅猛发展。在科大讯飞、阿里、百度、搜狗等越来越多科技公司的助力之下,AI语音技术正不断突飞猛进、更新换代,给人们的生产和生活带来更加颠覆性的影响。
目前,AI语音技术除了传统意义上的AI语音识别、AI语音服务之外,又诞生出了AI语音合成和AI语音识人等新突破与新应用。其中,AI语音识别是AI与语音最早的一种组合,将AI加持到语音识别技术之上,能赋予产品更智能、更准确的识别效果,眼下市场上科大讯飞研发的各种翻译机器、不少手机采用的语音解锁,以及智能门锁等安防产品,都普遍采用了该技术。
而AI语音服务是继AI语音识别之后的又一创新尝试。机器人企业通过该技术赋予了机器人说话、沟通的能力,让人机互动更加顺畅、自然和智能;而电销企业则运用该技术替换人工电销员,带动了电销行业的整体提效增速升级;此外,由该技术打造的AI合成主播也成为电视荧幕上的全新吸睛点,推动了新闻传媒的与时俱进。
再往下,AI语音技术的又一突破是AI合成技术,利用该技术人们可以轻松生成各种AI定制语音,实现创造声音和变换人类声音的神奇功效。日前,阿里巴巴便发布了新一代语音合成技术KAN-TTS,据悉该技术可大幅提高合成语音与真人发声的相似度,并将语音合成定制成本降低10倍以上。普通用户只需手机录音十分钟,就能获得与录制声音高度相似的合成语音,这大大降低了人们定制“AI声音”的门槛。
最后,AI语音技术最前沿的创新便是AI语音识人技术,换句话说就是“闻声识人”。在国外,有研究人员设计了一种智能软件,通过深度学习网上搜集到的百万段教学和音像视频中的人声和面部特征,习得了单听声音便能画出人物相貌的功能,虽然该软件尚不成熟,但准确性也八九不离十。未来该技术有望运营到刑事鉴识等场景之中。
日前,我国连续第三次将人工智能写入政府工作报告之中,且提出“智能+”新概念;国内35所高校成功建设人工智能相关专业和学院;以及人社部等三部门发布人工智能有关新职业,共同推动了我国人工智能建设的进一步提速。
而作为人工智能重要分支之一的AI语音技术,当前在积极向上的大环境下也正迎来迅猛发展。在科大讯飞、阿里、百度、搜狗等越来越多科技公司的助力之下,AI语音技术正不断突飞猛进、更新换代,给人们的生产和生活带来更加颠覆性的影响。
目前,AI语音技术除了传统意义上的AI语音识别、AI语音服务之外,又诞生出了AI语音合成和AI语音识人等新突破与新应用。其中,AI语音识别是AI与语音最早的一种组合,将AI加持到语音识别技术之上,能赋予产品更智能、更准确的识别效果,眼下市场上科大讯飞研发的各种翻译机器、不少手机采用的语音解锁,以及智能门锁等安防产品,都普遍采用了该技术。
而AI语音服务是继AI语音识别之后的又一创新尝试。机器人企业通过该技术赋予了机器人说话、沟通的能力,让人机互动更加顺畅、自然和智能;而电销企业则运用该技术替换人工电销员,带动了电销行业的整体提效增速升级;此外,由该技术打造的AI合成主播也成为电视荧幕上的全新吸睛点,推动了新闻传媒的与时俱进。
再往下,AI语音技术的又一突破是AI合成技术,利用该技术人们可以轻松生成各种AI定制语音,实现创造声音和变换人类声音的神奇功效。日前,阿里巴巴便发布了新一代语音合成技术KAN-TTS,据悉该技术可大幅提高合成语音与真人发声的相似度,并将语音合成定制成本降低10倍以上。普通用户只需手机录音十分钟,就能获得与录制声音高度相似的合成语音,这大大降低了人们定制“AI声音”的门槛。
最后,AI语音技术最前沿的创新便是AI语音识人技术,换句话说就是“闻声识人”。在国外,有研究人员设计了一种智能软件,通过深度学习网上搜集到的百万段教学和音像视频中的人声和面部特征,习得了单听声音便能画出人物相貌的功能,虽然该软件尚不成熟,但准确性也八九不离十。未来该技术有望运营到刑事鉴识等场景之中。
面对国内产业现状,龙人反向研究义无反顾,肩负起国产企业的责任,持续为我国AI语音技术的发展、核心技术的跟进以及国外壁垒的突破提供系统级解决方案与全方位技术支持。