在各行业持续智能化、数字化升级的背景下,人工智能落地应用的市场需求持续多样化,智能语音语言技术与各行业终端交互产品的结合日益紧密。基于此,作为国内专业的对话式人工智能平台型企业,思必驰拟对新一代综合听觉感知技术、图像理解及多模态自然交互技术和支撑大规模AI赋能及研发的计算和数据平台基础设施建设进行研发升级,进一步完善公司人工智能技术体系,优化技术服务架构,提升AI技术场景化应用的能力和效率。
新一代综合机器听觉感知技术
新一代综合机器听觉感知技术研发主要包含端侧语音处理关键技术和丰富音频分析技术两个方向的升级。通过升级端侧语音信号处理、唤醒及语音识别、高质量个性化语音合成及复刻等技术以及软硬件协同优化技术,实现对低资源芯片和智能终端本地计算设备的更强大、更通用、更丰富的智能听觉感知能力支撑,满足低功耗、低成本、高质量、端侧个性化定制等更多智能终端应用需求。
通过研发新一代复杂场景说话人日志、病理语音分析、情感分析、环境声分析等丰富音频分析技术,加深和拓宽听觉感知技术的应用范围,拓展多人会议、工业智能、智慧医疗及其他复杂场景下的应用。
图像理解及多模态自然交互技术
图像理解及多模态自然交互技术的研发升级主要包含基于图像的场景和行为理解,以及多模态人机交互技术两个方面的研发。图像理解针对多人、高噪、情感交流、动作意图等复杂人机交互情境下的物理场景和人的行为进行感知和理解技术研发,为基于广义语言信息的理解和对话交互提供新的信息维度;多模态人机交互技术研发将升级图像理解与语音信息的融合技术,研发跨模态全双工交互架构、多模态交互控制技术,以及多模态信息生成技术,使人机交互能够在复杂场景下自然、稳定的运行并实现更拟人化的表达。
多模态技术的研发升级,将增强思必驰对话式人工智能的应用场景,提升语言交互的准确性和稳定性,在汽车驾驶、家居生活、商务办公、金融服务、交通物流、地产酒店、政务民生、医疗健康等领域,满足自由、随意、即兴、拟人化自然交互的用户体验需求。
人工智能计算和数据分析平台
人工智能计算和数据分析平台的研发升级主要包括对底层基础设施扩容升级和优化人工智能技术服务框架两部分。一方面,通过对底层基础计算设施扩容,进一步扩大业务数据的分布式储存和计算能力,扩大面向研发的人工智能模型训练和算法迭代优化能力;另一方面,通过优化人工智能技术服务框架,升级运维自动化系统,研发新型任务调度系统、数据隐私保护系统及商业智能分析平台,建设高可靠性、高可用性、大规模的大数据存储和智能分析基础设施平台,进一步提升思必驰的研发和业务服务能力和规模。
截至2022年底,思必驰拥有近100项全球独创技术,已授权知识产权近1400件,其中已授权专利近700项,软件著作权近400项,在对话式人工智能全链路方面具有完整的技术创新体系和工程系统研发能力。2022年7月,获国家科技部批准建设“语言计算国家新一代人工智能开放创新平台”,也是江苏省首家获批的企业,科创实力受到国家高度认可。
可以预见的是,上述基础落地后,将进一步提升思必驰的技术实力,巩固公司在核心技术竞争力和新技术产业应用等方面的优势,拓展新的业务应用场景,为公司继续做大做强主营业务提供坚实的技术基础,为公司主营业务的应用拓展和新产品的快速迭代提供保障。