近日,阿里巴巴达摩院(杭州)科技有限公司申请的“多模态对话方式、装置、设备及存储介质”专利获批公布(申请公布号:CN115840841A)。
根据摘要显示的信息,该专利涉及一种多模态对话方法、装置、设备及存储介质。
专利通过获取与同一问题关联的多模态信息,对所述多模态信息进行意图识别,得到意图信息,并对所述多模态信息进行槽位识别,得到一个或多个槽位值。
然后,根据所述意图信息和所述一个或多个槽位值,生成该多模态信息对应的一个或多个回复信息,使得用户可以通过多种模态信息对同一问题和该问题针对的目标对象进行描述。
这使得人机对话系统可以从多个模态理解同一问题,并针对同一问题生成一个或多个回复信息,如果是多个回复信息,则多个回复信息的模态不同,从而实现了多模态对话,使得用户和人机对话系统之间的对话方式灵活多样,提高了用户体验。
值得一提的是,根据此前消息,阿里达摩院正在进行类似ChatGPT的生成式人工智能研发,并已经开放给公司内部员工进行测试。
此次公布的专利,与达摩院在AI方面的研究也有着密不可分的关系。