当前位置: 首页 >> 经济 > 内容页
当前讯息:多模态话语决策模型让机器人学会“捧哏”
来源:科技日报     时间:2023-05-09 15:30:15

◎本报记者 张佳星

5月6日,第十二届吴文俊人工智能科学技术奖颁奖典礼在京举行,旨在奖励在智能科学技术领域作出贡献的科技工作者和管理者,此次共有60个项目及个人受到表彰奖励。

“当前人工智能技术创新产业应用迅猛发展,人工智能的应用让经济社会各领域从数字化、网络化向智能化加速跃升。”科技部战略规划司副司长邢怀滨表示,目前我国人工智能全场景的智能应用仍面临很多挑战,要强化人工智能技术创新和产业应用双向促进,充分激发学术界、产业界的智慧和创造力,积极培育人工智能新兴业态,汇聚社会强大的发展动能。


(资料图)

此次,京东云言犀团队凭借“任务型智能对话交互关键技术及大规模产业应用”,获得吴文俊人工智能科学技术奖科技进步奖,京东集团副总裁、京东科技智能服务与产品部负责人何晓冬因在人工智能领域取得的成就荣获吴文俊人工智能科学技术奖杰出贡献奖。

他告诉科技日报记者,几年前,和机器人聊天,要忍受它们的“词不达意”。而现在,人工智能技术的不断创新,不仅让机器人能够轻松理解你的表达内容,甚至还能读懂你的犹豫、焦急等。

率先提出关键模型框架

“我们一直努力让机器人有‘捧哏’的天分。”何晓冬说,“基于我们在包括高表现力的对话生成、在复杂场景下进行对话决策等方面的研究创新,此次获奖项目让机器人在等待、接续对话的时机,对话内容的选择等方面都达到了令人类满意的程度。”

“过去的技术是给机器人规定一个时间,比如无声期超过0.5秒,就要‘接话’。”何晓冬说,任务型对话是以解决真实世界复杂任务为目的,对话中的人类也可能会出现犹豫、沉吟不决等情况,因此往往就会出现人类还在思考,AI就急着插话的情况。

“对此,我们提出了一个多模态的话语决策模型,在评价语音信号时,不仅考量停顿时间,更重要是计算评估语义完整度、语气、助词等,综合多模态信号作出动态决策。”何晓冬解释,这个模型可以让AI来判断对话者是说完了还是在思考。

“会倾听”是人类重要的交流能力之一。应用“任务型智能对话交互关键技术及大规模产业应用”,使京东云言犀平台实现了对机器人“倾听”能力的塑造。例如,在语音合成时给予机器人多维度的信息,在建模时让机器人能够掌握篇章、句子、字词,多轮对话时使机器人精确捕捉用户意图、流畅对答。

规模化落地服务千家万户

何晓冬坦言,AI实践应用不仅能创造价值,还是技术创新的“试金石”,不断反哺研究人员,完善相关理论。

“例如AI可以在短时间内拨出2600万通电话,以了解一座城市内居民的健康情况。”何晓冬说,如果没有这类AI应用,完成相同的工作至少需要1万名社区人员不停地打好几个月的电话。

标签:

广告

X 关闭

广告

X 关闭