绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
SongNet:格式控制下的文本生成框架
2020/09/03 20:00:00
课程讲师
李丕绩 腾讯AI Lab高级研究员

从事对话系统和文本生成相关的科研和落地相关工作。主要研究方向为自然语言处理领域的文本摘要、文本生成和对话系统。已在相关领域顶级会议和期刊发表多篇论文。担任EMNLP 2020 summarization方向的Area Chair,多次担任ACL,EMNLP,NAACL, NeurIPS, SIGIR, TACL等会议和期刊的PC Member和审稿人。

李丕绩
腾讯AI Lab高级研究员

从事对话系统和文本生成相关的科研和落地相关工作。主要研究方向为自然语言处理领域的文本摘要、文本生成和对话系统。已在相关领域顶级会议和期刊发表多篇论文。担任EMNLP 2020 summarization方向的Area Chair,多次担任ACL,EMNLP,NAACL, NeurIPS, SIGIR, TACL等会议和期刊的PC Member和审稿人。

课程提纲
  • 文本生成技术的研究与挑战
  • SongNet:基于自回归语言模型的格式控制文本生成框架
  • 诗词生成、歌词创作应用案例解析
课程简介

文本生成任务是自然语言处理中一个重要的研究领域,具有广阔的应用前景。国内外已经有诸如Automated Insights、Narrative Science以及“小南”机器人和“小明”机器人等文本生成系统投入使用。这些系统根据自然语言文本生成新闻、财报或者其他解释性文本。但是这些系统都有一个共同的特征,那就是无法满足特殊文本格式的要求。

目前的文本生成任务大多属于开放式的生成风格,将生成的数据简单的罗列在一起,却没有对生成数据的格式进行控制。这种情况使得一些诸如歌词、诗词等特殊文本的生成格式无法满足要求。虽然也有一些模型能生成一定格式的文本,但这些模型只是将格式视为一种潜在信息,让模型在训练过程中隐式地捕捉这一特征。简单来说就是五字四行语料库上训练的模型不能生成七字诗,并且这些模型也不能根据任意新定义的格式生成令人满意的文本。基于特殊文本范式的特征,需要解决三个问题:1)怎样使生成的文本符合我们需求的格式;2)如何生成符合押韵方案的内容;3)怎样保证句子的完整性。

SongNet,是一种可以解决特殊文本范式格式控制问题的基于自回归语言模型的文本生成框架。9月3日晚8点,智东西公开课联合腾讯AI Lab推出「腾讯AI Lab专场」,第1讲的讲师、腾讯AI Lab高级研究员李丕绩博士将围绕《SongNet:格式控制下的文本生成框架》这一主题进行直播讲解。李博士将从文本生成任务的研究与挑战出发,详解基于自回归语言模型的格式控制文本生成框架SongNet,并深入解析其在诗词生成、诗歌创作方面的应用。

李丕绩是香港中文大学的博士,2018年8月加入腾讯AI Lab任高级研究员,从事对话系统和文本生成相关的科研和落地相关工作,主要研究方向为自然语言处理领域的文本摘要、文本生成和对话系统。李博在相关领域顶级会议和期刊发表多篇论文,并担任EMNLP 2020 summarization方向的Area Chair,多次担任ACL、EMNLP、NAACL、NeurIPS、SIGIR、TACL等会议和期刊的PC Member和审稿人。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...