- 课程回放
如何利用语言探针检测深度神经模型性能
NLP前沿讲座 2020/11/20 10:00:00
课程讲师
课程提纲
- 深度神经模型的性能检测算法
- 语言探针:一种探测模型编码特征的“诊断性分类器”
- 基于信息论的语言探针分类器选择
- 减少语言探针误差的方法解析
课程简介
语言模型编码在神经模型中的评估越来越受到科研人员的关注。语言探针(linguistic probe)是最近比较流行的一种可以探测深度神经模型里面编码了哪些特征的“诊断性分类器”算法,分类器效果的好坏直接体现深度模型包含信息的好坏,也就是模型性能的好坏。因此如何选择“探针”成为了一个难点。
2019年Hewitt & Liang提出,语言探针分类器的效果好可能因为信息好,或者探针本身学会了探测任务。而在2020年,Pimentel et al.反对这种二分法。那么这种二分法到底是否正确呢?多伦多大学的朱子宁博士通过信息理论对此进行了验证,表示这两种可能性确实存在。同时他们还发现探针的构建与选择,与两篇论文中提到的控制任务(Hewitt和Liang,2019)和控制功能(Pimentel等人,2020)是等价的,也就是说,这两种选择标准造成的误差原因是相同的。
11月20日上午10点,智东西公开课邀请到多伦多大学在读博士参与到「NLP前沿讲座」第8讲,带来主题为《如何利用语言探针检测深度神经模型性能》的直播讲解。在本次讲解中,朱子宁博士首先会讲解深度神经模型的性能检测算法,然后对语言探针的定义及分类器的选择进行详解,最后就如何减少探针误差的方法进行重点解析。
朱子宁博士目前就读于多伦多大学,师从Frank Rudzicz。他的研究方向包括自然语言处理和深度模型的可解释性,试图设计实验来理解深度语言模型编码的信息,以及这些模型在应用时的表现。
精彩问答
提问
提问