绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
从数据角度看AI模型训练的挑战
2020/06/12 19:00:00
课程讲师
贾艳明 爱数智慧 首席数据科学家

清华大学计算机系博士、博士后,前朗播首席科学家(CSO),发表人工智能相关论文十余篇,申请专利十余篇,参与国家十一五“核高基”重大专项项目;先后在学校、外企和央企任职,在计算机算法的理论研究和工程应用上均具有丰富的经验,尤其在AI和大数据落地在线教育领域有多年实战经验。

贾艳明
爱数智慧 首席数据科学家

清华大学计算机系博士、博士后,前朗播首席科学家(CSO),发表人工智能相关论文十余篇,申请专利十余篇,参与国家十一五“核高基”重大专项项目;先后在学校、外企和央企任职,在计算机算法的理论研究和工程应用上均具有丰富的经验,尤其在AI和大数据落地在线教育领域有多年实战经验。

课程提纲
  • 数据决定AI模型的上限
  • 高质量数据的需求定义
  • 语音数据的难点解析
  • 基于人机协同的语音数据筛选与标注
  • 最新开源的语音数据集解读
课程简介

数据,人工智能的三大要素之一,是AI最基础的要求,同时也是AI模型效果的决定性因素。

数据问题,是所有企业都需要考虑的问题。尤其是对于中小型企业来说,大量数据的获取、样本筛选和特征标注,是一件非常消耗资源的事情。尤其是语音数据,语音是一个连续的音频流,它是由大部分的稳定态和部分动态改变的状态混合构成,其采集的难度要远远大于图像等数据的采集。

数据的质量决定AI模型的质量,高质量语音模型取决于高质量的语音数据。那么如何获取高质量的语音数据呢?语音数据的标注生成又有哪些难点,有什么样的解决方案呢?

为了让大家更好理解语音数据的标注难点与标注方法,6月12日晚7点,智东西公开课策划推出AI数据服务公开课爱数智慧专场。

爱数智慧是一家专业的AI数据标注服务商,提供语音数据,文本数据,图像数据标注和采集服务,自主研发了语音合成,语音识别,发音词典等领域的成品数据集。去年10月,语音识别开源工具Kaldi的主要开发者和服务者Daniel Povey成为公司首席科学家顾问。

本次专场将由爱数智慧首席数据科学家贾艳明直播讲解。贾老师将为大家分析AI数据所面临的挑战,并对基于人机协同的语音数据筛选与标注进行系统的讲解。同时,本次课程内含免费在线教育数据集,欢迎大家关注、获取。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...