绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
大模型RAG技术架构与应用实践
大模型技术公开课 2024/08/05 19:00:00
课程讲师
常扬 合合信息 合合信息智能创新事业部研发总监、复旦博士

常扬,合合信息智能创新事业部研发总监,复旦博士,复旦大学机器人智能实验室成员,国家级大学生赛事评审专家,发表多篇SCI核心期刊学术论文,多个学术会议讲师与技术社区AI专家博主,负责合合智能文档处理业务线的产品、技术、云服务平台研发工作。任职期间,先后主导了人工智能数据清洗平台,卡证识别、票据识别、行业文档定制等信息抽取产品,TextIn智能文字识别云服务平台,TextIn票据机器人、财报机器人、合同机器人等智能文档场景落地产品,为金融、制造、物流等行业提供智能文档处理产品与解决方案,在企业信息化转型领域具备丰富的技术落地经验和行业场景洞察力。

常扬
合合信息 合合信息智能创新事业部研发总监、复旦博士

常扬,合合信息智能创新事业部研发总监,复旦博士,复旦大学机器人智能实验室成员,国家级大学生赛事评审专家,发表多篇SCI核心期刊学术论文,多个学术会议讲师与技术社区AI专家博主,负责合合智能文档处理业务线的产品、技术、云服务平台研发工作。任职期间,先后主导了人工智能数据清洗平台,卡证识别、票据识别、行业文档定制等信息抽取产品,TextIn智能文字识别云服务平台,TextIn票据机器人、财报机器人、合同机器人等智能文档场景落地产品,为金融、制造、物流等行业提供智能文档处理产品与解决方案,在企业信息化转型领域具备丰富的技术落地经验和行业场景洞察力。

课程提纲
  • RAG技术背景、系统架构的演进与前沿进展
  • RAG技术架构与核心模块
  • RAG关键技术精讲 - TextIn文档解析技术与acge_embedding_model向量化模型
  • 应用实践 - OpenKIE 开放域多模态信息抽取、TextIn分析师知识问答
课程简介

随着大语言模型的兴起,其在处理自然语言任务上展现出了强大的能力,但也逐渐暴露出一些问题。大语言模型虽然能够生成连贯且富有逻辑的文本,但在某些情况下可能会出现“幻觉”,即生成不准确或无根据的内容。而且,大语言模型对于最新的、特定领域的专业知识的掌握可能存在滞后性。

目前主要有两种途径解决以上问题:一是微调,二是RAG。微调虽能使模型“学会”私域知识,但是,模型微调工作复杂,从数据准备、算力资源、微调效果到训练时间,都面临诸多挑战,用新数据随时微调不切实际,每月能更新一次已属理想状况。RAG 则为生成式模型与外部世界互动提供了颇具前景的解决办法。

RAG的全称是Retrieval-Augmented Generation,中文翻译为检索增强生成,是一个为大模型提供外部知识源的概念。通过RAG,可以使大语言模型生成准确且符合上下文的答案,同时能够减少“幻觉”。

RAG的主要功能类似于搜索引擎,能够找出与用户提问最相关的知识或对话历史,并结合原始提问创建内容丰富的 prompt,引导模型生成准确的输出。RAG还可分为5个基本流程:知识文档的准备、嵌入模型(embedding model)、向量数据库、查询检索和生产回答。

为帮助大家更加深入地了解RAG技术及应用,8月5日19点,智猩猩邀请到合合信息智能创新事业部研发总监常扬带来最新一期「智猩猩大模型技术公开课」,主题为《大模型RAG技术架构与应用实践》。

常扬首先会介绍RAG技术背景、系统架构的演进与前沿进展,之后将着重讲解 RAG 技术架构与核心模块。接下来,常扬将以合合信息的TextIn文档解析技术、acge_embedding_model向量化模型为例,对RAG关键技术进行精讲。最后,他会分享合合信息的两个应用实践:OpenKIE 开放域多模态信息抽取、TextIn分析师知识问答。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...