本文试图从以下几个方面对当前的指令学习研究进行总结:
(1)什么是任务指令,存在哪些指令类型?
(相关资料图)
(2)如何为指令建模?
(3)哪些因素影响和解释指令的执行?
(4)指令中还存在哪些挑战? 据我们所知,这是第一次对文本指令的全面调查。 论文地址:https://arxiv.org/pdf/2303.10475v2.pdf1引言
人工智能的一个目标是建立一个可以普遍理解和解决新任务的系统。标记示例作为主流任务表示,不太可能大量可用,甚至不存在。那么,是否有其他任务表示可以有助于任务理解?任务指令为表达任务语义提供了另一个监督维度,指令往往包含比单个标记示例更抽象和全面的目标任务知识。 指令学习是受典型的人类对新任务的学习启发,例如,小孩可以通过从指令和几个例子中学习来很好地解决一个新的数学任务。这种新的学习范式最近引起了机器学习和NLP社区的主要关注。 如图1所示,通过任务指令的可用性,可以快速构建系统来处理新任务,特别是在特定于任务的注释稀缺的情况下。 当谈到任务指令时,我们大多数人首先会将这个概念与提示联系起来——使用一个简短的模板将新的输入重新格式化为语言建模问题,以便为启动PLM回复响应。 尽管 提示在文本分类、机器翻译等中普遍存在,但提示只是指令的一种特殊情况。 本文对指令驱动的NLP研究进行了全面和更广泛的看法。 具体来说,我们试图回答以下问题: 什么是任务指令,存在哪些指令类型?给定任务指令,如何对其进行编码以帮助完成目标任务?哪些因素(如模型大小、任务数量)影响指令驱动系统的性能,以及如何设计更好的指令?指令学习能带来什么应用?指令学习中存在哪些挑战,未来的方向是什么?据我们所知,这是第一篇调研文本指令学习的论文。与一些现有的侧重于特定上下文指令的调研相比,例如提示、按输出输入的演示或推理,我们提供了一个更广泛的视角,以有组织的方式连接该领域的不同研究。希望本文能呈现一个更好的指令学习故事,吸引更多同行来研究这个具有挑战性的人工智能问题。我们还发布了本次调研的相应阅读清单。2基础知识
对于任务式学习,目标是通过遵循指令来驱动系统达到给定输入的输出。因此,一个数据集由三个元素组成: Input (X):实例的输入;它可以是一段文本(如情感分类)或一组文本(如文本蕴涵、问题回答等)。 Output (Y):实例的输出;在分类问题中,它可以是一个或多个预定义标签;在文本生成任务中,它可以是任何开放形式的文本。 模板(T):一种文本模板,试图单独表达任务的含义,或者充当X和y之间的桥梁。T可能还不是一种组件结构。3 什么是任务指令?
在之前的零样本和少样本NLP任务中已经使用了各种类型的文本指令,例如提示,Amazon Mechanical Turk 指令,辅以演示的指令和思维链解释。不同的指令最初是为不同的目标设计的(例如,Mturk指令最初是为人类标注者理解而创建的,提示是为了控制PLM)。在本节中,如图2所示,我们首先将这些指令总结为三个类别,它们执行T、X和ˆY的不同组合(面向蕴含、面向PLM和面向人),然后比较它们并提供指令的正式定义。 3.1 I=T^+Y:Entailment主导的指令处理分类任务的一个传统方案是将目标标签转换为索引,并让模型决定输入属于哪个索引。这种范式侧重于对输入语义进行编码,同时丢失标签语义。为了让系统识别新标签而不依赖于大量标记的示例,Yin等人提出为每个标签建立一个假设——然后,推导标签的真值被转换为确定假设的真值。如表1所示,这种方法内置在指令I中,将模板T与标签Y相结合,以解释每个目标标签Y。由于这种范式自然地满足文本蕴含的格式(TE,其中任务输入和指令可以分别被视为前提和假设),这些类型的指令被称为「面向蕴含(Entailment)的指令」。面向蕴含(entailment)的指令学习方法具有以下4个方面的优势:
(1)保持了标签语义,使得输入编码和输出编码在建模输入输出关系时得到同等的重视;
(2)形成了一个统一的推理过程——文本蕴含——来处理各种NLP问题;
(3)它创造了利用现有TE数据集的间接监督的机会,以便预训练TE模型有望在不进行特定任务微调的情况下在这些目标任务上工作;
(4)将原始的闭集标签分类问题扩展为具有少量甚至零类属类样本的开放域开放形式标签识别问题。 因此,它被广泛应用于各种少样本/零样本分类任务中,如分类主题、情感、姿态、实体类型和实体关系。 3.2 I=T^+X:面向PLM的指令(如ˆ提示)提示是面向PLM的指令的代表,它通常是一个简短的语句,前面加上任务输入(前缀提示),或者一个完形填空问题模板(完形填空提示)。它主要用于从预训练的语言模型(PLM)中查询中间响应(可以进一步转换为最终答案)。 由于提示输入符合PLM的预训练目标,例如,完形风格的输入满足掩码语言建模目标,它有助于摆脱对传统监督微调的依赖,并大大减轻人工标注的成本。 因此,快速学习在大量之前的少量/零样本NLP任务上取得了令人印象深刻的结果,例如问答、机器翻译、情感分析、文本蕴含和命名实体识别。 3.3以人为本指示以人为本的指令基本上是指在人类注释平台上用于众包的指令(例如Amazon MTurk指令)。与面向人的指令不同,面向人的指令通常是一些人可读的、描述性的、段落式的任务特定文本信息,由任务标题、类别、定义、要避免的事项等组成。因此,以人为本的指令更加友好,可以理想地应用于几乎任何复杂的NLP任务。4 如何为指令建模?
在本节中,我们总结了几种最流行的指令学习建模策略。总体而言,本文介绍了四种不同的建模方案:对于早期的基于机器学习的系统,(1)基于语义解析器的策略是编码指令的常用方法;随着神经网络和预训练语言模型的出现,(2)基于提示模板和(3)基于前缀指令的指令学习模式成为两种备受青睐的范式;最近,(4)基于超网络的方法也引起了更大的兴趣。5 应用
5.1人机交互文本指令可以自然地视为一种人机交互方式。之前的许多工作使用自然语言指令来「指导」计算机执行各种现实世界的任务。 对于非NLP(多模态)任务,大多数专注于基于环境的语言学习,即驱动智能体将自然语言指令与环境相关联,并做出相应的反应,例如从图像/视频中选择提到的对象,按照导航指示,在地图上绘制相应的痕迹,基于给定规则玩足球/纸牌游戏,生成实时体育广播、控制软件和查询外部数据库。与此同时,指令也被广泛适用于帮助与系统沟通,以解决NLP任务,例如,遵循操作字符串的指令,根据给定的解释对电子邮件进行分类,以及文本到代码生成。 近年来,越来越多的研究倾向于以迭代和模块化的方式设计人机通信过程。例如,Li等人构建了一个系统来帮助用户处理日常任务(例如,点咖啡或请求Uber)。得益于用户友好的图界面,系统可以迭代地询问有关任务的问题,用户可以不断改进他们的指令,以避免不明确的描述或模糊的概念。类似地,Dwivedi-Yu等人提出了一个基准来迭代地指导PLM改进文本,其中每次迭代只使用具有精确目的的一小段指令(例如,「简化文本」或「使文本中性」)。此外,Chakrabarty等人构建了一个协作写诗系统,用户可以最初提供一个模棱两可的指令(例如,「写一首关于蛋糕的诗」),然后通过观察模型的中间输出,用更多的细节逐步完善指令(例如,「包含单词-巧克力」)。同时,Mishra和Nouri提出了一个传记生成系统,该系统逐步从用户那里收集必要的个人信息(通过在对话场景中提出问题来引导用户),并最终生成一个段落式的传记。针对非专家用户难以一次性编写完整的指令的问题,在基于指令的人工智能系统设计中采用迭代式、模块化的设计范式,可以引导用户逐步丰富任务指令,从而有效地缓解用户的思维需求,使系统更加面向用户。鉴于其实用价值,本文强调了这一分支工作的重要性。 5.2 数据和特征增强任务指令被认为是一种间接的监督资源,其中有时包含一些肤浅且武断的规则。这些规则也被称为标记函数,可以直接应用于注释(例如,句子「a very fair price」是情感积极的,因为「单词price之前直接有fair」)。因此,现有的一些工作还将指令作为远程监督来执行数据或特征增强。例如,Srivastava等人使用语义解析器将自然语言解释转换为逻辑形式,并将它们应用于数据集中的所有实例以生成额外的二进制特征。而Wang等人利用标签解释自动标注原始语料库,并在产生的噪声数据上训练分类器。除了直接的扩充外,Su等人进一步使用任务指令来丰富模型表示,并实现了较强的跨任务泛化。具体来说,他们在具有对比学习的不同指令数据集上训练了一个嵌入模型(单个编码器),然后使用该模型为下游未见过的任务生成基于指令的特定任务表示。 5.3 通用语言模型根据通用人工智能(Artificial General Intelligence, AGI)的定义,「通用模型」通常是一个能够胜任不同任务并在多变环境中可扩展的系统,这将远远超出其创造者最初的预期。虽然特定于NLP领域,但通用语言模型应该是一个优秀的多任务助手,能够以完全零样本/少样本的方式熟练处理各种现实世界的NLP任务和不同的语言。由于许多现有工作证明了在跨任务泛化中使用指令的惊人能力,该指令很可能成为实现这一最终目标的突破。 值得注意的是,最近指令的两个显著应用,即InstructGPT和ChatGPT,也表明在构建通用语言模型方面迈出了一大步。然而,与其他主要采用指令学习的工作不同,ChatGPT还采用了一些其他组件,如人工反馈的强化学习(RLHF)。虽然「哪个组件对ChatGPT的出色结果贡献更大」的答案仍然是模糊的,需要进一步调研,但我们介绍了一些最近的工作,以强调指令学习的关键作用。例如,Chung等人进行了广泛的实验来评估人类对PaLM的偏好对齐。他们发现,即使没有任何人类反馈,指令微调也显著降低了PaLM开放式世代的毒性,比如性别和职业偏见。此外,其他一些工作也单独采用创造性指导而不是人工反馈,并取得了显著的跨任务结果。尽管ChatGPT仍然存在许多不令人满意的方面,距离通用语言模型还很远,我们希望AGI的目标可以通过采用和发展更强大的技术来继续推动,包括指令学习。 参考资料: https://arxiv.org/pdf/2303.10475v2.pdf【END】
免责申明:本站所有内容均来自网络,我们对文中观点保持中立,对所包含内容的准确性,可靠性或者完整性不提供任何明示或暗示的保证,请仅作参考。若有侵权,请联系删除。
文章来源:新智元
标签:
最新推荐
任务语义可以用一组输入到输出的例子或一条文本指令来表示。传统的自然语言处理(NLP)机器学习方法主要...
1、晚上可以吃以下食物来增肥:2、首先,如果不想晚上长胖,可以多吃粗粮,比如燕麦、糙米、红薯等。粗...
解答:1、茶籽油不能直接吃,味道很苦。主要吃法是榨油。油茶籽压榨茶油是优质食用油。2、茶树有种子。...
1、《花朵燃烧的国度》是玖月依宫尛离写的网络小说连载于晋江文学城。以上就是【花朵燃烧的国度,关于花...
1、安顺顶柱珊瑚是发现于贵州省安顺市西秀区轿子山镇的晚二叠世时期化石。本文到此分享完毕,希望对大家...
近期海南省流感病毒活动水平呈快速上升趋势,多地流感高发,流感病毒活动水平不断增强。1 因近期药品销...
东方电气:拟向控股股东等定增募资不超50亿元用于收购多家子公司股权等
房地产行业“百城价格指数”:3月百城销售均价新建住宅环比上涨0 02%同比下跌0 07%;二手住宅环比下跌...
文登、荣成、乳山:今夜到明天,阴有小到中雨,东南风6~7级阵风8~9级明天上午转西北风6~7级阵风8级,...
1、各地有线电视收费标准不一样。2、以南京为例,摹拟信号的有线电视早10年前开始收费每月为9元,后来电...
本报记者杜雨萌 见习记者毛艺融 加入首套房贷款利率下调队伍的城市仍在持续增多。结合中指研究院...
今天(4月3)早晨6时左右,南京玄武区北安门街路面出现轻度塌陷,地下水管渗漏,路面出现不少泥水,行人...
3月8日送这些礼物老婆好,我和老婆结婚以来为了3月8日这天的75日,这两天她就要过生日了。我们平时工作...
4月3日,国海证券发布一篇钢铁行业的研究报告,报告指出,宏观市场情绪改善,大宗商品市场氛围回暖。 ...
贞丰县气象台继续发布大风蓝色预警信号【Ⅳ 一般】
3月30日,广州期货交易所发布《关于免收工业硅期货、期权日内平今仓手续费的通知》。通知称,自2023年4...
今日,交个朋友发布了三周年成绩单。2020年4月1日,“罗永浩直播间”开启抖音首秀,创下当晚接近300万人...
在快手收到的礼物能转送么,快到你的礼物收到还是有,要是想要转送出,礼物不能是一件事,而是你要送的...
2023年3月31日-4月1日南方(以广东起步)电力现货市场结算运行日报南方(以广东起步)电力现货市场2023...
争四关键战,曼联在客场0-2完败纽卡斯尔,被对手反超暂时跌至第四位。从开水个人视角来看,滕哈赫本场的...
4月1日,市委书记蔡松涛在市行政中心会见明阳集团党委书记、董事长张传卫一行,双方就进一步加强新能源...
“三支ETF挑战一年资金翻倍”项目式教学案例追踪:第53天,收盘,股票,etf,日线图,上证指数,教学案例,散户投资者
婚姻是每个人生命中的重要一步,选择一个好的伴侣并建立稳定的婚姻关系,对于人们的生活有着非常重要的...
1、明火,是真正在自然界燃烧的火,也是可以看见的火,像看得见的火焰,看得见的火星和蜡烛之类能看到火...
来源|赢商云智库(ID:sydcyzk2014)作者|星艳玲头图来源|建发商管随着新一轮经济复苏以及国家扩大内需...
七月十五外婆送这些给外孙,我外婆下个周末过生日,外婆是个7月77号大寿,我想给外婆家里人买点东西!!...
本文内容是由小编为大家搜集关于南昌银行,以及的资料,整理后发布的内容,让我们赶快一起来看一下吧!本...
1、常用纸张按尺寸可分为A和B两类:A类就是我们通常说的大度纸,整张纸的尺寸是889*1194mm,可裁切A1(大对开。
《勇者斗恶龙》系列的首席制作人市村龙太郎在推特上宣布,他已于3月31日离开史克威尔。今年47岁的市村表...
广州港(601228)集团联合北部湾国际港务集团合作的“两湾快航”内外贸同船3月31日起进入常态化运行。“两...
需要购买手机的朋友们看过来,现在这款主机做活动,满21减20元,到手只需要3279元,现在购买,物超所值...
1、我理直气壮地对妈妈说: "我今天要出去玩 "。本文分享完毕,希望对大家有所帮助。
近日,据美国媒体报道,美国加州大量无家可归者的帐篷挤占了当地的人行道和农贸市场,摊贩不得不在毒贩...
证券时报网讯,3月31日晚,新潮能源发布公告,称收到烟台市牟平区人民法院(简称“牟平法院”)作出的《...
格隆汇3月31日丨北部湾港000582000582SZ公布公司于近日收到深圳证券交易所以下简称深交所出具的《关于受...
由于有宏观基本面的支持,黄金价格依然有较强的支撑,主升浪正徐徐开启,美联储加息结束将会打开黄金价...
30日上午,中国人寿保险股份有限公司(以下简称“中国人寿”)在京举办2022年度业绩发布会。中国人寿总...
媒体人:想异地搬迁的球队可以再等等,坚决反对的土木哥失联了,搬迁,失联,足协,苗原,土木哥,四川九牛
出品:科普中国-星空计划(创作培育计划)
大盘全天震荡反弹,三大指数均小幅上涨,创业板指偏强。截至收盘,沪指涨0 36%,深成指涨0 64%,创业...
1、人机对战给的钱太少了而且每天只能打180分钟的人机对战还减少奖励赚钱最快的方法还是打匹配匹配给钱...
听小骨异常会导致听力障碍吗病情分析:听小骨异常会导致听力障碍的。听小骨是听力在传导路径中的一个传...
大象新闻记者刘宜昕视频报道3月31日,“豫章书院案”在江西省萍乡市安源区人民法院开庭重审。出席庭审的...
中山市社保卡卡号在哪里查询呀?个人社保号具有唯一性。如参保人不记得个人社保号,可以通过以下几种方...
2022年,该集团销售收益约27 88亿港元,同比增长约4 3%;毛利约5 17亿港元,同比增加2 80%;每股盈...
3月30日,世华科技(688093)融资买入181 26万元,融资偿还185 92万元,融资净卖出4 66万元,融资余额8190 45万元。
来自《米兰体育报》的最新消息,阿根廷老将迪玛利亚与尤文图斯的续约事宜进行非常顺利,双方均有意续约...
春节送这些给干妈,首先,要看对方的喜好了,平时喜欢什么就给什么样的礼物了,不过不知道送什么给干女...
昨天大盘最后一小时放量下跌,外围股市普遍上涨,消息面偏向平静。今天大盘应该高开,上攻时关注3272点...
南科大深大上榜软科中国大学百强香港中文大学(深圳)位列全国合作办学大学第一深圳特区报讯(首席记者...
成都抗疫的外籍志愿者:愿为城市“康复”贡献力量
即时看!嫁对人了!马丽挺孕肚仍坚持工作,获老公全程呵护超恩爱
火影忍者万花筒写轮眼图片_火影忍者万花筒写轮眼的隐形眼镜多少钱_当前关注
和平精英绿洲世界望远镜在哪 绿洲世界望远镜位置获取攻略[多图]-环球今热点
37岁查出患有先心病,错过最佳手术时机?上海四院成功为患者“修心”
快克智能(603203)3月30日主力资金净卖出237.62万元
蒙娜丽莎:战略工程渠道营收降23.18%至26.24亿元 | 年报拆解|天天百事通
证券公司的员工不可能会给你打电话给你免费的荐股软件吗? 焦点速讯
世界热门:阿不都23+15新疆险胜北控 张帆21分廖三宁13+7
融捷股份(002192):3月29日北向资金减持3.01万股
日本福岛第一核电站核燃料取出作业专家组召开首次会议-环球新资讯
全球热讯:博鳌大放送:多位专家畅谈金融监管如何助力实体经济发展
6家券商“赛跑”IPO 财信和渤海率先触达“已问询”_每日速看
今天最新消息 国际媒体人被蜀道三国文化深深吸引 拍摄众多佳作
环球热资讯!平安果洛建设丨强化外来人员管理 创建平安建设环境
Copyright © 2015-2022 华南律师网版权所有 备案号:粤ICP备18025786号-52 联系邮箱: 954 29 18 82 @qq.com