什么是操作性条件反射？定义和例子(operant conditioning? definition and examples)

操作性条件作用发生在特定行为和该行为的结果之间的关联。这种联系建立在使用强化和/或惩罚来鼓励或阻止行为的基础上。行为心理学家B.F.斯金纳首先对操作性条件反射进行了定义和研究，他对动物受试者进行了几次著名的操作性条件反射实验。...

操作性条件作用发生在特定行为和该行为的结果之间的关联。这种联系建立在使用强化和/或惩罚来鼓励或阻止行为的基础上。行为心理学家B.F.斯金纳首先对操作性条件反射进行了定义和研究，他对动物受试者进行了几次著名的操作性条件反射实验。

关键收获：操作性条件反射

操作性条件反射是通过强化和惩罚学习的过程。
在操作性条件反射中，行为会根据该行为的后果而增强或减弱。
行为心理学家B.F.斯金纳对操作性条件反射进行了定义和研究。

起源

B.F.斯金纳是一位行为主义者，这意味着他认为心理学应该局限于对可观察行为的研究。而其他行为主义者，如约翰B。沃森专注于经典条件作用，斯金纳更感兴趣的是通过操作性条件作用进行的学习。

他观察到，在经典条件反射中，反应往往由自动发生的先天反射触发。他把这种行为称为回应者。他区分了回应行为和操作行为。“操作性行为”是斯金纳用来描述一种行为的术语，这种行为会因随之而来的后果而强化。这些后果对行为是否再次发生起着重要作用。

斯金纳的想法基于爱德华·桑代克的效应定律，该定律指出，引发积极后果的行为可能会重复，而引发消极后果的行为可能不会重复。斯金纳在桑代克的思想中引入了强化的概念，指出强化的行为可能会重复（或强化）。

为了研究操作性条件反射，斯金纳用一个“斯金纳盒子”进行实验，这个盒子的一端有一个杠杆，当按下时可以提供食物或水。一只动物，如鸽子或老鼠，被放在盒子里，它可以自由移动。最终，这只动物会按下杠杆并得到奖励。斯金纳发现，这个过程导致动物更频繁地按下杠杆。斯金纳将通过跟踪动物在强化反应时的反应率来衡量学习能力。

加强和惩罚

通过他的实验，斯金纳确定了鼓励或阻止行为的不同类型的强化和惩罚。

加固

紧跟着一种行为的强化会鼓励和强化这种行为。有两种类型的钢筋：

当一种行为产生了有利的结果时，就会产生积极的强化，例如，一只狗在服从命令后得到了款待，或者一个学生在课堂上表现良好后得到了老师的赞扬。这些技术增加了个体重复期望行为以再次获得奖励的可能性。
当一种行为导致一种不利体验的消除时，就会出现负强化，例如，当猴子按下某个杠杆时，实验者停止给猴子电击。在这种情况下，由于猴子希望再次消除不利的电击，因此杠杆按压行为得到加强。

此外，斯金纳还发现了两种不同的增强剂。

初级强化物自然会强化行为，因为它们是天生需要的，例如食物。
条件性强化物强化行为并不是因为它们与生俱来的可取之处，而是因为我们学会了将它们与初级强化物联系起来。例如，纸币不是天生的理想货币，但它可以用来获得天生理想的商品，如食物和住所。

惩罚

惩罚是强化的反面。当惩罚跟随一种行为时，它会阻止和削弱这种行为。有两种惩罚。

积极惩罚（或应用惩罚）发生在行为之后出现不利结果时，例如父母在孩子使用咒语后打孩子。
消极惩罚（或驱逐惩罚）发生在一种行为导致对孩子有利的东西被驱逐时，例如，父母因为孩子行为不当而拒绝给孩子每周的津贴。

尽管惩罚仍然被广泛使用，斯金纳和其他许多研究人员发现惩罚并不总是有效的。惩罚可以在一段时间内抑制一种行为，但从长远来看，不受欢迎的行为往往会卷土重来。惩罚也会产生不必要的副作用。例如，一个被老师惩罚的孩子可能会变得不确定和害怕，因为他们不知道该做什么来避免将来的惩罚。

斯金纳和其他人建议强化想要的行为，忽略不想要的行为，而不是惩罚。强化告诉个体什么行为是需要的，而惩罚只告诉个体什么行为是不需要的。

行为塑造

操作性条件作用可以通过塑造（也称为“近似方法”）导致越来越复杂的行为。当更复杂的行为的每一部分都得到强化时，塑造会以一步一步的方式发生。塑造从强化行为的第一部分开始。一旦掌握了这一部分行为，强化只会在第二部分行为发生时发生。这种强化模式一直持续到掌握了整个行为为止。

例如，当一个孩子被教游泳时，一开始她可能仅仅因为下水而受到表扬。当她学会踢腿时，她再次受到表扬，当她学会特定的手臂动作时，她再次受到表扬。最后，她因在水中同时进行特定的划水和踢腿而受到表扬。通过这个过程，形成了一个完整的行为。

强化程序表

在现实世界中，行为并不是不断强化的。斯金纳发现强化的频率会影响一个人学习新行为的速度和成功程度。他指定了几个加固计划，每个都有不同的时间和频率。

当特定响应跟随给定行为的每一个表现时，就会出现连续强化。学习随着不断的强化而迅速发生。然而，如果停止强化，行为将迅速下降，最终完全停止，这被称为灭绝。
固定比率在指定数量的响应后安排奖励行为。例如，一个孩子每完成五件家务活就会得到一颗星。在这个时间表中，奖励一发放，响应速度就会减慢。
可变比率计划会改变获得奖励所需的行为数量。这一计划会导致高响应率，而且也很难消除，因为其可变性维持了行为。老虎机使用这种加固计划。
固定时间间隔计划在经过特定时间后提供奖励。按小时计酬就是这种加固计划的一个例子。与固定比率计划非常相似，响应率随着奖励的接近而增加，但在收到奖励后立即降低。
可变间隔计划会改变奖励之间的时间长度。例如，一个孩子在一周中的不同时间领取津贴，只要他们表现出一些积极的行为，那么他就处于一个可变的间隔时间表上。孩子将继续表现出积极的行为，期待最终得到他们的津贴。

操作性条件反射的例子

如果你曾经训练过宠物或教过孩子，你很可能在自己的生活中使用过操作性条件反射。操作性条件反射仍然经常用于各种现实环境中，包括在课堂和治疗环境中。

例如，老师可以通过定期进行类似于最近的家庭作业的流行测验来强化学生的家庭作业。此外，如果孩子发脾气以引起注意，家长可以忽略该行为，然后在发脾气结束后再次承认孩子。

操作性条件反射也用于行为矫正，这是一种治疗成人和儿童许多问题的方法，包括恐惧症、焦虑症、尿床等。实现行为修改的一种方式是通过代币经济，在代币经济中，以数字徽章、按钮、芯片、贴纸或其他对象的形式的代币强化了所需的行为。最终，这些代币可以兑换成真正的奖励。

虽然操作性条件作用可以解释许多行为，并且仍然被广泛使用，但对这个过程有一些批评。首先，操作性条件作用被指责为对学习的不完全解释，因为它忽视了生物和认知因素的作用。

此外，操作性条件反射依赖于权威人物来强化行为，而忽略了好奇心的作用和个人自我发现的能力。批评家们反对操作性条件作用强调控制和操纵行为，认为它们会导致专制行为。然而，斯金纳认为环境自然控制行为，人们可以选择利用这些知识来做好事或坏事。

最后，由于斯金纳对操作性条件反射的观察依赖于动物实验，他因从动物研究中推断出人类行为而受到批评。一些心理学家认为，这种概括是有缺陷的，因为人类和非人类动物在生理和认知上是不同的。

来源

樱桃，肯德拉。“什么是操作性条件反射及其工作原理？”Verywell Mind，2018年10月2日。https://www.verywellmind.com/operant-conditioning-a2-2794863
克雷恩，威廉。发展理论：概念和应用。第五版，皮尔逊·普伦蒂斯大厅。2005
戈德曼，杰森·G.“什么是操作性条件反射(《科学美国人》，2012年12月13日。https://blogs.scientificamerican.com/thoughtful-animal/what-is-operant-conditioning-and-how-does-it-explain-driving-dogs/
麦克劳德，索尔。”斯金纳——操作性条件作用〉《简单心理学》，2018年1月21日。https://www.simplypsychology.org/operant-conditioning.html#class