什么是操作性条件反射?定义和例子(operant conditioning? definition and examples)

操作性条件作用发生在特定行为和该行为的结果之间的关联。这种联系建立在使用强化和/或惩罚来鼓励或阻止行为的基础上。行为心理学家B.F.斯金纳首先对操作性条件反射进行了定义和研究,他对动物受试者进行了几次著名的操作性条件反射实验。...

操作性条件作用发生在特定行为和该行为的结果之间的关联。这种联系建立在使用强化和/或惩罚来鼓励或阻止行为的基础上。行为心理学家B.F.斯金纳首先对操作性条件反射进行了定义和研究,他对动物受试者进行了几次著名的操作性条件反射实验。

Rabbit looking at carrot on a stick

关键收获:操作性条件反射

  • 操作性条件反射是通过强化和惩罚学习的过程。
  • 在操作性条件反射中,行为会根据该行为的后果而增强或减弱。
  • 行为心理学家B.F.斯金纳对操作性条件反射进行了定义和研究。

起源

B.F.斯金纳是一位行为主义者,这意味着他认为心理学应该局限于对可观察行为的研究。而其他行为主义者,如约翰B。沃森专注于经典条件作用,斯金纳更感兴趣的是通过操作性条件作用进行的学习。

他观察到,在经典条件反射中,反应往往由自动发生的先天反射触发。他把这种行为称为回应者。他区分了回应行为和操作行为。“操作性行为”是斯金纳用来描述一种行为的术语,这种行为会因随之而来的后果而强化。这些后果对行为是否再次发生起着重要作用。

斯金纳的想法基于爱德华·桑代克的效应定律,该定律指出,引发积极后果的行为可能会重复,而引发消极后果的行为可能不会重复。斯金纳在桑代克的思想中引入了强化的概念,指出强化的行为可能会重复(或强化)。

为了研究操作性条件反射,斯金纳用一个“斯金纳盒子”进行实验,这个盒子的一端有一个杠杆,当按下时可以提供食物或水。一只动物,如鸽子或老鼠,被放在盒子里,它可以自由移动。最终,这只动物会按下杠杆并得到奖励。斯金纳发现,这个过程导致动物更频繁地按下杠杆。斯金纳将通过跟踪动物在强化反应时的反应率来衡量学习能力。

加强和惩罚

通过他的实验,斯金纳确定了鼓励或阻止行为的不同类型的强化和惩罚。

加固

紧跟着一种行为的强化会鼓励和强化这种行为。有两种类型的钢筋:

  • 当一种行为产生了有利的结果时,就会产生积极的强化,例如,一只狗在服从命令后得到了款待,或者一个学生在课堂上表现良好后得到了老师的赞扬。这些技术增加了个体重复期望行为以再次获得奖励的可能性。
  • 当一种行为导致一种不利体验的消除时,就会出现负强化,例如,当猴子按下某个杠杆时,实验者停止给猴子电击。在这种情况下,由于猴子希望再次消除不利的电击,因此杠杆按压行为得到加强。

此外,斯金纳还发现了两种不同的增强剂。

  • 初级强化物自然会强化行为,因为它们是天生需要的,例如食物。
  • 条件性强化物强化行为并不是因为它们与生俱来的可取之处,而是因为我们学会了将它们与初级强化物联系起来。例如,纸币不是天生的理想货币,但它可以用来获得天生理想的商品,如食物和住所。

惩罚

惩罚是强化的反面。当惩罚跟随一种行为时,它会阻止和削弱这种行为。有两种惩罚。

  • 积极惩罚(或应用惩罚)发生在行为之后出现不利结果时,例如父母在孩子使用咒语后打孩子。
  • 消极惩罚(或驱逐惩罚)发生在一种行为导致对孩子有利的东西被驱逐时,例如,父母因为孩子行为不当而拒绝给孩子每周的津贴。

尽管惩罚仍然被广泛使用,斯金纳和其他许多研究人员发现惩罚并不总是有效的。惩罚可以在一段时间内抑制一种行为,但从长远来看,不受欢迎的行为往往会卷土重来。惩罚也会产生不必要的副作用。例如,一个被老师惩罚的孩子可能会变得不确定和害怕,因为他们不知道该做什么来避免将来的惩罚。

斯金纳和其他人建议强化想要的行为,忽略不想要的行为,而不是惩罚。强化告诉个体什么行为是需要的,而惩罚只告诉个体什么行为是不需要的。

行为塑造

操作性条件作用可以通过塑造(也称为“近似方法”)导致越来越复杂的行为。当更复杂的行为的每一部分都得到强化时,塑造会以一步一步的方式发生。塑造从强化行为的第一部分开始。一旦掌握了这一部分行为,强化只会在第二部分行为发生时发生。这种强化模式一直持续到掌握了整个行为为止。

例如,当一个孩子被教游泳时,一开始她可能仅仅因为下水而受到表扬。当她学会踢腿时,她再次受到表扬,当她学会特定的手臂动作时,她再次受到表扬。最后,她因在水中同时进行特定的划水和踢腿而受到表扬。通过这个过程,形成了一个完整的行为。

强化程序表

在现实世界中,行为并不是不断强化的。斯金纳发现强化的频率会影响一个人学习新行为的速度和成功程度。他指定了几个加固计划,每个都有不同的时间和频率。

  • 当特定响应跟随给定行为的每一个表现时,就会出现连续强化。学习随着不断的强化而迅速发生。然而,如果停止强化,行为将迅速下降,最终完全停止,这被称为灭绝。
  • 固定比率在指定数量的响应后安排奖励行为。例如,一个孩子每完成五件家务活就会得到一颗星。在这个时间表中,奖励一发放,响应速度就会减慢。
  • 可变比率计划会改变获得奖励所需的行为数量。这一计划会导致高响应率,而且也很难消除,因为其可变性维持了行为。老虎机使用这种加固计划。
  • 固定时间间隔计划在经过特定时间后提供奖励。按小时计酬就是这种加固计划的一个例子。与固定比率计划非常相似,响应率随着奖励的接近而增加,但在收到奖励后立即降低。
  • 可变间隔计划会改变奖励之间的时间长度。例如,一个孩子在一周中的不同时间领取津贴,只要他们表现出一些积极的行为,那么他就处于一个可变的间隔时间表上。孩子将继续表现出积极的行为,期待最终得到他们的津贴。

操作性条件反射的例子

如果你曾经训练过宠物或教过孩子,你很可能在自己的生活中使用过操作性条件反射。操作性条件反射仍然经常用于各种现实环境中,包括在课堂和治疗环境中。

例如,老师可以通过定期进行类似于最近的家庭作业的流行测验来强化学生的家庭作业。此外,如果孩子发脾气以引起注意,家长可以忽略该行为,然后在发脾气结束后再次承认孩子。

操作性条件反射也用于行为矫正,这是一种治疗成人和儿童许多问题的方法,包括恐惧症、焦虑症、尿床等。实现行为修改的一种方式是通过代币经济,在代币经济中,以数字徽章、按钮、芯片、贴纸或其他对象的形式的代币强化了所需的行为。最终,这些代币可以兑换成真正的奖励。

评论

虽然操作性条件作用可以解释许多行为,并且仍然被广泛使用,但对这个过程有一些批评。首先,操作性条件作用被指责为对学习的不完全解释,因为它忽视了生物和认知因素的作用。

此外,操作性条件反射依赖于权威人物来强化行为,而忽略了好奇心的作用和个人自我发现的能力。批评家们反对操作性条件作用强调控制和操纵行为,认为它们会导致专制行为。然而,斯金纳认为环境自然控制行为,人们可以选择利用这些知识来做好事或坏事。

最后,由于斯金纳对操作性条件反射的观察依赖于动物实验,他因从动物研究中推断出人类行为而受到批评。一些心理学家认为,这种概括是有缺陷的,因为人类和非人类动物在生理和认知上是不同的。

来源

  • 樱桃,肯德拉。“什么是操作性条件反射及其工作原理?”Verywell Mind,2018年10月2日。https://www.verywellmind.com/operant-conditioning-a2-2794863
  • 克雷恩,威廉。发展理论:概念和应用。第五版,皮尔逊·普伦蒂斯大厅。2005
  • 戈德曼,杰森·G.“什么是操作性条件反射(《科学美国人》,2012年12月13日。https://blogs.scientificamerican.com/thoughtful-animal/what-is-operant-conditioning-and-how-does-it-explain-driving-dogs/
  • 麦克劳德,索尔。”斯金纳——操作性条件作用〉《简单心理学》,2018年1月21日。https://www.simplypsychology.org/operant-conditioning.html#class

  • 发表于 2021-09-08 00:38
  • 阅读 ( 1173 )
  • 分类:数学

你可能感兴趣的文章

古典的(classical)和操作性条件反射(operant conditioning)的区别

经典条件反射与操作条件反射 经典条件反射和操作条件反射可以看作是两种形式的联想学习(学习两个事件同时发生),它们之间有着显著的区别。这两种学习形式都源于行为心理学。这个心理学流派关注的是个人的外在行...

  • 发布于 2020-10-23 20:33
  • 阅读 ( 740 )

古典的(classical)和操作性条件作用(operant conditioning)的区别

...行为的一门科学,它表明人或动物在任何情况下都有两种条件反射。当有知觉的人开始思考、学习或反应时,反应就生根了。这两种条件作用分别称为经典条件作用和操作条件作用。 如果你想让你的孩子在正确的道路上成长,...

  • 发布于 2021-06-23 12:13
  • 阅读 ( 224 )

社会学习理论(social learning theory)和操作性条件作用(operant conditioning)的区别

...或惩罚结束。 伯鲁斯·弗雷德里克·斯金纳是研究操作性条件反射的最著名的行为心理学家,他用老鼠和鸽子的实验巧妙地证明了这种学习方式。实验对象受到不同程度和间隔的正、负**。通过这些实验,他发现强化比惩罚更能...

  • 发布于 2021-06-26 12:12
  • 阅读 ( 586 )

古典的(classical)和操作性条件作用(operant conditioning)的区别

...是极其无用的。 基于上述假设,巴甫洛夫引入了经典的条件反射理论,该理论涉及启动一个中***,以建立一个自然发生的反射。在他用狗做的举世闻名的实验中,中***被认为是声音的音调,而自然发生的反射是唾液作为对食物...

  • 发布于 2021-06-28 03:24
  • 阅读 ( 1051 )

经典条件作用(classical conditioning)和操作性条件作用(operant conditioning)的区别

...r of ComparisonClassical ConditioningOperant Conditioning意义在经典的条件反射中,不自主的反应与**有关。在操作性条件作用中,主动反应和结果之间存在联系。修改在经典条件反射的情况下,这种变化发生在一种非自愿的行为中。在这里...

  • 发布于 2021-07-07 07:25
  • 阅读 ( 463 )

经典条件作用(classical conditioning)和操作性条件作用(operant conditioning)的区别

...,学习指的是在反应之前发生的非自愿行为。 在操作性条件反射中,学习指的是反应后发生的变化。 描述人 它最初是由俄罗斯生理学家伊万·巴甫洛夫描述的。 它最初是由B。F斯金纳,美国心理学家。 福库斯 经典的条件作...

  • 发布于 2021-07-08 15:10
  • 阅读 ( 506 )

什么是富豪统治定义和例子(plutocracy? definition and examples)

富豪统治是一个描述由极富阶层直接或间接统治的社会的术语。财阀统治的一个共同特征是,政府经常制定有利于富人的政策,往往以牺牲下层阶级为代价。由于财阀统治不是公认的政治哲学或政府形式,它的存在很少被承认...

  • 发布于 2021-09-01 19:23
  • 阅读 ( 365 )

什么是政治学的共同利益?定义和例子(the common good in political science? definition and examples)

政治学中的“公共利益”指的是与有利于个人或社会部门的私人利益的事物相比,任何有利于特定社区所有成员并自然共享的事物。在某些情况下,确保有利于共同利益的东西需要集体行动和参与政治进程。 关键收获:共同...

  • 发布于 2021-09-01 19:51
  • 阅读 ( 334 )

什么是香蕉共和国?定义和例子(a banana republic? definition and examples)

香蕉共和国是一个政治不稳定的国家,其经济完全依赖于出口单一产品或资源(如香蕉或矿物)的收入。它通常被认为是一个贬义词,描述其经济由外资公司或工业控制的国家。 主要外卖:香蕉共和国 香蕉共和国是任何政...

  • 发布于 2021-09-02 10:48
  • 阅读 ( 262 )

什么是资源分区?定义和例子(resource partitioning? definition and examples)

资源划分是将有限的资源按物种进行划分,以避免生态位中的竞争。在任何环境中,生物体都在争夺有限的资源,因此生物体和不同的物种必须找到彼此共存的方式。通过研究资源在特定生态位中的分配方式和原因,科学家可...

  • 发布于 2021-09-03 19:27
  • 阅读 ( 367 )
nydp2856
nydp2856

0 篇文章

相关推荐