如何通过正向强化训练狗狗

什么是正向强化?

你可能听说过 “正向强化” 这个术语,或许也了解过它的一些释义。实际上,这个术语有两层含义:它既是一种帮助狗狗(实际上适用于所有宠物)学习新技能的方法,也用于指代一群将正向强化作为主要训练手段的训练师。

与其他方法相比,正向强化能够强化行为,在宠物主人与其动物伙伴之间建立信任关系,并维护宠物的行为健康。

简单来说,强化是一种加强行为的过程。强化分为两类:正向强化和负向强化。

正向强化与负向强化

正向强化

正向强化中的 “正向” 并非指 “好”,而是意味着 “添加”。强化的意思是使某事物更强烈。在使用这种方法训练小狗时,你会在小狗做出某种行为后立即给予某种东西,以此在整个训练过程中强化该行为。我们添加的东西通常是狗狗喜欢或想要的,比如零食或腹部抚摸。如果在一段时间内,该行为没有持续发生,那就说明正向强化没有达成。

例如,教狗狗在户外排便,而不是在你新铺的硬木地板上。当狗狗开始排泄时,静静地等待它们结束。一旦完成,立刻给它们几块美味的零食,并给予口头表扬。这会让狗狗产生在户外解决生理问题以获取奖励的欲望。由于得到了正向强化,这种在户外排便的行为现在应该会更频繁地出现。

如果你在训练狗狗,而期望的行为在你发出指令后没有更频繁地发生,那就说明你没有成功运用正向强化。“正向强化不起作用” 这种说法实际上并不正确。更准确的说法是 “正向强化没有发生”,这意味着在执行过程中存在问题。

狗狗也会决定什么有强化效果,什么没有。例如,一只刚吃饱饭的狗狗,可能觉得食物的强化作用不如到户外玩耍来消耗摄入的能量。另一方面,一只已经运动了一个小时且几个小时没进食的狗狗,可能会觉得食物极具强化作用。

负向强化

负向强化的概念作为学习过程中的一个复杂组成部分,同样容易引起混淆。“负向” 并不意味着 “不好”,它的意思是 “去除”。正向强化和负向强化的相似之处在于,它们都能强化行为。

正向强化是指在行为发生后立即添加某种东西,而负向强化是指在行为发生后立即去除某种东西。在负向强化中,被去除的 “某种东西” 通常是狗狗觉得不愉快并想要避免的。例如,如果有狗狗认为可怕的事情发生,比如有人朝它跑过来或者试图抚摸它,它可能会朝这个人咬过去。如果这个可怕的事情停止了或者消失了,那么咬人的行为可能就得到了负向强化。

负向强化是一个棘手的过程。它常常与惩罚相混淆,并且传统意义上使用负向强化来训练宠物并不人道。这是因为宠物必须面对它们想要避免的东西 —— 它们认为痛苦、可怕、令人生畏或具有威胁性的事物。一旦有人在宠物的环境中加入负面因素,就会产生不良后果。使用负向强化主要有三个不良后果:

  • 引发负面条件情绪反应
  • 破坏与训练者之间的信任
  • 增加恐惧、焦虑和压力

正向强化也是一种理念

正向强化也是一种基于特定理念的行动。作为专业人士和宠物主人,我们应该专注于强化我们希望看到的行为,而不是对不希望看到的行为做出反应并进行惩罚。

由于惩罚的使用方式,它往往会带来多种潜在的不良后果,比如基于恐惧的行为在统计数据上有所增加,以及攻击行为出现的概率上升。训练应该是一种有趣且有益的与狗狗沟通的方式。

如何运用正向强化?

在使用正向强化训练狗狗时,你先发出一个关于某种行为的肢体或口头提示,等待狗狗完成该行为,然后给予狗狗想要的东西。重复这个过程几次,以评估行为上的变化。狗狗坐下的动作是否更可靠、更频繁或更迅速了呢?

仅仅说 “狗狗坐下后我给了它零食,所以我用了正向强化” 是不够的。你可能确实这么做了,但如果狗狗听到指令后坐下的频率没有增加,那就说明你没有对该行为进行正向强化。

标记物也是一个有用的工具。响片是训练中较为常用的标记物之一。它们有助于准确地向狗狗传达,它们做了什么才赢得了奖励。响片用于在狗狗完成任务的那一刻进行标记,并且就在给予奖励之前使用。例如,如果你让狗狗坐下,等待狗狗的屁股接触到地面的那一刻,然后立即使用响片 “标记” 这个瞬间,接着给予零食。与经过认证的专业训练师合作,能帮助你快速掌握响片训练技巧。

运用正向强化的小贴士

  • 确保正确运用:记录你的训练过程,这样你就能知道你所训练的内容是否有改善。也就是说,当你让狗狗坐下时,它们每次都能立即执行吗?
  • 注意训练环境:在与狗狗练习新行为时,确保环境干扰极少。
  • 谨慎选择强化物:在有组织的训练环节中,使用你知道会让狗狗满意的东西。记住,狗狗决定什么有强化作用,什么没有。
  • 使用标记物:只要标记物(响片或特定词语)与主要强化物相结合,对行为的标记就起到了次要强化物的作用。
  • 训练环节应简短有趣:选择一项技能,训练 5 分钟,在主要强化物的基础上加上口头表扬,适当休息,并在狗狗仍乐在其中时结束训练环节。

(文/汪星驻地办)