零食:獎勵行為?誘導行為?安撫情緒?轉移視線?

最近感到有些朋友可能對友善訓練方法有點誤解,以為正面訓練就是用食物誘導,有零食便就是萬能的印象。其實,零食只是用來進行制約訓練的工具。訓練要成功,更重要的是工具是否運用得當。

零食不能淪為誘導工具

當訓練師使用友善訓練方法去訓練一個行為,運用的是正增強的原理。淺白地說,就是通過一次又一次獎勵一個行為,使行動者更願意更頻密更努力做出該行為。獎勵是行動後的報酬,先後次序很重要:先做好行為,零食才能出現。

零食先出現甚至成為提示的話,就成了誘導,大大減弱獎勵的作用。因為零食本身吸引力大,使動物精神完全放到零食去,就無法注意其他事物進行學習。舉例說,若你走完一個迷宮後才得到鈔票,你會去記住迷宮怎走並再走一遍,意圖得到更多鈔票。若情況改成鈔票早在你面前出現並沿迷宮移動,你大概只會學到追逐鈔票而不會學懂走那迷宮。

有些人投訴動物沒有零食就做不出行為,多是這個原因。

零食不是用來轉移視線

當訓練師使用友善訓練方法去幫動物克服恐懼,運用的是古典制約的原理。成語望梅止渴講的就是這個,吃梅子時的酸味叫人流口水,而人們又把看見的梅子外型和吃梅子時的酸味在腦海中聯繫起來,使得人們看到梅子外型也流出口水來。這原理的關鍵是兩組刺激的配對,必須要恐懼的事物和零食同時或緊密地前後出現才能讓動物成功配對,令動物看到本來恐懼的事物也能產生吃零食的愉快反應,取代本來的恐懼。假若零食只被用作轉移動物視線離開恐懼事物,令配對難以成立,也就難以克服恐懼。當零食消失,恐懼又再回來。

One thought on “零食:獎勵行為?誘導行為?安撫情緒?轉移視線?

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *