Victoria Stilwell przekornie napisała pewnego dnia, że (i dlaczego) nie jest czysto pozytywną trenerką oraz że nigdy taką nie była.

Żargonowy zwrot "szkolenie pozytywne" pojawił się wraz z potrzebą wskazania na metodę polegającą na współczesnej wiedzy naukowej z zakresu zoopsychologii, tym samym przeciwną tradycyjnie stosowanym rozwiązaniom bazującym na karceniu za niewłaściwe zachowanie - nagroda ma stanowić motywację dla szkolonego / wychowywanego zwierzęcia.

Według Pameli Dennison, od której czerpałam wiedzę rozpoczynając swoją praktykę trenerską, pozytywny proces treningowy winien opierać się na dokładnie przemyślanym posługiwaniu nagrodami w celu skłonienia psa (lub innego szkolonego zwierzęcia) do zachowania zgodnego z oczekiwaniami. Rządzą nim relatywnie spójne reguły:

  • Nagradzane zachowanie z założenia powinno się powtórzyć.
  • Nienagradzane zachowanie powinno zanikać (wygasać).
  • Wyuczone (intuicyjnie powtarzane) zachowanie powinno być utrwalane (generalizowane) poprzez niejednostajne nagradzanie (za losowym razem i/lub z różnicowaniem intensywności, ilości, form wzmacniania), ostatecznie zaś następować jedynie w adekwatnym momencie (wyjątkowo wartym podkreślenia).

Szkolenie pozytywne w kontekście metody podręcznikowej definiuje zatem manipulacja nagrodą, zastępująca "tradycyjne" taktyki oparte na dysponowaniu karą (awersja) czy też po prostu na wywieraniu presji.

Uwaga: Rozważając metody tradycyjne, zwiększania i redukowania częstotliwości nie należy traktować jako alternatyw. Obie mogą funkcjonować osobno, a karcone zwierzę nie skupia się na konkretach.
Przykłady: P+ szarpnięcie smyczą psa, który próbuje oddalić się z kroku przy nodze. | P- rezygnacja z podania smakołyka dopóki pies samodzielnie nie wyrówna kroku. | R- usunięcie nacisku ręką po nakłonieniu psa do pozycji siedzącej. | R+ smakołyk podany psu naprowadzonemu gestem na siad.

Z behawioralnego punktu widzenia szkolenie pozytywne zbudowano na warunkowaniu mieszanym (w zależności od kontekstu), dzięki czemu zwierzę uczy się i zapamiętuje, a nawet rozwija się kreatywnie, zamiast tylko być posłuszne (schemat musztry).

Sens warunkowania najtrafniej ujął Clyve Wynne, naukowiec od lat studiujący etologię kognitywną zwierząt (w tym szczegółowo psy i wilki), wpasowując je w ramy procesu uczenia się przez skojarzenia, gdzie owe skojarzenia stanowią związki przyczynowo - skutkowe.

Umiejętność dostrzegania związków przyczynowo - skutkowych w otaczającym nas świecie jest prostym, lecz czasem niezwykle ważnym mechanizmem, którym zwierzęta kierują się w życiu. […] Taka forma uczenia się nosi nazwę uczenia skojarzeniowego i jest to jeden z najlepiej zbadanych obszarów w psychologii zwierząt.

Warunkowanie klasyczne zostało odkryte przypadkowo, przez rosyjskiego fizjologa Pawłowa, będącego wówczas w toku innych badań. Jest procesem nauki polegającym na tworzeniu bezpośrednich asocjacji pomiędzy dwoma bodźcami/zdarzeniami albo pomiędzy bodźcem/zdarzeniem a towarzyszącymi mu emocjami. Mogą to być zarówno odruchy warunkowe (wyuczone), jak i bezwarunkowe (fizjologiczne, wrodzone).

Warunkowanie instrumentalne angażuje świadomość (pamięć, procesy myślowe, struktura mózgowa). Polega na intencjonalnym tworzeniu związków pomiędzy bodźcem/zachowaniem a reakcją na bodziec/konsekwencją zachowania. I tak:

  • uzasadniane historycznie szkolenie klasyczne (awersyjne) opiera się na tzw. „karze pozytywnej“ celem wygaszenia niechcianego zachowania, opcjonalnie na wzmacnianiu zaniechania dzięki uniknięciu nieprzyjemności przez zwierzę.
  • postępowo współczesne szkolenie pozytywne korzysta ze wzmocnienia opartego na nagradzaniu pożądanych zachowań, których wyeliminowaniu ma sprzyjać ignorowanie oferowanego i/lub wycofanie nagrody.

Cechą przewodnią treningu z użyciem pozytywnego wzmocnienia jest zatem brak rezygnacji z alternatywnej opcji - odwrotnie zakładającej przeciwny efekt, jakim jest wygaszanie. Z reguły będzie to postać kary (lub sygnału dezaprobaty), jaka wywoła stres, a w ostateczności (i/lub przy błędnej ocenie) może prowadzić do frustracji. Decyzyjną ścieżkę kształtuje jednak szansa wyboru, uruchamiając w zwierzęciu kreatywne myślenie, motywując do oferowania implikacji - kombinacji świadomie wybranego sposobu reagowania.

Stąd mylnie byłoby uznawać pozytywne metody - czyli oparte na wzmacnianiu nagradzaniem - za pozbawione jakiejkolwiek presji, połączone z bezkarnością oraz nieobecnością dowolnego mechanizmu asertywnego. Wycofanie nagrody czy ignorowanie oferowanego zachowania (waga wypracowanego sygnału braku nagrody) stwarzają wariant dyscyplinujący (stres, frustracja), choć zostawiają furtkę na poszukiwanie innego działania, którego prezentację standardowa korekta przez skarcenie wyklucza (strach/awersja hamują wydajność reakcji) - odtąd zwierzę ma wpływ na rezultat.


Nagroda jest pozytywnym wzmocnieniem, a jej wycofanie to strata w widełkach definicji kary.

Tak samo, jak w przypadku szkolenia tradycyjnego, utrafienie w punkt ma znaczenie (timing). W przeciwnym razie można się potknąć o problemy - błędnej interpretacji (nagradzanie niewłaściwego zachowania, braku nagrody za to właściwe), przekupstwa (nagroda podana zbyt wcześnie), niekonsekwencji (dezorientacja wywołana zmiennością zasad) albo nagradzania za nic. Ich kompleksowość nakręca spiralę stresu, frustrując zwierzę nie bardziej niż regularna korekta (i tu frustracja dosięga samego trenera).

W obu przypadkach wprowadzenie do tego typu pracy z psem powinno się odbywać pod okiem fachowca.

1) Korzystaj z pozytywnego wzmocnienia (ewentualnie z negatywnego wygaszania przy wystarczającej pewności własnej wiedzy praktycznej).
2) Unikaj zastraszania, karcenia lub innych fizycznych korekt pozostających w relacji z elementami strachu.
3) Zasięgnij teorii celem rozwiania wątpliwości dotyczących pojęcia "dominacji".
4) Uszanuj psi punkt widzenia w trakcie sesji treningowej.

— tyle Victoria Stilwell.

Od tego trzeba zacząć.

Źródła:
"Szkolenie pozytywne psów dla żółtodziobów" Pamela Dennison
"Tajemnice umysłów zwierząt" Clyve Wynne

Why I’m Not (and never have been) a Purely Positive Dog Trainer