Co to jest operant Conditioning i jak to działa?

Jak wzmocnienie i kara modyfikują zachowanie

Warunkowanie operatora (czasami określane jako warunkowanie instrumentalne ) jest metodą uczenia się, która odbywa się za pomocą nagród i kar za zachowanie. Dzięki uwarunkowaniom operantom tworzy się związek między zachowaniem a konsekwencją tego zachowania.

Na przykład, gdy szczur laboratoryjny naciśnie niebieski przycisk, otrzymuje nagrodę za peletkę, ale gdy naciśnie czerwony przycisk, otrzymuje łagodny wstrząs elektryczny.

W rezultacie uczy się naciskać niebieski przycisk, ale unika czerwonego przycisku.

Lecz warunkowanie czynne to nie tylko coś, co ma miejsce w warunkach eksperymentalnych podczas szkolenia zwierząt laboratoryjnych; odgrywa również ważną rolę w codziennej nauce. Wzmocnienie i kara odbywają się niemal codziennie w naturalnych warunkach, a także w bardziej uporządkowanych ustawieniach, takich jak zajęcia w klasie lub sesje terapeutyczne.

Przyjrzyjmy się bliżej, jak odkryto uwarunkowania czynnika, jego wpływ na psychologię i sposób, w jaki jest używany do zmiany starych zachowań i uczenia nowych.

Historia warunkowania operacyjnego

Operacyjne uwarunkowanie zostało ukute przez behawiorystę BF Skinnera , dlatego od czasu do czasu można usłyszeć, że to się nazywa warunkowanie Skinnera. Jako behawiorysta, Skinner uważał, że nie jest konieczne przeglądanie wewnętrznych myśli i motywacji w celu wyjaśnienia zachowania. Zamiast tego, zasugerował, powinniśmy spojrzeć tylko na zewnętrzne, obserwowalne przyczyny ludzkich zachowań.

Przez pierwszą połowę XX wieku behawioryzm stał się główną siłą psychologii. Idee Johna B. Watsona zdominowały tę szkołę myślenia wcześnie. Watson skupił się na zasadach klasycznego uwarunkowania , po słynnym sugerowaniu, że może on zabrać każdą osobę, bez względu na pochodzenie i wyszkolić ją na wszystko, co wybierze.

Tam, gdzie wczesni behawioryści skupili swoje zainteresowania na nauce skojarzeniowej, Skinner był bardziej zainteresowany tym, jak konsekwencje działań ludzi wpłynęły na ich zachowanie.

Skinner użył terminu operant, aby odnosić się do każdego "aktywnego zachowania, które działa na środowisko, by generować konsekwencje". Innymi słowy, teoria Skinnera wyjaśniała, w jaki sposób zdobywamy zakres wyuczonych zachowań, które wystawiamy każdego dnia.

Jego teoria była pod silnym wpływem pracy psychologa Edwarda Thorndike'a , który zaproponował to, co nazwał prawem skutku . Zgodnie z tą zasadą, działania, które są pożądane, są częściej powtarzane, a mniej prawdopodobne jest powtórzenie tych niepożądanych.

Uwarunkowania warunkowe opierają się na dość prostej przesłance - działania, które następują po wzmocnieniu, zostaną wzmocnione i bardziej prawdopodobne, że wystąpią ponownie w przyszłości. Jeśli powiesz zabawną historię na lekcji i wszyscy się śmieją, prawdopodobnie będziesz bardziej prawdopodobne, że opowiesz tę historię jeszcze raz w przyszłości. Jeśli podnosisz rękę, by zadać pytanie, a twój nauczyciel pochwala Twoje grzeczne zachowanie, prawdopodobnie z większym prawdopodobieństwem podnieś rękę, gdy następnym razem będziesz mieć pytanie lub komentarz.

Ponieważ zachowanie nastąpiło po wzmocnieniu lub pożądanym wyniku, poprzednie działania zostały wzmocnione.

Odwrotnie, działania, które skutkują karą lub niepożądanymi konsekwencjami, zostaną osłabione i rzadziej powtórzą się w przyszłości. Jeśli powtórzysz tę samą historię w innej klasie, ale nikt nie będzie się śmiał tym razem, mniej prawdopodobne będzie ponowne powtórzenie tej historii w przyszłości. Jeśli wykrzyczycie odpowiedź na zajęciach, a nauczyciel was zbeształ, wtedy może być mniej prawdopodobne, że ponownie przerwie zajęcia.

Rodzaje zachowań

Skinner rozróżniał dwa różne typy zachowań

Podczas gdy klasyczne warunkowanie mogło odpowiadać za zachowania respondentów, Skinner uświadomił sobie, że nie może ono stanowić dużej części procesu uczenia się. Zamiast tego Skinner zasugerował, że warunkowanie czynnika ma znacznie większe znaczenie.

Skinner wynalazł różne urządzenia podczas swojego dzieciństwa i umieścił te umiejętności do pracy podczas studiów nad warunkowaniem operanckim.

Stworzył urządzenie zwane czynną komorą klimatyzacyjną, najczęściej nazywane dziś pudełkiem Skinnera . Komora była zasadniczo pudełkiem, w którym mogło przebywać małe zwierzę, takie jak szczur lub gołąb. Pudełko zawierało również drążek lub klucz, który zwierzę mogłoby nacisnąć, aby otrzymać nagrodę.

Aby śledzić odpowiedzi, Skinner opracował także urządzenie zwane rejestratorem zbiorczym. Urządzenie zarejestrowało odpowiedzi jako ruch linii w górę, tak aby można było odczytać wskaźniki odpowiedzi, patrząc na nachylenie linii.

Składniki warunkowania operacyjnego

Istnieje kilka kluczowych pojęć warunkujących operanta.

Wzmocnienie w warunkowaniu operacyjnym

Wzmocnienie to każde zdarzenie, które wzmacnia lub zwiększa zachowanie, które wynika. Istnieją dwa rodzaje wzmacniaczy:

  1. Pozytywne wzmocnienia to korzystne zdarzenia lub wyniki, które są prezentowane po zachowaniu. W sytuacjach, które odzwierciedlają pozytywne wzmocnienie, reakcja lub zachowanie jest wzmacniane przez dodanie czegoś, takiego jak pochwała lub bezpośrednia nagroda. Na przykład, jeśli wykonujesz dobrą robotę w pracy, a Twój menedżer daje ci premię.
  2. Ujemne wzmocnienia polegają na usunięciu niekorzystnych zdarzeń lub skutków po wyświetleniu zachowania. W takich sytuacjach reakcja zostaje wzmocniona przez usunięcie czegoś, co uważa się za nieprzyjemne. Na przykład, jeśli twoje dziecko zacznie krzyczeć w środku sklepu spożywczego, ale przestanie, gdy podasz mu przyjemność, z większym prawdopodobieństwem podasz mu przyjemność, gdy następnym razem zacznie krzyczeć. Twoje działanie doprowadziło do usunięcia nieprzyjemnego stanu (dziecko krzyczy), negatywnie wzmacniając twoje zachowanie.

W obu tych przypadkach wzmocnienia zachowanie się zwiększa.

Kara w warunkowaniu operacyjnym

Kara to prezentacja niepożądanego zdarzenia lub wyniku, który powoduje zmniejszenie zachowań, które wynikają. Istnieją dwa rodzaje kar:

  1. Kara pozytywna , czasami określana jako kara przez podanie, przedstawia niekorzystne zdarzenie lub wynik, aby osłabić odpowiedź, której dotyczy. Klepanie za złe zachowanie jest przykładem kary według aplikacji.
  2. Kara negatywna , określana również jako kara przez usunięcie, występuje, gdy korzystne wydarzenie lub wynik zostanie usunięty po wystąpieniu zachowania. Zabieranie dziecięcej gry wideo po niewłaściwym zachowaniu jest przykładem negatywnej kary.

W obu tych przypadkach kary zachowanie się zmniejsza.

Harmonogramy zbrojenia

Wzmocnienie niekoniecznie jest prostym procesem i istnieje wiele czynników, które mogą wpływać na szybkość i nowe umiejętności. Skinner odkrył, że kiedy i jak często zachowania były wzmacniane, odgrywały rolę w szybkości i sile akwizycji. Innymi słowy, czas i częstotliwość wzmocnienia wpłynęły na to, jak nowe zachowania zostały nabyte i jak stare zachowania zostały zmodyfikowane.

Skinner zidentyfikował kilka różnych harmonogramów wzmocnienia, które mają wpływ na proces uwarunkowania operanta:

  1. Ciągłe zbrojenie obejmuje dostarczanie wzmocnienia za każdym razem, gdy pojawia się odpowiedź. Uczenie się pojawia się stosunkowo szybko, ale wskaźnik odpowiedzi jest dość niski. Wymarcie występuje również bardzo szybko po zatrzymaniu zbrojenia.
  2. Harmonogramy o ustalonym stosunku są rodzajem zbrojenia częściowego. Odpowiedzi są wzmacniane dopiero po pojawieniu się określonej liczby odpowiedzi. Zwykle prowadzi to do dość stałego tempa odpowiedzi.
  3. Harmonogramy z ustalonym przedziałem czasowym są kolejną formą częściowego wzmocnienia. Zbrojenie następuje dopiero po upływie określonego czasu. Wskaźniki odpowiedzi pozostają dość stałe i zaczynają wzrastać wraz ze zbliżaniem się czasu zbrojenia, ale powolne natychmiast po dostarczeniu zbrojenia.
  4. Schematy o zmiennym współczynniku są również rodzajem częściowego wzmocnienia, które obejmuje zachowanie wzmacniające po zróżnicowanej liczbie odpowiedzi. Prowadzi to zarówno do wysokiego odsetka odpowiedzi, jak i do powolnego wyginięcia.
  5. Harmonogramy o zmiennej długości są ostateczną formą częściowego wzmocnienia opisaną przez Skinnera. Ten harmonogram obejmuje dostarczanie zbrojenia po upływie zmiennego czasu. Prowadzi to również do szybkiego tempa odpowiedzi i powolnego tempa wyginięcia.

Przykłady warunkowania operacyjnego

Możemy znaleźć przykłady operacyjnego warunkowania w pracy dookoła nas. Weź pod uwagę przypadek, w którym dzieci wykonują pracę domową, aby otrzymać nagrodę od rodzica lub nauczyciela, lub od pracowników kończących projekty w celu otrzymania pochwał lub promocji.

Kilka innych przykładów warunkowania operacyjnego w działaniu:

W niektórych z tych przykładów obietnica lub możliwość nagradzania powoduje wzrost zachowania, ale warunkowanie czynne można również zastosować w celu zmniejszenia zachowania. Usunięcie pożądanego wyniku lub zastosowanie wyniku negatywnego można zastosować w celu zmniejszenia lub zapobiegania niepożądanym zachowaniom. Na przykład dziecko może zostać poinformowane, że utraci przywileje związane z recesją, jeśli porozmawiają poza zajęciami. Ten potencjał kary może prowadzić do zmniejszenia zachowań destrukcyjnych.

Słowo od

Podczas gdy behawioryzm mógł utracić znaczną część dominacji, którą utrzymywał na początku 20 wieku, warunkowanie czynnika pozostaje ważnym i często wykorzystywanym narzędziem w procesie uczenia się i modyfikacji zachowania. Czasami naturalne konsekwencje prowadzą do zmian w naszym zachowaniu. W innych przypadkach nagrody i kary mogą być świadomie doliczane, aby stworzyć zmianę.

Kondycjonowanie przez operatora to coś, co od razu rozpoznajesz w swoim życiu, czy to w twoim podejściu do nauczania dobrych zachowań Twojego dziecka, czy w szkoleniu psa rodzinnego, aby przestał żuć twoje ulubione kapcie. Ważną rzeczą do zapamiętania jest to, że przy każdym rodzaju nauki czasami może to zająć trochę czasu. Weź pod uwagę rodzaj wzmocnienia lub kary, który może najlepiej pasować do Twojej wyjątkowej sytuacji i oceń, który rodzaj harmonogramu zbrojenia może przynieść najlepsze rezultaty.

> Źródła:

> Coon, D & Mitterer, JO. Psychologia: Podróż. Belmont, Kalifornia: Wadsworth; 2014.

> Domjan, M. Zasady uczenia się i zachowania, wydanie siódme. Stamford, CT; Cengage Learning; 2015.