Comportamentul și învățarea sistemului de recompensare prin condiționare

Câini cărora li se gură apă la sunetul unui clopot. Bebelușii plângând la vederea unui șoarece alb. Melci marini care își trag branhii atunci când sunt stimulați: În învățarea asociativă, stimulilor neutri li se dă un nou sens.
- Dacă sunt legate două evenimente care nu sunt în mod natural legate între ele, se vorbește despre învățarea asociativă.
- În ceea ce este cunoscut sub numele de condiționare clasică, un stimul care declanșează o reacție măsurabilă este combinat cu un stimul care nu îl induce în mod natural. Este important ca ambii stimuli să se succedă direct.
- În condiționarea operantă, un individ învață să asocieze un stimul cu o recompensă sau pedeapsă. Își schimbă comportamentul ca urmare a consecințelor. Dopamina este o substanță mesager importantă în învățarea asociativă și stimulează așteptările. Ca neurotransmițător de anticipare, este un motivator important.
Dopamina este o substanță mesageră importantă în sistemul nervos central care aparține grupului de catecolamine. Acesta joacă un rol în abilitățile motorii, motivația, emoția și procesele cognitive. Tulburările funcției acestui transmițător joacă un rol în multe boli ale creierului, cum ar fi schizofrenia, depresia, boala Parkinson sau dependența de substanțe.
Neurotransmițători
Un neurotransmițător este o substanță mesagerie chimică, o substanță mediator. Este eliberat din neuronul emițător în locurile de comunicare celulă-celulă și are un efect interesant sau inhibitor asupra neuronului receptor.
Inspirat, printre altele, de experimentele lui Pavlov despre condiționarea clasică, psihologul american John B. Watson a lansat comportamentismul la începutul secolului al XX-lea. Această școală de gândire a dominat psihologia americană timp de mai multe decenii. Comportamentul observabil singur a fost considerat un obiect al cercetării științifice de către cercetători precum Watson sau Skinner. Comportementiștii nu doreau nimic de-a face cu speculații despre stări mentale interne.
O mare parte din această atitudine s-a reflectat și în înțelegerea lor asupra învățării. Învățarea s-a arătat în consecință într-o schimbare de comportament legată de mediu. Pentru comportamentaliști, elevul este în esență pasiv și reacționează doar la stimulii din mediul său. Creează conexiuni stimul-stimul și stimul-răspuns. Pentru reprezentanții acestei școli de gândire, oamenii au venit pe lume ca o ardezie goală care se umple treptat de conținut prin experiență.
Această viziune și-a găsit criticii în susținătorii unei abordări cognitive. Ei au procedat nu numai din stimuli și reacții observabile extern, ci și din procesarea internă a informațiilor. Cel puțin organismele superioare sunt capabile să dobândească și să stocheze informații. Informațiile noi pot fi legate de informațiile salvate și, astfel, pot duce la un nou comportament. În acest fel, soluțiile la probleme pot fi găsite rapid - fără a fi nevoie să reacționeze în mod repetat la un stimul.
Așa cum se întâmplă adesea în cercetare, totul a început cu o mare coincidență - și de data aceasta au fost pașii unui asistent de laborator. Medicul și fiziologul rus Ivan Pavlov (1846-1936) studiază de ceva timp procesul digestiv la câini - cercetare pentru care mai târziu i se va acorda Premiul Nobel. Făcând acest lucru, el a făcut o descoperire surprinzătoare: procesul digestiv al animalului său de test nu a început doar când își avea hrana în gură. Saliva a început să curgă de îndată ce câinele a auzit pașii asistentului de laborator - evident semnalul pentru animal că se apropia de mâncare.
Interesul lui Pavlov a fost trezit și a investigat în mod sistematic fenomenul. Cercetătorul a implantat un tub în glanda salivară la câini pentru a măsura fluxul de salivă. De atunci a anunțat hrana animalelor cu un clopot. La început zgomotul i-a lăsat pe câini reci. Acest lucru nu este deloc surprinzător, deoarece nu există nicio legătură naturală între sunetul unui clopot și mâncare. Dar după câteva ori sunetul devenise important pentru animale și declanșa salivație chiar și fără hrană. Câinii învățaseră că după sunetul bolului pentru mâncare, acesta se umple. Iar Pavlov descoperise un important mecanism de învățare: condiționarea clasică.

Un neutru devine un stimul condiționat
Înainte ca animalele să înceapă să asocieze sunetul clopotului cu mâncarea, sunetul a fost un stimul neutru - fără nicio semnificație concretă pentru câini. Dar acum au legat două evenimente împreună prin învățare asociativă. Vorbim de condiționare clasică: un stimul care declanșează în mod natural o reacție măsurabilă este asociat cu altul care în mod normal nu ar provoca acest comportament.
Pavlov a descris primul stimul, adică mâncarea, ca un stimul necondiționat sau necondiționat. Aici fluxul de salivă este declanșat de un „reflex apetisant” care este înnăscut și facilitează transportul alimentelor în stomac. În cazul stimulului condiționat, sunetul clopotului, pe de altă parte, este necesar un proces de învățare, astfel încât să declanșeze reacția dorită. După cum a remarcat Pavlov, sincronizarea este importantă: trebuie să prezentați cei doi stimuli animalului în același timp sau într-o succesiune rapidă. Cu cât întârzierea este mai scurtă între stimulul condiționat și cel necondiționat, cu atât animalul dobândește răspunsul condiționat mai rapid și mai intens.
Nu numai câinii, ci și oamenii pot avea gura udată atunci când se gândesc doar la friptura delicioasă care fierbe în cuptor sau când îi adulmecă mirosul delicios care se revarsă prin bucătărie - cu mult înainte ca carnea să fie pe masă. Placă și se termină în gură. Psihologul american John B. Watson (1878-1959) a descoperit în 1920 în cel mai faimos, dar și foarte controversat experiment al său că condiționarea clasică funcționează și cu Homo sapiens. Watson l-a învățat pe un bebeluș pe nume Albert să se teamă de un șoarece alb. A reușit înfricoșându-l în mod repetat pe cel mic cu o lovitură puternică de ciocan pe o tijă de metal și făcându-l să plângă. În același timp, cercetătorul i-a arătat copilului un șoarece alb. După un timp, rozătoarea nu mai era un stimul neutru pentru micul Albert: se temea de vedere chiar și fără să audă crăpătura ciocanului - și începu să plângă.
Morcov si bat
Cu toate acestea, condiționarea clasică nu transmite un comportament cu adevărat nou. Mai degrabă, un comportament natural este declanșat - deși de un stimul dintr-un context diferit. Dacă, de exemplu, un câine va învăța un truc, să presupunem că joacă un rol la comandă, este necesară o altă formă de învățare: condiționarea operantă. Primul pas este de a determina câinele să facă trucul. Dacă reușește, se poate aștepta la o recompensă, un tratament sau o atenție specială. Dacă câinele ar trebui să memoreze ceea ce nu are voie să facă - de exemplu, să zdrobească ziarul stăpânului său - acest lucru funcționează și cu pedeapsă. Cu toate acestea, acest lucru este mai dificil. Prin urmare, se vorbește despre „învățarea prin recompensă sau pedeapsă” sau „învățarea din succes”. Comportamentul se schimbă ca urmare a consecințelor.
Psihologul Edward Thorndike (1874-1949) de la Universitatea Columbia a fost primul care a studiat condiționarea operantă în detaliu la începutul secolului al XX-lea - chiar dacă nu i-a dat acest nume. Thorndike a pus pisici flămânde într-o cușcă special construită și le-a oferit o bucată de pește - în afara închisorii. Pentru a intra în libertate și în cele din urmă la mâncarea râvnită, au trebuit să afle despre mecanismul cutiei și să acționeze un bolț. Asta a fost evident dificil pentru animale la început. Din întâmplare, au luat șurubul în timp ce rătăceau fără țintă, ușa s-a deschis și au putut obține recompensa. După câteva încercări, au început să deschidă în mod intenționat zăvorul imediat ce au fost așezate în cutie. Învățaseră ceva. Dintr-o înțelegere bruscă, o experiență aha pentru pisici, nu s-a putut pune problema, pentru că și-au simțit drumul prea încet spre soluția ghicitorului. Mai degrabă, tigrii casei au descoperit bara pe baza principiului încercării și erorii. Thorndike a bănuit că asocierea dintre cușcă și modelele de mișcare care au ajutat pisicile să se elibereze a devenit mai puternică cu fiecare evadare.
Atenţie
Atenția servește ca instrument pentru a percepe în mod conștient stimuli interni și externi. Realizăm acest lucru concentrându-ne resursele mentale pe un număr limitat de conținuturi ale conștiinței. În timp ce unii stimuli ne atrag automat atenția, îi putem selecta pe alții într-un mod controlat. De asemenea, creierul procesează inconștient stimuli care nu sunt în centrul atenției noastre.
În cutia Skinner
Termenul „condiționare operantă” a fost inventat în cele din urmă de psihologul american Burrhus Frederic Skinner (1904 - 1990), inventatorul celebrei cutii Skinner. În forma sa originală, simplă, este o cutie, echipată cu o pârghie proeminentă și un vas alimentar așezat dedesubt. Dacă animalul - Skinner a preferat șobolanii și porumbeii flămânzi - trage accidental de pârghie, acesta primește bile de mâncare. Această recompensă este un stimulent pentru a utiliza pârghia din ce în ce mai des în timp. În schimb, comportamentul condiționat poate fi șters din nou, prin dezactivarea robinetului de alimentare. În general, se aplică următoarele: O recompensă, așa-numitul întăritor pozitiv, crește probabilitatea ca un anumit comportament să se dezvolte. Pedeapsa, cum ar fi o supratensiune, le scade. La oameni, de exemplu, mângâierea pe spate poate servi ca un întăritor social - un simplu gest de apreciere care îi motivează să manifeste un anumit comportament mai des de acum înainte.