Ikastea (2): baldintzapen eragilea

Zer da baldintzapen eragilea?

Baldintzapen klasikoa aztertu genuenean jabetuko zinen Pàvlov-en txakurrek eta Albert txikiak ez zituztela iharduera konplexurik ikasi. Are gehiago: listua jariotzea ez da edozein txakur berez egin ezin dezakeen zerbait, negar egitea umeen jokabide erabat arrunt eta ohikoa den bezela. Hortaz, ikasi, ikasi zuten baldintzatutako erantzuna noiz adierazi. Baina iharduera bera ez zen berria. Horregatik baldintzapen klasikoak ezin ditzake iharduera konplexuak nola ikasten ditugun azaldu.

Horretarako beste ikastearen teoria bat aztertuko dugu: baldintzapen eragilea, hain zuzen.

Baldintzapen eragilea erantzun boluntario jakin bat bere ondorio onuragarri edo kaltegarrien arabera indartu edo ahuldu egiten duen ikasketa da. Hau da, jokabide jakin hori gehiago edo gutxiago errepikatzeko joera izango du.

Baldintzapen eragilearen kasuan izakiak nahita egindako ekintzak ikasiko ditu, eta ez erantzun naturalak noiz eman baldintzapen klasikoarekin gertatzen zen bezala. Hortaz animaliak edo pertsonak zerbait egin beharko du, hau da, operazioren bat burutu beharko du nahi duen ondorioa gerta daiten. Hortik dator eragilea hitza.

Thorndike-n efektuaren legea

Edward Lee Thorndike (1874–1949) psikologo eta pedagogoak animaliak erabili zituen bere esperimentuetan, Pàvlovek egin zuen bezela, animaliak erabili zituen animaliok modu mekanikoan ikasteko gaitasuna dutela demostratzeko.

Thorndike-ek gose zen katu bat zurezko barrotez osoturiko kutxa batean sartu zuen 1932ean egindako esperimentuetan. Kutxatik kanpo janaria jarri zuen, oso hurbil, baina katuak harrapatu ezin zuena. Kutxa honen barruan palankatxo bat dago kutxaren atetxoa zabaltzeko balio duena. Katuaren jokabide normala kutxatik irtetzen saiatzea da. Horregatik atzaparrak barroteen kontra erabiliko ditu, saltoak egingo ditu eta bueltaka ibiliko da irtetzeko moduaren bila.

1. irudia. Thorndike-k esperimentuetan erabilitako kutxa. Kutxa honek duen atea barruan dagoen palanka baten bidez zabal daiteke. Hori da kutxan sartuta dagoen katuak ikasi behar duena. Bertikalean katuak ateratzeko behar duen denbora segundutan ageri da. Horizontalean saiakerak.

1. irudia. Thorndike-k esperimentuetan erabilitako kutxa. Kutxa honek duen atea barruan dagoen palanka baten bidez zabal daiteke. Hori da kutxan sartuta dagoen katuak ikasi behar duena. Bertikalean katuak ateratzeko behar duen denbora segundutan ageri da. Horizontalean saiakerak.

Baina kutxak barruan palanka bat dauka kutxak duen atetxoa zabaltzeko balio duena. Hainbeste saiatuta, azkenean katuak kasualitatez palanka zapalduko du eta atea zabalduko da. Katuak horrela janaria lortuko du.

Hurrengoan katua kutxan sartzen dugunean pixka bat azkarrago topatuko du palankaren erabilera. Eta hurrengo aldietan gero eta denbora gutxiago emango du atetxoa zabaltzea lortu arte. Azkenean katuak palankatxoa erabiltzen ikasiko du. Prozesu hau efektuaren legean bildu zuen Thorndike-ek:

Ondorio desiragarriak dituzten erantzunak gehiago errepikatzeko aukera daukate.

Thorndike-ek lege hau automatikoki funtzionatzen zuela uste zuen. Hau da, izakiak ez zuen ulertu beharrik erantzuna eta sariaren arteko harremana. Esperientziaren poderioz izakiak konexio zuena egingo luke estimulu eta erantzunaren artean konexioaren kontzientziarik izan gabe.

Baldintzapen eragilearen oinarriak

Skinner-ren kutxa

B. F. Skinner (1904–1990) XX. mendeko psikologorik garrantzitsuenetariko bat izan zen. [1]Konduktismo izeneko korronte baten aldekoa izan zen eta psikologia esperimentala praktikatu zuen.

Thorndike-en pausuak jarraiki Skinner-ren kutxa izeneko aparatu batean sartzen zituen animaliak (ikus irudia beherago). Kutxa hau oso ongi kontrolatutako ingurune bat da, non animaliak operatu edo jardun behar duten. Kutxaren giroaren hainbat aldagarri manipulatu daitezke eta aldaketa hauek portaeran izan dezaketen eragina ikertzea egiten dute posible.

2. irudia. Skinner-rek erabilitako kutxaren eskema.

2. irudia. Skinner-rek erabilitako kutxaren eskema.

Thorndike-n kutxarekin alderatuta, Skinner-renak ez dauka katua irten dadin atetxo bat, janaria kutxan sartarazten duen botoi bat baino. Baina bestela funtzionamendua antzekoa da. Animaliak kutxaren barrualdea ikertuko du eta momenturen batean botoia sakatuko du janaria lortuz. Esploratzen jarraituko du berriro botoia sakatu eta janaria lortu arte. Azkenean gosea asetu arte botoia sakatu behar duela ikasiko du animaliak.

Indartzea edo errefortzua: baldintzapen eragilearen kontzeptu nagusia

Skinner-rek arratoiak erabili zituen baldintzapen eragilearen funtzionamendua aztertzeko. Indartzea estimulu jakin baten aurretik burututako portaera errepikatzearen probabilitatean areagontzen duen prozesua da. Indargarria, bestalde, portaera bat berriro gerta daitenaren probabilitatea areagotzen duen estimulua da. Skinner-ren kutxan dagoen arratoiaren kasuan janaria da indargarria, janariak botoia sakatzearen erantzuna probableagoa egiten baitu.

Zeintzu estimulu funtziona dezakete baldintzapen eragilea lortzeko? Panpinak, goxokiak, nota onak, dirua, etab. Zerbait indargarria izatea edo ez pertsonen araberakoa da, eta indartzaile jakin bat pertsona batekin funtzionatuko duen jakiteko modu bakarra saiatzea da. Estimulu batzuk estimulu direla ere ikasi egiten dugu. Eskarmentuaren araberakoa dira, beraz. Demagun besteentzat donut bat indargarria dela, baina zuri donutak gustatzen ez zaizkizunez donutak sari moduan erabiltzeak ez du zentzurik. Baina 1€ indargarria izan daiteke behin ikasten duzunean 1€ekin beste edozein gozoki eros dezakezula ikasten duzunean.

Honen arabera bi estimulu mota funtziona dezakete indargarri moduan:

  1. Lehen mailako indargarriak behar biologikoak asetzen dituzte eta berez funtzionatzen dute, pertsonaren eskarmentua kontuaan hartu barik. Janaria gose denarentzat, beroa hotz denarentzat eta mina arintzea minez dagoenarentzat lehen mailako indargarriak lirateke.
  2. Bigarren mailako indargarriak, ordea, lehen mailako indartzaileekin lotzen ditugulako dira indartzaile. Dirua da bigarren mailako indartzailerik nabarmenena, behin diruaren bitartez lehen mailako indargarriak lortu ditzakegula ikasten dugunean.

Indargarriak eta zigorrak

Orain arte ikusitakoaren arabera indargarriak saritzat har ditzakegu. Azken finean . Baina ez dira gauza bera. Sariak beti dira positiboak. Indargarriak, bestalde, positiboak zein negatiboak izan daitezke. Bestalde zigorrak aurretikako erantzuna gerta ez dadin dakarren estimulua da. Beraz probabilitatea murriztu egiten du, indargarriak ez bezala.

  • Indargarri positiboak. Inguruneari gehitutako estimulu bat da, aurretikako erantzunaren probabilitatea areagotzen duena. Janaria, ura, dirua, nota ona edo zoriontzea erantzuna berriro errepika dadin errezten du.
  • Indargarri negatiboak. Aurretikako erantzuna berriz gertatzearen probabilitatea areagotzen duten estimulu desatseginen kentzea dira. Azkura baldin badugu eta krema batek azkura hori kentzen badigu (estimulu desatzegina desagertarazi), krema hori berriro erabiltzeko joera handitu egingo da. Indargarri negatiboak ingurunean dauden baldintza negatiboak kentzen erakusten digu.
  • Zigor positiboa. Erantzuna ahultzen du estimulu desatsegin baten bitartez. Ume bati zaplasteko bat ematea gozokirik lapurtu ez dezan zigor positiboa litzateke. Norbait espetxeratzea zigor positiboa izango litzateke delitua berriz ez egiteko probabilitatea areagotzen duelako.
  • Zigor negatiboa. Gustagarria den zerbait kentzean datza. Lagunekin irtetzea gustoko baduzu, gurasoek zigortu nahi zaituztenean atera gabe zigor zaitzekete. Langile batek ondo lan egiten ez badu soldata murriztuko diote, lehen zuen soldata berreskuratzeko hobeto lan egingo duelakoan.

Ulertzen zaila bada, honako hiru aruak erabil ditzakezu aurreko hitzak hobeto ulertzeko [2]:

  • Indartzea aurretik doan jokabidearen frekuentzia areagotzen du. Zigorra, aldiz, aurretik doan jokabidearen frekuentzia murizten du.
  • Estimulu positibo baten aplikazioak indargarri positibotzat dugun jokabidearen frekuentzia areagotzen du. Estimulu negatibo baten aplikazioak, ostera, jokabidearen frekuentzia murrizten du (zigorra da).
  • Estimulu negatiboen kentzeak jokabidearen areagotzea badakar indartze negatiboa izango da. Jokabidearen frekuentzia murrizten duen estimulu positiboaren kentzeari zigor negatiboa deritzo.
3. irudia. Indartzea zein zigortzea estimuluak gehituta edo kenduta lortu daiteke. Bi faktore hauen konbinaketak lau aukera ezberdin ematen dizkigu

3. irudia. Indartzea zein zigortzea estimuluak gehituta edo kenduta lortu daiteke. Bi faktore hauen konbinaketak lau aukera ezberdin ematen dizkigu

Zigortu edo indartu?

Erabilgarria al da zigorra jokabidea aldatzeko? Batzutan zigorra jokabide bat ahalik eta azkarren aldatzeko bidea da, bereziki erabilgarria jokabide hori arriskutsua bada egiten duenarentzat. Ume bati errepidera atera ez daiten bigarren baten esateko aukerarik ez izatea posible da. Egiten duenean moztu beharra dago jokabide arriskutsu hori. Are gehiago, zigorra indarrean dagoen bitartean jokabide zuzena indartzeko aukera izango dugu.

Baina, orokorrean, zigorrak desabantaila asko ditu. Hasteko askotan zigorra ez da eragingarria. Bereziki ez baldin bada aplikatzen ekiditu nahi dugun jokabidea gertatu bezain laster. Zigortua den subjektuak zigortua izan den kontestu edo lekutik alde egiteko aukera badu zigorrak eragingarritasuna galduko du. Kasu hauetan ekiditu nahi dugun jokabidearen ordez beste jokabide are txarrago batek ordezka dezake.

Are txarrago. Zigor fisikoak zigortua den pertsonari bortitzkeria onargarria edota desiragarria denaren mezua bidal diezaioke. Ume bati ohikatu egiten badiogu ume horrek bere kideak ohikatuko ditu, akaso. Umeak agresio hori helduen erreakzio normaltzat hartu dezake. Askotan zigor fisikoak ezartzen dituztenek haserre bizian daude. Egoera horretan zaila da norberaren erreakzioa nerutzea edo ezartzen ari diren zigorraren neurria egokiro aplikatzea. Zigorrak aplikatzen dituztenak bildurra eragin dezakete besteengan. Eta zigorra jasotzen dutenek ez badute ondo ulertzen zigorraren arrazoiak autoestimuan jaso dezakete kalte.

Azkenik zigorrak ez du jokabide alternatibo zuzenagoen berririk ematen. Zigorra, eraginkorra izan behar badu, zuzendu nahi dugun jokabidearen eta jokabide zuzenago baten inguruko informazioa eman behar du. Zigorra aplikatutakoan jokabide egokia indartzen ahalegindu beharko gara.

Hau guztia kontutan harturik argi dago indartzea zigortzea baino estrategia hobea dela.

Indartze-programak

Zerbait ikasteko ez da beharrezkoa ongi egiten dugun bakoitzean indartzea jasotzea. Arrantzaleak arraina arrapatzen ez duten bakoitzean itzuliko balira portura, ez legoke arrantzalerik. Egunero deitzen diguten komunikabide-enpresen ordezkariak telefonoa eskegitzen dieten bakoitzean amore emango balute, ez genuke hurrengo egunean ostera deirik jasoko. Txanpon-makinan dirua sartzen dutenez indartugabeko jokabidea adierazten dute. Izan ere oso gutxitan tokatzen zaie saria. Baina behin eta berriro arrantzaleek sarea botatzen dute, saltzaileak bezero-potentzial berriei deitzen diete eta txanpon-makinak etengabean dabiltza.

Badirudi indartugabeko jokabideak ere ikasi eta mantentzen ditugula. Are gehiago: nohizbehinka indartzen den jokabidea etengabe indartzen den jokabidea baino hobeto ikasten da batzutan. Irakatsi nahi dugun jokabidea indartzearen frekuentzia eta segidari buruz ari garenean indartze-programetaz hitz egiten dugu.

  • Gertatzen den bakoitzean indartutako jokabidea etengabeko indartzean dagoela esaten dugu.
  • Batzutan baino ez badugu indartzen jokabide bat aldizkako indarzeaz edo indartze partzialazari gara.

Etengabeko indartzearen bitartez azkarrago ikasten badugu ere, aldizkako indartzeari ezker indargarriak bukatzen direnean luzeago iraungo dute ikasitako jokabideak. Zergatik, baina?

Azter ditzagun gozokiak saltzen dituen makina saltzaile baten eta kasino bateko makina txanponjalea. Makina saltzailea etengabeko indartzearen rededupean egiten du lan: diru kopuru egokia sartu ezkero beti jasoko dugu indartzailea. Hau da, gozokia. Makina txanponjalea, ordea, aldizkako indartzearen ereduaren arabera funtzionatzen du: gehienetan ez digu ezer ematen sartutako diruaren truk. Batzutan soilik emango digu sariren bat.

Demagun bi makina hauek matxuratu direla. Zenbat alditan sartuko zenuke dirua makina saltzailean goxokirik ematen ez badizu? Behin edo birritan. Eta makina txanponjalean? Zihurrenik askoz ere gehiagotan, saririk lortuko ez bagenu ere.

Aldizkako indartze eredu ezberdin asko aztertu dira, eta guztiak eraginkortasun maila berbera ez daukatela ondorioztatu. Bi kategoria orokor daude aldizkako indartzeaz ari garela.

  • Arrazoi finkoko eta arrazoi aldakorreko indartzeak indargarria eman baino lehen erantzuna zenbat alditan gertatu den kontutan hartzen du.
  • Denbora-tarte finkoko eta denbora-tarte aldakorreko indartzeak indargarria eman baino lehen zenbat denbora pasatzen den hartzen du kontutan.

Arrazoi finkoko eta arrazoi aldakorreko indartzeak

Arrazoi finkoko programan indartzea erantzun kopuru jakin baten ondoren ematen da. Skinner-ren kutxan dagoen arratoia palankatxoa sakatzen duen hamar aldiro janaria behin lortuko balu 1:10eko arrazoi edo proportzioaz ari gara. Demagun ehungintzan lan egiten duzula eta josten duzun alkondara bakoitzeko ordaintzen dizutela. Azkeneko kasu honetan argi ikusiko duzu ekoizpen handiagoak indartze gehiago dakarrela. Horregatik arrazoi finkoko indartzearen pean lan egiten duten pertsonek ahalik eta azkarren lan egiteko joera daukate.

Arrazoi aldakoreko indartzean programaren arabera indartzea erantzun kopuru aldagarri baten ondoren gertatzen da. Hala ere gehienetan batasbezteko kopuru baten inguruan gertatzen dira indartze hauek. Telefono bidezko saltzaile baten kasua da hau. Halako langileak ez du lortuko egiten duen dei bakoitzeko salmenta bat burutzea. Hirugarren, zortzigarren, hamargarren edo hogeigarren deiari esker lor dezake salmenta egitea. Kasu honetan %20 inguruko arrakasta izaten dute. Arrazoi aldakorraren eredupean lan egiteak ahalik eta denbora gutxienean ahalik eta dei kopururik altuena egitea ekarriko du. Beraz arrazoi aldakorreko indartzeak erantzun-tasa handia eta erantzunaren iranuntze luzea ekari ohi ditu.

Denbora-tarte finkoko eta denbora-tarte aldakorreko indartzeak

Kasu honetan indartzea denbora-tarte baten ondoren gertatzen da, eta ez erantzun kopuru jakin baten ondoren.

Denbora-tarte finkoko programan indartzeak denbora jakin baten ondoren gertatzen dira. Horregatik erantzun tasa txikia izaten dute, bereziki azkeneko indartzearen ondoren, hurrengo indartzerarteko tartea luzeagoa delako. Hilero soldata jasotzea da indartze-modu honen adibide egokia. Hilabete bukaeran kobratuko duen langileak ez dauka lana bereziki ondo egiteko estimulurik.

Ikasleen jokabideak ere denbora-tarte finkoko indartzearen araberakoak izan ohi dira. Azterketen arteko tarteak oso luzeak badira indartzea jasotzeko aukerak gutxitu egiten zaizkigu. Ondorioz ikasleak ez dute ezer ikasten edo gutxi ikasten dute azterketa hurbildu arte. Azterketaren aurreko egune(t)an ikastearen erantzuna areagotu egiten da. Baina, nork zabaltzen du liburua azterketaren ondoko egunean? Izan ere azterketaren ondoren ikastearen erantzuna (ia) dezagertu egiten da. Denbora-tarte finkoko indartzeak eskilara efektua sortu ohi du.

Denbora-tarte aldakorreko indartzea indartzearen ondoren gertatzen den erantzunaren murrizketa ekiditeko erabil daiteke. Indartzeen arteko aldagarritasuna batazbesteko jakin baten inguruan mugitzen da. Hiru egunean behinetik hiru astetan behinera bitartean azterketa sorpresak jartzen dituen irakasleak denbora-tarte aldakorreko indartzea erabiltzen ari da. Denbora-tarte finkoko programarekin konparatuta ikasleak gehiago ikasiko dute. Izan ere ikasleak ez dakite zehazki noiz izango duten azterketa eta, ondorioz, aprobatzeko aukerarik izan behar badute jarraiago ikasi beharko dute. Metodo honek erantzun-tasa altuagoa ekarri ohi du eta indartzea bukatu ondorengo erantzunaren desagertzea murriztu egiten du.[3]

Bereiztea eta orokortzea

Baldintzapen klasikoarekin gertatzen zen bezala baldintzapen eragilean bereizketa eta orokortze fenomenoak funtzionatzen dute.

Bereiztea

Pertsonek estimuluak bereizten ikasten duenteko prozesuari estimuluak kontrolatzeko prestakuntza deritzo. Honen arabera pertsona baten jokabidea estimulu jakin baten aurrean indartu egiten da, baina ez estimulu horren gabezian. Estimulu-bereizte kontesturik zailenetarikoa beste paertsona bat laguna bakarrik edo laguna baino gehiago den (edo izan nahi duen) jakitean dago. Pertsonek bereizten ikas dezakete hizketaz kanpoko komunikazioaren zeinuak jarraituta —hala nola begi-kontatu luzeagoa edo ikutzea— intentzio erromantikorik dagoen. Horrelako zeinurik egon ezean interes erromantikorik ez dagoela ikasiko (ondorioztatuko) dugu. Hizketaz kanpoko komunikazioa estimuluak bereizteko balio digu kasu honetan, estimuluak kontrolatzeko prestakuntzan erantzuten ikasiko dugularik. Estimulu-bereizteak erantzun baten ondoren indartzaile bat etortzearen probabilitatea ezartzen laguntzen digu. Honen aplikazioetariko bat izan daiteke ostiaralean normalean baino beranduago heltzeko baimena eskatzeko ama umore honean egon arte itxarotea. Umore ezberdinak bereizten dituzula ematen duzu aditzera, eta zure beranduago heltzeko baimena lortzeko probabilitateak aregotu egingo dituzu.

Orokortzea

Baldintzapen eragilearekin ere antzeko estimuluen aurrean erantzuna orokortzeko joera daukagu. Eskolan eskuzabala izatea lagungarria suertatu bazaizu litekeena da beste inguru batzuetan ere eskuzabala izatea, lehengo esperientziak zure eskuzabaltasuna indartu duelako.


  1. Seymour Skinner The Simpsons telesailaren pertsonaietariko baten izena da. Ikusten al duzu inolako loturarik ikastetxeko zuzendaria izatearen eta Skinner izena izatearen artean?  ↩

  2. Are sinpleago. Indartzeak jokabidearen areagotzea dakar. Zigortzeak jokabidearen gitxiagotzea dakar.  ↩

  3. Psikologia guzti honek ezin dezake honako fenomenoa ekiditu edo izkutatu: berdin dio azterketak nolakoak diren, zenbat diren eta noiz egiten diren; ikasleak beti kexatu egingo dira ahal duten beste. Lege Naturala da hau, nonbait, indartzerik jasotzen ez badu ere Desagertze Tasa = 0 duena. :-(  ↩