El condicionamiento operante: Qué es y cómo funciona

Descubra qué es el condicionamiento operante en psicología, sus diferentes componentes y cómo se utiliza.

Por ejemplo, cuando se le recompensa en el trabajo con una bonificación por un trabajo excepcional, se sentirá inclinado a seguir rindiendo a un nivel superior con la esperanza de recibir otra bonificación en el futuro. Como este comportamiento fue seguido por un resultado positivo, es probable que se repita.

Comportamiento operante

En la conducta operante, los estímulos pueden ser apetitivos o aversivos. Los estímulos apetitivos son aquellos a los que se acerca voluntariamente mientras que los estímulos aversivos son los que trata de evitar o escapar. Las respuestas a estos estímulos pueden ser de refuerzo positivo o negativo. En este caso, positivo y negativo no significan bueno o malo. Por el contrario, el refuerzo positivo significa introducir estímulos para aumentar la probabilidad de recurrencia de la conducta, mientras que el refuerzo negativo implica la eliminación de estímulos para fomentar la buena conducta.

La teoría del condicionamiento operante

El condicionamiento operante fue descrito por primera vez por el conductista B.F. Skinner. Su teoría se basaba en dos supuestos. En primer lugar, la causa del comportamiento humano es algo del entorno de la persona. En segundo lugar, las consecuencias de un comportamiento determinan la posibilidad de que se repita. El comportamiento que va seguido de una consecuencia agradable es probable que se repita y el comportamiento seguido de una consecuencia desagradable es menos probable que se repita.

Aunque Skinner fue el pionero de la teoría del condicionamiento operante, sus ideas se basaban en la ley del efecto de Thorndikes. Por lo tanto, era más productivo estudiar la conducta observable que los acontecimientos mentales internos.

Skinner también fue un inventor ejemplar. Entre sus artilugios se encuentra la Caja de Skinner, que utiliza sujetos como ratas y palomas para registrar el comportamiento de los animales en un tiempo comprimido.

A través de sus experimentos, Skinner identificó tres tipos de respuestas que seguían al comportamiento:

Respuestas neutras... Son respuestas del entorno que no producen ningún estímulo más que centrar la atención. No aumentan ni disminuyen la probabilidad de que una conducta se repita.

Reforzadores: son respuestas del entorno que aumentan la probabilidad de que una conducta se repita. Pueden ser positivos o negativos.

Castigadores. Son operantes negativos que hacen que la probabilidad de un comportamiento disminuya. El castigo debilita la conducta.

Refuerzo positivo

El refuerzo positivo implica la presentación de un estímulo apetitoso para aumentar la probabilidad de que una conducta se produzca en el futuro. Por ejemplo, si tu hijo hace las tareas sin que se lo pidas puedes premiarlo llevándolo al parque o dándole una golosina...

Skinner utilizó una rata hambrienta en una caja Skinner para mostrar cómo funciona el refuerzo positivo... La caja contenía una palanca en un lateral y, cuando la rata se movía por la caja, golpeaba accidentalmente la palanca. Inmediatamente después de hacerlo, una bolita de comida caía en un recipiente junto a la palanca. La consecuencia de recibir comida cada vez que la rata golpeaba la palanca aseguraba que el animal repitiera la acción una y otra vez.

El refuerzo positivo no tiene por qué implicar objetos tangibles. En su lugar, puede reforzar positivamente a su hijo a través de:

  • Aplaudiendo

  • Aplaudiendo

  • Dar un abrazo o una palmadita en la espalda

  • Dar un pulgar hacia arriba

  • Ofrecer una actividad especial, como jugar a un juego o leer un libro juntos

  • Decirle a otro adulto lo orgulloso que está del comportamiento de su hijo mientras éste le escucha

  • Elogiarlos

  • Chocar los cinco

Refuerzo negativo

En el refuerzo negativo, se termina algo desagradable en respuesta a un estímulo. Con el tiempo, la conducta aumenta con la expectativa de que el estímulo aversivo sea retirado. Si, por ejemplo, un niño se niega a comer verduras a la hora de la cena y los padres responden retirándolas, la retirada de las verduras es un refuerzo negativo.

Horarios de refuerzo

Un programa de refuerzo es un componente del condicionamiento operante que establece qué instancias de la conducta serán reforzadas. Implica un conjunto de reglas determinadas por... el tiempo y el número de respuestas requeridas para presentar o eliminar un reforzador.

Los diferentes patrones de refuerzo tienen efectos distintivos en la velocidad de aprendizaje:

Refuerzo de proporción fija: las recompensas dependen del número específico de veces que se produce una conducta. Por ejemplo, un niño es aplaudido después de deletrear 10 palabras correctamente.

Refuerzo de intervalo fijo. Las recompensas se proporcionan en momentos constantes. Un ejemplo es una paga semanal. Otro ejemplo es el de un niño que es recompensado una vez a la semana si lava los platos.

Refuerzo de proporción variable. Este refuerzo es imprevisible y produce un gran número de respuestas. Por ejemplo, los juegos de azar pueden ofrecer ganancias tras varios intentos imprevisibles.

Refuerzo de intervalo variable: las respuestas se recompensan después de un tiempo imprevisible. Un ejemplo son los controles imprevisibles de un inspector de sanidad.

Refuerzo continuo: es el refuerzo de un comportamiento cada vez que se produce. Un ejemplo es premiar a un niño pequeño cada vez que usa el orinal.

Castigo

En el condicionamiento operante, el castigo se define como cualquier cambio en el entorno que reduce la probabilidad de que las respuestas o el comportamiento se repitan... El castigo puede funcionar aplicando directamente un estímulo desagradable, como una reprimenda... o eliminando un estímulo potencialmente gratificante, como la deducción de la paga diaria de alguien para castigar un comportamiento indeseable.

Si bien el castigo es eficiente para disminuir las conductas indeseables, está asociado a muchos problemas como:

  • Aumento de la agresividad

  • El comportamiento castigado se suprime en lugar de olvidarse.

  • Miedo

  • El castigo no orienta necesariamente hacia el buen comportamiento

  • El castigo puede convertirse fácilmente en abuso

Economía de fichas

La economía de fichas es un sistema utilizado en los programas de modificación de conducta en el que el comportamiento deseable se refuerza utilizando recompensas tangibles como fichas, dinero falso, comida, pegatinas, fichas de póquer o botones que luego se intercambian por recompensas. En un entorno hospitalario, por ejemplo, pueden ofrecerse recompensas de dinero simbólico a cambio de comida, acceso a la televisión y otras bonificaciones.

La economía de fichas no sólo ha demostrado su eficacia en el manejo de pacientes psiquiátricos, sino también en la escuela. Este sistema puede utilizarse en las aulas para reducir el comportamiento disruptivo y aumentar el compromiso académico.

Hot