Análise do Comportamento

Reforço positivo e negativo: o que cada um é (e por que negativo não é punição)

Reforço positivo adiciona estímulo apetitivo; reforço negativo remove estímulo aversivo. Ambos aumentam a resposta. Punição é outra coisa. Entenda a diferença que organiza a clínica.

Sou Lucas Radis, psicólogo clínico, mestre em Análise do Comportamento, e faço parte da equipe da Clínica Evidenciare em Londrina-PR. “Reforço negativo” é provavelmente o termo técnico mais maltratado no debate público de psicologia. Em redes sociais, em coluna de jornal e até em formação clínica mal feita, “reforço negativo” aparece como sinônimo de punição, de feedback ruim, de bronca. Não é. Vou separar.

A definição em uma frase

Reforço é qualquer consequência que aumenta a probabilidade futura da resposta naquele antecedente. Punição é qualquer consequência que reduz essa probabilidade. Os adjetivos “positivo” e “negativo” referem-se à operação sobre o estímulo — adicionar (positivo) ou remover (negativo) — e não a juízo de valor sobre o procedimento.

Quatro combinações possíveis:

  • Reforço positivo: apresenta estímulo apetitivo → aumenta resposta.
  • Reforço negativo: remove estímulo aversivo → aumenta resposta.
  • Punição positiva: apresenta estímulo aversivo → reduz resposta.
  • Punição negativa: remove estímulo apetitivo → reduz resposta.

A confusão vem de associar “negativo” com “ruim”. Em análise do comportamento, “negativo” significa apenas remoção. O efeito sobre o comportamento — aumento ou redução — é definido pela palavra reforço ou punição, não pelo sinal.

Reforço positivo

Reforço positivo é o que a maior parte do público chama, em linguagem informal, de “recompensa”. É a contingência em que uma resposta produz a apresentação de algum estímulo, e o resultado é o aumento da frequência futura daquela resposta naquele tipo de antecedente.

Exemplos cotidianos:

  • Criança pede biscoito de modo educado; cuidador entrega biscoito; pedido educado aumenta de frequência ao longo do tempo.
  • Adulto contribui em reunião de trabalho; chefe reconhece publicamente; contribuição em reunião aumenta de frequência.
  • Adolescente posta foto em rede social; recebe curtidas e comentários; postar aquela classe de foto aumenta de frequência.

A função do estímulo apresentado define se houve reforço — não a intenção do agente que o entregou. Cuidador pode acreditar que está “premiando” a criança; o que importa é se a frequência da resposta-alvo aumenta. Se não aumenta, não foi reforço, foi outra coisa.

Reforço negativo

Reforço negativo é a contingência em que uma resposta remove um estímulo aversivo presente, ou previne um estímulo aversivo iminente. O resultado é o aumento da frequência futura daquela resposta nas condições em que o estímulo aversivo esteja presente ou esteja por vir.

Há dois tipos:

  • Fuga: o estímulo aversivo está presente; a resposta o termina. Ex.: chuva começa a cair, a pessoa abre o guarda-chuva, a sensação de molhar termina. Abrir o guarda-chuva quando chove aumenta de frequência.
  • Esquiva: o estímulo aversivo está iminente, sinalizado por algum antecedente; a resposta previne sua apresentação. Ex.: alarme antecede uma situação dolorosa; a pessoa aprende a sair do ambiente diante do alarme; sair diante do alarme aumenta de frequência.

Reforço negativo é o motor de uma enorme fatia do comportamento clínico relevante. Pacientes com transtorno de ansiedade evitam situações temidas — a evitação é mantida por reforço negativo, porque produz redução imediata da sensação aversiva. Pacientes com desregulação emocional intensa usam autolesão, dissociação, álcool ou compulsão alimentar — esses comportamentos são mantidos por reforço negativo automático, porque produzem redução rápida de um estado emocional aversivo intenso.

Mudança de paradigma: “ele se corta porque quer chamar atenção” → “ele se corta porque o ato produz, em segundos, redução de um estado interno de sofrimento, raiva, vazio ou dissociação tão intenso que ele não tem repertório alternativo para tolerar — a função é regulatória, mantida por reforço negativo automático”.

Não toda autolesão tem essa função. Algumas são mantidas por reforço social (atenção, validação, interrupção de exigência ambiental). A análise funcional é o que distingue.

Por que reforço negativo NÃO é punição

A confusão é tão comum que vale enunciar lentamente.

  • Reforço (positivo OU negativo): aumenta a probabilidade futura da resposta.
  • Punição (positiva OU negativa): reduz a probabilidade futura da resposta.

O “negativo” em reforço negativo refere-se a remover algo do ambiente. O “negativo” em punição negativa também refere-se a remover algo do ambiente. A diferença é o tipo de estímulo removido:

  • Reforço negativo remove estímulo aversivo → comportamento aumenta.
  • Punição negativa remove estímulo apetitivo → comportamento reduz.

Exemplo: criança brinca com violência com o irmão. Mãe retira o brinquedo (remove estímulo apetitivo). Se a frequência do brincar com violência reduzir, foi punição negativa. Se não reduzir, foi só uma retirada — sem efeito de redução, não há punição.

Outro exemplo: paciente experimenta crise de pânico em mercado lotado (estímulo aversivo intenso). Sai do mercado (resposta). Sensação de pânico reduz drasticamente (remoção do estímulo aversivo). Em situações futuras com sinais de mercado lotado, a probabilidade de sair do mercado aumenta. Foi reforço negativo — mesmo que o ato de sair seja, no contexto clínico, problemático e mantenha o quadro de transtorno de pânico.

A mesma operação técnica (remoção de estímulo) pode produzir reforço ou punição dependendo do tipo de estímulo e do efeito sobre a frequência.

Implicações para a clínica

Distinguir reforço positivo e negativo organiza intervenções.

Para comportamentos mantidos por reforço positivo (atenção, validação, acesso a item, status social), a intervenção em geral envolve:

  1. Reforço positivo de comportamento alternativo funcionalmente equivalente.
  2. Extinção do comportamento-alvo — retirar a consequência reforçadora — quando seguro e eticamente viável.
  3. Atenção a possíveis explosões de extinção (aumento temporário da resposta antes de declinar).

Para comportamentos mantidos por reforço negativo (esquiva, fuga, autolesão regulatória, uso de substância para reduzir afeto aversivo), a intervenção é mais complexa:

  1. Construção de repertório alternativo que produza a mesma função regulatória sem o custo.
  2. Aumento da tolerância ao estímulo aversivo, em vez de tentar removê-lo permanentemente.
  3. Em quadros com desregulação intensa, incorporação do trabalho ao protocolo DBT, com módulos de tolerância ao mal-estar e regulação emocional.

É importante destacar que tentar simplesmente “tirar” o comportamento mantido por reforço negativo, sem oferecer alternativa funcional, raramente funciona. O paciente perde o único repertório que tinha para regular o afeto aversivo, e o quadro tende a piorar — não a melhorar.

Onde isso aparece em DBT

A DBT incorpora a distinção entre reforço positivo e negativo em vários pontos do protocolo. A análise em cadeia, ferramenta central da DBT individual, mapeia consequências em duas dimensões: consequências para o paciente (incluindo função regulatória, frequentemente reforço negativo) e consequências para o ambiente (frequentemente reforço social positivo ou negativo).

O treino de habilidades trabalha a substituição de respostas mantidas por reforço negativo automático por habilidades que produzem a mesma redução de afeto aversivo — habilidades TIPP (temperatura, exercício intenso, respiração pausada, relaxamento muscular) são, em termos funcionais, alternativas com a mesma classe funcional da autolesão, mas com custo de vida radicalmente menor.

Sem entender a função de reforço negativo automático na manutenção desses quadros, a DBT vira lista de exercícios. Com a função clara, a intervenção fica tecnicamente coerente.

Onde ler

  1. Skinner, B. F. (1953). Science and Human Behavior. Edição brasileira: Ciência e Comportamento Humano (Martins Fontes).
  2. Catania, A. C. (1999). Aprendizagem: comportamento, linguagem e cognição. Artmed.
  3. Rajaraman, A., et al. (2022). Toward trauma-informed applications of behavior analysis. JABA.

A Clínica Evidenciare atende com protocolos baseados em evidência. Se você está em sofrimento intenso, ligue CVV 188 (gratuito, 24h, sigiloso). Para agendar avaliação na Evidenciare, escreva para [email protected].

Atendimento clínico

Reconheceu o quadro? Atendo casos como esse.

Texto científico não substitui consulta. Se você se identifica e quer atendimento DBT-informado, agende na Clínica Evidenciare — presencial em Londrina-PR ou remoto.

Agendar consulta Mais textos do blog

Em sofrimento intenso, ligue CVV 188 — gratuito, 24h, sigiloso.