Partager sur Pinterest
L’esprit humain peut avoir tendance à en vouloir toujours plus. Al Barry/Getty Images
  • Les chercheurs ont utilisé un modèle d’apprentissage par renforcement pour en savoir plus sur les raisons pour lesquelles nous nous habituons et comparons, même si cela nous rend malheureux.
  • Ils ont constaté que l’habitude et la comparaison peuvent jouer un rôle important dans le comportement adaptatif qui facilite l’apprentissage.
  • Ils ont conclu que leurs découvertes pourraient aider à faire la lumière sur les raisons pour lesquelles nous avons toujours tendance à en vouloir plus.

Le bonheur est l’une des émotions humaines les plus recherchées. Cependant, y parvenir sur le long terme est inaccessible pour beaucoup.

C’est parce que le bonheur dépend du changement attentes qui font que les gens s’habituent rapidement à de « nouvelles raisons d’être heureux ». Cela dépend aussi si les gens comparer ce qu’ils ont avec les autres ou ce qu’ils aimeraient avoir.

L’accoutumance et la comparaison peuvent conduire à un cycle de sans fin envies et désirs, qui affectent négativement la santé mentale et le bien-être.

Comprendre les coûts et les avantages de l’accoutumance et de la comparaison pourrait aider les chercheurs à élaborer des politiques et des interventions à grande échelle pour lutter contre ces biais mentaux.

Récemment, les chercheurs ont utilisé un cadre informatique connu sous le nom d’apprentissage par renforcement pour modéliser les effets de différents niveaux d’accoutumance et de comparaison.

Ils ont constaté que si faire des comparaisons réduit le bonheur, cela accélère l’apprentissage.

Dr Nathaniel Dawprofesseur en neurosciences computationnelles et théoriques à l’Université de Princeton, qui n’a pas participé à l’étude, a déclaré Nouvelles médicales aujourd’hui :

« Vous pourriez penser que construire un robot qui peut choisir parmi différentes options est facile : il suffit de donner une note à tout et de choisir le meilleur. Mais en fait, il est étonnamment difficile de déterminer comment configurer ce score pour que votre robot fasse de bons choix. Cet article examine le bonheur humain sous cet angle.

« [In particular, the researchers answer the question:] pourquoi le même résultat est-il délicieux aujourd’hui mais ennuyeux demain ? Ils montrent que cela a des avantages – si nous ne sommes jamais satisfaits, nous sommes constamment poussés à trouver de meilleurs résultats – mais aussi des inconvénients, car cela se fait au détriment d’une dévaluation constante de ce que nous avons déjà réalisé, ce que les auteurs suggèrent pourrait, poussé à l’extrême, rapport à la dépression. »
— Dr Nathaniel Daw

L’étude a été publiée dans Biologie computationnelle PLOS.

Les chercheurs ont utilisé un cadre d’apprentissage par renforcement. Rachit Dubéy, un doctorat de cinquième année. étudiant à l’Université de Princeton et auteur principal de l’étude, a déclaré MNT:

« Les méthodes d’apprentissage par renforcement se concentrent sur la formation d’un agent – par exemple, un robot – afin que l’agent apprenne à associer des situations à des actions – comme apprendre à jouer aux échecs. Le principe directeur de ces méthodes est qu’elles entraînent les agents à l’aide de récompenses – elles offrent des récompenses positives aux comportements souhaités et/ou des récompenses négatives aux comportements indésirables.

« Cela est similaire à la façon dont nous apprenons des récompenses – nous sommes plus susceptibles de prendre les actions qui nous donnent des récompenses positives comme l’argent, les éloges, etc., et nous évitons les actions qui nous donnent des récompenses négatives comme la douleur, la tristesse, etc. » il ajouta.

Pour l’étude, les chercheurs ont formé un agent en lui donnant une « récompense » chaque fois qu’il dépassait ses attentes précédentes et les performances des autres agents. Ils ont ensuite mené diverses expériences dans différents environnements avec les agents.

Ce faisant, ils ont constaté que les agents récompensés pour l’accoutumance et la comparaison apprenaient beaucoup plus rapidement que les agents standard basés sur la récompense, bien qu’ils soient moins heureux.

Cela signifie que l’accoutumance et la comparaison pourraient favoriser un comportement adaptatif en servant de puissant signal d’apprentissage.

Ils ont également constaté que faire des comparaisons accélérait l’apprentissage car cela incitait les agents à explorer, et que des attentes appropriées servaient d’aides utiles pour la comparaison, en particulier dans des environnements avec peu de récompenses.

Ils ont en outre noté, cependant, que les agents étaient mécontents et avaient des performances sous-optimales lorsque les comparaisons n’étaient pas vérifiées et lorsqu’il y avait trop d’options similaires parmi lesquelles choisir.

Cela, a noté Dubey, signifie que face à de nombreux choix, nous devrions essayer de prendre des décisions sans compter sur des comparaisons.

Lorsqu’on lui a demandé comment la fonction de récompense pouvait permettre aux agents d’apprendre plus rapidement mais d’être « moins heureux », Dubey a répondu :

« L’accoutumance et les comparaisons induisent le malheur parce que l’agent ne tire aucune récompense positive des scénarios connus, car il s’habitue rapidement aux bonnes choses. Il tire également très peu de récompenses positives de bons scénarios, car il se compare à quelque chose d’encore meilleur. Cependant, cela aide un agent à apprendre plus rapidement car cela le motive à essayer de nouvelles actions et de nouveaux scénarios, de sorte qu’il peut rapidement échapper à ceux qui sont désagréables.

« Pour illustrer cela, supposons que j’obtienne 90 % à un test, et cela me rend très heureux. Mais ensuite, je vois qu’un camarade de classe qui réussit généralement moins bien que moi obtient 96% au test. Cela me rendra très malheureux même si mes résultats de test n’ont pas changé. Ce malheur qui en résulte pourrait alors me motiver à étudier plus dur et à en faire plus dans le texte suivant », a-t-il expliqué.

Les chercheurs ont conclu que leurs résultats aident à expliquer pourquoi nous sommes enclins à être piégés dans un cycle sans fin de désirs et de désirs. Ils ont ajouté que leurs résultats pourraient « faire la lumière sur des psychopathologies telles que la dépression, le matérialisme et la surconsommation ».

Les chercheurs ont noté que, comme leurs expériences ont été menées dans des environnements trop simplifiés, elles peuvent ne pas être généralisables à des scénarios réels.

Ils ont ajouté que les travaux futurs devraient également prendre en compte d’autres aspects du bonheur tels que la culpabilité et la jalousie et la manière dont ceux-ci interagissent avec les états affectifs, notamment l’anxiété et l’ennui.

« Étant donné à quel point l’accoutumance et les comparaisons sont avantageuses pour promouvoir un comportement adaptatif, il est possible que ces caractéristiques soient des préjugés profondément enracinés dans nos esprits. Cela pourrait expliquer notre obsession moderne de la « croissance à tout prix » et pourquoi nos niveaux de consommation ont augmenté de façon si spectaculaire et ne montrent aucun signe de ralentissement. »
— Rachit Dubey, auteur principal

Interrogé sur les implications de la recherche pour l’avenir, Dubey a déclaré:

« Si nous voulons nous attaquer sérieusement au problème extrêmement urgent de la surconsommation – qui entraîne une détérioration rapide de notre planète et menace gravement les générations futures – nous devons développer des politiques concrètes et des interventions à grande échelle pour lutter contre ces biais de l’esprit humain ».