banner
Centre d'Information
Articuler et maîtriser son expertise.

Plusieurs échelles de temps d'apprentissage indiquées par des changements dans les preuves

May 05, 2023

npj Science of Learning volume 8, Article number: 19 (2023) Citer cet article

64 accès

Détails des métriques

Les modèles d'accumulation de preuves ont permis de fortes avancées dans notre compréhension de la prise de décision, mais leur application à l'examen de l'apprentissage n'est pas courante. À l'aide de données provenant de participants effectuant une tâche dynamique de discrimination aléatoire de la direction du mouvement des points sur quatre jours, nous avons caractérisé les altérations de deux composantes de la prise de décision perceptive (taux de dérive du modèle de diffusion de dérive et limite de réponse). Des modèles d'apprentissage en temps continu ont été appliqués pour caractériser les trajectoires de changement de performance, avec différents modèles permettant des dynamiques variables. Le modèle le mieux ajusté incluait le taux de dérive changeant en tant que fonction continue et exponentielle du nombre d'essais cumulés. En revanche, la limite de réponse a changé au sein de chaque session quotidienne, mais de manière indépendante à travers les sessions quotidiennes. Nos résultats mettent en évidence deux processus différents sous-jacents au modèle de comportement observé tout au long de la trajectoire d'apprentissage, l'un impliquant un réglage continu de la sensibilité perceptive, et un autre processus plus variable décrivant le seuil des participants lorsqu'il y a suffisamment de preuves pour agir.

L'apprentissage se produit dans presque tous les comportements que les humains exécutent, des tâches cognitives ou motrices complexes aux discriminations perceptives de base. La compréhension des processus responsables de l'apprentissage a donc des implications pour la plupart des actions humaines dans des contextes allant de l'éducation à la réadaptation1,2. Il est donc surprenant que la recherche sur les processus d'apprentissage ait souvent tendance à être limitée de plusieurs manières. Premièrement, il est assez courant que la recherche sur l'apprentissage se concentre exclusivement soit sur l'exactitude ou l'identité des choix3,4, soit sur le temps nécessaire pour faire des choix (c'est-à-dire le temps de réponse ou RT5,6). Ceci en dépit d'une grande quantité de recherches montrant que des inférences plus riches concernant les processus en cours deviennent possibles lorsque l'on considère à la fois la vitesse des décisions et leur précision en combinaison7,8,9,10. Deuxièmement, dans l'ensemble limité de cas où la RT et la précision ont été prises en compte dans les études d'apprentissage, la modélisation a presque toujours impliqué une agrégation substantielle entre les participants et/ou les essais d'apprentissage. Souvent, un modèle stationnaire distinct est adapté à tous les essais de chaque session d'apprentissage individuelle ou "bloc" d'essais, puis l'apprentissage est examiné à travers les différences dans les paramètres du modèle d'une session à l'autre (ou d'un bloc à l'autre). Une telle agrégation reste courante malgré les recherches montrant qu'elle peut être à la fois théoriquement et empiriquement malavisée, car elle peut conduire à des inférences manquées ou erronées sur les processus d'apprentissage sous-jacents11,12,13. Ci-dessous, nous passons brièvement en revue (A) les approches de modélisation pour lier la RT et la précision et leur utilisation antérieure dans l'évaluation de l'apprentissage dans le domaine perceptif et (B) les approches en temps continu et individuelles pour évaluer l'apprentissage dans le domaine perceptif, afin de motiver la nécessité de combiner ces deux approches dans un cadre unique. Cette approche combinée nous permet d'aborder des questions clés concernant la manière dont des aspects spécifiques du processus de prise de décision perceptif (par exemple, la rapidité avec laquelle les preuves perceptives s'accumulent, la quantité de preuves nécessaires avant de déclencher une réponse) changent au fil du temps dans une multi-session. étude de l'apprentissage perceptif.

Le modèle le plus important reliant la RT et le choix discret (par exemple, la précision) conceptualise les comportements comme résultant de l'accumulation bruyante de preuves jusqu'à ce qu'une limite de décision soit atteinte7,9,10,14. Par exemple, considérez une tâche où les participants voient un champ de points mobiles (voir Fig. 1 supplémentaire). À chaque essai, 15 % des points se déplacent de manière cohérente vers la gauche ou vers la droite, tandis que le reste des points se déplacent de manière aléatoire. La tâche des participants est d'indiquer aussi rapidement et précisément que possible si les points se déplaçant de manière cohérente se déplacent vers la gauche ou vers la droite. Dans le cadre d'une approche de modélisation par accumulateur, le système perceptif accumule en permanence des preuves en faveur des alternatives respectives (gauche ou droite), jusqu'à ce que la quantité de preuves en faveur de l'une des alternatives atteigne une certaine limite, moment auquel la décision donnée est prise. Ce modèle est formellement défini par un processus de diffusion de Wiener borné9,10. Le modèle de diffusion de dérive (DDM) résultant est caractérisé par quatre paramètres (voir Fig. 1). Dans deux choix forcés alternatifs, la preuve commence l'accumulation à un point de biais et se poursuit avec un bruit constant et un taux de dérive (DR) jusqu'à ce qu'elle atteigne une limite, la distance entre les limites étant définie par un paramètre de limite de réponse (RB). Un dernier paramètre est une valeur additive au RT qui est théoriquement indépendante du processus d'accumulation de preuves (temps de non-décision ; NDT). L'estimation de ces paramètres à l'aide de méthodes bayésiennes hiérarchiques est devenue de plus en plus courante, ce qui formule l'estimation des paramètres DDM comme une régression généralisée à effets mixtes ajustée aux distributions conjointes de RT et de précision8,15,16. Ici, nous implémentons des méthodes similaires en utilisant Stan17,18,19.

Le processus de prise de décision est défini par une accumulation bruyante de preuves (trois exemples indiqués par des lignes grises) avec une valeur moyenne, ou taux de dérive, vers une limite inférieure ou supérieure, également appelée limite de réponse. L'accumulation de preuves commence à un certain point de biais (généralement exprimé en proportion de la limite de réponse), et un paramètre additif de temps de non-décision tient compte des aspects des distributions RT qui ne sont pas attribuables au processus d'accumulation de preuves.

Les paramètres DDM sont théoriquement associés aux composants psychologiques des processus de prise de décision (en notant, cependant, qu'il y a un débat fréquent concernant l'isomorphisme empirique entre les paramètres DDM et les processus7,20, mais voir réf. 21,). La sensibilité, telle qu'elle serait associée à des capacités de perception meilleures ou pires, est généralement associée à la RD. La prudence de réponse ou un "compromis vitesse-précision" est généralement associé à RB. Dans la présente étude, seuls DR et RB ont été modélisés comme changeant avec le temps, le biais et le NDT étant maintenus constants au fil du temps chez les participants. S'il est vrai qu'il a été démontré que les biais et les paramètres de CND changent lorsque les stratégies sont manipulées expérimentalement20,22 et que la variabilité des CND a été réduite au cours de certaines tâches d'apprentissage perceptif23, il existe également des compromis connus dans les méthodes d'estimation conduisant à des résultats inférés. différences de CND lorsque les vraies différences de distribution sont dues à d'autres paramètres, tels que DR et RB14. À la lumière de cela, le biais et le NDT ont été estimés pour chaque participant comme une constante, seuls DR et RB étant considérés comme le temps variant selon une fonction d'apprentissage exponentielle \({\boldsymbol{asymptote}}{\boldsymbol{+}}{\ boldsymbol{(}}{\boldsymbol{start}}{\boldsymbol{-}}{\boldsymbol{asymptote}}{\boldsymbol{)}}{\boldsymbol{* }}{{\boldsymbol{2}}}^ {{\boldsymbol{trialNumber}}{\boldsymbol{/}}{\boldsymbol{rate}}}\) voir Méthodes et Remarque supplémentaire ; 3,5,24.

Compte tenu des liens putatifs entre les paramètres DDM et les composantes psychologiques du processus décisionnel accéléré, on peut s'attendre à ce que ces modèles soient prédominants dans la plupart des sous-domaines de recherche connexes. Toutefois, ce n'est pas necessairement le cas. Par exemple, l'apprentissage perceptif25 est un domaine important pour l'étude de la science fondamentale de la neuroplasticité, en plus d'être impliqué dans de nombreuses applications de réadaptation et professionnelles1,26,27,28,29,30. Dans le domaine de l'apprentissage perceptif, l'écrasante majorité des recherches ont examiné les résultats de choix discrets de la prise de décision perceptive. Ceci en dépit du fait que ne pas tenir compte d'une variable comportementale importante comme RT est inefficace, et peut même être trompeur en raison du potentiel d'estimations biaisées des changements de performance31.

Un petit nombre d'articles ont rapporté des enquêtes sur les analyses DDM de l'apprentissage dans les tâches de prise de décision perceptive. Pourtant, les résultats établissant dans quelle mesure certains paramètres changent à différentes échelles de temps sont particulièrement importants mais restent rares. Dans un exemple précoce dans lequel des singes ont effectué une tâche de discrimination visuelle avec des réponses oculomotrices, les changements de DR se sont révélés être liés à des améliorations des performances liées à l'apprentissage32. Des études sur l'apprentissage perceptif humain ont fourni des preuves similaires concernant les changements liés à l'entraînement dans la RD23,31.

D'autres manipulations de tâches utilisant des cadres DDM ont étudié dans quelle mesure divers types d'instructions affectent les estimations de paramètres au cours de l'apprentissage. Par exemple, lorsqu'il s'agissait de demander explicitement aux apprenants de mettre l'accent sur la vitesse ou la précision dans l'apprentissage perceptif, les effets étaient mieux caractérisés par un modèle DDM qui permettait des variations entre les sessions dans DR, RB et NDT20. Bien que l'END global n'ait pas changé de manière fiable au fil du temps, il y avait des effets principaux de l'apprentissage (en comparant les paramètres au niveau de la session) indiquant des diminutions de RB et des augmentations de DR. Dans une étude à échelle de temps plus courte33, sur 24 blocs courts (d'environ 1 min chacun), le RB des participants avait tendance à converger vers un niveau optimal, selon un calcul du taux de récompense. Ce dernier résultat indique que des changements mesurables rapides peuvent se produire dans RB sur des échelles de temps trop courtes pour être généralement associées à l'apprentissage perceptif, ainsi que trop courtes pour être mesurées lors de l'utilisation de méthodes standard d'agrégation sur de grands blocs pour mesurer l'apprentissage.

Les modèles de diffusion de l'apprentissage ont également été utilisés en conjonction avec d'autres mesures telles que la neuroimagerie fonctionnelle. Dans une de ces études sur l'entraînement à la discrimination de la direction du mouvement des points, des augmentations spécifiques de la DR du stimulus entraîné ont été observées et liées à l'activation de l'IRMf dans le champ oculaire supplémentaire et dans le cortex prémoteur ventral, tandis que des augmentations non spécifiques du RB ont également été observées, et les comparaisons de modèles n'ont pas soutenir les changements liés à la formation dans les CND34. Dans une autre étude, l'entraînement cognitif a entraîné des augmentations de DR et des diminutions de RB, bien que les seules associations entre les changements liés à l'entraînement dans les composants DDM et les mesures neurales aient été un lien entre les changements de RB et ceux de l'activité striatale. Les relations entre les paramètres DDM et le changement neuronal ont donc clairement le potentiel d'être des outils puissants pour les neurosciences cognitives de l'apprentissage, mais le manque relatif de recherche fondamentale sur l'influence de l'expérience sur les paramètres DDM signifie que les tests de telles correspondances restent largement sous-contraints. .

Dans l'ensemble, des enquêtes antérieures sur l'apprentissage perceptif à l'aide de DDM ont montré l'utilité des modèles d'accumulation de preuves pour comprendre les mécanismes de changement se produisant au cours d'un tel apprentissage. Une limitation potentiellement majeure de ces lignes de recherche est qu'elles ont utilisé des méthodes d'analyse qui instancient nécessairement certaines hypothèses implicites sur l'évolution temporelle de la performance et de l'apprentissage. Plus précisément, les évaluations des changements à la fois dans DR et RB ont souvent impliqué la comparaison de paramètres adaptés à des blocs complets ou à des sessions de données. Autrement dit, si une étude impliquait quatre jours d'apprentissage distincts, chaque jour contenant 700 essais, l'approche d'analyse typique impliquerait d'adapter un modèle DDM distinct aux données de chaque participant et de chaque jour - regroupant les 700 essais au cours des jours donnés - puis d'utiliser changements quotidiens dans les estimations des paramètres pour faire des déductions sur l'apprentissage. Ceci est problématique car une telle approche suppose implicitement que tous les essais d'une journée sont les mêmes, ou en d'autres termes qu'il n'y a pas d'apprentissage au cours de chaque journée, et que l'apprentissage ne peut se manifester qu'entre les jours. En tant que tel, on sait peu de choses sur les échelles de temps plus précises auxquelles les changements de paramètres intra-journaliers et inter-journaliers peuvent se produire et sur la manière dont ces changements peuvent interagir.

Les approches basées sur l'agrégation pour les évaluations de l'apprentissage perceptuel, et leurs problèmes associés, ne sont pas uniques aux études qui ont utilisé des modèles de type DDM. Au lieu de cela, les approches basées sur l'agrégation ont été monnaie courante dans la littérature sur l'apprentissage perceptuel (par exemple, ajuster un seuil pour chaque bloc ou session individuel ; utiliser une estimation ponctuelle à partir d'un escalier adaptatif). Des travaux plus récents ont montré qu'en évitant l'agrégation et en modélisant directement la capacité perceptive en fonction de la plus petite unité de temps d'entraînement (c. expérience sur la perception13,37,38,39. Par exemple, différentes formes de généralisation résultant d'un entraînement perceptif ont été dissociées à l'aide de modèles par essais, la généralisation sous forme d'apprendre à apprendre (c'est-à-dire l'amélioration du taux d'apprentissage) étant distinguée des améliorations immédiates de la perception12.

L'une des principales raisons pour lesquelles des modèles d'apprentissage bien calibrés revêtent une importance particulière dans l'étude de l'apprentissage perceptif est que l'identification précise de la forme fonctionnelle que prend l'apprentissage peut permettre des inférences significatives sur les processus sous-jacents, tant au niveau comportemental que mécaniste3,5,6 ,40. Cela est particulièrement vrai dans les cas où l'apprentissage se déroule sur plusieurs jours. Si un changement dépendant de l'expérience se produit à la fois pendant la formation proprement dite et pendant la consolidation entre les sessions, alors les deux caractéristiques de la trajectoire d'apprentissage doivent être incorporées dans le modèle de changement. Alternativement, si seule la quantité globale d'expérience de tâche influence les capacités de perception (par exemple, le nombre d'essais cumulés sur tous les jours), la modélisation des discontinuités entre les jours peut entraîner une complexité inutile du modèle et un surajustement.

Ces questions sont particulièrement pertinentes pour l'apprentissage de la prise de décision perceptive, un processus d'accumulation de preuves, dans lequel les paramètres DDM sous-jacents peuvent changer à différentes échelles de temps. En effet, si les échelles de temps des apprentissages en formation perceptive peuvent être révélatrices, elles sont souvent aussi litigieuses. Alors que certaines expériences d'apprentissage perceptuel n'ont impliqué que quelques centaines d'essais41, d'autres expériences ont écarté des centaines d'essais comme « apprentissage par tâche » et n'ont plutôt considéré que des trajectoires de changement ultérieures (souvent étendues). Cette dernière vision, dans laquelle une trajectoire complète de performance est d'abord dominée par "l'apprentissage par la tâche" et seulement plus tard par "l'apprentissage perceptif", prédirait que les changements de perception devraient être caractérisés par une échelle de temps d'amélioration plus courte puis plus longue. Pourtant, de telles prédictions n'ont pas été systématiquement confirmées dans les analyses des propriétés mathématiques des courbes d'apprentissage perceptif3,24. Néanmoins, d'autres sources de preuves ont indiqué que les processus sous-jacents aux améliorations perceptuelles peuvent changer à différentes échelles de temps. Des études de neuroimagerie ont indiqué, par exemple, que la plasticité initiale dans les zones sensorielles précède les changements à plus grande échelle de la connectivité42. Un phénomène qui est peut-être encore plus frappant est le rôle de la consolidation associée au sommeil pour un apprentissage perceptif réussi43,44,45. Dans un cas extrême, si les changements devaient dépendre entièrement du sommeil, alors les performances au cours de la journée seraient entièrement stationnaires et les courbes d'apprentissage seraient dominées par des discontinuités entre les jours. Une telle proposition est incompatible avec un grand nombre de preuves empiriques3,24,33,39. À l'opposé, des trajectoires d'apprentissage complètement continues et une absence totale de discontinuités entre les séances sembleraient également incompatibles avec les résultats publiés. Comment, alors, les deux schémas de résultats pourraient-ils être résolus ?

L'utilisation de modèles d'accumulation de preuves et de distributions conjointes de RT et de précision offre une grande opportunité dans ce domaine, car ils intègrent plus d'informations que l'une ou l'autre des sources de données seules, et ils le font de manière à conserver l'interprétabilité des paramètres. Les preuves antérieures de processus unitaires de changement3,24 peuvent donc être compatibles avec des preuves de plusieurs échelles de temps de changement ou de discontinuités entre les jours de performance43,45,46, différentes dynamiques étant confirmées dans différentes composantes des paramètres du modèle d'accumulation de preuves. Autrement dit, la discontinuité entre les jours et la continuité entre les jours peuvent être présentes dans les processus impliqués lors de l'apprentissage perceptif, mais ces échelles de temps de changement coexistantes peuvent n'être évidentes que lors de l'utilisation d'analyses des capacités perceptives qui permettent des décompositions de la performance au niveau du processus. sur plusieurs échelles de temps.

Les travaux actuels ont modélisé la performance perceptive des apprenants à l'aide d'un processus de diffusion de Wiener qui pourrait prendre plusieurs formes possibles de changement au fil du temps. Les données ont été utilisées à partir d'une tâche comportementale informatisée précédemment publiée47 qui demandait aux participants de répondre si un champ de points se déplaçait vers la gauche ou vers la droite aussi rapidement et précisément que possible. Au cours de chacun des quatre jours distincts, les participants ont effectué 700 essais de cette tâche (100 essais de chacun des 7 niveaux de cohérence de mouvement, voir Méthodes ; notez que dans les travaux publiés47, seul le dernier jour de formation a été utilisé). Une rétroaction auditive concernant la précision a été fournie pour chaque essai.

Conformément aux travaux examinés ci-dessus, DR et RB étaient d'un intérêt primordial. Quatre dynamiques de changement candidates (en DR, RB ou les deux) ont été prises en compte (voir Fig. 2 pour des exemples). La première possibilité pour chaque paramètre est un processus entièrement stationnaire ou "constant", dans lequel un paramètre ne change pas au cours des quatre jours de formation des participants sur une tâche de discrimination de direction de mouvement de point 2AFC. La deuxième possibilité ("continue") impliquait un changement dans les paramètres en tant que fonction exponentielle continue de l'expérience globale ou du nombre d'essais. La troisième (« réinitialisation du jour ») a permis un changement continu au cours de la journée (en fonction du nombre d'essais au cours de la journée) qui s'est répété pour chaque jour, impliquant une divergence transitoire et constante par rapport à la ligne de base en raison de l'expérience de la tâche au cours de la journée, mais un réinitialisé à cette ligne de base entre les jours. Le quatrième (« flexible ») permettait un changement continu au cours de la journée qui avait également la même vitesse (une constante de temps définissant la forme de la fonction exponentielle), mais des niveaux de départ et asymptotiques indépendants chaque jour, offrant ainsi une grande flexibilité dans capturer à la fois les changements intra-journaliers et inter-journaliers. Les modèles à paramètres constants étaient imbriqués dans tous les autres modèles, la forme de changement à réinitialisation du jour était imbriquée dans le changement flexible, et le changement continu pouvait être bien imité par la forme flexible de changement.

Des effets caractéristiques peuvent être observés (par exemple, la précision [b] augmente avec l'augmentation de DR [c] ou l'augmentation de RB [d] ; RT [a] diminue avec l'augmentation de DR ou la diminution de RB), bien que la force de liens spécifiques puisse varier d'une région à l'autre. niveaux de cohérence des stimuli. Les valeurs présentées ici étaient les valeurs estimées de la distribution postérieure à effet fixe et l'IC à 95 % des modèles rapportés dans les résultats, évalués à la cohérence médiane du stimulus à des fins d'illustration uniquement (voir également la section Note supplémentaire. Sortie récapitulative du modèle le mieux ajusté et tableaux 1–5).

Les différentes formes de changement, et leurs combinaisons, impliquent certains schémas de changement dans les processus sous-jacents à la prise de décision perceptive. Bien que nous nous attendions à ce que le DR augmente avec l'expérience en raison des améliorations de la sensibilité perceptuelle20,32, nos méthodes permettent en outre de déterminer si ce changement est motivé par des disjonctions entre les jours (possibles dans les modèles DR flexibles) ou indépendant de ces disjonctions comme supposé. dans les modèles DR continus. De plus, alors que des modulations à long terme20 et à court terme33 dans RB ont été observées, nous testons explicitement si ces dynamiques font partie des mêmes trajectoires multi-sessions sous-jacentes (RB continu), entraînées principalement par des changements intra-journaliers par rapport aux niveaux de base. (RB à réinitialisation journalière), ou impliquent à la fois des changements intra-journaliers et inter-journaliers (RB flexible).

En considérant que DR et RB pouvaient prendre différentes formes de changement, nous avons donc abouti à 5 modèles dynamiques possibles (qui sont plausibles compte tenu des travaux empiriques et théoriques antérieurs sur l'apprentissage) plus un sixième modèle statique de comparaison. Ces 5 modèles comprenaient [1] un modèle DR continu, RB continu avec une dynamique des deux paramètres pilotée par l'expérience globale cumulée et non influencée par les discontinuités entre les jours, [2] un modèle DR flexible, RB flexible avec des changements dans les deux paramètres variant par les deux les effets intra-journaliers et inter-journaliers, et les modèles correspondants [3] DR continu, RB flexible et [4] flexible DR, RB continu qui permettent des changements dus à l'expérience globale dans les deux modèles mais n'autorisent que des discontinuités ou des idiosyncrasies entre les jours dans un seul paramètre DDM. Une combinaison supplémentaire de [5] DR continu et RB à réinitialisation journalière a été testée pour exclure la possibilité que les performances du modèle DR continu, RB flexible puissent être attribuables à une simple réinitialisation des changements de RB au cours de la journée, sans aucun changement entre les jours. différences de RB.

Nous avons d'abord estimé des modèles avec les combinaisons décrites ci-dessus de changements de paramètres possibles. Nous avons ensuite identifié le modèle qui correspondait le mieux à nos données d'apprentissage perceptuel de discrimination visuelle des points et des mouvements. L'estimation et la comparaison de modèles à effets mixtes non linéaires entièrement bayésiens ont permis d'obtenir un cadre de modélisation robuste et reproductible, compte tenu de notre utilisation de packages statistiques accessibles au public (voir Méthodes). La robustesse supplémentaire apportée par les modèles bayésiens provient de leur quantification inhérente de l'incertitude autour de chaque paramètre estimé, en particulier lorsque les corrélations possibles entre les paramètres ne sont pas connues.

Pour préfacer nos résultats, nous avons constaté que le modèle permettant le changement le plus flexible à la fois de DR et de RB convenait mieux que la plupart des autres, y compris le modèle qui supposait des paramètres inchangés sur toute la durée de l'expérience. Notamment cependant, une simplification de ce modèle le plus flexible a encore amélioré les indices d'ajustement. Le meilleur modèle global incluait des augmentations de DR en tant que fonction exponentielle relativement simple et contrainte du nombre global d'essais, sans discontinuités entre les jours, tandis que pour le RB, des variations flexibles, intra-journalières et inter-journalières ont été modélisées. Des résultats compatibles ont été trouvés lors de l'ajustement de modèles distincts à chaque participant plutôt qu'à tous les participants simultanément. Qu'il s'agisse de comparer les modèles non linéaires à effets mixtes complets ou des modèles non linéaires par participants séparés, plusieurs méthodes de comparaison de modèles ont soutenu l'idée que l'apprentissage perceptif peut être mieux compris comme résultant d'un changement DR continu accompagné de changements flexibles dans RB.

Nous avons d'abord évalué les convergences de tous les modèles, puis comparé les modèles à l'aide de la variation de LOOIC (approximation de la déviance validée croisée avec un congé48) ainsi que des facteurs de Bayes (estimés à l'aide d'un échantillonnage pont ; voir Méthodes). Tous les modèles ont convergé (R-hat à effets fixes maximum < 1,03), le modèle gagnant ayant une taille d'échantillon efficace de queue minimale de 311 et aucune transition divergente. Pour les estimations à effets fixes de tous les modèles, nous renvoyons le lecteur à la note supplémentaire (section Résultats récapitulatifs du modèle le mieux ajusté et tableaux 1 à 5). Nous avons également évalué si l'apprentissage était évident à tous les niveaux de cohérence des stimuli ; les comparaisons agrégées par participant ont indiqué que la RT diminuait de manière fiable pour tous les niveaux de cohérence. Entre-temps, la précision a augmenté numériquement pour tous les niveaux de cohérence, mais elle n'était statistiquement fiable que pour les niveaux de cohérence intermédiaires (voir également les figures supplémentaires 4 et 5).

Nous avons d'abord comparé le modèle le plus complexe (DR flexible RB flexible) au modèle le plus simple (DR constant RB constant), constatant que le modèle permettant une variation flexible des paramètres dans le temps s'ajuste mieux (∆LOOIC = −3650,5). Des comparaisons de modèles ultérieures ont testé si une forme de changement plus parcimonieuse dans laquelle DR et RB étaient des fonctions continues de l'expérience globale pouvait effectivement expliquer l'apprentissage perceptuel observé. Le modèle DR continu, RB continu n'a pas amélioré l'ajustement du modèle par rapport au modèle DR flexible RB flexible (∆LOOIC = 1383,1), pas plus que le modèle DR flexible, RB continu (∆LOOIC = 1434,1). En revanche, un modèle dans lequel DR était une fonction continue du nombre global d'essais tandis que RB changeait de manière flexible a amélioré l'ajustement du modèle par rapport au modèle plus complexe (DR flexible flexible RB) (∆LOOIC = −301,2). Une contrainte différente sur RB, celle d'une fonction continue répétitive du nombre d'essais au cours de la journée (RB continu de réinitialisation du jour DR) ne correspondait pas mieux que le modèle RB flexible DR continu (∆LOOIC = 1931,6 ; voir la figure 3 pour un graphique probabilités relatives de tous les ajustements).

Les LOOIC ont été remis à l'échelle (inverses pour être interprétés comme une probabilité relative) et normalisés au modèle le mieux ajusté, qui est représenté par 0. Cette mise à l'échelle offre une interprétabilité en tant qu'approximation d'un facteur log Bayes, dans la mesure où la LOOIC est analogue à la probabilité prédictive fournie par un critère d'information bayésien (BIC55). Alternativement, les différences supérieures à 4 qui sont également supérieures à plusieurs erreurs types (c'est-à-dire toutes les différences dans cette figure) peuvent être interprétées comme indiquant une amélioration de l'ajustement du modèle d'un modèle à un autre57. Les nombres indiquent un classement général de la complexité du modèle. Les barres d'erreur indiquent l'erreur standard de la densité prédictive LOOIC ponctuelle du modèle croisé.

En utilisant le critère LOOIC, le meilleur modèle comprenait donc un changement continu de DR et un changement flexible de RB. En utilisant les facteurs de Bayes estimés à l'aide d'un échantillonnage en pont par paires de modèles, des résultats de comparaison de modèles très similaires ont été trouvés (voir le tableau 1). Le même modèle (DR global d'essai continu et RB flexible) s'adapte mieux que chacun des autres modèles.

Le modèle le mieux ajusté a bien récupéré à la fois la précision (r = 0,76) et le temps de réponse (r = 0,56 ; voir Méthodes et figures supplémentaires 2 et 3). Ce modèle a indiqué une amélioration (augmentation) du DR en tant que fonction exponentielle du nombre d'essais global tout au long de l'expérience (c'est-à-dire, essais 1 à 2800). Les effets fixes du modèle ont indiqué que la DR augmentait avec la formation (moyenne initiale = 0,44, se = 0,05 ; moyenne asymptote = 0,96, se = 0,11), avec un temps d'apprentissage au niveau de l'échantillon de 1 261 essais. Le DR de chaque participant a été estimé comme croissant (des estimations ponctuelles des participants, changement moyen = 0,516, sd = 0,175, min = 0,209, max = 0,800).

Les paramètres des limites de réponse ont changé moins systématiquement selon les jours et les participants (voir Fig. 4). Alors qu'au niveau du groupe, de légères diminutions semblaient se produire, avec quelques « réinitialisations » entre les jours, l'interprétation de ces effets au niveau du groupe est difficile en raison de la grande quantité de variabilité inter- et intra-individuelle49. Des diminutions du RB au cours de la journée étaient présentes chez la plupart des participants (80,9 %, 61,9 %, 76,2 % et 55,1 % des participants, respectivement sur chacun des quatre jours). Les changements de RB entre les jours diminuaient principalement du jour 1 au jour 2 (95,2 % des participants), mais seule une minorité de participants diminuait de la fin du jour 2 au début du jour 3 ou de la fin du jour 3 au début du jour 4 (28,6 % des participants à chaque transition).

Pour DR [a, b] et RB [c, d], les panneaux de gauche [a, c] montrent les ajustements globaux à tous les participants (voir également Fig. 1). Les panneaux de droite [b, d] montrent des ajustements pour trois exemples de participants (choisis pour illustrer des schémas de changement et d'hétérogénéité). Chaque jour est représenté par un type de ligne différent.

Nous avons ajusté le même ensemble de modèles, sans la structure à effets mixtes, aux données de chaque participant séparément et avons comparé les résultats intra-participants de la même manière. La paramétrisation continue DR flexible RB était le modèle le mieux ajusté chez 19/21 participants utilisant des comparaisons LOOIC et 15/21 participants utilisant des comparaisons Bayes Factor. Il y avait également une correspondance assez élevée entre les estimations ponctuelles des paramètres par participant, lors de la comparaison des modèles adaptés aux participants séparément et le modèle le mieux adapté à tous les participants simultanément (par exemple, constante de temps de changement dans DR Pearson r = 0,77, asymptotique DR r = 0,85). Chacune de ces comparaisons renforce ainsi les résultats des modèles complets à effets mixtes. Voir la note complémentaire pour plus de détails.

Afin de fournir une comparaison avec des approches plus typiques de la recherche sur l'apprentissage perceptif (c'est-à-dire, qui ne considèrent généralement que la précision des participants), nous avons ajusté plusieurs modèles en utilisant des changements continus dans les seuils des fonctions psychométriques logistiques39,50. Ces modèles ont été ajustés uniquement aux données de précision plutôt qu'aux distributions conjointes RT et précision. Les modèles candidats de changement du seuil par essai comprenaient les formulaires continus, à réinitialisation journalière et flexibles décrits dans les analyses primaires, ainsi qu'une combinaison supplémentaire de formulaires continus et à réinitialisation journalière (c'est-à-dire l'ajout d'un décalage de trajectoire de réinitialisation journalière au fonction continue). Le modèle le mieux ajusté était ce dernier, avec un niveau de complexité intermédiaire (LOOIC = 61182,7). Les autres modèles, par ordre décroissant de qualité d'ajustement, étaient flexibles (LOOIC = 61202,6), continus (LOOIC = 61238,6) et à réinitialisation journalière (LOOIC = 61352,3). Ces résultats, comme dans les résultats principaux, ont soutenu un modèle de complexité intermédiaire impliquant deux échelles de temps de changement. Pourtant, contrairement aux modèles DDM, les ajustements logistiques n'ont pas été en mesure de fournir un compte rendu mécaniste de ce qui a changé sur quelle échelle de temps. Bien que l'absence d'améliorations constantes de la précision aux niveaux de cohérence les plus petits et les plus grands signifie que ces résultats sont largement liés aux changements de précision aux niveaux de cohérence intermédiaires pour la plupart des participants (voir Fig. 4 supplémentaire), cette limitation des ajustements de la fonction psychométrique démontre davantage l'utilité de comprendre les distributions conjointes de RT et la précision lors de l'apprentissage (c'est-à-dire en raison des améliorations de RT à tous les niveaux de cohérence ; voir Fig. 5 supplémentaire). Voir la note complémentaire pour plus de détails.

Ici, nous avons utilisé des DDM à effets mixtes non linéaires pour caractériser les changements intra-journaliers et inter-journaliers au cours d'une tâche de prise de décision perceptive. Les changements de DR se sont avérés être mieux modélisés comme une fonction exponentielle du nombre d'essais sur 4 jours de formation différents. En revanche, les changements de RB ont été mieux modélisés par une dynamique hétérogène avec à la fois des changements continus au cours d'une journée et des variations non systématiques entre les jours dans les trajectoires de changement. De tels résultats appuient les conclusions de travaux antérieurs identifiant la RD comme un indice d'apprentissage perceptif chez les singes32 et les humains31,34 tout en ajoutant des spécificités supplémentaires dans l'arbitrage entre les échelles de temps de changement.

Plus largement, ce travail corrobore les ajustements rapides de RB observés dans la prise de décision perceptive33 tout en fournissant une explication unificatrice possible de deux observations apparemment contradictoires dans l'apprentissage perceptif : les améliorations en fonction continue de l'expérience39 et les grandes discontinuités entre les jours43. Le présent travail suggère que chacun de ces phénomènes peut se produire à ses propres échelles de temps. Il est important de noter que les différents processus de médiation de la prise de décision (DR et RB en particulier) évoluent avec des dynamiques plutôt différentes. Des travaux antérieurs ont identifié des rôles cruciaux pour l'activité neuronale inhibitrice entre les séances d'entraînement (en particulier pendant le sommeil) pour augmenter la résistance des améliorations aux interférences rétroactives51, nos résultats fournissant des preuves complémentaires pour de multiples processus. Alors que les améliorations de la sensibilité perceptuelle s'accumulent progressivement avec l'entraînement (par exemple, associées à un DR plus élevé et à des états neuronaux excitateurs et plastiques), une grande partie de la variation comportementale observée peut en fait être le résultat de modulations dans les processus inhibiteurs (par exemple, associée à des critères de décision plus élevés RB et avec des états neuronaux inhibiteurs et stables). Autrement dit, la vitesse à laquelle les processus inhibiteurs peuvent être régulés à la hausse ou à la baisse peut être beaucoup plus rapide que la vitesse à laquelle les processus perceptifs sont modifiables, ce qui entraîne de nombreuses variations de comportement ainsi que des processus importants de consolidation et de résistance aux interférences.

En tant que tel, l'utilisation de données comportementales à choix discrets appauvries pourrait empêcher ou biaiser d'éventuelles inférences concernant les trajectoires d'apprentissage31. Par exemple, des améliorations robustes des performances se sont produites dans la précision pour seulement certains niveaux de cohérence alors que la RT a montré des améliorations plus généralisées. L'intégration de ces deux éléments dans une seule approche basée sur un modèle nous a permis de mieux répartir les sources de variation et d'identifier les changements dans la sensibilité perceptuelle et les processus de décision. En pratique, le présent travail fournit une justification claire de l'utilisation du paramètre DR des modèles de diffusion comme indice d'apprentissage perceptif en fonction de chaque essai d'entraînement. L'interprétabilité de RB est plus complexe en raison de la présence de dynamiques intra-journalières et inter-journalières. Bien que de tels changements soient conformes au RB reflétant des choix adaptatifs lors de la prise de décision, comme être plus ou moins averse au risque, la source d'une telle hétérogénéité d'une journée à l'autre et d'un participant à l'autre reste mal comprise. Des mesures convergentes (par exemple, la neuroimagerie) ou des prédictions formalisées de la performance (par exemple, des niveaux de prudence « optimaux »33) peuvent fournir une clarté future pour les processus de changement se produisant sur cette échelle de temps plus rapide et plus disjointe.

Un élément important du présent travail est qu'il utilise des méthodes quantitatives avancées mais relativement accessibles (voir la note supplémentaire pour le code du modèle le mieux adapté). La disponibilité de plus en plus répandue des méthodes d'estimation DDM dans les progiciels statistiques aide à fournir à un plus grand nombre de chercheurs les outils nécessaires pour effectuer les analyses rapportées ici. Alors que les ressources de calcul nécessaires étaient importantes (au moins plusieurs semaines de temps de calcul pour chaque modèle), cette limitation devrait devenir moins problématique à mesure que les ordinateurs de plus en plus puissants deviennent plus courants. De plus, une fois que les bases ont été établies concernant les paramétrisations de modèles appropriées pour l'apprentissage, ces modèles peuvent être utilisés comme cas de test pour développer et évaluer des méthodes d'ajustement plus efficaces. Nous reconnaissons que les modèles rapportés ici ne représentent qu'une petite partie des modèles possibles de changement dans l'apprentissage perceptif. Pourtant, nous pensons qu'ils sont suffisants pour des inférences nouvelles et informatives, et nous n'avons pas ajusté divers modèles intermédiaires en raison de leur manque probable d'information et des ressources informatiques étendues nécessaires pour estimer les paramètres du modèle.

Comme pour la large applicabilité des DDM aux processus cognitifs et perceptuels, l'approche appliquée ici a des applications bien au-delà de l'apprentissage de la perception visuelle du mouvement. L'utilisation des DDM pour mieux comprendre les mécanismes contribuant aux trajectoires d'apprentissage peut être utile dans l'apprentissage des mots52, l'entraînement cognitif ou d'autres contextes d'apprentissage dans lesquels les informations doivent être traitées rapidement et avec précision.

L'apprentissage perceptif contient de nombreuses promesses translationnelles et agit comme une fenêtre sur les mécanismes de la neuroplasticité chez l'adulte, mais la compréhension de l'apprentissage perceptif repose sur des inférences appropriées à partir de la prise de décision perceptive des apprenants. En utilisant un modèle formel d'accumulation de preuves de la prise de décision perceptive, des propositions apparemment contradictoires concernant les trajectoires d'apprentissage peuvent être expliquées : différentes composantes de l'accumulation de preuves peuvent changer au cours des sessions de formation et entre les jours sur des échelles de temps indépendantes. Ici, nous avons présenté des preuves que la sensibilité perceptive (DR) change en fonction continue du nombre d'essais, tandis que la quantité de preuves nécessaires pour obtenir une décision (RB) change dynamiquement à la fois de manière continue au cours d'une session de formation et de manière non systématique entre les jours.

Les données étaient archivées et seules des analyses de données secondaires ont été effectuées pour cet article ; Les procédures ont été initialement approuvées par le comité d'éthique de l'Université de Rochester et le consentement éclairé a été obtenu de chaque participant. Les données, rapportées à l'origine dans Green, Pouget et Bavelier47, ont été recueillies auprès de 21 jeunes adultes masculins participant à 4 jours consécutifs chacun d'une tâche de discrimination par mouvement de points53,54. Seules les données du dernier jour ont été rapportées dans l'article original. Les participants ont été inclus à l'origine pour appartenir soit à un groupe "joueur de jeux vidéo d'action" (âge moyen = 18,8) soit à un groupe "pas de joueur de jeux vidéo d'action" (âge moyen = 20,6). Un participant a été exclu de l'échantillon initial de 22 en raison d'une distribution de temps de réponse très longue inexpliquée sur une session. Le présent article ne s'intéresse pas principalement aux différences possibles entre les groupes de joueurs, qui ne seront pas abordées, bien que chaque modèle inclue des effets fixes inter-sujets contrôlant les différences potentielles entre les groupes sur chaque paramètre du modèle de diffusion (voir ci-dessous). Ces paramètres à effet fixe devraient atténuer la bimodalité possible dans les paramètres au niveau des participants. Les stimuli ont été présentés sur un moniteur CRT 75 Hz à l'aide de Psychtoolbox (Brainard 1997). Les pourcentages de cohérence gauche ou droite étaient de 0,8 %, 1,6 %, 3,2 %, 6,4 %, 12,8 %, 25,6 % ou 51,2 %, dans un ordre aléatoire.

Pour ajuster les modèles de diffusion de dérive en temps continu par essai, nous avons utilisé le package brms dans R, qui utilise lui-même le cadre de modélisation Stan Bayesian17,18,19. Les modèles étaient, essentiellement, des régressions généralisées non linéaires des distributions conjointes de RT et de précision, les paramètres de diffusion de la dérive de chaque essai étant soit statiques sur tous les essais, soit fonction du nombre d'essais (paramétrés de plusieurs manières différentes ; voir la section suivante). À leur tour, les paramètres DDM de chaque modèle, qu'ils soient inchangés ou liés à des composants spécifiques du changement lié au temps, étaient eux-mêmes la valeur d'ajustement d'un modèle linéaire généralisé à effets mixtes (estimé en parallèle, voir réf. 38). Un tel cadre permettait une estimation simultanée de tous les paramètres pour tous les participants. Un autre avantage crucial de notre approche était que, parce que brms inclut des a priori par défaut pour les modèles linéaires généralisés de diffusion de Wiener, les seuls a priori nécessaires à spécifier manuellement étaient ceux liés aux composants non linéaires des modèles (c'est-à-dire le temps nécessaire pour changer, et un NDT avec un petit décalage additif de 0,001 seconde). Les priors par défaut améliorent l'applicabilité directe de notre implémentation à de nouveaux ensembles de données et augmentent la facilité avec laquelle d'autres peuvent effectuer de telles analyses, tout en se faisant au prix d'une diminution probable de l'efficacité et d'une plus grande difficulté à interpréter nos résultats du facteur Bayes (c'est-à-dire parce que les priors n'étaient pas explicitement adapté à notre ensemble de données ou à nos hypothèses). Pour plus de détails, voir la note complémentaire.

Indépendamment de la combinaison exacte des changements de paramètres mis en œuvre, les changements ont toujours été définis comme un paramètre DDM étant une fonction exponentielle du nombre d'essais (voir Eq. 1). Chaque participant avait l'ensemble de paramètres DDM du modèle estimé pour lui, en utilisant la structure à effets mixtes décrite ci-dessus (c'est-à-dire, les interceptions aléatoires par participant). Dans cette paramétrisation, la constante de temps de changement (vitesse ou vitesse inverse) était indépendante à la fois du début et de l'asymptote d'un paramètre donné. Les différences critiques entre les modèles comparés concernaient l'échelle de temps du changement (c'est-à-dire, si trialNumber était un numéro d'essai sur une journée ou cumulatif sur tous les jours) et, si le nombre d'essais sur une journée était pris en compte, si les paramètres de début et d'asymptote étaient partagés sur tous les jours. ou s'ils étaient autorisés à varier d'une journée à l'autre. Le paramètre de taux était le logarithme binaire d'une constante de temps jusqu'à 50 % du changement. La constante 2 ajoutée au taux a empêché les trajectoires d'indiquer 50 % de changement en moins de 2 essais, ce qui facilite l'identification et l'estimation du modèle. Notez que param peut être DR ou RB.

Les modèles comparés ont commencé par des modèles "constants" dans lesquels les paramètres ne variaient pas dans le temps. Dans cette comparaison, la cohérence était soit linéaire (non transformée), soit logarithmique, puis centrée sur la médiane. Notre comparaison entre ces deux modèles a établi la base empirique de la relation linéaire entre DR et cohérence53. Dans cette comparaison pour déterminer la mise à l'échelle de la force du stimulus par rapport à DR, nous avons constaté que le modèle à paramètre constant avec une cohérence de stimulus transformée en log DR correspondait bien moins bien que le même modèle avec DR en tant que fonction linéaire de cohérence (∆LOOIC = 3781.3). Pour cette raison, toutes les analyses ultérieures ont utilisé une fonction linéaire de cohérence.

Les paramètres ont ensuite été autorisés à varier en fonction continue du nombre d'essais global (continu) ou en fonction continue du nombre d'essais au cours d'une journée avec des démarrages et des asymptotes constants au sein des participants tout au long de la journée (réinitialisation du jour). Le modèle le plus complexe (flexible) permettait un changement intra-journalier avec des démarrages et des asymptotes distincts pour chaque jour ; chaque participant n'avait qu'un seul taux, pour faciliter l'estimation.

Ces formes de changement ont permis des comparaisons de modèles pour arbitrer entre des mécanismes potentiels distincts de changement dépendant de l'expérience. Un mécanisme de changement dû uniquement à l'expérience cumulative de la tâche, ou à la loi de l'effet, profiterait à la forme continue de changement par rapport à la forme flexible de changement en raison de sa plus grande parcimonie (c'est-à-dire un nombre de paramètres plus petit). De même, un mécanisme de changement impliquant une perturbation intra-journalière de la ligne de base de chaque participant et un retour entre les jours à cette ligne de base serait indiqué par la paramétrisation du changement à réinitialisation journalière, qui est également plus parcimonieuse que la forme de changement entièrement flexible. En revanche, si les comparaisons de modèles prennent en charge des trajectoires flexibles pour un paramètre, cela indique que les mécanismes de changement sont susceptibles d'être hétérogènes pour ce paramètre. De nombreux modèles génératifs possibles sont compatibles avec cette forme flexible de changement, et l'application sélective de contraintes (comme le font les modèles continus et à réinitialisation journalière) fournit des tests pour savoir si la complexité du modèle flexible est justifiée ou si les modèles plus parcimonieux et interprétables mécaniquement sont justifié.

Comme décrit dans l'éq. 1, les paramètres ont été définis comme des fonctions exponentielles du temps à 3 paramètres avec des valeurs de départ, des valeurs asymptotiques et une constante de temps de 50 % de changement définissant le taux de changement3,24,37. Le changement continu et le changement de réinitialisation du jour ont estimé chacun un démarrage, un taux et une asymptote pour chaque participant ; les deux formes de changement ne différaient que sur l'échelle de temps de ce changement. Le changement flexible a estimé un taux pour chaque participant sur les quatre jours, plus un début et une asymptote pour chaque jour pour chaque participant. Tous les a priori étaient par défaut dans la mesure du possible, les paramètres de taux ayant des a priori normaux centrés sur 25 % du nombre maximal d'essais (c'est-à-dire 175 pour le changement intrajournalier et 700 pour le changement complet de l'expérience). L'écart-type de ces a priori était de 1, ce qui a conduit la majeure partie de la densité (c'est-à-dire entre +2 et -2 écart-type) à se situer entre l'échelle de temps complète du changement et 1/16e de cette échelle de temps de changement.

Nous rapportons les formules de modèle dans le format commun "Wilkensen", pour plus de clarté et de similitude avec l'implémentation R (exemple : driftRate ~ predictorA + (predictorB | groupingVariable)). Dans cette syntaxe, la variable prédite (ici, le paramètre de diffusion de la dérive) est à gauche d'un tilde. Les prédicteurs sont à droite du tilde. Un 1 indique une valeur d'interception estimée. Les composants des prédicteurs entre parenthèses sont des effets aléatoires, avec des prédicteurs à gauche de la barre verticale et la variable de regroupement à droite de la barre verticale.

Tous les modèles avaient les fonctionnalités partagées suivantes :

Les joueurs de jeux vidéo d'action (AVGP) et les joueurs de jeux vidéo sans action (NVGP) ont été inclus, avec des effets principaux fixes contrôlant les différences intergroupes sur chaque paramètre dans un modèle donné. (Tous les paramètres ont également des coefficients estimés au niveau des participants). Les essais avec des TR inférieurs à 0,16 ou supérieurs à 2,5 ont été exclus. Les composantes évoluant dans le temps ont été estimées sous forme de log binaire (c'est-à-dire en base 2) de la constante de temps à 50 % du changement.

Le taux de dérive a été estimé sans fonction de lien. Le prior a été défini sur le brms par défaut pour le taux de dérive (compte tenu de nos données), student_t(3,1,10). Dans tous les modèles, le taux de dérive a toujours été estimé avec une interception à effet fixe, une interception par sujet et une pente par sujet pour la cohérence médiane centrée (c'est-à-dire que le taux de dérive variait linéairement, par sujet, en fonction de la cohérence du stimulus) . Des modèles ont été testés qui comprenaient soit des pourcentages de cohérence "bruts", soit leurs transformées logarithmiques, afin de tester l'hypothèse selon laquelle la relation entre la cohérence et le taux de dérive serait linéaire. Exemples de formules : taux de dérive fixe : drift_rate ~ 1 + VGPstatus + (coherence || subj), asymptote d'un taux de dérive évoluant dans le temps : drAsym ~ 1 + VGPstatus + (coherence || subj).

La limite de réponse a été estimée sur une échelle logarithmique. Le prior pour tous les modèles a été défini sur le prior brms par défaut pour la limite de réponse (compte tenu de nos données), normal (-0,6, 1,3). Les interceptions par sujet et les interceptions à effets fixes ont été estimées. Exemples de formules : limite de réponse fixe : response_boundary ~ 1 + VGPstatus + (1 || subj), asymptote d'une limite de réponse évoluant dans le temps : rbAsym ~ 1 + VGPstatus + (1 || subj).

Le temps de non-décision a été estimé à l'aide d'une distribution exponentielle avec un décalage de 0,001 et une moyenne de 0,15. Cette approche de décalage a limité l'échantillonnage à des valeurs plausibles et amélioré l'efficacité du modèle. Dans la mesure où tous les modèles utilisent cette approche, aucun biais ne devrait être introduit dans les modèles ou les comparaisons. Les interceptions à effet fixe ainsi que les interceptions par sujet ont été estimées. Exemple de formule : ndt ~ 0,001 + ndtOffset ; ndtOffset ~ 1 + (1 || subj). Le terme de biais a été estimé avec une interception à effet fixe et une interception par sujet (c'est-à-dire, biais ~ 1 + VGPstatus + (1 || subj)). Le biais a été estimé sur une échelle logit et son a priori était normal (0,1).

Compte tenu des formes de changement ci-dessus, nous avons testé des combinaisons de paramètres DR et RB variant dans le temps (voir Introduction). Bien que nous ayons envisagé de tester également des temps de non-décision variant dans le temps, nous avons décidé de ne pas inclure ces modèles dans notre manuscrit actuel en raison de la possibilité probable que des changements empiriques dans les paramètres de temps de non-décision puissent refléter des schémas fallacieux en raison d'un manque de récupération entre temps de non-décision et RB14. La comparaison de modèles primaires a utilisé une approximation efficace de la validation croisée leave-one-out48 (voir également la documentation du package loo R). En utilisant cette méthode, nous rapportons le critère d'information LOO (LOOIC), qui est sur une échelle de déviance (c'est-à-dire que les valeurs inférieures sont meilleures) et est interprétable de la même manière qu'une valeur AIC ou BIC voir, par exemple55,56,. De plus, les valeurs de différence LOOIC des modèles supérieures à 4 sont interprétables en termes de nombre d'erreurs types des différences57.

Une comparaison supplémentaire de modèles a utilisé les facteurs de Bayes estimés à l'aide d'un échantillonnage en pont58. Quinze passages d'échantillonnage en pont ont été effectués à l'aide d'une distribution de proposition normale multivariée déformée, qui est plus robuste que la distribution de proposition normale multivariée standard. Les facteurs de Bayes ont été transformés avec un logarithme de base 3 de sorte que les seuils de sélection de modèles conventionnels (c'est-à-dire 3 fois plus de preuves pour un modèle par rapport à l'autre étant des « preuves substantielles ») coïncident avec les seuils à -1 et +1. Sur les 15 passages d'échantillonnage de pont, nous rapportons le plus équivoque (c'est-à-dire, BFlog3 le plus proche de 0).

L'ajustement absolu du modèle (c'est-à-dire la récupération des données brutes) a été évalué en regroupant les données en blocs de 25 essais (112 blocs au total par participant) et en faisant la moyenne de la RT et de la précision dans chaque bloc pour chaque niveau de cohérence. Les données et les valeurs prédites du modèle le mieux ajusté ont suivi cette procédure. Compte tenu de ces moyennes groupées, les corrélations produit-moment d'ordre zéro entre les données et les prédictions du modèle ont servi à indiquer la récupération du modèle des modèles dans les données brutes. D'autres visualisations peuvent être vues dans les Figs supplémentaires. 2 et 3.

Des comparaisons supplémentaires correspondent à chacun des 6 modèles comparés dans les résultats principaux aux participants séparément, et ont utilisé les facteurs Bayes intra-participants et LOOIC. Les ajustements par participants ont utilisé le même ensemble de modèles (formules et a priori, pertinents pour les participants individuels) que les modèles à effets mixtes adaptés à tous les participants simultanément. De même, les comparaisons ont utilisé des comparaisons LOOIC et des facteurs de Bayes à l'aide d'un échantillonnage par pont. Tous les indices ont indiqué une convergence.

Des comparaisons avec des méthodes plus conventionnelles d'ajustement des données de prise de décision perceptive (c'est-à-dire, en ne considérant que l'exactitude) ont été mises en œuvre à l'aide de fonctions psychométriques logistiques50. Les modèles logistiques ont utilisé une approche plus conforme aux analyses classiques de la psychophysique, c'est-à-dire l'ajustement d'une fonction psychométrique logistique reliant la cohérence à la probabilité qu'un participant réponde que le mouvement était dans une certaine direction. Un taux de déchéance de 1 % a été utilisé. Comme dans les résultats principaux, la performance (ici, le seuil) a été modélisée comme une fonction exponentielle continue du temps, le "temps" correspondant au nombre d'essais intra-session, au nombre d'essais global ou à une combinaison des deux. Les temps de réponse ont été notés z et les pentes aléatoires des temps de réponse par participant ont été estimées pour chacun des paramètres de seuil de départ et asymptotique, comme méthode approximative pour inclure toutes les informations dans les modèles logistiques qui avaient également été inclus dans les modèles DDM.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports de recherche sur la nature lié à cet article.

Toutes les données sont disponibles sur https://doi.org/10.5281/zenodo.7025263.

Le code du modèle est disponible sur demande auprès de l'auteur correspondant.

Deveau, J., Lovcik, G. & Seitz, A. Les bienfaits thérapeutiques de l'apprentissage perceptif. Courant. Tendances Neurol. 7, 39–49 (2013).

PubMed PubMed Central Google Scholar

Mayer, RE À quoi sert la psychologie de l'éducation ? Le cas de la cognition et de l'instruction. Éduc. Psychol. 36, 83–88 (2001).

Article Google Scholar

Dosher, BA & Lu, Z.-L. La forme fonctionnelle des améliorations de performance dans l'apprentissage perceptif : taux d'apprentissage et transfert. Psychol. Sci. 18, 531–539 (2007).

Article PubMed Google Scholar

Gold, JI & Ding, L. Comment les mécanismes de prise de décision perceptive affectent la fonction psychométrique. Programme. Neurobiol. 103, 98–114 (2013).

Article PubMed Google Scholar

Heathcote, A., Brown, S. & Mewhort, DJ La loi de puissance abrogée : le cas d'une loi de pratique exponentielle. Psychone. Taureau. Rév. 7, 185–207 (2000).

Article CAS PubMed Google Scholar

Newell, A. & Rosenbloom, PS Mécanismes d'acquisition de compétences et loi de pratique. in Cognitive skills and their acquisition (ed. Anderson, JR) 1–51 (Lawrence Erlbaum, 1981).

Heathcote, A. & Hayes, B. Diffusion versus accumulation balistique linéaire : différents modèles de temps de réponse avec différentes conclusions sur les mécanismes psychologiques ? Peut. J. Exp. Psychol./Rév. canadienne de. psychologie exp.érimentale 66, 125–136 (2012).

Google Scholar

Pedersen, ML, Frank, MJ & Biele, G. Le modèle de diffusion de dérive comme règle de choix dans l'apprentissage par renforcement. Psychone. Taureau. Rév. 24, 1234-1251 (2017).

Article PubMed PubMed Central Google Scholar

Ratcliff, R. Une théorie de la récupération de la mémoire. Psychol. Rév. 85, 59–108 (1978).

Article Google Scholar

Ratcliff, R. & Tuerlinckx, F. Estimation des paramètres du modèle de diffusion : approches pour traiter les temps de réaction des contaminants et la variabilité des paramètres. Psychone. Taureau. Rév. 9, 438–481 (2002).

Article PubMed PubMed Central Google Scholar

Gallistel, CR L'organisation de l'apprentissage. (MIT Press, 1993).

Kattner, F., Cochrane, A., Cox, CR, Gorman, TE & Green, CS Perceptual Learning Generalization from Sequential Perceptual Training as A Change in Learning Rate. Courant. Biol. 27, 840–846 (2017).

Article CAS PubMed Google Scholar

Zhang, P., Zhao, Y., Dosher, BA et Lu, Z.-L. Évaluer l'évolution détaillée dans le temps du changement de sensibilité perceptive dans l'apprentissage perceptif. J.Vis. 19, 9 (2019).

Article PubMed PubMed Central Google Scholar

Dutilh, G. et al. La qualité de l'inférence des données sur le temps de réponse : une évaluation collaborative en aveugle de la validité des modèles cognitifs. Psychone. Taureau. Rév. 26, 1051–1069 (2019).

Article PubMed Google Scholar

Franck, MJ et al. Prédicteurs IRMf et EEG des paramètres de décision dynamiques lors de l'apprentissage par renforcement humain. J. Neurosci. 35, 485–494 (2015).

Article CAS PubMed PubMed Central Google Scholar

Vandekerckhove, J., Tuerlinckx, F. & Lee, MD Modèles de diffusion hiérarchiques pour les temps de réponse à deux choix. Méthodes psychologiques 16, 44–62 (2011).

Article PubMed Google Scholar

Bürkner, P.-C. brms : un package R pour les modèles multiniveaux bayésiens utilisant Stan. J. Stat. Doux. 80, 1–28 (2017).

Article Google Scholar

L'équipe de développement de Stan. Guide de l'utilisateur et manuel de référence du langage de modélisation Stan. (2022).

L'équipe de développement de Stan. Rstan : l'interface R vers Stan. (2022).

Zhang, J. & Rowe, JB Les mécanismes dissociables du compromis vitesse-précision lors de l'apprentissage de la perception visuelle sont révélés par un modèle hiérarchique de dérive-diffusion. Devant. Neurosci. 8, 69 (2014).

Article PubMed PubMed Central Google Scholar

Shadlen, MN & Kiani, R. Prise de décision comme fenêtre sur la cognition. Neurone 80, 791–806.

Article CAS PubMed Google Scholar

Mulder, MJ, Wagenmakers, E.-J., Ratcliff, R., Boekel, W. & Forstmann, BU Biais dans le cerveau : une analyse du modèle de diffusion de la probabilité antérieure et du gain potentiel. J. Neurosci. 32, 2335-2343 (2012).

Article CAS PubMed PubMed Central Google Scholar

Petrov, AA, Van Horn, NM et Ratcliff, R. Mécanismes d'apprentissage perceptuel dissociables révélés par l'analyse du modèle de diffusion. Psychone. Taureau. Rév. 18, 490–497 (2011).

Article PubMed Google Scholar

Cochrane, A. & Green, CS Évaluation des fonctions sous-jacentes à l'apprentissage à l'aide de modèles par essai et par participant : preuves de deux paradigmes d'apprentissage perceptif visuel. J.Vis. 21, 5 (2021).

Article PubMed PubMed Central Google Scholar

Fahle, M. Apprentissage perceptif : spécificité versus généralisation. Courant. Avis. Neurobiol. 15, 154-160 (2005).

Article CAS PubMed Google Scholar

Ahissar, M., Nahum, M., Nelken, I. & Hochstein, S. Hiérarchies inversées et apprentissage sensoriel. Philos. Trans. R. Soc. B : Biol. Sci. 364, 285-299 (2009).

Article Google Scholar

Johnston, IA et al. Apprentissage perceptif du diagnostic d'appendicite en images radiologiques. J.Vis. 20, 16 (2020).

Article PubMed PubMed Central Google Scholar

Kellman, PJ & Garrigan, P. Apprentissage perceptuel et expertise humaine. Phys. Life Rev. 6, 53–84 (2009).

Article PubMed Google Scholar

Lu, Z.-L., Lin, Z. & Dosher, BA Traduire l'apprentissage perceptif du laboratoire en applications. Tendances Conn. Sci. 20, 561-563 (2016).

Article PubMed PubMed Central Google Scholar

Polat, U., Ma-Naim, T., Belkin, M. & Sagi, D. Améliorer la vision dans l'amblyopie adulte par l'apprentissage perceptuel. Proc. Natl Acad. Sci. États-Unis 101, 6692–6697 (2004).

Article CAS PubMed PubMed Central Google Scholar

Liu, CC & Watanabe, T. Prise en compte du compromis vitesse-précision dans l'apprentissage perceptif. Vis. Rés. 61, 107-114 (2012).

Article PubMed Google Scholar

Eckhoff, P., Holmes, P., Law, C., Connolly, PM & Gold, JI Sur les processus de diffusion avec des taux de dérive variables comme modèles pour la prise de décision pendant l'apprentissage. NJ Phys. 10, nihpa49499 (2008).

Article CAS Google Scholar

Evans, NJ & Brown, SD Les gens adoptent des politiques optimales dans une prise de décision simple, après pratique et conseils. Psychone. Taureau. Rév. 24, 597–606 (2017).

Article PubMed Google Scholar

Jia, K. et al. L'apprentissage perceptif visuel module le réseau de décision dans le cerveau humain : les preuves de la psychophysique, de la modélisation et de l'imagerie par résonance magnétique fonctionnelle. J.Vis. 18, 9 (2018).

Article PubMed Google Scholar

Schmiedek, L. & Lindenberger Cent jours d'entraînement cognitif améliorent les capacités cognitives générales à l'âge adulte : résultats de l'étude COGITO. Devant. Neurosciences vieillissantes. https://doi.org/10.3389/fnagi.2010.00027 (2010).

Article PubMed PubMed Central Google Scholar

Kühn, S. et al. Les zones cérébrales sont systématiquement liées aux différences individuelles dans la prise de décision perceptive chez les adultes plus jeunes et plus âgés avant et après l'entraînement. J. Cogni. Neurosci. 23, 2147-2158 (2011).

Article PubMed Google Scholar

Cochrane, A. TEfits : régression non linéaire pour les indices évoluant dans le temps. J. Logiciel Open Source. 5, 2535 (2020).

Article Google Scholar

Cochrane, A. & Green, CS Les trajectoires de changement de performance indiquent de multiples liens dissociables entre la mémoire de travail et l'intelligence fluide. npj Sci. Apprendre. 6, 33 (2021).

Article PubMed PubMed Central Google Scholar

Kattner, F., Cochrane, A. & Green, CS Fonctions psychométriques dépendantes des essais représentant l'apprentissage perceptif dans les tâches de discrimination 2-AFC. J.Vis. 17, 3 (2017).

Article PubMed Google Scholar

Newell, KM, Mayer-Kress, G., Hong, SL et Liu, Y.-T. Adaptation et apprentissage : échelles de temps caractéristiques de la dynamique de la performance. Hum. Dév. Sci. 28, 655–687 (2009).

Article PubMed Google Scholar

Poggio, T., Fahle, M. & Edelman, S. Apprentissage perceptif rapide dans l'hyperacuité visuelle. Sciences 256, 1018-1021 (1992).

Article CAS PubMed Google Scholar

Kang, D.-W. et coll. La connectivité structurelle et fonctionnelle change au-delà du cortex visuel dans une phase ultérieure de l'apprentissage perceptif visuel. Sci. Rep. 8, 5186 (2018).

Article PubMed PubMed Central Google Scholar

Karni, A. & Sagi, D. Le cours du temps d'apprentissage d'une compétence visuelle. Nature 365, 250–252 (1993).

Article CAS PubMed Google Scholar

Mednick, SC, Cai, DJ, Kanady, J. & Drummond, SPA Comparaison des avantages de la caféine, des siestes et du placebo sur la mémoire verbale, motrice et perceptive. Comportement Cerveau Res. 193, 79–86 (2008).

Article CAS PubMed PubMed Central Google Scholar

Tamaki, M. et al. La récompense ne facilite pas l'apprentissage de la perception visuelle jusqu'à ce que le sommeil se produise. Proc. Natl Acad. Sci. États-Unis 117, 959–968 (2020).

Article CAS PubMed Google Scholar

Yotsumoto, Y., Watanabe, T. & Sasaki, Y. Différentes dynamiques de performance et d'activation cérébrale au cours du temps de l'apprentissage perceptif. Neurone 57, 827–833 (2008).

Article CAS PubMed PubMed Central Google Scholar

Green, CS, Pouget, A. & Bavelier, D. Amélioration de l'inférence probabiliste en tant que mécanisme d'apprentissage général avec les jeux vidéo d'action. Courant. Biol. 20, 1573-1579 (2010).

Article CAS PubMed PubMed Central Google Scholar

Vehtari, A., Gelman, A. & Gabry, J. Évaluation pratique du modèle bayésien à l'aide de la validation croisée sans un seul et du WAIC. Statistique Comput 27, 1413-1432 (2017).

Article Google Scholar

Brown, S. & Heathcote, A. Moyenne des courbes d'apprentissage entre et au sein des participants. Comportement Res Methods Instrum. Comput 35, 11–21 (2003).

Article PubMed Google Scholar

Dale, G., Cochrane, A. & Green, CS Prédicteurs de différences individuelles de l'apprentissage et de la généralisation dans l'apprentissage perceptif. Attent. Percevoir. Psychophyse. https://doi.org/10.3758/s13414-021-02268-3 (2021).

Article PubMed Google Scholar

Tamaki, M. et al. Contributions complémentaires du sommeil non-REM et REM à l'apprentissage visuel. Nat. Neurosci. 23, 1150–1156 (2020).

Article CAS PubMed PubMed Central Google Scholar

Dutilh, G., Vandekerckhove, J., Tuerlinckx, F. & Wagenmakers, E.-J. Une décomposition du modèle de diffusion de l'effet de pratique. Psychone. Taureau. Rév. 16, 1026-1036 (2009).

Article PubMed Google Scholar

Palmer, J., Huk, AC & Shadlen, MN L'effet de la force du stimulus sur la vitesse et la précision d'une décision perceptive. J.Vis. 5, 376–404 (2005).

Article PubMed Google Scholar

Watamaniuk, SNJ & Sekuler, R. Intégration temporelle et spatiale dans les stimuli dynamiques à points aléatoires. Vis. Rés. 32, 2341-2347 (1992).

Article CAS PubMed Google Scholar

Wagenmakers, E.-J. Une solution pratique aux problèmes omniprésents des valeurs de p. Psychone. Taureau. Rév. 14, 779–804 (2007).

Article PubMed Google Scholar

Wagenmakers, E.-J. & Farrell, S. Sélection du modèle AIC à l'aide des poids d'Akaike. Psychone. Taureau. Rév. 11, 192–196 (2004).

Article PubMed Google Scholar

Sivula, T., Magnusson, M., Matamoros, AA et Vehtari, A. Incertitude dans la comparaison de modèles basés sur la validation croisée bayésienne Leave-One-Out. Préimpression sur http://arxiv.org/abs/2008.10296 (2022).

Gronau, QF, Singmann, H. & Wagenmakers, E.-J. bridgesampling : un package R pour l'estimation des constantes de normalisation. J. Stat. Doux. 92, 1–29 (2020).

Article Google Scholar

Télécharger les références

Ce travail a été soutenu en partie par l'Office of Naval Research N00014-20-1-2074 à DB et en partie par l'Office of Naval Research Grant N00014-17-1-2049 au CSG Les sources de financement n'avaient aucune implication directe dans la conception de l'étude, la collecte de données , analyse, préparation de manuscrit ou toute autre implication directe dans cette recherche.

Université de Genève, Genève, Suisse

Aaron Cochrane & Daphné Bavelier

Campus Biotech, Genève, Suisse

Aaron Cochrane & Daphné Bavelier

Université Brown, Providence, RI, États-Unis

Aaron Cochrane

Rensselaer Polytechnic Institute, Troy, NY, États-Unis

Chris R.Sims

Hamilton College, Clinton, NY, États-Unis

Vikranth R. Bejjanki

Université du Wisconsin—Madison, Madison, WI, États-Unis

C. Shawn Green

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

AC a effectué des analyses de données et la préparation de manuscrits. CSG et DB ont conseillé l'analyse des données et la préparation du manuscrit. CS et VRB ont effectué des analyses de données préliminaires et ont commenté le manuscrit préparé. Tous les auteurs ont approuvé le manuscrit final.

Correspondance avec Aaron Cochrane.

Les auteurs ne déclarent aucun intérêt financier concurrent mais les intérêts non financiers concurrents suivants : DB est un membre fondateur d'Akili Interactive, Boston.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International License, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, tant que vous donnez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Cochrane, A., Sims, CR, Bejjanki, VR et al. Plusieurs échelles de temps d'apprentissage indiquées par des changements dans les processus d'accumulation de preuves au cours de la prise de décision perceptive. npj Sci. Apprendre. 8, 19 (2023). https://doi.org/10.1038/s41539-023-00168-9

Télécharger la citation

Reçu : 12 septembre 2022

Accepté : 15 mai 2023

Publié: 08 juin 2023

DOI : https://doi.org/10.1038/s41539-023-00168-9

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt