Catalogo dei prodotti della ricerca

Bandit algorithms such as Thompson sampling (TS) have been put forth for decades as useful tools for conducting adaptively-randomised experiments. By skewing the allocation toward superior arms, they can substantially improve particular outcomes of interest for both participants and investigators. For example, they may use participants’ ratings for continuously optimising their experience with a program. However, most of the bandit and TS variants are based on either binary or continuous outcome models, leading to suboptimal performances in rating scale data. Guided by behavioural experiments we conducted online, we address this problem by introducing Multinomial-TS for rating scales. After assessing its improved empirical performance in unique optimal arm scenarios, we explore potential considerations (including prior’s role) for calibrating uncertainty and balancing arm allocation in scenarios with no unique optimal arms.

Multinomial Thompson sampling for rating scales and prior considerations for calibrating uncertainty / Deliu, N.. - In: STATISTICAL METHODS & APPLICATIONS. - ISSN 1618-2510. - 33:2(2024), pp. 439-469. [10.1007/s10260-023-00732-y]

Multinomial Thompson sampling for rating scales and prior considerations for calibrating uncertainty

Nina Deliu

2024

Abstract

Bandit algorithms such as Thompson sampling (TS) have been put forth for decades as useful tools for conducting adaptively-randomised experiments. By skewing the allocation toward superior arms, they can substantially improve particular outcomes of interest for both participants and investigators. For example, they may use participants’ ratings for continuously optimising their experience with a program. However, most of the bandit and TS variants are based on either binary or continuous outcome models, leading to suboptimal performances in rating scale data. Guided by behavioural experiments we conducted online, we address this problem by introducing Multinomial-TS for rating scales. After assessing its improved empirical performance in unique optimal arm scenarios, we explore potential considerations (including prior’s role) for calibrating uncertainty and balancing arm allocation in scenarios with no unique optimal arms.

Scheda breve

Scheda completa

	Anno di pubblicazione
	
				2024
			
	Parole chiave
	
				Adaptive experiments; Thompson sampling; Multi-armed bandits; Rating scales; Multinomial model; Dirichlet distribution; Incomplete learning
			
	Tipologia
	
				01 Pubblicazione su rivista::01a Articolo in rivista
			
	Citazione
	
				Multinomial Thompson sampling for rating scales and prior considerations for calibrating uncertainty / Deliu, N.. - In: STATISTICAL METHODS & APPLICATIONS. - ISSN 1618-2510. - 33:2(2024), pp. 439-469. [10.1007/s10260-023-00732-y]
			
	Appartiene alla tipologia:
	
				01a Articolo in rivista

File allegati a questo prodotto

File	Dimensione	Formato
Deliu_Multinomial-Thompson_2024.pdf accesso aperto Tipologia: Versione editoriale (versione pubblicata con il layout dell'editore) Licenza: Tutti i diritti riservati (All rights reserved) Dimensione 3.3 MB Formato Adobe PDF	3.3 MB	Adobe PDF

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11573/1693336

Citazioni

ND

ND

4

social impact