LR training的时候,改变weight 的update的方式,然后Thompson sampling, UCB用来解决EE问题感觉相当不可控啊,并且simulation搭建起来好麻烦,有在展示广告中用过的吗?