Yingbin Liang

1 indexed paper

Recent (6 mo)

With code

Influential cites

Benchmarked

Publications per year

Top categories

ML×1AI×1Optimization and Control×1Stats ML×1

Frequent co-authors

Tong Yang1×

Yu Huang1×

Yuejie Chi1×

Research Timeline

2026

Agentic Transformers Provably Learn to Search via Reinforcement Learning

This paper demonstrates that transformer-based policies can provably learn complex tree search mechanisms, such as depth-first search, purely through reinforcement learning in a stochastic environment.

Highlighted terms show continued research focus across papers

Papers

cs.LGcs.AImath.OCRecentMay 29, 2026

Agentic Transformers Provably Learn to Search via Reinforcement Learning

Tong Yang, Yu Huang, Yingbin Liang, Yuejie Chi

View →