Yong Man Ro

1 indexed paper

Recent (6 mo)

With code

Influential cites

Benchmarked

Publications per year

Top categories

AI×1Vision×1Audio and Speech Processing×1

Frequent co-authors

Jeong Hun Yeo1×

Chae Won Kim1×

Hyeongseop Rha1×

Research Timeline

2026

Diffusion Large Language Models for Visual Speech Recognition

The paper proposes DLLM-VSR, a novel Diffusion Large Language Model framework for Visual Speech Recognition, achieving state-of-the-art performance by treating transcription as iterative masked denoising with flexible-order decoding.

Highlighted terms show continued research focus across papers

Papers

cs.AIcs.CVeess.ASRecentMay 27, 2026

Diffusion Large Language Models for Visual Speech Recognition

Jeong Hun Yeo, Chae Won Kim, Hyeongseop Rha, Yong Man Ro

View →