Guoxin Lu

1 indexed paper

Recent (6 mo)

With code

Influential cites

Benchmarked

Publications per year

Top categories

Crypto×1AI×1NLP×1

Frequent co-authors

Letian Sha1×

Qing Wang1×

Peijie Sun1×

Hao Zhou1×

Hua Dai1×

Fu Xiao1×

Research Timeline

2026

Safety Anchor: Defending Harmful Fine-tuning via Geometric Bottlenecks

The paper introduces Safety Bottleneck Regularization (SBR), a novel defense mechanism that anchors LLM safety by constraining the unembedding layer, effectively preventing harmful fine-tuning (HFT) even when other defenses fail.

Highlighted terms show continued research focus across papers

Papers

cs.CRcs.AIcs.CLRecentMay 7, 2026

Safety Anchor: Defending Harmful Fine-tuning via Geometric Bottlenecks

Guoxin Lu, Letian Sha, Qing Wang, Peijie Sun +3 more

View →