Publications

2 results for Xiangyu Qi

Defensive Prompt Patch: A Robust and Generalizable Defense of Large Language Models against Jailbreak Attacks
- - Chen Xiong
  - Xiangyu Qi
  - et al.
- 2025
- ACL 2025
Fine-tuning Aligned Language Models Compromises Safety, Even When Users Do Not Intend To!
- - Xiangyu Qi
  - Yi Zeng
  - et al.
- 2024
- ICLR 2024