读研信息

我和张泉老师共同组建了一个研究小组,每年招收若干研究生,也欢迎本科生加入课题组参与科研实践。我们的研究包括但不限于以下几个方面:

· 如何提升含 AI 模型系统的安全性与可靠性?

对于一个包含确定代码符号逻辑和不确定统计模型的系统,从硬件,到Infra,到模型,再到应用,任意一层出现问题都可能导致非预期的结果。针对特定场景下的 AI 系统,如何对潜在攻击面(安全性)或非预期行为(可靠性)进行分析、测试、限制?

安全性和可靠性很难由单一机制完全保障,但我们可以从不同侧面降低风险,我们探索过以下工作:

  • AI Infra 层:PolyJuice [OOPSLA’24], DeepConstr [ISSTA’24]
  • AI 模型层:InDe-LLM [FSE’26], LURE [TIFS’26],Advdoor [ISSTA’21]
  • AI 应用层:GrantBox [FSE’26-IVR], Retrieval Poisoning [ASE’24, FSE’24-IVR]

· 如何提升 LLM 生成代码的正确性?

随着 Vibe Coding 逐渐普及,程序员渐渐不需要关注代码细节。而代码不断膨胀,如何保障 LLM 生成的代码质量?

我们永远无法给出一个“保障”,但我们可以从不同侧面提升代码质量,我们探索过以下工作:

  • 通用场景测试:LSPRAG [ICSE’26, FSE’25-Industry], Data Coverage [USENIX Security’24], PATA [S&P’22]
  • 特定场景测试:Linux Package Incompatibilities [ASE’25], Browser vulnerabilities [FSE’22, OOPSLA’23, ICSE’25]
  • 特定场景代码生成:ongoing
  • 需求断言:ongoing

“One can never guarantee that a proof is correct, the best one can say, is: ‘I have not discovered any mistakes’.” - Edsger Dijkstra

· 其它

我们也探索过一些其它的研究方向,比如:系统防护 [OSDI’26, NDSS’24, OOPSLA’23], 勒索病毒防护 [FSE’25, ICSE’24, S&P’23], 特定场景的编译与运行优化 [PLDI’22, ATC’21, ASE’20] 等等。如果你有其它感兴趣的研究方向,也欢迎随时和我们探讨。

· 我们希望学生能够:

  • 有自驱力,有兴趣学习和探索新知识
  • 具备基本计算机基础,能理解并解决工程实践中遇到的问题
  • 非必须的加分项:
    • 编写过复杂的软件系统或对开源项目有过贡献
    • 参加过CTF、ICPC等能体现解决问题能力的竞赛
    • 参与过一些研究项目

欢迎来自不同学历背景、不同经历的同学加入,一起做有趣且有影响的研究。