读研信息
我和张泉老师共同组建了一个研究小组,每年招收若干研究生,也欢迎本科生加入课题组参与科研实践。我们的研究包括但不限于以下几个方面:
· 如何提升含 AI 模型系统的安全性与可靠性?
对于一个包含确定代码符号逻辑和不确定统计模型的系统,从硬件,到Infra,到模型,再到应用,任意一层出现问题都可能导致非预期的结果。针对特定场景下的 AI 系统,如何对潜在攻击面(安全性)或非预期行为(可靠性)进行分析、测试、限制?
安全性和可靠性很难由单一机制完全保障,但我们可以从不同侧面降低风险,我们探索过以下工作:
- AI Infra 层:PolyJuice [OOPSLA’24], DeepConstr [ISSTA’24]
- AI 模型层:InDe-LLM [FSE’26], LURE [TIFS’26],Advdoor [ISSTA’21]
- AI 应用层:GrantBox [FSE’26-IVR], Retrieval Poisoning [ASE’24, FSE’24-IVR]
· 如何提升 LLM 生成代码的正确性?
随着 Vibe Coding 逐渐普及,程序员渐渐不需要关注代码细节。而代码不断膨胀,如何保障 LLM 生成的代码质量?
我们永远无法给出一个“保障”,但我们可以从不同侧面提升代码质量,我们探索过以下工作:
- 通用场景测试:LSPRAG [ICSE’26, FSE’25-Industry], Data Coverage [USENIX Security’24], PATA [S&P’22]
- 特定场景测试:Linux Package Incompatibilities [ASE’25], Browser vulnerabilities [FSE’22, OOPSLA’23, ICSE’25]
- 特定场景代码生成:ongoing
- 需求断言:ongoing
“One can never guarantee that a proof is correct, the best one can say, is: ‘I have not discovered any mistakes’.” - Edsger Dijkstra
· 其它
我们也探索过一些其它的研究方向,比如:系统防护 [OSDI’26, NDSS’24, OOPSLA’23], 勒索病毒防护 [FSE’25, ICSE’24, S&P’23], 特定场景的编译与运行优化 [PLDI’22, ATC’21, ASE’20] 等等。如果你有其它感兴趣的研究方向,也欢迎随时和我们探讨。
· 我们希望学生能够:
- 有自驱力,有兴趣学习和探索新知识
- 具备基本计算机基础,能理解并解决工程实践中遇到的问题
- 非必须的加分项:
- 编写过复杂的软件系统或对开源项目有过贡献
- 参加过CTF、ICPC等能体现解决问题能力的竞赛
- 参与过一些研究项目
欢迎来自不同学历背景、不同经历的同学加入,一起做有趣且有影响的研究。