Simin Chen

Postdoctoral Researcher at Columbia University

Computer Science Department at Columbia University

Biography

I am a postdoctoral researcher in the Computer Science Department at Columbia University, working with Prof.Baishakhi Ray on research related to large language models for code (LLM4Code). I earned my Ph.D. from the University of Texas at Dallas (UTD), and I was fortunate to be advised by Prof.Wei Yang and Prof.Cong Liu. Before joining UTD, I received my master degree from Tongji University in May 2018. My research interest lies in machine learning, computer security, and program analysis.

Download my resumé.

Interests

Machine Learning
Computer Security
Software Engineering

Education

Ph.D., 2019 - 2024

The University of Texas at Dallas
Master, 2015 - 2018

Tongji University
Bachelor, 2011 - 2015

Tongji University

News

October 2024 -- Serve as a reviewer of CVPR 2025.

August 2025 -- Serve as a reviewer for ICLR 2025.

July 2024 -- Serve as a program committee on the 39th IEEE/ACM International Conference on Automated Software Engineering (ASE 2024).

June 2024 -- Serve as a Program Committee for AAAI 2025.

April 2024 -- One paper is accepted to ESEC/FSE 2024 after major revision.

See all posts

Publications

Simin Chen, Jinjun Peng, Yixin He, Junfeng Yang, Baishakhi Ray (2025). Your Compiler is Backdooring Your Model: Understanding and Exploiting Compilation Inconsistency Vulnerabilities in Deep Learning Compilers. In S&P 2026.

PDF Code

Simin Chen, Pranav Pusarla, Baishakhi Ray (2025). DyCodeEval: Dynamic Benchmarking of Reasoning Capabilities in Code Large Language Models Under Data Contamination. In ICML 2025.

PDF Code Dataset Project

Ravishka Rathnasuriya, Tingxi Li, Zexin Xu, Zihe Song, Mirazul Haque, Simin Chen, Wei Yang (2025). SOK: Efficiency Robustness of Dynamic Deep Learning Systems. In USENIX Security 2025.

Jiaqi Wu, Simin Chen, Jing Tang, Yuzhe Yang, Yiming Chen, Lixu Wang, Song Lin, Zehua Wang, Wei Chen, Zijian Tian (2025). FDPT: Federated Discrete Prompt Tuning for Black-Box Visual-Language Models. In ICCV 2025.

Dezhi Ran, Yuan Cao, Yuzhe Guo, Yuetong Li, Mengzhou Wu, Simin Chen, Wei Yang, Tao Xie (2025). Medusa: A Framework for Collaborative Development of Foundation Models with Automated Parameter Ownership Assignment. In FSE 2025.

Simin Chen, Zexin Li, Wei Yang, Cong Liu (2024). DeciX: Explain Deep Learning Based Code Generation Applications. In ESEC/FSE 2024.

Simin Chen, Xiaoning Feng, Xiaohong Han, Cong Liu, Wei Yang (2024). PPM: Automated Generation of Diverse Programming Problems for Benchmarking Code Generation Models. In ESEC/FSE 2024.

PDF Code

Yiming Chen, Simin Chen, Zexin Li, Wei Yang, Cong Liu, Robby Tan, Haizhou Li (2023). Dynamic Transformer Provide a False Sense of Efficiency. In ACL 2023.

Simin Chen, Hanlin Chen, Mirazul Haque, Cong Liu, Wei Yang (2023). The Dark Side of Dynamic Routing Neural Networks: Towards Efficiency Backdoor Injection. In CVPR 2023.

Zexin Li, Bangjie Yin, Taiping Yao, Junfeng Guo, Shouhong Ding, Simin Chen, Cong Liu (2023). Sibling-Attack: Rethinking Transferable Adversarial Attacks against Face Recognition. In CVPR 2023.

Simin Chen, Shiyi Wei, Cong Liu, Wei Yang (2023). DyCL: Dynamic Neural Network Compilation Via Program Rewriting and Graph Optimization. In ISSTA 2023.

Simin Chen, Mirazul Haque, Cong Liu, Wei Yang (2022). DeepPerform: An Efficient Approach for Performance Testing of Resource-Constrained Neural Networks. In ASE 2022.

PDF Code

Simin Chen, Cong Liu, Mirazul Haque, Zihe Song, Wei Yang (2022). NMTSloth: Understanding and Testing Efficiency Degradation of Neural Machine Translation Systems. In ESEC/FSE 2022.

PDF Code

Simin Chen, Hamed Khanpour, Cong Liu, Wei Yang (2022). Learning to Reverse DNNs from AI Programs Automatically. In IJCAI 2022.

PDF

Simin Chen, Zihe Song, Mirazul Haque, Cong Liu, Wei Yang (2022). NICGSlowDown: Evaluating the Efficiency Robustness of Neural Caption Generation Models. In CVPR 2022.

PDF Code

Simin Chen, Soroush Bateni, Sampath Grandhi, Xiaodi Li, Cong Liu, Wei Yang (2020). DENAS: automated rule generation by knowledge extraction from neural networks. In ESEC/FSE 2020.

PDF Code DOI

Experience

Research Assistant

Amazon Web Service

May 2023 – Aug 2023 Arlington Area, VA

Applying large language model for Cedar authorization policy language.

Research Assistant

Microsoft Research

May 2021 – Jul 2020 Seattle

Evaluate the model leakage risk of on-device DNNs.

Research Assistant

NEC Laboratories America

Jan 2020 – May 2020 New Jersey

Apply ML techniques for program analysis.

Services

Program Committee Member -- NeurIPS 2025, ICML 2025, ICCV 2025, ACL 2025, ASE 2024, CVPR 2024, AAAI 2024, ICA3PP 2023, ICCV 2023, MSR 2023, CVPR 2023, AAAI 2023, WACV 2022, ECCV 2022

Sub-Reviewer -- ISSRE 2023, ASE 2023, ICSE 2023, ICST 2023, ASE 2022, ICST 2022, ICSE 2021

Contact

sxc180080@utdallas.edu