🎓 关于我

我是江南大学(211 工程·双一流)人工智能与计算机学院数字媒体技术专业本科生, 研究方向聚焦 AI for Science——尤其是 生物序列建模单细胞基础模型蛋白/多肽设计大语言模型推理

迄今投稿 七篇 学术论文(六篇一作 / 共一,五作一篇;六篇已录用), 覆盖 NeurIPSICMLPRCVICIC 等会议; 申请 发明专利一项; 带队斩获 iGEM 2025 国际金奖(干实验负责人,巴黎线下答辩)。

欢迎科研合作与机会推荐(科研助理 / 暑期实习 / 研究生申请),尤其是 AI for 生命科学方向。

🌟 研究理念

生命以序列书写,而 AI 正在学习倾听。我的研究由两条互补的主线驱动:

  • 读懂生物序列。 以信息论与可解释性视角,设计面向蛋白质、多肽、单细胞转录组及更广生物语言的基础模型。
  • 面向科学的推理机器。 以大语言模型 Agent 为核心,融合符号推理与深度表示学习,解决具体的科学设计问题。

"我们必须知道,我们必将知道。" — 大卫·希尔伯特

📰 近期动态

  • 2026 RA-Det(五作)被 ICML 2026(CCF-A 国际顶会)接收。NEW
  • 2026 Tokenization is Mechanism 投稿 NeurIPS 2026(CCF-A),第一作者。
  • 2026 四篇一作论文同获 ICIC 2026 Oral:ProtoGene、Extract-Then-Compile、Alignment-Adaptive Fusion、FWMamba-UNet。
  • 2025-11 iGEM 2025 国际金奖,巴黎线下答辩,担任干实验负责人。
  • 2025 MambaGuard(共一)被 PRCV 2025(CCF-C)接收。
  • 2025 申请发明专利《一种基于神经符号融合的语言驱动旅行规划方法及装置》。
  • 2025 无锡市优秀学生干部 称号。

🏫 教育经历

江南大学  (211 工程 · 双一流)

人工智能与计算机学院 · 数字媒体技术 · 本科

2023.09 — 2027.06  |  绩点 88 / 100

校级荣誉:江南大学荣誉至善生一等综合奖学金校级优秀学生干部; 市级荣誉:无锡市优秀学生干部

📄 学术论文

1 表示第一作者 · * 表示共同第一作者

1
Tokenization is Mechanism: Information-Asymmetric Token Merging for Biological Sequences
Zihao Guo1, et al.
NeurIPS 2026 · CCF-A 投稿中 第一作者

肽段-MHC 结合预测 · 信息论 Token Merging · 可解释机制 · 跨域生物序列建模(pMHC / TCR / DNA / SMILES)。

2
ProtoGene: Bridging the RT-Gap in Single-Cell Foundation Models via Biology-Aware Prototypical Fine-Tuning
Zihao Guo1, et al.
ICIC 2026 · CCF-C · Oral 已录用 第一作者

单细胞基础模型 · 基因预训练模型微调 · 原型对比学习 · 模型泛化性。

3
Extract Then Compile: Reliable Neuro-Symbolic Planning for Large Language Models
Zihao Guo1, et al.
ICIC 2026 · CCF-C · Oral 已录用 第一作者

大语言模型 · Agent · 神经符号方法 · 约束满足规划求解。

4
Fusion Direction Matters: Alignment-Adaptive Cross-Modal Fusion for Medical Image Segmentation
Zihao Guo1, et al.
ICIC 2026 · CCF-C · Oral 已录用 第一作者

计算机视觉 · 医学图像分割 · 视觉-语言模型 · 多模态融合。

5
FWMamba-UNet: Frequency-Wavelet Enhanced Mamba UNet for Medical Image Segmentation
Zihao Guo1, et al.
ICIC 2026 · CCF-C · Oral 已录用 第一作者

计算机视觉 · 医学图像分割 · Mamba 状态空间模型 · 小波变换。

6
MambaGuard: A CLIP-Mamba Approach for OOD Generated Image Detection
Xinchang Wang*, Yuechen Zhang*, Zihao Guo*, et al.
PRCV 2025 · CCF-C 已录用 共同一作

生成图像检测 · 视觉-语言模型 · Mamba。

7
RA-Det: Towards Universal Detection of AI-Generated Images via Robustness Asymmetry
Xinchang Wang, Yunhao Chen, Yuechen Zhang, Congcong Bian, Zihao Guo, et al.
ICML 2026 · CCF-A 已录用 第五作者

基于鲁棒性非对称的通用 AI 生成图像检测。

发明专利 — 一种基于神经符号融合的语言驱动旅行规划方法及装置
中国发明专利(申请中)
已申请

🧪 重点项目

第一作者 · ICIC 2026 Oral

FWMamba-UNet — 频域-小波增强 Mamba UNet

面向医学图像分割的网络,在 Mamba 状态空间主干上引入 频域小波变换 双分支。频域-小波增强可捕获纯空间域 UNet 难以建模的跨尺度边界信息, 在多器官、病理等数据集上获得稳定的 Dice / HD95 提升,且保持 Mamba 的线性复杂度优势。

Mamba / SSM小波变换FFTUNet 医学图像PyTorch
iGEM 2025 · 国际金奖 · 干实验负责人

AMP Forge — 抗菌肽从头设计平台

团队以唯一人源抗菌肽 LL-37 为切入点,利用酿酒酵母构建细胞工厂以缓解抗生素耐药性。 作为干实验负责人,搭建通用型抗菌肽从头设计与可控生成平台:构建最大规模 AMP 语料数据库, 设计 ESM-2 / ProtT5 / Ankh + BiGRU-VAE 隐空间 + Latent Diffusion + Transformer 解码 三阶段训练流程(MLE → RL 对抗 → 扩散精调),支持六种生成方式,多项指标达 SOTA; 多条变体经湿实验验证,抑菌活性优于原始序列。

PyTorchESM-2ProtT5Ankh Latent DiffusionBiGRU-VAERLHF
第一作者 · ICIC 2026 Oral

ProtoGene — 单细胞基础模型微调

提出生物先验原型微调框架,弥合不同 scRNA-seq 测序协议之间的 read-technology gap, 提升单细胞基础模型在未见数据集上的泛化能力。

scGPTGeneformer对比学习PyTorch
第一作者 · NeurIPS 2026 投稿

Tokenization-as-Mechanism

信息非对称的 Token Merging:将分词器本身作为可解释机制,应用于 pMHC、TCR、DNA、SMILES 多种生物序列,跨域均取得稳定提升, 且可视化合并树具有清晰的生物学含义。

信息论pMHCTCRDNASMILES
第一作者 · ICIC 2026 Oral

SHINE — 神经符号旅行规划 Agent

Extract-Then-Compile 框架:大模型先将自然语言约束抽取为符号程序,再交由经典求解器可靠求解。 在 ChinaTravel 基准上取得领先 pass-rate,已申请国家发明专利。

LLM Agent神经符号约束求解

📬 联系我

  1191230418@jiangnan.edu.cn

  +86 176-1462-8870

  江苏 无锡

github.com/unumbrela

欢迎科研合作、实习机会、研究生申请等方面的交流(尤其是 AI for 生命科学方向)。