本次汇报定位:选题汇报,目标是提出可落地的研究方案,而非汇报已完成实验结果。 近两年 Agent 能力快速增强,已经具备任务编排、工具调用、反思纠错的工程基础。 生物化学下游任务(逆合成、代谢位点、酶反应性、结合自由能)长期分散,难以复用。 BDE/BDFE 提供跨任务的统一“能量语言”,适合做核心中枢。
任务定位:给定目标分子,自动生成可执行的逆合成路径,并优先选择热力学更合理的断键步骤。 为什么关键:逆合成是化学合成设计的核心场景,直接决定路线长度、成本与可实现性。 BDE价值:将“断哪根键”转化为可量化的能量排序问题,减少低可行性候选。 任务输入:目标分子、反应模板库、可用试剂与条件约束。 任务输出:候选路径、每步断键解释、置信度与替代路线。 典型指标:Top-k断键命中率、路径成功率、平均步骤数、计算成本。
任务定位:预测分子在生物体内更可能发生代谢反应的位置(如CYP450相关位点)。 为什么关键:代谢位点直接影响药物半衰期、毒性风险与成药性优化方向。 BDE价值:较低BDE位点往往更易发生H抽取/氧化,能作为位点排序的重要先验。 任务输入:分子结构、酶环境上下文、可选实验约束。 任务输出:位点排序、风险标签与可解释能量证据。 典型指标:Top-1/Top-k命中率、PR-AUC、跨化学空间泛化能力。
任务定位:在给定酶-底物体系下,预测更可能发生反应的位点与反应类型。 为什么关键:用于酶工程、定向进化与生物催化路线优化。 BDE/BDFE价值:统一描述局部键强弱与H转移热力学能力,提高机制解释一致性。 任务输入:蛋白残基微环境、底物结构、反应条件。 任务输出:位点优先级、机理解释、候选突变方向。 典型指标:位点排序相关性、反应类型判别准确率、解释一致性评分。
任务定位:对蛋白-配体候选集合进行热力学排序,辅助先导化合物优选。 为什么关键:决定筛选效率,是药物发现中连接计算与实验的关键环节。 与能量核心关系:把BDE/BDFE语义与\(\Delta G\)评估对齐,提升跨任务一致性。 任务输入:复合物构象、候选分子集合、模拟参数约束。 任务输出:候选排名、误差估计、可解释热力学因子。 典型指标:Spearman/Pearson相关、RMSE、命中率提升与单位成本收益。
当前痛点可归纳为三类: 痛点 当前常见做法 关键不足 任务割裂 每个任务单独建模 难迁移、难维护 能量语义不统一 BDE/BDFE/ΔG各用各的 决策标准不一致 实验评估不对齐 指标体系不统一 无法比较系统级收益 本课题核心问题: 能否构建一个能量核心Agent,统一表示与推理 BDE/BDFE 相关知识? 能否通过任务适配器,把该能力稳定迁移到四类下游任务? 能否用统一实验协议评估“核心中枢”带来的真实增益?
文献侧可复用结论(来自调研资料): ALFABET 证明 BDE 可被图模型高效预测,并服务代谢位点等任务。 大规模 FEP/ABFE 工作验证了自由能方法在药物任务中的工程价值。 BDFE 体系可把 pKa 与 E° 统一到同一个热力学标尺中。 本选题的创新定位: 维度 现有研究 本方案 目标 单任务最优 跨任务统一中枢 表示 各任务特征独立 能量核心共享表示 调度 静态流程 多Agent动态编排 评估 单任务指标 统一协议+跨任务对照 结论:本课题的创新不是“再做一个模型”,而是构建可复用的能量核心系统能力。
总体路线分三层: 任务层:输入具体任务目标与约束(如逆合成路径长度、反应可行性、候选筛选成本)。 核心层:Energy Core Agent 提供统一能量判别能力(BDE/BDFE 语义与不确定性估计)。 执行层:各领域 Agent 负责任务特定推理与工具调用,返回可评估输出。 关键思想: 用统一能量语义替代“任务各自为政”的特征体系。 用 Orchestrator 把“目标拆解、调用顺序、反馈回路”工程化。 用 Evaluator 与共享记忆形成持续改进闭环。
架构职责拆分: Orchestrator Agent:任务解析、子目标分解、Agent路由。 Energy Core Agent:统一能量表示、可行性打分、不确定性控制。 Domain Agents:Retrosynthesis / Metabolism / Protein Reactivity / Binding FE。 Evaluator + Shared Memory:自动评估、经验回写、失败模式复盘。
Energy Core Agent 的核心输入输出: 模块 输入 输出 Energy Encoder 分子/反应图、上下文约束 统一能量嵌入向量 Feasibility Scorer 候选断键/位点/构象 可行性分数+置信区间 Constraint Checker 化学规则、反应条件 违规标记与修正建议 任务适配策略: Retrosynthesis:把“断键候选排序”映射为能量引导搜索问题。 Metabolism:把“代谢位点排名”映射为能量脆弱性评估。 Protein Reactivity:把“反应位点选择”映射为局部能量变化解释。 Binding FE:把“结合自由能排序”映射为热力学一致性判别。 说明:本阶段只定义方法与接口,不报告实验结果。
闭环执行流程: 任务请求进入 Orchestrator,生成任务图与调用计划。 Energy Core 对候选方案给出“能量可行性 + 不确定性”双输出。 Domain Agent 执行任务特定推理并返回候选解。 Evaluator 按统一指标打分,Shared Memory 回写成功/失败轨迹。 下一轮调用优先利用高价值经验,提升稳定性与效率。
本汇报仅给出实验方案,不给结果。 统一协议设计: 数据拆分:按任务分别设 Train/Valid/Test,并增加跨任务迁移评测集。 对照基线: 无Energy Core的独立任务Agent。 仅规则或仅单模型方法。 我们的统一中枢 Multi-Agent 方案。 统一评估:任务指标 + 系统指标(推理时延、成功率、稳定性)。 消融实验:移除能量核心、移除记忆模块、移除不确定性估计,观察性能变化。 目标:证明“统一能量核心”在多任务场景下的可迁移性与工程收益。
主线任务定义: 输入:目标分子、反应约束、可用反应模板库。 输出:逆合成路径与每一步断键决策解释。 实验设计: 组件 方案 候选生成 模板法 + 规则法 + Agent检索增强 候选排序 加入 BDE 引导的断键优先级打分 评价指标 Top-k断键命中率、路径可行率、平均步骤数、推理成本 对照 无BDE排序 / 仅规则打分 / 统一能量核心方案 预期验证点:BDE 引导是否能在不增加过多成本的前提下,提高关键断键决策质量。
三类任务均复用同一 Energy Core Agent,仅替换任务适配器。 任务 输入 指标 目标 代谢位点预测 分子结构 + 酶环境约束 位点命中率、Top-k准确率 验证能量脆弱位点识别能力 蛋白/酶反应性 残基环境 + 反应条件 位点排序相关性、解释一致性 验证自由基反应性推断能力 结合自由能排序 蛋白-配体候选集合 排序相关性、误差统计 验证跨任务热力学一致性
预期贡献: 提出一个可复用的能量核心Agent系统范式,统一多任务能量语义。 给出面向生物化学任务的统一实验协议,支持系统级对照。 在逆合成任务上形成可解释的 BDE 引导断键决策方案。 阶段计划(建议): 时间阶段 里程碑 第1阶段 完成核心模块与四个任务适配器原型 第2阶段 完成统一实验协议与消融实验管线 第3阶段 聚焦Retrosynthesis深度优化并撰写论文主线 收束:本课题重点是把“强Agent能力”沉淀为可迁移的科研基础设施,而不是单点任务刷指标。