一、传统评估体系的三大结构性缺陷

RNA结构预测领域的评估体系长期存在系统性偏差，这种偏差如同给模型佩戴了”有色眼镜”，导致评估结果与真实预测能力产生显著偏离。研究团队通过系统性分析揭示了三大核心问题：

1.1 数据去重机制的认知偏差

现有基准数据集普遍采用序列相似性作为去重标准，这种做法忽视了RNA结构与序列的非线性关系。以Rfam数据库为例，其传统去重流程仅过滤序列相似度＞80%的条目，却未考虑：

研究团队通过对比实验发现，使用传统去重方法的数据集训练出的模型，在测试集上表现出23%的虚假准确率提升，这种提升源于结构相似样本的意外泄露。

当前主流评估指标（如Matthews相关系数MCC）过度聚焦碱基配对准确性，这种局部性评估存在两大弊端：

结构完整性缺失：模型可能正确预测80%的碱基对，但将这些配对组装成完全错误的拓扑结构。例如将发夹结构预测为假结结构，虽局部配对正确但整体构象错误。
长程相互作用忽视：RNA分子中存在大量跨越数百个核苷酸的相互作用，传统评估方法无法捕捉这些关键特征。研究显示，在16S rRNA预测中，忽略长程相互作用的模型准确率虚高17%。

基准数据集存在显著的时间偏倚和来源偏倚：

针对上述问题，研究团队构建了CHANRG（Comprehensive Hierarchical Annotation of Non-coding RNA Groups）评估框架，该系统通过三个创新维度重构评估体系：

CHANRG采用三级筛选机制确保结构唯一性：

该流程从1070万原始序列中筛选出17.3万结构唯一样本，相比传统方法数据多样性提升3.2倍。实验表明，使用CHANRG数据集训练的模型在新物种RNA预测中准确率提高28%。

CHANRG引入三维评估矩阵：

评估维度 = f(局部准确性, 结构合理性, 生物相关性)

具体包含：

CHANRG构建了持续更新的评估生态系统：

该系统已集成到RNAcentral平台，支持实时评估12类非编码RNA的预测结果。

CHANRG系统的应用已产生显著效果：

该成果对行业产生三方面启示：

目前，CHANRG系统已开放API接口，支持研究人员上传自定义数据集进行评估。研究团队正在开发基于图神经网络的评估模型，预计将进一步提升复杂RNA结构的评估精度。这项突破不仅解决了AI预测RNA结构的”偏科”问题，更为整个结构生物学领域提供了新的方法论范式。