3.1、基于机器学习进行创新药研发的底层逻辑 Kruger 等人(2023)提出了一个基于机器学习判断化合物是否具有杀虫活性的典型数据筛选案例,其通过构建杀虫剂与非杀虫剂样本的数据集,训练机器学习模型以识别潜在杀虫剂分子,并依据特征数据进行性能评估。研究者采用 BCPC 数据集,用非农药数据构建负数据集,利用公开工具如 PaDEL 和 MOE 构建高质量输入特征,并使用 SVM、LDA、DT、RF、ANN、SOM 六种主流的机器学习模型进行训练与预测。最终训练完成的模型能够判断新输入品种的性能是否为合格杀虫剂。例如,当机器输出 0 时,说明机器基于其特征数据认为不是杀虫剂,性能较差。