面向基于数据驱动的隧道工程不平衡数据集识别策略
编号:18
访问权限:仅限参会人
更新:2024-10-16 17:22:46
浏览:273次
口头报告
摘要
数据驱动的方法有望通过提供智能决策支持,革新机械化隧道掘进。隧道施工现场的数据通常是构建智能模型的基础。然而,机械化隧道掘进领域中,数据类别不平衡现象广泛存在。数据驱动模型往往难以准确预测样本数量较少的类别,尽管这些稀缺类别在实际应用中至关重要。为解决这一瓶颈,本研究提出了一种基于委员会主动学习的不平衡样本识别策略。该策略通过构建多个委员会模型来量化代理预测中的不确定性。对于预测不确定性较高的样本,将从验证数据中进行有放回的重采样,以迭代增强训练数据,从而提高模型处理不平衡数据集的能力。本研究通过将该策略应用于机械化隧道掘进中的围岩等级预测和渣土堵塞预测等实际案例,验证了其有效性。结果表明,该策略显著提高了少数类别的预测准确性。此外,研究还发现,“熵方法”和“权重方法”都能有效量化样本的学习难度。该策略同样适用于其他工程和科学领域。
关键词
机器学习;TBM;不平衡数据;围岩分类;泥饼预测;主动学习
发表评论