您当前的位置:首页 >> 工业物联
工业物联

Hudson River Trading:如何正确看待Machine Learning论文

发布时间:2025-08-18

如上Mania等人的博士论文在引言中都提到:“……学术研究声称,许多RL方法有对超强参数、随机幼苗、甚至同一迭代的各有不同充分利用的变异都不很强鲁棒病态……如果没有人显著的修改和鲁棒病态,很强这种脆弱病态的迭代无法集成到关键训练任务管控系统中都。”如果一个人甚至不用已确定一篇博士论文在一个几乎相同的情况上是可重复的,为什么我们的学术研究工作人员要花间隔时间把这个结果运用到一个几乎各有不同的情况上呢?

我们在自己的日常工作中都引人注意都会遇见这个情况:对我们来说,一个常见于的情况是意上图了解我们的交易系统在未来的变异都会有多大的展示出。我们可以先前通过试验它在现在的展示出来大约这一点。这样想到或许都会丢失的事情有很多,但即使不慎重考虑这些,我们仍然有统计也就是说的情况。我们不仅并不需要避免系统病态也就是说,而且很不易在消除低清晰度应用的小关联时故意自己。这想像中类似于指出强化修习迭代改进的史家所面临的情况。RL方法有是随机的,每次试运行的病态能关联较大,而且依此试验训练任务本身也普遍存在随机病态的情况。与此同时,试运行这些RL试验中的量化成本更为极低,引人注意是对于量化资源更少的学术机构来说,而且没有人一个通用的方法有来年度报告这两项(这与我们内部试运行“更早试验”的一个通用方法有各有不同)。

Agarwal等人在“Deep Reinforcement Learning at the Edge of the Statistical Precipice” 一文中都对该情况透过了加权。这篇博士论文的重点十分是关于机械地展现一个结果的瓶颈,而是关于这些结果是如何倾听的。

创作者显然,引人注意年度报告的对各种依此训练任务展示出的点大约是更为误导的,因为这些这两项的不已确定病态准确度是进一步的。此外,模型试运行的更深关联可以几乎颠倒结果。例如,他们注意到在基于玛毕卡索新近游戏的依此试验中都,一种迭代年度报告的结果很或许比另一种迭代很好,这正是由于这种可变病态。在其他情况下,如果将一篇博士论文的评估建议运用到另一篇博士论文中都,任何展示出上的差距都都会消失,甚至产生相反的结论。幸而的是,对于这个情况没有人单纯的消除建议:学术研究工作人员确实努力工作使他们的结果中都的不已确定病态尽或许直观,并适用新近标准的度量新近标准,而审稿人确实对他们负责。对于实践者来说,我们需要对任何属于自己结果都有较大持续性的相信,并且不够喜欢那些在任何或许的;也都能强充份地显然其可重复病态的方法有。

普适病态

正如我们在后提到的,大多数AI学术研究是充分传动装置的,但充分结果或许是在与我们自己的情况太各有不同而不用即刻一般来说于我们的情况上授予的。例如,从第一准则来看,从市场数据预测未来股票价格作为一个回归情况十分就是指上图像分类或机筒翻译,因此,主要在这些训练任务上评估的新近型模型在我们的情况上展示出都会如短期内那样较好吗?

慎重考虑新近设计一个深度修习模型构建筒的情况。有越来越多的构建筒是为深度修习情况新近设计的,但单单上选择构建筒本身就是一个不够为严重的情况。慎重直接影响概念对它们的新近设计获取了大多的指导,人们或许都会确信值得注意披露的构建筒比旧的很好,多于在充分上是这样。然而,我们有原因相信:构建筒有许多超强参数,只要比参考/依此构建筒不够仔细地二阶这些超强参数,就或许无意间都指出一种样子很好的新近设计。此外,还有一种发表也就是说在起作用:发表的博士论文只是说明该构建筒在博士论文设定的环境中都有很好的展示出,十分一般来说于其他“样本”空间内的深度修习的情况。

这张来自Schmidt等人的“Descending through a Crowded Valley”的上图推断,每年有许多构建筒(各有不同的颜色)在博士论文中都被提及。这么多构建筒,并没有人连续函数到一个也就是说的普适病态的最佳构建筒的。

Schmidt, Schneider,Hennig的一篇博士论文“Descending through a Crowded Valley – Benchmarking Deep Learning Optimizers”揭示了这个情况。他们利用了一组15个普及的(引人注意被提及的)构建筒,并对情况、构建筒、构建调优和修习叛将计划的交叠幂透过彻底搜索。他们有两个引人注意有趣的结论,单独一般来说于我们。首先,2014年首次披露的Adam构建筒(Kingma和Ba)仍然是深度修习情况的最佳首选构建筒——它充分利用了我们所努力的“一般病态”本体。

第二个道理是适用新近构建筒前要不够慎重:“与用各有不同的随机幼苗继续相应或继续试运行的也就是说方法有相比之下,各有不同的构建筒展示出出惊人的相似病态能常见于。”局限性都,慎重直接影响我们更少的学术研究间隔时间和一定持续性上更少的量化间隔时间,这仅仅我们甚至不可信试验属于自己构建筒是否明智,除非所指出的构建筒和它声称可以很好地消除的情况的交集有一些引人注意多样的东西。

阐释

人文学科是我们改善意图的不可或缺资源。阅读现阶段的人文学科给我们造就了启发,即使这些学术研究十分单独一般来说。我们需认识到,人文学科的事实或许与从业工作人员的事实不几乎一致。

因此,在慎重考虑将这项学术研究运用于我们的情况时,我们需始终保持健康的相信态度。但要自已沦为很好的学术研究工作人员和新近技术工作人员,就需始终保持直觉、参与感,并从他人的工作中都汲取灵感。

安徽精神心理治疗医院
成都看白癜风哪家医院最好
哈尔滨妇科医院哪家最好
天津看白癜风去哪里好
老年人身体虚弱吃什么补品

上一篇: 光效两大 朗科NV3000 RGB固态硬盘震撼来袭

下一篇: 世界环境日:我国森林覆盖率大增,福建居首,全球日本,印尼较低

友情链接