大发一分快3官网AAAI 2018 五个论文奖全部揭晓,「记忆增强的蒙特卡洛树搜索」获杰出论文 | 雷锋网

  • 时间:
  • 浏览:48

雷锋网(公众号:雷锋网) 大发一分快3官网aI 科技评论消息,第 32 届 AAAI 大会(AAAI 2018)日前在美国新奥尔良拉开帷幕,会议时间为 2 月 2 日至 7 日。

作为人工智能领域最悠久、所含内容最广泛的学术会议之一,历届 AAAI 都吸引了全世界的人工智能相关领域的研究者参与,会议的论文内容也雄厚多彩。近年来参加 AAAI 的中国学者和以及投稿 AAAI 的中国论文也都是明显增加,大发一分快3官网这也印证了 AAAI 对中国学者们的吸引力。实际上,来自中国的论文投递数在 2017 年为 785 篇,仅以微弱优势超越美国,但在今年实现了 58%的惊人提大发一分快3官网升,以 1242 篇论文当仁不让地成为 AAAI 2018 的「学术论文第一产地」。但从录用论文的数量来说,中美两国仍然不相上下,均有 2100 余篇论文被收录,可见来自中国的投稿数真是有了大幅提升,但在质量上仍然有进步的空间。

AAAI 2018 今年共收到论文投稿 31008 篇,接受论文 938 篇,接受率 24%。大会评出杰出论文、杰出学生论文各一篇,杰出论文提名、杰出学生论文提名各一篇,以及经典论文一篇。尽管《Memory-Augmented Monte Carlo Tree Search》获得杰出论文的消息早已传播开来,但论文内容还是直到上周末才公开发表;另外,这篇来自阿尔伯塔大学的论文的三位作者中都是两位是华人。

论文获奖介绍

杰出论文 Outstanding Paper:《Memory-Augmented Monte Carlo Tree Search》

  • 记忆增强的蒙特卡洛树搜索

  • 论文摘要:这篇论文提出并评估了记忆增强蒙特卡洛树搜索(M-MCTS),你你这人 办法为在线实时搜索提出了四种 新的利用泛化性的办法。记忆增强蒙特卡洛树搜索的关键思路是把蒙特卡洛树搜索和两个 记忆型态组合起来,记忆型态中的每个存储位置都还并能 所含某个特定状况的信息。通过综合类式的状况的估计结果,你你这人 记忆还并能 生成逼近的估计值。作者们展示了,在随机状况下,基于记忆的逼近值有更高由于性比原始的蒙特卡洛树搜索表现更好。作者们也在围棋游戏中评估了记忆增强蒙特卡洛树搜索,实验结果表明,在同样的模拟步数下记忆增强蒙特卡洛树搜索也比原始版本有更好的表现。

  • 论文地址:https://webdocs.cs.ualberta.ca/~mmueller/ps/2018/Chenjun-Xiao-M-MCTS-aaai18-final.pdf 

杰出学生论文 Outstanding Student Paper:《 Counterfactual Multi-Agent Policy Gradients》

  • 反事实多智能体策略梯度

  • 论文摘要:你你这人 现实世界中的间题报告 ,比如网络数据包的路由,由于自动驾驶汽车之间的协调,都还并能 很自然地看作战略企业合作性的多智能体系统间题报告 来建模。这就对新的强化学习办法提出了强烈的需求,以便为你你这人 系统高效地学习到大发一分快3官网区中心化的运行策略。出于你你这人 目的,作者们提出了四种 新的多智能体的“执行者-批评者”办法:反事实多智能体策略梯度(COMA)。COMA 中使用两个 中心化的批评者估计Q函数和区中心化的执行者,从而优化智能体的运行策略。除此之外,为了处理多智能体间互相建立信任的间题报告 ,它使用了两个 会把单个智能体的动作边缘化的反事实基准线,同时还能保证其它智能体的动作不变。COMA 中使用了两个 批评式的表征,从而使得你你这人 反事实基准线还并能 在单个前馈流程中进行高效的计算。作者们在星际争霸游戏的单位控制测试环境中评估了 COMA 的表现,使用了非常便于分别观察的去中心化变量。与你你这人 环境下的其它多智能体执行者-批评者办法相比,COMA 的平均表现有显著提高,但是 COMA 得到的最好的智能体的表现还并能 和顶尖的具有全状况数据的中心化控制办法相提并论。

  • 论文地址:https://arxiv.org/abs/1705.08926

杰出论文提名 Outstanding Paper, Honorable Mention:《Generalized Adjustment Under Confounding and Selection Biases》

  • 对选用偏倚和混杂偏倚的泛化调节处理办法

  • 论文摘要:选用偏倚和混杂偏倚是限制常见推理办法在大尺度环境下使用的最常见的两个 障碍。在这篇论文中,作者们泛化了后门调节的想法,以便同时处理你你这人 种偏倚,但是在不引入选用偏倚的状况下利用由于的内部人员数据(比如来自人口调查的数据)。作者们介绍了调节对(adjustment pair)的思路,并展示了通过调节办法识别因果关系的完整性图形条件。作者们还进一步设计了两个 算法,以多项式形式列出所有还并能 处理的调节对,对于希望评估以每段可处理的调节对的特定属性(常见属性包括开销、变化、测量难度)的研究人员来说这会很有用。最后,作者们描述了四种 统计性的估计过程,一旦确认了某个设置是还并能 处理的就还并能 执行你你这人 过程;它还并能 用来处理有限样本中的多种间题报告 。

  • 论文地址:https://pdfs.semanticscholar.org/023a/a92487c037a7557b9b74e891003725afd00a.pdf 

杰出学生论文提名 Outstanding Student Paper, Honorable Mention:《Adapting a Kidney Exchange Algorithm to Align with Human Values》

  • 改创造科学发明和人类的价值一致的肾脏分配算法

  • 论文摘要:咋样高效分配有限的资源是经济学和计算机科学两个 领域共有的经典间题报告 。对于肾脏移植手术来说,通常会由两个 中央市场把一切正常的肾脏捐赠者分配给在等待肾脏的病人。在肾脏分配中,病人和捐赠者首先由委员会通过特设的权重决定优先级,但是输入两个 分配算法,由它决定哪个病人会分配到哪个捐赠者 —— 以及决定哪个病人分配非要捐赠者。在这篇论文中,作者们提出了四种 端到端的办法用于在肾脏分配中根据每个病人的档案估计权重。作者们首先从人类被试者获取了一组当他们 认为还并能 用于决定病人优先级的属性(比如医疗型态,生活办法等等)。但是作者们根据不同病人的档案向被试者提问对比间题报告 ,并根据当他们 的回答严格地计算出各个属性的权重。作者们展示了咋样在肾脏分配市场的分配算法中使用你你这人 权重。作者们接着在模拟环境下评估了你你这人 权重的影响,发现当他们 算出的权重的精确值真是影响很小,实际上并能 的就是 由权重计算出的档案的排序。不过,与完整性不给病人排优先级的状况相比,所含权重的算法还是取得了更好的表现,真是有每段类别的病人那我述的测试者的价值评价中获得了优先匹配(由于延后匹配)。

  • 论文地址:https://users.cs.duke.edu/~conitzer/kidneyAAAI18.pdf 

经典论文 Classic Paper:《Algorithm and Tool for Automated Ontology Merging and Alignment》

  • 自动本体合并和对齐的算法及工具

  • 这篇论文来自 100 年的第 17 届 AAAI 大会。这次颁奖是为了表彰这篇论文在本体匹配和集成研究方面的先驱性贡献,论文中分析了你你这人 间题报告 的具体状况,并提出了首个创新的处理方案。

  • 论文地址:https://www.aaai.org/Papers/AAAI/100/AAAI00-069.pdf 

  • 论文作者 Natasha Fridman Noy 应邀在会议上进行了演讲,介绍了论文内容以及你你这人 间题报告 研究的后续变迁,雷锋网 AI 科技评论也将为当他们 挂接呈现演讲内容。请期待后续报道。

雷锋网 AI 科技评论报道

相关文章:

AAAI 2018全揭秘:1242篇中国投递论文领大发一分快3官网跑全球,录用数和美国平分秋色

AAAI 2018 六大前瞻亮点抢先看,BATJ、滴滴聚首学术顶会|AAAI 2018

AAAI 2018,腾讯AI Lab 11篇录用论文全解读

雷锋网版权文章,未经授权禁止转载。详情见转载须知。