强化学习全解;Facebook 机器学习@Scale 2017 资料汇总 | 开发者日报

强化学习全解

强化学习(Re-inforcement Learning) 是一种基于与环境互动的目标导向的学习。强化学习被认为是真正的人工智能的希望。作者认为这是正确的说法,因为强化学习拥有巨大的潜力。

据雷锋网(公众号:雷锋网)了解,很多人说,强化学习被认为是真正的人工智能的希望。本文从 7 个方面带你入门强化学习,读完本文,希望你对强化学习及实战中实现算法有着更透彻的了解。

详情:http://dataunion.org/27366.html

Facebook 机器学习@Scale 2017 资料汇总

据雷锋网了解,上周 Facebook 了举办了机器学习 @Scale 大会,大会汇集了众多数据科学家、工程师和研究人员,他们讨论大规模应用机器学习解决方案中的技术挑战范围。

300 多名与会者聚集在曼哈顿大都市西部,听取来自 Bloomberg,Clarifai,Facebook,Google,Instagram,LinkedIn 和 ZocDoc 的工程领导人的讲话,他们分享了各种不同的方法来构建数百万甚至数十亿人使用的机器学习系统。

现将演讲视频整合于一个页面中,方便来到雷锋网的大家聆听、学习、查阅。

详情:http://t.cn/RJ1jEyc

科学数据云

Stefan 在视频中探讨了他在 StitchFix 是如何利用来使 80 个数据科学家一起工作的。

他也谈及了对原型的想法、算法和分析,以及他们是如何在 Hive,Presto,Redshift 和 Spark 之间建立以及保持模式的同步。

对于众多数据科学家共同工作,究竟如何使数据访问更加简洁方便,Stefan 也进行了相应的分享。

详情:http://dwz.cn/5m4FYq

大数据的稀疏网络:利用大规模学习的简约性

高维数据分析科学和工业变得无处不在。

数据分析的一个重要工具是非参数模型的监督学习,这种方法在没有明确的数据假设的情况下估计了目标和输入变量之间的依赖关系。然而,这种普遍性是要付出计算成本与输入维数的成倍增长作为代价。一般来说,非参数模型不能逃避维度增长的问题,除非这个问题具有确定的一些属性。因此,为了促进大规模监督学习的发展,本文主要关注两个属性:数据低维流形的存在和高阶输入变量之间的相互作用的重要性打折。一个问题常常在一定程度上表现出这两种属性。为了识别和利用这些属性,这工作扩展了对于分层稀疏网络模型的简约性的概念。在发展学习算法的同时,也优化了模型参数和模型结构以适应手头的问题。

详情:http://t.cn/RJDMPpv

论文下载地址:https://pan.baidu.com/s/1o8oDuTO

深度学习是如何改变数据科学规范的?

深度学习正在改变一切,它正变得无处不在。

就像电子和电脑改变了所有经济活动一样,人工智能将重塑零售、运输、制造、医药、电信、重工业……甚至数据科学本身。这个应用领域的列表还在持续增长,而这个列表正是展示出了在哪些领域中 AI 可以比人类做得更好。

我们在 Schibsted 看到了深度学习所提供的机会,对于能够在其中做出一份贡献,我们也很兴奋。

本文作者:AI研习社

本文转自雷锋网禁止二次转载,原文链接

时间: 2017-08-02

强化学习全解;Facebook 机器学习@Scale 2017 资料汇总 | 开发者日报的相关文章

人工智能的新希望——强化学习全解

很多人说,强化学习被认为是真正的人工智能的希望.本文将从7个方面带你入门强化学习,读完本文,希望你对强化学习及实战中实现算法有着更透彻的了解. | 介绍 许多科学家都在研究的一个最基本的问题是"人类如何学习新技能?".理由显而易见--如果我们能解答这个问题,人类就能做到很多我们以前没想到的事情.另一种可能是我们训练机器去做更多的"人类"任务,创造出真正的人工智能. 虽然我们还没有上述问题的全部答案,但有一些事情是清楚的.不论哪种技能,我们都是先通过与环境的互动来学习

​入门指南 | 人工智能的新希望-强化学习全解

很多人说,强化学习被认为是真正的人工智能的希望.本文将从7个方面带你入门强化学习,读完本文,希望你对强化学习及实战中实现算法有着更透彻的了解. 介绍 许多科学家都在研究的一个最基本的问题是"人类如何学习新技能?". 理由显而易见– 如果我们能解答这个问题,人类就能做到很多我们以前没想到的事情. 另一种可能是我们训练机器去做更多的"人类"任务,创造出真正的人工智能. 虽然我们还没有上述问题的全部答案,但有一些事情是清楚的.不论哪种技能,我们都是先通过与环境的互动来学习

(转) 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文)

  本文转自:http://mp.weixin.qq.com/s/aAHbybdbs_GtY8OyU6h5WA   专题 | 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文) 原创 2017-01-28 Yuxi Li 机器之心 选自arXiv 作者:Yuxi Li 编译:Xavier Massa.侯韵楚.吴攀     摘要   本论文将概述最近在深度强化学习(Deep Reinforcement Learning)方面喜人的进展.本文将从深度学习及强化学习的背景知识开始,包

详解Facebook田渊栋NIPS2017论文:让大家都能做得起深度强化学习研究的ELF平台

这周,机器学习顶级会议 NIPS 2017 的论文评审结果已经通知到各位论文作者了,许多作者都马上发 Facebook/Twitter/Blog/朋友圈分享了论文被收录的喜讯.大家的熟人 Facebook 人工智能研究院研究员田渊栋也有一篇论文入选,论文名为「ELF: An Extensive, Lightweight and Flexible Research Platform for Real-time Strategy Games」.这篇论文介绍了他们构建的强化学习研究平台 ELF,为环境

监督学习×强化学习,Facebook让聊天机器人学会谈判

雷锋网 AI 科技评论按:目前人们对聊天机器人的认识还在调戏微软小冰的阶段,可以明显感觉到小冰不是很关心上下文之间的关联.而且在我们的观念里,聊天机器人也没办法真的理解人类所说的话,没办法跟人类讨论事情.明确地达到什么共同目标. 不过,Facebook的人工智能研究机构FAIR刚刚开源并公开发表的聊天机器人就开始拥有了跟人类进行协商谈判.进行讨价还价的能力.通过监督学习+强化学习,这个聊天机器人不仅能理解字词和语义的对应关系,还能针对自己的目标制定策略,跟别人进行协商讨论达成一致. 以下为雷锋网

UCL计算机系教授汪军:如何进行大规模多智体强化学习?| CCF-GAIR 2017

雷锋网AI科技评论按:7月7号,全球人工智能和机器人峰会在深圳如期举办,由中国计算机学会(CCF)主办.雷锋网(公众号:雷锋网)与香港中文大学(深圳)承办的这次大会共聚集了来自全球30多位AI领域科学家.近300家AI明星企业.雷锋网最近将会陆续放出峰会上的精华内容,回馈给长期以来支持雷锋网的读者们! 今天介绍的这位嘉宾是来自伦敦大学学院的汪军教授,分享主题为"群体智能". 汪军, 伦敦大学学院(UCL)计算机系教授.互联网科学与大数据分析专业主任.主要研究智能信息系统,主要包括数据挖

【田渊栋年度总结】FAIR强化学习研究进展,理论研究竞争也相当激烈

今年的主要研究方向是两个:一是强化学习及其在游戏上的应用,二是深度学习理论分析的探索. 今年理论方向我们做了一些文章,主要内容是分析浅层网络梯度下降非凸优化的收敛性质.首先是上半年我自己 ICML 的这篇[1],分析了带一层隐层的网络,且输入为高斯分布时的收敛性情况.这篇文章,尤其是去年在 ICLR 17 workshop 上发表的不完全版,可以算是此方向的头一篇,给分析神经网络的非凸问题提供了一个思路.之后 CMU 的杜少雷过来实习,又出了两篇拓展性的文章.两篇都在浅层卷积网络上做了分析,一篇

【双11背后的技术】基于深度强化学习与自适应在线学习的搜索和推荐算法研究

选自<不一样的技术创新--阿里巴巴2016双11背后的技术>,全书目录:https://yq.aliyun.com/articles/68637 本文作者:灵培.霹雳.哲予 1. 搜索算法研究与实践 1.1 背景 淘宝的搜索引擎涉及对上亿商品的毫秒级处理响应,而淘宝的用户不仅数量巨大,其行为特点以及对商品的偏好也具有丰富性和多样性.因此,要让搜索引擎对不同特点的用户作出针对性的排序,并以此带动搜索引导的成交提升,是一个极具挑战性的问题.传统的Learning to Rank(LTR)方法主要是

引入秘密武器强化学习,发掘GAN在NLP领域的潜力

1.基础:文本生成模型的标准框架文本生成(Text Generation)通过 机器学习 + 自然语言处理 技术尝试使AI具有人类水平的语言表达能力,从一定程度上能够反应现今自然语言处理的发展水平. 下面用极简的描述介绍一下文本生成技术的大体框架,具体可以参阅各种网络文献(比如:CSDN经典Blog"好玩的文本生成"[1]),论文等. 文本生成按任务来说,比较流行的有:机器翻译.句子生成.对话生成等,本文着重讨论后面两种. 基于深度学习的Text Generator 通常使用循环神经网