阿里深度学习框架开源了!无缝对接TensorFlow、PyTorch

2018-11-28 15:40:54 来源:网络整理 作者:管理员

原标题:阿里深度学习框架开源了!无缝对接TensorFlow、PyTorch

阿里深度学习框架开源了!无缝对接TensorFlow、PyTorch

来源:阿里巴巴

编辑:文强

【新智元导读】阿里巴巴将于12月开源其内部深度学习框架 X-DeepLearning,面向广告、推荐、搜索等高维稀疏数据场景,以填补TensorFlow、PyTorch等现有开源深度学习框架主要面向图像、语音等低维稠密数据的不足。

阿里巴巴内部透露将开源内部深度学习框架 X-DeepLearning的计划,这是业界首个面向广告、推荐、搜索等高维稀疏数据场景的深度学习开源框架,可以与TensorFlow、PyTorch 和 MXNet 等现有框架形成互补。

X-Deep Learning(下文简称XDL)由阿里巴巴旗下大数据营销平台阿里妈妈基于自身广告业务自主研发,已经大规模部署应用在核心生产场景,在这次的“双11”中也发挥了重要作用。

阿里妈妈研究人员介绍,XDL整体上跟TensorFlow和PyTorch是同级的,它们很好地解决了目前已有开源深度学习框架分布式运行能力不足,以及大规模稀疏特征表征学习能力不足的问题。

XDL 采用了“桥接”的架构设计理念。这种架构使得 XDL 跟业界的开源社区无缝对接。例如,用户可以非常方便地在XDL框架上应用基于TensorFlow或者PyTorch编写的最先进开源深度学习算法。此外,对于已经在使用其他开源框架的企业或者个人用户,也可以在原有系统基础上轻松进行扩展,享受XDL带来的高维稀疏数据场景下极致的分布式能力。

数据的高维稀疏性是广告、推荐、搜索等互联网众多核心应用场景的特征,覆盖了大多数互联网企业的数据应用模式。

对于难以与BAT研发能力比肩的众多互联网公司而言,工业级深度学习框架XDL及内置算法方案的开源,将助力各大公司的技术升级,大大提升广告/推荐/搜索场景的精准性,缩短技术迭代周期。

面向广告、推荐、搜索场景的工业级分布式开源DL框架

2016年左右,阿里妈妈团队在研发基于深度学习的广告点击率预估算法时发现,当时已有的TensorFlow、MXNet等开源框架,用来实验算法原型可以,但真正面临互联网尺度的规模化数据时,运行效率面临巨大的挑战。

“我们第一次基于TensorFlow训练我们实际生产系统的深度点击率预估模型时,一天的数据量需要运行超过3天的时间模型才能收敛,”阿里妈妈研发人员告诉新智元:“典型的生产模型需要用到的训练样本往往都是历史几个月的数据,显然直接使用TensorFlow是不现实的。”

随后,阿里妈妈团队也试图对TensorFlow做一些简单优化,但发现改动成本巨大。进一步剖析框架后,他们发现本质的原因是TensorFlow、MXNet、PyTorch等框架大都是面向图像、语音等领域的稠密数据设计,对广告、推荐等场景的高维稀疏数据上的深度学习计算考虑不足

为此,阿里妈妈启动了XDL框架的研发,希望能够在复用已有开源框架对稠密数据的计算能力基础上,重点打造面向工业级应用的分布式规模能力,单机能够处理的计算则引用现有开源框架。

经过2年的研发与打磨,XDL目前已经在阿里妈妈成功部署到内部的生产系统。以阿里妈妈定向广告为例,2017年,以 XDL 为基础的深度学习算法升级带来的广告收入提升超过百亿。

“我们注意到今天业界的很多团队还在类似的重复性工作。开源XDL,是希望把阿里巴巴的能力赋能给大家,推高全行业的整体技术水位,同时也希望能够吸引业界的伙伴们一起来建设高维稀疏数据场景上的深度学习技术,一起成长与获益。 ”

“在现有的版本中,我们在单节点稠密深度网络计算上采用桥接技术,复用了 TensorFlow、MxNet 的能力,也是最大程度上复用了已有开源深度学习框架的能力。”

研究人员表示,后续 XDL 也会考虑加入ONNX。“ONNX针对稀疏计算的表征能力目前是不完善的,我们也在考虑对ONNX的协议标准进行扩充。”

研究人员表示,他们预计12月在Github公开 XDL的源代码和使用文档。除了核心的X-DeepLearning 训练框架,阿里还将开源面向高维稀疏数据场景的系统化解决方案,计划分批次对外发布,包括面向在线实时服务的高性能深度学习预估引擎、面向全库实时检索的全新深度学习匹配引擎;同时还内置阿里妈妈自主研发的一系列创新算法,涉及CTR预估模型、CVR预估模型、匹配召回模型、模型压缩训练算法等等。

不管是以广告、推荐、搜索为代表业务的企业级用户,还是对此感兴趣的个人用户,都可以加入到开源计划当中。

一图看懂阿里巴巴首次公开深度学习框架

阿里深度学习框架开源了!无缝对接TensorFlow、PyTorch

显示全文
为您推荐
铁扇公主:与牛魔王结为夫妻(孩子是红孩儿)
铁扇公主:与牛魔王结为夫妻(孩子是红孩儿)

【导读】 铁扇公主:与牛魔王结为夫妻(孩子是红孩儿),下面是小编为你收集整理的,希望对你有帮助!说到四大名著《西游记》,大家一定都不陌生,里面的人物非常多,但更多的都是一些妖魔鬼怪,可能女性角色偏少,而这些出现的女性都是非常漂亮的。那你们知道铁扇公主是谁吗?铁扇公主是什么妖精呢?今天小编就带着大......

发布时间:2023-06-13 16:01:14

韩红:在音乐领域,我愿意成为一个“疯子”
韩红:在音乐领域,我愿意成为一个“疯子”

中央音乐学院琥珀四重奏组合现场演奏韩红的作品 韩红工作室供图中新网北京4月27日电 (记者 应妮)在音乐的领域里,我愿意成为一个‘疯子’。携自己首部器乐作品《晨雾》亮相时,韩红这样说。从流行歌手到说唱.........

发布时间:2023-06-13 15:03:30

世界上最大的单位:无穷大(1655年产生)
世界上最大的单位:无穷大(1655年产生)

【导读】 世界上最大的单位:无穷大(1655年产生),下面是小编为你收集整理的,希望对你有帮助!无穷大最早是由亚力士多德提出的,那时它并没有被当做一个单位。亚里士多德作为哲学家,也只是向世人表明无穷大这个范围是可能存在的,但是极端在理论上是科学所接触不到的。约十个世纪以前,一位印度的数学家布哈斯......

发布时间:2023-06-13 15:01:14

信用卡未出账单金额是否上征信报告
信用卡未出账单金额是否上征信报告

【导读】 信用卡未出账单金额是否上征信报告,下面是小编为你收集整理的,希望对你有帮助!1、未出账单是不会上征信的,征信上只会显示已出账单金额或欠款金额,未出账单是没有传送记录个征信中心的,所以在征信上是看不到信用卡未出账单,而且信用卡未出账单也是不会上征信的。2、如果本月的账单日已过,......

发布时间:2023-06-13 14:01:12

猪八戒真实身份吓死你 既然身份高贵为何被贬下凡间
猪八戒真实身份吓死你 既然身份高贵为何被贬下凡间

【导读】 猪八戒真实身份吓死你 既然身份高贵为何被贬下凡间,下面是小编为你收集整理的,希望对你有帮助!虽然猪八戒外表是一个长相极丑,贪生怕死的小人,但是猪八戒真实身份却是曾经南天门的天蓬元帅。众所周知,李靖李天王是整个天宫陆军的统领,掌管十万天兵天将,而天蓬元帅则是整个天空中水军的总领帅,掌管着八万水......

发布时间:2023-06-13 13:01:17

神农架野人之谜,传说中的野人很可能是棕熊
神农架野人之谜,传说中的野人很可能是棕熊

【导读】 神农架野人之谜,传说中的野人很可能是棕熊,下面是小编为你收集整理的,希望对你有帮助!世界上关于野人的传说很多,美国和加拿大的大脚怪、中国神农架的野人、中国喜马拉雅山区的雪人、高加索到蒙古一带的阿尔玛斯人、西伯利亚的丘丘纳、澳大利亚的幽微。其中尤以神农架野人传说证据最多。直立行走、身高......

发布时间:2023-06-13 12:01:25

女巫汤意面做法
女巫汤意面做法

【导读】 女巫汤意面做法,下面是小编为你收集整理的,希望对你有帮助!1、番茄、红菜头切块,洋葱对半切开,柠檬切半,葱白和西芹切段。2、将番茄100克、红菜头100克、紫洋葱半个、西芹一段、葱白一段、良姜两片、香茅两段、迷迭香一捏、百里香一捏、花椒3粒、麻椒3粒、黑胡椒......

发布时间:2023-06-13 11:01:11

许嵩:最先饱满的麦穗会被恶鸟啄食
许嵩:最先饱满的麦穗会被恶鸟啄食

2023.5.28,上海星巢秘境音乐节,许嵩谈命运考验,引发热议!这次,他的话语之中,蕴含了什么样的深意呢?相信我们懂得都懂据悉,许嵩在音乐节上表示:“有时我想,其实很多时候,过于饱满,过于蓬勃,也不.........

发布时间:2023-06-13 10:03:59

木牛流马是什么东西?木牛流马的运作原理是什么?
木牛流马是什么东西?木牛流马的运作原理是什么?

【导读】 木牛流马是什么东西?木牛流马的运作原理是什么?,下面是小编为你收集整理的,希望对你有帮助!说起诸葛亮,相信大家都非常的熟悉了,自古以来他早已经成为了聪明与智慧的象征。早年期间,诸葛亮随着自己的叔父诸葛玄游历到了荆州,在叔父死亡之后,诸葛亮便在荆州隆中隐居了,过着一边读书一边农耕户口的生活。......

发布时间:2023-06-13 10:01:22

劳尔哈龙:欧洲大型植食恐龙(长17米/生于1.4亿年前)
劳尔哈龙:欧洲大型植食恐龙(长17米/生于1.4亿年前)

【导读】 劳尔哈龙:欧洲大型植食恐龙(长17米/生于1.4亿年前),下面是小编为你收集整理的,希望对你有帮助!劳尔哈龙是一种蜥脚亚目中的圆顶龙科恐龙,诞生于1.45亿年前的侏罗纪末期,体长可达17米,主要以植物为食,属于大型恐龙的一种。劳尔哈龙在颈椎骨的后半段带有明显的棱脊,前肢比圆顶龙更长一些。劳尔哈龙的第......

发布时间:2023-06-13 09:01:15

怎么炒猪血
怎么炒猪血

【导读】 怎么炒猪血,下面是小编为你收集整理的,希望对你有帮助!材料:猪血、食盐、葱、蒜、干辣椒、调和油。1、新鲜猪血洗净切块。2、葱切花,辣椒切段,蒜拍成末。3、锅中加清水烧开,放入猪血一氽,捞出放盆中清水冲洗干净。4、锅中放油,花椒烹香捞出。5、烹辣椒段,葱花......

发布时间:2023-06-13 08:01:20

枕中记主题与人生哲理有和积极意义
枕中记主题与人生哲理有和积极意义

【导读】 枕中记主题与人生哲理有和积极意义,下面是小编为你收集整理的,希望对你有帮助!《枕中记》这本书不知道大家熟不熟悉,这是出自唐朝孔子之手的一部作品。这本书是在孔子与其弟子们一问一达的情况下所编写出来的一本预言书籍。在这本书记载着这么一句话:壬寅是丰年,禾稻倍收全。四季均调和,采拓......

发布时间:2023-06-13 07:49:41