亚美娱乐

亚美娱乐_亚美娱乐官网_亚美娱乐手机版首页(趁我们都还年轻,多欣赏下沿途的风景,不要错过了流年里温暖的人和物....)

新兴生态系统:Python和R语言,谁更适用于大数据Spark/Hadoop和深度学习?

老师是无私的,他不求得到学生的回报;老师是“好面子”的,他希望自己的学生成才。作为学生,我们难道不应该真诚敬献满腔的热情、无限温暖和一颗赤诚的心吗?亚美娱乐官方网站

作者:Gregory Piatetsky, KDnuggets 本文为36大数据独译,译者ya楠

本文中我们将对现有大数据的顶级东西做项检验:Python和R言语,谁更实用于Spark/Hadoop和深度学习,并肯定一个新兴的大数据深度学习生态零碎。

上个月,我们对第18届KDnuggets软件的考察后果进行了一次报导:数据剖析、数据迷信、机械学习中的新领导者、趋向和欣喜。

本文将更具体的考查哪些东西可能互相之间敌对合作,哪些东西则兼容性较差。我们还发现了一个新兴的Python敌对型东西生态零碎,这些东西平日被利用在数据迷信的两大前沿:大数据(Spark / Hadoop)和深度学习。

本文的末尾有一个匿名数据集的链接——欢迎读者对数据进行剖析,而后将后果发布或者发送给我。

首先,让我们来看一下顶级东西之间的分割。

我们拔取了投票超越500票的东西(今年有11项入选)。

掂量两个特色之间的关联水平有许多种方法,比方卡方剖析或T测验,但这次我们依然相沿了在2015年和2016年剖析时采纳的绝对复杂的方法。此处先界说一个“Lift”

Lift (X & Y) = pct (X & Y) / ( pct (X) * pct (Y) )

此中pct(X)示意抉择X的用户百分比。

Lift(X&Y)> 1示意X&Y 一同出现的频次比预设中两者互相自力要大;Lift=1示意X&Y 一同出现的频次恰恰即是预设中两者互相自力,Lift<1标明X&Y 一同出现的频次小于两者互相自力的状况(负相干)。

为了更直观的看到与1之间的差距,我们界说

Lift1 (X & Y) = Lift (X & Y) – 1

表1将排名前11的东西的Lift1值进行了两两比拟,并挑选出关联度绝对值abs(Lift1) 大于15%的状况。

图1:数据迷信、机械学习高级东西关联度表,2017

注:绿色示意正相干,红色示意负相干。

标签Lift1上文已诠释;条形的宽度与Lift1的大小成正比。

亚美娱乐官方网站以出色的资源调配手段和深厚的文化底蕴创意为客户打造最适合休闲游戏的服务平台.

时间:2017-09-09 06:00:20 分类 亚美娱乐官方网站