亚美娱乐

亚美娱乐_亚美娱乐官网_亚美娱乐手机版首页(趁我们都还年轻,多欣赏下沿途的风景,不要错过了流年里温暖的人和物....)

泰坦尼克号乘客生存分析(下)——机器学习预测&一些深度总结

老师是无私的,他不求得到学生的回报;老师是“好面子”的,他希望自己的学生成才。作为学生,我们难道不应该真诚敬献满腔的热情、无限温暖和一颗赤诚的心吗?亚美娱乐官方网站


接上篇泰坦尼克号搭客生存剖析(上)——用机械学习通知你,假如你在事先的船上,有多大机率生还?

机械学习展望

machine-learning-cheet-sheet.png


抉择算法

练习数占有带标注的特色、须要展望能否存活,显然这是一个十分典范的二元分类问题,属于监视学习分类问题;特色数据中有间断数值(continuous)和团圆值(discrete),数据量也不大,这里我抉择了决议计划树算法(Decisiontree)。别的,抉择这个算法,这也有种运气在做决议计划的象征。

练习及评价

为了让要展望特色比拟语义,我加了一个新的特色 Survival,只是复杂把1和0值映照为Survived和No:

# extract "Survival" so that can use it as the label_columndf["Survival"] = df["Survived"].map { |survived| survived && (survived == 1 ? "Survived" : "No") }

而后设置装备摆设模子参数:

练习及穿插考证:

实行练习工作train会主动把有标志的数据集按比例拆分红练习集和测试集,进行穿插考证:

rake app:classifiers:titanic:train summary=n

模子评价后果的F1 Score平均分是 0.81489,高于最开始的评分基准值,说明新增的特色整体上有更高的相干性。

要评价每个新特色的相干性,实行特色评价工作 evaluate_features:

亚美娱乐官方网站以出色的资源调配手段和深厚的文化底蕴创意为客户打造最适合休闲游戏的服务平台.

时间:2017-09-09 08:00:02 分类 亚美娱乐官方网站