大数据时代警惕“幸存者偏差”

大数据时代警惕“幸存者偏差”

数据挖掘 8年前 (2016-02-01) 浏览: 696 评论: 0

有人说,数据会说谎。其实不然,数据本身不会说谎,它只会真是呈现记录的状态。 所谓的数据会“说谎”,其根本原因在于分析数据的那个人所追求的“真相”。 先来讲个故事: 1941年,第二次世界大战正打得如火如荼。有一天,美国哥伦比亚大学著名统计学家沃德 教授(Abraham Wald) 遇到了一个意外的访客,那是英国皇家空军的作战指挥官。 他说:“沃德教授,每次飞行员出发去执行轰炸任务,我们最怕听到的回报是:‘ 呼叫总部,我中弹了!’请协助我们改善这个攸关飞行员生死的难题吧!” 沃德接下这个紧急研究案

从公交 IC 卡数据,我们到底能获得什么?

从公交 IC 卡数据,我们到底能获得什么?

模型与算法 9年前 (2015-11-28) 浏览: 1388 评论: 0

公交 IC 卡系统设计的初衷是方便乘客支付,服务企业结算。不过,当人们发现公交 IC 卡数据记录了乘客的大量出行信息(如卡编号、乘坐线路、乘坐车辆等)之后,开始积极尝试运用公交 IC 卡数据进行公交客流分析。可以说,公交客流分析只能算是公交 IC 卡数据的附加值。当然,现在已经有部分城市在着手改造既有的公交 IC 卡收费系统,使公交 IC 卡数据更加便于用来进行公交客流分析。 那么说到这里,就回到了题目中的问题:从公交 IC 卡数据,我们到底能获得什么? 公交客流?太笼统。 下面是北京交通发展研


切换注册

登录

忘记密码 ?

切换登录

注册

扫一扫二维码分享