非参数方法——核密度估计(Kernel Density Estimation)

非参数方法——核密度估计(Kernel Density Estimation)

模型与算法 5年前 (2019-04-20) 浏览: 8040 评论: 0

核密度估计(Kernel density estimation,KDE),是一种用于估计概率密度函数的非参数方法。令 \(x_1,x_2,\cdots,x_n\) 为独立同分布 \(F\) 的 \(n\) 个样本点,设其概率密度函数为 \(f\),核密度估计如下: \[\hat{f}_h(x) = \frac{1}{n}\sum_{i=1}{n}{K_h(x-x_i)}=\frac{1}{nh}\sum_{i=1}{n}{K(\frac{x-x_i}{h}})\] 其中,\(K(.)\) 为核函

「推介」城市公共交通系统大数据分析系统

「推介」城市公共交通系统大数据分析系统

模型与算法 8年前 (2016-08-16) 浏览: 2671 评论: 0

本文要介绍的是一个以公交 IC 卡和车辆定位数据等城市公交系统大数据为基础的数据分析系统,可实现公交车辆运营分析、公交客流 OD 推导和公交客流分析等功能,为城市公交线网规划、优化调整和运营管理提供数据和决策支撑。

一种神奇的 Sqrt 函数实现方法

一种神奇的 Sqrt 函数实现方法

模型与算法 7年前 (2017-10-10) 浏览: 2198 评论: 0

在编程开发中,经常需要去计算一个数的平方根,小编一般是直接调用系统函数 Math.Sqrt()。 当然除了系统函数,我们也可以自己编写函数进行求解,常用的方法有二分法和牛顿迭代法。 二分法 二分法的基本思想:对于区间 \([m,n]\) 上连续不断且 \(f(m)·f(n) < 0\) 的函数 \(y=f(x)\),通过不断地把函数 \(f(x)\) 的零点所在的区间一分为二,使区间的两个端点逐步逼近零点,进而得到零点近似值。 显然,\(\sqrt{a}\) 是函数 \( f(x) =x^

地理围栏:如何判断一个点是否在多边形内部?

地理围栏:如何判断一个点是否在多边形内部?

开发随记 8年前 (2016-02-22) 浏览: 1994 评论: 0

地理围栏(Geo-fencing)是LBS的一种应用。简单地说,就是用一个虚拟的栅栏围出一个虚拟地理边界,当用户进入或者离开某个特定区域,就会触发相应的互动。 如下图所示的三个商场,当用户进入其中某个商场的时候,服务器就会将对应商场的优惠券消息推送到用户。 在公共交通领域,地理围栏常用于公交车辆的报站。对于每个站点,事先预设一个地理围栏,当车辆进入站点区域后,车辆自动报站。该技术同样可以用来记录公交车辆的到站和离站时间。 那么我们如何判断一个点是否在多边形的内部呢?这是地理围栏的核心问题。本文将

罗曼诺夫斯基检验法(Romanowski)的临界值表

罗曼诺夫斯基检验法(Romanowski)的临界值表

开发随记 7年前 (2017-09-05) 浏览: 1836 评论: 0

罗曼诺夫斯基检验法(Romanowski Test),又称 t 检验,是一种常见的异常数据检测方法,其基本流程为: (1)剔除疑似离群值 \(x_{o}\),计算新样本的均值和标准差: \[\overline{x'}=\frac{1}{n-1}\sum_{i=1}^{n-1}{x_i} \] \[s'=\sqrt{\frac{1}{n-2}\sum_{i=1}^{n-1}\left({x_i-\overline{x}}\right)^2}\] (2)计算统计量 \(K_{o}\) 的值: \[K

基于公交 IC 卡和 AVL 数据的下车站点推导

基于公交 IC 卡和 AVL 数据的下车站点推导

数据挖掘 8年前 (2016-04-25) 浏览: 1593 评论: 0

前言 当敲下《基于公交IC卡和AVL数据的下车站点推导》这个题目的时候,不禁轻轻舒了一口气:终于把自己挖的坑给填上了。 其实在很早之前,上车站点识别和下车站点推导的核心代码就已经写完了。但是因为数据原因(更重要的原因是懒),先前的代码比较碎片,功能的实现还时不时需要人工的参与。 今天,算是彻彻底底的把上车识别和下车推导的程序码完了。最终的版本也已经完全实现了图形化操作,与最初的控制台程序相比,用户已经可以自行设定绝大多数的推导参数。为了尽可能减少软件使用过程中的假死现象,还特意添加了启动界面,以

“大数据与城市空间分析研讨会”要点摘录

“大数据与城市空间分析研讨会”要点摘录

数据挖掘 9年前 (2015-12-16) 浏览: 1468 评论: 0

随着信息时代的到来,海量、多源的大数据将对城市问题咨询、城市规划应用、城市交通研究等方面的范式、技术革新产生重要影响。为推动大数据在城市研究中的应用,不断提高城市研究水平,2015 年 11 月 21 日,由同济大学建筑与城市规划学院、上海同济城市规划设计研究院、城市规划学刊编辑部共同主办的大数据与城市空间分析研讨会在同济大学成功举办。 会议嘉宾从多角度解读了对城市的理解、对大数据方法应用的心得,具体情况如下: 手机数据·活动特征 基于智能手机的个体用户活动特征分析 同济大学交通运输学院 &nb

从公交 IC 卡数据,我们到底能获得什么?

从公交 IC 卡数据,我们到底能获得什么?

模型与算法 9年前 (2015-11-28) 浏览: 1388 评论: 0

公交 IC 卡系统设计的初衷是方便乘客支付,服务企业结算。不过,当人们发现公交 IC 卡数据记录了乘客的大量出行信息(如卡编号、乘坐线路、乘坐车辆等)之后,开始积极尝试运用公交 IC 卡数据进行公交客流分析。可以说,公交客流分析只能算是公交 IC 卡数据的附加值。当然,现在已经有部分城市在着手改造既有的公交 IC 卡收费系统,使公交 IC 卡数据更加便于用来进行公交客流分析。 那么说到这里,就回到了题目中的问题:从公交 IC 卡数据,我们到底能获得什么? 公交客流?太笼统。 下面是北京交通发展研

基于公交 IC 卡和 AVL 数据的上车站点识别

基于公交 IC 卡和 AVL 数据的上车站点识别

模型与算法 8年前 (2016-04-14) 浏览: 1150 评论: 0

在车辆定位系统广泛应用的今天,也许你会感觉要去识别公交乘客的上车站点并不是一件特别困难的事情。 因为从纯理论的角度来看,有了 IC 卡数据,有了 AVL 数据(特别是到离站数据),上车站点的识别基本上没有什么可以研究的。但是当你具体实践的时候,你会发现从公交 IC 卡和 AVL 数据到上车站点数据之间有一段很长很长的路。 “咦,20 号的 IC 数据里面竟有 19 号的数据!” “这个站的到离站时间也丢了!” “怎么五条公交线路共用一个线路编号!” …… 总而言之,没有不可能,只有想不到。 公交

无锡·基于手机信令数据的居民出行调查项目

无锡·基于手机信令数据的居民出行调查项目

数据挖掘 9年前 (2015-12-03) 浏览: 1086 评论: 0

在《从公交IC卡数据,我们到底能获得什么?》一文中,曾简单介绍了基于公交IC卡的公交客流分析。今天在这里转载一篇介绍基于手机信令数据的居民出行调查项目的文章。与公交IC卡数据相比,手机信令数据覆盖的人群更加广泛,时间上也更加连续,是未来替代居民出行调查的潜在手段。当然,目前基于手机信令数据的分析方法还存在一些难点,比如说定位的精度、活动模式的识别、出行方式的识别等。


切换注册

登录

忘记密码 ?

切换登录

注册

扫一扫二维码分享