遗传算法入门

数据挖掘 8年前 (2016-01-11) 浏览: 633 评论: 0

遗传算法 ( GA , Genetic Algorithm ) ,也称进化算法,是受达尔文的进化论的启发,借鉴生物进化过程而提出的一种启发式搜索算法。因此在介绍遗传算法前有必要简单的介绍生物进化知识。 一、进化论知识 作为遗传算法生物背景的介绍,下面内容了解即可: 种群(Population):生物的进化以群体的形式进行,这样的一个群体称为种群。 个体:组成种群的单个生物。 基因 ( Gene ) :一个遗传因子。 染色体 ( Chromosome ) :包含一组的基因。 生存竞争,适者生存:对

汉语编程,你也行!

开发随记 9年前 (2015-12-06) 浏览: 452 评论: 0

其实敲出这样一个标题,小编的内心是崩溃的。 因为我们日常接触到的绝大部分编程语言都是以英语为基础的,比如VB、C、C++、C#、Matlab、PHP、R、Java等等。 数据来源:TIOBE Index for December 2015 其实呢,像 C#,也是支持中文变量的,比如: int 年龄=0,这里“年龄”就是一个整型变量。 但是如果连关键字都是直接用汉字呢?比如说下面这位崩溃的程序猿遇到的奇葩事。 小编已经被深深的震惊了!你说你都这样了,为什么不直接使用易语言啊!! 好吧,其实汉语编程

模拟退火算法入门

数据挖掘 8年前 (2016-01-11) 浏览: 658 评论: 0

在介绍模拟退火前,需要首先介绍一下爬山算法。 一. 爬山算法 ( Hill Climbing ) 爬山算法是一种简单的贪心搜索算法,其基本原理是:每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。 爬山算法的实现很简单,当然缺点也很明显——容易陷入局部最优解,不一定能搜索到全局最优解。 如下图所示:假设C点为当前解,爬山算法搜索到A点这个局部最优解就会停止搜索,因为在A点无论向那个方向小幅度移动都不能得到更优的解。 爬山算法示意图 二. 模拟退火(SA,Simulate

地理围栏:如何判断一个点是否在多边形内部?

开发随记 8年前 (2016-02-22) 浏览: 2001 评论: 0

地理围栏(Geo-fencing)是LBS的一种应用。简单地说,就是用一个虚拟的栅栏围出一个虚拟地理边界,当用户进入或者离开某个特定区域,就会触发相应的互动。 如下图所示的三个商场,当用户进入其中某个商场的时候,服务器就会将对应商场的优惠券消息推送到用户。 在公共交通领域,地理围栏常用于公交车辆的报站。对于每个站点,事先预设一个地理围栏,当车辆进入站点区域后,车辆自动报站。该技术同样可以用来记录公交车辆的到站和离站时间。 那么我们如何判断一个点是否在多边形的内部呢?这是地理围栏的核心问题。本文将

统计学家刘军:大数据时代 统计学依然是数据分析的灵魂

数据挖掘 8年前 (2016-01-14) 浏览: 328 评论: 0

在数据“爆炸”的时代,大数据常常被寄予厚望。到底,什么样的数据才算大数据,怎样才能用好大数据,传统统计学还有用武之地吗?清华大学统计学研究中心前不久成立,著名统计学家、哈佛大学终身教授刘军担任主任。日前,刘军做客人民日报、人民网《文化讲坛》,分享他的思考。

JavaScript 逻辑运算符 “||” 和 “&&”

开发随记 7年前 (2017-08-27) 浏览: 452 评论: 0

一、先来说说 ||(逻辑或),从字面上来说,只有前后都是 false 的时候才返回 false,否则返回 true。 但是,从深层意义上来说的话,却有另一番天地,试下面代码: 显然,我们知道,前面 0 意味着 false,而后面 1 意味着 true,那么上面的结果应该是 true,而事实返回的结果是 1 。再看下面代码: 我们知道,前面 2 是 true,后面 1 也是 true,那返回结果又是什么呢? 测试结果是 2,继续看: 同样,前面 'a' 是 true,后面 1 也是 true,测试

思考:大数据并不是万能的

数据挖掘 8年前 (2016-02-03) 浏览: 659 评论: 0

不久之前我曾与一位大型银行的首席执行官一同用餐。他正在考虑是否要退出意大利市场,因为经济形势不景气,而且未来很可能出现一场欧元危机。 这位 CEO 手下的经济学家描绘出一片惨淡的景象,并且计算出经济低迷对公司意味着什么。但是最终,他还是在自己价值观念的指引下做出了决定。 这家银行在意大利已经有了几十年的历史。他不希望意大利人觉得他的银行只能同甘不能共苦。他不希望银行的员工认为他们在时局艰难之际会弃甲而逃。他决定留在意大利,不管未来有什么危机都要坚持下去,即便付出短期代价也在所不惜。 做决策之时他

罗曼诺夫斯基检验法(Romanowski)的临界值表

开发随记 7年前 (2017-09-05) 浏览: 1840 评论: 0

罗曼诺夫斯基检验法(Romanowski Test),又称 t 检验,是一种常见的异常数据检测方法,其基本流程为: (1)剔除疑似离群值 \(x_{o}\),计算新样本的均值和标准差: \[\overline{x'}=\frac{1}{n-1}\sum_{i=1}^{n-1}{x_i} \] \[s'=\sqrt{\frac{1}{n-2}\sum_{i=1}^{n-1}\left({x_i-\overline{x}}\right)^2}\] (2)计算统计量 \(K_{o}\) 的值: \[K

大数据时代警惕“幸存者偏差”

数据挖掘 8年前 (2016-02-01) 浏览: 696 评论: 0

有人说,数据会说谎。其实不然,数据本身不会说谎,它只会真是呈现记录的状态。 所谓的数据会“说谎”,其根本原因在于分析数据的那个人所追求的“真相”。 先来讲个故事: 1941年,第二次世界大战正打得如火如荼。有一天,美国哥伦比亚大学著名统计学家沃德 教授(Abraham Wald) 遇到了一个意外的访客,那是英国皇家空军的作战指挥官。 他说:“沃德教授,每次飞行员出发去执行轰炸任务,我们最怕听到的回报是:‘ 呼叫总部,我中弹了!’请协助我们改善这个攸关飞行员生死的难题吧!” 沃德接下这个紧急研究案

从公交 IC 卡数据,我们到底能获得什么?

模型与算法 9年前 (2015-11-28) 浏览: 1388 评论: 0

公交 IC 卡系统设计的初衷是方便乘客支付,服务企业结算。不过,当人们发现公交 IC 卡数据记录了乘客的大量出行信息(如卡编号、乘坐线路、乘坐车辆等)之后,开始积极尝试运用公交 IC 卡数据进行公交客流分析。可以说,公交客流分析只能算是公交 IC 卡数据的附加值。当然,现在已经有部分城市在着手改造既有的公交 IC 卡收费系统,使公交 IC 卡数据更加便于用来进行公交客流分析。 那么说到这里,就回到了题目中的问题:从公交 IC 卡数据,我们到底能获得什么? 公交客流?太笼统。 下面是北京交通发展研


切换注册

登录

忘记密码 ?

切换登录

注册

扫一扫二维码分享