taoCMS是基于php+sqlite/mysql的国内最小(100Kb左右)的功能完善的CMS管理系统

[置顶]taoCMS2.5Beta5发布,组件升级、安全加固、支持BAE

发布时间:2012-09-23 | 类别:taoCMS发布 | 阅读:409890 | 评论:24283 | 标签:taocms taocms下载

[置顶]taocms的mod版本

发布时间:2013-07-01 | 类别:taoCMS发布 | 阅读:216154 | 评论:9588 | 标签:taocms taocms mod版

kibana查询语法

单项term查询例: 搜 Dahlen, Malone字段field查询field:value   例:city:Keyport, age:26通配符? 匹配单个字符      例: H?bbs* 匹配0到多个字符           例: H*注意: ? * 不能用作第一个字符,例如: ?text    *text范围查询age:[20 TO 30] &n
发布时间:2017-10-10 | 类别:未分组 | 阅读:17459 | 评论:0 | 标签:

有效性指标中的区分能力指标

作者:穿靴子的猫链接:https://www.zhihu.com/question/37405102/answer/106668941来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。KS(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估,指标衡量的是好坏样本累计分部之间的差值。好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。KS的计算步骤如下:1. 计算每个评分区间的好坏账户数。2. 计算每个评分区间的累计好账户数占总好账户数比率(good%)和累计坏账户数占总坏账户数比率(bad%)。3. 计算每个评分区间累计坏账户占比与累计好账户占比差的绝对值(累计good%-累计bad%),然后对这些绝对值取最大值即得此评分卡的K-S值。&am
发布时间:2017-10-02 | 类别:未分组 | 阅读:19410 | 评论:0 | 标签:

Bagging和Boosting 概念及区别

 Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本)。1、Bagging (bootstrap aggregating)Bagging即套袋法,其算法过程如下:A)从原始样本集中抽取训练集。每轮从原始样本集中使用Bootstraping的方法抽取n个训练样本(在训练集中,有些样本可能被多次抽取到,而有些样本可能一次都没有被抽中)。共进行k轮抽取,得到k个训练集。(k个训练集之间是相互独立的)B)每次使用一个训练集得到一个模型,k个训练集共得到k个模型。(注:这里并没有具体的分类算法或回归方法,
发布时间:2017-09-26 | 类别:未分组 | 阅读:18397 | 评论:0 | 标签:

TA-Lib学习笔记-K线模式识别

写在前面之前看过蜡烛图相关的书,虽然我不是很信这种老旧的统计模式,但是还算熟悉,尽量把talib里的模式名字翻译做中文,方便大家网上查询,并每个都做了简介。翻了下百度,大概没有比这篇更全的文档了。本来应该配上模式的K线图与检测代码的,但是脖子实在太疼,还是先缓一缓吧。若有谬误之处,请随时指正,谢谢。说明x日K线模式指的是x周期K线模式,按选择的K线周期不同而不同实体指 开盘价-收盘价的长度上影线指 最高价-max(开盘价, 收盘价)的长度下影线指 最低价-min(开盘价, 收盘价)的长度向上跳空指 T日最低价大于T-1日最高价向下跳空指 T日最高价小于T-1日最低价K线模式识别函数名:CDL2CROWS名称:Two Crows 两只乌鸦简介:三日K线模式,第一天长阳,第二天高开收阴,第三天再次高开继续收阴,收盘
发布时间:2017-09-24 | 类别:未分组 | 阅读:18769 | 评论:0 | 标签:

数据挖掘模型中的IV和WOE详解

1.IV的用途IV的全称是Information Value,中文意思是信息价值,或者信息量。我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我们有200个候选自变量,通常情况下,不会直接把200个变量直接放到模型中去进行拟合训练,而是会用一些方法,从这200个自变量中挑选一些出来,放进模型,形成入模变量列表。那么我们怎么去挑选入模变量呢?挑选入模变量过程是个比较复杂的过程,需要考虑的因素很多,比如:变量的预测能力,变量之间的相关性,变量的简单性(容易生成和使用),变量的强壮性(不容易被绕过),变量在业务上的可解释性(被挑战时可以解释的通)等等。但是,其中最主要和最直接的衡量标准是变量的预测能力。“变量的预测能力”这个说法很笼统,很主观,非量化,在筛选变量的时候我们总不
发布时间:2017-09-17 | 类别:未分组 | 阅读:18929 | 评论:0 | 标签:iv

机器学习中的算法(1)-决策树模型组合之随机森林与GBDT

版权声明:    本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com。也可以加我的微博: @leftnoteasy 前言:    决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不够的。    模型组合(比如说有Boosting,Bagging等)与
发布时间:2017-09-10 | 类别:未分组 | 阅读:20244 | 评论:0 | 标签:

集成学习自动权重设置python实现

[python] view plain copyimport pandas as pd  import numpy as np  from scipy.optimize import minimize  from sklearn.cross_validation import StratifiedShuffleSplit  from sklearn.ensemble import RandomForestClassifier  from 
发布时间:2017-09-10 | 类别:未分组 | 阅读:22709 | 评论:0 | 标签:

predict_proba用法

predict_proba返回的是一个n行k列的数组,第i行第j列上的数值是模型预测第i个预测样本的标签为j的概率。所以每一行的和应该等于1.举个例子>>> from sklearn.linear_model import LogisticRegression>>> import numpy as np>>> x_train = np.array([[1,2,3], [1,3,4], [2,1,2], [4,5,6],
发布时间:2017-09-10 | 类别:未分组 | 阅读:21013 | 评论:0 | 标签:

公告

taoCMS发布taoCMS2.5Beta5(最后更新14年05月25日),请大家速速升级,欢迎大家试用和提出您宝贵的意见建议。

捐助与联系

☟请使用新浪微博联系我☟

☟在github上follow我☟

标签云