引入
这是一篇helloworld,主要记录一下开始折腾的时间。
写一些鸡汤样式的文字,什么每天前进一点点等等,其实都是瞎说,多说无益。
markdown格式
本博客中,渲染markdown的引擎是 kramdown, 具体语法参见 这里。
当然markdown最基础的语法请参照这里。
这里着重介绍下markdown的格式,参考:wiki百科。
实际的编辑器,在MAC推荐使用 typora,很多时候,挺好用的。
这是1号标题&目录
这底下都是标题的,所有的标题都会自动进入到目录中,启用目录参见文章头部
2号标题
3号标题
4号标题
5号标题
6号标题
文字的表现形式
我是一段示例文字1,有粗体,斜体,下划线,内联代码,删除线,
文内链接
这是一个文内链接的例子。
这个链接在鼠标悬浮时没有标题。
这个链接是本地资源。
引用链接
这是一个引用链接的例子。
注意,这里的id没有大小写区分,如果省略id,则前面方括号的内容会被用作id。
也可以写成

无序列表
- 1
- 2
- 3
有序列表
- 1
- 2
- 3
我是一段引用,很好看是不是
引用内部啥都能写
我是一段示例文字,有粗体,斜体,下划线,
内联代码,删除线,
各类分割线
专业表现形式
表格
| 2000 | 5000 | 8000 | 10000 | 正负样本悬殊 | |
|---|---|---|---|---|---|
| DecisionTreeClassifier(gini) | 98.15% | 99% | 99.13% | 99.31% | 99.94% |
| DecisionTreeClassifier(entropy) | 98.6% | 99.28% | 99.55% | 99.53% | 99.96% |
| RandomForestClassifier | 98.3% | 99.03% | 99.33% | 99.46% | 99.93% |
| GradientBoostingClassifier | 99.3% | 99.45% | 99.51% | 99.57% | 99.64% |
代码
import java.lang.String;
数学图表
集合信息的度量方式称为香农熵,简称熵(entropy)。
熵就是信息的期望值。单位是”比特”(bit)。一个比特是一位二进制数字。比如 “将一个硬币朝天空抛起4次,最后四次落地时候的朝向” 这句话中包含一定的信息量。最终答案需要我们猜测4次,每次猜一次硬币落地的结果,猜测结果只有2种,分别是正面和反面。每个面朝向的概率是1/2。
如果一次关于1/2猜测的信息量=1,那么上面一句话的信息量=4,比2更少的情况就是1,不需要猜测,那么信息量就是0。
同理,如果向上抛起的是一个骰子,每次猜测的结果有6种,每种结果出现的概率是1/6,每次猜测的次数大约=2.5(类似折半查找)。那么上面语句信息量大约是2.5*4=10
引入对数的话,每次猜测可以表示为:
其中,p代表发生x事件的概率,x代表事件,i代表事件的结果
熵的公式则如下
其中n是分类的数目,注意,在最终的熵需要乘以事件的概率,对于上面硬币的例子
其中,p代表发生x事件的概率,x代表事件,i代表事件的结果
-
我是脚注,可以是一些引用,或者一些超链接,或者是图片地址等 ↩