概率论:根据桶中信息,猜猜手里有啥? 统计学:根据手中信息,猜猜桶里有啥?
概率论研究的是一个白箱子,你知道这个箱子的构造(里面有几个红球、几个白球,也就是所谓的分布函数), 然后计算下一个摸出来的球是红球的概率。
统计学面对的是一个黑箱子,你只看得到每次摸出来的是红球还是白球, 然后需要猜测这个黑箱子的内部结构,例如红球和白球的比例是多少?
统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。 描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。 推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。 变量(variable):统计上的绝对量指标,按连续性分可分为离散变量与连续变量。按性质分可分为确定性变量和随机变量。 分类变量(categorical variable):观测结果表现为某种类别的变量。 顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。 数值型变量(metric variable):又称定量变量,观测结果表现为数字的变量。 均值(mean):均值也就是平均数,有时特指算术平均数,这是相对其他方式计算的均值,求法是先将所有数字加起来,然后除以数字的个数,这是测量集中趋势,或者说平均数的一种方法。 中位数(median):又称中值,是按顺序排列的一组数据中居于中间位置的数,其可将数值集合划分为相等的上下两部分。 众数(mode):众数也就是数据集中出现频率最多的数字。