统计小百科

时间:2024-04-09 15:06:01

统计学是数据分析[ SQL、数据分析实战再更新] 湿 的基础学科,程序代码一律 Python 实现。

star ...

  • 概率与机会
  • 变量与常量
  • 数据的类型
  • 混淆的术语

你好,我是 Debroon。介绍一下,这是 Debroonee。

Debroonee : 以下是我们的聊天,没错是聊天,关于这个问题我需要用分析矩阵做一个分解,再用回归曲线拟合一下,最后借助海氏系统求出加权平均数...babababababba...

统计小百科

Debroon : 楼上是我朋友,请大家给我一个面子,允许 ta 再装一会。等下和 ta 切磋切磋,绝对没有什么沉甸甸的知识。只是一些统计学基础知识呃,其实是我学习统计学的笔记。

 

1. 什么是概率 ??

           概率描述某件事情出现的可能性大小。

           e.g.  天气预报:电视台采用概率值表示天气现象出现的可能性大小,ta 代表的不是某种天气☁️是否出现,而是某种天气☁️出现的可能性有多大。 

2. 概率与机会的关系 ??

          概率是在 0 ~ 1 之间的一个数,ta 说明了某事情的机会是多少。

          e.g.  天气预报中会提到降水概率,如果降水概率超过 80% ,那么很可能下雨☔️,低于 10% 就不太可能下雨。

          这种概率不可能超过 100%,也不会少于 0%。

3. 什么是条件概率 ??

           Debroonee : 小哥,我问你一个问题 !

           小明 : 没必要,这世界上的问题都可以用 "关我皮试" and "关你皮试" 来回答。

           统计小百科

          Debroonee :我该说什么好,emmm ,把喜欢捣乱的给我丢出去。好,Deboon 我说了哈 ~

          Debroon: 关我,咳咳,问题一。

          Debroonee :一个家庭有俩个孩子,问都是女孩的概率有多大 ?

          Debroon:   男男、男女、女男、女女  , 


 统计小百科

Debroonee :有本事回答这个,一个家庭有俩个孩子,其中一个是女孩,另一个是女孩的概率是多少 ?

Debroon : 不是男孩就是女孩,统计小百科  是吗!

 Debroonee : Debroon 你是不是没过脑呀,恩,应该是啦,明明就是  统计小百科 !

 Debroon :我读书少,你不要骗我 。

 Debroonee :不信呀那你再回答下面一个,一个家庭有俩个孩子,大孩子是女孩,小的是女孩的概率是多少 ?

 Debroon :统计小百科  

 Debroonee :恩,对头。你仔细看第二个问题和第三个问题的条件。问题二,只是说,这个家庭的俩个孩子其中一个是女孩,于是有三种可能 : 兄妹、姐妹、姐弟,姐妹只是其中一种,所以答案是  统计小百科  。统计小百科

问题三的条件,第一个是女孩,所以这个家庭限制在俩种情况,只有 姐弟 和 姐妹 。

 Debroon :哎呀,原来如此~ 同九义汝何秀 ??

Debroonee : 我们将这种在某种 条件 和 信息 下对事件发生的可能性大小称为 条件概率 。


4.  相关事件: 如果几个事情互有影响,则为相关事件; 即一件事情发生与否,会影响到另一件事情发生的概率。

                        e.g.  酒驾与车祸

5.  独立事件: 如果几件事情互不相影响,则为独立事件;即无论其他事情发生与否,某件事情发生的概率总是保持不变。

                        e.g.  虽然我这么可爱,可是和寄快递没什么关系,虽然我想送你一件非常可爱的礼物????,可是快递员把我从礼物盒里拉了出来。

6.  互斥事件: 事件 A 和 事件 B 不可能同时发生,即 A 和 B 同时发生的概率为 0,P(AB) = 0

                       e.g. 美国????????总tong 只能选一个,选了 川普 就不是 希拉里。

                      Debroon : 我也考考你,Debroonee ,投硬币,连续俩次正面朝上是什么事件 ? 

                      Debroonee : 独立,投第二枚硬币并不受第一枚影响。 

                      Debroon : 从抽屉里拿袜子,拿出一只后,再拿一只,直到找到一双 ?

                      Debroonee : 相关,取出一只袜子,下一次取袜子时,原来的袜子数就减少了,影响到了概率。

7. 变量与常量有什么关系 ??

             都是统计学研究中的对象特征,在数量的指标中,

             不变的数量指标称为 常量 或 常数

              可变的数量指标称为 变量

             e.g.  一本书的页数是一个常量,火车车厢是一个常量

                     博客的字数是一个变量,火车车厢的旅客是一个变量

8. 变量有哪些类型 ??

             按照变量值是否连续,分为连续变量和离散变量

             离散变量 :其数值只能用 自然数 和  整数 为单位计算,e.g. 企业个数、工作人员

             连续变量:这一定区间内可以 任意取值 的变量,其数值是连续不断的,e.g. 身高、血压、体重

9. 怎么区分离散变量和连续变量??

              连续变量:是一直叠加上去的,是逐渐增长,增长量可以划分为固定单位,即 1、2、3··· 

              e.g. 树首先是 1.50 ,然后长到 1.51 、1.52 ···

               离散变量:是对所有统计的对象计数,增长量是非固定的,不是逐渐增长

               e.g. 一个企业第一年工作人员 是 5 人,第二年是 70 人

                那么人的年龄是连续变量还是离散变量呢?

                按照这个人的习惯,年龄按整数取整,如 13、18、20··· 这是离散变量

                按照西方的习惯,年龄是由整数年龄+月+天的形式,如 7岁5个月8天,这是连续变量

 

10. 变量分为定性变量和定量变量

                 定量变量:由数字量化的变量,如 人的体重、男女生的人数等

                 定性变量:像 性别、观点 之类的无法用数字来表示的变量

 

11. 数据的几种类型 

             按计量层次分:数值型、分类型、顺序型

             数值型:可以由具体的数值来计量,ta 是对事物的精准测度,如 收入 20000RMB、考试分数 99、年龄 3 

             分类型:性别按 男女 分,血型按 O、A、B、AB 分

              顺序型:各类别之间有程度的差别,如 奖学金按照一等 、 二等、三等分

具体实例:

统计小百科

另外不同的数据类型间是可以相互转换的

                数值型可以变成分类型,只需要给出分界线

统计小百科

分类型数据转换为数值型

统计小百科

统计小百科

这种数据转换的目的是为使分类的数据尽可能量化,以便进行更好的数据分析

 

按时间状况 分为 截面数据和时序数据

                     横截面数据:同一时间,由不同统计单位和相同统计指标组成的一组数据,如 股票数据

统计小百科

                     时序数据:不同时间点上收集的数据,反映的是某一现象的变化状态或程度

统计小百科

12. 什么是绝对数与相对数 ??

              绝对数:反映客观现象总体,在一定时间、地点的条件下的总规模、总水平的综合性指标,如 200米、300家

              相对数:由俩个有联系的指标对比计算而得到的数值,如 1 : 3、 20%、 7倍

13. 什么是频率和频数 ??

               频数:一组数据中个别数据重复出现的次数

统计小百科

               频率:每个小组的频数与数据总和的比值,ta 代表的是某组在总体中出现的频繁程度,一般采用百分数表示,所有组的频率总和等于 100%

统计小百科