以下为《概率论与数理统计笔记》的无排版文字预览,完整内容请下载
概率论的基本概念
1 随机试验
1.对随机现象的观察、记录、试验统称为随机试验.
2.随机试验的所有结果构成的集合称为的样本空间,记为, 称中的元素为基本事件或样本点.
3.可以在相同的条件下进行相同的实验;每次实验的可能结果不止一个,并且能事先明确试验的所有可能结果;进行一次试验之前不能确定哪一个结果会实现.
2.样本空间、随机事件
1.对于随机试验,尽管在每次试验之前不能预知试验结果,但试验的所有可能结果组成的集合是已知的.我们将随机试验的所有可能结果组成的集合称为的样本空间,记为样本空间的元素,即的每个结果称为样本点.
2.一般我们称的子集为的随机事件,当且仅当所包含的一个样本点发生称事件发生.如果将亦视作事件,则每次试验总是发生,故又称为必然事件。为方便起见,记为不可能事件,不包含任何样本点.
3.若,则称事件包含事件,这指的是事件发生必导致事件的发生。若且,即,则称事件与事件相等.
4.和事件
5.当时,称事件与不相容的,或互斥的.这指事件与事件不能同时发生.基本事件是两两互不相容的.
6.
7. 事件 A 的对立事件:设 A 表示事件 “A 出现”, 则“事件 A 不出现”称为事件 A 的对立事件或逆事件.
事件间的运算规律:
3.频率和概率
1.记
频率 反映了事件发生的频繁程度.
2.频率的性质:
3.当重复试验次数逐渐增大时,频率 呈现出稳定性,逐渐稳定于某个常数.这种“频率稳定性”即通常所说的统计规律性.我们让试验重复大量次数,计算频率 以它来表征事件发生可能性的大小是合适的. 随的增大渐趋稳定,记稳定值为. 的稳定值定义为的概率,记为.
4.概率定义:设是随机试验,是它的样本空间.对于的每一个事件赋予一个实数,记为,称为事件的概率.
满足下列条件:
非负性:对于每一个事件,有
规范性:对于必然事件,有
可列可加性:设是两两相互不相容的事件,即对于,,,则有 ;
5.概率定义推得的重要性质.
(1)
(2)有限可加性 若是两两互不相容的事件 则有
(3)对于任一事件1
(4)对于任一事件A有
(5)
4.等可能概型(古典概型)
1.当试验的样本空间只含有有限个元素,并且试验中每个基本事件发生的可能性相同,具有这样特点的试验是大量存在的,则称这种试验为等可能概型.它在概率论发展初期曾是主要的研究对象,所以也称为等可能概型.
2. 即是等可能概型中事件的概率的计算公式.
5.条件概率
1. 条件概率定义:设是两个事件,且,称
为在事件发生条件下事件发生的条件概率.
2.符合条件概率的三个条件,即:
(1)非负性 对于每一事件B, 有
(2)规范性 对于必然事件S,有
(3)可列可加性 设是两两互不相容的事件,则有
3. 乘法定理:设,则有
推广: 一般设 为n个事件,,且有
.
4.全概率公式:设试验的样本空间为,为的事件, 为的一个划分,且,则
5.贝叶斯公式:设试验的样本空间为,为的事件, 为的一个划分,且,则
6.独立性
1.定义:设是两事件,如果满足等式,则称事件相互独立,简称独立.
若,则相互独立与互不相容不能同时成立.
2. 定理一:设是两事件,且>0,若相互独立,则=.反之亦然.
3.定理二:若事件A与B相互独立则与,与,与也相互独立.
4.推广定义:设是三个事件,如果满足等式,,,则称事件相互独立.
5.
随机变量及其分布
随机变量
1.定义:设随机试验的样本空间是定义在样本空间上的实值单值函数,称为随机变量.
常见的两类随机变量.
2.本书中一般以大写字母如表示随机变量,而以小写字母表示实数.
离散型随机变量及其分布律
1.定义:有些随机变量,它全部可能取到的不相同的值是有限个或可列无限多个,这种随机变量称为离散型随机变量.
2.定义:取值可数的随机变量为离散量.
称为离散型随机变量X的分布律。满足如下两个条件:
(1) (2)
3.(0-1)分布
设随机变量X只可能取0与1两个值,它的分布律是
,则称 X 服从(0-1)分布或两点分布.
(0-1)分布的分布律也可写成
4.设试验只有两个可能结果: 及, 则称为伯努利试验.设,此时,将独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验.
刚好是二项式的展开式中出现的那一项,故称随机变量服从参数的二项分布,记为.特别,当时二项分布化为,这就是(0-1)分布.
5.泊松分布
设随机变量X所有可能取值为0,1,2…..而取各个值的概率为
.
3.随机变量的分布函数
1. 分布函数的定义
设是一个连续随机变量,称为 的分布函数.是随机变量, 是自变量.
由定义,对任意实数 ,随机点落在区间的概率为:.
2. 分布函数性质
即任一分布函数处处右连续.
3.公式
4.连某某随机变量及其概率密度
1.如果对于随机变量的分布函数,存在非负函数,使对任意实数有,则称为连某某随机变量,其中函数称为的概率密度函数简称概率密度。在实际应用中遇到的基本上是离散型或连某某随机变量.
2.概率密度性质:
(1)
(2)
(3)对于任意实数,,
(4)若在点x处连续则有
3.均匀分布:设连某某随机变量具有概率密度=,则称在区间上服从均匀分布.记为.易知.
4指数分布:设连某某随机变量具有概率密度 ,其中为常数,则称服从参数为的指数分布.易知.
5 正态分布:设连某某随机变量具有概率密度, 则称X服从参数为的正态分布.特别的,当时,称X服从标准正态分布.
5.随机变量的函数分布
定理:设随机变量X具有概率密度,,又设函数处处可导且恒有,则Y=g(X)是连某某随机变量,其概率密度为 .
多维随机变量及其分布
1.二维随机变量
1.设随机试验的样本空间为: 为定义在上的随机变量,由它们构成一个随机向量 ,叫二维随机向量或二维随机变量.
2.定义:设二维随机变量,对任意实数,二元函数,称为的(联合)概率分布函数.
二维随机变量分布函数的性质:
(1)是变量和的不减函数,即对任意固定的,当时;对于任意固定的,当时.
(2),且对于任意固定的,,对于任意固定的,,,
(3) =,=,即关于x右连续,关于y也右连续.
(4) 对于任意,,,,下述不等式成立: .
如果二维随机变量全部可能取到的不相同的值是有限对或可列无限多对,则称是离散型的随机变量.
3. 对于二维随机变量的分布函数.如果存在非负的函数使对于任意有,则称是连某某的二维随机变量,函数称为二维随机变量的概率密度,或称为随机变量和的联合概率密度.
概率密度具有以下性质:
(1)
(2)
(3) 设是平面上的区域,点落在内的概率为
(4) 若在点连续 则有
4. 两个常用的分布
(1)均匀分布:定义设为闭区域面积为,若随机变量 的(联合)密度为:
则称: 服从上的均匀分布.
(2)二维正态分布:若二维随机变量 的概率密度为:
则称: 服从参数为(1、(2、(1、(2、(的二维正态分布.其中(1>0,(2>0,|(|(1是常数.记为:~ ((1、(2、(12、(22、() .
2.边缘分布
1.二维随机变量作为一个整体,具有分布函数,而和都是随机变量,也有也有分布函数,将他们分别记为,,依次称为二维随机变量关于和的边缘分布函数。边缘分布函数可以由的分布函数所确定,事实上=.
2.是一个连某某随机变量,则其概率密度 和 分别称,为关于和关于的边缘概率密度函数.
3. 离散型随机变量的边缘概率分布:
3.条件分布
1.定义:设使二维离散型随机变量,对于固定的,若有,则称
,为在条件下随机变量的条件分布律。同样,对于固定的,若则称,为在条件下随机变量的条件分布律.
2.定义:设二维随机变量的概率密度为,关于的边缘概率密度为.对于固定的,,则称为在的条件下的条件概率密度,记为. 称为在的条件下,的条件分布函数,记为即
,
类似的,可以定义和.
离散型随机变量的条件分布
4.连某某随机变量的条件分布
4.相互独立的随机变量
1.定义:设, , 分别为二维随机变量的(联合)分布函数和边缘分布函数,若对于所有有: = ·,即:,则称与相互独立.
2.定理 a. 相互独立 (
b.离散型随机变量相互独立充要条件是对于任意有: .
5.两个随机变量函数的分布
1. 的分布
设的概率密度为,则分布函数为
,由概率密度的定义,即得到的概率密度为,由的对称性,又可写成.特别,当和相互独立是,设边缘概率密度为,,则上面两个公式可以化为,,这两个公式称为卷积公式,记为即
更一般地,有限个相互独立得正态随机变量的线性组合仍然服从正态分布.
2.及的分布
设是两个相互独立的随机变量,他们的分布函数分别为, ,现在来求及的分布函数。 又由于和相互独立,得到 的分布函数为
即有 类似的,可得到的分布函数为
即.
第四章 随机变量的数字特征
1. 数学期望
1. 定义:设离散型随机变量的分布律为=,若级数绝对收敛,则称级数的和为随机变量的数学期望,记为=.
2. 设连某某随机变量的概率密度为,若积分的值为随机变量的数学期望,即=.
数学期望简称期望,又称均值.
3. 定理:设是随机变量的函数: (是连续函数).
1) 若是离散型随机变量,它的分布律为=,若级数绝对收敛,则有==.
2) 若是连某某随机变量,它的概率密度为 若绝对收敛则有== .
4.数学期望的重要性质:
(1) 设是常数,则有
(2)设是一个随机变量,是常数,则有
(3) 设是两个随机变量,则有 .这一性质可以推广到任意有限个随机变量之和的情况.
(4) 设是相互独立的随机变量,则有;这一性质可以推广到任意有限个相互独立的随机变量之积的情况.
5. 几个重要随机变量的期望
(1)0-1分布的数学期望:
(2)二项分布:
(3) 泊松分布:
(4) 均匀分布.
(5) 指数分布:
(6)正态分布:
2. 方差
1.定义:设是一个随机变量,若存在,则称为的方差,记为即 .在应用上引入,记为 称为标准差或均方差.
2.离散型随机变量:, 其中.
连某某随机变量:= 其中是的概率密度.
随机变量X的方差可按计算.
3.方差的重要性质
(1)设是常数,则有
(2)设是一个随机变量,是常数,则有
(3) 设是两个随机变量,则有
若相互独立,则有 这一性质可以推广到任意有限个相互独立的随机变量之和的情况
(4) 的充要条件是以概率1取常数,
几个重要随机变量的方差
(2) 泊松分布:
(3) 均匀分布:
(4) 指数分布:
(5) 正态分布:
3. 协方差及相关系数
1 定义:称为随机变量X与Y的协方差,记为,即,称为随机变量X与Y的相关系数.
2.协方差性质
1)
2)
3)
4)
5) 若相互独立,则
6)
3. 定 理:
(1)
(2)的充要条件是,存在常数使
(3)当=0时,称和不相关
(4)当和相互独立时由=0,知=0即X,Y不相关,反之,若不相关,却不一定相互独立.
4.矩、协方差矩阵
1.定义:设和是随机变量,若,存在,称它为的阶矩。若 存在,称它为的阶中心矩。若 存在,称它为和的阶混合矩.若 ,存在,称它为和的阶混合中心矩.
2.设维随机变量的二阶混合中心距
都存在,则称矩阵为维随机变量的协方差矩阵.
3. 维正态变量的性质:
第五章 大数定律和中心极限定理
大数定律
2.
3.
4.
2.中心极限定理
1.
2.
数据集中趋势
数据集中趋势的度量包括:均值(mean),分位数,中位数(median),众数(mode)。
1. 平均数:一个数列的和除以所含个数。
2. 分位数: 最大值和最小值之间的一个数值,可使变量的一部分观察值小于或等于它,另一部分观察值大于或等于它。
3. 百分位数:按照升序排列的数列中,其左侧的观察个数在整个样本中所占的百分比为p%,其右侧的观察个数在整个样本中所占的百分比为(100-p)%。
4. 中位数:一组数据按大小顺序排列后,处在数列中点位置的数值,n为奇数时,其值等于第(n+1)/2个数;n为偶数时,其值等于第n/2和n/2+1个数的平均值。
5. 众数:一组数据中出现次数最多的变量值。
第一章 概率论的基本概念?11
确定性现象随机现象:在大量重复试验中其结果又具有统计规律性的现象
1. 随机试验 11
2. 样本空间、随机事件 12
随机试验E,E的所有可能结果组成的集合称为E的样本空间,记为S,样本空间的每个元素,即E的每个结果,称为样本点
称试验E的样本空间S的子集为E 的随机事件,简称事件,在每次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生。
基本事件:由一个样本点组成的单点集。还有必然事件、不可能事件
3. 频率与概率 15
相同条件下,进行了n次试验,在这n次试验中,事件A发生的次数nA称为事件A发生的频数,比值nA/n称为事件A发生的频率
什么是充分统计量?
数理统计的本质是通过样本来做推断,也就是说统计推断是这个学科的主要负责功能。而直观来说,推理需要证据,需要信息,这也就是充分统计量诞生的来源:统计量可不可以尽量少,并且包含样本提供的我们感兴趣的所有信息?你想,如果可以包含一个样本的所有信息,那么这个统计量,直白的来说就可以代替这个样本中的所有数据,从某种意义上来说也是一种降维。这也是为什么充分统计量具有非常大的统计学上的意义。
很明显我们不可能说做加工不丢失信息,但是我们完全可以做到保留所有我感兴趣的信息。书上给了一个非常简单的例子来理解:如果你希望知道样本的均值,那么你需不需要知道一组数据的顺序?123和321是否是相同的样本?我们一般认为,如果我们只关心均值这个参数,那么这两个样本是没有差别的。
有了这个理解,我们从概率意义上来解释。我们在第一节有说,样本本身会存在一个联合密度函数?F(x)?,这个函数本质上也就刻画了样本所包含的所有信息(因为在统计学意义上,如果我们对数据拿到了它的不含未知量的分布,那么我们就认为我们已经拿到了所有王牌)。
一般,若X~N(μ,σ2),我们只要通过一个线性变换就能将它化成标准正态分布。
3σ法则:尽管正态变量的取值范围是(-∞, +∞),但它的值落在 (μ-3σ,μ+3σ)内几乎是肯定的事,这就是人们所说的“3σ”法则
分位点,略
应用:在自然现象和社会现象中,大量随机变量都服从或近似服从正太分布,例如,一个地区的男性成年人的身高,测量某零件长度的误差,海洋波浪的高度,半导体器件中的热噪声电流或电压等,都服从正态分布。
在概率论和数理统计的理论研究和实际应用中正态随机变量起着特别重要的作用。
5. 随机变量的函数的分布 60
就是由X组成的函数的分布,比如:X是随机变量,Y=X-1,这个函数的分布。如果X是离散型的,Y也是离散的,用分布律;如果X是连续的,Y也是连续的,用密度函数。
第三章 多维随机变量及其分布 70
二维随机变量
离散型随机变量:求分布律,连某某随机变量:求概率密度
二维离散型随机变量的联合分布:F(x,y)
?二维离散型随机变量的边缘分布:Fx(y), Fy(x)
二维离散型随机变量的条件分布:两者之间的关系
二维连某某随机变量的联合概率密度
性质:非负性、归一性(概率和为1)、求概率、分布函数与概率密度函数之间的关系
二维连某某随机变量的边缘分布:
?
第四章 随机变量的数字特征 100
上一章介绍了随机变量的分布函数、概率密度和分布律,它们都能完整地描述随机变量,但在某些实际或理论问题中,人们感兴趣于某些能描述随机变量某一特征的常数,例如,一篮球队上场比赛的运动员的身高是一个随机变量,人们常关心上场运动员的平均身高。
一个城市一户家庭拥有汽车的数量是一个随机变量,在考察城市的交通情况时,人们关心户均用户汽车的辆数。
评价棉花的质量时,既需要注意纤维的平均长度,又需要注意纤维长度与平均长度的偏离程度,平均长度较大,偏离程度较小,质量就较好。
这种由随机变量的分布所确定的,能刻画随机变量某一方面的特征的的常数称为数字特征,它在理论和实际应用中都很重要,本章将介绍几个重要的数字特征:数学期望、方差、相关系数和矩。
如名称所述,课程内容分为两部分:概率论和数理统计。这两部分是有着紧密联系的。在概率论中,我们研究的随机变量,都是在假定分布已知的情况下研究它的性质和特点;而在数理统计中,实在随机变量分布未知的前提下通过对所研究的随机变量进行重复独立的观察,并对观察值对这些数据进行分析,从而对所研究的随机变量的分布做出推断。因此,概率论可以说是数理统计的基础。在长达一个学期的学习中,我增长了不少课程知识,同时也获得了不少对于学习数学这门课程的体会。
一、?课程的价值及作用
概率论与数理统计是一门在大学数学中极为重要的课程。以我个人的理解,如果说微积分、线性代数只是分析数学、或是说解题的工具,那么概率论才是真正把实际问题转换为数学问题的学问,因为它解决的并非纯数学问题,不是给你一个命题让你去解决,而恰恰是让你去构思命题,进而构建模型来想方设法解决实际问题。假设检验就是一个典型的例子,要解决问题,你要先建立假设,还要估计总体的分布,如果是大样本问题,可以近似看作正态分布……学习概率论和数理统计,我很大的一个感受就是和实际问题联系很紧密,对问题需要有更深层次的思考,因而学起来也比微积分和线代更吃力。
在大学中,概率论与数理统计是理工科及经管类学科的必修课之一,因其与生活实践和科学试验有着非常紧密的联系,而且是许多新发展的前沿学科(如信息论、人工智能等)的基础。若能掌握好概率的思想和数理统计的 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 -连某某 一维--二维--多维离散: 两点分布,二次分布,泊松分布,几何分布连续: 均匀分布,指数分布,正态分布
2.基本运算概念: 概率密度,数学期望,方差,协方差,相关系数
数理统计部分:
样本基本概念:X2分布,t分布,F分布,正态总体的样本均值,方差,k阶原点矩,k阶中心矩“概率论与数理统计”是理工科大学生的一门必修课程,由于该学科与生活实践和科学试验有着紧密的联系,是许多新发展的前沿学科(如控制论、信息论、可靠性理论、人工智能等)的基础,因此学好这一学科是十分重要的。
随机事件及其运算
概率论与数理统计研究的对象是随机现象. 概率论是研究随机现象的模型(即概率分布),数理统计是研究随机现象的数据收集与处理。
随机现象: 在一定的条件下,并不总是出现相同结果的现象称为随机现象
样本空间:随机现象的一切可能基本结果组成的集合称为样本空间
随机事件:随机现象的某些样本点组成的集合称为随机事件
随机变量:用来表示随机现象结果的变量称为随机变量
事件间的关系:包含,相等,互不相容
事件的运算:并、交、差、对立
对立,互不相容
事件的运算性质:交换律、结合律、分配律、对偶律
[文章尾部最后500字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《概率论与数理统计笔记》的无排版文字预览,完整内容请下载
概率论与数理统计笔记由用户“yixiaoyuntian1988”分享发布,转载请注明出处