
概率论与统计学统计
概率论与统计学 ——统计

01 总体与随机样本 目录 02 样本均值的抽样分布 03 样本方差的抽样分布 04 学生t-分布 05 F-分布 06 假设检验 概率论与统计学 2
概率论与统计学 目录 01 总体与随机样本 02 03 样本均值的抽样分布 样本方差的抽样分布 2 学生 𝒕-分布 05 𝓕-分布 04 06 假设检验

前置知识>随机变量X,给定其概率密度函数(PDF)f(x);: 均值 (Mean) : μ= E(X)=J~xf(x)dx方差 (Variance) : α2 =var(X) = J(x-μ)2f(x)dx>如果随机变量X=α,α为常数,则2=0。故方差可以作为不确定性的测度。>例:在金融学中,预期回报和投资组合的风险是衡量投资组合表现的两个重要测度。:如果随机变量X为投资收益率,则均值为预期收益率,方差为相应的风险。P夏普比率(SharpeRatio):SR=a概率论与统计学
概率论与统计学 ➢ 随机变量 𝑋,给定其概率密度函数(PDF)𝑓 𝑥 ; • 均值(Mean):𝜇 = 𝐸 𝑋 = ∞− ∞ 𝑥𝑓 𝑥 𝑑𝑥 • 方差(Variance):𝜎 ∞− = �� �𝑎𝑣� = 2 ∞ 𝑥 − 𝜇 2𝑓 𝑥 𝑑𝑥 ➢ 如果随机变量 𝑋 = 𝑎, 𝑎 为常数,则 𝜎 2 = 0。故方差可以作为不确定性 的测度。 ➢ 例:在金融学中,预期回报和投资组合的风险是衡量投资组合表现的两 个重要测度。 • 如果随机变量 𝑋 为投资收益率,则均值为预期收益率,方差为相应 的风险。 • 夏普比率( Sharpe Ratio ):SR = 𝜇 𝜎 。 3 前置知识

前置知识>现实中,随机变量X的概率密度函数(PDF)f(x)未知,故我们无法直接算得u和?,需要用可观测的数据(样本)来推断总体。>样本均值Xn==1X;和总体均值μ的关系?. Xn→μ=E(X)asn→80概率论与统计学
概率论与统计学 ➢ 现实中,随机变量 𝑋 的概率密度函数(PDF)𝑓 𝑥 未知,故我们无法 直接算得 𝜇 和 𝜎 2 ,需要用可观测的数据(样本)来推断总体。 ➢ 样本均值 𝑋ത 𝑛 = 1 𝑛 σ𝑖=1 𝑛 𝑋𝑖 和总体均值 𝜇 的关系? • 𝑋ത 𝑛 → 𝜇 = 𝐸 𝑋 as 𝑛 → ∞ 4 前置知识

01总体与随机样本概率论与统计学
概率论与统计学 01 总体与随机样本 5

1.总体与随机样本数据与随机样本>随机样本:假设有 n个随机变量X,.…,Xn,令Xn=(X,…,Xn),则称Xn是一个样本容量(samplesize)为n的随机样本。>数据集:随机样本Xn的一个实现值称为从随机样本Xn生成的一个数据集(data set)或样本点,Xn 的一个数据集记作 xn=(xi,···,xn)>一个随机样本Xn可生成多个不同的数据集。所有可能的Xn的数据集构成随机样本Xn的样本空间。概率论与统计学
概率论与统计学 ➢ 随机样本: 假设有 𝑛 个随机变量 𝑋1, . ,𝑋𝑛,令 𝑋 𝑛 = (𝑋1, . ,𝑋𝑛),则称 𝑋 𝑛 是一个样本容量(sample size)为 𝑛 的随机样本。 ➢ 数据集: 随机样本 𝑋 𝑛 的一个实现值称为从随机样本 𝑋 𝑛 生成的一个数 据集(data set)或样本点,𝑋 𝑛 的一个数据集记作 𝑥 𝑛 = (𝑥1, · · · , 𝑥𝑛)。 ➢ 一个随机样本 𝑋 𝑛 可生成多个不同的数据集。所有可能的 𝑋 𝑛 的数据集 构成随机样本 𝑋 𝑛 的样本空间。 6 1. 总体与随机样本 数据与随机样本

1.总体与随机样本例:[抛硬市]>假设抛掷n次硬币。令X;表示抛掷第i次硬币的结果,若正面朝上则Xi=1,否则Xi=0。·Xn=(Xi,,Xn)构成一个随机样本。·抛掷n次硬币后,将获一个实数序列,如xn=(1,1,0,0,1,0,,·,1)。该序列是来自随机样本Xn的一个数据集。:若再次抛掷n次硬币,会获得一个不同的实数序列,如xn=(1,0,01,1,1,···,O),这是来自随机样本Xn的另一数据集。随机样本Xn一共可生成2n个数据集,每个数据集的样本容量均为n。概率论与统计学
概率论与统计学 例: [抛硬币] ➢ 假设抛掷 𝑛 次硬币。令 𝑋𝑖 表示抛掷第 𝑖 次硬币的结果,若正面朝上则 𝑋𝑖 = 1,否则 𝑋𝑖 = 0。 • 𝑋 𝑛 = (𝑋1, . ,𝑋𝑛) 构成一个随机样本。 • 抛掷 𝑛 次硬币后,将获一个实数序列,如 𝑥 𝑛 = (1, 1, 0, 0, 1, 0,· · · , 1)。 该序列是来自随机样本 𝑋 𝑛 的一个数据集。 • 若再次抛掷 𝑛 次硬币,会获得一个不同的实数序列,如 𝑥 𝑛 = (1, 0, 0, 1, 1, 1, · · · , 0) ,这是来自随机样本 𝑋 𝑛 的另一数据集。随机样本 𝑋 𝑛 一共可生成 2 𝑛 个数据集,每个数据集的样本容量均为 𝑛。 7 1. 总体与随机样本

1.总体与随机样本总体(population)与随机样本>若随机变量X1,,Xn互相独立(即f(x1,x2,.,xn)=In=1f(xi)=f(xi)f(x2)..f(xn)),其中每个随机变量Xi具有相同的概率分布f(x),这个概率分布f(x)就称为总体分布。>则称随机变量序列X1…,Xn为来自总体分布为f(x),样本容量为n的独立同分布(IID)的随机样本。概率论与统计学
概率论与统计学 ➢ 若 随 机 变 量 𝑋1, . ,𝑋𝑛 互相独立 ( 即 𝑓 𝑥1, 𝑥2, . . . , 𝑥𝑛 = ς𝑖=1 𝑛 𝑓 𝑥𝑖 = 𝑓 𝑥1 𝑓 𝑥2 . . . 𝑓 𝑥𝑛 ),其中每个随机变量 𝑋𝑖 具有相同的 概率分布 𝑓 𝑥 ,这个概率分布 𝑓 𝑥 就称为总体分布。 ➢ 则称随机变量序列 𝑋1, . ,𝑋𝑛 为来自总体分布为 𝑓 𝑥 ,样本容量为 𝑛 的 独立同分布 (IID) 的随机样本。 8 1. 总体与随机样本 总体 (population) 与随机样本

1.总体与随机样本例:[中国各省级行政区的GDP年增长率】>令X;表示2024年省级行政区i的GDP年增长率,则Xn=(X1,,Xn)构成了一个样本容量n=34的随机样本。·不同省级行政区的GDP年增长率符合IID的前提假设符合现实吗?√不符合。不同省份的地理位置(例如,东西部)、人口规模、发展阶段与发展水平等均存在差异>随机变量的独立同分布仅是统计学中的一个经典假设。·例如,我们可以假设不同随机变量相互独立,但不服从同样的分布。概率论与统计学
概率论与统计学 例: [中国各省级行政区的 GDP 年增长率] ➢ 令 𝑋𝑖 表示 2024 年省级行政区 𝑖 的 GDP 年增长率,则 𝑋 𝑛 = (𝑋1, . , 𝑋𝑛) 构成了一个样本容量 𝑛 = 34 的随机样本。 • 不同省级行政区的 GDP 年增长率符合 IID 的前提假设符合现实吗? ✓ 不符合。不同省份的地理位置(例如,东西部)、人口规模、发 展阶段与发展水平等均存在差异。 ➢ 随机变量的独立同分布仅是统计学中的一个经典假设。 • 例如,我们可以假设不同随机变量相互独立,但不服从同样的分布。 9 1. 总体与随机样本

1.总体与随机样本>假设Xn=(Xi,,Xn)是一个独立同分布的随机样本,且E(Xi)=μ,var(X,) = α2, i = 1,2, ...,n。总体均值:E(Xi)= J~xif(xi)dxi=μ;总体方差: var(Xi)= J(xi -μ)f(xi)dxi =2;>问题:给定一个数据集xn=(x1,···,xn),如何估计μ和α2?·通过统计量(statistic)。两个最重要的统计量:样本均值、样本方差概率论与统计学10
概率论与统计学 ➢ 假设 𝑋 𝑛 = (𝑋1, . , 𝑋𝑛) 是一个独立同分布的随机样本,且 𝐸 𝑋𝑖 = 𝜇, 𝑣𝑎𝑟 𝑋𝑖 = 𝜎 2 ,𝑖 = 1,2,. , 𝑛。 ∞− = �𝑋� ��:总体均值• ∞ 𝑥𝑖𝑓 𝑥𝑖 𝑑𝑥𝑖 = 𝜇; ∞− = �𝑋� �𝑎𝑣�:总体方差• ∞ 𝑥𝑖 − 𝜇 2𝑓 𝑥𝑖 𝑑𝑥𝑖 = 𝜎 2; ➢ 问题:给定一个数据集 𝑥 𝑛 = (𝑥1, · · · , 𝑥𝑛),如何估计 𝜇 和 𝜎 2? • 通过统计量(statistic) • 两个最重要的统计量:样本均值、样本方差 10 1. 总体与随机样本