“人的一切痛苦,本质上都是对自己无能的愤怒。”
文:蓝兔子读难NOTES
图:配图来源于网络
编码:0008
因为篇幅的限制,我们上一篇文章只说了一半,在这一篇文章中,我们会继续进行常见的概率分布内容的分享。可以说,在常见概率分布这一大章内容里面,最重要的内容就在接下来要说的里面,一个是正态分布(normaldistribution),另一个是t分布(student‘st-distribution),其也是掌握后面章节内容的关键知识点。
连续概率分布与正态分布
具体连续概率分布的定义我们在上一篇文章中已经进行过解释,这里就不再赘述。我们直接来看一个连续均匀分布(continuousuniformdistribution)的PDF图形:
以太坊信标链APR涨至8.76%:金色财经报道,Token.Unlock数据显示,自以太坊上海升级完成以来,已有约267万枚ETH解除质押,约341万枚ETH新存入质押,净质押余额约73.5万枚ETH。即以太坊上海升级完成以来的ETH新存入质押数已超过解除质押数。此外,当前约枚4.36万ETH处于待提款状态,APR为8.76%。[2023/5/15 15:03:16]
因为每一个可能的结果发生的概率是相等的,所以其PDF曲线为一条水平线。这里需要强调说明一下,由于连续随机变量可以有无数多个可能,因此针对某一确定的结果,我们近似的认为其发生的概率为0,因此在分析连续随机变量相关问题时,我们应该取区间分析,而不能对点进行分析。
又因为任何一个随机事件,其所有可能的结果的概率和为1,所以上图中,该条直线的y轴坐标为1/(b-a)。当我们对区间(a,b)中任何一段子区间进行分析时,可以利用简单的几何原理算出相应的面积(概率)。
接下来,就是重中之重的正态分布,正态分布几乎存在于我们生活的方方面面,无论是班上同学的考试成绩,还是班上同学的身高体重,基本上都逃离不了正态分布的“上帝诅咒”,而且同一个目标对象的数量(样本量)越是多,越是重复的厉害,那么就越正态。看看下面这两幅图,看看你是否能找到小正态的影子。
LSDx Finance发布的代币销毁提案已开放投票:4月17日消息,全 LSD 超流动性协议 LSDx Finance 发布的代币销毁提案已开放投票。该提案提议进行代币销毁以在保护当前代币持有者的利益和确保未来增长的可持续排放率之间取得平衡,包含了销毁 5 亿枚代币、销毁 3 亿枚代币、销毁 2 亿枚代币和不销毁代币四个选项。veLSD 持有者可进行投票。[2023/4/17 14:09:12]
请别告诉我这是人为的,即便是人为的,为何偏偏就是这个样子。那到底是哪个样子呢,请看下图:
正态分布虽然如上帝的“祝福”般占据了我们生活的方方面面,但是我们只需要把它当作一个工具即可,一把扳手,我们不需要知道它是怎么生产出来的,我们只需要了解他的一些性质即可:
其PDF完全由均值和方差刻画,通常记为N(均值,方差);其图形对称,偏度为0,越中间概率越大,越两端概率越小;如之前内容所讲,正态分布的峰度为3,超额峰度为0;服从正态分布的随机变量线性组合后还符合正态分布;标准正态分布概率区间几个特殊值经常用要记住,如下图(90%对应1.65个标准差,虽然图中没标,但也很重要)。
今日恐慌与贪婪指数为33,等级由极度恐慌转为恐慌:金色财经报道,今日恐慌与贪婪指数为33(昨日为20),恐慌程度较昨日大幅下降,等级由极度恐慌转为恐慌。
注:恐慌指数阈值为0-100,包含指标:波动性(25%)+市场交易量(25%)+社交媒体热度(15%)+市场调查(15%)+比特币在整个市场中的比例(10%)+谷歌热词分析(10%)。[2022/10/26 16:39:30]
接下来的内容是标准化的正态分布。如前文所言,正态分布表示为N(均值,方差),尽管正态分布存在于我们生活的方方面面,但是这方方面面的正态分布却也各不相同,且由于正态分布的PDF比较复杂,我们很难通过表达式去计算出其某区间的概率,更不可能给每一个参数不同的正态分布都列一个表格去查。
好在前辈们也纠结过这个问题,并且找到了解决方案:他们把标准正态分布的结果列成一张表,并提供一种把非标准正态分布转换为标准正态分布的办法,再拿这个分布去查表。
标准正态分布表示为N(0,1),其中0为均值,1为方差,任何非标准正态分布都可以进行转换,转换后即可查标准正态分布的表得到相应的值。为了便于理解,举个例子:
已知某公司股票的某参数符合正态分布,其均值为10,方差为9,即服从N(10,9),问随机抽取该股票参数中的某个值,该值小于5的概率,即F(5)。
OpenSea实施对NFT稀有度进行排名的新协议:金色财经报道,NFT市场OpenSea宣布在其平台内实施Open Rarity,这是一种为NFT提供可验证稀有度计算的协议。该协议使用透明的数学方法来计算稀有度。OpenSea表示,稀有的NFT的数字会比较小,而具有与许多其他NFT相似属性的NFT的数字会比较大。因此,市场强调买家在考虑购买NFT时可以看到可靠的“稀有度排名”。(thebharatexpressnews)[2022/9/23 7:15:39]
虽然其服从正态分布,但不是标准正态分布,所以没法直接查表,需要先进行转换,转换的方法就是:
(X-μ)/σ====即=====>>(5-10)/3
即查标准正态分布的F((5-10)/3)即可。
查表要注意,1、查表会不会,不会的同学看看书,这里就不解释了;2、查得的是累积概率,可能需要再次进行换算。
标准正态分布也被称为z分布或者u分布。
亏空风险(shortfallrisk):指资产的收益低于最低可接受水平的概率,亏空风险是一个概率。这个最低可接受水平(shortfalllevel)用Rl表示。
罗伊的第一安全比例(Roy'ssafety-firstratio|SFration):
SBF:没有与Robinhood就收购进行积极的会谈:6月28日消息,据华尔街日报,加密货币交易所FTX首席执行官Sam Bankman-Fried(SBF)称没有与美股经纪商Robinhood就收购进行积极的会谈。(金十)[2022/6/28 1:35:12]
SFRatio=/标准差
从其公式上来看,第一安全比例代表的是每份超额风险所获得的收益,这里的超额指的是投资收益相对于最低要求收益的超额。注意与夏普比率区分,夏普比率的超额是指投资收益相对于无风险收益超额。
同夏普比率一样,每单位风险获得的收益肯定是越多越好,所以怎么根据SFratio选择组合你懂的。
对数正态分布与t分布
接下来是另一个非常重要的分布,学生t分布(studentt-distribution),不要觉得名字奇怪,之所以叫这个名字,只是因为发表的人给自己取了个这么样的笔名而已。就像正态分布也叫高斯分布一样,只是名字而已。
不过说到正态分布和t分布,他们不仅仅是名字都是发表者用的名字而已,他们还有很多的相似之处。怎么个相似法呢,先看图:
我们之前说过,正态分布的样本数量越多,就越正态分布。以考试成绩为例,一个班50个同学的数据肯定没有全校同学的数据那么“正态”。但是如果反过来,班上只有40个同学,或者只有10个同学,他们的成绩还符合正态分布吗?不难想象,当我们数据量越小时,越容易受到极端值的影响,当数据量太少时,就会和正态分布出现偏差。
我们有一位伟大的同学,叫做“Student”,同我们一样,他也发现了这个现象,但是和我们不一样的是,人家找到了小样本的解决方案,后来被命名成t分布。t分布具有如下性质:
图形如上图所示,当自由度增大时,图形逐步接近于正态分布;图形完全由自由度(degreesoffreedom|df)刻画;相比于正态分布,t分布图形有低峰肥尾巴特质,因此峰度>3;这里说明一下,峰态虽然叫做“峰”态,但他看的不是峰有多高,而是尾巴有多肥。
下面是对数正态分布(lognormaldistribution),虽然正态分布占据了我们生活的方方面面,但是他却有一个问题:他的取值范围在正负无穷的范围内,而我们的资产,或者说股票的价格,不可能为负,所以导致其不能用于衡量资产的价格。因此,我们引入了对数正态分布(具体的过程比较有意思,但是这里不说),如下图:
其有如下特点:
非负性,符合资产股票的价格定义域,偏度为正,所以一般用正态分布来衡量资产的风险,而用对数正态分布来衡量资产的价格。
最后还有一个知识点,叫做多元分布(multivariatedistribution),这里大家不用详细了解,只知道多元分布就像多元方程一样,里面有多个元素。考试一般问你需要几个参数才能刻画出这个多元分布,只要记住以下内容就OK:
每一个元需要两个参数来刻画:一个均值,一个方差;每两个元之间需要一个相关系数来刻画,nC2;所以,假设有n元,需要的参数就是2*n+nC2,掏出你的计算器吧!
模拟
模拟就是通过事前对事情进行彩排,来预测和发现事情的发展方向,比如去面试前,你会进行一个模拟面试,考虑会有哪些问题,如何应对。
模拟有两种,以面试为例,很多人都有面试过,自己可能也面试过多次,面试的常见套路,问题基本上就那些,你模拟的时候,你就能知道大概会问哪些问题,虽然每次面试不一样,但是大差不差,你可以假设一种情景来分析,如果问这个问题怎么样,如果问那个问题怎么样。这就是蒙特卡罗模拟(MonteCarlosimulation),我们也称之为情景模拟,对解决如果咋的咋的(whatif)问题很有效。实际上,你就需要先假设这么一个如果(通常假设其符合某一分布),但是其缺陷是,你一旦假设都错了,那你就全盘皆输。而且这种计算费电脑。
还有一个叫做历史模拟(historicalsimulation),就是根据历史数据来模拟,比如搜集某个地方某一天过去100年的天气情况来预测以后的天气情况,由于其依赖历史数据,所以不能进行情景分析,如果(whatif)气象局搞了场人工降雨呢?而且时代在进步,万事万物都是在变,没有什么是一成不变的,所以历史模拟也存在问题。还有就是,你选的这段历史数据万一碰巧选到特殊的一段了,比如模拟经济发展,你刚好选到二战那一段呢?所以,我们通常进行样本外测试(outofsampletest),把数据拿到样本外的历史数据去试试,排除数据选择问题(是那一段时间独有的)。
兔纸的相关文章
CFA一级数量分析-货币的时间价值
CFA一级数量分析-数理统计基础与收益
CFA一级数量分析-概率论基础
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。