本篇文章给大家分享的是有关bootstrap中怎么求置信区间,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
bootstrap置信区间:
假设总体的分布F未知,但有一个容量为n的来自分布F的数据样本,自这一样本按有放回抽样的方法抽取一个容量为n的样本,这种样本称为bootstrap样本。相继地、独立地自原始样本中抽取很多个bootstrap样本,利用这些样本对总体F进行统计推断,这种方法称为非参数bootstrap方法,又称自助法。
使用bootstrap方法可以求得变量(参数)的置信区间,称作bootstrap置信区间。
bootstrap置信区间:
使用Python计算bootstrap置信区间:
这里以一维数据为例,取样本均值作为样本估计量。代码如下:
import numpy as npdef average(data): return sum(data) / len(data)def bootstrap(data, B, c, func): """ 计算bootstrap置信区间 :param data: array 保存样本数据 :param B: 抽样次数 通常B>=1000 :param c: 置信水平 :param func: 样本估计量 :return: bootstrap置信区间上下限 """ array = np.array(data) n = len(array) sample_result_arr = [] for i in range(B): index_arr = np.random.randint(0, n, size=n) data_sample = array[index_arr] sample_result = func(data_sample) sample_result_arr.append(sample_result) a = 1 - c k1 = int(B * a / 2) k2 = int(B * (1 - a / 2)) auc_sample_arr_sorted = sorted(sample_result_arr) lower = auc_sample_arr_sorted[k1] higher = auc_sample_arr_sorted[k2] return lower, higherif __name__ == '__main__': result = bootstrap(np.random.randint(0, 50, 50), 1000, 0.95, average) print(result)
输出:
(20.48, 28.32)
以上就是bootstrap中怎么求置信区间,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。