AB测试最小样本量

这篇具有很好参考价值的文章主要介绍了AB测试最小样本量。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.AB实验过程

常见的AB实验过程,分流-->实验-->数据分析-->决策:
分流:用户被随机均匀的分为不同的组
实验:同一组内的用户在实验期间使用相同的策略,不同组的用户使用相同或不同的策略。
数据收集:日志根据实验系统为用户打标记,用于记录用户行为,然后数据计算系统根据带有实验标记的体制计算用户的各种实验数据指标。
数据分析和决策:实验者去理解和分析不同的策略对用户起了什么样的作用。

2.中心极限定理

将策略推全来验证策略效果是比较危险的,因此AB实验的对象是从总体当中去抽样数据,总体的分布可能会有多种形态,如正态分布、偏态分布、严重偏态分布等,总体的数据量也有多有少。‘
AB实验是用小样本去推断整体,这就会有一个问题:抽样的样本至少多少能保证统计的科学性?

样本均值的分布,趋近于正态分布,正态分布曲线由均值和方差决定,该分布均值的均值E( ̅x)趋近于总体均值u。就算总体分布不是正态分布,依然可以通过抽样得到样本均值的分布,近似正态分布,这样就可以使用正态分布来估计置信区间,从而实现参数检验(如t检验)

3. 样本容量

当每次从总体中抽样数据时,计算均值会得到一个数,抽样同样的数据量,计算均值,也会得到一个数,两个数大概率不会一样,因此,当抽样多次,计算的均值就会形成一个分布。
当总体分布是正态分布时,样本容量n为任意数,u的抽样分布都是正态分布
当总体非正态,如指数分布、均匀分布等,样本容量n>30,  近似为正态分布
当总体非正态,分布为严重偏态或有异常值,样本容量n>50,近似为正态分布

上文说的样本容量,即每个随机样本中个体的数量,用n表示,当按照样本量抽取多次的时候,才能得到正态分布,抽样的次数,叫样本量。E( ) = u 与样本容量无关,样本标准差和样本容量有关(总体标准差=样本标准差/),样本容量越大,样本标准差 越小。假设样本容量=总量,那最后就成一条线。
基于均值分布,就能计算出 在均值u附近一定举例的概率,反之根据概率,也可以得到置信区间。

4.最小样本量


   在正态分布中置信区间为ab test的最小样本量一般怎么确定,机器学习,人工智能

   为显著性水平,置信水平是1-,为标准正态概率分布上侧面积为时的Z值,为边际误差,边际误差的含义是在统计学中,业务人员主观上可以接受的误差范围。
   总体均值u,样本均值 ̅x ,两者之间的误差ε,u =   + ε

    误差ε与边际误差存在对应关系。

    指标主要有两种:均值类和比率类,有不同的边际误差计算方法。

    均值类指标,计算得到

    含义:在当前的方差水平下,要以1-的把握检测出边际误差不大于ε的变化,样本量至少需要n个。

    从公式中可以看到,当边际误差减少为原来的时,所需的样本容量变为原来的4倍,是指数级关系。因此,在满足业务需求的情况下,尽量采用较大的边际误差,由于边际误差是业务需要检测的最低变化幅度,所以又称为最小样本量。

    对比率类指标的方差计算与均值有所不同,方差=,所以置信区间为:

ab test的最小样本量一般怎么确定,机器学习,人工智能

方差可以使用经验值或者小样本抽取,还可以=0.5,这样得到的n是一个最大值,因为我们知道当=0.5时,能取到最大。

因此解出来的n为

  
   文章来源地址https://www.toymoban.com/news/detail-830739.html

到了这里,关于AB测试最小样本量的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 开发工具-压力测试工具 ab

    在学习ab工具之前,我们需了解几个关于压力测试的概念 吞吐率(Requests per second) 概念:服务器并发处理能力的量化描述,单位是reqs/s,指的是某个并发用户数下单位时间内处理的请求数。某个并发用户数下单位时间内能处理的最大请求数,称之为最大吞吐率。 计算公式:

    2024年02月04日
    浏览(46)
  • 广告策划师如何做 AB 测试

    更多技术交流、求职机会,欢迎关注 字节跳动数据平台微信公众号,回复【1】进入官方交流群 近年来,随着消费者的心理需求逐步趋向于精神层面、科技的迭代迅速以及市场环境的复杂性逐步上升,我国的广告行业逐步展开新的投放模式。但流量成本高,企业试错成本高昂

    2024年02月08日
    浏览(32)
  • 测试工具ab(apache bench)

    在使用ab压力测试工具之前,首先我们要了解几个关于压力测试的概念 吞吐率 概念:服务器并发处理能力的量化描述,单位是reqs/s,指的是某个并发用户数下单位时间内处理的请求数。某个并发用户数下单位时间内能处理的最大请求数,称之为最大吞吐率。 计算公式:总请

    2024年01月16日
    浏览(33)
  • 【Flink 实战系列】Incremental snapshot for tables requires primary key, but table test.ab doesn’t have pri

    问题背景 今天有同学问了这么一个问题,在使用 Flink CDC 同步数据到 Hudi 时,任务抛出异常,完整的报错信息如下所示:

    2023年04月08日
    浏览(46)
  • CentOS压力测试 ab 命令安装与使用

    ab命令会创建很多的并发访问线程,模拟多个访问者同时对某一URL地址进行访问。 它的测试目标是基于URL的,因此,既可以用来测试Apache的负载压力,也可以测试nginx、lighthttp、tomcat、IIS等其它Web服务器的压力。 ab命令对发出负载的计算机要求很低,既不会占用很高CP U,也不

    2024年02月06日
    浏览(50)
  • DevOps系列文章 之 linux ab压力测试

    1、安装 2、检测版本 3、常用 4、解释

    2024年02月16日
    浏览(38)
  • 性能测试工具 ab(Apache Bench)使用详解

    Apache Bench (ab) 是一个由 Apache 提供的非常流行的、简单的性能测试工具,用于对 HTTP 服务器进行压力测试。下面是 ab 工具的一些基本使用方法。 安装 在大多数 Unix 系统中,ab 通常作为 Apache HTTP 服务器的一部分预装在系统中。你可以通过在终端中运行 ab -V 来检查 ab 的版本,

    2024年04月11日
    浏览(41)
  • Apache安装教程及使用ab命令进行压力测试

    1.官网下载https://www.apachehaus.com/cgi-bin/download.plx 2.选择要下载的版本(比如64位:Apache 2.4.46 x64) 3.解压到电脑任意盘根目录下(非根目录需注意不能有中文文件名) 4.已解压目录中在 conf文件夹找到httpd.conf文件右键使用记事本打开进行编辑 5.Ctrl+F查找Define SRVROOT修改它的值为你

    2024年02月04日
    浏览(39)
  • Nginx通过SplitClient进行AB测试以及负载均衡分流

    Nginx 是一个被广泛应用的 Web服务中间件 ,今天分享一下如何用它做 AB 测试。大致可以通过以下方式实现。 1.根据url参数进行 AB测试 : Nginx 可以根据请求的 url 参数来处理请求,例如针对不同的 url 参数返回不同的页面版本,从而实现AB测试。 2.使用 nginx-lua 模块进行 AB 测试

    2024年02月07日
    浏览(39)
  • Java必备技能之环境搭建篇 (linux ab压力测试)

    yum -y install httpd-tools ab的参数说明 4、检测版本 ab -V [root@vic html]# ab --help ab: wrong number of arguments Usage: ab [options] [http[s]😕/]hostname[:port]/path Options are: -n requests Number of requests to perform -c concurrency Number of multiple requests to make -t timelimit Seconds to max. wait for responses -b windowsize Size of TCP

    2024年04月22日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包