思步网

楼主: lanj
打印 上一主题 下一主题

[连载] 09年中国首家过CMMI ML4的总结分享

    [复制链接]
{:8_307:}
好不容易进来了
昨天和我们的评估师讨论了下P-value的问题。这边整理下。
昨天在看回归分析的时候,发现我们当时要求R方是多少,P-value是多少,可是却没有太在意p-value的意义。所以昨天特别和咨询师聊了下p-value的问题。
本帖最后由 lanj 于 2009-8-11 16:25 编辑

在用回归分析的时候,我们会得到一组数据,比如说
回归统计        
Multiple R        0.985721803
R Square        0.971647474
Adjusted R Square        0.967736781
标准误差        3.082411287
观测值        34

             Coefficients       标准误差         t Stat         P-value      
            76.91557816        4.356610836      17.65491136       4.68244E-17        
X1        0.006684388        0.000711317      9.397193428       2.65296E-10        
X2         1.683856263       0.733388439      2.2959951           0.029094862      
X3        -2.977707438      1.082453153       -2.750888045      0.010133432      
X4         3.576085182      1.062133854       3.366887488        0.002158691
我们通过看R Square和Adjusted R Square,可以来判断我们建立的方程/模型的可用性,一般情况下,如果是一元线性回归,我们看R方,如果是多元线性回归,我们看的是调整R方。上面的案例,我们可以看出,是个多元线性回归,调整R方是0.67736781。那这个线性方程的可用性是96.8%,是可用性非常高的一个方程。
根据Coefficients值,我们可以知道我们的方程是Y=0.006684388*X1+1.683856263 *X2+( -2.977707438)*X3+3.576085182*X4+76.91557816 这就是我们的方程。那P-Value又是什么呢?我们要求P-value的值小于0.05,而且越小越好,可是为什么要越小越好呢?这就是我昨天问咨询师的问题。
其实P-value值应该说是cofficients值的一个可用性的大小,某种程度上相当于R方的作用。
因为我们在建立模型的过程中,cofficients的值是有多个,系统自动得出的是一个最佳的情况,比如X1的系数其实并不止有0.006684388,它还有其他的可能,只是0.006684388这个值它P-Value值最小<=0.05,所以才取这个值,经过组合就成了我们上面所列的方程。
同样如果会假设检验的朋友,也会发现会有一个P-value值存在。其实这里的P-value的概念是一样,就是假设是否成立的一个可能性。
JJ,我来捧场。。。要把这个主题打造成优秀的主题!!!
{:8_309:}优秀主题,不用这么夸张吧
我已经觉得自己写的很差了,你这样我会更惭愧的{:8_306:}
表谦虚嘛。
好东西是要被肯定的,哈!:118)
54# lanj
支持下 继续写下去~
继续回归分析
回归分析估计是线性方程里面比较基础的一个内容,但是却能直接有效的帮助我们识别方程,所以可用性还是非常强的。
可是回归分析得到的方程有时并不是一个PPM,因为这个方程可能对应的是整个项目而不是某个流程,也可能方程中没有可控因素,从而不能进行控制。
那么如何利用回归风行数据和图表来进行控制呢:
1、可以根据比值,比如y与x的比值,例如规模和时间,比值就是每小时的代码生产率
2、将我们得到的比值放入到我们的控制图中进行分析,当然要注意不同类型的图表对数据的要求,比如XMR图是要求数据有时间上的连续性。
3、对我们得到的控制图进行设置,看看我们是要指数形式还是对数形式的图形
4、根据图形我们可以得到我们的一个“最佳值”
5、找出我们的异常点
6、对异常点进行分析、去除
7、对异常点改进,对流程进行改进,相关的资料要进行保留
另外说下残差
简单来说残差就是实际的y值与模型得到的y值(预测值)的偏差。
在对残差分析的时候我们会发现,最理想的状况是残差为0,就是我们的实际值和我们的预测值是完全吻合的,但是这种情况微乎其微。同时如果残差是负值,或者数值非常的小,我们可以通过对残差进行平方的方法使得数据更加明显。
如果我们的残差也是按照一定时间顺序排列的,那我们也可以用xmr图来进行分析,找出异常点。
如果数据是比较稳定的,我们可以用中值图来分析,如果不稳定,我们可以用平均值来分析。
另外说下我们在CMMI四级中用到的一些工具,我觉得非常的不错。
Crystalball(水晶球)、SPSS工具、PHSTAT工具、minitab工具,还有6sigma工具。
这些工具都能满足一般我们工作中的需要。其中6Sigma工具是和minitab相类似的,应该说是minitab的中文版才对,实用性也不错。
Crystalball也非常有效,它能够帮助我们进行数据的分析、预测。
SPSS工具,在对数据的相关性分析、自相关分析上和控制图制作上也不错,但是控制图制作可能没有minitab和6sigma,spc工具一样全面。
Phstat也是个很不错的工具。
这些工具在我们过级中都有使用,大家可以了解下,找到你们所需要的。
您需要登录后才可以回帖 登录 | 注册

本版积分规则



思步组织思步科技|思步网|火花学堂|思步文库|思步问答|思步英才|天下心
© 2007 思步网 浙ICP备10212573号-4(首次备案号:浙ICP备07035264号)|邮箱:service#step365.com(将#换成@)|服务热线:0571-28827450
在线培训课程|求职招聘|思步文库|官方微信|手机APP|思步问答|微博平台|官方QQ群|交流论坛|软件工程透析|关于我们|申请友链|
点击这里给我发消息     点击这里给我发消息
思步 step365 过程改进 CMMI中文 质量保证 质量管理 流程体系 需求跟踪矩阵 敏捷开发 Scrum 软件度量 项目评审 全员改进 流程管理 人力资源 6sigma 信息安全 ISO27001认证 IT服务管理 ISO20000认证 ISO9000认证 软件测试 SQA 配置管理 IPD 软件工程 PMP认证 PMP试题 PMBOK中文 精益研发 agile 顾问式管理培训
返回顶部