logistic回归应用的常见问题有哪些,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
二元logistic回归分析
注意,OR的应用及解释存在以下误区
1)认为OR> 1代表为危险因素,OR<1代表为保护因素。事实上,OR代表应变量与自变量之间联系的强度,需要根据研究结局进行专业意义的解释。
如果研究结局是正性事件,如疾病治愈、生存,则OR>1代表为促进疾病治愈、促进生存的保护因素,而OR<1代表为不利于正性事件的危险因素;
当研究结局为负性事件,如疾病发生、进展、死亡等,则OR> 1代表为危险因素,OR<1代表为保护因素。
2)将OR与相对危险度(relative.risk,RR)含义混淆。RR是暴露组与未暴露组的研究结局发生率之比,它是一个比值,代表暴露于某个因素的研究结局发生率是未暴露组的多少倍。而OR是优势比,可以理解为工;每改变一个单位时,研究结局的发生风险改变量。只有发生率很低的研究结局,即P很小时,OR才近似等于RR。
【在Logistic回归中 设置哑变量】
Logistic回归中最常见的自变量类型为多分类变量,如分娩方式分为顺产、难产、剖腹产,婴儿喂养方式分为母乳喂养、混合喂养、人工喂养。有些研究者将多分类自变量误作为连续型变量引人Logistic模型进行分析,这意味着该变量各:相邻分类水平间是等距的,显然不符合实际逻辑。例如,有研究对合肥市城区低出生体重儿影响因素的Logistic回归分析中,原作者将“父亲职业”这个分类变量分为“体力劳动”、“体力兼脑力劳动”、“脑力劳动三个分类水平,进行Logistic回归分析时却将该变量作为有序分类(等级)变量赋值为各分类水平的得分,按连续变量进行处理欠妥。
此外,如果研究者想观察分类变量的各暴露水平对研究结局的影响,也可以将有m个分类水平的变量转变为m个哑变量(取值0或1),每个哑变量分别代表有无该水平的暴露(取值1代表有,取值0代表无)。例如,有研究对儿童慢性胃炎、消化性溃疡致病危险因素的Logistic回归分析中,对于膳食模式这个3分类变量(喜爱蔬菜/水果/肉食),可转变为3个哑变量(分别表示“是否喜爱蔬菜”、“是否喜爱水果”、“是否喜爱肉食”)。
Logistic回归模型建立时,如自变量较多,可采用逐步回归法进行变量筛选。不同的筛选方法有时会产生不同的模型。判断某个变量是否显著以及作用大小,与模型中所包含的变量有关。实际工作中衡量某些变量是.否选人模型,需要考虑专业背景、研究目的、用以调整的某些重要混杂因素以及模型的可解释性、节约性等。
【回归分析最强总结】
变量的参照水平设置
实际工作中,有些论文作者在Logistic回归模型的结果展示中只标注自变量中文名称和回归系数,未说明各变量的参照水平设置。在回归系数的解释上,也只说明自变量对研究结局是危险或保护因素,未考虑实际专业意义。
下图能更清楚说明问题。父亲肥胖的儿童更容易发生超重和肥胖,其风险是父亲体重正常者的1. 976倍;而相较于出生体重≥4000g的儿童,出生体重在2500~4000g是儿童超重肥胖的保护因素。
关于logistic回归应用的常见问题有哪些问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。