我在 R 中运行简单的线性模型(Y~X),其中我的预测变量是分类变量(0-10)。然而,这个变量不是正态分布的,并且没有任何可用的转换技术是有帮助的(例如log、sq 等),因为数据不是负偏/正偏,而是到处都是。我知道对于 lm,结果变量 (Y) 必须呈正态分布,但这对于预测变量是否也是必需的?如果是,任何有关如何执行此操作的建议将非常受欢迎。

另外,由于我正在查看的数据有两组,即患者与对照组(我对组差异感兴趣,正如您可以猜到的那样),我是否必须查看数据是否在两组内呈正态分布,还是在整个组中呈正态分布?两组?
谢谢。

有帮助吗?

解决方案

请参阅上面的@Roman Luštriks 评论:你的预测变量如何分布并不重要。(多重共线性问题除外。)重要的是 残差 是正态的(并且具有同质方差)。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top