from functools import reduce
import pandas as pd
import statsmodels.api as sm
import numpy as np
from scipy.optimize import minimize

df = pd.read_csv("pheno.asd", sep="\s+", header=0)
gmat = np.loadtxt("test.agrm.mat_fmt")

X = np.array(df.loc[:, 'mean':'sex'], dtype=np.float64)
y = np.array(df.loc[:, 'trait'], dtype=np.float64)

logit = sm.Logit(y, X)

前几日,当我在调试这个程序的时候突然爆出了一个错误

我对 statsmodels 这个库使用的不多并没有反应出这个错误是什么

于是我问了神奇的度娘

我发现,并没有什么能一下子让我明白错误在哪的文章

于是我参照  python - 值错误 : endog must be in the unit interval - IT工具网 https://www.coder.work/article/1270243

这篇文章的一个解答其实是问题所在,但是我当时并不知道错在哪里,并没有找到很好的解决的办法

于是我去用excel分析了一下我的数据

 他出现了0 1 之外的数字

我使用 statsmodels 这个库是为了拟合逻辑回归的初值

我筛选查看的这一列是放入的表型

也就是 y = np.array(df.loc[:, 'trait'], dtype=np.float64)

当使用函数 logit = sm.Logit(y, X) 拟合的时候便会出现错误,当修改数据使其不会出现除了0 1 之外的数据,报错解决

 

 

 

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐