Learn practical skills, build real-world projects, and advance your career

数据集中的数据类别包括租赁房源、小区、二手房、配套、新房、土地、人口、客户、真实租金等。

  • Score: 类似 mse/var_ 衡量 误差与标准差的差异
    alt

from yuan.pipe import *
from yuan.eda import SimpleEDA
from sklearn.metrics import mean_squared_error, r2_score
# tradeMeanPrice leak? 未来的数据平均值?
# ID 采样顺序成周期性?
 
train = pd.read_csv('../../Data/Future/train_data.csv')
y = train.tradeMoney

租赁房源 = train.columns[:8]
小区信息 = train.columns[8:14]
配套设施 = train.columns[14:27]
二手房 = train.columns[27:31]
新房 = train.columns[31:37]
土地 = train.columns[37:43]
人口 = train.columns[43:46]
客户 = train.columns[46:49]
真实租金 = train.columns[49:51]