Rentforecast Ipynb 61107 - Notebook by Betterme (Jie-Yuan)

Learn practical skills, build real-world projects, and advance your career

Created 5 years ago

数据集中的数据类别包括租赁房源、小区、二手房、配套、新房、土地、人口、客户、真实租金等。

Score: 类似 mse/var_ 衡量误差与标准差的差异

from yuan.pipe import *
from yuan.eda import SimpleEDA
from sklearn.metrics import mean_squared_error, r2_score

# tradeMeanPrice leak? 未来的数据平均值？
# ID 采样顺序成周期性？

train = pd.read_csv('../../Data/Future/train_data.csv')
y = train.tradeMoney

租赁房源 = train.columns[:8]
小区信息 = train.columns[8:14]
配套设施 = train.columns[14:27]
二手房 = train.columns[27:31]
新房 = train.columns[31:37]
土地 = train.columns[37:43]
人口 = train.columns[43:46]
客户 = train.columns[46:49]
真实租金 = train.columns[49:51]