|
|
|
@ -438,7 +438,7 @@
|
|
|
|
|
"metadata": {},
|
|
|
|
|
"source": [
|
|
|
|
|
"用户进来的时间,可能是第一天,可能是第二天等,当用户进来后,比如第7天,用户有了数据,从第7天开始第8天第9天用户的数据纬度都是一致的,也就是用户进来的那天当做用户自己的t1,第二天是t2以此类推到tn,用来预测该客户未来的某一天的可能性,比如用第一天(t1)数据用来预测第七天数据(t1+7)。\n",
|
|
|
|
|
"<img src=\"assets/20201129190029573.png\" width=\"100%\">\n",
|
|
|
|
|
"<img src=\"assets/20201129190029573.png\" width=\"70%\">\n",
|
|
|
|
|
"目前是没有标签的,需要自己打标签,比如预测第7天,就给每个客户的ti+7天打上标签,用来预测,0表示没登录,1表示登录"
|
|
|
|
|
]
|
|
|
|
|
},
|
|
|
|
@ -49530,6 +49530,21 @@
|
|
|
|
|
"\n",
|
|
|
|
|
"可以看到上面的test_score(F1 Score)很高,也是比赛中非常接近冠军的值"
|
|
|
|
|
]
|
|
|
|
|
},
|
|
|
|
|
{
|
|
|
|
|
"cell_type": "markdown",
|
|
|
|
|
"metadata": {},
|
|
|
|
|
"source": [
|
|
|
|
|
"### 总结:\n",
|
|
|
|
|
"构建数据之前,考虑清楚模型的选取,如果是选择RNN网络,构建的数据应该是个序列,t × f,t是时间步长,f是时间步长对应的特征,如数据中用户的注册数据就是t,只需要把f构建好就可以训练了。"
|
|
|
|
|
]
|
|
|
|
|
},
|
|
|
|
|
{
|
|
|
|
|
"cell_type": "code",
|
|
|
|
|
"execution_count": null,
|
|
|
|
|
"metadata": {},
|
|
|
|
|
"outputs": [],
|
|
|
|
|
"source": []
|
|
|
|
|
}
|
|
|
|
|
],
|
|
|
|
|
"metadata": {
|
|
|
|
|