diff --git a/机器学习竞赛实战_优胜解决方案/快手短视频用户活跃度分析/.ipynb_checkpoints/快手用户活跃预测-checkpoint.ipynb b/机器学习竞赛实战_优胜解决方案/快手短视频用户活跃度分析/.ipynb_checkpoints/快手用户活跃预测-checkpoint.ipynb index d8faec7..f665094 100644 --- a/机器学习竞赛实战_优胜解决方案/快手短视频用户活跃度分析/.ipynb_checkpoints/快手用户活跃预测-checkpoint.ipynb +++ b/机器学习竞赛实战_优胜解决方案/快手短视频用户活跃度分析/.ipynb_checkpoints/快手用户活跃预测-checkpoint.ipynb @@ -438,7 +438,7 @@ "metadata": {}, "source": [ "用户进来的时间,可能是第一天,可能是第二天等,当用户进来后,比如第7天,用户有了数据,从第7天开始第8天第9天用户的数据纬度都是一致的,也就是用户进来的那天当做用户自己的t1,第二天是t2以此类推到tn,用来预测该客户未来的某一天的可能性,比如用第一天(t1)数据用来预测第七天数据(t1+7)。\n", - "\n", + "\n", "目前是没有标签的,需要自己打标签,比如预测第7天,就给每个客户的ti+7天打上标签,用来预测,0表示没登录,1表示登录" ] }, @@ -49530,6 +49530,21 @@ "\n", "可以看到上面的test_score(F1 Score)很高,也是比赛中非常接近冠军的值" ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### 总结:\n", + "构建数据之前,考虑清楚模型的选取,如果是选择RNN网络,构建的数据应该是个序列,t × f,t是时间步长,f是时间步长对应的特征,如数据中用户的注册数据就是t,只需要把f构建好就可以训练了。" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [] } ], "metadata": {