admin 管理员组文章数量: 887042
智源
github:
智源 - 看山杯 专家发现算法大赛 2019
文件说明
features.py : 从原始数据集中生成特征
deepfm.py: 运行deepfm模型并取得预测结果
textdeepfm.py: 运行textdeepfm模型并取得预测结果
utils.py: deepctr运行环境
模型说明
模型一:DeepFM
运行环境: DeepCTR-Torch ()
分数(AUC):线下0.6903 线上0.691804111317667 (没有采用五折交叉验证,可能还没收敛,设置epoch大些)
特征说明
1.用户特征
用户原始特征:gender、frequency、A1、…
用户关注和感兴趣的topics数目
**2.问题特征 **
问题标题的字、词计数
问题描述的字、词计数
问题绑定的topic数目
3.用户问题交叉特征
用户关注、感兴趣的话题和问题绑定的话题交集计数
邀请距离问题创建的天数
模型二:TextDeepFM
模型说明:在DeepFM基础上增加文本特征,将用户感兴趣的话题作为用户的embedding,将问题绑定的话题作为问题的embedding。
文本特征利用TextCNN作为特征提取器,提取的特征和原始特征向量拼接一起传给DNN训练。
分数(AUC):线下0.7251481779973195 线上0.701741036192302 (没有采用五折交叉验证)
最后,有意向共同参赛、共同学习的伙伴请添加个人微信号
本文标签: 智源
版权声明:本文标题:智源 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/free/1698660185h313167.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论