admin 管理员组

文章数量: 887021

滴滴

这里写目录标题

    • 1 Learning to Estimate the Travel Time,2018
    • 2 Multi-task Representation Learning for Travel Time Estimation,2018

ETA - Estimate the Travel Time,耗时估计,通行时间估计,到达时间估计

1 Learning to Estimate the Travel Time,2018

资料:

  1. KDD 2018:滴滴提出WDR模型显著提升ETA预测精度
  2. 滴滴ETA论文解读:WDR模型

论文概述:

  1. 将问题看作时空回归问题
  2. 本文要求给定行驶路线,然后在该路线上预测行驶时间。 下一篇论文就不要求给定行驶路线,只要知道起点终点就行。

服务整体架构如下图:

算法演进路径

  1. 传统方法:通行时间=每段路的时间+红绿灯时间。这种基于规则的,局限性大。
  2. 转化为回归问题:回归模型上,滴滴先后考虑过两种在业界比较流行的模型,Tree Based model 和 Factorization Machine。但是回归模型受输入限制,使用的是统计信息,无法利用道路的详细信息。
  3. 本文的回归问题+深度学习:最大化信息的无损,模型看对 link 序列信息的建模。

模型整体结构如下图:

特征:

  • spatial information:
    • 先将轨迹匹配到路网,得到路段和交叉路口。
    • 然后提取特征,比如路段有长度,宽度,道路等级,车道数,道路在路网编号等信息,还有经过的POIs兴趣点信息。
  • temporal information:
    • a year, a month and a day, the holiday indicator and rush hour indicator,
  • traffic information
    • We build a traffic monitor and prediction system that provides us the real-time traffic speed estimation in each road segment in the traffic network in every two minutes。每2分钟更新一下。
    • such as the real-time estimated speed, the average speed and free-flow speed, et al.
  • personalized information:
    • 不同的人有不同的行驶习惯,会提取driver profile, rider profile and vehicle profile等特征。
    • 比如司机有新手,老手;车有电动车,燃油车,货车等;骑手有自行车,电动自行车等。
  • augmented information:
    • 其他辅助信息,比如 the weather information and traffic restriction, et al.
      总维度:上百各类别特征,共上百万个维度。
      After sophisticated feature engineering, we obtain a set of features in hundreds of categories and millions of dimensions.

2 Multi-task Representation Learning for Travel Time Estimation,2018

概述:

  • 使用了路网结构,以及先验的时空信息,也使用了Path信息
  • 本文不要求指定行驶路线。只给起点终点即可。这种针对那种可能行驶路线很多的场景就比较好。

模型整体结构如下:

  1. 整体结构:非监督图embedding + Link embedding network + spatial embedding network +temporal embedding network + 其他特征 -> 深度残差网络 -> 得到结果
  2. This model produces meaningful representation that preserves various trip properties in the real-world and at the same time leverages the underlying road network and the spatiotemporal prior knowledge.
  • 给出了不同轨迹的有效表示方法,可保留轨迹的各种属性
  • 此外,还利用了路网,时空等先验信息
  1. Further-more, we propose a multi-task learning framework to utilize the path information of historical trips during the training phase which boosts the performance.
  • 训练阶段使用了历史轨迹的路径信息,用来提升效果。
  1. pytorch开源实现地址:

本文标签: 滴滴