本项目将课程中的上海出租车轨迹分析整理为可复现的工程化流程,覆盖三类任务:
- 实验一:时空特征分析
- 实验二:出行行为分析
- 实验三:交通状态分析(
exp3+part3双体系)
task2/
├─ config/
├─ src/shanghai_taxi/
├─ scripts/
├─ tests/
├─ outputs/
│ ├─ assets/ # 仅保留 exp3_* 与 part3_* 关键图
│ ├─ data/ # 仅保留 exp3_* 与 part3_* 关键表
│ └─ reports/ # 保留报告与 part3 热力图
├─ run_project.py
└─ requirements.txt
py -3 -m venv .venv_clean
.\.venv_clean\Scripts\Activate.ps1
pip install -r requirements.txt统一入口:
py -3 run_project.py <command> [options]常用命令:
py -3 run_project.py all --resumepy -3 run_project.py report --resumepy -3 run_project.py ppt --resumepy -3 run_project.py exp3 --resume --limit 200
常用参数:
--config:配置文件路径--data-root:覆盖原始数据目录--output-root:覆盖输出目录--limit:仅处理前 N 个原始文件--resume:优先复用已有阶段产物
- 来源:项目流水线自产(
run_project.py exp3) - 典型产物:
outputs/assets/exp3_*.pngoutputs/data/exp3_*.csv
- 作用:给出小时速度、分时段速度、低速热点等基础交通状态画像。
- 来源:项目内已纳入的扩展结果文件
- 典型产物:
outputs/assets/part3_*.pngoutputs/data/part3_*.csvoutputs/reports/part3_congestion_heatmap.html
- 作用:补充拥堵传播、预测方法说明、速度-流量关系与 BPR 通行能力评估。
- Haversine 球面距离(用于 OD 直线距离)
其中
- 行程切分判据(同一车辆时序)
默认阈值:trip_gap_minutes = 5。
- 观测速度(stage3 中用于效率描述)
- 网格化(热点统计)
默认 grid_size = 0.01。
- 低速热点筛选与排序口径
- 先过滤:
point_count >= low_speed_min_points - 再排序:
mean_speed升序、point_count降序 - 取 Top10 作为低速热点
- BPR 通行能力函数(用于
part3方法说明)
其中
仓库采用 outputs 白名单策略,仅跟踪关键交付:
outputs/人工修改.pptx(最终版 PPT)outputs/assets/exp3_*.png、outputs/data/exp3_*.csvoutputs/assets/part3_*.png、outputs/data/part3_*.csvoutputs/reports/report.mdoutputs/reports/stage3_basic_report.htmloutputs/reports/part3_congestion_heatmap.html
- 脚本生成产物路径由程序配置控制(默认可生成
风格3_修订版.pptx)。 - GitHub 中当前认定的最终交付版为:
outputs/人工修改.pptx。