Skip to content

Latest commit

 

History

History
105 lines (63 loc) · 6.52 KB

README_CN.md

File metadata and controls

105 lines (63 loc) · 6.52 KB

img img img img img

All Contributors

flight-delay-predict

English | 中文

flight delay predict with weather data

img

img

img

img

注意⚠⚠⚠

数据库

数据库初始化文件在dataset-and-model的branch中,design文件夹下的all.sql,

注意!!,因为在答辩时天气预测时的爬虫网站出错,所以临时换用了其他的方法,需要在arriveweather这个表里加上departureweatheryear, month, day, normal_prob, mild_prob, moderate_prob, serious_prob的相同属性,并删除date属性

其次还需要INSERTairlineairport这两个表的数据,分别在delay-masterbranch的modelTrain/predict/dict_id.csvdataset-and-modelbranch的dataset/airport.csv

最后别忘了在API/algorithm.pyAPI/loginAndRegister.py开始重新配置你的(云)数据库

天气数据预测

因为答辩的时候,爬取的天气网站临时维护,所以被迫将气象预测换成直接读取往年同一天的消息,现在已经能重新使用,如果需要加入天气预测则可以再algorithm.py(如果我没记错的话)重新恢复下天气预测功能

项目

基于往年航班和天气信息的对航班延迟信息的预测系统

数据清洗项目

  1. 首先根据原航班信息数据对应天气信息网站手动做出机场-城市编码参考字典,其中只选择了部分机场

  2. 对应填充机场的经纬度

  3. 首先进行第一次清洗:删除出发、到达机场不在给出的参考机场字典中的项

  4. 进行第二次清洗:删除同一时间航线(即为出发地点和到达地点都一样的航班)重复的项

  5. 其中对最原始的数据集的处理还有:

通过原始的时间戳计算计划出发、达到与实际出发、达到的时间

通过不同机场之间的经纬度计算出各个机场之间的距离并整合填充至各个航班相应的信息栏中

  1. 通过构建的机场-城市参考字典进行天气信息的爬取、填充

首先构建不同城市的各个的以天为单位的天气信息文件.CSV

进行相应的网络爬虫读取数据并写道城市天气文件中

通过城市->定位所要访问的文件;预计出发日期->定位到具体要填充的项

  1. 之后保存写入,得到初始清洗好的数据集了

Contributors ✨

Thanks goes to these wonderful people (emoji key):

#Project Dependence npm install echarts@4.9 npm install --save-dev less-loader less

人员分工:

项目经理 解世超

前端工程师 蒋涵、陈泽锋

后端工程师 何毅、江顺

数据工程师 贺思超


Routhleck Ekalesor

🔣 💻

是小柴同学吖

💻 🐛 🚇

Shichao

📖 🤔 📆

chenzefeng33

🎨 📦

hanjiang1073

🎨 📦

1avish

💻

This project follows the all-contributors specification. Contributions of any kind welcome!