python抓取某城市全部道路名称信息

引子

这两天碰到一个需求,要获取某个城市所有道路的车辆通行速度。首先自然是想到用高德或百度的Web服务 API 来请求交通路况信息,结果一看高德的交通态势服务API从2020年12月31日起就下线了,遂转而奔向百度,百度的实时路况查询服务倒是还能用,但是在使用上确有许多限制,主要是检索限定范围太小,无法通过直接设置矩形范围查询区域内所有道路路况信息,最终想到如果能获取该城市的所有道路名称信息,直接根据道路名去请求接口,就能又准又全的采集所有道路通行状况数据。所以,就有了本次标题的目标:怎么获取城市全部道路名称信息?

思路

在网上一番检索,并未直接找到有收录城市所有道路名的网站,还是太天真了。最终还是选择了从百度自身下手,百度Web服务是提供POI检索的,道路也算是POI的一种,所以可以通过这种曲线救国的方式,来实现道路名称信息的抓取,具体步骤如下:

1.确定检索范围,也就是待查询区域的经纬度边界,这个可以网上搜。如果有对应区域的地理空间数据,也可以在ArcGIS内以查看坐标信息的形式获取经纬度。
2.确定检索形式,百度提供行政区划区域检索、圆形区域检索、矩形区域检索、地点详情检索四种POI检索形式,最理想的是矩形区域检索,但该检索功能已不再免费对外开放,所以退而求其次,选择圆形区域检索,尽可能多的获取道路相关POI信息。
3.确定检索步长,圆形检索是通过设定好中心坐标点,并按设定半径来请求该圆形区域内的所有道路名称,由于半径不可能无限延伸,所以要把第一步确定的矩形范围分解成多个小圆形范围,来分批次请求检索结果。
4.编写实现代码,代码实现过程比较简单,需要主要是获取道路信息后逐一保存。

实现

实现代码如下,写的比较糙,不过能用。

f = open('F:\\路名信息.json', 'w+')
#经纬度范围设置,按每次偏移两公里来移动检索圆心
for lat in np.arange(30.895038,31.424064,0.02):
        for long in np.arange(107.183609,107.800848,0.02):
            latstr=str(lat)
            longstr=str(long)
            bounds=latstr+','+longstr
            #query的参数值设为道路,检索半径设置为2公里
            api= "http://api.map.baidu.com/place/v2/search?query=道路&location={0}&radius=2000&output=json&ak={你的开发者秘钥}".format(bounds)
            r = requests.get(api, headers={'User-Agent': 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)','Connection': 'close'}, timeout=(5, 5))
            try:
                result=r.json()
                #是否成功返回结果
                if result['status'] == 0:
                    #是否包含路况信息
                    results = result['results']
                    if len(results) != 0:
                        for road in results:
                              #每条路的json文件单独保存
                              print(json.dumps(road, ensure_ascii=False))
                              f.write(json.dumps(road, ensure_ascii=False,indent=4))

            except:
                print('哇塞,出错了')
                continue
f.close()

结果

最后请求得到的道路信息类似如下格式,可以看到当我们以道路作为检索关键字来请求POI时,确实能够获取道路的详细信息,但是也有一些非标准道路名称结果被检索到,比如某某路口这种。所以,如果再对数据做一遍清洗修正,应该能得到更多道路名称信息。总之通过POI这种形式来获取城市所有道路名是有一定可操作性的,但在数据的全量性上还没法完全保证,需要进一步优化该方法,以后有时间再研究研究。

{
 "name": "踏水桥",
 "location": {
 "lat": 30.908352,
 "lng": 107.244304
 },
 "address": "四川省达州市大竹县",
 "province": "四川省",
 "city": "达州市",
 "area": "大竹县",
 "detail": 0,
 "uid": "ce658bf70958ecccda13183b"
},
{
 "name": "华农街/将军西街(路口)",
 "location": {
 "lat": 30.90876,
 "lng": 107.241049
 },
 "address": "达州市大竹县X168",
 "province": "四川省",
 "city": "达州市",
 "area": "大竹县",
 "detail": 1,
 "uid": "2355baab46ba127551e5c541"
},
{
 "name": "将军西街",
 "location": {
 "lat": 30.911387,
 "lng": 107.243157
 },
 "address": "四川省达州市大竹县",
 "province": "四川省",
 "city": "达州市",
 "area": "大竹县",
 "detail": 0,
 "uid": "09979f7c1c1aa5cb09f5eb47"
},
......
作者:起不好名字就不起了原文地址:https://blog.csdn.net/qq_38017966/article/details/123160325

%s 个评论

要回复文章请先登录注册