首先什么叫API,API全称又叫做Application Programming Interface,简称应用程序接口,第一次接触接口调用的时候,完全不知道写的啥,因为我看的是整个项目,项目是tornado写的,看了半天的tornado,后来才发现方向走错了,我直接看接口就行了,因为没人告诉我项目的整体流程,只能自己强行看了,只要找到程序的主入口,然后根据一步步函数调用就行了

        我在写接口的时候,因为要配合后台来写,浏览器中来访问,每次访问只需要传入对应的参数就可调用对应的接口,接口可以是别人写的,也有是合作公司提供的,合作公司提供的当然不是免费的了,现在基本都是没访问一次就收几毛钱等等,听到这你们可别小看这几毛钱啊,有时候调用了几百万次的话那这钱就多了,到这有的人就想,难道不能包月吗,抱歉,我也不知道,反正我们是按一条条算的,因为第一次接触,我以为花钱买的直接把我们要的数据全部买下来,存到本地的数据库中,用的时候直接从自己数据库中调就是了,后来我才发现我自己想多了。

        接口调用就是用python的requests库来访问,基本就是get或者post请求,有的接口会加密,然后我们就得用对方提供给我们的公钥加密或解密,然后在配上相应的参数进行访问,我们要的数据就在请求后的返回结果中,我见过的基本上都是json格式解析的,所以请求后可以用requests自带的json函数来解析它,然后将要的数据提取出来即可,访问一次得到一条数据。

        没看错,接口调用就是这么简单,但是要和后台写一起,我现在才发现requests库是多么强大,只要是http或者是https的都能爬,很庆幸自己当初看了一个礼拜把requests和bs4看完了,做爬虫不学requests真的不叫爬虫工程师,你用scrapy写到四=死看看能写出来吗?urllib的话基本淘汰了,有requests 还用那个干嘛

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐