近几年提供
服务的公司越来越多,许多公司都把 API 作为产品重要的一部分,作为服务提供出去。而微服务的兴起,也让企业内部开始重视和频繁使用 HTTP API 。好的
- HTTP API
设计容易理解、符合 RFC 标准、提供使用者便利的功能,其中经常被拿来作为教科书典范的当属 。这篇文章就通过
- HTTP API
总结了一些非常好的设计原则,可以作为以后要编写 HTTP API 的参考。
- Github API
注意:这篇文章只讨论设计原则,不是强制要求(API 设计者可以根据实际情况实现部分内容,甚至实现出和某些原则相反的内容),也不会给出实现的思路和细节。
这个和 Restful API 本身没有很大的关系,但是对于增加网站的安全是非常重要的。特别如果你提供的是公开 API,用户的信息泄露或者被攻击会严重影响网站的信誉。
NOTE:不要让非 SSL 的 url 访问重定向到 SSL 的 url。
在
中指定 API 的版本是个很好地做法。如果 API 变化比较大,可以把 API 设计为子域名,比如
- url
;也可以简单地把版本放在路径中,比如
- https://api.github.com/v3
。
- https://example.com/api/v1
对于响应返回的格式,JSON 因为它的可读性、紧凑性以及多种语言支持等优点,成为了 HTTP API 最常用的返回格式。因此,最好采用 JSON 作为返回内容的格式。如果用户需要其他格式,比如
,应该在请求头部
- xml
中指定。对于不支持的格式,服务端需要赶回正确的 status code,并给出详细的说明。
- Accept
资源是
的核心元素,所有的操作都是针对特定资源进行的。而资源就是
- Restful API
(Uniform Resoure Locator)表示的,所以简洁、清晰、结构化的 URL 设计是至关重要的。Github 可以说是这方面的典范,下面我们就拿
- URL
来说明。
- repository
- /users/:username/repos
- /users/:org/repos
- /repos/:owner/:repo
- /repos/:owner/:repo/tags
- /repos/:owner/:repo/branches/:branch
我们可以看到几个特性:
NOTE: 根据 RFC3986 定义,URL 是大小写敏感的。所以为了避免歧义,尽量使用小写字母。
有了资源的 URL 设计,所有针对资源的操作都是使用 HTTP 方法指定的。比较常用的方法有:
Verb | 描述 |
---|---|
HEAD | 只获取某个资源的头部信息。比如只想了解某个文件的大小,某个资源的修改日期等 |
GET | 获取资源 |
POST | 创建资源 |
PATCH | 更新资源的部分属性。因为 PATCH 比较新,而且规范比较复杂,所以真正实现的比较少,一般都是用 POST 替代 |
PUT |
替换资源,客户端需要提供新建资源的所有属性。如果新内容为空,要设置 为 0,以区别错误信息 |
DELETE | 删除资源 |
比如:
- GET /repos/:owner/:repo/issues
- GET /repos/:owner/:repo/issues/:number
- POST /repos/:owner/:repo/issues
- PATCH /repos/:owner/:repo/issues/:number
- DELETE /repos/:owner/:repo
NOTE:更新和创建操作应该返回最新的资源,来通知用户资源的情况;删除资源一般不会返回内容。
在实际资源操作中,总会有一些不符合
(Create-Read-Update-Delete) 的情况,一般有几种处理方法。
- CRUD
为需要的动作增加一个 endpoint,使用 POST 来执行动作,比如
重新发送邮件。
- POST /resend
添加动作相关的参数,通过修改参数来控制动作。比如一个博客网站,会有把写好的文章 "发布" 的功能,可以用上面的
方法,也可以在文章中增加
- POST /articles/{:id}/publish
字段,发布的时候就是更新该字段
- published:boolean
- PUT /articles/{:id}?published=true
把动作转换成可以执行
操作的资源, github 就是用了这种方法。
- CRUD
比如 "喜欢" 一个 gist,就增加一个
子资源,然后对其进行操作:"喜欢" 使用
- /gists/:id/star
,"取消喜欢" 使用
- PUT /gists/:id/star
。
- DELETE /gists/:id/star
另外一个例子是
,这也是一个动作,但是在 gist 下面增加
- Fork
资源,就能把动作变成
- forks
兼容的:
- CRUD
可以执行用户 fork 的动作。
- POST /gists/:id/forks
比如查询某个 repo 下面 issues 的时候,可以通过以下参数来控制返回哪些结果:
,
- open
,
- closed
- all
、
- created
、
- updated
- comments
当返回某个资源的列表时,如果要返回的数目特别多,比如 github 的
,就需要使用分页分批次按照需要来返回特定数量的结果。
- /users
分页的实现会用到上面提到的 url query,通过两个参数来控制要返回的资源结果:
)也失去了设计的初衷
- 99999999
返回的资源列表为
。github API 文档中还提到一个很好的点,相关的分页信息还可以存放到
- [(page-1)*per_page, page*per_page)
头部,这样客户端可以直接得到诸如
- Link
、
- 下一页
、
- 最后一页
等内容的 url 地址,而不是自己手动去计算和拼接。
- 上一页
HTTP 应答中,需要带一个很重要的字段:
。它说明了请求的大致情况,是否正常完成、需要进一步处理、出现了什么错误,对于客户端非常重要。状态码都是三位的整数,大概分成了几个区间:
- status code
:请求正常处理并返回
- 2XX
:重定向,请求的资源位置发生变化
- 3XX
:客户端发送的请求有错误
- 4XX
:服务器端错误
- 5XX
在 HTTP API 设计中,经常用到的状态码以及它们的意义如下表:
状态码 | Label | 解释 |
---|---|---|
200 | OK | 请求成功接收并处理,一般响应中都会有 body |
201 | Created | 请求已完成,并导致了一个或者多个资源被创建,最常用在 POST 创建资源的时候 |
202 | Accepted | 请求已经接收并开始处理,但是处理还没有完成。一般用在异步处理的情况,响应 body 中应该告诉客户端去哪里查看任务的状态 |
204 | No Content | 请求已经处理完成,但是没有信息要返回,经常用在 PUT 更新资源的时候(客户端提供资源的所有属性,因此不需要服务端返回)。如果有重要的 metadata,可以放到头部返回 |
301 | Moved Permanently |
请求的资源已经永久性地移动到另外一个地方,后续所有的请求都应该直接访问新地址。服务端会把新地址写在 头部字段,方便客户端使用。允许客户端把 POST 请求修改为 GET。 |
304 | Not Modified | 请求的资源和之前的版本一样,没有发生改变。用来缓存资源,和条件性请求(conditional request)一起出现 |
307 | Temporary Redirect | 目标资源暂时性地移动到新的地址,客户端需要去新地址进行操作,但是 不能 修改请求的方法。 |
308 | Permanent Redirect | 和 301 类似,除了客户端 不能 修改原请求的方法 |
400 | Bad Request | 客户端发送的请求有错误(请求语法错误,body 数据格式有误,body 缺少必须的字段等),导致服务端无法处理 |
401 | Unauthorized | 请求的资源需要认证,客户端没有提供认证信息或者认证信息不正确 |
403 | Forbidden | 服务器端接收到并理解客户端的请求,但是客户端的权限不足。比如,普通用户想操作只有管理员才有权限的资源。 |
404 | Not Found | 客户端要访问的资源不存在,链接失效或者客户端伪造 URL 的时候回遇到这个情况 |
405 | Method Not Allowed |
服务端接收到了请求,而且要访问的资源也存在,但是不支持对应的方法。服务端 必须
返回 头部,告诉客户端哪些方法是允许的 |
415 | Unsupported Media Type |
服务端不支持客户端请求的资源格式,一般是因为客户端在 或者 中申明了希望的返回格式,但是服务端没有实现。比如,客户端希望收到 返回,但是服务端支持
|
429 | Too Many Requests | 客户端在规定的时间里发送了太多请求,在进行限流的时候会用到 |
500 | Internal Server Error | 服务器内部错误,导致无法完成请求的内容 |
503 | Service Unavailable |
服务器因为负载过高或者维护,暂时无法提供服务。服务器端应该返回 头部,告诉客户端过一段时间再来重试 |
上面这些状态码覆盖了 API 设计中大部分的情况,如果对某个状态码不清楚或者希望查看更完整的列表,可以参考 这个网站,或者 的内容。
如果出错的话,在 response body 中通过
给出明确的信息。
- message
比如客户端发送的请求有错误,一般会返回
结果。这个结果很模糊,给出错误 message 的话,能更好地让客户端知道具体哪里有问题,进行快速修改。
- 4XX Bad Request
- Problems parsing JSON
,除了 message 之外,还通过
- 422 Unprocessable Entity
给出了哪些 field 缺少了,能够方便调用方快速排错
- errors
基本的思路就是尽可能提供更准确的错误信息:比如数据不是正确的 json,缺少必要的字段,字段的值不符合规定…… 而不是直接说 "请求错误" 之类的信息。
一般来说,让任何人随意访问公开的 API 是不好的做法。验证和授权是两件事情:
如果没有通过验证(提供的用户名和密码不匹配,token 不正确等),需要返回 状态码,并在 body 中说明具体的错误信息;而没有被授权访问的资源操作,需要返回 状态码,还有详细的错误信息。
NOTE:Github API 对某些用户未被授权访问的资源操作返回 ,目的是为了防止私有资源的泄露(比如黑客可以自动化试探用户的私有资源,返回 403 的话,就等于告诉黑客用户有这些私有的资源)。
如果对访问的次数不加控制,很可能会造成 API 被滥用,甚至被 。根据使用者不同的身份对其进行限流,可以防止这些情况,减少服务器的压力。
对用户的请求限流之后,要有方法告诉用户它的请求使用情况,
使用的三个相关的头部:
- Github API
: 用户每个小时允许发送请求的最大值
- X-RateLimit-Limit
:当前时间窗口剩下的可用请求数目
- X-RateLimit-Remaining
: 时间窗口重置的时候,到这个时间点可用的请求数量就会变成
- X-RateLimit-Rest
的值
- X-RateLimit-Limit
如果允许没有登录的用户使用 API(可以让用户试用),可以把
的值设置得很小,比如 Github 使用的
- X-RateLimit-Limit
。没有登录的用户是按照请求的 IP 来确定的,而登录的用户按照认证后的信息来确定身份。
- 60
对于超过流量的请求,可以返回 状态码,并附带错误信息。而
返回的是 ,虽然没有
- Github API
更准确,也是可以理解的。
- 429
Github 更进一步,提供了不影响当然
的请求查看当前
- RateLimit
的接口 。
- RateLimit
Restful API 的设计最好遭到 Hypermedia:在返回结果中提供相关资源的链接。这种设计也被称为 。这样做的好处是,用户可以根据返回结果就能得到后续操作需要访问的地址。
比如访问 ,就可以看到 Github API 支持的资源操作。
API 最终是给人使用的,不管是公司内部,还是公开的 API 都是一样。即使我们遵循了上面提到的所有规范,设计的 API 非常优雅,用户还是不知道怎么使用我们的 API。最后一步,但非常重要的一步是:为你的 API 编写优秀的文档。
对每个请求以及返回的参数给出说明,最好给出一个详细而完整地示例,提醒用户需要注意的地方…… 反正目标就是用户可以根据你的文档就能直接使用 API,而不是要发邮件给你,或者跑到你的座位上问你一堆问题。
来源: http://www.tuicool.com/articles/jIZZjqF