依赖分布式系统的公司组织和团队经常使用 Go 语言编写其应用程序, 以利用 Go 语言诸如通道和 goroutine 之类的并发功能. 如果你负责研发或运维 Go 应用程序, 则考虑周全的日志记录策略可以帮助你了解用户行为, 定位错误并监控应用程序的性能.
这篇文章将展开聊一些用于管理 Go 日志的工具和技术. 我们将首先考虑要使用哪种日志记录包来满足各种记录要求. 然后会介绍一些使日志更易于搜索和可靠, 减少日志资源占用以及使日志消息标准化的技术.
日志包的选择
Go 标准库的日志库非常简单, 仅仅提供了 print , panic 和 fatal 三个函数对于更精细的日志级别, 日志文件分割以及日志分发等方面并没有提供支持. 所以催生了很多第三方的日志库, 流行的日志框架包括 logrus , zap , glog 等. 我们先来大致看下这些日志库的特点再来根据实际应用情况选择合适的日志库.
log 标准库
Go 的内置日志记录库 ( log ) 带有一个默认记录器( logger ), 该记录器可写入标准错误并自动向记录中添加时间戳, 而无需进行配置. 你可以使用它日志用于本地开发, 和试验性的代码段. 这时从代码中获得快速反馈可能比生成丰富结构化的日志更为重要.
logrus
logrus 是一个为结构化日志记录而设计的日志记录包, 非常适合以 JSON 格式记录日志. JSON 格式使机器可以轻松解析 Go 日志. 而且, 由于 JSON 是定义明确的标准, 因此通过包含新字段可以轻松地添加上下文, 解析器能够自动提取它们.
使用 logrus , 可以使用功能 WithFields 定义要添加到 JSON 日志中的标准字段, 如下所示. 然后, 可以在不同日志级别调用记录器, 例如 Info() , Warn() 和 Error() . logrus 库将自动以 JSON 格式写入日志, 并插入标准字段以及您即时定义的所有字段.
- package main
- import (
- log "github.com/sirupsen/logrus"
- )
- func main() {
- log.SetFormatter(&log.JSONFormatter{})
- standardFields := log.Fields{
- "hostname": "staging-1",
- "appname": "foo-app",
- "session": "1ce3f6v",
- }
- requestLogger := log.withFields(standardFields)
- requestLogger.WithFields(log.Fields{"string": "foo", "int": 1, "float": 1.1}).Info("My first ssl event from Golang")
- }
生成的日志将在 JSON 对象中包括消息, 日志级别, 时间戳, 标准字段以及调用记录器即时写入的字段:
- {
- "appname":"foo-app","float":1.1,"hostname":"staging-1","int":1,"level":"info","msg":"My first ssl event from Golang","session":"1ce3f6v","string":"foo","time":"2019-03-06T13:37:12-05:00"
- }
- glog
glog 允许启用或禁用特定级别的日志记录, 这对于在开发和生产环境之间切换时保持检查日志量很有用. 它使您可以在命令行中使用标志 (例如,-v 表示详细信息) 来设置运行代码时的日志记录级别. 然后, 可以在 if 语句中使用 V() 函数仅在特定日志级别上写入 Go 日志. 功能 Info() , Warning() , Error() 和 Fatal() 分别指定日志级别 0 到 3
- if err != nil && glog.V(2){
- glog.Error(err)
- }
日志库的选择
上面分析了, 标准库的 log 只适合非项目级别的代码片段的快速验证和调试. logrus 在结构化日志上做的最好, 有利于日志分析. glog 可以减少日志占用的磁盘空间. 不过相比产生的日志占用空间大的问题, 利于分析的日志给应用产品带来的价值更大, 所以 logrus 使用的更多一些. 很多开源项目, 如 Docker , Prometheus 等都是用了 logrus 来记录他们的日志.
logrus 的使用介绍
logrus 是目前 GitHub 上 star 数量最多的日志库, 目前(2020.03) star 数量为 14000+, fork 数为 1600+. logrus 功能强大, 性能高效, 而且具有高度灵活性, 提供了自定义插件的功能. 很多开源项目, 如 Docker , Prometheus 等都是用了 logrus 来记录他们的日志.
logrus 完全兼容 Go 标准库日志模块, 拥有六种日志级别: debug , info , warn , error , fatal 和 panic , 这是 Go 标准库日志模块的 API 的超集. 如果你的项目使用标准库日志模块, 完全可以以最低的代价迁移到 logrus 上.
可扩展的 Hook 机制: 允许使用者通过 hook 的方式将日志分发到任意地方, 如本地文件系统, 标准输出, logstash , Elasticsearch 或者 mq 等.
logrus 内置了两种日志格式, JSONFormatter 和 TextFormatter 还可以自己动手实现接口 Formatter, 来定义自己的日志格式.
Field 机制: logrus 鼓励通过 Field 机制进行精细化的, 结构化的日志记录, 而不是通过冗长的消息来记录日志.
Entry : logrus.WithFields 会自动返回一个 *Entry , Entry 会自动向日志记录里添加记录创建的时间 time 字段.
基本用法
logrus 与 Go 标准库日志模块完全兼容, logrus 可以通过简单的配置, 来定义输出, 格式或者日志级别等.
- package main
- import (
- "os"
- log "github.com/sirupsen/logrus"
- )
- func init() {
- // 设置日志格式为 JSON 格式
- log.SetFormatter(&log.JSONFormatter{})
- // 设置将日志输出到指定文件(默认的输出为 stderr, 标准错误)
- // 日志消息输出可以是任意的 io.writer 类型
- logFile := ...
- file, _ := os.OpenFile(logFile, os.O_RDWR|os.O_CREATE|os.O_APPEND, 0666)
- log.SetOutput(file)
- // 设置只记录日志级别为 warn 及其以上的日志
- log.SetLevel(log.WarnLevel)
- }
- func main() {
- log.WithFields(log.Fields{
- "animal": "walrus",
- "size": 10,
- }).Info("A group of walrus emerges from the ocean")
- log.WithFields(log.Fields{
- "omg": true,
- "number": 122,
- }).Warn("The group's number increased tremendously!")
- log.WithFields(log.Fields{
- "omg": true,
- "number": 100,
- }).Fatal("The ice breaks!")
- }
自定义 Logger
如果想在一个应用里面向多个地方写 log , 可以创建多个记录器 Logger 实例.
- package main
- import (
- "github.com/sirupsen/logrus"
- "os"
- )
- // logrus 提供了 New()函数来创建一个 logrus 的实例.
- // 项目中, 可以创建任意数量的 logrus 实例.
- var log = logrus.New()
- func main() {
- // 为当前 logrus 实例设置消息的输出, 同样地,
- // 可以设置 logrus 实例的输出到任意 io.writer
- log.Out = os.Stdout
- // 为当前 logrus 实例设置消息输出格式为 JSON 格式.
- // 同样地, 也可以单独为某个 logrus 实例设置日志级别和 hook, 这里不详细叙述.
- log.Formatter = &logrus.JSONFormatter{}
- log.WithFields(logrus.Fields{
- "animal": "walrus",
- "size": 10,
- }).Info("A group of walrus emerges from the ocean")
- }
- Fields
logrus 不推荐使用冗长的消息来记录运行信息, 它推荐使用 Fields 来进行精细化的, 结构化的信息记录. 例如下面的记录日志的方式:
log.Fatalf("Failed to send event %s to topic %s with key %d", event, topic, key)
在 logrus 中不太提倡, logrus 鼓励使用以下方式替代之:
- log.WithFields(log.Fields{
- "event": event,
- "topic": topic,
- "key": key,
- }).Fatal("Failed to send event")
WithFields 可以规范使用者按照其提倡的方式记录日志. 但是 WithFields 依然是可选的, 因为某些场景下, 确实只需要记录一条简单的消息.
Default Fields
通常, 在一个应用中, 或者应用的一部分中, 始终附带一些固定的记录字段会很有帮助. 比如在处理用户 HTTP 请求时, 上下文中所有的日志都会有 request_id 和 user_ip. 为了避免每次记录日志都要使用:
log.WithFields(log.Fields{"request_id": request_id, "user_ip": user_ip})
我们可以创建一个 logrus.Entry 实例, 为这个实例设置默认 Fields , 把 logrus.Entry 实例设置到记录器 Logger , 再记录日志时每次都会附带上这些默认的字段.
- requestLogger := log.WithFields(log.Fields{
- "request_id": request_id, "user_ip": user_ip
- })
- requestLogger.Info("something happened on that request") # will log request_id and user_ip
- requestLogger.Warn("something not great happened")
Hook 接口
logrus 最令人心动的功能就是其可扩展的 HOOK 机制. 通过在初始化时为 logrus 添加 hook , logrus 可以实现各种扩展功能.
logrus 的 hook 接口定义如下, 其原理是每次写入日志时拦截修改 logrus.Entry .
- // logrus 在记录 Levels()返回的日志级别的消息时会触发 HOOK,
- // 按照 Fire 方法定义的内容修改 logrus.Entry.
- type Hook interface {
- Levels() []Level
- Fire(*Entry) error
- }
一个简单自定义 hook 如下, DefaultFieldHook 定义会在所有级别的日志消息中加入默认字段 appName="myAppName" .
- type DefaultFieldHook struct {
- }
- func (hook *DefaultFieldHook) Fire(entry *log.Entry) error {
- entry.Data["appName"] = "MyAppName"
- return nil
- }
- func (hook *DefaultFieldHook) Levels() []log.Level {
- return log.AllLevels
- }
hook 的使用也很简单, 在初始化前调用 log.AddHook(hook) 添加相应的 hook 即可. Hook 比较常见的用法是把指定错误级别的日志记录消息提醒发送到邮件组或者错误监控系统(比如 sentry ), 起到主动错误通知的作用.
logrus 官方仅仅内置了 syslog 的 hook . 但 GitHub 有很多第三方的 hook 可供使用. 比方刚才说的 sentry 相关的 hook .
sentry-hook
Sentry 是一个错误监控系统, 可以使用厂商的服务也可以在自己的服务器上搭建 Sentry . 模式跟 GitLab 很像, 也是提供一键安装包. 为应用注册 Sentry 后会分配一个 DSN 用于连接 Sentry 服务.
- import (
- "github.com/sirupsen/logrus"
- "github.com/evalphobia/logrus_sentry"
- )
- func main() {
- log := logrus.New()
- hook, err := logrus_sentry.NewSentryHook(YOUR_DSN, []logrus.Level{
- logrus.PanicLevel,
- logrus.FatalLevel,
- logrus.ErrorLevel,
- })
- if err == nil {
- log.Hooks.Add(hook)
- }
- }
logrus 是线程安全的
默认情况下, Logger 受 mutex 保护, 以进行并发写入. 当钩子被调用并且日志被写入时, mutex 会被保持. 如果确定不需要这种锁, 则可以调用 logger.SetNoLock() 禁用该锁.
不需要锁的情况包括:
没有注册 hook , 或者 hook 调用是线程安全的.
写入 logger.Out 是线程安全的, 比如 logger.Out 已经被锁保护或者 logger.Out 是一个以 Append 模式打开的文件句柄.
日志写入和存储的一些建议
选择了项目使用的日志库后, 您还需要计划在代码中调用记录器的位置, 如何存储日志. 在本部分中, 将推荐一些整理 Go 日志的最佳实践, 他们包括:
goroutine HTTP
避免在 goroutine 中使用日志记录器
避免创建自己的 goroutine 来处理写日志有两个原因. 首先, 它可能导致并发问题, 因为记录器的副本将尝试访问相同的 io.Writer . 其次, 日志记录库通常会自己启动 goroutine , 在内部管理所有并发问题, 而启动自己的 goroutine 只会造成干扰.
总是将日志写入文件
即使将日志发送到中央日志平台, 我们也建议您先将日志写到本地计算机上的文件中. 这确保您的日志始终在本地可用, 并且不会在网络中丢失. 此外, 写入文件意味着您可以将写入日志的任务与将日志发送到中央日志平台的任务分开. 您的应用程序本身无需建立连接或流式传输日志给日志平台, 您可以将这些任务交给专业的软件处理, 比如使用 Elasticsearch 索引日志数据的话, 那么就可以用 Logstash 从日志文件里抽取日志数据.
使用日志处理平台集中处理日志
如果您的应用程序部署在多个主机群集中, 应用的日志会分散到不同机器上. 日志从本地文件传递到中央日志平台, 以便进行日志数据的分析和汇总. 关于日志处理服务的选择, 开源的日志处理服务有 ELK , 各个云服务厂商也有自己的日志处理服务, 根据自身情况选择即可, 尽量选和云服务器同一厂商的日志服务, 这样不用消耗公网的流量.
使用唯一 ID 跨服务跟踪 Go 日志
对于构建在分布式系统之上的应用, 一个请求可能会流经多个服务, 每个服务都会自己记录日志. 这种情况下为了查询请求对应的日志, 通常的解决方案是在请求头中携带唯一 ID, 分布式系统中所有服务的日志记录器中增加唯一 ID 字段, 这样每条写入的日志里都会有 HTTP 请求的唯一 ID. 在统一日志平台中分析日志时, 通过上游服务日志记录的请求唯一 ID 即可查询到该请求在下游所有服务中产生的日志.
参考链接:
https://www.datadoghq.com/blog/go-logging/
来源: http://www.tuicool.com/articles/UnANnej