最后在浏览器中输入 http:// 你的服务器 IP:3000 并访问, 出现如下页面即安装成功!
点击 Login 登录, 初始账号: admin, 密码: password, 登录进去可自行修改.
开始定制专属 RSS
以下以制作电影天堂的最新电影 https://www.dytt8.net/html/gndy/dyzz/index.html 信息 RSS 为例
新建第一个 Agent, 获得标题和对应链接
初始化已经有一些 Agents, 你可以从里中学习到一些使用方法. 点击 + New Agent 添加第一个 Agent,Type 选择 website Agent.
Name 框输入名称, Schedule 下拉框选择执行的间隔时间, 其他默认即可
Options 参数最为关键, 右侧都有英文说明的, 字段简要说明如下:
url: 网址链接
type: 返回的数据类型, 支持 xml,,HTML,JSON,text, 此处填写 HTML
mode: 抓取模式, 可选 all, on_change, merge, 这里填写 on_change, 表示页面有变化才会抓取
extra: 表示抓取规则,
url 和 title 表示抓取字段的名称, 可随意命名;(后面用得着, 作为参数传给其他 Agent)
CSS 表示抓取内容的 CSS 路径, value 表示抓取的值,@href 表示抓取对应 CSS 标签的 href 属性值, 还有 @src,@title 等等;
如果要抓取对应标签的值, 可填.(包括 HTML 代码的全部内容),string(.)(只包含对应标签的值),text() 等同 string(.)
填写完毕后点击 Dry Run, 如上图显示抓取到了数据表明有效, 然后点击 save 保存, 否则请修改 extract 下的参数再试.
保存后 run 一下, 然后就会有生产出很多 events, 就是获取到的数据. 如果没有获取到可能是数据库的问题.
新建第二个 Agent, 获取全文输出
同样的, Type 选择 Website Agent,Sources 选中第一个 Agent, 下面的框一定勾选上
{{url}} 即第一个 Agent 传过来的超链接参数, 这里 mode 一定填写 merge, 这样两个 Agent 的字段就组合到一起了, 同样的选择一个接受到的 event 测试一下
把第一个的 events 都删除然后重新 run 一下可以发现第二个 Agent 也自动执行了, 第二步完毕.
新建第三个 Agent, 输出成 RSS
Type 选择 Data output Agent,Sources 选择第二个 Agent,secrets 填写 RSS 地址自定义的末尾名称, item 下就是 RSS 中的每一条信息了, 填写上对应参数, 其他默认即可. 最后点击保存
来源: http://www.bubuko.com/infodetail-3356441.html