文心 (ERNIE) 是依托百度深度学习平台飞桨打造的语义理解技术与平台, 集先进的预训练模型, 全面的 NLP 算法集, 端到端开发套件和平台化服务于一体, 为企业和开发者提供一整套 NLP 定制与应用能力. 在 2020 世界人工智能大会, 百度文心 (ERNIE) 荣获最高奖项 SAIL 奖(Super AI Leader, 卓越人工智能引领者).
ERNIE 开创性地将大数据预训练与多源丰富知识相结合, 持续学习海量数据中的知识, 将机器语义理解水平提升到一个新的高度. 以中文模型为例, 目前 ERNIE 已经学习了 1500 万篇百科语料和词语, 实体知识, 700 万个人类对话, 3 亿的文章的因果结构关系, 以及 10 亿次的搜索查询与结果的对应关系, 以及 2000 万的语言逻辑关系知识. 模型还在持续不断地建模新的海量数据与知识, 不断地提升下游的应用效果. ERNIE 在中英文的 16 个任务上已经超越了业界最好模型, 全面适用于各类 NLP 应用场景.
目前, EasyDL 已预置了领先的预训练模型 ERNIE2.0, 并配套了多种 NLP 经典算法网络, 支持了文本分类, 短文本匹配和序列标注等典型文本处理任务.
近日, 文心 (ERNIE) 重磅发布三项功能, 新增定制多标签文本分类, 情感倾向分析, 文本实体抽取模型等功能, 同时数据管理能力也进一步增强, 更好地满足 NLP 领域开发者需求, 开发者可通过百度 AI 开发平台 EasyDL 进行使用.
EasyDL 是百度大脑面向企业开发者推出的零门槛 AI 开发平台, 基于百度自主研发的深度学习平台飞桨, 结合业界先进的工程服务技术打造, 覆盖视觉与自然语言处理两大技术方向, 支持一站式智能标注, 模型训练, 服务部署等全流程功能. 目前 EasyDL 已经被广泛应用在零售, 互联网, 安全生产, 工业质检, 教育, 医疗, 交通等 20 多个行业, 拥有 70 多万用户.
使用 EasyDL 简单三步即可完成 NLP 任务配置与训练, 性能优异.
那么, 文心这么厉害, 有没有机会和高工面对面, 快速掌握技术原理与实际应用?
本周六, 百度资深研发工程师空降上海, 一个上午从文心 (ERNIE) 技术解析到实战演练为你解析如何定制企业高精度 NLP 模型.(文末海报报名哦)
我们先来点技术干货稍做预习, 了解下文心 (ERNIE) 近期重磅上线的多项实用功能!
新增定制化多标签文本分类功能
"多标签文本分类" 指对一段文本同时标记多个标签, 如:"未来的学和教正在发生颠覆, 学生将会在家里学习, 机器人将走上讲台." 可对应标签为 "教育","科技". 该功能应用场景广泛, 如媒体场景中对新闻内容进行自动归类, 在内容推荐场景中利用内容标签提升召回, 通过自动标签功能对知识文档进行多层级分类等.
目前, EasyDL 平台经典版和专业版均新增了这项功能, 在 "专业版" 的任务配置过程中, 开发者还可选择 ERNIE Tiny,ERNIE Large,ERNIE Base 三种各有所长的预训练模型.
新增定制化情感倾向分析功能
"情感倾向分析" 指对一段文本进行 "积极情感" 或 "消极情感" 的判断, 如 "酒店位置很好, 服务周到热情, 下次一定会再来" 的用户评价, 部署模型后可直接得到 "Positive(积极情感)" 的标签和 99% 的置信度.
该功能最常应用于用户评论分析和舆情分析, 比如商品, 店铺的口碑分析, 对事实性的新闻事件或互联网话题进行舆情分析等, 在汽车, 餐饮, 酒店等多个垂类上, 分析准确率可达到 95% 以上.
目前, 该功能已经上线 EasyDL 经典版, 后续平台将逐步增加基于实体级和句子级的情感分类, 力求覆盖更多的应用需求.
文本数据管理和数据标注功能全面升级
针对开发者数据管理和数据标注过程中的痛点, EasyDL 支持了更加灵活的数据格式, 当前可支持 zip,Excel,TXT 三种文件格式进行上传. 除了提供在线标注能力外, 还提供智能标注功能, 大幅降低了开发者的标注成本, 开发者可直接上传未标注数据体验该功能.
图: 文本智能标注示意图
10 月 24 日当天, 百度 AI 快车道[飞桨开源框架高阶营] 线下课程 "闪现" 上海站, 邀请 "魔都程序猿" 和 "沪上程序媛" 来到上海市徐汇区瑞平路 230 号保利时光里 B1-09--LOFAS 集聚空间, 与百度资深高工, 各位行业开发者相聚一堂. 上海站内容绝对不会令你 "空脑而归", 开发全流程, 部署工具, 高精度目标检测, 模型优化方案一一奉上, 更有 "全能"OCR, 金牌推荐算法, 一起来场硬核趴体吧!
想了解强大文心 (ERNIE) 背后的技术原理?
想更进一步快速掌握 NLP 模型开发方法与技巧?
想线下和百度资深研发与各行业开发者深度沟通?
本周六上午, 就在上海徐汇区复兴路 1199 号 A 座 5 层, 百度 AI 快车道[EasyDL 零门槛模型训练营] , 资深研发工程师详解 NLP 技术能力, 并带来现场实操与面对面答疑解惑, 助你三小时掌握 EasyDL 的 NLP 模型开发秘籍!
点击下方链接即可体验!
https://paddle.wjx.cn/m/93404058.aspx?udsid=798299
来源: http://ai.51cto.com/art/202010/629220.htm