1 月底, 阿里云正式推出以计算机视觉 AI 能力为核心的视觉智能开放平台 (vision.aliyun.com), 平台目前已上线 8 大类目, 超过 50 多种视觉 AI 能力, 面向人脸识别, 文字识别, 商品理解, 内容安全, 图像识别, 图像增强, 目标检测等多个视觉应用核心场景. 所有视觉 AI 能力都以 API 方式进行开放, 最大程度降低开发者接入成本.
阿里云作为亚洲最大的公有云服务商, 支撑起了国内最大的零售平台淘宝, 天猫, 最大的支付平台支付宝, 背后得益于雄厚的技术研发能力和运维能力. 视觉技术作为 AI 领域应用最广泛的技术之一, 在阿里巴巴内部一直作为核心技术不停的进行研发创新, 最终形成了成熟的视觉体系. 今天, 阿里这些所有成熟的视觉 AI 都能在阿里云视觉智能平台调用 (vision.aliyun.com)
据了解, 阿里云视觉智能平台上所有 AI 能力均来自阿里巴巴经济体, 包括达摩院, 阿里云, 支付宝, 菜鸟, 天猫等事业部, 其中包含了深度学习, 图像识别, OCR, 图计算等方面的最新前沿研究成果, 并且所有 AI 能力都经过了阿里经济体的具体应用与实践, 确保各能力符合场景实际需求.
平台特点
阿里云视觉智能平台荟聚了阿里巴巴集团最专业, 全面, 易用的视觉 AI 能力, 同时还提供最快捷有效的方式为开发者提供服务, 降低开发者研发成本, 降低使用门槛, 让小白也能使用人工智能.
平台能力
平台已经上线超过 50 种 AI 能力, 涵盖 8 大类目视觉智能能力, 以满足开发者在安防, 数字营销, 新零售, 生活娱乐等方面的功能开发需求. 还有 100+AI 能力在陆续上新中. 具体能力如下所示:
人脸识别: 人脸数量检测, 人脸特征点检测, 人脸定位检测, 人脸置信度检测, 人脸姿态检测, 人脸特征点定位检测, 瞳孔检测, 性别识别, 年龄识别, 简单表情识别, 佩戴眼镜识别, 人脸属性识别, 人脸对比 1:1, 人脸对比 1:N
文字识别: 身份证识别, 户口页识别, 银行卡识别, 名片识别, 驾驶证识别, 行驶证识别, 车牌识别, VIN 码识别, 出租车发票识别, 火车票识别, 营业执照识别, 公章识别, 通用文字识别, 表格识别
商品理解: 商品分类
内容安全: 图片智能鉴黄, 图片暴恐涉政识别, 图片 logo 识别, 图片垃圾广告识别, 图片不良场景识别, 图片风险人物识别
图像识别: 颜色识别, 风格识别, 元素识别, 通用图像打标, 场景识别
图像增强: 图像裁切, 图像超分, 色彩迁移, 风格迁移
图像分割: 通用分割, 人像分割, 面部分割, 头部分割, 头发分割, 商品分割
目标检测: 主题检测, 机动车检
效率平台
视觉智能领域能力技术相比其它 AI 类技术 (语音语言等), 功能流派更多, 场景也更复杂 , 各种能力逻辑也存在互相包含的情况. 阿里云视觉智能平台依靠整个阿里巴巴经济体的大量业务场景和应用实践 (电商零售, 金融物流, 文娱营销, 企业服务等多个行业), 将复杂的视觉 AI 能力进行系统划分, 形成最符合实践场景的 AI 能力系统, 并通过平台进行统一输出, 开发者可以轻松找到适用于自身研发需求和业务场景的能力, 以最低的成本调用最匹配的 AI 能力进行视觉场景研发.
普惠三面
- "使用门槛越来越低"
- "使用人群越来越多"
- "使用面越来越广"
阿里云视觉智能平台希望为视觉智能 AI 领域带来真正的普惠 AI, 将接入使用视觉 AI 门槛和成本降到最低, 以整个阿里云最强的运维能力和技术为用户提供最高的价值. 未来, 阿里云视觉智能将集合更多视觉领域的 AI 能力, 拓展更多成熟的使用场景, 在图像识别, 人脸识别, 文字识别等视觉智能领域帮助开发者和企业实现研发为核心, 创造为价值的普惠 AI.
了解更多 AI 产品请戳: https://vision.aliyun.com/
点击观看产品发布会: https://developer.aliyun.com/live/1915
来源: https://yq.aliyun.com/articles/746595