导读: 高德地图拥有几千万的 POI 兴趣点, 例如大厦, 底商, 学校等数据, 而且每天不断有新的 POI 出现. 为了维持 POI 数据的鲜度, 高德会通过大量的数据采集来覆盖和更新. 现实中 POI 名称复杂, 多变, 同时, 名称制作工艺要求严格, 通过人工来制作 POI 名称, 需要花费大量的人力成本.
因此, POI 名称的自动生成就显得格外重要, 而机器对商户挂牌的语义理解又是其中关键的一环. 本文主要介绍相关技术方案在高德的实践和业务效果.
一, 背景
现实世界中, 商户的挂牌各式各样, 千奇百怪, 如何让机器正确的理解牌匾语义是一个难点. 商户挂牌的文本种类有很多, 如下图所示, 我们可以看到一个商户牌匾的构成.
结合 POI 的名称制作工艺, 我们目前将 POI 的牌匾的文本行分为 4 大类: 主名称, 经营性质 (包括经营范围, 具体的进行项目), 分店名, 噪声 (包括非 POI 文字, 地址, 联系方式), 前面 3
来源: https://yq.aliyun.com/articles/738165