项目说明
业务背景
运动潮牌鞋类越来越受年轻人欢迎,近几年运动鞋类销量也持续增高,也出现不少用户自主交易的电商平台。用户每天上传几万张鞋子照片,包括:鞋子外观、外盒或者鞋标,后台需要将鞋类照片进行分类处理,以便用户进行图像搜索时实现精准搜索。现阶段主要依赖人工进行分类后建立数据底库的形式来建设功能应用,其中耗费的人力成本过高,且识别效果不理想。某电商企业希望通过建立AI图像分类的能力来实现以图搜商品、商品自动分类等应用。
业务难点
AI模型的训练需要有图片对应标注的数据集,海量的鞋品图片需要进行标注,成本高,且人工标注效率低。模型效果调优周期长,需要反复添加数据进行模型迭代,效率低下。应用app有高并发、多地域的用户使用特性,如低成本地部署AI模型成为难点问题。
解决思路
通过EasyDL图像分类任务,无需了解AI算法知识,简单上手使用,提交少量图片进行训练,很快即可获得能够识别鞋类照片的AI模型。标注少量数据后可使用智能标注功能,完成大量原始数据的标注,来进行模型训练与迭代。模型可生成在线API服务,多地域、高并发调用;并通过该模型在内部平台建立了图片自动分类的接口,当有用户上传图片时,将自动对其分类。每日3W+的新增照片分类,补充了产品后台数据处理能力,替代原有10+人工审核团队,提升审核效率。
数据准备
数据采集
客户最终的应用场景是在电商app中提供用户拍摄的鞋类照片识别功能,因此数据采集的照片要尽量贴合用户拍摄的场景,具备真实性,包含多种光照条件,这样才能保证训练模型的效果。切勿使用网络图片进行训练。应用场景需要对每种型号的鞋品进行识别,并定位到最终的鞋品型号(例如NIKETMQPDG1),型号具有唯一性,可在AI模型应用时直接通过AI识别定位到鞋品SKU。因此需要对每种型号的鞋品进行多角度拍摄采集数据。而在设计标签时,也需要注意的是,每种型号鞋品的不同视角图差异太大,因此我们需要将鞋底、鞋侧面等图片分别定义为对应的标签。
创建并导入数据
第一步,在EasyDL