原文作者Kaz Sato,Google Cloud Platform
一海之隔的邻国日本,在工业和自动化程度上永远追求更高效的同时,也面临着部分重复性工作需要大量人力投入的窘境——比如说,按品质自动归类分拣黄瓜。今天我们就说说一个叫做Makoto Koike的小伙子,利用机器学习和云端计算,解决这个黄瓜窘境的故事。
黄瓜的困境
在日本,每个农场都有自己对于黄瓜品质的分级标准,但仍然缺少一个行业通行的标准。根据黄瓜的颜色、纹理、尺寸、厚度、划痕等可见的属性,每家农场会对黄瓜进行不同程度的分拣,进而在市场上以不同价格的进行售卖。又直又粗、颜色显眼、带有大量黄瓜刺的品种是市场上的特极品,自然也能在价格上比普通黄瓜高出许多。
Makoto家的农场对自家产的黄瓜有九个不同类别的划分,他的父母则是这项标准划分的指定和操作人。在高产时期,花费在黄瓜分类上的时间每天高达8小时!
大约一年前的Makoto,还是日本汽车工业嵌入式系统的一名设计师。在这期间,他也花了几个月的时间参与了分拣黄瓜的农活。“分拣工作不是一件容易上手的事。你同时得兼顾黄瓜的尺寸、厚度、颜色、纹理,是否有划痕、是否歪斜、是否有刺。在最忙的时候,就算雇佣临时工也不能解决根本问题。”Makoto说到。他认为农场主应该花更多精力在种出好吃的菜上,而不是分拣任务上。
机器学习的想法
他决定着手用更智能的方式帮父母解决这个耗时耗力的工作——对收集后的黄瓜进行拍照,使用机器学习的方式对黄瓜的照片进行分类,自动化按照标准分拣黄瓜。
“当我看到Google AlphaGo时,我意识到这会有很重要的促进作用。正因此,才触发了我开发机器学习技术的黄瓜分拣机。”
计算机可以利用对图像识别的深度学习,从训练数据集中学到图片中的一些重要“特点”。通过使用大量的人工神经元层次结构,深度学习可以自动地进行高精确度的图像分类工作。比如计算机可以从图片中识别出不同种类的猫、汽车或是飞机。
“Google刚刚开源了TensorFlow,于是我打算用黄瓜的图片来试试看。尝试后的精确度比我的预期还高,使得我有更大信心来解决问题。”
黄瓜的救赎
黄瓜分拣机系统示意图
Raspberry Pi 3作为主控制器,采集黄瓜的图片。
TensorFlow上的一个小规模神经网络,检测图片是否为黄瓜。
TensorFlow上的一个较大规模神经网络,对黄瓜图片进行详细分类。
下面是黄瓜分拣机的无码特写
黄瓜分类手臂
分类界面
黄瓜救赎的背后
Makoto利用3个月的时间,收集他母亲采集的7000张黄瓜照片作为这个分拣系统的训练数据集。
好消息是:使用训练数据集,识别准确率>95%
坏消息是:使用实际场景,识别准确率降到了70%
结论:强大的黄瓜分拣系统仍然需要更多的训练数据集作为学习素材。
7000张训练数据集的背后,仍然有着数据计算能力的缺口。Makoto采集的是80×80像素的低分辨率黄瓜图片,在windows台式机上跑完图像训练模型仍然需要2-3天的时间。而且,目前还不能识别颜色、纹理、划痕和黄瓜刺。虽然提高图片分辨率可以相应提高识别精准度,但训练的时间也就显著的增加了。
即使黄瓜分拣的困难仍然存在,但Makoto还在信心满满的调整各种算法、参数和神经网络来提高识别的准确率。
这个“逃避干农活”的孩子与黄瓜的段子就此打住,不知是否给各位读者来带一丝黄瓜的清新思考呢?
话不多说,老板喊我去干农活了…
本篇文章来源于微信公众号: 腾讯CDC体验设计