Facebook 开源三款图像识别人工智能软件

Facebook今天开源了三款人工智能图像分割（Image Segmentation）软件，分别是DeepMask、SharpMask和MultiPathNet，三款工具相互配合完成一个完整的图像识别分割处理流程，DeepMask生成初始对象mask、SharpMask优化这些mask，最后由MultiPathNet来识别这些mask框定的物体。SharpMask目前已遵循BSD授权协议在GitHub上公开源码。

Facebook的人工智能研究实验室（FAIR）此前曾在多篇学术论文中讨论过以上开源的图像分割技术（论文1、论文2、论文3）。图像分割技术不仅能够识别图片和视频中的人物、地点、物体，甚至能够判断它们在图像中的具体位置（精确到像素级别），为了做到这一点，Facebook使用了一种人工智能技术——机器学习，也就是用大量的数据来训练人工神经网络，不断提高其对新数据的处理判断准确性。

Facebook一直是开源人工智能技术的积极推动者，在开源三款图像分割软件工具之前，Facebook还曾在Torch上开源了一些功能强大的深度学习工具。

深度学习是科技巨头竞争激烈的技术阵地，包括苹果、百度、谷歌和微软都投入重金，并在COCO这样的图像识别竞技场上展开激烈角逐。

据Facbook介绍，图像分割技术对于改进社交软件来说意义重大，例如计算机能够自动识别图片中的物体，这能极大提高图片搜索的准确率和效率，即使这些图片没有添加人工标签。对于视力障碍的用户来说，计算机甚至能给他们念出图片中的内容。

Facebook人工智能实验室的科学家Piotr Dollár在博客中指出：图像识别技术的下一个挑战是视频识别，这方面Facebook的计算视觉技术已经取得一些进展，能够在查看视频的同时理解并区分视频中的物体，例如猫或食物。对视频中物体的实时区分功能将大大提高Facebook视频直播内容的推荐准确性，而且随着技术水平的提升，未来机器将能根据场景、物体和动作的时空变化给出实时的描述。

http://www.oschina.net/news/76523/facebook-opensource-image-segmentation

秒客网

Facebook 开源三款图像识别人工智能软件

相关文章