AI技术精选一:图像识别技术的“今生”与“来世”

2017-04-06

现代社交网络的发展带来了海量图片视频信息,目前人类现有信息中百分之七十的信息为视频图片信息。 伴随着图片成为人类社会中的主要信息载体,难题随之出现。图片给我们带来了快捷的信息记录和分享方式,却无法高效的进行检索。在这样的环境下,人工智能中的图像识别技术就显得尤为重要。

图像识别是处理器对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。简单来说,图像识别就是处理器如何像人一样读懂图片的内容。借助图像识别技术,我们不仅可以通过图片检索更快的获取信息,还可以产生一种新的与外部世界交互的方式,甚至会让外部世界更加智能的运行。

AI技术精选一:图像识别技术的“今生”与“来世”

人工智能视觉

应用化

在这个阶段,用户主要是借助图像识别技术来满足某些简单化需求。例如,最新的人工智能互联网鉴黄工作;国内专注于图像识别的创业公司 和创懒人基于视觉的slam研发,借助图形识别等技术研发机器人移动相关的slam。这将极大改善机器人自主移动的成本与效果。

此前我们利用科技工具搜寻外部世界的流程是:人的眼睛捕捉目标信息、人的大脑将信息进行分析、转化成机器可以理解的语言、与机器交互获得结果。而当图像识别技术给予了机器“眼睛”之后,这个过程就可以更加简化:人眼借助机器捕捉目标信息、机器和互联网直接对信息进行分析并返回结果。图像识别使摄像头成为解密信息的钥匙,我们仅需把摄像头对准某一未知事物,就能得到预想的答案。

拥有视觉的机器

AI技术精选一:图像识别技术的“今生”与“来世”

未来拥有视觉的人工智能机器人

如上文所说,目前的图像识别技术是来帮助我们与外部世界进行交互,只为我们自身的视觉提供了一个辅助作用,所有的行动还需我们自己完成。而当机器真正具有了视觉之后,它们完全有可能代替我们去完成这些行动。目前的图像识别应用就像是盲人的导盲犬,在盲人行动时为其指引方向;而未来的图像识别技术将会同其他人工智能技术融合在一起成为真正的人工智能管家,让我们得到完全解放。

许多科技巨头也开始了在图像识别和人工智能领域的布局,Facebook签下的人工智能专家Yann LeCun最重大的成就就是在图像识别领域,其提出的LeNet为代表的卷积神经网络,在应用到各种不同的图像识别任务时都取得了不错效果,被认为是通用图像识别系统的代表之一。值得一提的是,国内的和创懒人AI研究室已经研发出基于视觉的图像识别核心算法。这也是国内人工智能研究公司对图像识别技术以及人工智能技术的一个里程碑。

很难想象未来有什么职业无法被人工智能所替代。