10月30日,由百度主办、广告门承办的百度德尔塔俱乐部在京小聚,不同以往的讨论话题、有点炫酷的体验,为在场的嘉宾们揭露了通向未来世界的生活方式,在活动现场摆放的各类鲜花和名品包,暗示了这次的活动主题,“一图一世界”——探寻百度图像搜索的奥妙。
对准一束鲜花,通过百度App内置的拍照功能获取图像,就可以搜索出关于这束鲜花的相关信息,在不清楚学名,无法用文字描述的情况下依然能够完成搜索,而如果摄取对象是某款包,用户甚至还能同时获取到此款包的售价,品牌名以及同款包包——似乎在科幻电影中才能出现的应用场景,此刻正在通过百度拍照搜索逐步实现。在活动现场,百度研究院深度学习实验室的余轶南告诉我们,这些技术不是将来的技术,从现在起,用户会更加多的使用“将来的东西”,因为未来世界的技术,会比我们现在的还要多。人工智能最重要的就是图象识别,核心就是机器识别。
而在今年9月初的百度世界大会上,百度董事长兼首席执行官李彦宏的一番话,似乎更能证明,新技术对现今文字搜索的颠覆,他判断,未来5年,50%的搜索请求将来自于语音、图像搜索。
当天活动现场,嘉宾直接体验了拍照搜索,在手机百度APP内拍摄包包或鲜花照片,就可以搜索到相关信息。本次活动现场手提包均由百度搜索战略合作伙伴寺库网赞助。
图片识别的精准度是解决拍照搜索过程中最大的难题,余轶南介绍,目前在视觉领域最著名的数据库,包含了一千个识别的类别,它是当今最有挑战的数据库。从2010年开始,该数据库不断完善,错误率从28%降到今天的6%,而人脑识别错误率为5%,从这个过程中看,计算机的算法和人脑只有一步之遥。
事实上,百度此前已经借由几款产品,对图像识别搜索进行过试水,之前在朋友圈风靡的百度魔图APP,让用户可以根据自拍照片,找到与自己相似的明星脸。余轶南认为,这种技术使人和世界更加自然的交流,我们将自然的图像和自然的语言连接在一起,机器不但能告诉我这是什么,还要能说出一句美丽的话。
毫无疑问,图片和语音搜索,解决了人与智能设备间更深层次的沟通问题,让智能真正成为人类的外脑,而新的沟通方式的到来,则蕴藏着巨大的商机,甚至影响了到整个传播方式的改变,未来图片搜索的挑战与机遇在哪里,几位来自国内知名创意机构的创意人和百度产品研发人员一起,对百度拍照搜索未来的传播方式和形态做出了构想。
龙杰琦 CheilChina大中华区执行创意总监
百度发展语音跟图像的搜索,让消费者更容易接触到,认识这个世界,从这个出发点看,其实技术人员和创意人员的初衷是一样的。比如我们曾想过推出一款跟踪芯片,放在鞋子之中,这样能够防止痴呆老人走失,后来发现百度和361度也推出了类似的产品,只不过是运用在儿童市场。通过百度的技术帮助我们,让创意人提出更好的解决方案,这是我们创意提升的价值所在。
一个新的技术跟一个更简便的沟通方式的产生,会造成一个很大的变革,而且在这个变革背后,我想到对于客户来讲它有巨大的商机。当你去搜索一个东西,你不是用文字输入,你拍下来,可以设定它的各种产品背后的信息,你可以植入很多信息在里面,不只是搜索,它能够把这个产品出自于哪里,在哪里卖,全部都可以在图片搜索里展现出来。这个对于客户来讲,开创了一个全新的领域,也是开创了一个全新的商业机会的平台,或许它可以改变我们一些使用习惯,让我们去了解,认知这个世界的习惯。
范耀威 Leagas Delaney创意总监
BBH的创始人John Hegarty曾说“语言是沟通的障碍”,其实有两层意思:第一层是说不同种族的语言间,如果我不懂对方的语言是没办法交流的;另外一层是说人是动物,能够尽量少用文字,少用语言来表达是最好的。
现在百度拥有这三种搜索方式,语音、文字、图像,其实前两种是同一种东西,因为语音也是要转换成文字来搜索的。在人类早期的时候,我们是没有语言的,我们只是图像的表达。百度这个技术对中国人特别有意义的,我们的文字叫象形文字,我们最早的文字是从图像转变过来的,所以我们基因里就有一种对视觉表达的偏好。所以我觉得这块将来是有很大的潜力去发挥的。
上个月我在纽约博物馆就用了很多手机百度,当时我没有租助听教材,有些作品我不知道它什么背景的时候,我就用手机百度查背后是什么。今年据说中国出境游的人数超过一亿,是非常吓人的,国内游也是非常海量的数字。我在想是不是可以和旅游业结合起来。因为我们每天在城市里,可能碰到问题不会太多,但出去旅行的时候你肯定会碰到很多问题。如果手机百度能够帮助我们这些游客,通过拍照的方式去解决问题,比如说去非洲我看到很多动物,我拍一下我就知道什么东西,或者去了南美,我看到食物拍一下我就知道了。我觉得有可能跟旅游机构,旅游局,这些机构去合作,去提升游客的用户体验,这对他们来说完全是非常好的一个体验,可以得到更好的口碑。