搜索霸主GoogleVS微软王朝挺进搜图时代
这是一个信息肆意滋生的时代,谁能够将这些杂乱的信息梳理成大众可以查询的数据,那么它就将会是这个时代的王者!Google显然是第一个坐上王者宝座的,在文字关键词搜索的领域,它无人能敌,拥有绝对的权威与霸主地位。然而,这是一个读图的年代!我们正以惊人的速度向网络中传输者各种图片信息、视频信息,谁能够在这眼花缭乱的图片中,帮我们搜寻到最精准的答案,谁就将是搜图时代的新霸主。
小图大业
技术是在欲望的刺激下推动的,Google的崛起让搜索经济成为了IT行业最有潜力的金矿,在风险资本的眼中,一切能够挑战Google的新技术都会成为下一个潜在的金矿。伴随着Web2.0的崛起,伴随着图库网站和YouTube视频网站的野蛮生长,能够将这些文字搜索引擎无能为力的信息梳理清晰,将会创造出无比巨大的财富与价值。图像搜索技术显然是这场搜索时代变革中的最关键因素。
在这场新的搜图争霸战中,Retrievr图像搜索引擎显然从出生那天起就拥有绝对的优势。它的缔造者Flickr是Web2.0时代最优秀的网络图库网站,如今已经成为行业的标杆,是众多新生中小图库网站模仿的对象与财富的偶像。
Flickr图库网通过向部分专业用户征收每年25美元的使用费支撑起了一个庞大的免费用户群,这些用户成为了Flickr图像帝国的忠实臣民,也为Flickr积累了庞大的原创图片资源。这些独有的一手资源成为了Retrievr搜索引擎的最好资源库与试验场。
在传统搜索引擎中,搜索引擎通过与图片相关的网页检索出关键字,然后通过这些关键字辨别图片是否与查询信息相符。但是,关键字是随机提取的,虽然透过精巧绝伦的优化算法已经大大减少了无关图像的出现几率,但是它仍然不能够满足人们的需求,因为需求有时是模糊的,假如我需要一个以红色为基调的装饰图片怎么找寻?在Google中输入红色,你将很难寻找到满意的结果——但Retrievr能够帮助你解决这个难题!
Retrievr搜索引擎区别于传统图片搜索引擎的特别之处就在于其新颖的图片搜索方式。当用户登陆Retrievr网站后,不在需要输入任何名称来寻找你需要的图片,你只需要在网站左边提供的一张“白板”上涂写你想要的图片图形,Retrievr即可根据涂写的图形形状和颜色在Flickr庞大的图库中寻找与之相近的图片。当然,这也就意味着,Flickr的图像资源越多,你画的越精确,搜索出的结果也就越准确。
此时,如果你再一次想寻找红色基调的装饰图,那么只需要在Retrievr搜索引擎中,轻轻画出一个红色你理想的形状,它就会寻找到与你希望看到的形状、色调甚至于感觉类似的图片——多么神奇!
不过先不要惊讶,这种搜索方式外,Retrievr还提供了一个新颖的图片对比搜索功能。你想寻找莎朗斯通的大幅图片吗?你只需要有一张她的小图,然后通过Retrievr图片对比搜索页面提交到网站中,那么Retrievr就会很快的将与这张照片相同的所有照片列举出来,或许其中就有你一直希望得到那张清晰的图片。
这个功能最为神奇的地方在于,你如果将莎朗斯通的面部照片上传到Retrievr引擎之中,那么它会在短时间内神奇的帮你找到一大堆有关这个家伙的图片。虽然不是百分之百的精准,但是这项魔法般的功能已经足够让那些钟爱搜集图片的用户为之疯狂了。正是通过率先开发出这个图形搜索引擎,在小小的图片王国中Flickr成为了Google王朝潜在的竞争对手,也成为了图像搜索领域中一只不可忽视的力量。
寻道图强
Retrievr图像搜索引擎的推出,掀起了一场搜图时代的明争暗斗,从传统搜索引擎霸主Google到资金雄厚的微软王朝,甚至于一些名不见经传的小网站也纷纷加入了这场比赛。不同的公司着力于不同的技术与思路,开发出了各不相同的图像搜索方式。
微软的Live.com没有将精力放在与Retrievr引擎短兵相接的图像对比技术中,在现阶段,它巧妙的回避了已经处于弱势的技术,转而采取了更加巧妙和简单的图形算法分类检索给用户提供出多样的选择。在新的Live图片搜索引擎中,微软增加了三个新的图片搜索方式,用户可以通过简单的命令,将人物图片的面部、肖像信息作为搜索范围,还可以通过图像是否为黑白图像作为检索的条件,对于要求相对简单的用户,这已经能够满足他们的绝大多数需求,并提高了查询图片的精准率了。
看好这种相似图片搜索功能的并不只有财大气粗的微软,一家名为Picitup的网站在近期也开始对自己的图片搜索引擎进行公测。与微软类似,Picitup的引擎也是先通过关键字进行分类检索,然后用户可以通过选择面部、产品、颜色等细分选项将检索到的结果按照用户要求进行分门别类,以此提高搜索结果的精准度。此外,通过第一次检索到的图片结果,用户还可以任意点击结果中的图片,让Picitup为你再一次类出与该图片近似的图像。这显然比Live的检索功能又强大了许多。
时代给每个企业腾飞的机会都是有限的,作为技术起家Google显然比任何人都要深刻的理解技术的推动力。面对搜图时代的来临,Google并没有沉默,但是它也并没有像Retrievr在2006年就开始了第一次面向大众的测试。在今年的国际万维网大会上,Google终于解开了神秘的面纱,向公众展示了自己下一代的图片搜索系统,新引擎中融合了图像识别软件方法和将相似图像排位的技术,所采用的技术方向与Retrievr有着惊人的相似。
但是,在与Retrievr短兵相接中,Google似乎并没有体现出自己独到与特别的技术优势。它所采用的技术手段与Retrievr相同,甚至于它也没有走出自己的领地,将图片检索的范围控制在了自己旗下的Picasa网络相册中。并没有出现像大多数用户想象的那样,可以任意对比互联网中存在的每一张图像。对于这样让人失望的结果,Google工程师给出的解释是,搜索引擎索引互联网中的所有图像,并对其进行算法处理是永远无法实现也极为不现实的。
这个被命名为VisualRank的算法据说可以更精确的找到图片搜索结果,而且能够将分类相似的图片,避免显示重复结果。新技术将识别图片中的主体作为最主要的搜索因素,比如当用户搜索iPod时,Google将索引图片库中最类似于iPod档案照片的图片,而非文件名中含有iPod的图片。不过Google的工程师没有透露他们的引擎到底能够检索多少图像,但是他们自信的认为Google的图像搜索是“网上最全面的图像搜索”。
技术搜图
搜图时代前进的号角也许刚刚吹响,但是引领前行的技术变革却早已在十几年前就已经在实验室中悄悄开始了。Retrievr图像搜索引擎所使用的技术源头就可以追溯到1992年计算机领域对CBIR的研究,即基于内容的图像多媒体检索技术。
这项技术就是为了解决报刊等媒体集团大量图片检索的难题而引申出的。它主要希望利用图像的颜色特征作为索引的关键因素,对图像进行检索。通过这项技术研发的搜索引擎会根据用户提供的图像进行算法分析,在提取图像中主要颜色特征的基础上,进一步提取相应的主色空间分布信息,也就是主要颜色的形状特征作为图像库的索引。
这是晦涩的学术解释,用言简意赅语言来描述,这项技术的就是利用我们常常接触的图像略缩图,然后进行略缩图对比,查找相似的图像。如今效率和精准度已经大大提高Retrievr图像搜索引擎正是由这此技术发展而来的。
当我们上传一幅名为“西瓜”的图片到Retrievr引擎后,图形搜索引擎会先对图片的名称进行语法检索,引擎会将索引名称包含西瓜的图片作为重点检索对象。然后图形搜索引擎会再去辨别图形的颜色比例,图片中究竟包含了80%的红色,还是80%的绿色?这些都是非常重要的信息。
通过这次检索可以将色率相近的图片挑拣出来。接下来它会根据颜色的比例将图像的像素和色彩近似的筛选出来后,再对比略缩图的图像纹理,例如粗糙的纹理、图像的亮度、灰度、规律性等参数。最后通过形状对比给出确定结果,例如对比两个略缩图图片中的大体图片形状是否一样,结构相似度有多少?经过上面这一系列过程,图像引擎会将自己认为是相同类型的图片挑拣出来,给出最终结果,整个挑拣过程跟我们用肉眼在略缩图图库中选择近似图片的过程极为相似。
不过这个刚刚走出实验室的新技术仍然有许多改进之处,我们曾将一幅红辣椒的照片上传到Retrievr中寻找类似的图片,但是很奇怪,它给出的结果竟然是一堆堆的圣诞老人——难道圣诞老人和辣椒有如此之多的相似之处吗?也许的确如此,他们都是红色的,长长的形状和尖尖的一头——为什么以前我们没有发现圣诞老人像辣椒?
不过抛开这些技术的瑕疵,我们可以看到的是,未来谁掌握了最优秀的搜图方法,谁将会成为YouTube之类的图像与视频检索的幕后掌控者,如同现在Google在文搜索领域所处的霸主地位一样。显然Google提前嗅到了这种商机,在它公布图像搜索系统的同时,Google宣布不排除未来在搜索出的图像中添加自己广告的情况——这果然是一座金矿!
但与Google的自信相比,鹿死谁手的较量仍没有结果。或许查尔斯达尔文在《物种起源》中那段关于“丛林法则”的经典论述,正成为这场搜图时代的一条公理:“存活下来的物种,不是那些最强壮的种群,也不是那些智力最高的种群,而是那些对变化做出最积极反应的物种。”