谷歌Google推出亲人搜索 助力救灾 剑指本土化
谷歌Google推出亲人搜索 助力救灾 剑指本土化
2008年5月22日,北京时间——截至5月22日下午,四川汶川地震已经造成三万多同胞遇难,198347人因灾受伤。巨大的震动和悲伤盘旋国人心头整整六天。为了整合非常时期最有价值的亲人信息,世界搜索引擎巨头Google(谷歌)5月16日早晨紧急推出了——亲人搜索,这可不是谷歌的又一个愚人节玩笑,在这个时候没人有心情过愚人节,“亲人搜索”(www.google.cn/qinren)是谷歌工程师各司其职,利用“机器 人工”的原理研发的一个新产品。该产品利用谷歌定制的搜索引擎(Custom Search Engine)技术平台,把搜索范围限定到那些专门发布地震消息的网站,把那些与地震相关,包含失踪或遇难人员的网站找出来并进行实时索引,整合到这个定制的搜索引擎里去。这个亲人搜索可以帮助在中国乃至世界每一个角落不断地搜索亲友的人们,获得哪怕只是只言片语的信息。截至目前,“亲人搜索”经过数次更新,已经初具规模,可以覆盖40多家当地医院,4万灾民信息。据了解,四川汶川发生强烈地震.后,谷歌公司即迅速组织了大批人力,加班加点进行地震.救灾的相关工作。
此番推出的谷歌灾区亲人搜索,展现在我们眼前的仅仅是个页面,背后却是几十位工程师,夜以继日、两天没合眼加紧推出的。
更重要的是,“亲人搜索”还整合了网络下的消息,谷歌的工程师们夜以继日,打电话联系灾区的医院和相关收留单位,获取幸存下来的人员名单和联系方式,帮助惦念他们的亲人和朋友找到他们。 以下截图二的信息,便是谷歌整合的来自互联网之外的受灾人员的信息。在搜索结果的最上端,是谷歌整合的“Onebox”,查询者可以以最简单的方式、最快的速度获得被查者的信息。
| 亲人搜索首页 |
| 亲人搜索整合当地医院伤员信息 |
5月18日,周末,笔者来到谷歌中国公司,谷歌员工似比往常更加忙碌了。
5月16日谷歌推出“灾区亲人搜索”,有些网民仅仅通过页面,难以理解所谓亲人搜索到底如何,笔者也带着这个困惑,走访了部分谷歌中国公司员工。谷歌中国区总裁李开复亦对此详加解释,并进行了演示。
由于搜索引擎爬虫对于网页信息抓取有个价值判定周期,对于正在发生的汶川地0震.相关信息,技术上的网页权重和实际上的价值有效存在一定落差。非凡是在寻找亲人这一方面,许多网站比如成都社区、新开的站“512寻人网站”以及一些医院的网页等,根本就没有PR,网页内容权重非凡低。但是民众对于亲人寻找又是十分急切,这就需要对网页内容的选择、抓取进行一定的人工干预。
谷歌技术人员Devin Chen告诉我们,谷歌亲人搜索已经不是传统意义上的搜索引擎那样,依靠机器自动抓取内容。亲人搜索的每一个网页都是谷歌员工通过手工或者其他技术举措找到的。
他解释说:Custom Search Engine可以针对非凡提交的网页做一个小范围的搜索。同时,他们增加了Google App Engine的功能,放入了一个数据库,这样当有官方信息的时候,会有一个onebox的出现。对于其他公司提供的资源和引擎比如百度、搜狗等抓取的信息,也把它们融入进来,以求信息最大化地有效。
这个平台,主要在于谷歌对外开发的两个技术平台,尽管技术创新并不突出,但实用XXX却非常高。
DevinChen说,谷歌亲人搜索的XXX质几乎就是一个大家所说的“人肉”搜索,他们花了相当大的功夫和心血,上百人不眠不休地工作。除了大批量录入新的网页之外,在发现网络爬虫不够实时,他们就一个个的copy-paste这些内容。非凡还有些网站是用Ajax技术,爬虫很难获取信息,非须人工进行甄别不可。除了人工繁琐加工,还购买了大量卫星数据,力求亲人搜索有效。
通过数天的运行,谷歌亲人搜索亦取得了预期效果,寻找亲人上谷歌平台已经成为许多网民的首选。据悉,四川电台也开始通过谷歌相关平台要求得到帮助,把想捐赠的人和需要的物资联系起来。
这几天我们经常可以看到,在谷歌自己的广告平台上,出现不少自己的广告,比如对于亲人搜索这一新服务进行推广。谷歌中国公司市场部的人员天天晚上三点才回家,在买全球广告词,以吸引外国人捐钱,笔者通过一些英文搜索引擎可以看到,搜索"china earthquake"会看到许多谷歌对于此次地震.救灾的广告。
李开复告诉笔者,作为四川人,对这次的灾难有非凡深的悲伤和感慨。非凡是处于他这样一个位置,更多地感受到一种责任。笔者也看到他也是满脸愁容,眼睛布满哀伤。
李开复介绍说,灾难发生后,谷歌数百名员工几乎没有怎么休息,赶制各种尽可能的服务。公司只有五百多人,两三天就募捐了一百五十万元,谷歌公司层面直接捐款200万美元。他们还通过捐赠要害词广告方式,在全球使用100种语言进行"中国地震.捐款"或其他要害词的针对XXX捐赠。而且这种具有很强针对XXX的捐赠,将会比此前缅甸具灾推出的全球首页捐赠更加有效。
李开复最后表示,谷歌中国公司作为一家中文搜索引擎,永远会把华语网民的需求置于首位,这一点毋庸置疑。
但是,40家医院、4万余人的信息仍然太过有限,我们可以想象那些亲人仍然下落不明的同胞的悲痛心情,作为一个开放的搜索平台,谷歌需要更多的来自用户提供的内容,那些散落在用户中的零零落落的信息,对谷歌来说非常重要。“我们当时都是在熬夜干活儿。”柯化成向记者说。在发现寻亲搜索的需求后,他和几个同事通过简单的联系,花半个小时的时间就做出了产品的原型系统,并在内部进行了讨论,认定这样的产品能够帮助救灾。
与此同时,寻亲搜索也得到了谷歌全球副总裁兼大中华区总裁李开复的支持。于是,这个自发的项目迅速启动,并加班做出了产品的第一个版本。5月16日早上6点,寻亲平台正式发布。此时距离项目动议恰好20个小时。
对于能够迅速开发出寻亲搜索的原因,柯化成总结道:谷歌有独特的技术结构,例如CSE、AppEngine等,这些提供了快速开发的工具,节省了大量的时间。
同时,谷歌全球范围的配合也提供了帮助。在这次开发中,谷歌分布在美国、中国、瑞士等地的工程师进行了不间断地接力式开发,保证了每时每刻都有人参与到开发中来。
当然,即使是在谷歌这样的高科技公司,面对紧急任务时,也不得不部分依靠于最原始的方式。
从5月16日凌晨3点开始,谷歌的寻亲搜索团队发动了几十人一起开始了浩如烟海的“人肉搜索”,从各大门户、论坛、非凡是四川的各主要网站上,收录了近3000条URL pattern。
在柯化成看来,当前的网络和搜索技术虽然达到了一定程度的自动化,但距离全自动还有很远的距离。于是,当面临紧急任务的时候,开发人员不得不放下架子,做一些手工查找的工作。这种在网络上如同爬虫一般寻找信息资源的作业方式,对他们来说是一种“体力活”。
谷歌中国的寻亲搜索平台发布后,流量迅速增长。根据谷歌中国方面提供的数据,该平台发布的第一天,用户使用次数就达到10万次,第二天就已经涨到4倍以上。
工程师们还在不断对该平台进行改进。5月17日11点,寻亲搜索平台的第二个版本发布,更多的网站信息被加入了进来。同时,用户也可以通过发手机短信的方式在平台上发布信息。
“有的医院和安置点的消息都是以纸质形式发布的,有的就直接贴在门外的电线杆子上,再由好心的网友用手机拍摄成图片发布在了网络上。我们要负责查找这样的图片,并且手工录入这些数据,这又是人肉部队干的活儿,太辛劳了。”柯化成说。
截至5月21日凌晨,谷歌中国的这个平台已经收录了344个网站的147473个网页,以及80家医院的38284条记录。
志愿者的工具
除了谷歌的开发人员之外,对于这个寻亲搜索平台有强烈参与意识的还包括那些抗震救灾中的志愿者。
在美国卡耐基梅隆大学(Carnegie Mellon University)上学的钱敏杰告诉记者,他在5月12日当天就从豆瓣网知道了汶川地震,并迅速在海外发起了“汶川需要你的帮助”的小组,联系香港的救援组织,并且汇总国内的灾情报道。
当天晚上,这个小组已经有了5000人。5月14日,人数进一步增加到12000人。分布在世界各地的这些小组成员纷纷把和灾情相关的消息,聚合到该小组开发的主页上。开始的时候,这些消息集中于血库信息,后来由于灾区缺乏物资,内容也慢慢转到了物资需求信息上。
“开始我们的信息发布平台在豆瓣网。但豆瓣的发布方式是文字的,前方人员看起来不直观。”钱敏杰告诉记者,“我们在17号,开始意识到需要利用地图更好的显示信息,为前方提供第一线消息。”
此后,他们联系了谷歌中国,并加入了其寻亲平台的运行,把得到的消息发布在平台上。
“我们希望全国其他各地的捐物者能了解前方的信息,让捐物更有针对XXX一点。”钱敏杰说。各地的志愿者或能够获得信息的网友,通过现场调查或者从可靠的渠道得到消息后,在平台上发布物资紧缺消息并留下联系方式,后方拥有资源的人们可以根据网络上的消息和前方取得联系,提供物资。
一位在成都的NGO负责人也对记者表示,其也把所获得的情况,发布到谷歌的平台上。
“我们的主要精力放在了学校救助方面,调查地震灾区的学校毁损情况,把主要精力放在灾后校舍的重建。”这个主要针对学校救助的NGO人士表示,其把前方人员派到各个灾区调查学校的毁损情况,获得关于校舍的第一手的资料,同时也能获得其他的情况,他们把这些情况发布在网络平台上,不仅包括物资,也包括校舍的资料。
在这位人士看来,救灾已经离不开网络了。
开放平台的问题
然而,目前评估网络救灾的效果似乎还为时过早。
当记者问谷歌中国和志愿者们,他们是否可以评估自己在救灾中起到了多大的作用,双方都没有明确答复。事实上,到目前为止,还没有足够的反馈让人们做出一个合理的评价。
网络只是提供了一个必要的平台,并且展示了利用这个平台能够做出什么样的事情。至于该平台最后能起到什么样的作用,还在于使用这个平台的机构和个人的共同配合和协调。
网络数据由于海量和分散的特点,给信息查询和整合带来了麻烦。谷歌力图在定向检索上为人们提供一个集中的便捷的查询平台,把所有分散的信息统一在一个数据库中。
然而,这同时也带来了数据的不准确XXX。比如,如何判定从网络上检索的信息是准确的?据记者了解,谷歌中国已经采取了技术手段,避免虚假数据,但目前这并不能完全杜绝不真实消息的存在,其搜索出来的数据也都已经标明“仅供参考”。
“在目前阶段,我们宁肯把可能的答案都告诉寻亲的人们。在快速的基础上再提高准确XXX。”柯化成说。
在他看来,假如要让数据更加准确,还需要更多的官方或者半官方机构参与,“一方面,我们离不开民间的参与,假如没有民间志愿者,就没有足够的材料;另一方面,由于无法完全过滤掉错误信息,假如有比较权威的机构参与更新数据,会让信息更加可靠”。
“最起XXX谷歌给人们带来了想象力,它的开放XXX真的有点儿维基百科的味道了。只是如何保证垃圾信息的过滤还是一个问题。”一位业内人士如此评价。
为此,谷歌的“亲人搜索”增加了短信发送功能,希望用户能够更加方便地提供灾区人员信息。
只要大家将自己或所知道的朋友的状况(所在城市,联系方式等)经手机发送信息到106617001912,经过确认后,就会自动整合到灾区人员搜索平台的后台数据库中;查询的人只要登录谷歌“亲人搜索”,就可获得这些信息。谷歌在中国的力量还太小,因此我们也提供了一段开放的代XXX,任何的网站、博客,都可以将这段代XXX嵌入到自己的网站中,让更多的人加入到这个寻找希望的队伍中来。
我们相信,你正在搜索的亲人、爱人、友人,也许并不在遇难者那悲痛的巨大数字里。他也许正在废墟前抢救生命,她也许正在医院里护理伤员,他应该已在避难所得到帮助,她应该正忙于为幼儿寻粥问饭……很快,他们就会听到我们的呼唤,知道在这场苦难中,他们从未孤独。
在此,我们向每一个朋友真诚求助,因为我们需要一个众志成城、民众共铸的搜索,共同努力提供更多的消息,搭建起一个交换希望、交换勇气的平台。
天佑中华,祈愿灾难中的人们平安。
关于Google™(谷歌):
谷歌公司(www.google.com)的创新搜索技术天天为全球数以千万计的人们提供信息服务。谷歌由斯坦福大学的两位博士——拉里•佩奇(Larry Page)和谢尔盖•布林(Sergey Brin)在1998年创办,如今在全球主要市场的互联网界都已取得了领先地位。谷歌提供有针对XXX广告服务,为各种规模的企业提供可以测量的结果,并增强了用户的互联网使用体验。谷歌总部位于美国硅谷,在北美、欧洲和亚洲都有办公地点。
Google™是Google Inc.的注册商标。本文中涉及到的其它公司和产品名称为与此相关的第三方的知识产权。
编辑注:在这次四川汶川大地震中,我觉得谷歌GOOGLE很好的尽到到了一个大型企业应该有的社会责任~为google的本土化埋下了一个春天的种子~我相信,中国不仅仅是百度更懂得中国人的习惯~其实google也在努力~最后再次祝福灾区人民走出困境~天堂的朋友们你们走好~


















没有评论▼