行业联盟云平台欢迎您!

收藏本站

当前位置:资讯首页 > 互联网

百度凭什么站在人工智能竞争最前沿

2014年07月07日09:49中国行业联盟
    今年5月,在美国硅谷,距离谷歌、苹果总部不远,百度美国硅谷实验室开张了。一家中国互联网企业敢于单枪匹马地将自己的研发中心,摆到了国际顶级竞争对手的“家门口”,在当地引起了不小的轰动。
    如今,谷歌、Facebook、微软等科技巨头都在低调地瞄准人工智能发力:过去一年,谷歌给几乎所有机器人研究领域的公司都开出了收购的报价;微软在今年早些时候推出了研发许久的基于人工智能的虚拟个人助理服务;Facebook的人工智能小组去年9月开始秘密实验“深度学习”技术,以让用户获得更多有趣的新鲜事和更精准的广告。在这场竞争中,百度作为唯一一家中国企业站到了最前沿。
    百度拿出了什么样的“武器”参与这场竞争?百度的深度学习又是如何改变我们当下生活?决定这场竞争的关键是什么?

“百度大脑”是这样思考的

    “‘百度大脑’现在相当于两到三岁孩子的智力水平,可能是世界上最复杂的、模拟人大脑思维的系统。 ”今年4月,百度创始人兼首席执行官李彦宏对外宣布了 “百度大脑”项目。
    “‘百度大脑’是以大规模机器学习与深度学习为基础的人工智能在搜索引擎中的应用。”百度高级副总裁王劲一语道破了“百度大脑”与人工智能的关系。
    “大数据引擎对于数据的搜索分析与预测是通过机器来完成的。这个‘大脑’用计算机模拟人脑神经网络,包括模拟人脑学习分析的能力,从而通过多层的学习模型和海量的训练数据进行数据智能分析,然后做出预测。 ”
    “百度大脑”的产生由多种因素促成。
    “首先是服务器的能力和云计算的能力有了很大突破,数万台服务器能够集合起来像一台服务器一样工作。其次是大数据的积累达到了相当大的规模。 ”王劲分析。2013年全球每天产生的数据,相当于1500个国家图书馆信息量总和。互联网技术的突飞猛进及数据库的积累为人工智能提供了突破的环境与机遇。
    “最重要的推动是深度学习的不断演进迭代。 ”人工智能的核心是机器学习技术,即通过算法使机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测。从上世纪80年代末以来,机器学习的发展大致经历了两次浪潮:浅层学习和深度学习。
    深度学习更接近于人类的学习方式,它通过模仿人类大脑行为的神经网络,利用更多层次的网络模型结构来收集事物的外形、声音等信息,进行感知理解并产生相应行为。比如,要让机器“认识”物体,就需要若干层网络,首先要建立最基本的一层人工神经元,用来探知物体的边缘形状等基本信息,第二层神经元需要将第一层感知到的物体边缘形状拼凑起来,认知物体形状。然后第三层进一步拼凑信息从而得出物体整体的形态。 “这些过程都是机器自主完成的,并不需要工程师在任何环节输入信息。”王劲强调。
    目前,通过“百度大脑”的思考,语音识别的相对错误率降低了20%至30%,扫描文本图像生成汉字文本的相对错误率降低了30%,相似图像搜索效果显著超过同类产品,通过大数据显著提升广告点击率,提升网页搜索排序质量等。

“深度学习”正改变当下生活

    “百度大脑”进行深度学习,可不仅仅是实验室里进行,它正实实在在地改变着当下生活——
    “百度已经被与公安局合作,用图像识别技术帮助公安局寻找嫌疑犯。公安局在全国布置了很多监控摄像头,如果通过人工对人脸图片进行比对,准确率不高,也费时;但通过百度图像识别技术,以图识图,用嫌疑犯的照片来进行匹配就容易多了。 ”
    “还可以把海量的婴儿声纹,上传到大数据中心提取特征,年轻父母录下婴儿哭声上网比对,就知道孩子因为什么哭,是饿了,还是想撒撒娇,让没有带孩子经验的父母得到帮助。 ”
    “这其实是将‘百度大脑’中每一部分都分开应用到现实中。就像机器人有眼睛与耳朵,语音和图像识别的技术就是这眼睛与耳朵。”王劲解释。
    “百度大脑”也能通过推理决策为大数据的应用助力。
    “本届世界杯参赛队夺冠几率:巴西,30.2%;德国,17.7%;阿根廷,11.2%;荷兰,8.9%;法国8.3%;等等。 ”
    充当这个“预言帝”的可不是章鱼保罗,而是“百度大脑”。百度的大数据汇集了2010年至2013年全世界范围内所有国家队及俱乐部的赛事数据,构建了赛事预测模型。世界杯进入淘汰赛阶段以来,百度预测的准确率为100%。
    除了预测世界杯外,“百度大脑”还能预测高考择校、城市旅游热度、景点旅游舒适度、疾病等,这就更加有价值了。
    比如,“用‘百度大脑”,我们能够预测到城市旅游热度,游客会从哪一个城市过来,如果更细一点,在城市景点,能预测两天拥挤程度,玉渊潭和陶然亭哪个公园拥挤。 ”“通过‘疾病预测’可以知道所处城市是否处于流感高发期,大家都去哪个医院看病,从而了解当前流行病态势及未来7天的变化趋势。 ”
    王劲透露,“百度大脑”是百度所有技术中变现率最高的技术,而且下半年还会有很多令人惊喜的应用出现。
    在“百度大脑”的背后,大数据起到关键性作用。还拿医疗举例,每天网民在百度搜索大量流行病相关信息,汇聚起来就有了统计规律,经过一段时间的积累,可以形成一个个预测模型,预测未来疾病的活跃指数。
    王劲说,目前有关大数据时代的认识,要么停留于想象世界,要么停留于上线和数据收集阶段,真正的大数据时代包括三部分:每个人都能以最自然的方式提出需求,并满足需求;每家企业都能以最低的成本得到每时每刻对于它而言最理想的用户,并采取最优化的流程满足其需求;中间的部分则是如何将用户的需求与企业的需要进行最佳匹配。也就是说,未来的社会将是用户需求和企业能力双重驱动的,二者相互促进。
    “百度有一个 10年计划,是2009年提出来的。未来我们从大数据上面获得的收入比今天所有的收入要高,比所有现有的产品线要高。 ”

未来的竞争是人才与技术

    “百度大脑”是聪明的大脑,但开发出它的研发者更加聪明。很长一段时间,百度都低调地在世界各地寻觅与招募这些 “更聪明的大脑”。
    早在2013年初,百度就成立了深度学习研究院 (简称IDL),李彦宏亲自挂帅担任院长。如今百度在此基础上成立百度研究院,下设硅谷人工智能实验室、北京深度学习实验室、北京大数据实验室等三大前沿实验室,其中包括语音识别与图像识别两大重要部门。此外,上海研发中心、深圳研发中心与北京研发中心主要负责一些基础性研发工作。
    “筑巢”的目的是为了 “引凤”。 “世界顶级公司对人才竞争是非常激烈的,一些顶级科学家都有很多公司在长年追踪。”王劲代表百度频繁地接触一些人才,说起来颇有感触。“未来的互联网竞争必将来自人才与技术。我们与国际竞争对手目前对人才的竞争是站在同一起跑线上的。 ”
    国家 “千人计划”特聘专家余凯,Facebook前资深科学家徐伟,AMD异构系统前首席软件架构师吴韧等一批全球顶级专家,纷纷加盟百度。2014年初,百度推出“少帅计划”,面向全球招揽30岁以下人工智能人才。今年5月,“谷歌大脑”之父、全球三大人工智能顶级科学家之一的吴恩达加盟百度。
    这样的海内外实验室布局与专家队伍的全明星阵容的背后,透露出只有一个——百度对人工智能志在必得。
    也正是因为这样的谋划,百度对国内互联网市场的纷争表现得很“淡定”。 “对百度来说,你有你的打法,我有我的打法。百度的长项就是技术,所以我们会更专注于打造百度在技术方面的积累,让其成为真正的核心力。而这一核心力的实现,就是得到人才。百度也相信,未来的商业竞争会是由今天的人才竞争决定。 ”王劲说。
    纵观全球顶级互联网公司,每年的研发投入占公司营收的平均值是7%,百度的研发投入远远高于这个比例。 “前几年是11%,未来几年预算会在12%上下。百度的营收在持续增长,所以这个金额也每年在增长。 ”
    据了解,百度在校园招聘市场是给出薪酬最高的互联网公司之一。不过,百度的人才并非全都依靠高薪吸引而来。王劲说,吴恩达这种级别的人才,薪酬已经不是他们加盟一家企业所考虑的最主要因素,他们更关注这家企业能不能让其研究的技术改变世界。所以,去年有三巨头竞标GeoffreyHinton的公司,谷歌不是出价最高的,但竞标到一半,GeoffreyHinton就决定加盟谷歌。同样的,百度给吴恩达出价也不是最高的。事实上,王劲、余凯乃至李彦宏,百度高层一直跟顶尖人才保持着联系,逮机会就游说他们。Yann LeCun是百度的一名技术顾问,每年都会来百度开会,可惜去年被Facebook抢去了。幸运的是百度得到了三位顶尖科学家之一,王劲透露,宣布吴恩达加盟的当天,就有6个在人工智能领域很强的研究学者、技术人员来申请百度的职位。这几位早就在王劲的跟踪挖角名单上,但之前对加入百度的邀请,他们一直在“考虑”。
    人才的竞争,现在三大公司(谷歌、百度、Facebook)在同一个起跑线上。有着谷歌工作经历的吴恩达,对百度的执行力印象非常深刻,他相信百度会跑得更快。
    “人工智能有很多研究方向,我们的国际竞争对手正在人工智能的多个方向上出击。相比它们,百度的实力与精力有限,所以只会坚定地沿着我们看好的方向发力。我们会比竞争对手更加专注、更加执着地做一些事情。 ”王劲说。