谷歌重返中国组建团队? AI项目在中国开启招聘

9月4日消息,搬到新址一年后,谷歌打算从0开始在北京组建一个人工智能研发团队,目前已经开启招聘。招聘岗位集中在机器学习领域,包括机器学习研究员、机器学习技术主管、云端机器学习产品经理等。据人工智能行业新媒体“量子位”报道的消息,这不仅是一个工程团队,还兼具技术研发的任务。 继续阅读谷歌重返中国组建团队? AI项目在中国开启招聘

王小川:我从来没说过搜狗不上市我不谈恋爱

3月27日消息,搜狗CEO王小川今日在在洪泰基金CEO春分大会上做了关于人工智能技术思考的分享。在开场,王小川首先调侃着澄清近日因搜狗即将上市而流出的关于自己恋爱时间的传闻,“我从来没说过搜狗不上市我不谈恋爱这种话”。

关于人工智能,他认为在往三个阶段走:1,将传统规则教给机器;2,将答案教给机器记忆学习;3,将目标给机器自我学习。而目前正处于第二阶段的高级阶段。同时,他也认为今年的人工智能还是有很多的局限性。比较难点的是在自然语言的处理,在翻译系统现在有大的发展,机器做翻译能把中文翻译成英文,英文翻译成中文,这个能翻译的很流畅,因为现在的机器人的学习,不是基于理论方法。(锡安)

以下内容根据王小川在现场分享整理:

简单讲,我们讲人工智能是往三个阶段走,我们还处在第二阶段的高级阶段,人工智能这个话题不是新课题,在上个世纪60年代、80年代就在做人工智能,那时候做人工智能的教授其实很不幸,那时候人工智能的水平是远远不够的,当时人们把对自己世界的认知变成了规则,转成了机器人,就是把这个规则告诉机器,这是那个时代的工作,那是60年代到80年代,人们对规则的表达是偏离这个目标的,就是做不好。

80年代基于统计方法来做的人工智能,不要尝试把人对于世界的认知告诉机器,就是让机器学,让你看答案是什么。一方面是把原始的问题,看到问题之后把答案给他,这是走上了让机器人学习的道路,这搞了几年。这个答案很清楚,很多经典案例的是人脸识别,怎么描述呢?胖一点的、瘦一点的等等,我知道这个人是谁,但是没有办法描述。到2000年之后的突破点,我们发现用更粗暴的方法,我们不要尝试在这个问题上找特征,把特征告诉机器,把原始的问题原始的数据交给机器,我给他更多的机器,我给他两千多张照片,让他自己去找特征,最后得出答案。2000年之后的爆发是跟这个相关的,阿尔法狗就是这么出来的,他不是靠原来的方法做的。

今天局部开始走到第三个阶段了,阿尔法狗属于是第二阶段加上一点点第三阶段,给它一些答案,给它每一个局面下人是怎么走的,让机器学,这样可以发现机器很难追上顶尖的人。到最后我告诉机器说,你走对,你赢了,或者是输了,这个也可以做了根据我看到的媒体报道。

在工业里面我们在第二个阶段,一定要用大数据。好处是我们不需要工程师对原有的行业有特别深度的理解,我举个例子,医生他是懂得怎么看心脏病的心电图,但是他很难把这个规则明晰的描述给工程师,从去年开始工程师得到很重要的体验,我不需要医生去学习他细节的技术经验,只要医生告诉我这个代表什么,工程师数据量大,就可以建立这样的模型,这跟选择人工智能的行业之间有天然的沟通鸿沟就消失掉了,这个很快就可以在人工智能里面得到突破的应用。未来的两三年里已经有成功工作经验得到了巨大的升级,今年在智能领域里面有一个很大的发现。

我今天就不讲了这个深度学习的意义和突破了,今年的人工智能还是有很多的局限性。核心问题是有一个前提的条件,要很安静的环境里,如果这个环境里还有背景音乐,同时两三个人一块说话,人是很清楚能分辨出来的,但是机器做不到,这个对机器而言,如果是声音里混了声音,人工智能是对见过声音的处理,如果两个人一起说话就不行了。一种做法是我们用麦克风做,我们在汽车里面,汽车里有胎噪和风噪,把这个录下来,然后在混到这个训练里面去,不是在识别里面做,而是他见过这样的声音。还有就是去噪音。

比较难点的是在自然语言的处理,在翻译系统现在有大的发展,机器做翻译能把中文翻译成英文,英文翻译成中文,这个能翻译的很流畅,因为现在的机器人的学习,不是基于理论方法。人如果流畅,机器也就可以流畅。

我去年6月份去了一个剑桥顶尖语言的实验室,他们在演示一个人机对话的系统,演示的非常清楚,我想吃辣的,我想吃什么样的,机器就帮你找。当我找到餐馆的时候机器问我问题,你需要停车位吗?我说我没有车,它就没有说的了,因为它不知道车和停车位是什么关系。语音图像里有大的发展,语言上现在是非常的不够。

另外一个很好的视角,跟投资相关的地方,我想看到人工智能的分类,像理解讲了一大堆的理论,但如果从产品上分类从功能上分类,我把人工智能分成这么三类。叫级别、判断和创造,创造叫生成。相信大家会看到一个语音能转化过来,或者是图像里面可以看到大象在做一个什么事情。今天做的第一个事情就是把物理世界的东西建模,语音识别、图象识别这都叫识别,像人脸识别,这是一类。还有是创造生成,语音的合成和图象合成是在这一类,所以一和三能干什么事呢?我们可以提升人机交互,就是在机器里可以看到这么一个东西,能把他合成出来做交互,相对而言就是在安防领域里面做人脸识别,在我心中这个东西有用,但是商业的价值不大。

现在有一个个人的观点,就是让机器做判断和决策,这个是里面唯一有巨大商业价值的东西,把人的劳动取代,让机器产生更高的工作,比如像金融里面是这个例子,阿尔法狗也是,它是在做判断和决策,一旦让机器有这样功能了,他就有很高的效率。我也看一个指数,1和3是在交互,不能构成一个商业品牌的核心成本,但是做判断,或者做决策,这是商业判断的核心部分。

前面讲了一个人工智能的判断,我给大家分享一点搜狗在这个里面的思考,大家开始思考人工智能了,这就是一个错误,人工智能现在的基本做法是要学习,其实对于搜索引擎公司,不管是百度还是搜狗大部分还是在学习。现在有了深度学习以后我们可以想像的更多,比如在网页搜索里面,以前靠我们的工程师怎么是高品质的,让这个机器去学,或者是图象识别这个里面如何更好的发现人脸,发现这个特征。深度学习之后需要更大的数据量才能做提升。

第二个是对于2C很重要的是图像和语音,应该叫做深度学习让我们有了很大的进步,我想表达的是,搜狗从2011年开始做,80%有语音的收入,就是一下子会使得一天产生了两亿次的,每天20万的语音数据我们对了一下,比其他家做的语音识别的识别价值还要大,这个有清晰的应用场景。TO B和TO C的公司是有区别,这个要有数据、场景。因为自己不能成为一个闭环,没有场景,就要依靠别人,其他的公司也数据和场景,这是一种合作的方式,这不是我们的基因所在。我们是用这样的技术首先为自己服务,因为我们有足够大的数据场景做支撑。

还有一个深度的思考,我看到这个是微软的医院,语音识别是不是人工智能的核心,或者是人工智能未来很重要的一个部分,我跟他们的观点是一样的,我说不。语音识别之后机器不知道你在说什么,未来的搜索是不是叫语音搜索,这个东西是一个毛皮,因为当我们提到说,王老师这三个字用文字去搜索,本质上具有不大。只是把我的新闻、百度、微博推给你,比如你这句话,王小川是不是说过不上市就不结婚,这个是语音的理解,在人工智能的应用里面,在金融、医院里面的应用都会很有用。语音在里面今天是没有功课的事情,语言跟这个都有关系,因为你用语音做识别的时候就把他变成语音,语言变语音我们也在做,但是我们考虑的是以个为核心做周边的发展。包括两个语音的转化是翻译,最后是语音的理解,这是我们to C公司里面思考的,叫自然交互和知识计算,自然交互是以语音为中心,还有是怎么建立对语音的分析和理解,这是我们的一个图。

行业中会有共识,未来很重要的事情,语音在于是对话、翻译、问答,这几个都是最前沿的工作。我们为什么考虑呢?今天是词的搜索,未来是给机器提问题,让他有一个精准的答案,我们在这个工作里面也做了很多的积累,我们认为在1年以内会有突破,不代表是机器理解了,而是在很多问题里面可以直接的回答。以前是靠拼音,敲汉字进去,未来我们是希望别人问,今天我们的上午什么时候举行,他不用拼拼音了,他就可以直接表现出来。

翻译是在去年开始的,是一个有大突破的事情,翻译的解决会使世界格局带来变得变化,我对他有这样的期待,不光我们在做,这是全人类的事情。如果人类做好了,这个是非常有意义的事情。因此不同的人说不同的语音,这是中间的过程。

吴恩达离开百度,再次证明了百度不是“中国的Google”

你一定已经知道了吴恩达从百度离职的消息。关于他为什么要离职、他离职之后的去向,人们也有很多猜测。

我不知道他会去哪里。但他离职的原因,在我看来,其实凸显了百度的一个困境:一方面它在中国显露出落后于腾讯和阿里巴巴的迹象,急需提振现有业务,避免在短期内掉队;另一方面,它也需要对未来有长期规划,避免因为储备不足而被颠覆。

吴恩达的离开,说明百度在面临以上困境时,天平倒向了前者,即提振现有业务。

回顾2014年吴恩达加入百度时的状况。那时BAT还是完全齐名的三家公司,从赚钱的能力、市值(当时阿里尚未在美国上市)、影响力和口碑上来说,并没有太大的差别。百度并不用为“当下”感到着急,可以比较从容的对未来进行布局。

未来是什么?百度认为最重要的是人工智能。所以百度找来了吴恩达。吴恩达在人工智能领域有足够的号召力。无论是他在斯坦福大学还是在Google 的经历,都让他获得了大批的拥趸。他还有一段履历是创建在线教育平台Coursera —— 但吴恩达仍然更像是个学者、研究员,而非企业家。陆奇不一样。

陆奇在人工智能上绝对也非常厉害,但他在微软是实际意义上重要部门的掌权者。严格意义上他是职业经理人。从企业家角度,他比吴恩达做的更好。陆奇在百度的职位是集团总裁和首席运营官,而吴恩达是首席科学家。

吴恩达加入百度之后,做的事也并非企业家所擅长的,仍然是偏前沿的研究。3年时间里,几乎没有一款产品可以归到吴恩达的名下。所以在很多人看来,他并没有为百度做出什么贡献。但你不能用产品经理的标准来衡量一位学者或者科学家。

吴恩达对百度做出最大的贡献是建立了百度硅谷实验室,以及1300人规模的人工智能团队,其中包括300名百度研究院成员。这些人里,必定有很多是因为吴恩达才加入的百度。如果没有吴恩达,百度可能搭不起这样的团队,或者团队整体质量要差很多。

但这1300人,尤其是300名百度研究院成员,也是吴恩达所要承担的巨大压力。这些研究员整天忙的东西,很多都无法投入到实际应用中,对百度现有业务的帮助也不明显。但是养这些研究员,要花很多钱;为他们创造好的环境和条件,要消耗很多资源。

当百度现有业务顺风顺水的时候,腾出大笔资金和大量精力做一些对未来的研究,没有任何问题。可是一旦现有业务开始疲软,百度就保守了。

李彦宏说自己对人工智能的理解只有陆奇的十分之一,但人工智能并不是陆奇在百度要做的全部。他更大的责任是运营好百度这家公司,当务之急是要加快现有业务的发展。李彦宏和陆奇都不会减少对人工智能的研究和投入,但研究的方向会更偏向实际应用,用个贬义词来说就是更“急功近利”(但我并没有批评的意思)。这和吴恩达追求的不一样。

于是,吴恩达选择离开。我不认为他的离开是政治斗争的结果,只是他所擅长的事情和公司的发展重心出现了偏差。他在公开信里对李彦宏和陆奇的夸赞,应该也是真心的。

终于要说到重点了,百度vs Google。

Google 历史上也不是没有过危机,它曾被质疑收入构成太单一,做不成社交,搜索也受到移动互联网的冲击。这和百度现在面临的危机比较接近。

那时,Google 联合创始人拉里·佩奇取代当了10年CEO的埃里克·施密特重新掌舵,迅速帮助Google 把握住了移动互联网的机会,并且加大了突破性项目的研究,比如人工智能、自动驾驶汽车。还有很多项目简直异想天开,更核心业务并没有直接的联系,比如医药科技公司Calico、机器人项目Boston Dynamics 等等。

在危机面前Google 的做法是全面出击,而百度,看起来是收缩和聚焦。

Google 的突破性项目同样非常烧钱,会影响它的利润和股价,也被投资人质疑。后来,Google 成立了一家叫Alphabet 的公司,把核心业务装了进去叫Google —— 让一个印度人桑德尔·皮蔡来负责;也把其他业务装了进去,和Google 并列。这是2015年8月的事。Alphabet 的股价在这一年半多的时间里上涨了30%。

2017年1月,在百度最困难的时候,陆奇加入。3月,在百度未来还不明朗的时候,吴恩达离开。

陆奇不是百度的皮蔡,百度也成不了“中国的Google”。

两会观察:人工智能首次进入政府工作报告

3月5日,十二届全国人大五次会议在京开幕,国务院总理李克强在作政府工作报告时表示,要“全面实施战略性新兴产业发展规划,加快新材料、人工智能、集成电路、生物制药、第五代移动通信等技术研发和转化”,这也是“人工智能”这一表述首次出现在政府工作报告中。

在持续一年的时间中,“人工智能”的概念在整个政策中的份量正在逐步的增加。2016年7月,在国务院印发的《“十三五”国家科技创新规划》中,人工智能尚未进入规划中公布的15项“科技创新2030-重大项目”。但在2017年年初召开的全国科技工作会议中,科技部部长万钢却透露目前正在编制人工智能的专项规划,同时还在研究论证人工智能重大项目的立项工作。按照此前相关政策的表述,进入重大立项的项目体现了“国家战略意图”。

清华大学计算机系教授邓志东曾对经济观察网表示,目前人工智能的高涨主要得益于自2012年以来全球产业界对于人工智能的高强度持续投入,这些投入在2016年产生了一大批人工智能标志性成果,如谷歌的AlphaGo和Master,从而吸引到了政策方的关注。

在2016年十二届全国人大四次会议中,科技部部长万钢也曾经公开表示了对于谷歌的AlphaGo与韩国围棋棋手李世乭“人机大战”的看法,在他看来,人工智能的发展能够使人类劳动往更高级的状态发展。