“我也不怕告诉你们,我搞了15个月的deep-id人脸识别技术,只是我在深度学习型人工智能方面的试水作品,主要是为了培养团队。从明年,也就是06年开始,我会把人工智能的主要努力方向,放到用户行为分析、偏好分析上面。
最终实现‘用人工智能揣摩用户喜欢什么,从而把他喜欢的内容产品推送给对方’这种商业模式。我相信,这一天实现的时候,不管是叮铛网还是某点网,或者niconico,正版付费用户的规模都会产生一个数倍乃至数十倍规模的爆炸。
到时候,内容产业会迎来一个‘盗版的垃圾资源容易找,但是盗版的、知道你品味的好书好歌好游戏难找,用户或许不会为纯粹的内容付费,但是他们不得不为‘内容+知道他喜欢什么内容’的人工智能组合套餐付费。”
顾诚用一句轻松的展望,把马风和丁三石都拉到了一个悠然神往的世界里。
丁三石是做内容产业的,从游戏到音乐,他深知国内的盗版问题有多严重。而如果可以解决盗版问题,足以养活多几十倍乃至百倍的内容产业者,并且把细分需求的长尾效应发挥到何等极致的程度。
“你……你在《长尾理论》这本书里写的未来远景,原来在多年之前你就已经知道要怎么去实现了?这……这也太夸张了吧,你写《长尾理论》的时候,你连杰夫辛顿教授的名字都没听说过,也不认识吧?那个世界上都还没有‘深度学习型人工智能’这个概念,你是怎么预言未来会有这么一种技术来实现你的布局的?”
丁三石觉得自己的大脑已经不够用了。他这辈子没服过几个人,虽然他很服顾诚,但直到今天,他才发现跟顾诚一比,他自己完全就是井底之蛙啊。
除非顾诚是先知或者穿越者,否则怎么可能在两三年之前就预料到今天才略微看得到一点萌芽的未来传媒分发形态?
“你猜对了,我在写《长尾理论》之前,就已经看到今天,甚至看到三年五年之后了。”顾诚毫不谦虚地承认了。他需要这种铁口直断的威望,来让丁三石和马风对自己深信不疑。
“那你今天把这些都告诉我们,你就不怕我们也开始布局,跟马腾那样抄袭你的套路么?”马风对人性的认识更加深刻,第一时间觉得顾诚似乎有什么有恃无恐的阴谋。
顾诚没心没肺地笑了,笑得非常君子坦荡荡:“抄?怎么抄?大数据在我手上,你们有么?人工智能的算法在我手上,你们有么?这些都没有,就算知道我的思路,你们拿什么抄?”
马风一愣,心说确实是这个道理。
难怪顾诚有恃无恐了。
马风暗忖顾诚这人如果不是抱有什么目的,很少跟同行吐露这么多干货的。今天突然说这些,莫非是另有所图?于是他自然而然地问道:
“那你今天和我们说这么多,究竟有何图谋?总不会是突然给我们扫盲开眼的吧?”
顾诚见被戳穿了,也就不再掩饰:“马哥就是贼啊,一下就看出来了。行,那我也不瞒着你们,实话说了吧。未来的深度学习型人工智能,要想运作得好,需要的配套条件千头万绪,我也不可能一个人包打天下,从头做到脚。所以有些配套,我觉得未来会有一定前途,但是还不配我亲自出手的,你们今天要是有意向,就可以自己找资源准备起来了。”
马风和丁三石的耳朵一下子就竖起来了。
顾诚这家伙创造的奇迹太多了,哪怕是他拔根毛下来,一点微末的看不上的小生意,那背后都是无限商机。
当然了,顾诚看不上的生意,一般做起来肯定比较辛苦,或者低俗,要不无法形成垄断不能常年暴利,只能赚个几年快钱,然后就要陷入低门槛的激烈竞争。
但即便如此,那也肯定是一门普通人求都求不来的商机。
见哥们儿都听得很认真,顾诚也不藏着掖着,干脆地伸出三根指头,比划着说:
“未来要做好深度学习型人工智能,关键有三方面的条件。
第一是要有好的算法,这个是核心,就像是软件。
第二是要有充分的大数据,这个就相当于是软件里的输入素材。而且深度学习型软件是可以自我优化自我进化的,输入素材越多、数据标示越好最终的效果就越好越精准。一旦某一方面的大数据有优势,未来的巨头可以很快形成滚雪球效应,跟后来者拉开差距。
第三,就是要有处理这些天量数据的硬件处理速度——以目前的人工智能运算量来看,哪怕是解决最简单的图片识别,或者语音智能识别,甚至只是输入法频次统计反馈,都不是任何一个单独的服务器可以承载的。或许每一个需求,都要用一个数据中心的处理能力去处理。
但是同时,每个数据中心处理的多个问题又可能有很高的重复率,数据处理过程量的复用率会很高。所以拥有越多处理需求、越多处理硬件资源的企业,在处理效率上就会有明显的优势。这时候,我们就会发现,依靠传统的‘为每一个新的业务需求购置一批服务器、搞一个专