“小扎那个图片识别的雏形软件做出来之后,我看过内测报告,想要在一张照片上识别出人脸来,只有不到1o%的成功率。.⒉3TT.要是想进一步识别这张脸是谁,就更可怜了,准确率1%都不到——而且是在内测时被识别样本只有1oooo人的基础上。要是选项更多一些,误读率就更高了。这份测试报告,你应该在小扎的邮件里见过吧。”
李莹轻柔地跟着顾诚的节奏,渐渐有点儿弗拉明戈的意思了。嘴里说着的,却是严肃得不能再严肃的生意话题。
因为是在舞池里,双方都怕说话声音太响泄密,只能贴着耳朵说,这场景实在是很诡异。
顾诚也附耳说道:“看过,这方面我可是专业的,我估计他这套软件,至少还要半年的时间,才能把‘识别照片上某个区域是不是一张人脸’这个判断的正确率提高到3o%,至于认出这张脸是谁,没两年时间想都别想。”
人脸识别技术是用机器学习解决模糊算法问题的典范,历史上FaceBook对该项技术最早的应用场景,就是让用户在分享照片之后,一旦点击照片上的人头位置,软件就可以自动识别出这个位置是一个人头,然后形成一个方框,让用户可以往里面填写名字。
如此一来,一张有好多人合照的照片,就可以被一个个标注上合影人的名字了。
这项技术再往下展,某些人被标注得多了,数年后就可以形成“鼠标点到照片上的某个头像上,自动跳出这个人是谁”的功能。
再往后,则是人们常见的“智能手机拍照时自动识别哪里有人脸、以便自动对焦”乃至支付宝的“刷脸识别”。
那都是第二代、第三代人脸识别技术了,比如deepId,起码再有七八年的技术积累才可能实现。
初代的人脸识别技术,在平行时空的华夏sns社区领域也有过应用——人人网的个人空间里,照片也都是可以对着人脸写名字的。
但那个时空的人人网技术不太扎实,在网站衰落之前也没做到“机器看多了某张脸之后,下次另一张照片上再标注这个人时就举一反三自动标示”这种程度(FaceBook做到了)。
顾诚知道这些历史轨迹的大概脉络,所以并没有期待扎克伯格能更逆天。
然而现在,没有被任何存量束缚形成路径依赖的李莹,却告诉他:她对这项技术的早期应用另有妙招。
“我就是这么给小扎泼冷水的,希望他能认清自己目前做出来的这个东西根本不值钱,别为这点小成就沾沾自喜——”李莹说到这儿,顿了一顿拖了个长音,似乎在观察顾诚的反应,“但是,背地里我却想到了另外一条路子,一个让‘还处在残次品阶段的人脸识别算法也能得到商业化应用’的场景。”
顾诚终于觉得自己提起了点兴趣:“干脆点儿,说。”
李莹的眼神闪过一丝埋怨,似乎在怪顾诚都不赏赐她,但还是很利落地说:“我觉得,yy网目前之所以用不到这项技术,是因为在米国不存在娱乐圈选秀活动。大家在朋友圈里人脸识别,就是图一个认得准,不准就没有意义。但是在华夏,我听说你搞了一个娱乐圈的选秀活动,将来还会有更大规模的让普通粉丝投票支持之类的举动——我觉得,照片的人脸识别技术,和这个活动结合起来,就有很大的操作空间。”
顾诚的表情渐渐认真起来。场内的弗拉明戈舞曲已经结束,他也不顾李莹是否反对,拉着她就回到包厢,关起门来密谈:“说说看具体怎么做。”
李莹端起酒杯,又给自己倒了一杯喝下,把剩下的想法和盘托出:“很简单,我觉得你可以推出一个‘人人热度指数’。比如百度提供的是搜索引擎服务,就有相应的百度指数,可以看哪个关键词目前最热、每个关键词搜索后有多少条搜索结果。
‘人人热度指数’,可以在人人网和那些选秀节目结合起来之后,总结出每个候选艺人目前在人人网上的被关注热度、被搜索图片的数量、频次。乃至最关键的——被人在照片头像上标注名字的次数、以及其头像当前被识别的估算准确率。
我们可以开诚布公地坦言:到时候人人网的‘人脸识别算法’依然是不完善的,识别率很低。但是我们也明说这是一个会‘自我学习、自我进化’的软件,在网上被爆照爆得张数越多、各种角度脸型数据越充分、被网民标示识别频次越高的人,就越容易被识别对。
如此一来,人脸识别算法哪怕认错人,用户也不会怪我们公司,而是会认为因为自己爆照不够多、被网民标示频次不够高,所以才认不准。她们只会更努力地爆照、更努力的吸粉,更努力地拉人标注,并且以‘我在人人网上被机器认对的概率比其他网红女更高’为荣。”
顾诚眼前一亮。
妙啊!
人脸识别技术,本该以求准为奋斗目标,不准就会被用户鄙夷。
但李莹这么一来,一项原本“对了是本分,不对是失职”的技术,就变成了“对了说明你名气大、牛逼;不对也是本分,说