在互联网世界,近年来弥漫着一股“算法迷信”的风气,并且有愈演愈烈之势。
以字节跳动的快速崛起为起点,尤其是大家提到抖音时,会理所当然地认为他们的秘密武器是存储在服务器里那一行行神秘的代码。
这种迷信在去年TikTok的强制卖身风波中体现得淋漓尽致。当谈判陷入僵局,有相当一部分竞购方认为如果出售业务不带有算法,那么毫无意义。
《华尔街日报》援引自消息人员的说法是,没有算法的TikTok就如同用着廉价引擎的豪车。
但事实上,字节内部关于机器学习推荐算法并未取得多少外界未知的突破性进展。
虽然抖音并未在国内公布他们的算法是如何工作的,但为了自证清白,TikTok不仅向当地的监管机构和外部隐私专家开放了查看代码的权利,还在洛杉矶建立了一个存放着所有数据流和代码的透明度及问责中心。
可我们至今都没有找到任何关于个性化推荐算法函数本身的颠覆性创意,美国市场上也没有出现新的相关产品。那么,APP工厂的真正优势,到底在哪里?
一、字节系爆款真正的闪光点,在算法友好型的UI设计上
过去二十年,科技产品的UI设计始终围绕着如何消除用户与他们的需求之间的摩擦。
在这个网络效应爆发式增长的时代,谁能设计出比竞争对手更好地满足用户需求的产品和服务,谁就能成为利用聚合理论获得大量用户群的科技巨头。
这是一种写在字里行间的以用户为中心。
拔地而起的科技公司,迅速过载的膨胀信息,让我们为用户提供最好服务的关键,从洞察人们某种未被发掘的需求变成了利用机器学习算法实现对海量数据的筛选与过滤。
首先明确一个前提:ML算法的训练需要大量的数据集,任何一个Google或Facebook的算法专家都没办法独自训练出一个高质量的推荐算法。
这是否意味着所有全新垂类的APP都会被打上大厂的标签?
大概率是这样,但不全是。
自1998年亚马逊推出基于项目的协同过滤算法以来,它被改编和应用到了大部分网页上,比如向人们推荐视频或新闻的算法,以及各式各样的互联网广告。
但作为个性化推荐的商业鼻祖,亚马逊只有30%的网页浏览量来自推荐系统,搜索结果页面目前仍是用户下单的最主要路径。
在这个推荐引擎中,系统正常运转的前提是用户过往的购买记录、在商店浏览过的商品、已经添加到购物车里的商品,以及一些以后可能会订购的商品。
所有的一切都是基于用户的搜索行为。所以时至今日,我们依然会面临在淘宝上搜索一次“花架”就一直被推荐花架的囚徒困境,而不是转而询问你需不需要一盆花。
可以明显地感觉到,这类算法永远都处于“猜你喜欢”的状态。因为当屏幕上同时展示多个项目时,它无法分辨出你的眼睛所注视的到底是哪个区域。就算能看到,因为没有upvote/downvote的反馈设置,它也不可能知道这种关注是正面的还是负面的。
一言以蔽之,算法对用户情绪的判断并不清晰。
然后我们再来看抖音的界面。
从视频开始播放的那一刻起,APP的UI设计会促使用户立即开始思考一个问题:你怎么看待眼前的这个视频?
- 你会在视频还没播放完的时候就下滑进入下一个视频吗?是的话就隐含表示你对它不感兴趣。
- 你看完了它,还给视频漫不经心地点了个赞?
- 你在这个视频中停留了一阵子,甚至让它循环播放了好几次?
- 你通过内置的分享面板把这段视频分享给别人了吗?
- 你是否点击了右下角旋转的LP图标,看了更多使用同款背景音乐的视频?
- 你打开视频制作者的个人界面页面了吗? 是否观看了他其他的视频?之后你关注这个人了吗? 是的话,说明你除了喜欢这个视频之外,也许还特别喜欢这类人。
但这些都不属于硬核的技术突破,而是来自UI方面的巧妙构思。
这种设计最大的特点,就是帮助用户像算法一样看东西。
所以抖音的算法比其他短视频APP学得更快。这一点非常重要,要知道,即使算法本身同几年前并没有有太大差别,仅仅是在更大的数据集上进行训练,就足以让OpenAI开发出GPT-3这样的模型。
在抖音之前,绝大部分短视频App都采用了微博式的界面,照搬图文信息流的展示方式,以缩略图的形式显示视频,再加上几个关键词标签或一段描述。
这种信息展示的方式历史悠久,适用面很广,但是对算法来说并不友好。
至于抖音设计巧思的来源,如果你恰巧使用过他们早期的版本,就会发现其界面、内容、调性与Musical.ly如出一辙。
据说张一鸣很早就洽谈过收购musical.ly,后来未果才回国做了抖音。完成反向收购之后,字节的后端算法插入Musical.ly(现在的TikTok)的效果是显著的,用户时长很快就增长了一倍以上。
二、算法推荐是重要的,但它并非全部
信息展现方式一直是互联网产品里最基础的部分,也是争议最大的部分。
只是在技术至上的论调下被忽略了。
最常见的信息展现方式有瀑布流,以及全屏。它们之间的区别在于一屏里放多少内容合适。
按照张小龙在微信公开课上的说法,一屏里的内容条数,跟命中率成反比。所以视频号上线后的前半年,采用半屏式的信息流展现方式。后来在灰度半屏和全屏的用户时,关注tab的用户因为内容命中率不够高,全屏后反而带来了后台清晰可见的选择困难。
这是内容池深度的问题,与推荐算法的调教无关。
这里普及一个技术方面的常识:当底层召回内容数据不足时,算法会从候选队列中进行降级召回。
即本来算法觉得用户可能会喜欢内容A,但整个内容候选集中都没有A的存在,只能递补与A相近的B。
如果连B都没有时,算法会进一步做降级召回处理,或是直接按照热度排序补充全局热门的内容给用户。
从而带来持续的恶性循环——被污染了的算法模型,会始终局限在某个范围内寻求帕累托次优解。
出于这样的理由,我更愿意相信视频号的全屏是出于内容积累到达某个临界点后开始进入调教算法的阶段,而非所谓的对抖音的妥协。包括快手的精选tab,也是同样的道理。
人们永远可以争论社交网络是由什么组成的,但需要明确的一个前提是,大多数社交网络都采用一种渐进的方式来扩大规模。
鼓励用户与其他人互关,一次建立一个联系。为工具而来,为关系而留,这样做唯一的问题就是速度太慢,而互联网恰好是一个崇拜速度的地方。
只需要搜几个关键词,无需关注或与任何人成为好友,抖音就可以快速了解一个人的喜好。
我们姑且把它命名为一个围绕兴趣建立的娱乐网络。现阶段,它是一个快速、高效的传播媒介,因为这个网络不由关系连接,所以抖音博主的流量永远不可能属于个体。
很多人认为抖音商业化走在前面是因为广告算法好,但实际上抖音对游戏广告主的包容程度才是隐藏不言的奥秘,他们允许以单个付费用户为单位结算,甚至可以约定“若用户流失则退款”。
然而想靠这个设计留住用户和增长并不现实(字节国内的广告收入趋于停滞已经证明了这件事)。中文互联网的残酷之处在于,任何UI设计都可以在一夜之间被同类产品模仿和复制,只要它被证明是有用的。
在这个机器学习占据主流的时代,全屏的设计就是为了帮助算法更快地去“看”这个世界。
但这并不意味着算法是万能的。因为直到今天,字节都没有办法大规模地侵入长视频领域,即使张一鸣的战略PPT上明明白白地写着“只要在信息分发领域,字节都要用算法来重新做一遍。”
即使抖音的UI设计让他们的算法迭代更快,也不可能做到筛选出人们行为信息中的所有“噪声”。有时,人们希望算法再“聪明”一些,更理解自己;有时,人们并不愿意重复看那些自己感兴趣的内容,也想了解一点公共热点;还有的时候,人们会想培养一些新的潜在兴趣。
事实上,那些乏味重复、引起用户轻微不快的内容才是产品的慢性杀手。如今,这些负面情绪正在抖音的APP里缓慢发酵。
算法今天不是,未来也不可能是万能的。
举一个最直观的例子,不管是我们自己的优爱腾,还是海外那个算法驱动的Netflix,内容消费都是以运营阵地和导航搜索为第一生产力的。
因为决疑成本的巨大差异,长视频至今还保持着传统货架式的消费方式:
最新最热的内容放在首页曝光度最高的轮播栏;用户依赖类目导航去查找想要的内容,比如按照类型、地区、上映时间和评分来选择电影;还有很大一部分消费来自于搜索对应的站外决策。
比如在微博种草了某部电视剧,根据豆瓣评分来选择观看的电影,以及最近身边的朋友们常常聊起的综艺。
毫无疑问,算法在长视频领域依然没有占据主导地位。
三、结语
当个性化推荐在某些领域大杀四方之时,我们总会不由自主地假设它占据我们全部信息场景的画面;然而,现实却是一个人在日常生活中接触信息的渠道,远比他自己想象得要更加丰富。
假设一个初级电影爱好者想在周末看一部电影,会有几种可能?
他可能直接打开搜索框,搜索自己喜欢的演员或导演,看看他们还有哪些自己没看过的作品;也可能打开豆瓣,刷一刷有没有自己感兴趣的电影;当然,如果他有一个朋友恰好是发烧级的影迷,他可以直接请对方推荐几部。
事实上,推荐、搜索和社交是满足人们不同需求的互补类工具,它们之间并没有明确的替代关系。
算法与编辑、社交并不对立,也不存在唯一的最优选。就像微信的算法,一定有克服「社交情景崩溃」的成分,而今日头条的内容审核,也聘请了大量的人工编辑。
当我们站在科技与人文的交汇点去看这个世界,会发现每一种新技术都既是包袱又是恩赐,它永远不会是非此即彼的结果,反倒比我们预想中的要更加复杂与深刻。
《楚门的世界》里,创造者对楚门说:“外面的世界跟我给你的世界一样的虚假,有一样的谎言,一样的欺诈。但在我的世界你什么也不用怕,我比你更清楚你自己。”
楚门却说:“You never had a camera in my head!”(你无法在我脑子里装一个摄像机)
尽管楚门的世界是假的,但楚门是真实的。所有计算好的下一刻,是行云流水般的此世光阴。