第四章 在中国,是信息在阅读你

第四章
在中国,是信息在阅读你

前中航广场航空博物馆、字节跳动北京总部中心的“大玻璃鱼缸”会议室

我们建立了全球最大的信息内容机器学习平台。这就是我们的秘密武器。

——字节跳动AI实验室总监李磊

章节大事记

2012年9月:今日头条个性化推荐系统上线

2013年8月:张利东加入字节跳动,领导公司进行商业化

2014年:杨震原加入字节跳动,任技术副总裁

2015年1月:字节跳动冲绳年会召开

2016年2月:字节跳动迁址中航广场

2012年年中,字节跳动技术团队的收件箱里,出现了一封题为“推荐引擎”的电子邮件。张一鸣下定决心,要全力推进一项他认为对公司未来至关重要的大事。他在邮件中写道:“想做好信息平台,就必须做好个性化推荐引擎。你们准备好了吗?”

今日头条早期的推荐系统,也就是他们的“个性化技术”,在当时还比较粗糙。打开应用程序,用户会被大量的热门阅读文章轰炸,获取他们的注意力。接下来,系统会显示一些更具指向性的文章,引特定用户群点击,以此测试并判断用户的喜好。比如,会点击女性车模文章封面预览图的用户,大概率是男性;经常阅读“心灵鸡汤”类型文章的用户,八成是老年人。另外,系统还会对用户的一些基本信息进行补充分析,比如手机型号、地理位置以及打开应用程序的时间等。

这样的开头还算不错,但离张一鸣的期望还差得远。他希望成为行业中的佼佼者,最大限度地发挥这项技术的潜力,从而获得超越其他技术的长久优势。然而,要想超越目前的水平,他们还面临巨大的技术障碍。当时字节跳动的技术团队还很小,他们在搜索引擎和移动应用程序的开发上还有些经验,但要开发最先进的个性化推荐引擎,则需要更加深厚的专业知识和过硬的专业能力。团队里很多人都曾表示担心,觉得这支队伍并没有这样的技术能力,没办法实现张一鸣的长远目标。但花高价从外部聘请专家也不现实,首先,他们不过是一家只有几十人的创业小公司,办公室还是由民居改造的;其次,在中国很难找到拥有这种专业知识和能力的人。

固执的张一鸣选择坚持下去。在他看来,他们固然可以选择稍加创新,乘着移动互联网浪潮取得差强人意的成功,也可以全力以赴、一鸣惊人,实现真正创造价值的根本突破。为做表率,张一鸣首先做出承诺:“做不出推荐引擎,那就去学。这次会议结束后,我会第一个采取行动。”

张一鸣的动力之一,源自一本即将出版的专著《推荐系统实践》。这本书简直就是为字节跳动量身打造的,作者是当时中国国内顶尖的机器学习专家之一项亮。张一鸣亲自联系了当时在直播网站Hulu担任研究员的项亮,想要一本《推荐系统实践》,但因该书尚未出版而遭到拒绝。沮丧之下,张一鸣决定自学,专心研究他在网络上能找到的一切资源。讽刺的是,几年之后,项亮最终加入了字节跳动,成为公司人工智能实验室的机器学习重要专家之一。后来张一鸣谈起这次事件时称,项亮的拒绝大大耽误了字节跳动推荐引擎能力的提升,也反映出“真正下定决心做推荐引擎的公司屈指可数,而且大都失败了”。

破釜沉舟的决心和刻苦自学固然有用,但最终,字节跳动取得的最大突破,还是源自对外部人才的引进。只有从其他组织中吸收丰富的专业经验,张一鸣才有希望打造出一流的推荐引擎。而在当时的中国市场,刚好有一家公司能够提供这样的顶级人才,那就是搜索巨头百度。

和字节跳动一样,百度的总部也设于北京。百度是中国最大的互联网公司之一,也因人才辈出而享有盛誉。谷歌退出中国市场后,没了竞争压力的百度独占鳌头,享有相对安全的市场地位。在字节跳动刚刚成立的时候,张一鸣觉得百度是自己最大的竞争对手。百度公司的算法人才储备给他造成了巨大的压力,他还认为,在自己想要开拓的推荐引擎领域里,百度是最有能力拔得头筹的公司。

但张一鸣运气不错,等百度意识到个性化推荐的重要性时,为时已晚。在搜索业务领域,百度一家独大、利润丰厚,就算在移动通信这个新领域落后,他们也根本不在乎字节跳动带来的威胁。尽管百度被媒体吹捧为“中国的谷歌”,但这种比喻其实不算恰当,毕竟百度没有机会控制占主导地位的智能手机安卓操作系统。同时,百度也因派系内斗和管理层臃肿而遭到诟病。一直有传言称,百度创始人兼首席执行官李彦宏的妻子才是公司重要决策的拍板人。

2014年,字节跳动从百度挖来了9年老员工、搜索部副总监杨震原,由此迎来了第一次技术突破。杨震原刚一入职便被授予技术副总裁头衔,并开始着手策划一次重大的技术升级。

跟随杨震原的脚步,许多来自百度的程序员前赴后继地加入字节跳动。字节跳动也拼尽一切,以丰厚的薪酬和股票期权,从百度丰富的技术人才库中挖来了不少骨干。2015至2016年,在引进陈雨强、朱文佳等鼎鼎大名的百度技术人才后,字节跳动摆脱了过去的技术桎梏,在推荐引擎技术方面创造出了长久优势。朱文佳后来带领团队负责开发抖音和TikTok所使用的原创推荐系统。

2014年年初,字节跳动总共只有差不多100名员工

截至2016年,字节跳动的技术水平已经大大提升,他们甚至尝试使用算法自动生成内容的方法。在当年的奥运会期间,字节跳动开发了一个可以撰写原创新闻的自动程序,不仅能比传统媒体更快地发布重大事件的报道,其遣词造句也丝毫不亚于人工编辑。

推荐系统成为字节跳动的核心技术,无论是抖音上的短视频、今日头条上的文章,还是内涵段子上的搞笑动图,其根基都在于推荐技术。

上一章 封面 书架 下一章