网友们相互开盒,不亦乐乎。
不过这些问题,却也不是孟繁岐现在有什么办法可以改变的了。
至于第三种混合推荐方式,则是将之前两大类通过一些方法综合考量,融合起来。
毕竟单独考虑内容和协同过滤都是不够周全的,前者可以避免冷启动问题,也就是如果用户没有跟一个种类的视频互动过,那么这类视频就会很难被推荐到。不过基于内容的推荐很可能会陷入重复套娃当中,点多了之后就不会推别的内容给用户。看几个萌宠视频就掉进猫窝出不来了。
后者根据用户互动数量的增加,可以非常好地把握用户的喜好。只是如果用户从未看到某些类型的话,系统也难以判断,在初期会遭遇上述的冷启动问题,不知道该不该推某些类别。
当然了,这是非常笼统论述,实际的操作更加复杂。
“现在国内在这方面大部分都是模仿你在谷歌为油管设计的那一套办法。”张一名此前刚刚自学了一套传统办法,结果推荐系统就被AI革新了一轮。
孟繁岐在谷歌的中前期,为了扩大自己的分成比例,做了一些推荐搜索方面的优化,其中就包括替油管准备的一套方法。
针对网页和推荐广告的那部分,谷歌是不可能放出来的,毕竟那是谷歌8成收入来源的一个重大提升。
而油管这方面,虽是世界级的视频网站,但在营收方面占比还是拉胯了一点,加上孟繁岐的做法也比较糙,因而迟些时候谷歌还是选择了公布。
“其实我在那个工作里没有投入太多精力,就只是率先把深度网络的那一套给搬进去了,做了一些专项的适配。”孟繁岐着实也不是谦虚,那段时间太忙了,油管这边属于营收小头,孟繁岐没有当成主要任务在做,各方面都不够细致。
“你这话说得,传出去能把人气死。油管怎么说也是十几亿用户的头部长视频平台,哪有你说得那么好做?”张一名是内行人,他知道以油管的规模,是有几个巨大挑战的。
“油管体量大,我自己测试很多推荐算法,小规模问题都做得非常好,但体量上到千万、亿级别就很容易出问题,更别提油管的十亿级别了。”张一名在头条上推荐的东西测得很多,其中的难点知晓得很清楚。
“用户多了,每秒的新内容上传数量也很庞大,系统不仅要处理好原本十亿级别的视频,还得对最新上传的内容及时更新建模。”张一名摇了摇头,以他自学推荐方法的经历,一时间根本想象不到这个难题得怎么去解决。
“油管当时是用了十亿级别的参数,用了千亿的训练样本。主要是用了两个神经网络,一个>> --