【票·资讯】全球视频网站的人工智能竞技场

时间:2019-05-24 07:00:01 来源:石家庄热线 当前位置:峰哥悄悄话 > 诗词 > 手机阅读

 点击上方关注 ↑


来源:界面新闻

作者:彭郑子岩

失去凯文·史派西的《纸牌屋》第六季于今年年末在惨淡中黯然收场,但相比于这部剧本身的质量高低,六年前当这部集合了大卫·芬奇、凯文·史派西和英国知名政治小说三大要素的政治惊悚剧横空出世时,除了其大牌阵容与精良制作以及一次性放出全季的“壮举”,更关键的是让全球的观众认识到了剧集开头的“NETFLIX”品牌。


也正是从那时起,这几个字母背后所体现的技术与艺术的完美融合为全球观众及整个娱乐行业带来了一场深刻变革。

《纸牌屋》成为了Netflix改变一切的关键


与此同时在大洋彼岸,中国的流媒体行业竞争态势之惨烈更甚于美国同行,位于第一梯队的爱奇艺、优酷、腾讯视频都依然常年保持着用高额亏损换用户增长的状态。


这或许是属于流媒体最好的时代,但“烧钱”一刻也不能停。


由于采购现成版权内容的费用不断上涨,以Netflix为首的流媒体平台都开始将更多精力和资金转向自制原创内容,去年Netflix宣布将再投入80亿美元打造原创内容。但根据日前《经济学人》的报道,Netflix今年的实际在内容方面的投资将达120至130亿美元,超越了同期任何一家电影公司、电视台(不含体育频道),订阅用户每年可收到82部电影,作为对比,今年华纳兄弟推出了23部电影,迪士尼则为10部。

如日剧增的版权成本是流媒体平台的承重负担


国内三大巨头的亏损很大程度也是由于日益高涨的内容成本,以爱奇艺为代表,其2018年度前三季的财报显示,今年一季度、二季度、三季度,爱奇艺内容成本分别为 39 亿、47 亿、60 亿,同比增长了54%、47%、66%。在本季度,内容成本占总成本的比例达到 78%,而内容成本最重要的两部分——版权费和自制内容成本——仍然呈增长态势。


同为美股上市公司的Netflix与爱奇艺都选择发债来扩充“弹药库”,十月底,Netflix宣布了今年再筹集20亿美元新贷款的计划。加上这20亿后,Netflix的长期债务已经超过100亿美元。11月30日,爱奇艺发布公告,确定发行6.5亿美元的可转换优先债券,部分募集资金将用于支付有上限期权交易的成本 ,剩余的资金将被用于继续扩充和提升内容库、加强技术研发以及用于公司日常运营。


除了不断扩充内容库与打造自有IP——这类早已被HBO和迪士尼等娱乐公司证明行之有效的手段之外,同时具有科技公司基因的Netflix和爱优腾,还将吸引用户和提高营收的希望寄托在了新技术——人工智能(Artificial Intelligence,以下简称为AI)身上。


身在硅谷的内容公司Netflix,利用AI更懂你


从2016年1月DeepMind首次披露AlphaGo可以战胜人类棋手开始,到随后AlphaGo与中国棋手的“世纪对弈”,AI这一偃旗息鼓甚至是被大众忽视多年的领域突然又进入了所有人的视野,尽管科技行业一直在保持投入,但随着公众关注度的不断提高,AI几乎是以肉眼可见的速度成为了新的风口。

媒体提及AI时的评价态度变化,2016年1月是个重要的时间节点


就如同两三年前文娱行业随处可见的“大数据”一样,最近几年AI再次成为了新的技术靠山,尤其是在国内的人口红利日渐消失,同时内容与发行方面已经无法明显做到差异化的流媒体行业,越来越多的公司将目光投向了AI技术,试图依靠技术优化用户体验来提高用户粘性并获得营收增长。


而作为经典意义上的硅谷科技公司,Netflix不仅仅只是传统的流媒体巨头,其身上的硅谷基因也使得整个公司从来都会尝试以各种新技术来驱动产品和服务。


早在Netflix的主业还是出租DVD的时代,他们便开发了一套名为“Cinematch”的智能推荐系统,它能够根据用户以前的评分数据预测到这位顾客可能喜欢什么样的主题和风格,等新电影发行后马上为相应的用户群体进行推荐。


不过基于当时的技术导致这套系统并不完善,2006年, Netflix对外宣布,他们要设立一项大赛,公开征集电影推荐系统的最佳电脑算法,第一个能把现有推荐系统的准确率提高10%的参赛者将获得一百万美元的奖金。三年后Netflix则真的凭借一百万美元奖金,获得了一套准确率被提升了10%的算法。


2013年《纸牌屋》的推出则是一次Netflix精心营造的“技术营销”,当时所谓的依靠“大数据”打造的美剧,事后被证明更多依靠的是Netflix不计成本的高投入,两季总共一亿美元的投入,于当时HBO一家独大的美剧行业来说可谓是“天价”。


但与此同时,Netflix又热衷于将AI技术应用到其产品当中,并且这一技术也确实帮助其获得了营收的增长。

每个行业因为人工智能的加入都会是赢家,但有些行业注定是大赢家


早前德勤发布了一份面向全美企业的AI状况报告也证明了这一点,报告中德勤特别提到了Netflix的案例:Netflix发现他们的用户喜欢搜索电影,但如果搜索并找到一部电影的时间超过90秒,那么用户往往会放弃,而借助AI技术优化站内搜索之后,不仅可以给用户带来用户体验的上升,还能让用户更快地付费。德勤的报告显示,仅仅一年,得力于AI对搜索的改进,Netflix可以多赚10亿美元。


为人所称道的Netflix智能算法推荐,便是基于AI技术所打造。广义的AI所包含的技术众多,当下科技公司能够将其转化到实际应用场景中的无非是机器学习、深度学习、自然语言处理和计算机视觉四大类别,而从Netflix的技术博客可以看到,Netflix利用机器学习和深度学习所开发的算法正是其推荐系统异常“懂你”的关键。

广义的人工智能技术包含了当下最流行的机器学习和深度学习


在过去,Netflix通过收集每个用户对于每部影片的评价(分数1-5),借此推荐用户可能有兴趣的内容。不过随着Netflix掌握更多用户行为数据(包括用户观看的内容、使用设备、观看时间、观看频率、观看地点),同时借助机器学习来建立推荐算法,以捕捉更多基于rule-based算法可能漏掉但对预测喜好相当有帮助的信息,例如:观看影片的顺序、不同因素之间的交互作用。

Personalized Video Ranker, PVR (某类型影片):推荐你喜欢的影片类型

Top-N Video Ranker (最佳推荐):推荐你喜欢的影片,和PVR 的差别在于这边没有类型的限制

Trending Now (现正热播):依据当下热门话题,如圣诞节庆,推荐你喜欢的影片类型

Continue Watching (请继续观赏):推荐你可能会想继续观看的影片

Video-Video Similarity (因为您观赏过):推荐用户可能会想看的类似影片

Page Generation:将上述演算法排序出最适合你的的个人化首页


上述是Netflix首页的推荐条目,背后的算法大致可以归结为两类:基于内容过滤(Content-based filtering)与协同过滤(Collaborative filtering method)。内容过滤算法是根据影片本身特性找出类似影片并推荐给用户,这也是现在多数视频网站能做的将同类作品推荐给用户,如果你看过迪士尼的《头脑特工队》那么算法就会给你推荐《神偷奶爸》系列。


而后者则是先找出喜好类似的用户,借此判断用户A可能会喜欢用户B看过的影片。具体到Netflix,基于该算法的内容推荐是由相似的浏览模式代表相似的用户品味这一假设所提供的,“同品味用户群”(Taste Communities)这一概念在这些推荐算法中起着重要作用,“同品味用户群”即喜欢看相同内容的用户群体,Netflix目前已识别出2000个这样的用户群。


这些同品味用户群内的用户可能会喜欢看似完全不同的内容,这时算法便会派上用场,Netflix负责原创内容的副总裁Cindy Holland曾提到:“Netflix的算法发现单口喜剧演员Dave Chappelle的粉丝群与霍金传记电影《万物理论》的粉丝群之间存在着令人意想不到的联系。”

内容过滤(Content-based filtering)的简单概念识别


根据的报道,Netflix表示通过算法增强了用户粘性,每年可以节省超过10亿美元的成本。同时Netflix也越来越多地使用算法所打造的公式来进行内容创作,其成功率高达80%,而传统电视节目的成功率为30%-40%。


对于个性化推荐,Netflix最知名的论断便是“有3300万个不同版本的Netflix”,在2013年还只有3300万订阅用户时,Netflix首席内容官泰德·萨兰多斯就说过“没有‘Netflix节目’这种东西,我们的品牌是个性化的。”


利用算法,Netflix可以根据每个用户的需求调整整个用户体验,包括主页、标题、每部电影的视觉效果等等,Netflix把这种个性化的过程定义为“消费者科学”(Consumer Science)。Netflix的高级数据科学家Mohammad Sabah在2014年曾表示,“75%的用户根据公司的推荐选择电影,Netflix希望这个数字能更高。”而根据2015年Netflix公开发表的一篇论文显示,80%的用户观看时长都是依靠算法推荐而来。

同一部剧集Netflix会打造多个海报封面推送给用户


也因为Netflix完全依靠用户订阅作为主要营收来源,如Netflix产品副总裁Yellin所说,他们几乎是跪在地上哀求用户不要取消订阅,想方设法吸引用户留下是Netflix的唯一目标。因此在内容之外,包括预告片、标题、视觉呈现都是Netflix要专注为用户所打造的。


去年IBM的研究人员研发出第一个“认知电影预告片”系统。其采用机器学习技术为电影《摩根》生成了一个恐怖电影风格的预告片,以吸引观众的眼球。Netflix也计划将这项AI技术应用在自家作品的预告片中,包括电影和电视剧。其AI系统利用机器学习技术可以将一部更能吸引用户兴趣的电影或电视剧进行分析,将影片数据按类别归类,比如场景、演员、背景乐类型、拍摄手法等等,然后根据每个用户的偏好,制作成符合用户口味的预告片。

接近实时推荐系统


多数互联网公司使用批次处理(batch processing)的方式实现个性化的目标(如个性化推荐),但这也是静态的机器学习所能达到的极限状态。包括Facebook和Netflix在内的巨头都意识到这对于具备时效性的推荐内容来说依然不够快,比如某一突发新闻或者实时上线的新剧在常规状态下就得不到及时推荐。


Netflix随后转向了接近实时( Near Real-Time Recommendation)的推荐过程,以加速学习过程并推出测试结果。目前Facebook已经开发出了实时机器学习(Real-Time Machine Learning)算法Spiral,可以为网站上的数十亿用户提供实时推荐的服务。实时机器学习的优势在于能够在几分钟内预测并将新结果输出给用户,而不是依靠好几周的数据来优化和更新服务。目前Netflix等专注算法推荐的媒体公司也都在跟进这项技术。


正如凯文·凯利在《必然》一书中写道:“Netflix的推荐系统有一个300人的团队,拥有1亿美元的预算,但他们解决的是一个价值10亿美元的问题 。”


国内的巨头们,都说要让AI帮忙做爆款


在年末第六届中国网络视听大会期间发布的《2018中国网络视听发展研究报告》中,有一章提到了新兴技术在国内网络视频行业的应用,其中提到AI和大数据可能会最先应用到内容生产、广告分发、IP预测等各个层面。


在接受界面娱乐专访时,金山云高级副总裁、合伙人梁守星表示,AI作为一种技术能力,正在成为视频行业发展的新引擎。他也提到现在金山云在将AI应用到视频行业,主要针对于技术与内容两个层面,技术层面主要是解决视频公司的传输和带宽问题,而在内容层面现在AI技术能够解决的则是内容审核和标注,前者是由于当前国内的审查环境使得大公司需要投入更多人力去对UCG内容进行审查,后者将标注自动化之后则会有利于视频平台更好的售卖广告。

金山云的AI技术能为视频行业解决人力审核压力过大的问题


受困于激烈竞争和盈利压力的国内巨头们,也纷纷将目光投向了AI技术。


2017年6月,爱奇艺创始人、CEO龚宇在爱奇艺世界大会上发布了“做一家以科技创新为驱动的伟大娱乐公司”的企业愿景,之后爱奇艺宣布将会全面AI化。背靠已经“ALL IN AI”的科技公司百度成长起来的爱奇艺,也是国内最早提出要将AI应用到视频场景的流媒体公司。


爱奇艺创始人、CEO龚宇多次提到AI对于流媒体平台的重要性


想依靠技术来驱动公司发展和产业升级,几乎已经成了国内视频巨头的共识。来到今年的优酷秋集,优酷宣布APP端正式改版,从原先的固定频道推荐转变成为了复合信息流推荐。阿里巴巴文化娱乐集团大优酷COO兼CTO南天提到“新时代的AI技术不神秘,不冰冷,也不会背离用户与从业者心智,它会是一套切实可依的方法论,在每一个内容生产前后的细节中,体现出效率的力量。”


目前基于AI技术和算法,优酷推出了鱼脑和YOUKU ORIGINAL两款内容制作产品。其中,鱼脑平台依托于阿里大数据能力,建立了内容从投资、制作、智能化运营、需求挖掘等辅助决策的工业化标准体系。它可以完成AI选角、AI剧本、推动内容IP流量放大及联动等功能。


至于在2018年被人称为“没有梦想”和身处温室的腾讯,也在调整内部架构之后宣布喊出了“AI in ALL”的口号,相对其他两家,腾讯视频则更多倚赖于腾讯整体的AI战略,上半年腾讯云推出的腾讯音视频AI产品解决方案——腾讯明眸,可以实时的对视频流进行识别,并进行AI化处理。在2019年V视界大会上,关于腾讯视频对于技术的投入和使用,腾讯视频总编辑王娟也只是表示“让技术和数据产品更加前置,指导内容生产的过程,从而达到内容的品质更可控。”


虽然国内的流媒体巨头们都在争先恐后的强调自己的付费会员数量,但国内视频网站付费用户留存率一直是一个大问题,对于内容所带来的黏性较低问题,前爱奇艺CTO汤兴曾表示:“影视圈的问题是没有黏度,热播期一过去用户通常不会再回来。”对国内巨头们来说,吸引用户付费是一回事,如何留住用户让其持续付费又是另一回事。


没有持续产出好内容始终是横亘在国内视频平台面前的最大障碍,龚宇早前也认识到了这一问题:“需要用源源不断的内容养成用户的内容惯性,并考虑长期用户体验及特权。”但认识到问题不等于解决了问题,当下大公司们能给出的解决方案则都不约而同的指向了AI。

爱奇艺AI的应用场景


在今年多个场合都着力强调AI重要性的爱奇艺在这方面无疑走得最远,今年以来,爱奇艺连续发布了通过AI深度神经网络算法增强的HCDN技术、AI ABS自适应码流、ZoomAI视频增强技术、绿镜以及只看TA 3.0和蒙版弹幕等功能,以此来提升视频用户的体验。


对于用户而言关注内容往往更甚于使用体验本身,在利用AI提升用户体验的同时,爱奇艺基于AI技术所打造的“IP价值评估系统”和“流量预测”则是完全针对于内容生产本身。


对于底层技术的使用,爱奇艺商业大数据的负责人孙斌表示;“上述应用场景都使用了主流且比较成熟的AI技术,如自然语言处理(NLP),语义理解,深度学习技术等技术,独特的地方在于与爱奇艺业务场景的结合,我们在业界最早开始大规模尝试并且应用于实际业务的。”


“IP价值评估系统”显然是想让AI技术真正介入到内容的生产与创作环节,利用AI和大数据分析全面提升剧本创作质量、评估可拍摄性以及商业价值,而这一系统与优酷致力打造的鱼脑思路不尽相同。


“IP价值评估其实是基于一个IP生命周期中各个阶段的相关信息综合进行分析的。”孙斌也进一步解释了在实际应用中这一系统如何发挥作用,“比如相似IP在历史上的受欢迎程度,话题舆论热度,IP涉及的关键信息对应事件在历史上的反应等等信息都会作为模型的输入,再根据业务目的动态调整权重进行评估。”


同时他也表示基于大数据和AI的评估永远无法确保一个内容一定成功,但是基于海量数据和深度学习的模型,可以最大程度充分分析历史和预测未来,从而为决策提供高置信度的数据支持,说唱音乐之所以能成功出圈,很大程度得以于基于爱奇艺海量站内数据和站外数据,配合最领先的深度学习算法,及时和准确反应出了爱奇艺站内以及站外的观众兴趣和舆论动向,所以的这些都离不开两个关键因素,“大数据”和“大算法”,这两者爱奇艺恰恰都有。


算法至上的Netflix低头了,AI创作还只是梦想


由于科幻小说、电影和剧集的影响,公众会对AI产生过多不切实际的幻想,甚至连伊隆·马斯克这样的科技大佬不时也会发表所谓的“AI威胁论”,但事实上目前的AI技术发展远没有进入能令产业结构发生翻天覆地变化的程度,正如科技博客作者赵赛坡所说在没有具体的应用场景之下,甚至并不存在一个真正意义上的“人工智能行业”。


2016年的伦敦科幻电影节上,一个名叫Benjamin的人工智能写出了一段科幻短片,在一位电影人和AI研究者的共同参与下,Benjamin经过训练最终完成一段剧本创作,但它甚至还无法完成为人物起名字这件事,因为虚拟角色的名字往往具有不可预测性。今年六月,Benjamin卷土重来,它采用神经网络和换脸技术通过整合大量电影素材和演员语音,生成新的场景和对话完成了一部名为《Zone Out》的6分钟电影短片,但由于这次完全没有真人演员参与演出,单靠用换脸技术将演员的脸放置在已经存在的角色上使得最终成片显得相当怪异。


事实上AI或者数据能为内容创作带来的帮助并不多,作为专业的技术人士,梁守星认为依靠AI来进行内容创作并不成熟,“文艺创作类的内容理论上来说是感性的东西,用机器学习来判断我觉得并不成立。一部电影或者是一部剧集的创作不是内容的问题,而是过程当中导演感觉的问题,演员表现力的问题,包括每个时代不同观众接受度的问题,有很多综合的因素,人的情感在里边。目前这个AI时代是很难预测。”


而同样是依托大数据和AI技术为影视行业服务的小土科技,旗下产品也是试图利用技术去为影视剧本做评估和判断,小土科技创始人祝金甫表示作品能不能成为爆款,思想性和艺术性一定是有30%的占比在,AI短期代替人的艺术创造很难,只能基本判断这是不是一个合格的产品,但是艺术性判断不出来。

Netflix CEO里德·哈斯廷斯从不讳言数据对他们的重要性


需要依靠人来做最终决策,这依然影视行业充满不确定性的关键,Netflix虽然长算法推荐,但对于其并非像外界所误解的那般爱好用算法去执导内容创作,Netflix首席内容官泰德·萨兰多斯也不止一次说过:“千万不要沉溺于算法,过去的信息很有可能限制对于未来的想像力。”


“数据是用来支撑决策的,算法越准,数据量越大,数据结果的置信度越高,可是这个决定永远都是人做的,所有的这些数据评估体系的结果都是为相关的专业人士负责的,我们从来没有让一个算法的结果来替我们做决定。”孙斌在采访中也一再强调“人”的重要性。


当然身在硅谷却越来越向好莱坞靠拢的Netflix,其实已经在面临在算法涉嫌“种族歧视”,以及在算法与人情之间抉择的问题。前述已经提到过Netflix善于利用算法为不同用户提供各种风格的海报,今年十月一些黑人订阅者发现《虎父无犬女》这部电影的缩略图,其中突出了非洲裔美国演员伦纳德·欧兹和布莱尔·布鲁克斯,但这两位黑人演员其实只是小配角,正片里他们发现这其实是一部白人演员主演的作品。尽管Netflix后来否认根据用户种族推荐作品,但过于“智能”算法所引发的社会工程学问题已经产生了不小风波。

最终出现的《同妻俱乐部》第二季海报


而上个月WSJ一篇长篇报道则直接指出,Netflix内部其实已经分化出两派,“技术团队更偏向于‘数据驱动和分析’,而好莱坞方面更偏向于‘以关系为导向’。”


文中提到的例子依旧是关于推荐海报,Netflix热门剧集《同妻俱乐部》第二季的播出宣传时,Netflix的根据数据发现当宣传海报中没有简·方达时,用户会更加愿意点进去观看,尽管简·方达是该剧的两大女主角之一。显然根据Netflix的数据发现,年轻观众已经对于这位好莱坞老江湖不感兴趣,但发布一张没有主演的剧集海报毫无疑问会让Netflix与好莱坞之间产生嫌隙,更别说这一做法甚至有可能违背了双方签订的合同。


对于海报中明星站位的不同所引发的纷争,即便是在国内影视圈也屡见不鲜,而Netflix直接制作了一张没有主角的海报无疑也触怒了好莱坞,最终想要成为好莱坞一份子的Netflix做出妥协,重新发布了包含简·方达的海报,尽管公司部分坚信“数据”的工程师至始至终都无法理解为什么要做出这种决定。同时Netflix对于好莱坞人才的吸纳也在不断增加,去年长期在任的Netflix首席产品官Neil Hunt下台,代替他的是在产品内容运营方面更有经验的高管Greg Peters。


当新势力尝试进入并改变传统行业时,势必都将会面临新旧对立的问题,尤其是面对影视这一长期倚赖人类智能与人际关系所建立起来的庞大产业。正如梁守星所说现在阶段的AI可以解决一部分能力释放的问题,包括内容监管和标注的问题,当人力密集和模式化的时候,它是可以解决这个问题。“但是要超越这个,加入感情和趋势的东西,那是不可能的。很难说短时间内AI可以达到新的高度并解决一些趋势判断的问题。”


不过Netflix的中国学徒们还尚未走出需要依靠广告甚至游戏收入的商业模式,距离真正用AI为用户和内容服务其实还有很长的路要走。

- THE END -


电影票房微信号:dypfboxoffice聚焦电影产业、关注电影市场                                    

这里是第三方票房统计机构,圈内著名公众号@电影票房投稿、合作或者其他事宜可直接回复本微信,或者加小编私人服务号:piaofang1      




上一篇企业大数据平台构建之路

下一篇创泽在英国剑桥成立人工智能研究院

相关文章:

诗词本月排行

诗词精选