我比谁都清楚观众喜欢看什么

为了弄懂订户的观剧喜好,在线视频提供商Netflix创造至少7万种视频“微类型”(micro-genres),来细分已有的视频内容。然后,再通过元素的重组,为下一步新的影视内容摄制提供参考。

Netflix面对庞大的好莱坞影视业,它又要以怎么样个性化分类,来满足旗下的4000万订阅用户的需求?

Netflix切入点很细,这些“微类型”对应特定的观众区间。有时分类甚至让人觉得很特殊、很荒谬。比如情感斗争类的纪录片、基于现实生活的古装剧、20世纪80年代的外国魔鬼故事……

根据大西洋月刊的记者粗略统计,Netflix至少把影片分成76897种“微类型”。这打破了原本对于影片类型粗放式的分类方法。Netflix能由此分析出最受欢迎的影片类型、以及最受欢迎的演员与导演等。

除了Netflix的员工以外,没有人了解Netflix是如何细致分类的。他们要面对好莱坞那般空前的数据储存,而记者所统计的数量的类型只是冰山一角。

Netflix内部把这种分类过程称之为“altgenres ”,它由Netflix副总裁 Todd Yellin构想发明,这是一项特殊的解构电影的过程,整个系统复杂精确。Netflix首先要雇佣一群人,让他们阅读一份长达36页的培训文档,训练他们如何对影片的性暗示内容、暴力程度、浪漫桥段、甚至情节等等元素,作出精确地评级细分。

他们捕捉了数万种不同的电影属性,甚至是人物的道德派别。这些标记内容,与千万级用户的观影习惯相配对,便成了Netflix的竞争优势。Netflix的主要目标,是为了获得并留住订阅用户。通过这种微类型,对应不同的观影受众,正好是他们战略的一部分。

在2012年的时候,Netflix就在其官方博客中提到,“了解用户喜欢的“微类型”的内容,就能用高收视的类型取代低收视的部分,以赢得竞争力。”只要,Netflix更了解用户,用户就越容易黏在它的平台上。

过去的几年中,Netflix建立了属于自己的用户偏好数据库。这个数据库,虽然不能告诉导演编剧影视剧要怎么拍,但他能告诉这些人,影视剧中需要什么样的元素。比如他们拍摄纸牌屋的时候,就该知道哪些元素需要有的放矢。

Netflix通常是这样对影视内容进行分类的,比如:

独立情感的体育电影
20世纪30年代、间谍和冒险类点电影
中国浪漫主义黑帮片
黑色悬疑科幻恐怖电影
广受好评、主角情感受挫的电影……

这种细分方法可以概括成:首先是国家,其次是类型片大类,比如是西部片还是恐怖片。其次是影片的创作来源,基于现实生活、古典文学还是虚构内容。然后影片设定的时代,比如20世纪80年代。观影级别,比如16周岁以上观看等。还有一些比较特殊的通用分类,比如女英雄主义,激进的浪漫主义等,当然还有导演与演员的个人风格。

这些繁复又有规则的分类方法,又组成了这样一种公式:

影片类型=地区+主题+形容词元素+类型片类型+演员特性+创作来源+时间+故事情节+内容+得奖情况+适宜观看人群等等。

但这并不意味着所有的微类型,都能在线找到对应的影片。而这些细致分类代表所有的排列组合的可能性,而不止是代表观众在特定时间场合看到的影片。

Netflix自有的片库不能涵盖到所有微类型的影片,但它的价值在于,如果市场需要的话,Netflix可以根据这些标签,去拍摄这种类型的片子。

假如把以上过程,可以看做是Netflix把影视内容转码成数据过程。而对数据最简单的处理,就是做个统计排行榜。

基于Netflix分析,订户最喜欢的主题是结婚。

订户最喜欢的形容词元素是浪漫的。

订户最受欢迎的电影所处时代是20世纪80年代。


订户喜欢的电影场景设定在欧洲。

Netflix副总裁 Todd Yellin,与另外两位工程师通过数月的努力,制定了以上被称为“Netflix量子理论”的东西。Yellin本人像一位混迹于科技公司、不安分的制片人,它需要为影片生产所有流程精心算计,就像纸牌屋中Frank Underwood的智囊 Doug Stamper那样。

Yellin告诉大西洋月刊的记者,他们分析出的内容,只是他们终端的产品形态。而在Netflix数据库内部,数据分类捕捉会更加繁复。他说道:“我们要把影片内容给撕裂”。

通过这些分类标签,Netflix不仅能给他的订户推荐影片,甚至告诉他们你喜欢的类型究竟是什么。基于Netflix算法,它甚至提前帮用户预估,他们看完影片,会给影片打几分。

这家公司还拿出100万美元悬赏,奖励给能提高这种预估评分算法准确度的技术团队。经过几年时间的改进,准确度仅仅提升了10%。尽管该奖金在2009年开始设立,但Netflix并没有把它纳入新模式,而只是一种工作需要。他们认为,比起感性的得分,更个性化风格的微类型细分,才是观众真正要的。

标记的微类型判断用户喜欢什么还不是全部,这些数据还能用来分析,什么类型影片哪些演员来出演,会更受欢迎。Netflix还希望算法基于数据,能在合适的时间,给特定的观影对象,推送合适的内容。

原文发布时间为:2014-01-07


时间: 2024-03-31 20:52:32

我比谁都清楚观众喜欢看什么的相关文章

电影观众为什么看电影?

最近不二,通过极特别极特别的渠道,做了一系列的"权威"问卷调研,得出了很多好玩的结论,这些结论出来之后,什么索福瑞啊.艾瑞啊等等吧,所谓的权威调研机构都可以休息休息啦,本身电影市场这点事就没什么大不了的,也没必要那么故弄玄虚,索性根据不二这些靠谱的不精准的调研,与大家分享一些结论与话题,信不信由您. 今天这个话题,可就深了,电影观众为什么看电影?鬼才知道,脑子进水了才看的吧.反正总是有这么一群游手好闲的.寻求刺激的,爱跟风臭屁的家伙们总对看电影这个事情上瘾.那么,在为什么看电影这个事情

站长习惯分析:为什么老站长们不喜欢看SEO的帖子和软文?

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 互联网上面关于一些话题文章非常多,多的自己都看不过来,每天都有重复的,不管是抄袭的,还是自己写的,重复的多的不能再多了,一些信息看完之后就不要去看第二篇,那样会误导你的思想,如果没有问题的时候,尽量不要去看别人的文章.这也是我不喜欢看别人的文章,更不喜欢去抄袭别人文章的一个原因,很多人说,你写文章不累吗?其实写文章习惯了之后,一天不写自己心里

柯洁收回承诺:只要观众愿意看我会继续对抗AI

来源:新华社 2017-11-10 11:22      "只要观众愿意看,我就会继续与人工智能对弈."近日,棋手柯洁在浙江乌镇出席2017首届智能金融知识图谱峰会时表示,出于推广围棋运动的责任感,他将收回不再与人工智能对弈的承诺. 柯洁 "很多人知道我,并不是因为围棋,而是人机大战 ."柯洁说.今年5月,柯洁在乌镇与AlphaGo举行三番棋"人机大战",以0比3告负.输棋的柯洁一度落泪哽咽,并表示这是自己最后一次与人工智能对决.11月,柯洁却现

大家都驻足伸长脖子看着闪烁变化的数字

每年的双11,肥猫都是守在电脑前紧张的下单.付款,为错失的购物车里的商品扼腕叹息--今年双11,老了不中用,守到23点30分,睡着了.一觉醒来,是清晨4点30分,打开手机,满目刷屏都是双11. 打开邮箱,收到的第一条邮件是小米发来的,双11开场3分钟,小米手机销售破亿:第二条邮件是派驻天猫现场的记者沈婷婷发来的,支付宝破10亿只用了不到6分钟,38分钟后,天猫销售额突破58亿:60分钟后,小米单店销售过3亿--这是什么样的节奏?我只能用手托起惊掉的下巴. 沈婷婷说,在23:52分时,马云来到记者

7月份第三周杯具傻缺视频合辑,喜欢看别人笑话的你千万别错过喔~

class="post_content" itemprop="articleBody"> 似乎有一段时间没有分享一些杯具傻缺的视频了,所以,小编找来了最新一期7月份第三周杯具傻缺合辑.喜欢看别人笑话的网友,要是觉得最新一期的杯具傻缺不给力,那么后面还有33分钟的"悲催傻缺意外汇编"等着你呢-- 2013年7月第三周杯具傻缺视频合辑 33分钟!各种悲催傻缺意外汇编

金鹰奖颁奖晚会孙红雷闫妮荣获观众喜欢演员

第八届中国金鹰电视节将于今晚在长沙闭幕,最受观众喜爱男女演员.优秀主持人等三项大奖将在颁奖典礼现场揭晓.图为陆川.吕丽萍联手颁出第二对观众喜欢男女演员,孙红雷.闫妮获此殊荣.闫妮表示:"这次真的没准备,我真的很感谢,<北风那个吹>已经两年了,大家还能记得,这个鲜花还是有点牛."孙红雷表示:"开拍前,我说<潜伏>如果观众不喜欢的话,一定是演员的问题.功劳不属于我们,属于所有幕后的工作人员.我突然长大了,以后要对你们更好." 金鹰奖颁奖晚会 孙红

《风语》纠缠儿女情长观众想看“破解密码”

胡军在<风语>中的表演受好评. <风语>剧照. <风语>剧照. 央视电视剧频道的开春大戏<风语>日前登场,有媒体称,该剧是2011年最值得期待的谍战大剧--著名编剧麦家亲自改编自己的同名小说,<黎明之前>的导演刘江执导,郭晓冬.胡军.孙宁等主演.让人意外的是,该剧在贴吧和一些论坛上却被观众炮轰"节奏太慢"."不及<黎明之前>".对此,麦家公开表示,<风语>"不是传统的谍战剧

《观音山》上映观众没看懂导演:困惑引发共鸣

<观音山>海报 原定于3月4日上映的<观音山>提前一天在3日与观众见面,大多观众观影后认为电影充满了反叛.迷茫,也有观众大呼没看懂.<观音山>上映时,影院内的观众反应可谓相当戏剧化.记者从影院了解到,该片开场前售票情况相当理想,但放映时,不少观众却先后进入梦乡,也有部分观众默默离开了影院.而影片结束后,对于影片的拍摄手法以及视觉效果,认可的观众并不多.但对它所传达出的"人性的思考",观众却表示深有感触,记者身边的一位卞女士说:"看完心里挺难

我用rest 接口 返回的聊天记录始终是10条 每次都 一样 能给看一下不 有JAVA获取聊天记录的代码吗

问题描述 URL realUrl = new URL("https://a1.easemob.com/1989128 ... 6quot;);            HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();                        connection.setRequestProperty("content-type", "appli