产品经理需要了解的算法——热度算法和个性化推荐

分享UP 发表了文章 • 0 个评论 • 239 次浏览 • 2017-08-04 12:02 • 来自相关话题

[产品经理需要了解的算法——热度算法和个性化推荐]人人都是产品经理是中国最大最活跃的产品经理学习、交流、分享社区。集媒体、社区、招聘 、教育、社群活动为一体,全方位服务产品经理。本文由人人都是产品经理社区作者@卢争超  原创发布。转载请联系人人都是产品经理。 

今日头条的走红带动了“个性化推荐”的概念,自此之后,内容型的产品,个性化算法就逐渐从卖点变为标配。伴随着“机器学习”,“大数据”之类的热词和概念,产品的档次瞬间提高了很多。而各种推荐算法绝不仅仅是研发自己的任务,作为产品经理,必须深入到算法内部,参与算法的设计,以及结合内容对算法不断“调教”,才能让产品的推荐算法不断完善,最终与自己的内容双剑合璧。

本文以新闻产品为例,结合了我之前产品从零积累用户的经验,整理了作为PM需要了解的基本算法知识和实操。

1. 算法的发展阶段

个性化推荐不是产品首次发布时就能带的,无论是基于用户行为的个性化,还是基于内容相似度的个性化,都建立在大量的用户数和内容的基础上。产品发布之初,一般两边的数据都有残缺,因此个性化推荐也无法开展。

所以在产品发展的初期,推荐内容一般采用更加聚合的“热度算法”,顾名思义就是把热点的内容优先推荐给用户。虽然无法做到基于兴趣和习惯为每一个用户做到精准化的推荐,但能覆盖到大部分的内容需求,而且启动成本比个性化推荐算法低太多。

因此内容型产品,推荐在发布初期用热度算法实现冷启动,积累了一定量级以后,才能逐渐开展个性化推荐算法。

2. 热度算法
2.1 热度算法基本原理

需要了解的是,热度算法也是需要不断优化去完善的,基本原理:

新闻热度分 = 初始热度分 + 用户交互产生的热度分 – 随时间衰减的热度分

Score = S0 + S(Users) – S(Time)

新闻入库后,系统为之赋予一个初始热度值,该新闻就进入了推荐列表进行排序;随着新闻不断被用户点击阅读,收藏,分享等,这些用户行为被视作帮助新闻提升热度,系统需要为每一种新闻赋予热度值;同时,新闻是有较强时效性的内容,因此新闻发布之后,热度必须随着新闻变得陈旧而衰减。

新闻的热度就在这些算法的综合作用下不断变化,推荐列表的排序也就不断变化。

2.2 初始热度不应该一致

上面的算法为每一条入库的新闻赋予了同样的热度值,但在现实使用后发现行不通,例如娱乐类别比文化类别受欢迎程度本身就高很多;或者突发了严重的灾害或事故;或是奥运会期间,体育类别的关注度突然高了起来;而此时如果还是每条新闻给同样的热度就不能贴合实际了。

解决办法就是把初始热度设置为变量:

(1)按照新闻类别给予新闻不同的初始热度,让用户关注度高的类别获得更高的初始热度分,从而获得更多的曝光,例如:

[产品经理需要了解的算法——热度算法和个性化推荐]

(2)对于重大事件的报道,如何让它入库时就有更高的热度,我们采用的是热词匹配的方式。

即对大型新闻站点的头条,Twitter热点,竞品的头条做监控和扒取,并将这批新闻的关键词维护到热词库并保持更新;每条新闻入库的时候,让新闻的关键词去匹配热词库,匹配度越高,就有越高的初始热度分。

这样处理后,重大事件发生时,Twitter和门户网站的争相报道会导致热词集中化,所有匹配到这些热词的新闻,即报道同样事件的新闻,会获得很高的初始热度分。

2.3 用户行为分规则不是固定不变的

解决了新闻入库的初始分之后,接下来是新闻热度分的变化。先要明确用户的的哪些行为会提高新闻的热度值,然后对这些行为赋予一定的得分规则。例如对于单条新闻,用户可以点击阅读(click),收藏(favor),分享(share),评论(comment)这四种行为,我们为不同的行为赋予分数,就能得到新闻的实时用户行为分为:

S(Users) = 1*click + 5*favor + 10*comment + 20*share

这里对不同行为赋予的分数为1,5,10,20,但这个值不能是一成不变的;当用户规模小的时候,各项事件都小,此时需要提高每个事件的行为分来提升用户行为的影响力;当用户规模变大时,行为分也应该慢慢降低,因此做内容运营时,应该对行为分不断调整。

当然也有偷懒的办法,那就是把用户规模考虑进去,算固定用户数的行为分,即:

S(Users) = (1*click + 5*favor + 10*comment + 20*share)/DAU * N(固定数)

这样就保证了在不同用户规模下,用户行为产生的行为分基本稳定。

2.4 热度随时间的衰减不是线性的

由于新闻的强时效性,已经发布的新闻的热度值必须随着时间流逝而衰减,并且趋势应该是衰减越来越快,直至趋近于零热度。换句话说,如果一条新闻要一直处于很靠前的位置,随着时间的推移它必须要有越来越多的用户来维持。

[产品经理需要了解的算法——热度算法和个性化推荐]

我们要求推荐给用户的新闻必须是24h以内,所以理论上讲,衰减算法必须保证在24h后新闻的热度一定会衰减到很低,如果是线性衰减,当某些新闻突然有大量用户阅读,获得很高的热度分时,可能会持续排名靠前很久,让用户觉得内容更新过慢。

参考牛顿冷却定律,时间衰减因子应该是一个类似于指数函数:

T(Time) = e ^ (k*(T1 – T0)) 

其中T0是新闻发布时间,T1是当前时间。

而由于热度的发展最终是一个无限趋近于零热度的结果,最终的新闻的热度算法也调整为:

Score = ( S0(Type) + S(Users) ) / T(Time)

2.5 其他影响因素

很多新闻产品会给用户“赞”,“踩”或“不在推荐此类”的选项,这些功能不仅适用于个性化推荐,对热度算法也有一定的作用。

新闻的推送会造成大量的打开,在计算热度的时候需要排除掉相关的影响。类似于这样的因素,都会对热度算法产生影响,因此热度算法上线后,依然需要不断地“调教”。建议把所有的调整指标做成可配项,例如初始热度分,行为事件分,衰减因子等,从而让产品和运营能实时调整和验证效果,达到最佳状态。

3. 基于内容的推荐算法

现在,你的内容产品顺利度过了早期阶段,拥有了几万甚至十几万级别的日活。这时候,你发现热度算法导致用户的阅读内容过于集中,而个性化和长尾化的内容却鲜有人看,看来是时候开展个性化推荐,让用户不仅能读到大家都喜欢的内容,也能读到只有自己感兴趣的内容。

个性化推荐一般有两种通用的解决方案,一是基于内容的相关推荐,二是基于用户的协同过滤。由于基于用户的协同过滤对用户规模有较高要求,因此更多使用基于内容的相关推荐来切入。

这里引入一个概念叫“新闻特征向量”来标识新闻的属性,以及用来对比新闻之间的相似度。我们把新闻看作是所有关键词(标签)的合集,理论上,如果两个新闻的关键词越类似,那两个新闻是相关内容的可能性更高。 新闻特征向量是由新闻包含的所有关键词决定的。得到新闻特征向量的第一步,是要对新闻内容进行到关键词级别的拆分。

3.1 分词

分词需要有两个库,即正常的词库和停用词库。正常词库类似于一本词典,是把内容拆解为词语的标准;停用词库则是在分词过程中需要首先弃掉的内容。

停用词主要是没有实际含义的,例如“The”,“That”,“are”之类的助词;表达两个词直接关系的,例如“behind”,“under”之类的介词,以及很多常用的高频但没有偏向性的动词,例如“think”“give”之类。显而易见,这些词语对于分词没有任何作用,因此在分词前,先把这些内容剔除。

剩下对的内容则使用标准词库进行拆词,拆词方法包含正向匹配拆分,逆向匹配拆分,最少切分等常用算法,这里不做展开。

因为网络世界热词频出, 标准词库和停用词库也需要不断更新和维护,例如“蓝瘦香菇”,“套路满满”之类的词语,可能对最终的效果会产生影响,如果不及时更新到词库里,算法就会“一脸懵逼”了。

因此,推荐在网上查找或购买那些能随时更新的词库,各种语种都有。

3.2 关键词指标

前面已经说过,新闻特征向量是该新闻的关键词合集,那关键词的重合度就是非常重要的衡量指标了。

那么问题来了,如果两条新闻的关键词重合度达到80%,是否说明两条新闻有80%的相关性呢?

其实不是,举个例子:

(1)一条“广州摩拜单车投放量激增”的新闻,主要讲摩拜单车的投放情况,这篇新闻里“摩拜单车”是一个非常高频的词汇,新闻在结尾有一句“最近广州天气不错,大家可以骑单车出去散心”。因此“广州天气”这个关键词也被收录进了特征向量。

(2)另外一条新闻“广州回南天即将结束,天气持续好转”,这篇新闻结尾有一句“天气好转,大家可以骑个摩拜单车出门溜溜啦”,新闻里面“广州天气”是非常高频的词汇,“摩拜单车”尽管被收录,但只出现了一次。

这两个新闻的关键词虽然类似,讲的却是完全不同的内容,相关性很弱。如果只是看关键词重合度,出现错误判断的可能性就很高;所以特征向量还需要有第二个关键词的指标,叫新闻内频率,称之为TF(Term Frequency),衡量每个关键词在新闻里面是否高频。

那么问题来了,如果两条新闻的关键词重合度高,新闻中关键词的频率也相差无几,是否说明相关性很强呢?

理论上是的,但又存在另外一种情况:如果我们新闻库里所有的新闻都是讲广州的,广州天气,广州交通,广州经济,广州体育等,他们都是讲广州相关的情况,关键词都包含广州,天河,越秀,海珠(广州各区)等,并且有着类似的频率,因此算法很容易将它们判断为强相关新闻;从地域角度讲,这种相关性确实很强,但从内容类别层面,其实没有太多相关性,如果我是一个体育迷,你给我推荐天气,交通之类的内容,就没多大意义了。

因此引入第三个关键词的指标,即关键词在在所有文档中出现的频率的相反值,称之为IDF(Inverse Document Frequency)。为什么会是相反值?因为一个关键词在某条新闻出现的频率最大,在所有文档中出现的频率越小,该关键词对这条新闻的特征标识作用越大。

这样每个关键词对新闻的作用就能被衡量出来即TFIDF=TF * IDF,这也就是著名的TF-IDF模型。

3.3 相关性算法

做完分词和关键词指标后,每一篇新闻的特征就能用关键词的集合来标识了:

[产品经理需要了解的算法——热度算法和个性化推荐]

其中word0,1,2……n是新闻的所有关键词,tfidf0,1,2……n则是每个关键词的tfidf值。

两个新闻的相似度就能通过重合的关键词的tfidf值来衡量了。根据之前所学的知识,几何中夹角余弦可以用来衡量两个向量的方向的差异性,因此在我们的算法中使用夹角余弦来计算新闻关键词的相似度。夹角越小,相似度越高。

有了关键词和各关键词的tfidf之后,就可以计算新闻的相似度了。假设两条新闻的特征列表如下:

[产品经理需要了解的算法——热度算法和个性化推荐]

可以看到两条新闻有5个重合的关键词:广州,摩拜单车,太阳,天河和市长,因此两条新闻的相关性由这5个关键词决定,计算方式如下:

[产品经理需要了解的算法——热度算法和个性化推荐]

得出两条新闻的相关性最终值;用同样的方法能得出一条新闻与新闻库里面所有内容的相关性。

3.4 用户特征

得到新闻特征以后,还需要得到用户特征才能对两者进行匹配和推荐,那怎么获得用户特征呢?

需要通过用户的行为来获得,用户通过阅读,点赞,评论,分享来表达自己对新闻内容的喜爱;跟热度排名类似,我们对用户的各种行为赋予一定的“喜爱分”,例如阅读1分,点赞2分,评论5分等,这样新闻特征跟用户行为结合后,就能得到用户的特征分。

[产品经理需要了解的算法——热度算法和个性化推荐]

而随着用户阅读的新闻数越来越多,该用户的标签也越来越多,并且越发精准。

从而当我们拿到新闻的特征后,就能与用户的关键词列表做匹配,得出新闻与用户阅读特征的匹配度,做出个性化推荐。

3.5 其他运用

除了个性化推荐,基于内容的相关性算法能精准地给出一篇新闻的相关推荐列表,对相关阅读的实现非常有意义。此外,标签系统对新闻分类的实现和提升准确性,也有重要的意义。

3.6 优缺点

基于内容的推荐算法有几个明显优点:

对用户数量没有要求,无论日活几千或是几百万,均可以采用;因此个性化推荐早期一般采用这种方式;

每个用户的特征都是由自己的行为来决定的,是独立存在的,不会有互相干扰,因此恶意刷阅读等新闻不会影响到推荐算法。

而最主要的缺点就是确定性太强了,所有推荐的内容都是由用户的阅读历史决定,所以没办法挖掘用户的潜在兴趣;也就是由于这一点,基于内容的推荐一般与其他推荐算法同时存在。

4. 基于用户的协同推荐

终于,经过团队的努力,你的产品已经有了大量活跃用户了,这时候你开始不满足于现有的算法。虽然基于内容的推荐已经很精准了,但总是少了那么一点性感。因为你所有给用户的内容都是基于他们的阅读习惯推荐的,没能给用户“不期而遇”的感觉。

于是,你就开始做基于用户的协同过滤了。

基于用户的协同过滤推荐算法,简单来讲就是依据用户A的阅读喜好,为A找到与他兴趣最接近的群体,所谓“人以群分”,然后把这个群体里其他人喜欢的,但是A没有阅读过的内容推荐给A;举例我是一个足球迷,系统找到与我类似的用户都是足球的重度阅读者,但与此同时,这些“足球群体”中有一部分人有看NBA新闻的习惯,系统就可能会给我推荐NBA内容,很可能我也对NBA也感兴趣,这样我在后台的兴趣图谱就更完善了。

4.1 用户群体划分

做基于用户的协同过滤,首先就要做用户的划分,可以从三方面着手:

(1)外部数据的借用

这里使用社交平台数据的居多,现在产品的登录体系一般都借用第三方社媒的登录体系,如国外的Facebook、Twitter,国内的微信、微博,借用第三方账户的好处多多,例如降低门槛,方便传播等,还能对个性化推荐起到重要作用。因为第三方账户都是授权获取部分用户信息的,往往包括性别,年龄,工作甚至社交关系等,这些信息对用户群划分很有意义。

此外还有其他的一些数据也能借用,例如IP地址,手机语种等。

使用这些数据,你很容易就能得到一个用户是北京的还是上海的,是大学生还是创业者,并依据这些属性做准确的大类划分。比如一篇行业投资分析出来后,“上海创业圈”这个群体80%的用户都看过,那就可以推荐给剩下的20%。

(2)产品内主动询问

常见在产品首次启动的时候,弹框询问用户是男是女,职业等,这样能对内容推荐的冷启动提供一些帮助。但总体来说,性价比偏低,只能询问两三个问题并对用户的推荐内容做非常粗略的划分,同时要避免打扰到用户;这种做法算是基于用户个性化的雏形。

(3)对比用户特征

前文已经提到过,新闻的特征加用户的阅读数据能得到用户的特征,那就可以通过用户特征的相似性来划分群体。

4.2 内容推荐实施

我们结合一个很小的实例来了解用户协同过滤的原理,包括如何计算用户之间的相似性和如何做出推荐。假设有A、B、C、D和E共5个用户,他们各自阅读了几篇新闻并做出了阅读,赞,收藏,评论,分享操作,我们对这几种行为赋予的分数分别为1分、2分、3分、4分和5分,这样用户对每条新闻都有自己的得分,其中“-”表示未阅读,得分如下:

[产品经理需要了解的算法——热度算法和个性化推荐]

接下来,我们需要给用户E推荐4,5,6中的哪一篇?

用户的阅读特征向量由用户所有的阅读数据决定,我们以用户E阅读过的新闻数据作为参考标准,来找到与E最相似的用户。

[产品经理需要了解的算法——热度算法和个性化推荐]

多维向量的距离需要通过欧几里得距离公式来计算,数值越小,向量距离约接近。

[产品经理需要了解的算法——热度算法和个性化推荐]

算出结果:

distance(E,A)=4.123 (用户A没有阅读news2,因此news2的数据不能用来计算与用户E的相似度,这里取1,3)

distance(E,B)=3.162

distance(E,C)=3.742

distance(E,D)=1.414

因此得出结果:用户D是与用户E阅读喜好最接近的那个,应该优先归为同一类用户。最终结论根据用户D的阅读数据,优先推荐news4。

4.3 内容选取

我们通过阅读特征向量把用户做群体划分后,接下来就是如何获取新闻推荐的优先级。上面的例子里面只需要选出一个相似用户,并且用户A,B,C,D都只阅读news4,5,6中的一条,所以比较简单,但现实情况中,同一个用户群体阅读的新闻多且随机,用户交互更是错综复杂,如何得出推荐新闻的优先级呢?

假设用户X在系统归属于群体A,这个群体有n个用户,分别为A0,A1,A2……An,这些用户的集合用S(X,n)表示。

首先,我们需要把集合中所有用户交互过(阅读,评论等)的新闻提取出来;

需要剔除掉用户X已经看过的新闻,这些就不用再推荐了,剩下的新闻集合有m条,用N(X,m)来表示;

对余下的新闻进行评分和相似度加权的计算,计算包括两部分,一是用户X与S(X,n) 每一个用户的相似性,二是每个用户对新闻集N(X,m)中每条新闻的喜好,这样就能得到每条新闻相对于用户X的最终得分;

将N(X,m)中的新闻列表按照得分高低的顺序推荐给用户。

4.4 优缺点

相比于基于内容的推荐算法,基于用户的协同过滤同样优缺点明显。

优点主要在于对分词等算法的精确度无太大要求,推荐都是基于用户的行为数据去不断学习和完善;同时能发现用户的潜在阅读兴趣,能“制造惊喜”。

而缺点则是启动的门槛高,用户量不够时几乎无法开展;并且学习量不够时推荐结果较差。

5. 总结

关于个性化推荐的算法,在网上有很多资料,也有很多其他的实现方法,因为笔者了解也有限,所以也不敢描述。如有兴趣可以自行搜索。热度和个性化推荐算法,作为大部分内容型产品的核心卖点之一,依然在不断地进化和完善中。没有哪种算法是完美的,甚至没有哪种算法是一定优于其他的,在实际使用中,很多产品都是多算法结合去做好内容推荐。

而产品经理在算法的实施中,绝对不是一句“我们要做个性化推荐”就完事的,必须深入算法内部,对算法的原理做深入了解,然后结合自己的产品特征来部署和优化。

因此我站在产品经理的角度,整理了这一篇初步的算法相关的介绍,如有对文中内容感兴趣的,欢迎探讨!如有描述不当之初,敬请指正,感激不尽!

最后,需要对我的团队表示感谢,飞哥在算法的研究中打了头阵并给出了细致的分享,宗荣对算法进行了无数轮的调整和优化,凯华在关键词的部署和效果验证中付出了很多心血……喜欢那些日子里大家一起从零开始学习和实现算法,让推荐效果越来越好。

原文:http://36kr.com/p/5084292.html
作者:卢争超,前UC,腾讯海外产品经理,负责UC Browser,微信支付等产品的国际化,现创业中。多年产品策划运营和管理经验,在工具,支付,内容,企业服务型产品的策划和运营领域经验丰富。 查看全部


[产品经理需要了解的算法——热度算法和个性化推荐]人人都是产品经理是中国最大最活跃的产品经理学习、交流、分享社区。集媒体、社区、招聘 、教育、社群活动为一体,全方位服务产品经理。本文由人人都是产品经理社区作者@卢争超  原创发布。转载请联系人人都是产品经理。 

今日头条的走红带动了“个性化推荐”的概念,自此之后,内容型的产品,个性化算法就逐渐从卖点变为标配。伴随着“机器学习”,“大数据”之类的热词和概念,产品的档次瞬间提高了很多。而各种推荐算法绝不仅仅是研发自己的任务,作为产品经理,必须深入到算法内部,参与算法的设计,以及结合内容对算法不断“调教”,才能让产品的推荐算法不断完善,最终与自己的内容双剑合璧。

本文以新闻产品为例,结合了我之前产品从零积累用户的经验,整理了作为PM需要了解的基本算法知识和实操。

1. 算法的发展阶段

个性化推荐不是产品首次发布时就能带的,无论是基于用户行为的个性化,还是基于内容相似度的个性化,都建立在大量的用户数和内容的基础上。产品发布之初,一般两边的数据都有残缺,因此个性化推荐也无法开展。

所以在产品发展的初期,推荐内容一般采用更加聚合的“热度算法”,顾名思义就是把热点的内容优先推荐给用户。虽然无法做到基于兴趣和习惯为每一个用户做到精准化的推荐,但能覆盖到大部分的内容需求,而且启动成本比个性化推荐算法低太多。

因此内容型产品,推荐在发布初期用热度算法实现冷启动,积累了一定量级以后,才能逐渐开展个性化推荐算法。

2. 热度算法
2.1 热度算法基本原理

需要了解的是,热度算法也是需要不断优化去完善的,基本原理:

新闻热度分 = 初始热度分 + 用户交互产生的热度分 – 随时间衰减的热度分

Score = S0 + S(Users) – S(Time)

新闻入库后,系统为之赋予一个初始热度值,该新闻就进入了推荐列表进行排序;随着新闻不断被用户点击阅读,收藏,分享等,这些用户行为被视作帮助新闻提升热度,系统需要为每一种新闻赋予热度值;同时,新闻是有较强时效性的内容,因此新闻发布之后,热度必须随着新闻变得陈旧而衰减。

新闻的热度就在这些算法的综合作用下不断变化,推荐列表的排序也就不断变化。

2.2 初始热度不应该一致

上面的算法为每一条入库的新闻赋予了同样的热度值,但在现实使用后发现行不通,例如娱乐类别比文化类别受欢迎程度本身就高很多;或者突发了严重的灾害或事故;或是奥运会期间,体育类别的关注度突然高了起来;而此时如果还是每条新闻给同样的热度就不能贴合实际了。

解决办法就是把初始热度设置为变量:

(1)按照新闻类别给予新闻不同的初始热度,让用户关注度高的类别获得更高的初始热度分,从而获得更多的曝光,例如:

[产品经理需要了解的算法——热度算法和个性化推荐]

(2)对于重大事件的报道,如何让它入库时就有更高的热度,我们采用的是热词匹配的方式。

即对大型新闻站点的头条,Twitter热点,竞品的头条做监控和扒取,并将这批新闻的关键词维护到热词库并保持更新;每条新闻入库的时候,让新闻的关键词去匹配热词库,匹配度越高,就有越高的初始热度分。

这样处理后,重大事件发生时,Twitter和门户网站的争相报道会导致热词集中化,所有匹配到这些热词的新闻,即报道同样事件的新闻,会获得很高的初始热度分。

2.3 用户行为分规则不是固定不变的

解决了新闻入库的初始分之后,接下来是新闻热度分的变化。先要明确用户的的哪些行为会提高新闻的热度值,然后对这些行为赋予一定的得分规则。例如对于单条新闻,用户可以点击阅读(click),收藏(favor),分享(share),评论(comment)这四种行为,我们为不同的行为赋予分数,就能得到新闻的实时用户行为分为:

S(Users) = 1*click + 5*favor + 10*comment + 20*share

这里对不同行为赋予的分数为1,5,10,20,但这个值不能是一成不变的;当用户规模小的时候,各项事件都小,此时需要提高每个事件的行为分来提升用户行为的影响力;当用户规模变大时,行为分也应该慢慢降低,因此做内容运营时,应该对行为分不断调整。

当然也有偷懒的办法,那就是把用户规模考虑进去,算固定用户数的行为分,即:

S(Users) = (1*click + 5*favor + 10*comment + 20*share)/DAU * N(固定数)

这样就保证了在不同用户规模下,用户行为产生的行为分基本稳定。

2.4 热度随时间的衰减不是线性的

由于新闻的强时效性,已经发布的新闻的热度值必须随着时间流逝而衰减,并且趋势应该是衰减越来越快,直至趋近于零热度。换句话说,如果一条新闻要一直处于很靠前的位置,随着时间的推移它必须要有越来越多的用户来维持。

[产品经理需要了解的算法——热度算法和个性化推荐]

我们要求推荐给用户的新闻必须是24h以内,所以理论上讲,衰减算法必须保证在24h后新闻的热度一定会衰减到很低,如果是线性衰减,当某些新闻突然有大量用户阅读,获得很高的热度分时,可能会持续排名靠前很久,让用户觉得内容更新过慢。

参考牛顿冷却定律,时间衰减因子应该是一个类似于指数函数:

T(Time) = e ^ (k*(T1 – T0)) 

其中T0是新闻发布时间,T1是当前时间。

而由于热度的发展最终是一个无限趋近于零热度的结果,最终的新闻的热度算法也调整为:

Score = ( S0(Type) + S(Users) ) / T(Time)

2.5 其他影响因素

很多新闻产品会给用户“赞”,“踩”或“不在推荐此类”的选项,这些功能不仅适用于个性化推荐,对热度算法也有一定的作用。

新闻的推送会造成大量的打开,在计算热度的时候需要排除掉相关的影响。类似于这样的因素,都会对热度算法产生影响,因此热度算法上线后,依然需要不断地“调教”。建议把所有的调整指标做成可配项,例如初始热度分,行为事件分,衰减因子等,从而让产品和运营能实时调整和验证效果,达到最佳状态。

3. 基于内容的推荐算法

现在,你的内容产品顺利度过了早期阶段,拥有了几万甚至十几万级别的日活。这时候,你发现热度算法导致用户的阅读内容过于集中,而个性化和长尾化的内容却鲜有人看,看来是时候开展个性化推荐,让用户不仅能读到大家都喜欢的内容,也能读到只有自己感兴趣的内容。

个性化推荐一般有两种通用的解决方案,一是基于内容的相关推荐,二是基于用户的协同过滤。由于基于用户的协同过滤对用户规模有较高要求,因此更多使用基于内容的相关推荐来切入。

这里引入一个概念叫“新闻特征向量”来标识新闻的属性,以及用来对比新闻之间的相似度。我们把新闻看作是所有关键词(标签)的合集,理论上,如果两个新闻的关键词越类似,那两个新闻是相关内容的可能性更高。 新闻特征向量是由新闻包含的所有关键词决定的。得到新闻特征向量的第一步,是要对新闻内容进行到关键词级别的拆分。

3.1 分词

分词需要有两个库,即正常的词库和停用词库。正常词库类似于一本词典,是把内容拆解为词语的标准;停用词库则是在分词过程中需要首先弃掉的内容。

停用词主要是没有实际含义的,例如“The”,“That”,“are”之类的助词;表达两个词直接关系的,例如“behind”,“under”之类的介词,以及很多常用的高频但没有偏向性的动词,例如“think”“give”之类。显而易见,这些词语对于分词没有任何作用,因此在分词前,先把这些内容剔除。

剩下对的内容则使用标准词库进行拆词,拆词方法包含正向匹配拆分,逆向匹配拆分,最少切分等常用算法,这里不做展开。

因为网络世界热词频出, 标准词库和停用词库也需要不断更新和维护,例如“蓝瘦香菇”,“套路满满”之类的词语,可能对最终的效果会产生影响,如果不及时更新到词库里,算法就会“一脸懵逼”了。

因此,推荐在网上查找或购买那些能随时更新的词库,各种语种都有。

3.2 关键词指标

前面已经说过,新闻特征向量是该新闻的关键词合集,那关键词的重合度就是非常重要的衡量指标了。

那么问题来了,如果两条新闻的关键词重合度达到80%,是否说明两条新闻有80%的相关性呢?

其实不是,举个例子:

(1)一条“广州摩拜单车投放量激增”的新闻,主要讲摩拜单车的投放情况,这篇新闻里“摩拜单车”是一个非常高频的词汇,新闻在结尾有一句“最近广州天气不错,大家可以骑单车出去散心”。因此“广州天气”这个关键词也被收录进了特征向量。

(2)另外一条新闻“广州回南天即将结束,天气持续好转”,这篇新闻结尾有一句“天气好转,大家可以骑个摩拜单车出门溜溜啦”,新闻里面“广州天气”是非常高频的词汇,“摩拜单车”尽管被收录,但只出现了一次。

这两个新闻的关键词虽然类似,讲的却是完全不同的内容,相关性很弱。如果只是看关键词重合度,出现错误判断的可能性就很高;所以特征向量还需要有第二个关键词的指标,叫新闻内频率,称之为TF(Term Frequency),衡量每个关键词在新闻里面是否高频。

那么问题来了,如果两条新闻的关键词重合度高,新闻中关键词的频率也相差无几,是否说明相关性很强呢?

理论上是的,但又存在另外一种情况:如果我们新闻库里所有的新闻都是讲广州的,广州天气,广州交通,广州经济,广州体育等,他们都是讲广州相关的情况,关键词都包含广州,天河,越秀,海珠(广州各区)等,并且有着类似的频率,因此算法很容易将它们判断为强相关新闻;从地域角度讲,这种相关性确实很强,但从内容类别层面,其实没有太多相关性,如果我是一个体育迷,你给我推荐天气,交通之类的内容,就没多大意义了。

因此引入第三个关键词的指标,即关键词在在所有文档中出现的频率的相反值,称之为IDF(Inverse Document Frequency)。为什么会是相反值?因为一个关键词在某条新闻出现的频率最大,在所有文档中出现的频率越小,该关键词对这条新闻的特征标识作用越大。

这样每个关键词对新闻的作用就能被衡量出来即TFIDF=TF * IDF,这也就是著名的TF-IDF模型。

3.3 相关性算法

做完分词和关键词指标后,每一篇新闻的特征就能用关键词的集合来标识了:

[产品经理需要了解的算法——热度算法和个性化推荐]

其中word0,1,2……n是新闻的所有关键词,tfidf0,1,2……n则是每个关键词的tfidf值。

两个新闻的相似度就能通过重合的关键词的tfidf值来衡量了。根据之前所学的知识,几何中夹角余弦可以用来衡量两个向量的方向的差异性,因此在我们的算法中使用夹角余弦来计算新闻关键词的相似度。夹角越小,相似度越高。

有了关键词和各关键词的tfidf之后,就可以计算新闻的相似度了。假设两条新闻的特征列表如下:

[产品经理需要了解的算法——热度算法和个性化推荐]

可以看到两条新闻有5个重合的关键词:广州,摩拜单车,太阳,天河和市长,因此两条新闻的相关性由这5个关键词决定,计算方式如下:

[产品经理需要了解的算法——热度算法和个性化推荐]

得出两条新闻的相关性最终值;用同样的方法能得出一条新闻与新闻库里面所有内容的相关性。

3.4 用户特征

得到新闻特征以后,还需要得到用户特征才能对两者进行匹配和推荐,那怎么获得用户特征呢?

需要通过用户的行为来获得,用户通过阅读,点赞,评论,分享来表达自己对新闻内容的喜爱;跟热度排名类似,我们对用户的各种行为赋予一定的“喜爱分”,例如阅读1分,点赞2分,评论5分等,这样新闻特征跟用户行为结合后,就能得到用户的特征分。

[产品经理需要了解的算法——热度算法和个性化推荐]

而随着用户阅读的新闻数越来越多,该用户的标签也越来越多,并且越发精准。

从而当我们拿到新闻的特征后,就能与用户的关键词列表做匹配,得出新闻与用户阅读特征的匹配度,做出个性化推荐。

3.5 其他运用

除了个性化推荐,基于内容的相关性算法能精准地给出一篇新闻的相关推荐列表,对相关阅读的实现非常有意义。此外,标签系统对新闻分类的实现和提升准确性,也有重要的意义。

3.6 优缺点

基于内容的推荐算法有几个明显优点:

对用户数量没有要求,无论日活几千或是几百万,均可以采用;因此个性化推荐早期一般采用这种方式;

每个用户的特征都是由自己的行为来决定的,是独立存在的,不会有互相干扰,因此恶意刷阅读等新闻不会影响到推荐算法。

而最主要的缺点就是确定性太强了,所有推荐的内容都是由用户的阅读历史决定,所以没办法挖掘用户的潜在兴趣;也就是由于这一点,基于内容的推荐一般与其他推荐算法同时存在。

4. 基于用户的协同推荐

终于,经过团队的努力,你的产品已经有了大量活跃用户了,这时候你开始不满足于现有的算法。虽然基于内容的推荐已经很精准了,但总是少了那么一点性感。因为你所有给用户的内容都是基于他们的阅读习惯推荐的,没能给用户“不期而遇”的感觉。

于是,你就开始做基于用户的协同过滤了。

基于用户的协同过滤推荐算法,简单来讲就是依据用户A的阅读喜好,为A找到与他兴趣最接近的群体,所谓“人以群分”,然后把这个群体里其他人喜欢的,但是A没有阅读过的内容推荐给A;举例我是一个足球迷,系统找到与我类似的用户都是足球的重度阅读者,但与此同时,这些“足球群体”中有一部分人有看NBA新闻的习惯,系统就可能会给我推荐NBA内容,很可能我也对NBA也感兴趣,这样我在后台的兴趣图谱就更完善了。

4.1 用户群体划分

做基于用户的协同过滤,首先就要做用户的划分,可以从三方面着手:

(1)外部数据的借用

这里使用社交平台数据的居多,现在产品的登录体系一般都借用第三方社媒的登录体系,如国外的Facebook、Twitter,国内的微信、微博,借用第三方账户的好处多多,例如降低门槛,方便传播等,还能对个性化推荐起到重要作用。因为第三方账户都是授权获取部分用户信息的,往往包括性别,年龄,工作甚至社交关系等,这些信息对用户群划分很有意义。

此外还有其他的一些数据也能借用,例如IP地址,手机语种等。

使用这些数据,你很容易就能得到一个用户是北京的还是上海的,是大学生还是创业者,并依据这些属性做准确的大类划分。比如一篇行业投资分析出来后,“上海创业圈”这个群体80%的用户都看过,那就可以推荐给剩下的20%。

(2)产品内主动询问

常见在产品首次启动的时候,弹框询问用户是男是女,职业等,这样能对内容推荐的冷启动提供一些帮助。但总体来说,性价比偏低,只能询问两三个问题并对用户的推荐内容做非常粗略的划分,同时要避免打扰到用户;这种做法算是基于用户个性化的雏形。

(3)对比用户特征

前文已经提到过,新闻的特征加用户的阅读数据能得到用户的特征,那就可以通过用户特征的相似性来划分群体。

4.2 内容推荐实施

我们结合一个很小的实例来了解用户协同过滤的原理,包括如何计算用户之间的相似性和如何做出推荐。假设有A、B、C、D和E共5个用户,他们各自阅读了几篇新闻并做出了阅读,赞,收藏,评论,分享操作,我们对这几种行为赋予的分数分别为1分、2分、3分、4分和5分,这样用户对每条新闻都有自己的得分,其中“-”表示未阅读,得分如下:

[产品经理需要了解的算法——热度算法和个性化推荐]

接下来,我们需要给用户E推荐4,5,6中的哪一篇?

用户的阅读特征向量由用户所有的阅读数据决定,我们以用户E阅读过的新闻数据作为参考标准,来找到与E最相似的用户。

[产品经理需要了解的算法——热度算法和个性化推荐]

多维向量的距离需要通过欧几里得距离公式来计算,数值越小,向量距离约接近。

[产品经理需要了解的算法——热度算法和个性化推荐]

算出结果:

distance(E,A)=4.123 (用户A没有阅读news2,因此news2的数据不能用来计算与用户E的相似度,这里取1,3)

distance(E,B)=3.162

distance(E,C)=3.742

distance(E,D)=1.414

因此得出结果:用户D是与用户E阅读喜好最接近的那个,应该优先归为同一类用户。最终结论根据用户D的阅读数据,优先推荐news4。

4.3 内容选取

我们通过阅读特征向量把用户做群体划分后,接下来就是如何获取新闻推荐的优先级。上面的例子里面只需要选出一个相似用户,并且用户A,B,C,D都只阅读news4,5,6中的一条,所以比较简单,但现实情况中,同一个用户群体阅读的新闻多且随机,用户交互更是错综复杂,如何得出推荐新闻的优先级呢?

假设用户X在系统归属于群体A,这个群体有n个用户,分别为A0,A1,A2……An,这些用户的集合用S(X,n)表示。

首先,我们需要把集合中所有用户交互过(阅读,评论等)的新闻提取出来;

需要剔除掉用户X已经看过的新闻,这些就不用再推荐了,剩下的新闻集合有m条,用N(X,m)来表示;

对余下的新闻进行评分和相似度加权的计算,计算包括两部分,一是用户X与S(X,n) 每一个用户的相似性,二是每个用户对新闻集N(X,m)中每条新闻的喜好,这样就能得到每条新闻相对于用户X的最终得分;

将N(X,m)中的新闻列表按照得分高低的顺序推荐给用户。

4.4 优缺点

相比于基于内容的推荐算法,基于用户的协同过滤同样优缺点明显。

优点主要在于对分词等算法的精确度无太大要求,推荐都是基于用户的行为数据去不断学习和完善;同时能发现用户的潜在阅读兴趣,能“制造惊喜”。

而缺点则是启动的门槛高,用户量不够时几乎无法开展;并且学习量不够时推荐结果较差。

5. 总结

关于个性化推荐的算法,在网上有很多资料,也有很多其他的实现方法,因为笔者了解也有限,所以也不敢描述。如有兴趣可以自行搜索。热度和个性化推荐算法,作为大部分内容型产品的核心卖点之一,依然在不断地进化和完善中。没有哪种算法是完美的,甚至没有哪种算法是一定优于其他的,在实际使用中,很多产品都是多算法结合去做好内容推荐。

而产品经理在算法的实施中,绝对不是一句“我们要做个性化推荐”就完事的,必须深入算法内部,对算法的原理做深入了解,然后结合自己的产品特征来部署和优化。

因此我站在产品经理的角度,整理了这一篇初步的算法相关的介绍,如有对文中内容感兴趣的,欢迎探讨!如有描述不当之初,敬请指正,感激不尽!

最后,需要对我的团队表示感谢,飞哥在算法的研究中打了头阵并给出了细致的分享,宗荣对算法进行了无数轮的调整和优化,凯华在关键词的部署和效果验证中付出了很多心血……喜欢那些日子里大家一起从零开始学习和实现算法,让推荐效果越来越好。

原文:http://36kr.com/p/5084292.html
作者:卢争超,前UC,腾讯海外产品经理,负责UC Browser,微信支付等产品的国际化,现创业中。多年产品策划运营和管理经验,在工具,支付,内容,企业服务型产品的策划和运营领域经验丰富。

发现一款可以直接在iOS设备上录屏的App Vidyo!

分享Slax 发表了文章 • 0 个评论 • 822 次浏览 • 2016-01-07 10:48 • 来自相关话题

介绍:
Vidyo is the ultimate solution to capturing your screen, device audio or in fact any capture input available on your device (eg. camera, mic).

Vidyo captures your entire screen, and/or ALL audio on your device, and even allows you to add commentary and finalise your video all on your device - no computer required. Ideal for uploading directly to video sites such as YouTube.

Vidyo lets you take videos from the camera, record sound from your microphone, or use video or voice already on your device; and then trim, combine/mix and edit these into one final file.

- Capture your device screen no matter which app you are in.
- Capture your device audio (anything that comes out of the speakers) in full original quality.
- Capture from the Microphone, Camera or any other available media input on your device.
- Add background music or commentary to existing videos with full control of mixing volumes.
- Capture new videos and trim them before uploading to online media sites. (on board camera and any other connected and compatible video source)
- Unique new trim control to help you trim audio files with precision.
- Record and manage all your media files from one place.
 
一句话总结就是在手机上录屏幕视频,不需要依赖电脑!
 
Appstore链接:https://itunes.apple.com/us/ap ... 253D4 查看全部
介绍:
Vidyo is the ultimate solution to capturing your screen, device audio or in fact any capture input available on your device (eg. camera, mic).

Vidyo captures your entire screen, and/or ALL audio on your device, and even allows you to add commentary and finalise your video all on your device - no computer required. Ideal for uploading directly to video sites such as YouTube.

Vidyo lets you take videos from the camera, record sound from your microphone, or use video or voice already on your device; and then trim, combine/mix and edit these into one final file.

- Capture your device screen no matter which app you are in.
- Capture your device audio (anything that comes out of the speakers) in full original quality.
- Capture from the Microphone, Camera or any other available media input on your device.
- Add background music or commentary to existing videos with full control of mixing volumes.
- Capture new videos and trim them before uploading to online media sites. (on board camera and any other connected and compatible video source)
- Unique new trim control to help you trim audio files with precision.
- Record and manage all your media files from one place.
 
一句话总结就是在手机上录屏幕视频,不需要依赖电脑!
 
Appstore链接:https://itunes.apple.com/us/ap ... 253D4

告诉开发哥哥,我要的就是酱紫的~

分享visai 发表了文章 • 0 个评论 • 566 次浏览 • 2015-12-02 23:01 • 来自相关话题

很多时候,在快速迭代过程中,作为产品汪,不可能有那么多的时间去完成一个高保真交互效果,而且有的比较酷炫的交互效果话很多时间做出来演示给开发哥哥们看,自己花了很大力气,他们不一定能做出来,所以这个时候往往会因为一句话太复杂,技术实现不了,这个时候产品汪通常是比较难过的,尤其是哪些不懂技术的更是无能为力。很多时候你跟开发描述一个抽象的酷炫效果,巴拉巴拉半天,他冒一句你找给相似效果给我看看,于是产品汪下载各种app去找自己想要的效果,然后跑过去给开发哥哥说,我要的就是酱紫的,然后得到的回复,哦,那我研究研究,是不是累觉不爱,在这里推荐一个交互效果预览网站,其实很多开发都是在这儿搞的,只是一般没告诉产品汪罢了!
各类app交互效果预览网址:http://code4app.com/category
慢慢去找吧,一般你想要的一些效果都可以找到,然后拿给开发哥哥看就行了,我要的就是酱紫的~~
  查看全部

很多时候,在快速迭代过程中,作为产品汪,不可能有那么多的时间去完成一个高保真交互效果,而且有的比较酷炫的交互效果话很多时间做出来演示给开发哥哥们看,自己花了很大力气,他们不一定能做出来,所以这个时候往往会因为一句话太复杂,技术实现不了,这个时候产品汪通常是比较难过的,尤其是哪些不懂技术的更是无能为力。很多时候你跟开发描述一个抽象的酷炫效果,巴拉巴拉半天,他冒一句你找给相似效果给我看看,于是产品汪下载各种app去找自己想要的效果,然后跑过去给开发哥哥说,我要的就是酱紫的,然后得到的回复,哦,那我研究研究,是不是累觉不爱,在这里推荐一个交互效果预览网站,其实很多开发都是在这儿搞的,只是一般没告诉产品汪罢了!
各类app交互效果预览网址:http://code4app.com/category
慢慢去找吧,一般你想要的一些效果都可以找到,然后拿给开发哥哥看就行了,我要的就是酱紫的~~
 

进入壁垒:市场不是你想进,想进就能进

分享Slax 发表了文章 • 0 个评论 • 460 次浏览 • 2015-11-25 10:25 • 来自相关话题

概念

进入壁垒 (Barriers to entry) 指产业内在位企业对于潜在进入企业和新进企业所具有的某种优势的程度。进入壁垒可以理解为打算进入某一产业的企业而非已有企业所必须承担的一种额外的生产成本。进入壁垒的高低,既反映了市场内已有企业优势的大小,也反映了新进入企业所遇障碍的大小。进入壁垒的高低是影响该行业市场垄断和竞争关系的一个重要因素,也是对市场结构的直接反映。

进入壁垒的形成原因和案例

规模经济

在一定的产量范围内,随着产量的增加,平均成本不断降低;因此新进入者在成本上处于劣势,面临较高的进入壁垒。

规模经济在价值链的各个环节均可能出现:

采购:大规模企业占据较高市场份额,与上游供应商有较强的议价能力,从而压低采购成本。例:沃尔玛超市压低食品杂货的采购价格,小超市在价格上无法与沃尔玛竞争。
生产:在一定产量范围内,机器设备等固定成本变化不大,新增的产品可以分担更多的固定成本,从而使平均成本下降。
销售:大规模企业占据较高市场份额,与下游企业有较强的议价能力,从而提升销售价格。例:英特尔提高其向下游厂商销售芯片组的价格。

绝对成本优势

在位企业的绝对成本优势可能源于以下因素:

通过专利或技术控制最新的生产工艺:医药企业。
控制产品的销售渠道。例:加多宝充分渗透了餐饮、大型商超、批发、小店和特殊渠道(学校、车站、宾馆、KTV)等凉茶饮料的全部可能销售渠道并建立长期合作关系,现有的零售商不会轻易转向其他品牌。加多宝对销售渠道的控制给凉茶的潜在进入者造成了较高的壁垒。
控制上游投入品的供应渠道。例:Priceline, 携程去哪儿对机票、酒店供应渠道的控制。
拥有具有特殊经营能力和其他技术专长的人才。

转换成本:更换供应商所需要的投资越大,消费者对于现有供应商的商品的价格敏感性越低,越不愿意更换供应商,从而给新进者造成壁垒。例:

苹果手机用户转向使用非苹果手机的成本很高——储存在苹果账户上的通讯录、App 数据和照片都无法直接导入新手机。因此苹果用户即使支付较高的价格,也不愿意换其他品牌的手机。
航空公司一般不愿意更换飞机供应商。如果将波音换为空客或其他品牌,那么重新培训机械师、投资购置新的备用部件等会增加很多成本。

产品差异化:指产业内相互竞争的厂商所生产的产品之间替代程度的不完全性。在位企业在长期经营过程中在产品品质、定价和销售服务等方面树立了良好声誉,增加了消费者对该企业产品的忠诚度,使得新进入企业在销售成本上处于劣势。

网络外部性:产品价值随着购买这种产品及其兼容产品的消费者的数量增加而不断增加。

例:社交软件、操作系统、交易平台。

必要资本量:指企业进入某一产业时最低限度的资本数量。必要资本量越大,筹措越困难,壁垒就越高。

例:金融行业。

政策法律制度

例:电信行业、金融行业。

投资启示

Peter Thiel 在《从零到一》中提到,互联网企业的利润之所以远远高于传统企业,一个重要原因在于他们建立了垄断地位,进而获取垄断利润。Google, Facebook, PayPal, Palantir 均是在各自领域具有一定垄断地位的企业。进入壁垒是企业垄断力量的重要组成部分。以上对进入壁垒形成原因的梳理为我们判断什么领域能够出现垄断企业,以及现有企业如何增强市场力量 (market power) 提供了基本依据。

未来可能出现大型垄断企业的领域: 

VR/AR:较高的技术壁垒;VR/AR 本质上是新一代硬件与操作系统,而操作系统具有强网络外部性。

较难出现大型垄断企业的领域:

上门 O2O:进入壁垒较低; 每个 O2O 物流配送员的效率每天 30-40 单左右,瓶颈难以突破,因此 O2O 物流的规模经济非常有限,配送范围的扩张和配送量的增长难以带来平均成本的下降。

现有企业如何增强市场力量:

企业服务领域:产品差异化、提高转换成本、加强销售渠道建设;

电商领域(自营电商):加强上游供应链建设,提升与上游的议价能力。

本文主要作者:林琳,实习投资分析师

36 氪 FA 团队基于对行业的深度研究,充分发掘优质项目,精准对接投资人与创业者,为融资环节提供更专业的财务顾问服务,提高投融资效率。

原文作者:Lois,出处:http://36kr.com/p/5040064.html 查看全部

概念

进入壁垒 (Barriers to entry) 指产业内在位企业对于潜在进入企业和新进企业所具有的某种优势的程度。进入壁垒可以理解为打算进入某一产业的企业而非已有企业所必须承担的一种额外的生产成本。进入壁垒的高低,既反映了市场内已有企业优势的大小,也反映了新进入企业所遇障碍的大小。进入壁垒的高低是影响该行业市场垄断和竞争关系的一个重要因素,也是对市场结构的直接反映。

进入壁垒的形成原因和案例

规模经济

在一定的产量范围内,随着产量的增加,平均成本不断降低;因此新进入者在成本上处于劣势,面临较高的进入壁垒。

规模经济在价值链的各个环节均可能出现:

采购:大规模企业占据较高市场份额,与上游供应商有较强的议价能力,从而压低采购成本。例:沃尔玛超市压低食品杂货的采购价格,小超市在价格上无法与沃尔玛竞争。
生产:在一定产量范围内,机器设备等固定成本变化不大,新增的产品可以分担更多的固定成本,从而使平均成本下降。
销售:大规模企业占据较高市场份额,与下游企业有较强的议价能力,从而提升销售价格。例:英特尔提高其向下游厂商销售芯片组的价格。

绝对成本优势

在位企业的绝对成本优势可能源于以下因素:

通过专利或技术控制最新的生产工艺:医药企业。
控制产品的销售渠道。例:加多宝充分渗透了餐饮、大型商超、批发、小店和特殊渠道(学校、车站、宾馆、KTV)等凉茶饮料的全部可能销售渠道并建立长期合作关系,现有的零售商不会轻易转向其他品牌。加多宝对销售渠道的控制给凉茶的潜在进入者造成了较高的壁垒。
控制上游投入品的供应渠道。例:Priceline, 携程去哪儿对机票、酒店供应渠道的控制。
拥有具有特殊经营能力和其他技术专长的人才。

转换成本:更换供应商所需要的投资越大,消费者对于现有供应商的商品的价格敏感性越低,越不愿意更换供应商,从而给新进者造成壁垒。例:

苹果手机用户转向使用非苹果手机的成本很高——储存在苹果账户上的通讯录、App 数据和照片都无法直接导入新手机。因此苹果用户即使支付较高的价格,也不愿意换其他品牌的手机。
航空公司一般不愿意更换飞机供应商。如果将波音换为空客或其他品牌,那么重新培训机械师、投资购置新的备用部件等会增加很多成本。

产品差异化:指产业内相互竞争的厂商所生产的产品之间替代程度的不完全性。在位企业在长期经营过程中在产品品质、定价和销售服务等方面树立了良好声誉,增加了消费者对该企业产品的忠诚度,使得新进入企业在销售成本上处于劣势。

网络外部性:产品价值随着购买这种产品及其兼容产品的消费者的数量增加而不断增加。

例:社交软件、操作系统、交易平台。

必要资本量:指企业进入某一产业时最低限度的资本数量。必要资本量越大,筹措越困难,壁垒就越高。

例:金融行业。

政策法律制度

例:电信行业、金融行业。

投资启示

Peter Thiel 在《从零到一》中提到,互联网企业的利润之所以远远高于传统企业,一个重要原因在于他们建立了垄断地位,进而获取垄断利润。Google, Facebook, PayPal, Palantir 均是在各自领域具有一定垄断地位的企业。进入壁垒是企业垄断力量的重要组成部分。以上对进入壁垒形成原因的梳理为我们判断什么领域能够出现垄断企业,以及现有企业如何增强市场力量 (market power) 提供了基本依据。

未来可能出现大型垄断企业的领域: 

VR/AR:较高的技术壁垒;VR/AR 本质上是新一代硬件与操作系统,而操作系统具有强网络外部性。

较难出现大型垄断企业的领域:

上门 O2O:进入壁垒较低; 每个 O2O 物流配送员的效率每天 30-40 单左右,瓶颈难以突破,因此 O2O 物流的规模经济非常有限,配送范围的扩张和配送量的增长难以带来平均成本的下降。

现有企业如何增强市场力量:

企业服务领域:产品差异化、提高转换成本、加强销售渠道建设;

电商领域(自营电商):加强上游供应链建设,提升与上游的议价能力。

本文主要作者:林琳,实习投资分析师

36 氪 FA 团队基于对行业的深度研究,充分发掘优质项目,精准对接投资人与创业者,为融资环节提供更专业的财务顾问服务,提高投融资效率。

原文作者:Lois,出处:http://36kr.com/p/5040064.html

从此Sketch做带交互的原型不是梦

分享Slax 发表了文章 • 0 个评论 • 658 次浏览 • 2015-11-23 16:18 • 来自相关话题

用Sketch做原型的PM们可以关注一下这个插件,从此用Sketch做交互原型不是梦!
http://silverflows.com

用Sketch做原型的PM们可以关注一下这个插件,从此用Sketch做交互原型不是梦!
http://silverflows.com

ios审核遭拒问题总结汇总

分享visai 发表了文章 • 0 个评论 • 495 次浏览 • 2015-11-19 12:09 • 来自相关话题

很多iOS应用在上架过程总会遇到这样的问题:一次又一次被苹果审核拒绝,每次重新申请花费一周甚至更久时间,经常一个版本上传成功至少花费数月时间甚至小半年,严重影响产品市场推广计划。在开发的过程一定要严格熟悉App Store的审核指南,在这里跟大家汇总一些常见的审核遭拒经验,五大高频雷区:

(1) 奔溃的程序或者存在重大BUG:产品提审前一定要经过反复的测试,如果存在APP频繁奔溃或者闪退,要通过的概率基本为零,在苹果丛林法则中,用户体验至上。

(2) 诱导用户评论:假如APP中出现“给个好评”、“五星好评”、“好评奖励”等诱导性评论,基本是审核NG的。

(3) 定位功能:获取用户定位,需要增加提示并告知用户干什么用,并允许用户拒绝,这个细节要切记呀。

(4) UI和相关文案描述:UI中切勿出现与苹果相似的logo,描述中切记出现“苹果官方” 、“AppStore” 、“Apple Pay”等与苹果挂钩的关键词,要知道苹果中国区审核同胞是懂中文的,还有苹果的版权意识特别强,切勿触碰导火线。

(5) 关于UCG内容: 尤其是社区类的产品,用户产生内容的,一定需要有举报功能,举报功能,举报功能,重要的事情说三遍;另外还需要注意的是,产品信息选择时,对年龄限制等级是否过低要检查;音视频类,需要提供版权说明,给一版版权说明文案查看页面即可。
  查看全部
很多iOS应用在上架过程总会遇到这样的问题:一次又一次被苹果审核拒绝,每次重新申请花费一周甚至更久时间,经常一个版本上传成功至少花费数月时间甚至小半年,严重影响产品市场推广计划。在开发的过程一定要严格熟悉App Store的审核指南,在这里跟大家汇总一些常见的审核遭拒经验,五大高频雷区:

(1) 奔溃的程序或者存在重大BUG:产品提审前一定要经过反复的测试,如果存在APP频繁奔溃或者闪退,要通过的概率基本为零,在苹果丛林法则中,用户体验至上。

(2) 诱导用户评论:假如APP中出现“给个好评”、“五星好评”、“好评奖励”等诱导性评论,基本是审核NG的。

(3) 定位功能:获取用户定位,需要增加提示并告知用户干什么用,并允许用户拒绝,这个细节要切记呀。

(4) UI和相关文案描述:UI中切勿出现与苹果相似的logo,描述中切记出现“苹果官方” 、“AppStore” 、“Apple Pay”等与苹果挂钩的关键词,要知道苹果中国区审核同胞是懂中文的,还有苹果的版权意识特别强,切勿触碰导火线。

(5) 关于UCG内容: 尤其是社区类的产品,用户产生内容的,一定需要有举报功能,举报功能,举报功能,重要的事情说三遍;另外还需要注意的是,产品信息选择时,对年龄限制等级是否过低要检查;音视频类,需要提供版权说明,给一版版权说明文案查看页面即可。
 

为什么姑娘喝酒,你买单

分享UP 发表了文章 • 0 个评论 • 288 次浏览 • 2015-11-12 10:38 • 来自相关话题

编者按:36 氪经济学知识小专栏,本系列由 36 氪 FA 团队研究整理,不定期与大家分享一些经济学或其他相关理论知识。用一分钟学一点经济学,武装头脑涨姿势。


本期内容:

双边市场概念
双边市场的成立条件
双边市场实例
双边市场的定价策略

双边市场的概念

如果各用户群之间需要通过平台进行交易,且各用户群之间存在交叉网络外部性,平台可以通过价格结构影响各用户群之间的总交易量,那么这时的市场结构就具有双边性。

双边市场的成立条件

交叉网络外部性:传统的网络外部性是某种产品或服务的价值与该种产品或服务的消费规模正相关。然而,双边市场中的网络外部性与传统产业组织理论中的网络外部性存在显著差别,它是一种交叉网络外部性——一方的用户数量将影响另一方用 户的数量和交易量。
价格结构:平台企业将总价格水平在双边市场的用户之间进行合理分配,而不是按照价格等于边际成本的原则确定。
相互依赖和互补性:只有双边用户同时对平台所提供的产品或服务产生需求时,平台企业才具有价值。

双边市场举例

传统企业:

信用卡支付平台,如 VISA:

两个用户群:商户、消费者
交叉网络外部性:商户喜欢消费者多的信用卡支付平台,消费者喜欢签约商户多的信用卡支付平台
价格结构:信用卡支付平台对商户收高价,对消费者收低价
相互依赖性和互补性:商户需要信用卡平台促进应收账款周转和客户消费,消费者需要信用卡以促进资金融通、简化付款流程

酒吧:

两个用户群:男性、女性
交叉网络外部性:男性喜欢女性多的酒吧,女性喜欢男性多的酒吧
价格结构:酒吧对男性收高价,对女性收低价
相互依赖性和互补性:男女性都需要酒吧进行娱乐社交

媒体,如电视:

两个用户群:广告商、观众
交叉网络外部性:电视台观众越多,愿意投放广告的商户就越多
价格结构:电视台对广告商收高价,对观众基本免费
相互依赖性和互补性:商户需要电视台的观众,观众需要电视节目

互联网相关产业:

电商平台如淘宝:商户、消费者
社交网络如 LinkedIn:猎头 /HR、求职者
搜索引擎:广告商、用户
电脑操作系统:软件开发商、用户

双边市场的定价策略

单边市场企业面临一条需求曲线,认为价格仅与自身的边际成本和需求弹性有关,并且价格和需求弹性变化的方向是相反的。

双边市场的平台企业面临的是两条需求曲线,若 A 边市场的价格的下降使得 A 边市场中一些原来没有使用平台交易的富有弹性的用户开始通过平台进行交易,由于交叉网络外部性的存在又使得 B 边市场的用户人数增加和价格上升,从而使平台可以从 B 边市场获取更多的收益,A 边市场的价格低于边际成本以至免费就是有利可图的。

本文主要作者:林琳,实习投资分析师
原文:http://36kr.com/p/5039589.html 查看全部

yestone_HD_1116184168.jpg!heading_.jpeg


编者按:36 氪经济学知识小专栏,本系列由 36 氪 FA 团队研究整理,不定期与大家分享一些经济学或其他相关理论知识。用一分钟学一点经济学,武装头脑涨姿势。


本期内容:

双边市场概念
双边市场的成立条件
双边市场实例
双边市场的定价策略

双边市场的概念

如果各用户群之间需要通过平台进行交易,且各用户群之间存在交叉网络外部性,平台可以通过价格结构影响各用户群之间的总交易量,那么这时的市场结构就具有双边性。

双边市场的成立条件

交叉网络外部性:传统的网络外部性是某种产品或服务的价值与该种产品或服务的消费规模正相关。然而,双边市场中的网络外部性与传统产业组织理论中的网络外部性存在显著差别,它是一种交叉网络外部性——一方的用户数量将影响另一方用 户的数量和交易量。
价格结构:平台企业将总价格水平在双边市场的用户之间进行合理分配,而不是按照价格等于边际成本的原则确定。
相互依赖和互补性:只有双边用户同时对平台所提供的产品或服务产生需求时,平台企业才具有价值。

双边市场举例

传统企业:

信用卡支付平台,如 VISA:

两个用户群:商户、消费者
交叉网络外部性:商户喜欢消费者多的信用卡支付平台,消费者喜欢签约商户多的信用卡支付平台
价格结构:信用卡支付平台对商户收高价,对消费者收低价
相互依赖性和互补性:商户需要信用卡平台促进应收账款周转和客户消费,消费者需要信用卡以促进资金融通、简化付款流程

酒吧:

两个用户群:男性、女性
交叉网络外部性:男性喜欢女性多的酒吧,女性喜欢男性多的酒吧
价格结构:酒吧对男性收高价,对女性收低价
相互依赖性和互补性:男女性都需要酒吧进行娱乐社交

媒体,如电视:

两个用户群:广告商、观众
交叉网络外部性:电视台观众越多,愿意投放广告的商户就越多
价格结构:电视台对广告商收高价,对观众基本免费
相互依赖性和互补性:商户需要电视台的观众,观众需要电视节目

互联网相关产业:

电商平台如淘宝:商户、消费者
社交网络如 LinkedIn:猎头 /HR、求职者
搜索引擎:广告商、用户
电脑操作系统:软件开发商、用户

双边市场的定价策略

单边市场企业面临一条需求曲线,认为价格仅与自身的边际成本和需求弹性有关,并且价格和需求弹性变化的方向是相反的。

双边市场的平台企业面临的是两条需求曲线,若 A 边市场的价格的下降使得 A 边市场中一些原来没有使用平台交易的富有弹性的用户开始通过平台进行交易,由于交叉网络外部性的存在又使得 B 边市场的用户人数增加和价格上升,从而使平台可以从 B 边市场获取更多的收益,A 边市场的价格低于边际成本以至免费就是有利可图的。

本文主要作者:林琳,实习投资分析师
原文:http://36kr.com/p/5039589.html

2015年双11天猫全天成交金额为912.17亿元

行业UP 发表了文章 • 0 个评论 • 324 次浏览 • 2015-11-12 10:27 • 来自相关话题

天猫双十一全天成交金额为912.17亿元,其中在移动端交易额占比68%,232个国家参与进来,物流订单量4.67亿。

最败家城市前五名为广东,浙江,江苏,上海,北京。

最大消费县为:江苏昆山,浙江义乌,浙江慈溪,四川双流,江苏常熟。

今年天猫双十一购物狂欢节开场1分钟12秒之后,交易额冲到了10亿元,无线端占比为81.82%;开场12分钟28秒之后,交易额冲到了100亿元,无线交易额占比74.83%。 查看全部
9nSZ-fxksqis4730502.jpg

天猫双十一全天成交金额为912.17亿元,其中在移动端交易额占比68%,232个国家参与进来,物流订单量4.67亿。

最败家城市前五名为广东,浙江,江苏,上海,北京。

最大消费县为:江苏昆山,浙江义乌,浙江慈溪,四川双流,江苏常熟。

今年天猫双十一购物狂欢节开场1分钟12秒之后,交易额冲到了10亿元,无线端占比为81.82%;开场12分钟28秒之后,交易额冲到了100亿元,无线交易额占比74.83%。

这个上市了 100 年的公司,股价翻了 3.4 万倍

闲聊UP 发表了文章 • 0 个评论 • 303 次浏览 • 2015-11-12 10:19 • 来自相关话题

 1915 年 11 月 11 日,IBM 首次在纽约证券交易所挂牌交易。当时,这家公司还叫做计算机制表公司。

成立已有 104 年历史的 IBM,经历过上世纪的大萧条时期,鉴证了网络泡沫的破灭以及本世纪的大衰退。虽然历经了无数次的技术转型,但是由于涉足云计算业务太晚,IBM 营收已连续 14 个季度出现下滑。 查看全部

u27114.jpg

 1915 年 11 月 11 日,IBM 首次在纽约证券交易所挂牌交易。当时,这家公司还叫做计算机制表公司。

成立已有 104 年历史的 IBM,经历过上世纪的大萧条时期,鉴证了网络泡沫的破灭以及本世纪的大衰退。虽然历经了无数次的技术转型,但是由于涉足云计算业务太晚,IBM 营收已连续 14 个季度出现下滑。

Axure Mac版更新至8.0.0.3268

分享Slax 发表了文章 • 0 个评论 • 415 次浏览 • 2015-11-11 18:05 • 来自相关话题

Axure RP 8.0.0.3268 Beta Update
11/10/2015 - Bug Fixes

- Fixed slide animation for visibility of Groups
- Fixed issues hiding and showing Groups with flip
- Fixed error adding Sketchiness after converting to Dynamic Panel
- Fixed HTML error when Repeater contains unplaced Dynamic Panel
- Fixed issue with Master in Repeater in Master
- Fixed Move with this option

下载地址:http://www.axure.com/client-do ... false 查看全部
Axure RP 8.0.0.3268 Beta Update
11/10/2015 - Bug Fixes

- Fixed slide animation for visibility of Groups
- Fixed issues hiding and showing Groups with flip
- Fixed error adding Sketchiness after converting to Dynamic Panel
- Fixed HTML error when Repeater contains unplaced Dynamic Panel
- Fixed issue with Master in Repeater in Master
- Fixed Move with this option

下载地址:http://www.axure.com/client-do ... false