个性化算法推荐,怎么推?推些啥?

发布时间:2024-12-25 16:43

音乐推荐算法能个性化推荐音乐 #生活乐趣# #音乐陶冶#

来源:传媒评论

如今,推荐功能对于一家网站、一款应用程序来说已不算特别亮眼的功能,甚至慢慢成为标配。它能够根据用户偏好,快速地对内容筛选,起到匹配信息的作用。以今日头条为代表的新闻类产品,渐渐吹皱了新闻分发领域的“一江春水”。

根据中国联通“APP沃指数”显示, 截至2017年12月,今日头条的活跃用户人数已达2.78亿,在新闻资讯类应用中位居第一,成为传统媒体捕获用户最强劲的对手。但是其在推荐系统中不附价值观的使用也给用户带来了诸多内容上的负面影响。

那么对于向新媒体转型中的传统媒体来说,应该怎么做好推荐功能,或者说,我们究竟需要什么样的推荐功能呢?

何为推荐系统?

推荐系统是由瑞典的计算机语言学家Jussi Karlgren在1990年提出的,当时主要用来为读者推荐喜爱的书籍。

试想如果读者在书架中发现了一本感兴趣的书,那么他们也会更容易在周边发现下一本类似的书籍,进而沉浸在自己的“小天地”中。其原因就在于书架上的书往往是按类别或内容的相似度排列的。而将同类书籍摆放在一起或者相近地方的这种操作,本质 上就起到了“推荐”的作用。

由此可见,相似性是推荐系统是否奏效的关键。用户之间、内容之间的相似性是推荐系统运行的“原动力”。目前,构建推荐系统的基础方法主要分为两大类:以用户为主的协同过滤法和以内容为主的内容过滤法

协同过滤法主要依靠用户间相似的偏好来作推荐。该算法假定用户的偏好会保持不变,并且相似用户间的喜好会“互相传染”。

如电商巨头亚马逊就是根据用户的购买记录和对商品的评分,来计算比较用户之间的相似性的。假设小林给A、B、C三样商品分别打了5分,小夏给A、B、D三样商品打了4.5、5和5分,系统“发现”他们同时给A、B打分且分数接近,从而判断他们有可能是“品味”相似的用户,就会把C推荐给小夏,把D推荐给小林。

推荐算法模型

这就是基于物品的协同过滤法,通过物品去测算用户间的相似性,从而把“相似”人群感兴趣的物品推荐给你,帮助用户发现隐匿的兴趣所在。

显然,这种方法主要依靠用户的历史数据,它不需要对物品或内容本身有太多了解或分析,因此多应用于一些较难特征化或非结构化的场景中,而且它可以推荐出一些“小众”的长尾内容,给用户惊喜。但对于没有任何历史记录的新用户来说,这种推荐系统可能就会因遭遇“冷启动”而难以奏效。

此外,当用户历史数据量巨大时,此类推荐系统会占用非常大的计算资源,这对机器的计算能力也是不小的考验。

内容过滤法的运作机制主要基于内容特征的相似程度和用户自身对于内容偏好的定义。该方法以信息提取和信息过滤等相关知识作为理论基础,它只需掌握内容的特征(如关键词),即可无需依赖用户的历史数据进行推荐,只要用户预先“告知”系统自己的偏好,就能以此来避免所谓“冷启动”的问题。

推荐算法模型

在文本处理方面,生成关键词用到的基本方法称为TF-IDF。意为文本频率-逆文档频率,指的是在所有文档中查找特定文字的频率,寻求权重最大的文本作为其关键词。此类推荐算法在新闻领域应用较为广泛,经常被用于推荐稿件的相关新闻。

如澎湃新闻、南方+等媒体都会在新闻详情页末端推荐与文章主题相关的其他新闻内容。然而,虽然内容过滤法的运行效率较高,给出的推荐建议也有理有据,但推荐内容的同质化是其软肋,而且在提取关键词时,时常会遇到一词多义或者一义多词的问题,从而也降低了推荐的精准性。

如今,随着机器学习和深度学习理论的发展,推荐系统也正日趋完善。无论哪种推荐算法都有其长处和短板,因此将它们结合起来形成混合算法,扬长避短,或许可以达到更为理想的推荐效果。

推荐系统在媒体行业中的应用

商业媒体在个性化推荐上的“嗅觉”一向灵敏。以今日头条为例,它作为一款基于数据挖掘的新闻聚合类产品,能在行业中取得如此大的市场占有率,主要得益于其强大的内容推荐系统。

在其推荐系统架构的“底层算法”中,协同过滤法和内容过滤法相互配合,协同过滤帮助找寻相似用户,内容过滤帮助找寻相似内容。

然而要想充分发挥两种算法的优势,建立数据特征是非常重要的一个环节,也就是要具备何种特征才能使用户或内容“被找到”。今日头条将众多特征分为四类,分别为相关性特征、环境特征、热度特征和协同特征。

一是相关性特征,主要评估的是内容与用户是否匹配相关,包括关键词、分类、来源、主题等。

二是环境特征,主要为地理位置、时间等。但这类特征比较容易引起结果的偏差,需要与其他特征结合来减少对结果的误判。

三是热度特征,主要是内容的全局热度、分类热度、主题热度以及关键词热度,这在推荐系统“冷启动”时非常有用。

四是协同特征,如果只考虑用户历史,推荐系统中可能会出现内容越来越狭窄的问题,所以需要通过分析不同用户之间在点击、兴趣、关注等方面的相似性,扩大模型探索用户兴趣的边界。

面对庞大的用户数量和复杂多样的内容,要将这样众多特征灵活组合应用,今日头条的推荐系统还运用了更多模型和算法,如逻辑回归分析、深层神经网络、分解机和梯度提升决策树等。

同时今日头条还需要考虑各种会影响推荐效果的因素,如候选内容的快速变化、推荐特征的增加、推荐架构的升级、算法参数的优化以及规则策略的改变等,以便更好地对系统进行完善升级。

推荐系统的尴尬境地

企鹅智酷公布的调查数据

从推荐系统理论及相关算法的提出,到在庞大推荐架构中的实际应用,其各类算法模块都在不断发展完善,但在实践中涌现的问题也层出不穷。

根据企鹅智酷公布的调查数据显示,有41.5%的受访者认为新闻内容平台(以自媒体为主)有些媒体为了流量和收益,故意夸大标题,言论极端情绪化且缺乏深度,罔顾事实制造新闻,为大众所不齿。

人民日报在《网络时代,应如何规范“算法”》中指出,“技术中性”不能等同于“价值中性”,不能让价值观成为算法的附庸。虽然技术没有价值,但是技术体现了作为发明人、操纵者的价值观。文中提到北京大学法学院教授的建议,他认为应该将算法的价值伦理上升为法律规范和原则,使其具有法律的刚性,以强化对算法推荐本身的法治监督。

约束网络推荐平台乱象固然需要法律的监督,但立法具有滞后性。在相关法律法规出台之前,还是要依靠企业自律或行业规范为立法打下基础。

如今一些媒体如凤凰新闻、天天快报、新浪新闻等,大都会在文章标题列的角落增添负反馈按钮,用户可因“不感兴趣”、“反馈垃圾内容”、“拉黑作者”、“标题党”等理由向平台表达自己的意见,帮助平台锁定低俗和违规的内容或作者,将其撤回并进行降权处理。

不只是用户,平台自身对于风险的识别和过滤模型也可以为其从分发源头上遏制住不良信息的传播。

如今日头条利用深度学习中的算法打造“鉴黄模型”,依靠千万张图片样本,“训练”机器有效识别,可检索出99%的涉黄相关图片。另外,还有“低俗模型”和“谩骂模型”,可分别对文章和评论进行不当内容的判断和识别。当然,今日头条也会依靠人工复审对内容安全进行把控。

构建一个优质的内容推荐平台,是一个集技术大成并反复验证的过程。商业媒体或因其在技术、人才,以及用户规模上的优势,可以设计并开发出相对“灵活”的推荐系统。

但这并不代表传统媒体在个性化推荐领域就没有机会。在内容引导流量的数字媒体时代,传统媒体对于内容的严格把控力会成为其无可替代的优势。

结语:

在不断完善推荐系统算法的基础上,如何把握个性化推荐与传统分发之间的平衡点,让用户可以自由决定个性化推荐的内容在其接收资讯中所占比重,这种将传统的新闻分发模式和推荐系统结合起来的尝试,或许会成为新闻媒体在个性化推荐实践中的新思路。

美术编辑:刘 玥

责任编审:王 洋

责任编辑:

网址:个性化算法推荐,怎么推?推些啥? https://www.yuejiaxmz.com/news/view/564465

相关内容

个性化推荐算法
推荐系统:个性化推荐的算法与策略
win11个性化推荐怎么关闭 win11个性化推荐关闭方法介绍
协同过滤推荐算法:个性化推荐的基石
推荐系统:个性化推荐的算法与实践
MovieLens个性化电影推荐系统实战(三):个性化电影推荐(推荐算法)
个性化推荐算法概述与展望
Slope One个性化推荐算法
iPanda推荐算法如何个性化?
个性化推荐的主流算法:哪些算法值得关注

随便看看