【果壳探索】什么样的微博链接会让你“手滑”?
许多微博文本里头都有个链接。什么样的链接你会忍不住手滑去点?国外研究人员找到的一种算法,可根据文章内容推断出文章在被分享到推特后会获得多少点击和转发,准确率据说高达84%。但这种算法是否适用于微博,还有待实验。
许多微博文本里头都有个链接。什么样的链接你会忍不住手滑去点?点完了又忍不住手滑去转发?今年早些时候,国外就有科学家做过这样的研究,略有不同的是,他们没有微博,只有推特。
2012年2月初,惠普研究所的Bernardo Huberman和加州大学的Roja Bandari等人发表了一篇论文,提出了一种预测一篇文章流行程度的方法。研究人员通过找到一种算法,仅仅根据文章的内容就推断出文章在被分享到推特后会获得多少点击和转发,而该算法准确率据说高达84%。这一研究无疑引起了广泛的关注,国内外众多科技新闻网站都曾有报道。如此神奇的研究结果是如何获得的?它真的靠谱吗?不妨就让我们来一窥究竟。
流不流行,推特说了算
很显然这是一个基于统计分析的研究。我们知道,所有基于统计分析的研究,它的样本都是非常关键的 。研究者通过一个叫做Feedzilla的应用程序收集了2011年8月8日到16日之间,某些新闻汇集网站上的4万多篇文章。Feedzilla能够记录并整理统计这些文章的摘要、地址、标题、时间以及被分享到推特上的次数。
而得到的这些数据将用于模型的训练和测试(这两个概念我们会在之后详细介绍)。另外为了使一些参数尽可能准确,研究者在确定某些参数时采用了更大的样本空间。
另一方面,被分享到推特上的推文传播量则可以通过搜索引擎查询出来。有研
登录后获取更多权限
网络编辑:刘之耘