基本速度算法?

| 给定我网站上一篇文章的以下数据集:
Article 1
2/1/2010 100
2/2/2010 80
2/3/2010 60

Article 2
2/1/2010 20000
2/2/2010 25000
2/3/2010 23000
其中第1栏是日期,第2栏是文章的网页浏览量。可以执行什么基本速度计算来确定本文最近3天的上升趋势或下降趋势? 请注意,文章不会只知道自己的浏览量总数。理想情况下,数字应介于0到1之间。是否有任何指向此类算法的指针? 谢谢!     
已邀请:
        更新:您的数据实际上已经是速度列表(每日浏览量)。以下答案仅显示了如何查找过去三天的平均速度。请参阅我的其他答案,以了解如何计算综合浏览量,这是您可能正在寻找的真实统计信息。 速度只是值(页面浏览量)随时间的变化: 对于2/3/2010的第1条:
delta pageviews = 100 + 80 + 60 
                = 240 pageviews
delta time = 3 days

pageview velocity (over last three days) = [delta pageviews] / [delta time]
                                         = 240               / 3
                                         = 80 pageviews/day
对于2/3/2010的第2条:
delta pageviews = 20000 + 25000 + 23000 
                = 68000 pageviews
delta time = 3 days

pageview velocity (over last three days) = [delta pageviews] / [delta time] 
                                         = 68,000             / 3
                                         = 22,666 + 2/3 pageviews/day
现在我们知道了最大速度,我们可以缩放所有速度以获得0和1之间(或0%和100%之间)的相对速度:
relative pageview velocity of article 1 = velocity / MAX_VELOCITY
                                        = 240      / (22,666 + 2/3)
                                        ~ 0.0105882353
                                        ~ 1.05882353%

relative pageview velocity of article 2 = velocity      / MAX_VELOCITY
                                        = (22,666 + 2/3)/(22,666 + 2/3)
                                        = 1
                                        = 100%
    
        “浏览量趋势”很可能是指浏览量加速,而不是速度。您的数据集实际上已经是速度列表(每日浏览量)。浏览量是非递减值,因此浏览量速度永远不能为负。下面介绍了如何计算浏览量加速度(可能为负值)。
PV_acceleration(t1,t2) = (PV_velocity{t2} - PV_velocity{t1}) / (t2 - t1)
(\"PV\" == \"Pageview\")
说明: 加速度就是速度变化除以时间变化。由于您的数据集是页面浏览速度的列表,因此您可以将它们直接插入公式中:
PV_acceleration(\"2/1/2010\", \"2/3/2010\") = (60 - 100) / (\"2/3/2010\" - \"2/1/2010\")
                                        = -40        / 2
                                        = -20 pageviews per day per day
请注意未使用\“ 2/2/2010 \”的数据。另一种方法是计算三个PV_acceleration(使用仅追溯到一天的日期范围)并将其平均。您的示例中没有足够的数据来进行三天的操作,但是最近两天的操作方法如下:
PV_acceleration(\"2/3/2010\", \"2/2/2010\") = (60 - 80) / (\"2/3/2010\" - \"2/2/2010\")
                                        = -20        / 1
                                        = -20 pageviews per day per day

PV_acceleration(\"2/2/2010\", \"2/1/2010\") = (80 - 100) / (\"2/2/2010\" - \"2/1/2010\")
                                        = -20        / 1
                                        = -20 pageviews per day per day

PV_acceleration_average(\"2/3/2010\", \"2/2/2010\") = -20 + -20 / 2
                                                = -20 pageviews per day per day
此替代方法对第1条数据没有影响,因为两天之间的页面浏览速度没有变化,但对第2条有影响。     
        只是有关“趋向”算法重述,SU和HN使用等的文章的链接。 http://www.seomoz.org/blog/reddit-stumbleupon-delicious-and-hacker-news-algorithms-exposed     

要回复问题请先登录注册