C#计算时间序列的移动中位数SortedList< DateTime,double> - 提高绩效?

我有一个计算时间序列的移动中值的方法。像移动平均线一样,它使用固定的窗口或周期(有时称为回溯期)。 如果周期为10,它将创建前10个值(0-9)的数组,然后找到它们的中值。它将重复此操作,将窗口递增1步(现在值为1-10),依此类推......因此,此处的移动部分。这个过程与移动平均线完全相同。 中值可通过以下方式找到: 对数组的值进行排序 如果数组中有奇数个值,请取中间值。 5个值的排序数组的中值将是第3个值。 如果数组中存在偶数个值,请在中间的每一侧取两个值并取平均值。 6个值的排序数组的中值为(2nd + 3rd)/ 2。 我创建了一个函数,通过填充
List<double>
,调用
List<>.Sort()
,然后找到合适的值来计算它。 计算它是正确的,但我很想知道是否有办法改善这种计算的性能。也许是通过手动滚动
double[]
而不是使用列表。 我的实现如下:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

namespace Moving_Median_TimeSeries
{
    class Program
    {
        static void Main(string[] args)
        {
            // created a a sample test time series of 10 days
            DateTime Today = DateTime.Now;
            var TimeSeries = new SortedList<DateTime, double>();
            for (int i = 0; i < 10; i++)
                TimeSeries.Add(Today.AddDays(i), i * 10);

            // write out the time series
            Console.WriteLine("Our time series contains...");
            foreach (var item in TimeSeries) 
                Console.WriteLine("   {0}, {1}", item.Key.ToShortDateString(), item.Value);

            // calculate an even period moving median 
            int period = 6;
            var TimeSeries_MovingMedian = MovingMedian(TimeSeries, period);

            // write out the result of the calculation
            Console.WriteLine("nThe moving median time series of {0} periods contains...", period);
            foreach (var item in TimeSeries_MovingMedian)
                Console.WriteLine("   {0}, {1}", item.Key.ToShortDateString(), item.Value);

            // calculate an odd period moving median 
            int period2 = 5;
            var TimeSeries_MovingMedian2 = MovingMedian(TimeSeries, period);

            // write out the result of the calculation
            Console.WriteLine("nThe moving median time series of {0} periods contains...", period2);
            foreach (var item in TimeSeries_MovingMedian2)
                Console.WriteLine("   {0}, {1}", item.Key.ToShortDateString(), item.Value);
        }

        public static SortedList<DateTime, double> MovingMedian(SortedList<DateTime, double> TimeSeries, int period)
        {
            var result = new SortedList<DateTime, double>();

            for (int i = 0; i < TimeSeries.Count(); i++)
            {
                if (i >= period - 1)
                {
                    // add all of the values used in the calc to a list... 
                    var values = new List<double>();
                    for (int x = i; x > i - period; x--)
                        values.Add(TimeSeries.Values[x]);

                    // ... and then sort the list <- there might be a better way than this
                    values.Sort();

                    // If there is an even number of values in the array (example 10 values), take the two mid values
                    // and average them.  i.e. 10 values = (5th value + 6th value) / 2. 
                    double median;
                    if (period % 2 == 0) // is any even number
                        median = (values[(int)(period / 2)] + values[(int)(period / 2 - 1)]) / 2;
                    else // is an odd period
                    // Median equals the middle value of the sorted array, if there is an odd number of values in the array
                        median = values[(int)(period / 2 + 0.5)];

                    result.Add(TimeSeries.Keys[i], median);
                }
            }
            return result;
        }

    }
}
    
已邀请:
  可能有比这更好的方法 你是对的 - 如果你想要的只是中位数,你不需要对整个列表进行排序。请关注此维基百科页面中的链接以获取更多信息。     
对于N个项目和周期P的列表,您为每个项目重新排序列表的算法是O(N * P lgP)。有一个O(N * lg P)算法,它使用2个堆。 它使用一个最小堆,其中包含高于中位数的P / 2项,以及一个P-P / 2项小于或等于它的最大堆。每当您获得一个新的数据项时,用最新的项替换最旧的项,然后进行筛选或筛选以将其移动到正确的位置。如果新项目到达任一堆的根,则将其与另一个堆的根进行比较,并在需要时进行交换和筛选。对于奇数P,中位数是最大堆的根。对于均匀P,它是两个根的平均值。 这个问题有一个c实现。实现它的一个棘手的部分是 有效地跟踪最旧的项目。该部分的开销可能使小P的速度增加微不足道。     

要回复问题请先登录注册