如何从加权列表中选择4个唯一项?

| 因此,我有一个加权项目列表,我想从该列表中选择4个非重复项目。
Item     Weight
Apple     5
Banana    7
Cherry    12
...
Orange    8
Pineapple 50
最有效的方法是什么?我最初的尝试是,如果出现一个已经被拣选的项目,则只是重新滚动以选择后续的拣选...但是对于一个很小的清单,这可能会导致大量的重新滚动。 编辑以澄清: 对于上面的示例,忽略水果D到N,总重量为82。因此首先被选中的机会是:     〜6%     B〜8.5%     碳〜14.6%     O〜9.8%     磷〜61% 一旦选择了一个项目,概率将(应该!)改变。     
已邀请:
        在您的评论中,您说独特是指:   我不想选择相同的项目两次。 ..权重决定了被拣选的可能性。 要确保您没有选择重复项,只需要做的就是在选择下一个项目之前先从列表中删除最后一个项目。是的,这将稍微改变您的体重,但是如果您确实希望获得独特的结果,那么这是正确的统计更改。 此外,我不确定您是如何使用权重来确定候选者的,但是我想出了该算法,该算法应使用最少的循环次数(并且无需根据权重填充数组,可能会导致数组过大,需要int权重等)。 我在这里使用过JavaScript,只是为了轻松在没有服务器的浏览器中查看输出。移植到PHP应该很简单,因为它没有做任何复杂的事情。 常数
var FRUITS = [
    {name : \"Apple\", weight: 8 },
    {name : \"Orange\", weight: 4 },
    {name : \"Banana\", weight: 4 },
    {name : \"Nectarine\", weight: 3 },
    {name : \"Kiwi\", weight: 1 }
];

var PICKS = 3;

function getNewFruitsAvailable(fruits, removeFruit) {
    var newFruits = [];
    for (var idx in fruits) {
        if (fruits[idx].name != removeFruit) {
            newFruits.push(fruits[idx]);
        }
    }
    return newFruits;
}
脚本
var results = [];
var candidateFruits = FRUITS;

for (var i=0; i < PICKS; i++) {
    // CALCULATE TOTAL WEIGHT OF AVAILABLE FRUITS
    var totalweight = 0;
    for (var idx in candidateFruits) {
        totalweight += candidateFruits[idx].weight;
    }
    console.log(\"Total weight: \" + totalweight);

    var rand = Math.random();

    console.log(\"Random: \" + rand);

    // ITERATE THROUGH FRUITS AND PICK THE ONE THAT MATCHES THE RANDOM
    var weightinc = 0;
    for (idx in candidateFruits) {
        // INCREMENT THE WEIGHT BY THE NEXT FRUIT\'S WEIGHT
        var candidate = candidateFruits[idx];
        weightinc += candidate.weight;

        // IF rand IS BETWEEN LAST WEIGHT AND NEXT WEIGHT, PICK THIS FRUIT
        if (rand < weightinc/totalweight) {
            results.push(candidate.name);
            console.log(\"Pick: \" + candidate.name);

            // GET NEXT SET OF FRUITS (REMOVING PICKED FRUIT)
            candidateFruits = getNewFruitsAvailable(candidateFruits, candidate.name);
            break;
        }
    }
    console.log(\"CandidateFruits: \" + candidateFruits.length);
};
输出量
for (var i=0; i < results.length; i++) {
    document.write(results[i] + \"<br/>\");
}
基本策略是将每个水果分配到总范围
[0,1)
的一部分。在第一个循环中,您需要: 苹果-8/20 = 0.0至0.4 橙色-4/20 = 0.4至0.6 香蕉-4/20 = 0.6至0.8 油桃-3/20 = 0.8至0.95 猕猴桃-8/20 = 0.95至1.0 该脚本将遍历列表中的每个项目,并增加一个权重计数器。当它达到包含第一个随机数的范围时,它将选择该项目,将其从列表中删除,然后根据新的总重量重新计算范围并再次运行。     
        更新资料
function array_rand2($ary,$n = 1)
{
  // make sure we don\'t get in to an infinite loop
  // check we have enough options to select from
  $unique = count(array_unique(array_keys($ary)));
  if ($n > $unique) $n = count($unique);

  // First, explode the array and expand out all the weights
  // this means something with a weight of 5 will appear in
  // in the array 5 times
  $_ary = array();
  foreach ($ary as $item => $weight)
  {
    $_ary = array_merge($_ary, array_fill(0, $weight, $item));
  }

  // now look for $n unique entries
  $matches = array();
  while (count($matches) < $n)
  {
    $r = $_ary[array_rand($_ary)];
    if (!in_array($r,$matches))
    {
      $matches[] = $r;
    }
  }

  // and now grab those $n entries and return them
  $result = array();
  foreach ($matches as $match){
    $result[] = $match;
  }
  return $result;
}
看看是否做得更好。     
        在这里,我找到了执行以下步骤的想法: 建立权重之和-> SUM 建立介于0和SUM之间的随机数-> RAND_NUMBER 遍历列表,并从RAND_NUMBER中减去每个元素的权重。如果RAND_NUMBER变为负数,则您拥有第一个元素。 从列表中删除找到的元素,然后返回到步骤1,直到有4个元素。     
        也许可以代替\“ rerolls \”来增加您随机生成的列表元素索引:
list.elementAt(rand_index++ % size(list))
(类似这样)。我想您会使用类似的逻辑很快找到下一个随机唯一项。 我敢肯定当然会有更好的解决方案。 编辑:看起来布拉德已经提供了一个.. :)     

要回复问题请先登录注册