将数据帧拆分为重叠的数据帧
|
我正在尝试编写一个行为如下的函数,但事实证明这非常困难:
DF <- data.frame(x = seq(1,10), y = rep(c(\'a\',\'b\',\'c\',\'d\',\'e\'),2))
> DF
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 a
7 7 b
8 8 c
9 9 d
10 10 e
>OverLapSplit(DF,nsplits=2,overlap=2)
[[1]]
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 a
[[2]]
x y
1 5 a
2 6 b
3 7 c
4 8 d
5 9 e
6 10 a
>OverLapSplit(DF,nsplits=1)
[[1]]
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 a
7 7 b
8 8 c
9 9 d
10 10 e
>OverLapSplit(DF,nsplits=2,overlap=4)
[[1]]
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 a
7 7 b
[[2]]
x y
1 4 e
2 5 a
3 6 b
4 7 c
5 8 d
6 9 e
7 10 a
>OverLapSplit(DF,nsplits=5,overlap=1)
[[1]]
x y
1 1 a
2 2 b
3 3 c
[[2]]
x y
1 3 c
2 4 d
3 5 e
[[3]]
x y
1 5 e
2 6 a
3 7 b
[[4]]
x y
1 7 b
2 8 c
3 9 d
[[5]]
x y
1 8 d
2 9 e
3 10 f
我没想过如果尝试ѭ1之类的东西会发生什么
可能是以下情况:
[[1]]
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
[[2]]
x y
1 5 a
2 6 b
3 7 c
4 8 d
5 9 e
6 10 a
谢谢!
没有找到相关结果
已邀请:
3 个回复
蕉衫
用nsplit分割数! (nsplit = 1返回2个数据帧)。万一重叠拆分不真正适合数据帧,这将呈现不完整的最后一个数据帧,并发出警告。
还有一个警告
贸会
这使:
艾食魄轻县
这样,您可以在末尾用并行版本的lapply替换ѭ11,并稍微提高速度。 当然,考虑到处理器数量和数据集大小,现在存在优化拆分/重叠的问题。