格式化模拟输出的良好做法

| 这几乎是一个编程问题,但面向物理学家。 假设我正在编写一个软件,该软件将一些系统参数作为输入,然后从中计算出一些东西,在我的例子中是频谱函数$ A(k,\\ omega)$。 当我只想获取输出并将其提供给gnuplot时,我应该使程序输出一个简单的表,其中一列表示$ k $值,一列表示$ \\ omega $,另一列表示$ A(k,\ \ omega)$。 但是,那时我无法在其中存储所有其他信息,例如使用了哪些参数。也许我想在输出中存储一些其他调试信息,例如中间数量。在我的示例中,频谱函数是从自能量获得的,因此在某些情况下,我可能希望直接查看自能量。 我不想根据我想要的输出来不断修改源代码。如果\“ run \”的所有相关数据都出现在单个文件/实体中会更好,但是这样仍然很容易提取我可以提供给gnuplot的表。 不想重新发明轮子并开发出完整的文件格式,在创建,处理和存储来自计算或仿真的数据时,是否有一些“标准”最适合使用?甚至是SQL数据库格式?     
已邀请:
        有很多方法,但都不是太好。我将分享两个: 如果程序值得,我可以添加一个小的配置文件解析器。然后,我只是制作一个cofig,假设为
SimA.in
,而模拟器会生成一堆文件,其数据分别为
SimA.paths
SimA.stats
SimA.log
等。除非名称是唯一的,并且我添加了要记录的代码版本,否则结果完全可重现,并且仿真本身具有足够的可移植性,易于管理。 如果没有,我只是包装一下代码,然后使用R作为主机。然后,我只返回所有数组和标量(R数据结构非常灵活,并且很容易转换本机R或C结构),并使用R来管理,保存/加载以及当然可视化和分析数据。此外,借助Sweave和CacheSweave,可以将整个执行,分析和报告捆绑在一起,并可以通过一个命令完全重现。 如果要使用“企业”解决方案,请尝试使用NetCDF或HDF5。但我觉得这可能是一个过大的杀伤力。 当然,必须对模拟器代码进行版本控制。但这很明显=)     
        对于我目前正在使用Python和C ++(通过SWIG)进行的项目,我计划使用简短的python脚本作为输入文件。因此,以某种方式,我将“破解源代码”以更改参数,但使用一种解释性语言,而不是一种编译语言。 目前,我打算有一个输入文件,例如
parameters.py
,并使用它像
from parameters import params
。但这可能过于依赖正确的语法。
params = {
\"foods\" : [\"spam\", \"beans\", \"eggs\"],
\"costs\" : [199, 4, 1],
\"customerAge\" : 23,
}
另一种选择是仅在ѭ7中的脚本级别定义变量。这样就失去了很好的字典包装,但使用户更难以将其弄乱。编写一个“ parser”将那些脚本级变量放入一个漂亮的字典中可能并不难。该方法的一个优点是,用户可以参数化最初不考虑的内容-8会覆盖这些参数的先前定义。当然,如果用户覆盖了重要的内容,这可能是不好的。
foods = [\"spam\", \"beans\", \"eggs\"]
costs = [199, 4, 1]
customerAge = 23
parameters3.py
会使用一个类,尽管Python对缩进的顽强禁忌。
from parameters3 import params
class params:
    foods = [\"spam\", \"beans\", \"eggs\"]
    costs = [199, 4, 1]
    customerAge = 23
为了完整起见,我还应该提到我们的C ++代码还定义了一个参数类。也就是说,在我们的实际项目中,parameters.py是对应的C ++类的SWIG包装。您会像ѭ13那样使用。但是,这仅允许在C ++类中已经声明的参数。
import parameters
params = parameters.Parameters()
params.foods = [\"spam\", \"beans\", \"eggs\"]
params.costs = [199, 4, 1]
params.customerAge = 23
    

要回复问题请先登录注册