Python中的split(\'\\\\ n\')方法如何实现?

| 这是一个理论问题,可以理解Java和Python之间的差异。 要将文件的内容读入Java数组中,需要知道行数,以便在声明数组时定义数组的大小。而且由于您无法事先知道它,因此您需要应用一些技巧来克服该问题。 但是在Python中,列表可以是任意大小,因此可以通过以下方式将文件内容读入列表:
lines = open(\'filename\').read().split(\'\\n\')
要么
lines = open(\'filename\').readlines()
在这种情况下,split(\'\\ n \')如何工作? Python实现是否还在下面执行某种技巧(例如在需要时将数组的大小加倍等等)? 对此有任何启发的信息将不胜感激。     
已邀请:
str.split()
的实现内部调用
list.append()
,后者又调用内部函数
list_resize()
。从此函数的源代码中的注释:   这与列表大小成比例地过度分配,从而留出了空间   以获得额外的增长。过度分配是轻微的,但是   足以长期提供线性时间摊销行为   在表现不佳的情况下的appends()序列   系统realloc()。      增长模式是:0、4、8、16、25、35、46、58、72、88,...     
如果您正在寻找实现它的实际代码,请尝试以下操作: http://svn.python.org/view/python/trunk/Objects/stringlib/split.h?view=markup 对于“基本”拆分,请开始查看第148行。 简短摘要:他们在字符串中循环查找定义的拆分字符,然后使用\“ PyList_Append \”将最后一个查找和当前查找之间的字符串(或第一种情况的字符串开头)添加到输出元组。最后,他们将字符串的其余部分添加到元组。 它们具有占位符,可以在结果元组达到当前最大大小时为其分配更多空间,并具有用于检查单个拆分字符与另一个拆分字符串的独立函数(即,如果要在\'/ t \'上拆分)您可以通过一个单独的功能将其设置为两个字符)。     
我认为(尽管我没有重新检查代码)split()方法计算字符串中换行的数量,然后分配一个正确大小的列表。 但是,所有Python列表都具有总体分布,因此重复地附加到它们上面就是摊销的线性时间。     
您可以检查1)http://svn.python.org/view/python/trunk/Objects/listobject.c?view=markup  2)http://svn.python.org/view/python/trunk/Include/listobject.h?view=markup 简而言之,Java:矢量:: Python:列表     
split( [sep [,maxsplit]])
使用sep作为分隔符字符串,返回字符串中单词的列表。如果给出maxsplit,则最多完成maxsplit分割。 (因此,列表最多包含maxsplit + 1个元素)。如果未指定maxsplit,则分割数没有限制(进行所有可能的分割)。连续定界符未分组在一起,因此被视为定界空字符串(例如
\'1„2\'.split(\',\')
返回
[\'1\', \'\', \'2\']
。 sep参数可以包含多个字符 例如,
\'1, 2, 3\'.split(\', \')
返回
[\'1\', \'2\', \'3\']
。 使用指定的分隔符分割空字符串将返回
[\'\']
。 docs.python.org     

要回复问题请先登录注册