Python中的split（\'\\\\ n\'）方法如何实现？

| 这是一个理论问题，可以理解Java和Python之间的差异。要将文件的内容读入Java数组中，需要知道行数，以便在声明数组时定义数组的大小。而且由于您无法事先知道它，因此您需要应用一些技巧来克服该问题。但是在Python中，列表可以是任意大小，因此可以通过以下方式将文件内容读入列表：

lines = open(\'filename\').read().split(\'\\n\')

要么

lines = open(\'filename\').readlines()

在这种情况下，split（\'\\ n \'）如何工作？ Python实现是否还在下面执行某种技巧（例如在需要时将数组的大小加倍等等）？对此有任何启发的信息将不胜感激。

已邀请:

5 个回复

奥李

str.split()的实现内部调用list.append()，后者又调用内部函数list_resize()。从此函数的源代码中的注释：这与列表大小成比例地过度分配，从而留出了空间以获得额外的增长。过度分配是轻微的，但是足以长期提供线性时间摊销行为在表现不佳的情况下的appends（）序列系统realloc（）。增长模式是：0、4、8、16、25、35、46、58、72、88，...

蹄渭信妥扳

如果您正在寻找实现它的实际代码，请尝试以下操作： http://svn.python.org/view/python/trunk/Objects/stringlib/split.h?view=markup 对于“基本”拆分，请开始查看第148行。简短摘要：他们在字符串中循环查找定义的拆分字符，然后使用\“ PyList_Append \”将最后一个查找和当前查找之间的字符串（或第一种情况的字符串开头）添加到输出元组。最后，他们将字符串的其余部分添加到元组。它们具有占位符，可以在结果元组达到当前最大大小时为其分配更多空间，并具有用于检查单个拆分字符与另一个拆分字符串的独立函数（即，如果要在\'/ t \'上拆分）您可以通过一个单独的功能将其设置为两个字符）。

朗排谎纷瘟

我认为（尽管我没有重新检查代码）split（）方法计算字符串中换行的数量，然后分配一个正确大小的列表。但是，所有Python列表都具有总体分布，因此重复地附加到它们上面就是摊销的线性时间。

细屠截殴些

您可以检查1）http://svn.python.org/view/python/trunk/Objects/listobject.c?view=markup 2）http://svn.python.org/view/python/trunk/Include/listobject.h?view=markup 简而言之，Java：矢量:: Python：列表

公藕

split( [sep [,maxsplit]]) 使用sep作为分隔符字符串，返回字符串中单词的列表。如果给出maxsplit，则最多完成maxsplit分割。（因此，列表最多包含maxsplit + 1个元素）。如果未指定maxsplit，则分割数没有限制（进行所有可能的分割）。连续定界符未分组在一起，因此被视为定界空字符串（例如 \'1„2\'.split(\',\')返回[\'1\', \'\', \'2\']。 sep参数可以包含多个字符例如， \'1, 2, 3\'.split(\', \')返回[\'1\', \'2\', \'3\']。使用指定的分隔符分割空字符串将返回[\'\']。 docs.python.org

要回复问题请先登录或注册

Python中的split（\'\\\\ n\'）方法如何实现？

5 个回复

发起人

python

split

问题状态

Python中的split（\'\\\\ n\'）方法如何实现？

与内容相关的链接

5 个回复

发起人

python

split

问题状态