消除文本文件中某些模式的最简单方法

|| 我有一个vCard文件,其中包含数千个联系人。在vCard文件中,联系人被串在一起,并且单个联系人被
BEGIN:VCARD
...    
END:VCARD
公司或组织可以由
ORG;CHARSET=UTF-8:My Company;    
我正在寻找最简单的方法来消除没有公司的每个条目。我不在乎它是脚本语言还是Notepad ++。 有什么建议么?谢谢!     
已邀请:
您是否考虑过正则表达式? 您可以创建一个需要company字段的正则表达式,然后存储结果捕获。没有公司字段的任何元素都不会被捕获,因此将被删除。 例如:
BEGIN:VCARD
...
ORG;CHARSET=UTF-8:My Company;
...
END:VCARD
BEGIN:VCARD
...
...
END:VCARD
BEGIN:VCARD
...
ORG;CHARSET=UTF-8:My Company;
...
END:VCARD
您可以使用以下命令捕获单个vCard:
BEGIN:VCARD\\s+(.*?$\\s+)+?END:VCARD
然后,对于每个匹配项,如果捕获的字符串也匹配:match4ѭ,则保留它。如果不匹配,则没有companyName,因此请不要保存。 我确定您可以使用一个Regex来做到这一点,但这可以解决问题,对我有用     

要回复问题请先登录注册