从网页中提取日期
|
我想从网页中提取不同格式的日期。我正在使用Selenium2 Java API与浏览器进行交互。我也使用jQuery进一步与文档进行交互。因此,欢迎为这两层提供解决方案。
日期在不同的区域中可以具有非常不同的格式。另外,月份名称可以写为文本或数字。我需要尽可能地匹配日期,并且我知道有很多组合的事实。
例如,如果我有这样的HTML元素:
<div class=\"tag_view\">
Last update: May,22,2011
View :40
</div>
我希望提取和识别日期的相关部分:
May,22,2011
现在应该将其转换为常规的Java Date对象。
更新资料
这应该适用于任何网页上的HTML,日期可以以任何格式包含在任何元素中。例如,在Stackoverflow上,源代码如下所示:
<span class=\"relativetime\" title=\"2011-05-13 14:45:06Z\">May 13 at 14:45</span>
我希望它以最有效的方式完成,我想这将是一个返回标准日期表示形式的jQuery选择器或过滤器。但我愿意接受您的建议。
没有找到相关结果
已邀请:
3 个回复
田眯衅
您可以通过四处搜索来查找更多日期正则表达式,或者自己制作它们,这非常容易。需要注意的一件事:您可能会结合上面的一些正则表达式来创建更有效的程序。我会非常小心,这可能会导致您的代码变得难以快速阅读。每个日期格式做一个正则表达式看起来更干净。
盛虱
乏摩纶誊伟