返回首页

如何找到文本/ 1使用C#网站的HTML比我想知道,如何多页的部分(百分比)是文字和多少是HTML,这种意愿给你1网站内分析,这是有用的搜索引擎优化。

回答

评论会员:游客 时间:2012/02/04
Mash50:我不认为有像这样的东西,内置。首先,你应该尝试创建HTML解析器为确定从页面的所有控件/标签/元素(如LT;D​​IV/GT,LT;输入/,H1/GT,LT;脚本...)确定的所有元素(左字符可能是文字)后,不应该有一个问题,计算文本/HTMLratio.lt;/SCRIPT:Abhijit安娜:您的所有问题首先是不明确的。请具体根据您的需求。我理解的是,你要找到你页面的控制。有关Document.GetElementById或$('#'控件ID")找到该项目?例如,警报(("控件ID"));:阿里・Omairi(阿布AlHassan)
这里的东西非常的原油,将让你开始:


 

string myHtml = ... // (whatever your text is...



int textlLength = Regex.Replace(myHtml, "<[^>]*>", String.Empty).Length;

double textToHtmlRatio = (double)textlLength / (double)(myHtml.Length);

NETE使用的正则表达式去掉HTML是非常粗糙的。你真的需要使用一个分析器是准确的,至少你需要处理的编码字符(如放大器;放大器;等)
评论会员:游客 时间:2012/02/04
克里斯・蒙德:mash50520似乎是正确的,我觉得我有放弃的HTML页面
vineeta2011
评论会员:游客 时间:2012/02/04
codeprelang="c#"prelang="CSS"ahref=""/a[ahref=""target="_blank"/a]ahref=""/a&bigsmall/small/big/pre/code