在Perl中编码时,代码中的错误相当明显——解析器会将所有错误信息都显示在屏幕上,向你警告出现的问题,并让你立即采取措施进行更正。如果你在开发HTML页面,就不存在这样的早期警告系统——标记中出现的任何错误都被浏览器所忽略。更糟糕的是,一些浏览器甚至试图“自动”更正常见的标记错误,给这个过程带来许多新问题。
在Perl中编码时,代码中的错误相当明显——解析器会将所有错误信息都显示在屏幕上,向你警告出现的问题,并让你立即采取措施进行更正。如果你在开发HTML页面,就不存在这样的早期警告系统——标记中出现的任何错误都被浏览器所忽略。更糟糕的是,一些浏览器甚至试图“自动”更正常见的标记错误,给这个过程带来许多新问题。
最简单的解决方案是在应用HTML之前对它进行检测(或“验证”)。这时就要用到一个称为HTML::Lint的有用CPAN模块。这个Perl模块建立在人们所熟知的HTML::Parser模块之上,旨在对标记进行检验,看其是否符合W3C标准,并指出可能使它“中断”或在客户浏览器中无法编译的错误。
本文探讨了HTML::Lint的一些功能,用它来检验HTML页面并显示发现的错误。首先,在Perl提示符下运行下列命令,下载并安装此模块(如果你还没有这个模块的话)。
perl> perl -MCPAN -e "install HTML::Lint"
Linting Files
安装模块后,建立并保存下面的HTML文件(保存为abc.html):
<html>
<head></head>
A is for apple, B is for baby
</body>
</html>
如你所见,此文件中有一个有意的错误——开头缺少<body>标签。这个错误在这里相当明显;但如果文件更大更复杂的话,就更难发觉缺少这样的标签。这就是为什么下一步要编写一些Perl代码,用HTML::Lint来探测这个错误。
建立并保存下列的脚本(保存为linter.pl):
#!/usr/bin/perl
# initialize linter
use HTML::Lint;
$lint = HTML::Lint->new();
# parse file
$lint->parse_file("abc.html") or die("Cannot find file!");
# check for errors
($lint->err) ? print "Your code stinks!" : print "Your code rocks!";
这个过程相当简单:这段脚本初始化一个HTML::Lint对象,然后应用对象的parse_file()方法来解析前面建立的HTML文件。检测到的错误(如果存在的话)被存储在@err数组中,并向控制台显示一个错误信息。
以下是你看到的输出结果:
shell> ./linter.plYour code stinks!
当然,如果你有大量的文件要进行验证的话,这段代码就有点不切实际。在那种情况下,你可能想在运行时向脚本提交HTML文件名及路径,而不是把它硬编码到脚本中。列表A是前面脚本的修订版,正好可完成这一工作。
列表A
#!/usr/bin/perl
# read file name from command line
if (!$ARGV[0]) { die ("ERROR: No file name provided"); }
# initialize linter
use HTML::Lint;
$lint = HTML::Lint->new();
# parse file
$lint->parse_file($ARGV[0]) or die("ERROR: Cannot find file");
# check for errors
($lint->err) ? print "Your code stinks! " : print "Your code rocks! ";
# print error count
print "Errors found: ", scalar($lint->err);
在这种情况下,脚本认为一个文件路径是它的第一个引数,并将其保存在特殊的Perl @ARGV数组中。然后,脚本寻找这个文件,将它解析,并根据发现错误与否显示一条信息。脚本的最后一行是新的:它根据HTML::Lint的@err错误数组的大小,显示由解析器发现的错误数目。
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!