Perl 简明教程
PERL and CGI Tutorial
What is CGI ?
通用网关接口或 CGI 是一组定义在 Web 服务器和自定义脚本之间如何交换信息的标准。
CGI 规范由 NCSA 维护,NCSA 对 CGI 的定义如下 −
通用网关接口 (CGI) 是外部网关程序与诸如 HTTP 服务器等信息服务器进行交互的标准。
当前版本为 CGI/1.1,CGI/1.2 正在进行中。
Web Browsing
为了理解 CGI 的概念,让我们看看当我们点击超链接以浏览特定网页或 URL 时会发生什么。
-
您的浏览器会联系 HTTP Web 服务器并要求 URL,即文件名。
-
Web 服务器将解析 URL,并将寻找文件名,如果发现该文件,则会将其发送回浏览器,否则会发送一条错误消息,指出您请求了错误的文件。
-
网页浏览器接受网页服务器的响应并显示收到的文件或错误消息。
但是,可以对 HTTP 服务器进行设置,以便在请求某个目录中的文件时不将该文件发回;而是将其作为程序执行,并将其程序输出发送回浏览器以供其显示。此功能称为网关接口或 CGI,而程序称为 CGI 脚本。这些 CGI 程序可以是 PERL 脚本、Shell 脚本、C 或 C++ 程序等。
Web Server Support & Configuration
在继续进行 CGI 编程之前,请确保您的 Web 服务器支持 CGI 并且已配置为处理 CGI 程序。HTTP 服务器执行的所有 CGI 程序都保存在一个预先配置的目录中。此目录称为 CGI 目录,根据惯例将其命名为 /cgi-bin。惯例上,PERL CGI 文件的扩展名是 .cgi 。
First CGI Program
#!/usr/bin/perl
print "Content-type:text/html\r\n\r\n";
print '<html>';
print '<head>';
print '<title>Hello Word - First CGI Program</title>';
print '</head>';
print '<body>';
print '<h2>Hello Word! This is my first CGI program</h2>';
print '</body>';
print '</html>';
1;
HTTP Header
行 Content-type:text/html\r\n\r\n 是发送到浏览器的 HTTP 头的一部分,用于理解内容。所有 HTTP 头都将采用以下形式
HTTP Field Name: Field Content
例如
Content-type:text/html\r\n\r\n
在 CGI 编程中,您经常会用到其他一些重要的 HTTP 头。
S.No. |
Header & Description |
1 |
Content-type: String 一个定义正在返回的文件格式的 MIME 字符串。示例是 Content-type:text/html |
2 |
Expires: Date String 信息变为无效的日期。浏览器应该使用它来决定需要刷新页面的时候。有效的日期字符串应该采用 01 Jan 1998 12:00:00 GMT 格式。 |
3 |
Location: URL String 应该返回的 URL,而不是请求的 URL。你可以使用此项字段将一个请求重定向到任何文件。 |
4 |
Last-modified: String 资源上次修改的日期。 |
5 |
Content-length: String 要返回的数据的长度(以字节为单位)。浏览器使用此值报告文件的估计下载时间。 |
6 |
Set-Cookie: String 设置通过字符串传递的 Cookie |
CGI Environment Variables
所有 CGI 程序都将能够访问以下环境变量。这些变量在编写任何 CGI 程序时发挥着重要作用。
S.No. |
Variable Name & Description |
1 |
CONTENT_TYPE 内容的数据类型。在客户端向服务器发送附加内容时使用。例如,文件上传等。 |
2 |
CONTENT_LENGTH 查询信息的长度。它仅适用于 POST 请求。 |
3 |
HTTP_COOKIE 以键值对的形式返回设置的 cookie。 |
4 |
HTTP_USER_AGENT User-Agent 请求标头字段包含有关发出请求的用户代理的信息。它的 web 浏览器的名称。 |
5 |
PATH_INFO CGI 脚本的路径。 |
6 |
QUERY_STRING 随 GET 方法请求而发送的 URL 编码信息。 |
7 |
REMOTE_ADDR 发出请求的远程主机的 IP 地址。这对于记录或认证目的非常有用。 |
8 |
REMOTE_HOST 发出请求的主机的完全限定域名。如果此信息不可用,则可以使用 REMOTE_ADDR 获取 IR 地址。 |
9 |
REQUEST_METHOD 用于发出请求的方法。最常见的方法是 GET 和 POST。 |
10 |
SCRIPT_FILENAME CGI 脚本的完整路径。 |
11 |
SCRIPT_NAME CGI 脚本的名称。 |
12 |
SERVER_NAME 服务器的主机名或 IP 地址。 |
13 |
SERVER_SOFTWARE 服务器正在运行的软件的名称和版本。 |
#!/usr/bin/perl
print "Content-type: text/html\n\n";
print "<font size=+1>Environment</font>\n";
foreach (sort keys %ENV) {
print "<b>$_</b>: $ENV{$_}<br>\n";
}
1;
Output
Environment CONTEXT_DOCUMENT_ROOT:
CONTEXT_PREFIX:
DOCUMENT_ROOT:
GATEWAY_INTERFACE:
GEOIP_ADDR:
GEOIP_CONTINENT_CODE:
GEOIP_COUNTRY_CODE:
GEOIP_COUNTRY_NAME:
HTTP_ACCEPT:
HTTP_ACCEPT_ENCODING:
HTTP_ACCEPT_LANGUAGE:
HTTP_COOKIE:
HTTP_HOST:
HTTP_UPGRADE_INSECURE_REQUESTS:
HTTP_USER_AGENT:
HTTP_VIA:
HTTP_X_FORWARDED_FOR:
HTTP_X_FORWARDED_PROTO:
HTTP_X_HOST:
PATH:
QUERY_STRING:
REMOTE_ADDR:
REMOTE_PORT:
REQUEST_METHOD:
REQUEST_SCHEME:
REQUEST_URI:
SCRIPT_FILENAME:
SCRIPT_NAME:
SCRIPT_URI:
SCRIPT_URL:
SERVER_ADDR:
SERVER_ADMIN:
SERVER_NAME:
SERVER_PORT:
SERVER_PROTOCOL:
SERVER_SIGNATURE:
SERVER_SOFTWARE:
UNIQUE_ID:
How To Raise a "File Download" Dialog Box ?
有时候,你会希望提供一个选项,用户点击链接后将会为用户弹出“文件下载”对话框,而不是显示实际内容。这非常容易,可以通过 HTTP 标头实现。
此 HTTP 标头将与上一部分提到的标头不同。
例如,如果你想让用户可以通过给定的链接下载一个 FileName 文件,那么它的语法如下。
#!/usr/bin/perl
# HTTP Header
print "Content-Type:application/octet-stream; name=\"FileName\"\r\n";
print "Content-Disposition: attachment; filename=\"FileName\"\r\n\n";
# Actual File Content will go hear.
open( FILE, "<FileName" );
while(read(FILE, $buffer, 100) ) {
print("$buffer");
}
GET and POST Methods
你一定遇到过许多需要将某些信息从浏览器传递到网络服务器,最终再传递到 CGI 程序的情况。浏览器最常采用两种方法将此信息传递给网络服务器。这些方法是 GET 方法和 POST 方法。
Passing Information using GET method
GET 方法将编码的用户信息附加到页面请求中发送。页面和编码后信息通过 ? 字符分隔,如下所示 − http://www.test.com/cgi-bin/hello.cgi?key1=value1&key2=value2
GET 方法是将信息从浏览器传递到网络服务器的默认方法,它会在浏览器的地址栏中生成一个长字符串。如果需要将密码或其他敏感信息传递到服务器,请不要使用 GET 方法。GET 方法有大小限制:请求字符串中只能有 1024 个字符。
此信息使用 QUERY_STRING 标头传递,并且可以通过 QUERY_STRING 环境变量在 CGI 程序中访问。
您可以通过简单地连接键和值对以及任意 URL 来传递信息,或者可以使用 HTML <FORM> 标记使用 GET 方法传递信息。
Simple URL Example : Get Method
下面是一个简单的 URL,它将两个值传递给 hello_get.cgi 程序,并使用 GET 方法。
以下是处理网络浏览器提供输入的 hello_get.cgi 脚本。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "GET") {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
$first_name = $FORM{first_name};
$last_name = $FORM{last_name};
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Hello - Second CGI Program</title>";
print "</head>";
print "<body>";
print "<h2>Hello $first_name $last_name - Second CGI Program</h2>";
print "</body>";
print "</html>";
1;
Simple FORM Example: GET Method
这是一个简单的示例,它使用 HTML FORM 和 submit 按钮传递两个值。我们将使用相同的 CGI 脚本 hello_get.cgi 来处理此输入。
<FORM action = "/cgi-bin/hello_get.cgi" method = "GET">
First Name: <input type = "text" name = "first_name"> <br>
Last Name: <input type = "text" name = "last_name">
<input type = "submit" value = "Submit">
</FORM>
以下是以上表单的实际输出,您输入名字和姓氏,然后单击 submit 按钮即可看到结果。
First Name:
Last Name:
Passing Information using POST method
向 CGI 程序传递信息的一个通常更为可靠的方法是 POST 方法。此方法将信息打包的方式与 GET 方法完全相同,但是不是在 URL 中的 ? 之后作为文本字符串发送信息,而是作为单独的消息发送信息。此消息以标准输入的形式进入 CGI 脚本。
以下是处理网络浏览器提供输入的 hello_post.cgi 脚本。此脚本将处理 GET 方法和 POST 方法。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
$first_name = $FORM{first_name};
$last_name = $FORM{last_name};
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Hello - Second CGI Program</title>";
print "</head>";
print "<body>";
print "<h2>Hello $first_name $last_name - Second CGI Program</h2>";
print "</body>";
print "</html>";
1;
让我们再次采用上面相同的示例,它使用 HTML FORM 和 submit 按钮传递两个值。我们将使用 CGI 脚本 hello_post.cgi 来处理此输入。
<FORM action = "/cgi-bin/hello_post.cgi" method="POST">
First Name: <input type="text" name="first_name"> <br>
Last Name: <input type="text" name="last_name">
<input type="submit" value="Submit">
</FORM>
以下是以上表单的实际输出,您输入名字和姓氏,然后单击 submit 按钮即可看到结果。
First Name:
Last Name:
Passing Checkbox Data to CGI Program
如果要求选择多个选项,则使用复选框。
下面提供了包含两个复选框的表单示例 HTML 代码
<form action = "/cgi-bin/checkbox.cgi" method = "POST" target = "_blank">
<input type = "checkbox" name = "maths" value = "on"> Maths
<input type = "checkbox" name = "physics" value = "on"> Physics
<input type = "submit" value = "Select Subject">
</form>
此代码的结果是以下表单
Maths
Physics
下面是 checkbox.cgi 脚本,用于处理 Web 浏览器针对单选按钮提供的输入。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
if( $FORM{maths} ) {
$maths_flag ="ON";
} else {
$maths_flag ="OFF";
}
if( $FORM{physics} ) {
$physics_flag ="ON";
} else {
$physics_flag ="OFF";
}
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Checkbox - Third CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> CheckBox Maths is : $maths_flag</h2>";
print "<h2> CheckBox Physics is : $physics_flag</h2>";
print "</body>";
print "</html>";
1;
Passing Radio Button Data to CGI Program
如果要求只选择一个选项,则使用单选按钮。
这是一个带有两个单选按钮的表单的示例 HTML 代码 −
<form action = "/cgi-bin/radiobutton.cgi" method = "POST" target = "_blank">
<input type = "radio" name = "subject" value = "maths"> Maths
<input type = "radio" name = "subject" value = "physics"> Physics
<input type = "submit" value = "Select Subject">
</form>
这段代码的结果是以下表单−
Maths
Physics
下面是 radiobutton.cgi 脚本,用于处理 Web 浏览器针对单选按钮提供的输入。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
$subject = $FORM{subject};
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Radio - Fourth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Selected Subject is $subject</h2>";
print "</body>";
print "</html>";
1;
Passing Text Area Data to CGI Program
如果必须将多行文本传递给 CGI 程序,则使用 TEXTAREA 元素。
这是一个包含一个 TEXTAREA 框的表单的示例 HTML 代码−
<form action = "/cgi-bin/textarea.cgi" method = "POST" target = "_blank">
<textarea name = "textcontent" cols = 40 rows = 4>
Type your text here...
</textarea>
<input type = "submit" value = "Submit">
</form>
这段代码的结果是以下表单−
Type your text here...
下面是 textarea.cgi 脚本,用于处理 Web 浏览器提供的输入。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
$text_content = $FORM{textcontent};
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Text Area - Fifth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Entered Text Content is $text_content</h2>";
print "</body>";
print "</html>";
1;
Passing Drop Down Box Data to CGI Program
当我们有许多可用选项,但只选择一个或两个时,可以使用下拉框。
这里有一个用于带有下拉框的表单的 HTML 代码示例
<form action = "/cgi-bin/dropdown.cgi" method = "POST" target = "_blank">
<select name = "dropdown">
<option value = "Maths" selected>Maths</option>
<option value = "Physics">Physics</option>
</select>
<input type = "submit" value = "Submit">
</form>
这段代码的结果是以下表单−
Maths
Physics
下面是 dropdown.cgi 脚本,用于处理 Web 浏览器提供的输入
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
$subject = $FORM{dropdown};
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Dropdown Box - Sixth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Selected Subject is $subject</h2>";
print "</body>";
print "</html>";
1;
Using Cookies in CGI
HTTP 协议是一种无状态协议。但是,对于商业网站,需要在不同页面之间维护会话信息。例如,用户注册在完成多个页面后结束。但是,如何在所有 Web 页面中维护用户的会话信息。
在许多情况下,使用 cookie 是记忆和跟踪偏好、购买、佣金和其他信息最有效的方法,而这些信息对于提升访问者体验或网站统计至关重要。
How It Works
您的服务器会以 Cookie 的形式向访客的浏览器发送一些数据。浏览器可能会接受 Cookie。如果接受,它将作为纯文本记录存储在访客硬盘上。现在,当访客到达您站点上的另一个页面时,可以检索 Cookie。检索后,您的服务器知道/记住存储的内容。
Cookie 是纯文本数据记录,包含 5 个可变长度字段:
-
Expires − cookie 的过期日期。如果留空,则 cookie 将在访问者退出浏览器时过期。
-
Domain − 您网站的域名。
-
Path − 设置 cookie 的目录或网页的路径。如果您希望从任何目录或页面检索 cookie,则可以留空。
-
Secure - 如果此字段包含单词“secure”,则只能通过安全服务器来检索 cookie。如果此字段为空,则不存在此类限制。
-
Name=Value - Cookie 以键值对的形式进行设置和提取。
Setting up Cookies
以 cookie 形式将 Cookie 发送到浏览器非常容易。这些 Cookie 将随 HTTP 标头一起发送。假设你想将 UserID 和 Password 设为 Cookie。则它将按如下方式完成 −
#!/usr/bin/perl
print "Set-Cookie:UserID=XYZ;\n";
print "Set-Cookie:Password=XYZ123;\n";
print "Set-Cookie:Expires=Tuesday, 31-Dec-2007 23:12:40 GMT";\n";
print "Set-Cookie:Domain=www.tutorialspoint.com;\n";
print "Set-Cookie:Path=/perl;\n";
print "Content-type:text/html\r\n\r\n";
...........Rest of the HTML Content....
根据此示例,你一定理解了如何设置 Cookie。我们使用 Set-Cookie HTTP 标头来设置 Cookie。
在此,可以选择设置 Expires、Domain 和 Path 等 Cookie 属性。值得注意的是,Cookie 是在发送魔法行 "Content-type:text/html\r\n\r\n 之前设置的。
Retrieving Cookies
提取所有设置的 Cookie 非常容易。Cookie 存储在 CGI 环境变量 HTTP_COOKIE 中,它们将具有以下形式。
key1=value1;key2=value2;key3=value3....
下面是一个如何检索 Cookie 的示例。
#!/usr/bin/perl
$rcvd_cookies = $ENV{'HTTP_COOKIE'};
@cookies = split /;/, $rcvd_cookies;
foreach $cookie ( @cookies ) {
($key, $val) = split(/=/, $cookie); # splits on the first =.
$key =~ s/^\s+//;
$val =~ s/^\s+//;
$key =~ s/\s+$//;
$val =~ s/\s+$//;
if( $key eq "UserID" ) {
$user_id = $val;
} elsif($key eq "Password") {
$password = $val;
}
}
print "User ID = $user_id\n";
print "Password = $password\n";
This will produce following result
User ID = XYZ
Password = XYZ123