Ruby程序设计语言快速入门(七)-------之数字、字符串和其它

 在Ruby中,一切都是对象。更精确地说,Ruby中的一切都是一个具有完整功能的对象。因此,在Ruby中,数字4,定点数3.14和字符串"Hi"都是对象。显然,它们是有点"特殊"的,因为你不必使用new方法来创建它们。代之的是,你使用例如"literal 4"这样的形式来创建一个代表数字4的对象的实例。

  然而,对于绝大多数人来说,学习一种新的编程语言时,首先理解该语言提供的"标准"类型是非常有用的。所以,在这一节,我们先探讨数字类型,字符串类型,布尔类型和另外一些基本的Ruby数据类型。

  数字类型

  实质上,Ruby中的数字被分为整数和浮点数两大类。其中,整数又被进一步细分为"常规大小"的整数和大型整数。因为在Ruby中一切都是对象,所以整数和浮点数都是按类来定义的(见图1)。从图1看出,Numeric是所有数字类型的基类,Float和Integer类是Numeric的子类。Fixnum和Bignum都是Integer的子类型-它们分别定义了"常规大小"的整数和大型整数。


图1.Ruby的数字类型类继承图。

  Literal用来描述这些类的实例。下面的在交互式Ruby外壳(irb)中的代码显示了Float,Fixnum和Bignum的literal实例。注意,可以在literal上进行方法调用(在此,是指类方法)。

irb(main):001:0> 3.class
=> Fixnum
irb(main):002:0> 3.4.class
=> Float
irb(main):003:0> 10000000000000000000.class
=> Bignum 

  还有另外一些语法用来创建数字类型,显示于下面的代码列表中。字母E可以用来描述以指数标志的数字。数字的前面加上0代表这是一个八进制数,加上0x代表这是一个十六进制数,而0b代表是一个二进制数。为清晰起见,下划线可以用作数字中的分隔符号。注意,当写literal时,不要用逗号作为分隔符号。在一些情况中,这实际上能生成一个数组,我们将在后面讨论。最后,在一个字符(或Ctrl或元字符的组合)前面的一个问号将会创建一个Fixnum的实例,相应于字符的ASCII字符/逃逸序列值。

<
irb(main):001:0> 3.14E5 #指数标志
=> 314000.0
irb(main):002:0> 054 #八进制
=> 44
irb(main):003:0> 0x5A #十六进制
=> 90
irb(main):004:0> 0b1011 #二进制
=> 11
irb(main):005:0> 10_000 #10,000,用下划线隔开
=> 10000
irb(main):006:0> i=10,000 #创建一个数组而不是10000 Fixnum
=> [10, 0]
irb(main):007:0> i.class
=> Array
irb(main):008:0> ?Z #Fixnum ASCII值
=> 90
irb(main):009:0> ?Z.class
=> Fixnum
irb(main):010:0> ?\C-s #Control-s的值ASCII
=> 19 

  Fixnum和Bignum实例间的真实差别是什么?Fixnum整数可以被存储在机器中的一个字(通常16,32或64位)中,但减去1个位;而Bignum实例是超出固定存储空间的整数。当然,作为开发者,你不必担心整数的大小(见下面的例子),由Ruby负责为你实现Fixnum和Bignum之间的自动转换!

irb(main):001:0> i=4
=> 4
irb(main):002:0> i.class
=> Fixnum
irb(main):003:0> i=i+100000000000000
=> 100000000000004
irb(main):004:0> i.class
=> Bignum
irb(main):005:0> i=i-100000000000000
=> 4
irb(main):006:0> i.class
=> Fixnum

 字符串

  在Ruby中,字符串是任意顺序的字节。通常,它们是一个字符序列。在Ruby中,可以使用一个literal或new方法来创建String类的实例。

irb(main):001:0> s1="Hello World"
=> "Hello World"
irb(main):002:0> s2=String.new("Hello World")
=> "Hello World" 

  当然,String中定义了许多方法(和操作符)。另外,可以使用单引号或双引号来指定一个字符串。双引号情况下允许串中加入逃逸字符并能够嵌入待计算的表达式。在单引号串情况下,你看到的就是串中的实际内容。为了更好的理解,请看下列例子。

irb(main):001:0> str1='a \n string'
=> "a \\n string"
irb(main):002:0> str2="a \n string"
=> "a \n string"
irb(main):003:0> puts str1
a \n string
=> nil
irb(main):004:0> puts str2

string
=> nil
irb(main):005:0> 'try to add #{2+2}'
=> "try to add \#{2+2}"
irb(main):006:0> "try to add #{2+2}"
=> "try to add 4"
irb(main):007:0> this="that"
=> "that"
irb(main):008:0> 'when single quote rights #{this}'
=> "when single quote rights \#{this}"
irb(main):009:0> "double quote rights #{this}"
=> "double quote rights that" 

  请注意,在显示之前,双引号中的文本是如何被计算的,其中包括了逃逸符号(\n)和表达式(#{2+2})。

  除了使用单引号和双引号来定义一个字符串literal外,在Ruby中,还有另外的方法可以表达literal。一个百分号和小写或大写字母Q可以用来表达一个字符串,分别相应于单引号或双引号风格。

irb(main):001:0> %q@this is a single quote string #{2+2} here@
=> "this is a single quote string \#{2+2} here"
irb(main):002:0> %Q@this is a double quote string #{2+2} here@
=> "this is a double quote string 4 here" 

  注意,跟随在q%或Q%后面的字符分别定义了字符串literal的开始和结束。在本例中,@符号用作字符串开始与结束的限界符号。

  还应该注意,Ruby并没有区分一个字符串和一个字符。也就是说,没有适用于单个字符的特定的类-它们仅是一些小的字符串。

      布尔类型

  最后,让我们再看一下布尔类型。在Ruby中,有两个类用于表达布尔类型:TrueClass和FalseClass。每个这些类仅有一个实例(一个singleton):也就是true和false。这些是可在Ruby的任何地方存取的全局值。还有一个类NilClass。NilClass也仅有一个实例nil-表示什么也没有。然而,在布尔逻辑中,nil是false的同义词。

irb(main):001:0> true|false
=> true
irb(main):002:0> true&false
=> false
irb(main):003:0> true|nil
=> true
irb(main):004:0> true&nil
=> false 

  正规表达式

  大多数程序语言中都使用正规表达式。基于许多脚本语言的Ruby也广泛地使用正规表达式。我的一个同事曾经说"正规表达式太复杂了。"换句话说,你需要花费一些时间来学习正规表达式。在本文中,你仅能一瞥Ruby正规表达式的威力。在程序开发中,你不必一定使用正规表达式,但是如果使用这种工具,你的编码将更为紧凑而容易。而且,如果你想成为一名Ruby大师,你必须要花费其它时间来研究它。
在下面的例子中,Ruby中的正规表达式是在Tiger或菲Phil之间定义的。

/Tiger|Phil/

  现在你可以在一个条件或循环语句中使用带有一个匹配操作符("=~")的正规表达式来匹配或查找其它的字符串。

irb(main):001:0> 
golfer="Davis"
if golfer =~ /Tiger|Phil/
puts "This is going to be a long drive."
else
puts "And now a drive by " + golfer
end
=> "Davis" 

  下面是另一个稍微复杂些的正规表达式:

/[\w._%-]+@[\w.-]+.[a-zA-Z]{2,4}/

  你能够猜出这个表达式代表什么意思吗?它相应于一个电子邮件地址。这个正规表达式可以用来校验电子邮件地址。

irb(main):001:0> 
emailRE= /[\w._%-]+@[\w.-]+.[a-zA-Z]{2,4}/
email = "jwhite@interechtraining.com"
if email =~ emailRE
puts "This is a valid email address."
else
puts "this is not a valid email address."
end
这是一个有效的电子邮件地址。
irb(main):002:0>
email = "###@spammer&&&.333"
if email =~ emailRE
puts "This is a valid email address."
else
puts "this is not a valid email address."
end
 

  这不是一个有效的电子邮件地址

图2把电子邮件正规表达式分解开来。你已看到,正规表达式语言是相当丰富的,但在此不多详述。有关正规表达式的更多信息请参考http://www.regular-expressions.info。


图2.电子邮件正规表达式

  注意,在Ruby中正规表达式也是一种对象。在下面的代码示例中,一个正规表达式实例(派生自类Regexp)作为String方法的一个参数(gsub)以达到使用"glad"来替换和"happy"与"joy"之目的。

irb(main):001:0> 
quote = "I am so happy. Happy, happy, joy, joy!"
regx = /(h|H)appy|joy/
quote.gsub(regx, "glad")
=> "I am so happy. Happy, happy, joy, joy!"
=> /(h|H)appy|joy/
=> "I am so glad. glad, glad, glad, glad!" 

  当你在正规表达式对象上使用=~操作符时,你能够得到例如匹配模式串的索引等信息。

irb(main):001:0> /Tiger|Phil/=~"EyeOfTheTiger"
=> 8 

  如果你曾编写过大量有关字符串的程序,你就会知道Ruby中的正规表达式是非常有力量的。因此,我建议在较深入地用Ruby开发你的第一个程序前,你应该全面地探讨一下Ruby中的正规表达式。当然,你可以参考本文相应的源码文件,其中包含了大量的正规表达式。

  范围

  在Ruby中,一个很不平常但是非常有用的概念就是范围(range)。一个范围是一个值序列。例如,字符a到z就可以定义在英语字母表中的所有的小写字母。另外一个范围的例子是整数1到10。一个范围能从任何类型的对象中创建,假定对象的类型允许使用Ruby的操作符(<=>)和succ方法进行比较。根据<=>操作符左边的操作数是否小于,等于或大于<=>操作符右边的操作数,<=>操作符将分别返回-1,0或+1。例如,"A"<=>"B"将返回-1。运行于整数4上的succ方法(4.succ)将返回5。

  可以使用Range类的new方法或特殊的标志来创建一个范围。下面是在irb中分别使用括号和点速记标志创建的两个相同的范围(表示所有的大写字母)。

irb(main):001:0> r1=Range.new("A","Z")
=> "A".."Z"
irb(main):002:0> r2=("A".."Z")
=> "A".."Z" 

  当创建一个范围时,必须指定开始值和结束值。在上面的情况中,A作为开始值,Z作为结束值。当创建一个范围时,你还可以指示是否这个范围应该包括或不包括末尾元素。默认情况下,如上例所示,范围包括末尾元素。为了排除结束元素,你可以使用new方法的排除参数(置为true)或如下所示的3个点的速记标志。

irb(main):001:0> r1=Range.new("A","Z",true)
=> "A"..."Z"
irb(main):002:0> r2=("A"..."Z")
=> "A"..."Z"
irb(main):003:0> r1.include?"Z"
=> false
irb(main):004:0> r2.include?"Z"
=> false 

  上面的示例中在范围上调用的include?方法显示是否其参数是范围的一个成员。上例中,"Z"不是范围的一个元素。这个方法还有一个与之等价的操作符"==="-它实现相同的功能。

irb(main):005:0> r2==="Z"
=&Gt; 
false 

  范围被应用在Ruby编程的许多方面。它们有两种特定的使用:作为生成器(generator)和谓词(predicate)。作为一个生成器,在范围上的每个方法允许你遍历该范围中的每个元素;例如,你想确定在一个K字节范围中的实际字节数。下面在irb中运行的代码使用了一个范围作为K字节到字节的生成器。

irb(main):008:0> 
kilobytes=(1..10)
kilobytes.each{|x| puts x*1024}
=> 1..10
1024
2048
3072
4096
5120
6144
7168
8192
9216
10240
 

  在Ruby中,条件逻辑范围可以被用作谓语(predicate),通常借助于操作符===的帮助。例如,你可以使用一个范围谓词来测试一个相对于有效的端口号(0~65535)和保留的端口号(0~1024,不包括1024)的整数参考。

irb(main):001:0> 
proposedPort = 8080
validPorts=(0..65535)
reservedPorts=(0...1024)
if (validPorts === proposedPort) & !(reservedPorts === proposedPort)
puts "Proposed port is ok to use."
else
puts "Proposed port is not allowed to be used."
end
=> 8080
=> 0..65535
=> 0...1024 

  上例的结果是,建议的端口号可以使用。

  另外,范围也可以用于存取数据结构(如数组和哈希表)中的元素。



posted on 2006-06-19 12:15 nbt 阅读(261) 评论(0)  编辑  收藏 所属分类: Ruby On Railse技术


只有注册用户登录后才能发表评论。


网站导航:
 
<2006年6月>
28293031123
45678910
11121314151617
18192021222324
2526272829301
2345678

导航

统计

常用链接

留言簿(3)

随笔分类

随笔档案

文章分类

文章档案

相册

收藏夹

Java技术网站

友情链接

国内一些开源网站

最新随笔

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜