发现很多公司要求掌握一门脚本语言,一直也想搞搞这个,看C++,Linux C编程也只是为了对系统更加的了解,唉,我的工作定位好像一直都不怎么明确,是要搞个自己最擅长的了,以后有时间再搞linuxC,找工作第一位。。。工作基本定位在 Java+python,大部分公司也不会要求一个人既做Java也做C++。再说这语言也是大同小异,关键还是编程思想
d = {"server":"mpilgrim", "database":"master"}
li = ["a", "b", "mpilgrim", "z", "example"]
Tuple 是不可变的 list。一旦创建了一个 tuple,就不能以任何方式改变它
t = ("a", "b", "mpilgrim", "z", "example")
连接 list 与分割字符串
>>> li = ['server=mpilgrim', 'uid=sa', 'database=master', 'pwd=secret']
>>> s = ";".join(li)
>>> s
'server=mpilgrim;uid=sa;database=master;pwd=secret'
>>> s.split(";")
['server=mpilgrim', 'uid=sa', 'database=master', 'pwd=secret']
>>> s.split(";", 1)
['server=mpilgrim', 'uid=sa;database=master;pwd=secret']
使用 type、str、dir 和其它内置函数
4.3.2. str 函数
str 将数据强制转换为字符串。每种数据类型都可以强制转换为字符串。
例 4.6. str 介绍
>>> str(1)
'1'
>>> horsemen = ['war', 'pestilence', 'famine']
>>> horsemen
['war', 'pestilence', 'famine']
>>> horsemen.append('Powerbuilder')
>>> str(horsemen)
"['war', 'pestilence', 'famine', 'Powerbuilder']"
>>> str(odbchelper)
"<module 'odbchelper' from 'c:\\docbook\\dip\\py\\odbchelper.py'>"
>>> str(None)
'None' 对于简单的数据类型比如整型,你可以预料到 str 的正常工作,因为几乎每种语言都有一个
将整型转化为字符串的函数。
然而 str 可以作用于任何数据类型的任何对象。这里它作用于一个零碎构建的列表。
str 还允许作用于模块。注意模块的字符串形式表示包含了模块在磁盘上的路径名,所以你的显示
结果将会有所不同。
str 的一个细小但重要的行为是它可以作用于 None,None 是 Python 的 null 值。这个调用返回字符
串 'None'。你将会使用这一点来改进你的 info 函数,这一点你很快就会看到。
dir 函数返回任意对象的属性和方法列表,包括模块对象、函数对象、字符串对象、列表对象、字
典对象 …… 相当多的东西。
例 4.7. dir 介绍
>>> li = []
>>> dir(li)
['append', 'count', 'extend', 'index', 'insert',
'pop', 'remove', 'reverse', 'sort']
>>> d = {}
>>> dir(d)
['clear', 'copy', 'get', 'has_key', 'items', 'keys', 'setdefault', 'update', 'values']
>>> import odbchelper
>>> dir(odbchelper)
['__builtins__', '__doc__', '__file__', '__name__', 'buildConnectionString']
最后是 callable 函数,它接收任何对象作为参数,如果参数对象是可调用的,返回 True;否则返回
False。可调用对象包括函数、类方法,甚至类自身 (下一章将更多的关注类)。
例 4.8. callable 介绍
>>> import string
>>> string.punctuation
'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'
>>> string.join
<function join at 00C55A7C>
>>> callable(string.punctuation)
False
>>> callable(string.join)
True
你已经知道 Python 函数是对象。你不知道的是,使用 getattr 函数,可以得到一个直到运行时才知
道名称的函数的引用。
例 4.10. getattr 介绍
>>> li = ["Larry", "Curly"]
>>> li.pop
<built-in method pop of list object at 010DF884>
>>> getattr(li, "pop")
<built-in method pop of list object at 010DF884>
>>> getattr(li, "append")("Moe")
>>> li
["Larry", "Curly", "Moe"]
>>> getattr({}, "clear")
<built-in method clear of dictionary object at 00F113D4>
>>> getattr((), "pop")
Traceback (innermost last):
File "<interactive input>", line 1, in ?
AttributeError: 'tuple' object has no attribute 'pop'
4.4.1. 用于模块的 getattr
getattr 不仅仅适用于内置数据类型,也可作用于模块。
例 4.11. apihelper.py 中的 getattr 函数
>>> import odbchelper
>>> odbchelper.buildConnectionString
<function buildConnectionString at 00D18DD4>
>>> getattr(odbchelper, "buildConnectionString")
<function buildConnectionString at 00D18DD4>
>>> object = odbchelper
>>> method = "buildConnectionString"
>>> getattr(object, method)
<function buildConnectionString at 00D18DD4>
>>> type(getattr(object, method))
<type 'function'>
>>> import types
>>> type(getattr(object, method)) == types.FunctionType
True
>>> callable(getattr(object, method))
True
使用 getattr,你能够获得同一函数的同一引用。通常,getattr(object, "attribute") 等价于
object.attribute。如果 object 是一个模块的话,那么 attribute 可能是定义在模块中的任何东西:函数
、类或者全局变量。
就是相当于函数的指针
例 4.12. 使用getattr 创建分发者
import statsout
def output(data, format="text"):
output_function = getattr(statsout, "output_%s" % format)
return output_function(data)
output 函数接收一个必备参数 data,和一个可选参数 format。如果没有指定 format 参数,其缺省
值是 text 并完成普通文本输出函数的调用。
你可以连接 format 参数值和 "output_" 来创建一个函数名称作为参数值,然后从 statsout 模块中取
得该函数。这种方式允许今后很容易地扩展程序以支持其它的输出格式,而且无需修改分发函数。
所要做的仅仅是向 statsout 中添加一个函数,比如 output_pdf,之后只要将 “pdf” 作为 format 的参
数值传递给 output 函数即可。
现在你可以简单地调用输出函数,就像调用其它函数一样。output_function 变量是指向 statsout 模
块中相应函数的引用。
你是否发现前面示例的一个 Bug?即字符串和函数之间的松耦合,而且没有错误检查。如果用户传
入一个格式参数,但是在 statsout 中没有定义相应的格式输出函数,会发生什么呢?还好,getattr
会返回 None,它会取代一个有效函数并被赋值给 output_function,然后下一行调用函数的语句将会
失败并抛出一个异常。这种方式不好。
值得庆幸的是,getattr 能够使用可选的第三个参数,一个缺省返回值。
[mapping-expression for element in source-list if filter-expression]
>>> li = ["a", "mpilgrim", "foo", "b", "c", "b", "d", "d"]
>>> [elem for elem in li if len(elem) > 1]
['mpilgrim', 'foo']
>>> [elem for elem in li if elem != "b"]
['a', 'mpilgrim', 'foo', 'c', 'd', 'd']
>>> [elem for elem in li if li.count(elem) == 1]
['a', 'mpilgrim', 'foo', 'c']
使用 and 时,在布尔环境中从左到右演算表达式的值。0、''、[]、()、{}、None 在布尔环境中为假;
其它任何东西都为真。还好,几乎是所有东西。默认情况下,布尔环境中的类实例为真,但是你可
以在类中定义特定的方法使得类实例的演算值为假。
4.6.1. 使用 and-or 技巧
例 4.17. and-or 技巧介绍
>>> a = "first"
>>> b = "second"
>>> 1 and a or b
'first'
>>> 0 and a or b
'second'
这个语法看起来类似于 C 语言中的 bool ? a : b 表达式。整个表达式从左到右进行演算,所以先进
行 and 表达式的演算。1 and 'first' 演算值为 'first',然后 'first' or 'second' 的演算值为 'first'。
0 and 'first' 演算值为 False,然后 0 or 'second' 演算值为 'second'。
然而,由于这种 Python 表达式单单只是进行布尔逻辑运算,并不是语言的特定构成,这是 and-or
技巧和 C 语言中的 bool ? a : b 语法非常重要的不同。如果 a 为假,表达式就不会按你期望的那样
工作了。(你能知道我被这个问题折腾过吗?不止一次?)
Python 支持一种有趣的语法,它允许你快速定义单行的最小函数。这些叫做 lambda 的函数,是从
Lisp 借用来的,可以用在任何需要函数的地方。
例 4.20. lambda 函数介绍
>>> def f(x):
... return x*2
...
>>> f(3)
6
>>> g = lambda x: x*2
>>> g(3)
6
>>> (lambda x: x*2)(3)
6
总的来说,lambda 函数可以接收任意多个参数 (包括可选参数) 并且返回单个表达式的值。lambda
函数不能包含命令,包含的表达式不能超过一个。不要试图向 lambda 函数中塞入太多的东西;如
果你需要更复杂的东西,应该定义一个普通函数,然后想让它多长就多长。
例 4.25. 打印列表
>>> li = ['a', 'b', 'c']
>>> print "\n".join(li)
a
b
c 在你处理列表时,这确实是一个有用的调试技巧。在 Python 中,你会十分频繁地操作列表。
在 2.2.1 版本之前,Python 没有单独的布尔数据类型。为了弥补这个缺陷,Python 在布尔环境 (如 if
语句) 中几乎接受所有东西,遵循下面的规则:
0 为 false; 其它所有数值皆为 true。
空串 ("") 为 false; 其它所有字符串皆为 true。
空 list ([]) 为 false; 其它所有 list 皆为 true。
空 tuple (()) 为 false; 其它所有 tuple 皆为 true。
空 dictionary ({}) 为 false; 其它所有 dictionary 皆为 true。
下面是 from module import 的基本语法:
from UserDict import UserDict
它与你所熟知的 import module 语法很相似,但是有一个重要的区别:UserDict 被直接导入到局部
名字空间去了,所以它可以直接使用,而不需要加上模块名的限定。你可以导入独立的项或使用
from module import * 来导入所有东西。
Python 中的 from module import * 像 Java 中的 import module.* ;Python 中的 import module 像 Java
中的 import module
什么时候你应该使用 from module import?
如果你要经常访问模块的属性和方法,且不想一遍又一遍地敲入模块名,使用 from module import
。
如果你想要有选择地导入某些属性和方法,而不想要其它的,使用 from module import。
如果模块包含的属性和方法与你的某个模块同名,你必须使用 import module 来避免名字冲突。
尽量少用 from module import * ,因为判定一个特殊的函数或属性是从哪来的有些困难,并且会造
成调试和重构都更困难。
from UserDict import UserDict
class FileInfo(UserDict):
在 Python 中,类的基类只是简单地列在类名后面的小括号里。不像在 Java 中有一个特殊的
extends 关键字。
Python 支持多重继承。在类名后面的小括号中,你可以列出许多你想要的类名,以逗号分隔。
class FileInfo(UserDict):
"store file metadata"
def __init__(self, filename=None):
UserDict.__init__(self)
self["name"] = filename
一些伪面向对象语言,像 Powerbuilder 有一种“扩展”构造函数和其它事件的
概念,即父类的方法在子类的方法执行前被自动调用。Python 不是这样,你必须显示地调用在父类中的合适方法。
我告诉过你,这个类像字典一样工作,那么这里就是第一个印象。我们将参数 filename 赋值给对象 name 关键字,作为它的值。 注意 __init__ 方法从不返回一个值。
Java中是自动调用默认的无参的父类的构造函数
例 5.9. 定义 UserDict 类
class UserDict:
def __init__(self, dict=None):
self.data = {} ×××××××××××××××××××××××××××××××××××定义类的实例变量
if dict is not None: self.update(dict)
注意 UserDict 是一个基类,不是从任何其他类继承而来。
这就是我们在 FileInfo 类中进行了覆盖的 __init__ 方法。注意这个父类的参数列表与子类不同。很
好,每个子类可以拥有自已的参数集,只要使用正确的参数调用父类就可以了。这里父类有一个定
义初始值的方法 (通过在 dict 参数中传入一个字典),这一方法我们的 FileInfo 没有用上。
××××××××××××××××××××××××××××××××与Java的不同×××××××××××××××××××××××××××××××××××
与Java的不同,
1,Python中类的类属性是是在类的后面直接定义的
2,而实例变量是在在__init__方法中直接定义的使用如下方式self.instancevariable=***定义,
3,然后Python中实例方法都要显示的加上self(相当于Java的this)参数,方法中引用实例变量时也要通过self来引用
Python 支持数据属性 (在 Java 叫做 “实例变量”,在 C++ 中叫 “数据成员”),它是由某个特定的类实
例所拥有的数据。在本例中,每个 UserDict 实例将拥有一个 data 数据属性。要从类外的代码引用
这个属性,需要用实例的名字限定它,instance.data,限定的方法与你用模块的名字来限定函数一
样。要在类的内部引用一个数据属性,我们使用 self 作为限定符。习惯上,所有的数据属性都在
__init__ 方法中初始化为有意义的值。然而,这并不是必须的,因为数据属性,像局部变量一样,
当你首次赋给它值的时候突然产生。
×××××××××××××××××××××××××××××××××与Java的不同××××××××××××××××××××××××××××××××××
Java 支持通过参数列表的重载,也就是 一个类可以有同名的多个方法,但这些方法或者是参数个
数不同,或者是参数的类型不同。
Python 两种都不支持,总之是没有任何形式的函数重载。一个 __init__ 方法就是一个 __init__ 方法
,不管它有什么样的参数。每个类只能有一个 __init__ 方法,并且如果一个子类拥有一个 __init__
方法,它总是 覆盖父类的 __init__ 方法,甚至子类可以用不同的参数列表来定义它。
想想为什么不支持方法重载,是因为Python的参数可以定义默认实参,有缺省值
×××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
应该总是在 __init__ 方法中给一个实例的所有数据属性赋予一个初始值。这样做将会节省你在后面
调试的时间,不必为捕捉因使用未初始化 (也就是不存在) 的属性而导致的 AttributeError 异常费时费
力。
class MP3FileInfo(FileInfo):
mp3file.__class__ is fileinfo.MP3FileInfo true
mp3file.__class__ is fileinfo.FileInfo false
isinstance(mp3file,fileinfo.MP3FileInfo) true
isinstance(mp3file,fileinfo.FileInfo) true
li=[1,2,3]
li2[1,2,3]
li==li2 true 相当于Java的equals()
li is li2 false 相当于Java的==
5.7. 高级专用类方法
除了 __getitem__ 和 __setitem__ 之外 Python 还有更多的专用函数。某些可以让你模拟出你甚至可
能不知道的功能。
下面的例子将展示 UserDict 一些其他专用方法。
例 5.16. UserDict 中更多的专用方法
def __repr__(self): return repr(self.data)
def __cmp__(self, dict):
if isinstance(dict, UserDict):
return cmp(self.data, dict.data)
else:
return cmp(self.data, dict)
def __len__(self): return len(self.data)
def __delitem__(self, key): del self.data[key] __repr__ 是一个专用的方法,在当调用 repr
(instance) 时被调用。repr 函数是一个内置函数,它返回一个对象的字符串表示。它可以用在任何
对象上,不仅仅是类的实例。你已经对 repr 相当熟悉了,尽管你不知道它。在交互式窗口中,当你
只敲入一个变量名,接着按ENTER,Python 使用 repr 来显示变量的值。自已用一些数据来创建一
个字典 d ,然后用 print repr(d) 来看一看吧。
__cmp__ 在比较类实例时被调用。通常,你可以通过使用 == 比较任意两个 Python 对象,不只是
类实例。有一些规则,定义了何时内置数据类型被认为是相等的,例如,字典在有着全部相同的关
键字和值时是相等的。对于类实例,你可以定义 __cmp__ 方法,自已编写比较逻辑,然后你可以
使用 == 来比较你的类,Python 将会替你调用你的 __cmp__ 专用方法。
__len__ 在调用 len(instance) 时被调用。len 是一个内置函数,可以返回一个对象的长度。它可以
用于任何被认为理应有长度的对象。字符串的 len 是它的字符个数;字典的 len 是它的关键字的个
数;列表或序列的 len 是元素的个数。对于类实例,定义 __len__ 方法,接着自已编写长度的计算
,然后调用 len(instance),Python 将替你调用你的 __len__ 专用方法。
__delitem__ 在调用 del instance[key] 时调用 ,你可能记得它作为从字典中删除单个元素的方法。
当你在类实例中使用 del 时,Python 替你调用 __delitem__ 专用方法。
在 Java 中,通过使用 str1 == str2 可以确定两个字符串变量是否指向同一块物理内存位置。这叫做
对象同一性,在 Python 中写为 str1 is str2。在 Java 中要比较两个字符串值,你要使用 str1.equals
(str2);在 Python 中,你要使用 str1 == str2。某些 Java 程序员,他们已经被教授得认为,正是因为
在 Java 中 == 是通过同一性而不是值进行比较,所以世界才会更美好。这些人要接受 Python 的这
个“严重缺失”可能要花些时间。
ord("a") 97
ord("A") 65
5.8. 类属性介绍
你已经知道了数据属性,它们是被一个特定的类实例所拥有的变量。Python 也支持类属性,它们是
由类本身所拥有的。
例 5.17. 类属性介绍
class MP3FileInfo(FileInfo):
"store ID3v1.0 MP3 tags"
tagDataMap = {"title" : ( 3, 33, stripnulls),
"artist" : ( 33, 63, stripnulls),
"album" : ( 63, 93, stripnulls),
"year" : ( 93, 97, stripnulls),
"comment" : ( 97, 126, stripnulls),
"genre" : (127, 128, ord)}
例 5.18. 修改类属性,Java中的静态变量
>>> class counter:
... count = 0
... def __init__(self):
... self.__class__.count += 1 #一定得用self.__class__来引用,才是类变量,假如用self.count则定义的是实例变量,或者用
Counter.count +=1
...
上述代码记录创建的对象的个数
5.9. 私有函数
与大多数语言一样,Python 也有私有的概念:
私有函数不可以从它们的模块外面被调用
私有类方法不能够从它们的类外面被调用
私有属性不能够从它们的类外面被访问
与大多数的语言不同,一个 Python 函数,方法,或属性是私有还是公有,完全取决于它的名字。
如果一个 Python 函数,类方法,或属性的名字以两个下划线开始 (但不是结束),它是私有的;其它
所有的都是公有的。 Python 没有类方法保护 的概念 (只能用于它们自已的类和子类中)。类方法或
者是私有 (只能在它们自已的类中使用) 或者是公有 (任何地方都可使用)。
在 MP3FileInfo 中,有两个方法:__parse 和 __setitem__。正如我们已经讨论过的,__setitem__
是一个专有方法;通常,你不直接调用它,而是通过在一个类上使用字典语法来调用,但它是公有
的,并且如果有一个真正好的理由,你可以直接调用它 (甚至从 fileinfo 模块的外面)。然而,
__parse 是私有的,因为在它的名字前面有两个下划线。
在 Python 中,所有的专用方法 (像 __setitem__) 和内置属性 (像 __doc__) 遵守一个标准的命名习惯
:开始和结束都有两个下划线。不要对你自已的方法和属性用这种方法命名;到最后,它只会把你 (或其它人) 搞乱。
#!/usr/bin/env python
#coding=utf-8
import os
import sys
from UserDict import UserDict
def stripnulls(data):
"strip whitespace and null"
return data.replace("\00","").strip()
class FileInfo(UserDict):
"store file metadata"
def __init__(self,filename=None):
UserDict.__init__(self)
#will trigger the __setitem__ method,and this method be override in the sub class
self["name"]=filename
class MP3FileInfo(FileInfo):
"store ID3v1.0 MP3 tags"
tagDataMap={"title":(3,33,stripnulls),
"artist":(33,63,stripnulls),
"album" :(63,93,stripnulls),
"year" :(93,97,stripnulls),
"comment":(97,126,stripnulls),
"genre" :(127,128,ord)}
def __parse(self,filename):
"parse ID3v1.0 tags from Mp3 file"
self.clear()
try:
fsock = open(filename,"rb",0)
try:
fsock.seek(-128,2)
tagdata = fsock.read(128)
finally:
fsock.close()
if tagdata[:3]=="TAG":
for tag,(start,end,parseFunc) in self.tagDataMap.items():
self[tag] = parseFunc(tagdata[start:end])
except IOError:
pass
def __setitem__(self,key,item):
if key == "name" and item:
self.__parse(item)
FileInfo.__setitem__(self,key,item)
def listDirectory(directory,fileExtList):
"get list of file info object for files of particular"
fileList = [os.path.normcase(f)
for f in os.listdir(directory)]
fileList = [os.path.join(directory,f)
for f in fileList if os.path.splitext(f)[1] in fileExtList]
def getFileInfoClass(filename,module=sys.modules[FileInfo.__module__]):
"get file into class from filename extension"
subclass = "%sFileInfo" % os.path.splitext(filename)[1].upper()[1:]
return hasattr(module,subclass) and getattr(module,subclass) or FileInfo
return [getFileInfoClass(f)(f) for f in fileList]
if __name__=="__main__":
for info in listDirectory("G:\\test",[".mp3"]):
print "\n".join(["%s=%s" % (k,v) for (k,v) in info.items()])
print
posted on 2009-08-22 00:02
Frank_Fang 阅读(4197)
评论(0) 编辑 收藏 所属分类:
Python学习