比较C语言标准I/O与*nix系统I/O的异同

Posted on 2007-08-22 16:47 dennis 阅读(1362) 评论(0) 编辑收藏所属分类: linux & C

linux/unix系统的I/O也就是一般所说的低级I/O——操作系统提供的基本IO服务，与os绑定，特定于*nix平台。而标准I/O是ANSI C建立的一个标准I/O模型，是一个标准函数包和stdio.h头文件中的定义，具有一定的可移植性。两者一个显著的不同点在于，标准I/O默认采用了缓冲机制，比如调用fopen函数，不仅打开一个文件，而且建立了一个缓冲区（读写模式下将建立两个缓冲区），还创建了一个包含文件和缓冲区相关数据的数据结构。低级I/O一般没有采用缓冲，需要自己创建缓冲区，不过其实在*nix系统中，都是有使用称为内核缓冲的技术用于提高效率，读写调用是在内核缓冲区和进程缓冲区之间进行的数据复制。

1.fopen与open
标准I/O使用fopen函数打开一个文件：
FILE* fp=fopen(const char* path,const char *mod)

其中path是文件名，mod用于指定文件打开的模式的字符串，比如"r","w","w+","a"等等，可以加上字母b用以指定以二进制模式打开（对于*nix系统，只有一种文件类型，因此没有区别）,如果成功打开，返回一个FILE文件指针，如果失败返回NULL,这里的文件指针并不是指向实际的文件，而是一个关于文件信息的数据包，其中包括文件使用的缓冲区信息。

*nix系统使用open函数用于打开一个文件：
int fd=open(char *name,int how);
与fopen类似，name表示文件名字符串，而how指定打开的模式：O_RDONLY(只读),O_WRONLY(只写）,O_RDWR （可读可写),还有其他模式请man 2 open。成功返回一个正整数称为文件描述符，这与标准I/O显著不同，失败的话返回-1，与标准I/O返回NULL也是不同的。

2.fclose与close
与打开文件相对的，标准I/O使用fclose关闭文件，将文件指针传入即可，如果成功关闭，返回0，否则返回EOF
比如：

if(fclose(fp)!=0)
printf("Error in closing file");

而*nix使用close用于关闭open打开的文件，与fclose类似，只不过当错误发生时返回的是-1，而不是EOF，成功关闭同样是返回0。C语言用error code来进行错误处理的传统做法。

3.读文件，getc,fscanf,fgets和read
标准I/O中进行文件读取可以使用getc，一个字符一个字符的读取，也可以使用gets（读取标准io读入的）、fgets以字符串单位进行读取（读到遇到的第一个换行字符的后面），gets（接受一个参数，文件指针）不判断目标数组是否能够容纳读入的字符，可能导致存储溢出(不建议使用），而fgets使用三个参数：
char * fgets(char *s, int size, FILE *stream);
第一个参数和gets一样，用于存储输入的地址，第二个参数为整数，表示输入字符串的最大长度，最后一个参数就是文件指针，指向要读取的文件。最后是fscanf，与scanf类似，只不过增加了一个参数用于指定操作的文件，比如fscanf(fp,"%s",words)

*nix系统中使用read函数用于读取open函数打开的文件，函数原型如下：
ssize_t numread=read(int fd,void *buf,size_t qty);

其中fd就是open返回的文件描述符，buf用于存储数据的目的缓冲区，而qty指定要读取的字节数。如果成功读取，就返回读取的字节数目（小于等于qty）。

4.判断文件结尾，如果尝试读取达到文件结尾，标准IO的getc会返回特殊值EOF，而fgets碰到EOF会返回NULL,而对于*nix的read函数，情况有所不同。read读取qty指定的字节数，最终读取的数据可能没有你所要求的那么多（qty），而当读到结尾再要读的话，read函数将返回0.

5.写文件：putc,fputs,fprintf和write

与读文件相对应的，标准C语言I/O使用putc写入字符，比如：
putc(ch,fp);
第一个参数是字符，第二个是文件指针。而fputs与此类似：
fputs(buf,fp);
仅仅是第一个参数换成了字符串地址。而fprintf与printf类似，增加了一个参数用于指定写入的文件，比如：
fprintf(stdout,"Hello %s.\n","dennis");
切记fscanf和fprintf将FILE指针作为第一个参数，而putc,fputs则是作为第二个参数。

在*nix系统中提供write函数用于写入文件，原型与read类似：
ssize_t result=write(int fd,void *buf ,size_t amt);

fd是文件描述符，buf是将要写入的内存数据，amt是要写的字节数。如果写入成功返回写入的字节数，通过result与amt的比较可以判断是否写入正常，如果写入失败返回-1。write函数仅仅是将数据写入了缓冲区，何时写入磁盘由内核决定，如果要强制写入硬盘，那么在open的时候选择O_SYNC选项，或者调用fsync函数

6.随机存取：fseek()、ftell()和lseek()
标准I/O使用fseek和ftell用于文件的随机存取，先看看fseek函数原型
int fseek(FILE *stream, long offset, int whence);
第一个参数是文件指针，第二个参数是一个long类型的偏移量（offset），表示从起始点开始移动的距离。第三个参数就是用于指定起始点的模式，stdio.h指定了下列模式常量：
SEEK_SET            文件开始处
SEEK_CUR            当前位置
SEEK_END            文件结尾处
看几个调用例子：
fseek(fp,0L,SEEK_SET); //找到文件的开始处
fseek(fp,0L,SEEK_END); //定位到文件结尾处
fseek(fp,2L,SEEK_CUR); //文件当前位置向前移动2个字节数

而ftell函数用于返回文件的当前位置，返回类型是一个long类型，比如下面的调用：
fseek(fp,0L,SEEK_END);//定位到结尾
long last=ftell(fp); //返回当前位置
那么此时的last就是文件指针fp指向的文件的字节数。

与标准I/O类似，*nix系统提供了lseek来完成fseek的功能，原型如下：
off_t lseek(int fildes, off_t offset, int whence);

fildes是文件描述符，而offset也是偏移量，whence同样是指定起始点模式，唯一的不同是lseek有返回值，如果成功就返回指针变化前的位置，否则返回-1。因此可以通过下列方法模拟ftell函数来返回当前偏移量：
off_t    currpos;
currpos = lseek(fd, 0, SEEK_CUR);
whence的取值与fseek相同：SEEK_SET,SEEK_CUR,SEEK_END，但也可以用整数0,1,2相应代替。

最后，以一个例子结尾，通过c语言编写linux系统的cp指令，先看看使用标准I/O版本的：

#include<stdio.h>
#include<stdlib.h>
void oops(char *,char *);
int main(int ac,char *av[])
{
  FILE *in,*out;
  int ch;

  if(ac!=3){
   fprintf(stderr,"Useage:%s source-file target-file.\n",av[0]);
   exit(1);
  }
  if((in=fopen(av[1],"r"))==NULL)
   oops("can not open ",av[1]);
  if((out=fopen(av[2],"w"))==NULL)
   oops("can not open ",av[2]);
  while((ch=getc(in))!=EOF)
    putc(ch,out);
  if(fclose(in)!=0||fclose(out)!=0)
    oops("can not close files.\n"," ");
  return 0;
}
void oops(char *s1,char* s2)
{
  fprintf(stderr,"Error:%s %s\n",s1,s2);
  exit(1);
}

再看一个使用unix io的版本：

#include<unistd.h>
#include<stdio.h>
#include<fcntl.h>

#define BUFFERSIZE 4096
#define COPYMODE 0644
void oops(char *,char *);

int main(int ac,char *av[])
{
  int in_fd,out_fd,n_chars;
  char buf[BUFFERSIZE];
  if(ac!=3){
    fprintf(stderr,"useage:%s source-file target-file.\n",av[0]);
    exit(1);
  }

  if((in_fd=open(av[1],O_RDONLY))==-1)
     oops("Can't open ",av[1]);
  if((out_fd=creat(av[2],COPYMODE))==-1)
    oops("Can't open ",av[2]);
  while((n_chars=read(in_fd,buf,BUFFERSIZE))>0)
      if(write(out_fd,buf,n_chars)!=n_chars)
           oops("Write error to ",av[2]);
  if(n_chars==-1)
      oops("Read error from ",av[1]);
  if(close(in_fd)==-1||close(out_fd)==-1)
    oops("Error closing files","");
  return 0;
}
void oops(char *s1,char *s2)
{
  fprintf(stderr,"Error:%s",s1);
  perror(s2);
  exit(1);
}

显然，在使用unix i/o的时候，你要更多地关注缓冲问题以提高效率，而stdio则不需要考虑。

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: Google protocol buffers的Emacs扩展指针与数组再谈Selector的wakeup方法安装配置Emacs-rails ubuntu下解决Ruby安装后缺少openssl的问题 memcached1.2新增启动参数初探 lua 5.0的实现（翻译)4,5 lua 5.0的实现（翻译)1,2,3 重定向和管道的实现写操作系统？看看这个（转载）

庄周梦蝶

比较C语言标准I/O与*nix系统I/O的异同

公告

随笔分类

友情链接

最新随笔

搜索

最新评论