对文本行按特定字段排序(前N个字符或后N个字符),TCPL 练习5-17

时间:2023-03-08 17:07:30

The C programming language 的关于文本行排序的问题有很多种要求的方式,在对每行的字段排序方面,最简单的是例如对前N个字符或者末位N个字符进行排序,更高一点的要求是,对特殊符号标识的字段排序,例如,对逗号前的字段进行排序等,标识符号要尽可能地自定义,这里的程序实现了前者,即依据命令行参数N,对每行的前N或者后N个字符排序,当然,也实现了和-f(忽略大小写),-d(只对空格数字字母排序),-r(逆序)的组合使用,因此,基本完成了如书上所说,可以进行索引排序。但是哪怕是这一个简单的实现,也需要进一步考虑的问题是:能否对文本行中间N个字符进行排序?某些特殊场合可能会提出这样的要求。

代码如下:

 #include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <ctype.h>
/* 编写文本行排序函数,扩充其功能,使得函数能对特定字段排序,本例实现了对前leng个字符和末位leng个字符的排序,+为指令,还需能和-r,-f,-d等组合使用 */
#define MAXLINES 5000 /* 待排序的最大行数 */
char *lineptr[MAXLINES]; /* 指向问本行的指针 */ int readlines(char *lineptr[], int nlines);
void writelines(char *lineptr[], int nlines);
int inpuntcmp(char *, char *); /* 函数inpuntcmp:将忽略除空格字母数字以外的字符比较,如果某行以上三种字符都没有,则判断为最小 */ char *alloc(int n);
void sort(void *lineptr[], int left, int right, int (*comp)(void *, void *));
int numcmp(char *, char *);
int transfercmp(char *s1, char *s2); /* 函数transfercmp:忽略大小写的按字典比较的函数,例如,认为a=A,和numcmp以及strcmp并列的选项 */
int newstrcmp(char *s1, char *s2); /* 重新编函数newstrcmp: 实现对特定字段的一般字符比较,替代原来的strcmp */
static char allocbuf[];
static char *allocp=allocbuf;
int post=,uptolow=,leng=; /* post 为1则逆序排序;uptolow为1,忽略大小写,leng为字段分隔数,如为正,则对前leng个字符排序,为负,对末位leng个字符排序 */ main(int argc, char *argv[])
{
int nlines; /* 读入的输入行数 */
int numeric=,nw=; /* numeric为1则以数值排序 uptolow为1则转换大小写 */ while(argc-->){
if(strcmp(*++argv,"-n")==)
numeric=;
else if(strcmp(*argv,"-r")==)
post=;
else if(strcmp(*argv,"-f")==)
uptolow=;
else if(strcmp(*argv,"-d")==)
nw=; /* nw为1只对字母数字空格排序 */
else if(**argv=='+') { switch ((*++(*argv))-''>= && (**argv)-''<=) {
case :
if(leng==) (int)leng=atof(*argv);
else
printf("error: leng was defined\n");
break;
case :
if(**argv=='-'&&(*++(*argv))-''>= && (**argv)-''<=&& leng==)
(int)leng=atof(--(*argv)); else
printf("error: leng was defined or unknow command after '-'");
break;
default :
printf("error: please enter number after the '+'\n");
} } else printf("error: unkonwn command\n");
}
if((nlines=readlines(lineptr,MAXLINES))>=) {
if(nw==){
sort((void **)lineptr, post?(nlines-):, post?:(nlines-), (int (*)(void*,void*))(inpuntcmp));
writelines(lineptr,nlines);
return ;
} else {
if(uptolow==)
sort((void **)lineptr, post?(nlines-):, post?:(nlines-), (int (*)(void*,void*))(numeric?numcmp:newstrcmp));
else
sort((void **)lineptr, post?(nlines-):, post?:(nlines-), (int (*)(void*,void*))(numeric?numcmp:transfercmp)); writelines(lineptr,nlines);
return ;
}
}
else {
printf("input too big to sort\n");
return ;
} } void sort(void *v[], int left, int right, int (*comp)(void *, void *))
{
if(post==) {
int i, last;
void swap(void *v[], int, int); if(left>=right)
return;
swap(v,left,(left+right)/);
last =left;
for(i=left+;i<=right;i++)
if((*comp)(v[i],v[left])<)
swap(v,++last,i);
swap(v,left,last);
sort(v,left,last-,comp);
sort(v,last+,right,comp);
} else
{
int i, last;
void swap(void *v[], int, int); if(left<=right)
return;
swap(v,left,(left+right)/);
last =left;
for(i=left-;i>=right;i--)
if((*comp)(v[i],v[left])<)
swap(v,--last,i);
swap(v,left,last);
sort(v,left,last+,comp);
sort(v,last-,right,comp);
}
} int length(char *s);
int numcmp(char *s1,char *s2)
{
double v1,v2;
v1=atof(s1);
v2=atof(s2);
if(v1<v2)
return -;
else if (v1>v2)
return ;
else
return ; } void swap(void *v[], int i, int j) {
void *temp; temp =v[i];
v[i]=v[j];
v[j]=temp; }
#define MAXLEN 1000
int getline(char *, int);
int readlines(char *lineptr[], int maxlines) {
int len,nlines;
char *p,line[MAXLEN];
nlines =;
while((len=getline(line,MAXLEN))>)
if (nlines>= maxlines || (p=alloc(len))==)
return -;
else {
line[len-]=;
strcpy(p,line);
lineptr[nlines++]=p;
}
return nlines;
} void writelines(char *lineptr[], int nlines)
{
int i; for(i=; i< nlines; i++)
printf("%s\n",lineptr[i]);
}
int getline(char *s, int lim) {
int i=,c;
for(; i<lim && (c=getchar()) != EOF && c!='\n';++i)
*(s+i)=c;
if(c=='\n') {
*(s+i)=c;
++i;}
*(s+i)=;
return i; }
char *alloc(int n) {
if(allocbuf +-allocp>=n) {
allocp +=n;
return allocp - n;
} else
return ;
} int inpuntcmp(char *s1, char *s2)
{
char c,d,leng2;
int i=,k,len1=,len2=;
if(leng>=) {
while(*s1 != && *s2!= &&leng?(i<leng):) {
while(ispunct(*s1)) {
if(*s1==||len1>=leng)
return -;
++len1;
++s1;
}
while(ispunct(*s2)) {
if(*s2==||len2>=leng)
return ;
++s2;
++len2;
}
if(uptolow==) {
c=tolower(*s1);
d=tolower(*s2);
}
else {
c=*s1;
d=*s2;
}
if(c<d)
return -;
else if (c>d)
return ;
++s1;
++s2;
++len1;
++len2; }
if(len1>=leng && len2<leng)
return -;
if(len2>=leng && len1<leng)
return ;
if(len1>=leng && len2>=leng)
return ;
if(*s1<*s2)
return -;
else if (*s1>*s2)
return ;
else
return ;
} else {
leng2=-leng;
len1=length(s1);
len2=length(s2);
i=((len1-leng2)>)?(len1-leng2):;
k=((len2-leng2)>)?(len2-leng2):; while(s1[i] != && s2[k] !=) {
while(ispunct(s1[i])) {
if(s1[i]==)
return -;
++i; }
while(ispunct(s2[k])) {
if(s2[k]==)
return ;
++k;
}
if(uptolow==) {
c=tolower(s1[i]);
d=tolower(s2[k]);
}
else {
c=s1[i];
d=s2[k];
}
if(c<d)
return -;
else if (c>d)
return ;
++i;
++k; } if(s1[i]<s2[k])
return -;
else if (s1[i]>s2[k])
return ;
else
return ; } }
int transfercmp(char *s1, char *s2)
{
char c,d,leng2;
int i=,k,len1,len2;
if(leng>=) {
while(*s1 != && *s2!= && leng?(i<leng): ) {
c=tolower(*s1);
d=tolower(*s2);
if(c<d)
return -;
else if (c>d)
return ;
++s1;
++s2;
++i; }
if(i<leng) {
if(*s1<*s2)
return -;
else if (*s1>*s2)
return ;
else
return ;
} else
return ;
} else
{
leng2=-leng;
len1=length(s1);
len2=length(s2);
i=((len1-leng2)>)?(len1-leng2):;
k=((len2-leng2)>)?(len2-leng2):;
while(s1[i] != && s2[k] != ) {
c=tolower(s1[i]);
d=tolower(s2[k]);
if(c<d)
return -;
else if (c>d)
return ;
++i;
++k; }
if(s1[i]<s2[k])
return -;
else if (s1[i]>s2[k])
return ;
else
return ; } }
int newstrcmp(char *s1, char *s2) {
char c,d,leng2;
int i=,k,len1,len2;
if(leng>=) {
while(*s1 != && *s2!= && leng?(i<leng): ) {
c=*s1;
d=*s2;
if(c<d)
return -;
else if (c>d)
return ;
++s1;
++s2;
++i; }
if(i<leng) {
if(*s1<*s2)
return -;
else if (*s1>*s2)
return ;
else
return ;
} else
return ;
} else
{
leng2=-leng;
len1=length(s1);
len2=length(s2);
i=((len1-leng2)>)?(len1-leng2):;
k=((len2-leng2)>)?(len2-leng2):; while(s1[i] != && s2[k] != ) {
c=s1[i];
d=s2[k]; if(c<d)
return -;
else if (c>d)
return ;
++i;
++k; }
if(s1[i]<s2[k])
return -;
else if (s1[i]>s2[k])
return ;
else
return ; } }
int length(char *s) {
int i;
for(i=;*s++!=;++i)
;
return i;
}