CCF 201604-3 路径解析

原文地址: http://moilk.org/blog/2016/09/09/ccf2016043/

问题描述
　　在操作系统中，数据通常以文件的形式存储在文件系统中。文件系统一般采用层次化的组织形式，由目录（或者文件夹）和文件构成，形成一棵树的形状。文件有内容，用于存储数据。目录是容器，可包含文件或其他目录。同一个目录下的所有文件和目录的名字各不相同，不同目录下可以有名字相同的文件或目录。
　　为了指定文件系统中的某个文件，需要用路径来定位。在类 Unix 系统（Linux、Max OS X、FreeBSD等）中，路径由若*分构成，每个部分是一个目录或者文件的名字，相邻两个部分之间用 / 符号分隔。
　　有一个特殊的目录被称为根目录，是整个文件系统形成的这棵树的根节点，用一个单独的 / 符号表示。在操作系统中，有当前目录的概念，表示用户目前正在工作的目录。根据出发点可以把路径分为两类：
* 绝对路径：以 / 符号开头，表示从根目录开始构建的路径。
*Ÿ 相对路径：不以 / 符号开头，表示从当前目录开始构建的路径。
　　例如，有一个文件系统的结构如下图所示。在这个文件系统中，有根目录 / 和其他普通目录 d1、d2、d3、d4，以及文件 f1、f2、f3、f1、f4。其中，两个 f1 是同名文件，但在不同的目录下。
　　 CCF 201604-3 路径解析
　　对于 d4 目录下的 f1 文件，可以用绝对路径 /d2/d4/f1 来指定。如果当前目录是 /d2/d3，这个文件也可以用相对路径 ../d4/f1 来指定，这里 .. 表示上一级目录（注意，根目录的上一级目录是它本身）。还有 . 表示本目录，例如 /d1/./f1 指定的就是 /d1/f1。注意，如果有多个连续的 / 出现，其效果等同于一个 /，例如 /d1///f1 指定的也是 /d1/f1。
　　本题会给出一些路径，要求对于每个路径，给出正规化以后的形式。一个路径经过正规化操作后，其指定的文件不变，但是会变成一个不包含 . 和 .. 的绝对路径，且不包含连续多个 / 符号。如果一个路径以 / 结尾，那么它代表的一定是一个目录，正规化操作要去掉结尾的 /。若这个路径代表根目录，则正规化操作的结果是 /。若路径为空字符串，则正规化操作的结果是当前目录。
输入格式
　　第一行包含一个整数 P，表示需要进行正规化操作的路径个数。
　　第二行包含一个字符串，表示当前目录。
　　以下 P 行，每行包含一个字符串，表示需要进行正规化操作的路径。
输出格式
　　共 P 行，每行一个字符串，表示经过正规化操作后的路径，顺序与输入对应。
样例输入
　　7
　　/d2/d3
　　/d2/d4/f1
　　../d4/f1
　　/d1/./f1
　　/d1///f1
　　/d1/
　　///
　　/d1/../../d2
样例输出
　　/d2/d4/f1
　　/d2/d4/f1
　　/d1/f1
　　/d1/f1
　　/d1
　　/
　　/d2
评测用例规模与约定
　　1 ≤ P ≤ 10。
　　文件和目录的名字只包含大小写字母、数字和小数点 .、减号 - 以及下划线 _。
　　不会有文件或目录的名字是 . 或 .. ，它们具有题目描述中给出的特殊含义。
　　输入的所有路径每个长度不超过 1000 个字符。
　　输入的当前目录保证是一个经过正规化操作后的路径。
　　对于前 30% 的测试用例，需要正规化的路径的组成部分不包含 . 和 .. 。
　　对于前 60% 的测试用例，需要正规化的路径都是绝对路径。

解题说明
　　这道题要讲究操作的顺序。首先，如果字符串的第一个字符不是’/’，就不管别的先把当前目录方在前面，这样所有字符串就都变成了绝对路径。然后再把中间所有多余的’/’去掉，末尾的保留。如果末尾没有’/’，其实加上会比较好，这样可以发现如果末尾是当前目录或者上级目录，操作变得方便多了。接着，所有的当前目录符号都是多余的，全部去掉，这时要注意搜索的是”/./”，因为目录或者文件名可以包含’.’。做到这一步就发现只剩下上级目录符号了，我想不用我再多说也知道该怎么办了。最后去掉末尾的’/’，就全部搞定了（注意，如果之前末尾没有自己追加一个’/’，这时还要额外考虑末尾是”/..”和”/.”的情况, 我下面给的代码就是这样，写到这里的时候才发现可以追加斜杠变得简单）。

#include <iostream>

using namespace std;

string str[10];

string::size_type refind(const string &str,string::size_type pos,const char c) {
    int p=pos;
    while(1) {
        if(p==-1) {
            return (string::npos);
        }
        if(str[p]==c) {
            return p;
        }
        p--;
    }

    return (string::npos);
}

int main(void) {
    int N;
    string pwd,pwdf,tmp;
    cin>>N;
    cin>>pwd;
    getchar();
    string::size_type pre=0;
    string::size_type post;
    while(1) {
        post=pwd.find('/',pre+1);
        if(post==string::npos) {
            break;
        }
        pre=post;
    }
    if(pre==0) {
        pwdf="/";
    } else {
        pwdf=pwd.substr(0,pre);
    }

    for(int i=0; i<N; i++) {
        getline(cin,tmp);
        // 头部的处理
        if(tmp[0]!='/') {
            tmp=pwd+"/"+tmp;
        }
        // 去掉多于斜杠
        pre=0;
        while(1) {
            post=tmp.find('/',pre);
            if(post==string::npos) {
                break;
            }
            pre=post+1;
            post++;
            while(1) {
                if(post>=tmp.size()||tmp[post]!='/') {
                    break;
                }
                post++;
            }
            tmp.erase(pre,post-pre);
        }
        // 去掉中间的单点
        pre=0;
        while(1) {
            post=tmp.find("/./",pre);
            if(post==string::npos) {
                break;
            }
            tmp.erase(post+1,2);
            pre=post;
        }
        // 去掉中间的双点
        pre=0;
        while(1) {
            post=tmp.find("/../",pre);
            if(post==string::npos) {
                break;
            }
            pre=refind(tmp,post-1,'/');
            if(pre!=string::npos) {
                pre++;
            } else {
                pre=post+1;
            }
            tmp.erase(pre,post+4-pre);
            pre--;
        }

        //去掉末尾的点
        int len=tmp.size();
        if(len>=2&&tmp[len-1]=='.'&&tmp[len-2]=='/') {
            tmp.erase(len-1,1);
        }
        len=tmp.size();
        if(len>=3&&tmp[len-1]=='.'&&tmp[len-2]=='.'&&tmp[len-3]=='/') {
            pre=refind(tmp,len-4,'/');
            if(pre!=string::npos) {
                pre++;
            } else {
                pre=len-2;
            }
            tmp.erase(pre,len);
        }

        // 去掉末尾的斜杠
        len=tmp.size();
        if(len>1&&tmp[len-1]=='/') {
            tmp.erase(len-1,1);
        }
        cout<<tmp<<endl;
    }

    return 0;
}

秒客网

CCF 201604-3 路径解析

相关文章