CCF 201604-3 路径解析

时间:2022-04-14 21:35:37

原文地址: http://moilk.org/blog/2016/09/09/ccf2016043/

问题描述
  在操作系统中,数据通常以文件的形式存储在文件系统中。文件系统一般采用层次化的组织形式,由目录(或者文件夹)和文件构成,形成一棵树的形状。文件有内容,用于存储数据。目录是容器,可包含文件或其他目录。同一个目录下的所有文件和目录的名字各不相同,不同目录下可以有名字相同的文件或目录。
  为了指定文件系统中的某个文件,需要用路径来定位。在类 Unix 系统(Linux、Max OS X、FreeBSD等)中,路径由若*分构成,每个部分是一个目录或者文件的名字,相邻两个部分之间用 / 符号分隔。
  有一个特殊的目录被称为根目录,是整个文件系统形成的这棵树的根节点,用一个单独的 / 符号表示。在操作系统中,有当前目录的概念,表示用户目前正在工作的目录。根据出发点可以把路径分为两类:
* 绝对路径:以 / 符号开头,表示从根目录开始构建的路径。
*Ÿ 相对路径:不以 / 符号开头,表示从当前目录开始构建的路径。
  例如,有一个文件系统的结构如下图所示。在这个文件系统中,有根目录 / 和其他普通目录 d1、d2、d3、d4,以及文件 f1、f2、f3、f1、f4。其中,两个 f1 是同名文件,但在不同的目录下。
  CCF 201604-3 路径解析
  对于 d4 目录下的 f1 文件,可以用绝对路径 /d2/d4/f1 来指定。如果当前目录是 /d2/d3,这个文件也可以用相对路径 ../d4/f1 来指定,这里 .. 表示上一级目录(注意,根目录的上一级目录是它本身)。还有 . 表示本目录,例如 /d1/./f1 指定的就是 /d1/f1。注意,如果有多个连续的 / 出现,其效果等同于一个 /,例如 /d1///f1 指定的也是 /d1/f1。
  本题会给出一些路径,要求对于每个路径,给出正规化以后的形式。一个路径经过正规化操作后,其指定的文件不变,但是会变成一个不包含 . 和 .. 的绝对路径,且不包含连续多个 / 符号。如果一个路径以 / 结尾,那么它代表的一定是一个目录,正规化操作要去掉结尾的 /。若这个路径代表根目录,则正规化操作的结果是 /。若路径为空字符串,则正规化操作的结果是当前目录。
输入格式
  第一行包含一个整数 P,表示需要进行正规化操作的路径个数。
  第二行包含一个字符串,表示当前目录。
  以下 P 行,每行包含一个字符串,表示需要进行正规化操作的路径。
输出格式
  共 P 行,每行一个字符串,表示经过正规化操作后的路径,顺序与输入对应。
样例输入
  7
  /d2/d3
  /d2/d4/f1
  ../d4/f1
  /d1/./f1
  /d1///f1
  /d1/
  ///
  /d1/../../d2
样例输出
  /d2/d4/f1
  /d2/d4/f1
  /d1/f1
  /d1/f1
  /d1
  /
  /d2
评测用例规模与约定
  1 ≤ P ≤ 10。
  文件和目录的名字只包含大小写字母、数字和小数点 .、减号 - 以及下划线 _。
  不会有文件或目录的名字是 . 或 .. ,它们具有题目描述中给出的特殊含义。
  输入的所有路径每个长度不超过 1000 个字符。
  输入的当前目录保证是一个经过正规化操作后的路径。
  对于前 30% 的测试用例,需要正规化的路径的组成部分不包含 . 和 .. 。
  对于前 60% 的测试用例,需要正规化的路径都是绝对路径。

解题说明
  这道题要讲究操作的顺序。首先,如果字符串的第一个字符不是’/’, 就不管别的先把当前目录方在前面, 这样所有字符串就都变成了绝对路径。然后再把中间所有多余的’/’去掉,末尾的保留。如果末尾没有’/’, 其实加上会比较好, 这样可以发现如果末尾是当前目录或者上级目录,操作变得方便多了。接着,所有的当前目录符号都是多余的,全部去掉,这时要注意搜索的是”/./”, 因为目录或者文件名可以包含’.’。做到这一步就发现只剩下上级目录符号了, 我想不用我再多说也知道该怎么办了。最后去掉末尾的’/’, 就全部搞定了(注意,如果之前末尾没有自己追加一个’/’,这时还要额外考虑末尾是”/..”和”/.”的情况, 我下面给的代码就是这样, 写到这里的时候才发现可以追加斜杠变得简单)。

#include <iostream>

using namespace std;

string str[10];

string::size_type refind(const string &str,string::size_type pos,const char c) {
    int p=pos;
    while(1) {
        if(p==-1) {
            return (string::npos);
        }
        if(str[p]==c) {
            return p;
        }
        p--;
    }

    return (string::npos);
}

int main(void) {
    int N;
    string pwd,pwdf,tmp;
    cin>>N;
    cin>>pwd;
    getchar();
    string::size_type pre=0;
    string::size_type post;
    while(1) {
        post=pwd.find('/',pre+1);
        if(post==string::npos) {
            break;
        }
        pre=post;
    }
    if(pre==0) {
        pwdf="/";
    } else {
        pwdf=pwd.substr(0,pre);
    }

    for(int i=0; i<N; i++) {
        getline(cin,tmp);
        // 头部的处理
        if(tmp[0]!='/') {
            tmp=pwd+"/"+tmp;
        }
        // 去掉多于斜杠
        pre=0;
        while(1) {
            post=tmp.find('/',pre);
            if(post==string::npos) {
                break;
            }
            pre=post+1;
            post++;
            while(1) {
                if(post>=tmp.size()||tmp[post]!='/') {
                    break;
                }
                post++;
            }
            tmp.erase(pre,post-pre);
        }
        // 去掉中间的单点
        pre=0;
        while(1) {
            post=tmp.find("/./",pre);
            if(post==string::npos) {
                break;
            }
            tmp.erase(post+1,2);
            pre=post;
        }
        // 去掉中间的双点
        pre=0;
        while(1) {
            post=tmp.find("/../",pre);
            if(post==string::npos) {
                break;
            }
            pre=refind(tmp,post-1,'/');
            if(pre!=string::npos) {
                pre++;
            } else {
                pre=post+1;
            }
            tmp.erase(pre,post+4-pre);
            pre--;
        }

        //去掉末尾的点
        int len=tmp.size();
        if(len>=2&&tmp[len-1]=='.'&&tmp[len-2]=='/') {
            tmp.erase(len-1,1);
        }
        len=tmp.size();
        if(len>=3&&tmp[len-1]=='.'&&tmp[len-2]=='.'&&tmp[len-3]=='/') {
            pre=refind(tmp,len-4,'/');
            if(pre!=string::npos) {
                pre++;
            } else {
                pre=len-2;
            }
            tmp.erase(pre,len);
        }

        // 去掉末尾的斜杠
        len=tmp.size();
        if(len>1&&tmp[len-1]=='/') {
            tmp.erase(len-1,1);
        }
        cout<<tmp<<endl;
    }

    return 0;
}