参考资料
本次实验文件
正则表达式参考资料
wxMEdit 16进制编辑器
课堂上重点考核:
- 字节流与二进制文件
- 字符流与文本文件
- 缓冲流
- 正则表达式
第1次实验
0. 字节流与二进制文件
- 使用DataOutputStream与FileOutputStream将Student对象写入二进制文件student.data
- 二进制文件与文本文件的区别
- try...catch...finally注意事项
- 使用try..with...resouces关闭资源
- 使用DataInputStream与FileInputStream从student.data中读取学生信息并组装成对象
Student源代码见实验文件中的“基础代码”中的Student.java。
1、2为一个考核点。
1. 字符流与文本文件:使用 PrintWriter(写),BufferedReader(读)
任务:
- 使用BufferedReader从编码为UTF-8的文本文件中读出学生信息,并组装成对象然后输出。
- 中文乱码问题(FileReader使用系统默认编码方式读取文件,会产生乱码,可使用InputStreamReader解决)
- String的split方法使用
\\s+
可以使用多个空格作为分隔符。 - 进阶:修改Students.txt文件,在正确的数据行中间增加一些错误行(如,每行只有3个数据,或者应该是数字的地方放入其他字符),修改自己的程序,让起可以处理出错的行(报错但可以继续运行)。
- 编写public static ListreadStudents(String fileName);从fileName指定的文本文件中读取所有学生,并将其放入到一个List中
- 使用PrintWriter将Student对象写入文本文件,基础代码见后。注意:缓冲区问题。
- 使用ObjectInputStream/ObjectOutputStream读写学生对象。
其中1、2为1个考核点,3 为一个考核点
参考资料:
- 实验必需文件:基础代码目录中的Student.java(用来承载数据),Students.txt(UTF-8编码的包含中文的学生信息)
- 参考代码:
- BufferedReaderTest.java(BufferedReader的使用)
- InputStreamReaderTest.java(中文乱码)
- TextFileTest.java(将文件中读取到的数据组装成对象)
- 注意:文件名如果不指定路径名,文件时写到Eclipse的
Workspace
内相关的目录中 - 小技巧1:Eclipse并排显示(最大化编辑窗口,往下拖动编辑窗口标题)
- 小技巧2:通过修改workspace的Text file encoding可以绕过读取中文UTF-8编码文件乱码的问题。
PrintWriter写文件基础代码:
List<Student> stuList = new ArrayList<>();
Student d1 = new Student(1,"x",18,99.5);
Student d2 = new Student(2,"x",19,100.0);
Student d3 = new Student(3,"x",20,59.5);
PrintWriter printWriter = null;
try {
printWriter = new PrintWriter("d:/stuList.data");
//你的代码,请查询jdk文档PrintWriter的用法
} catch (FileNotFoundException e) {
e.printStackTrace();
}
2. 缓冲流(结合使用JUint进行测试)
使用PrintWriter往文件里写入1千万行随机整数,范围在[0,10]。随机数种子设置为100.
然后从文件将每行读取出来转换成整数后相加。然后依次输出“个数 和 平均值(保留5位小数)”。
对比使用BufferedReader
与使用Scanner
从该文件中读取数据(只读取,不输出),使用哪种方法快?
- 使用junit对比
BufferedReader
与Scanner
读文件的效率 - 格式化输出:System.out.format。
- 要使用Scanner的hasNextXXX方法来判断是否到文件尾,否则会抛异常。
- Scanner的asNextXXX方法应与相对应的nextXXX方法配合使用,否则容易出。
- 请删除
fail("Not yet implemented");
;并且在需要测试的方法上使用@Test
进行标注。
参考资料:
思考题:
为什么以下代码生成的文件大小是0,而只有当count=16384(两倍的默认缓冲区大小)才可以真正写入到文件?
String fileName = "d:/Test.data";
int count = 16383;
PrintWriter pw = null;
try {
pw = new PrintWriter(fileName);
for (int i = 0; i < count; i++) {
pw.print(1);
}
} catch (FileNotFoundException e) {
e.printStackTrace();
}finally{
//pw.close();
}
第2次实验
3. 字节流之对象流
结合使用ObjectOutputStream、ObjectInputStream与FileInputStream、FileOuputStream实现对Student对象的读写。
编写如下两个方法:
- public static void writeStudent(List stuList)
- public static List readStudents(String fileName)
进阶:
使用wxMEdit打开ObjectOutputStream所生成的文件格式,尝试修改文件,并通过代码读取文件进行验证。
4. 选做:RandomAccessFile
像操作数组一样操作文件内容。
将以上的对大量Student对象的读写使用RandomAceessFile。
特别考核:你觉得使用RandomAccessFile读写文件与使用字节流、字符流、缓冲流相比较各有何优缺点。
5. 文件操作
编写一个程序,可以根据指定目录和文件名,搜索该目录及子目录下的所有文件,如果没有找到指定文件名,则显示无匹配,否则将所有找到的文件名与文件夹名显示出来。
- 编写
public static void findFile(Path dir,String fileName)
方法.
以dir指定的路径为根目录,在其目录与子目录下查找所有和filename
相同的文件名,一旦找到就马上输出到控制台。
提示:
- 使用递归或队列。建议使用队列完成。
- 使用图形界面:
- GUI下可使用JFileChooser控件实现选取目录。控制台下手动指定目录名。
参考代码(参考代码 目录中):
- 一个简单的包括菜单的GUI小程序.rar(包含JFileChooser的用法)
- FindDirectories.java (用于查找文件)
进阶(选做):
自己编写的文件搜索方法基本上有很大缺陷,如不能正确处理符号链接。
考核点:查询资料,尝试使用Files.walkFileTree
方法进行文件搜索。
6. 正则表达式
- 如何判断一个给定的字符串是否是10进制数字格式?尝试编程进行验证。
- 修改HrefMatch.java
- 尝试匹配网页中的数字字符串
- 尝试匹配网页中的图片字符串
1、2为一考核点。
注意:
- 图片字符串的格式类似
img src="style/suizi/more.gif"
,还要注意特例。如img border= "0" src=....
- 可使用
java HrefMatch http://cec.jmu.edu.com
来进行测试。
参考资料:
HrefMatch.java
常用正则表达式.txt
Java正则表达式的语法与示例
特别考核(较难):进一步改造上面的程序,获得图片的链接,如IMG src=“images/mail1.gif”,然后经过处理,生成该图片的实际链接地址http://cec.jmu.edu.com/images/mail1.gif 最后将生成的若干地址,放入一个队列。编写方法,可以依照该队列的所有图片地址,一次将图片下载下来。