数据结构与算法分析Java版练习2.8

package ch02;

import java.util.Arrays;
import java.util.Random;

/**
 * 练习2.8 假设需要生成前N个整数的一个随机转换。例如{4，3，1，5，2}和{3，1，4，2，5}就是合法的转换，但
 * {5，4，1，2，1}则不是，因为数1出现两次而数3却没有。这个程序常常用于模拟一些算法。我们假设存在一个随机数
 * 生成器r,它有方法randInt(i, j),它以相同的概率生成i和j之间的整数。下面是三个算法：
 * 1. 如下填入从a[0]到a[n-1]的数组a;为了填入a[i],生成随机数直到它不同于已经生成的a[0],a[1],...,a[i-1]时
 *    再将其填入a[i]。
 * 2. 同算法（1），但是要保存一个附加的数组，称之为used数组。当一个随机数ran最初被放入数组a的时候，置used[ran]=true。
 *     这就是说，当用一个随机数填入a[i]时，可以用一步来测试是否该随机数已经被使用，而不是像第一个算法那样（可能）用
 *   i步测试。
 * 3. 填写该数组使得a[i] = i + 1。然后
 *    for (i = 1; i < n; i++)
 *       swapReference(a[i], a[randInt(0, i)]);
 * a. 证明这三个算法都生成合法的置换，并且所有的置换都是可能的。
 *    （证明略。）
 * b. 对每一个算法给出你能够得到的尽可能准确的期望运行时间分析（用大O)。
 * c. 分别写出程序来执行每个算法10次，得出一个好的平均值。对N=250, 500, 1000, 2000运行程序（1）；
 *    对N=25 000, 50 000, 100 000, 200 000, 400 000, 800 000运行程序（2）；对N=100 000, 200 000, 400 000, 800 000,
 *    1600 000, 3 200 000, 6 400 000运行程序（3）；
 * d. 将实际的运行时间与你的分析进行比较。
 * e. 每个算法的最坏情形的运行时间是什么？
 *
 */
public class EX08 {
static final Random rand = new Random(47);
private static int randInt(int i, int j) {
return rand.nextInt(j-i+1) + i;
}
/**
 * 如下填入从a[0]到a[n-1]的数组a;为了填入a[i],生成随机数直到它不同于已经生成的a[0],a[1],...,a[i-1]时
 * 再将其填入a[i].
 * 下面算法1和算法2的时间复杂度是从标准答案中参考的，因为涉及概率问题，本人不太肯定。
 * 期望运行时间 O(N^2 * logN)。
 * 最坏运行时间 O(N^2 * logN)。
 */
public static int[] algorithm1(int N) {
int []a = new int[N];
for (int i = 0; i < a.length; ++i) {  
while (true) {
a[i] = randInt(1, N);        
boolean foundDup = false;     
for (int j = 0; j < i; ++j) {  
if (a[i] == a[j]) {
foundDup = true;
break;
}
}
if (!foundDup) {
break;
}
}
}
return a;
}

/**
 * 同算法（1），但是要保存一个附加的数组，称之为used数组。当一个随机数ran最初被放入数组a的时候，置used[ran]=true。
  * 这就是说，当用一个随机数填入a[i]时，可以用一步来测试是否该随机数已经被使用，而不是像第一个算法那样（可能）用
     * i步测试。
     * 期望运行时间O(N * logN)。
     * 最坏运行时间O(N * logN)。
 */
public static int[] algorithm2(int N) {
int[] a = new int[N];
boolean[] used = new boolean[N+1];
for (int i = 0; i < a.length; ++i) {
do {
a[i] = randInt(1, N);
} while (used[a[i]]);
used[a[i]] = true;
}
return a;
}

/**
 * 填写该数组使得a[i] = i + 1。然后
 *    for (i = 1; i < n; i++)
 *       swapReference(a[i], a[randInt(0, i)]);
 * 期望运行时间O(N)。
 * 最坏运行时间O(N)。
 */
public static int[] algorithm3(int N) {
int[] a = new int[N];
for (int i = 0; i < N; ++i) {
a[i] = i + 1;
}

for (int i = 1; i < N; ++i) {
swapReferences(a, i, randInt(0, i));
}
return a;
}

private static void swapReferences(int a[], int i, int j) {
int temp = a[i];
a[i] = a[j]; 
a[j] = temp;
}

public static void main(String[] args) {
/*System.out.println(Arrays.toString(algorithm1(10)));
System.out.println(Arrays.toString(algorithm2(10)));
System.out.println(Arrays.toString(algorithm3(10)));*/
int []N1 = new int[] {250, 500, 1000, 2000};
int []N2 = new int[] {25000, 50000, 100000, 200000, 400000, 800000};
int []N3 = new int[] {100000, 200000, 400000, 800000, 1600000, 3200000, 6400000};
System.out.println("算法1:");
for (int i = 0; i < N1.length; ++i) {
System.out.println(N1[i] + ": " + testN(1, N1[i]) + " ms");
}

System.out.println("算法2:");
for (int i = 0; i < N2.length; ++i) {
System.out.println(N2[i] + ": " + testN(2, N2[i]) + " ms");
}

System.out.println("算法3:");
for (int i = 0; i < N3.length; ++i) {
System.out.println(N3[i] + ": " + testN(3, N3[i]) + " ms");
}
}

private static long testN(int algorithmNum, int N) {
long startTime = System.currentTimeMillis();
switch (algorithmNum) {
case 1:
for (int i = 0; i < 10; ++i)
algorithm1(N);
break;
case 2:
for (int i = 0; i < 10; ++i)
algorithm2(N);
break;
default:
for (int i = 0; i < 10; ++i)
algorithm3(N);
break;
}

long endTime = System.currentTimeMillis();
return endTime - startTime;
}
}
/*
 * 算法时间分析
 * 如果算法的复杂度为O(N^k), k>1, 如果输入分别为 N1, N2,且N1的运行时间为T1,则
 * T2 = T1 * ((N2/N1)^k) * (logN2/logN1)。可以验证下面的执行时间是否大致符合此规律。
 * 下面的算法1和算法2的时间，不太肯定，大概正确。
 * 算法1: O(N^2 * logN)
 *     N     实际时间(ms)     预估时间(ms)
 *    250       4              --
 *    500       11             
 *   1000       48             
 *   2000       206            
 *   
 * 算法2: O(N*logN)
 *     N     实际时间(ms)     预估时间(ms)
 *    25k       75              --
 *    50k       140             
 *   100k       298             
 *   200k       601             
 *   400k       1325            
 *   800k       3052            
 *   
 * 算法3: O(N)
 *     N     实际时间(ms)     预估时间(ms)
 *   100k       26             ---
 *   200k       51             52
 *   400k       107            102
 *   800k       245            214
 *   160m       754            490
 *   320m       1927           1508
 *   640m       4587           3854
 *   
 * 总结：因为忽略了常数系数，所以复杂度都是正确的。
 * */
秒客网

数据结构与算法分析Java版练习2.8

相关文章