Python中对复杂数据结构排序(类似C中结构体数据结构)

时间:2022-08-30 19:43:12

Python中排序主要有两个函数:sorted和列表成员函数sort,两者除了调用方式有些区别外,最显著的区别是sorted会新建一个排序好的列表并返回,而sort是修改原列表并排好序。sorted的原型是:

sorted(iterable, cmp=None, key=None, reverse=False)

sort的原型是:

list.sort(cmp=None, key=None, reverse=False)

其中cmp和key都是函数引用,即可以传入函数名。这两个函数都是对list里的成员进行运算。reverse是指是否逆序。

在c中经常会出现结构体或链表之类的数据结构,而这在Python中也是可以处理的。

如数据结构是这样的:

   学号   分数1  分数2
10000007 90 78
那么可以用一个列表保存学生的信息,即

info = ['10000007', '90', '78']

如果是简单的按某一分数进行排序,如按分数2排序,则可以这样:

如果输入的数据是:

14                     #学生总数
10000001 64 90 #具体信息
10000002 90 60
10000011 85 80
10000003 85 80
10000004 80 85
10000005 82 77
10000006 83 76
10000007 90 78
10000008 75 79
10000009 59 90
10000010 88 45
10000012 80 100
10000013 90 99
10000014 66 60

代码:

#!/usr/bin/python
def getKey( x ):
return int(x[2])

num = input()

list = []
for i in range(num):
info = raw_input().split()
list.append(info)

list.sort( key=getKey )
for i in list:
print i[0], i[1], i[2]

输出为:

10000010 88 45
10000002 90 60
10000014 66 60
10000006 83 76
10000005 82 77
10000007 90 78
10000008 75 79
10000011 85 80
10000003 85 80
10000004 80 85
10000001 64 90
10000009 59 90
10000013 90 99
10000012 80 100

代码量相较于c是精简很多,这归功与Python强大的功能(但在大量数据处理时,时间效率和空间效率一般都比c低,但开发效率很高)。

这是通过传递key来排序,也可以通过传递cmp函数来排序。再看一个复杂的例子:

题目描述:

输入第1行给出3个正整数,分别为:N(<=105),即考生总数;L(>=60),为录取最低分数线,即德分和才分均不低于L的考生才有资格被考虑录取;H(<100),为优先录取线——德分和才分均不低于此线的被定义为“才德全尽”,此类考生按德才总分从高到低排序;才分不到但德分到线的一类考生属于“德胜才”,也按总分排序,但排在第一类考生之后;德才分均低于H,但是德分不低于才分的考生属于“才德兼亡”但尚有“德胜才”者,按总分排序,但排在第二类考生之后;其他达到最低线L的考生也按总分排序,但排在第三类考生之后。

随后N行,每行给出一位考生的信息,包括:准考证号、德分、才分,其中准考证号为8位整数,德才分为区间[0, 100]内的整数。数字间以空格分隔。

输出格式:

输出第1行首先给出达到最低分数线的考生人数M,随后M行,每行按照输入格式输出一位考生的信息,考生按输入中说明的规则从高到低排序。当某类考生中有多人总分相同时,按其德分降序排列;若德分也并列,则按准考证号的升序输出。


原题见:http://pat.zju.edu.cn/contests/pat-b-practise/1015

代码:

#!/usr/bin/python

from sys import exit

def myCmp( a, b ):
valuea = 2 * int(a[1]) + int(a[2])
valueb = 2 * int(b[1]) + int(b[2])

if valuea > valueb:
return -1
elif valuea == valueb:
if a[0] < b[0]:
return -1
else:
return 1
else:
return 1

rawIn = raw_input().split()
num = int(rawIn[0])
jige = int(rawIn[1])
prio = int(rawIn[2])

firstClass = []
secondClass = []
thirdClass = []
forthClass = []

for i in range(num):
rawIn = raw_input().split()

if int(rawIn[1]) >= prio and int(rawIn[2]) >= prio:
firstClass.append(rawIn)
elif int(rawIn[1]) >= prio and jige <= int(rawIn[2]) <= prio:
secondClass.append(rawIn)
elif int(rawIn[1]) >= jige and int(rawIn[2]) >= jige and int(rawIn[1]) >= int(rawIn[2]):
thirdClass.append(rawIn)
elif int(rawIn[1]) >= jige and int(rawIn[2]) >= jige:
forthClass.append(rawIn)
else:
pass

firstClass.sort(cmp=myCmp)
secondClass.sort(cmp=myCmp)
thirdClass.sort(cmp=myCmp)
forthClass.sort(cmp=myCmp)

print len(firstClass) + len(secondClass) + len(thirdClass) + len(forthClass)
for i in [firstClass, secondClass, thirdClass, forthClass]:
for j in i:
print j[0], j[1], j[2]

exit(0)

输入:

14 60 80
10000001 64 90
10000002 90 60
10000011 85 80
10000003 85 80
10000004 80 85
10000005 82 77
10000006 83 76
10000007 90 78
10000008 75 79
10000009 59 90
10000010 88 45
10000012 80 100
10000013 90 99
10000014 66 60

输出:

12
10000013 90 99
10000012 80 100
10000003 85 80
10000011 85 80
10000004 80 85
10000007 90 78
10000006 83 76
10000005 82 77
10000002 90 60
10000014 66 60
10000008 75 79
10000001 64 90

不过这份代码在提交OJ时是存在几个case超时的,这也是Python存在的一个问题(不知道有没有更高效的Python方法)。这里为什么不用key呢,是因为该题的比较过程通过key很难完全体现出来,所以用cmp,这也说明cmp的适用性更广。但是由于key只是涉及单个list元素的计算,而cmp涉及两个list元素的计算,所以key更高效。