python实现比对两个json串的方法

时间:2023-03-09 06:12:25
python实现比对两个json串的方法

  记录瞬间

前段时间为了解决一些实际问题,引出了要对json字符串进行比对的需求。

觉得有意义,作以简单记录。

# 比对数据
def compare_data(set_key, src_data, dst_data, noise_data, num):
if isinstance(src_data, dict) and isinstance(dst_data, dict):
"""若为dict格式"""
for key in dst_data:
if key not in src_data:
print("src不存在这个key")
noise_data[key] = "src不存在这个key"
for key in src_data:
if key in dst_data:
if src_data[key] != dst_data[key] and num == 1:
noise_data[key] = "容忍不等"
if src_data[key] != dst_data[key] and num == 2:
noise_data[key] = {}
noise_data[key]["primary"] = src_data[key]
noise_data[key]["candidate"] = dst_data[key]
"""递归"""
compare_data(key, src_data[key], dst_data[key], noise_data, num)
else:
noise_data[key] = ["dst不存在这个key"]
elif isinstance(src_data, list) and isinstance(dst_data, list):
"""若为list格式"""
if len(src_data) != len(dst_data) and len(set_key) != 0:
print("list len: '{}' != '{}'".format(len(src_data), len(dst_data)))
noise_data[set_key]["primary"] = str(src_data)
noise_data[set_key]["candidate"] = str(dst_data)
return
if len(src_data) == len(dst_data) and len(src_data) > 1:
for index in range(len(src_data)):
for src_list, dst_list in zip(sorted(src_data[index]), sorted(dst_data[index])):
"""递归"""
compare_data("", src_list, dst_list, noise_data, num)
else:
for src_list, dst_list in zip(sorted(src_data), sorted(dst_data)):
"""递归"""
compare_data("", src_list, dst_list, noise_data, num)
else:
if str(src_data) != str(dst_data):
print("src_data", src_data, "dst_data", dst_data)
return noise_data

代码实现了出入的src_data、dst_data两个字符串,noise_data作为记录两个字符串的差异进行返回。

set_key是对json串中存在key值对应的list列表时,比对了列表长度不等,我们认为不需要在对列表中的具体元素进行对比。

num区分第一次对比和第二次对比时需要记录的选项。

# 分析获取的数据,并清空存储
def analyse_data():
noise_data1 = {}
mark_result = compare_data("", response["primary"], response["secondary"], noise_data1, 1)
noise_data2 = {}
comp_result = compare_data("", response["primary"], response["candidate"], noise_data2, 2)
td1 = "<tr><td style=\"background-color: #fcf8e3\">"
td2 = "</td><td style=\"width: 45%;padding: 8px;background-color: " \
"#dff0d8;line-height: 1.42857143;vertical-align: left;\"><pre style=\"white-space: pre-wrap!important;" \
"word-wrap: break-word!important;*white-space:normal!important;\">"
diff_td2 = "</td><td style=\"width: 45%;padding: 8px;background-color: " \
"#dff0d8;line-height: 1.42857143;vertical-align: left;\">"
diff_td3 = "</td><td style=\"width: 45%;padding: 8px;background-color: " \
"#dff0d8;line-height: 1.42857143;vertical-align: left;\">"
with open("./result.html", mode="a", encoding="UTF-8") as f:
print(td1 + "Response : ", td2 + json.dumps(response["primary"], indent=4, ensure_ascii=False) + "</pre>" +
td2 + json.dumps(response["candidate"], indent=4, ensure_ascii=False) + "</pre></td></tr>", file=f)
print("mark = ", mark_result)
print("comp = ", comp_result)
if (len(comp_result) - len(mark_result)) > 0:
diff_td = "<tr><td rowspan=\"" + str(len(comp_result) - len(mark_result)) + "\" style=\"background-color: #bf466a\">"
print("diff_td = ", diff_td)
with open("./result.html", mode="a", encoding="UTF-8") as f:
print(diff_td + "Diff Result ", file=f)
for key in comp_result:
if key not in mark_result:
try:
with open("./result.html", mode="a", encoding="UTF-8") as f:
print(diff_td2 + key + "->" + str(noise_data2[key]["primary"]) +
diff_td3 + str(noise_data2[key]["candidate"]) + "</td></tr><tr>", file=f)
# print(key + " = A:" + str(noise_data2[key]["primary"]) + "<->D:" + str(noise_data2[key]["candidate"])
            #     + " Maybe a new bug.", file=f)
print(key, "有可能是bug,要检查了。", str(noise_data2[key]["primary"]), str(noise_data2[key]["candidate"]))
except Exception as e:
with open("./result.html", mode="a", encoding="UTF-8") as f:
print(td1 + "Diff Result : ", td2 + str(noise_data2[key]["primary"]) + "</pre>" +
td2 + str(noise_data2[key]["candidate"]) + "</pre></td></tr>", file=f)
# print(key + " = A:" + str(noise_data2[key]["primary"]) + "<->D:" + str(noise_data2[key]["candidate"])
            #     + " Maybe a new bug.", file=f)
print(e) noise_data1.clear()
noise_data2.clear()
response.clear()

这里的response作为全局的变量进行使用。我们在获取了噪音数据noise_data1和noise_data2时,对噪音数据进行比对。

添加到result.html网页中,作为呈现的文本。

============================================