uvalive 3602 DNA Consensus String

时间:2022-01-24 21:34:14

https://vjudge.net/problem/UVALive-3602

题意:

给定m个长度均为n的DNA序列,求一个DNA序列,使得它到所有的DNA序列的汉明距离最短,若有多个解则输出字典序最小的解。

ps:汉明距离指的是两个等长字符串中字符不同的位置的个数。

思路:

贪心原则,记录每一个位置上哪个字母出现的次数最多,如果有相同的就取字典序最小的那个,然后放进答案就可以了。

代码:

 #include <iostream>
#include <string>
#include <algorithm>
#include <map>
using namespace std; map<char,int> mmp[]; struct node
{
char ch;
int sum;
} c[]; bool cmp(node aa,node bb)
{
if (aa.sum == bb.sum) return aa.ch < bb.ch; return aa.sum > bb.sum;
} int main()
{
int t; cin >> t; while (t--)
{
int m,n; cin >> m >> n; for (int i = ;i < n;i++) mmp[i].clear(); for (int i = ;i < m;i++)
{
string a; cin >> a; for (int j = ;j < n;j++)
mmp[j][a[j]]++;
} string s; int ans = ; for (int i = ;i < n;i++)
{
int cnt = ; if (mmp[i]['A'])
{
c[cnt].ch = 'A';
c[cnt].sum = mmp[i]['A'];
cnt++;
} if (mmp[i]['C'])
{
c[cnt].ch = 'C';
c[cnt].sum = mmp[i]['C'];
cnt++;
} if (mmp[i]['G'])
{
c[cnt].ch = 'G';
c[cnt].sum = mmp[i]['G'];
cnt++;
} if (mmp[i]['T'])
{
c[cnt].ch = 'T';
c[cnt].sum = mmp[i]['T'];
cnt++;
} sort(c,c+cnt,cmp); s.push_back(c[].ch); int tmp = ; for (int j = ;j < cnt;j++)
tmp += c[j].sum; ans += (tmp - c[].sum);
} cout << s << endl << ans << endl;
} return ;
}