午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

您的位置:首頁技術(shù)文章
文章詳情頁

python - 去除重復行并保留得分最高的行

瀏覽:191日期:2022-07-30 08:05:03

問題描述

第一列(scaffold這一列)相同,則根據(jù)第AS列(AS:i:xx)數(shù)字 xx的大小,保留數(shù)字最大的行。如果數(shù)字大小相同則都保留。

舉例,輸入文件

scaffold_010679_1AL.2 16 chr1A 429400034 119 3272M * GACACAAGAGACTCTTTG * AS:i:3268 XS:i:2147 XF:i:0 XE:i:29 NM:i:1scaffold_010679_1AL.2 16 chr1A 429400034 119 3272M * GACACAAGAGACTCTTTG * AS:i:3268 XS:i:2147 XF:i:0 XE:i:29 NM:i:1 scaffold_010679_1AL.2 16 chr1A 429400034 119 3272M * GACACAAGAGACTCTTTG * AS:i:1268 XS:i:2147 XF:i:0 XE:i:29 NM:i:1scaffold_010679_1AL.3 16 chr1A 429397743 19 599S1730M1I279M * 0 0 TGCCGAGGTTTTTGA * AS:i:1998 XS:i:1877 XF:i:3 XE:i:20 NM:i:2 XN:i:1scaffold_010679_1AL.3 16 chr1A 429397743 19 599S1730M1I279M * 0 0 TGCCGAGGTTTTTGA * AS:i:1098 XS:i:1877 XF:i:3 XE:i:20 NM:i:2 XN:i:1

結(jié)果文件

scaffold_010679_1AL.2 16 chr1A 429400034 119 3272M * GACACAAGAGACTCTTTG * AS:i:3268 XS:i:2147 XF:i:0 XE:i:29 NM:i:1scaffold_010679_1AL.2 16 chr1A 429400034 119 3272M * GACACAAGAGACTCTTTG * AS:i:3268 XS:i:2147 XF:i:0 XE:i:29 NM:i:1 scaffold_010679_1AL.3 16 chr1A 429397743 19 599S1730M1I279M * 0 0 TGCCGAGGTTTTTGA * AS:i:1998 XS:i:1877 XF:i:3 XE:i:20 NM:i:2 XN:i:1

問題解答

回答1:

# coding: utf-8from itertools import groupbywith open(’a.txt’) as f: data = [line for line in f] #因為數(shù)據(jù)的列數(shù)不相同, 只能以AS:i:為開頭來識別 #取第一列為key, AS:i:列為value lst = [(l.split()[0], _) for l in data for _ in l.split() if _.startswith(’AS:i:’)]#找出同key下的max(value) max_lst = [max(list(g)) for k, g in groupby(lst, lambda x: x[0])]#從原數(shù)據(jù)里找到同時包含key和value的行 print [line for line in data for _ in max_lst if _[0] in line and _[1] in line]回答2:

awk ’{n=gensub('.*AS:i:([0-9]+).*','1','g')}n>=k[$1]{c[$1]=n==k[$1]?c[$1]'n'$0:$0;k[$1]=n}END{for(i in c)print c[i]}’ file回答3:

grep '`sort -r -t '*' -k 3 b.txt | head -1 |awk -F '*' ’{split($3,a,' ');print a[1]}’`' b.txt

python - 去除重復行并保留得分最高的行

思路文件按星號*分列分3列,按照第三列降序排序,取出第一行,取出AS:i:最大數(shù),grep搜索之,得到結(jié)果。

是我沒仔細看提問,失誤了~~結(jié)果不對

標簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 操操操网站 | 色区网站 | 可以直接看的毛片 | 天堂中文在线资 | 中文字幕视频在线 | 在线观看免费视频一区 | 麻豆视频在线免费看 | 男人天堂网在线视频 | 一区二区三区在线观看免费视频 | 青青视频二区 | 久久久久免费 | 欧美 中文字幕 | 大学生三级中国dvd 亚洲www在线观看 | 免费又黄又爽又色的视频 | 日韩福利片 | 国产精品美女久久久久久久久 | 玖玖在线 | 一区不卡视频 | 天天操夜夜操视频 | 久久a久久 | 亚洲欧美激情精品一区二区 | 久久久久久久久亚洲 | 丁香六月天婷婷 | www在线播放 | 免费在线成人 | 亚州欧美日韩 | 青青av| 在线亚洲欧美 | 一级黄色免费观看 | 国产91精品久久久 | jizzjizzjizzjizz| 久久伊人久久 | 日本黄色录像视频 | 欧美黄色a | 国产女片a归国片aa 精品国产一二三区 | 国产一级免费视频 | 亚洲一区二区在线观看视频 | 日本黄色xxx| 色网免费 | 欧美在线中文字幕 | 黄色高清视频在线观看 |