使用tleap制备多肽库

2018年3月30日

前段时间碰到一个需要筛选多肽的客户。比方说,需要筛选所有的三肽和四肽与某靶标的亲和力。Let me see… 一共有168000个多肽!要是用软件一个一个的绘制,啊哈,真是天荒地老的节奏啊。于是我想到了AmberTools的tleap工具~ 配合循环脚本,应该是可行的。

 

操作系统:CentOS 6.8 x64

软件:AmberTools

 

废话不说,直接贴代码。

#!/bin/sh

 

#generation of polypeptide sequences

cat resname.txt | while read line

do

    a=$line

    cat resname.txt | while read line

    do

        b=$line

        cat resname.txt | while read line

        do

            c=$line

            echo "$a $b $c" > pepdb.txt

            cat resname.txt | while read line

            do

                d=$line

                echo "$a $b $c $d" >> pepdb.txt

            done

        done

    done

done

 

#generation of job scripts

M=`cat pepdb.txt | wc -l`

N=`expr $M / 100000`

rm -rf ./scripts/* > /dev/null 2>&1

mkdir scripts > /dev/null 2>&1

for ((i=1;i<$[$N+2];i++))

do

    echo "source leaprc.ff99SB" > ./scripts/tleap$i.in

    j=$[100000*$[$i-1]]

    sed -n "$[$j+1],$[$j+100000]p" pepdb.txt | while read line

    do

    j=$[$j+1]

        echo "pep = sequence { $line }" >> ./scripts/tleap$i.in

        echo "savepdb pep pep${j}.pdb" >> ./scripts/tleap$i.in

    done

    echo "quit" >> ./scripts/tleap$i.in

done

 

#Run scripts and create the polypeptides

mkdir pepdb && cd pepdb

for file in `ls ../scripts`

do

    tleap -f ../scripts/$file

done

 

您可以点击这里下载这个脚本文件,另外,还用到了一个resname.txt文件,里面记录了20种氨基酸的名称。将文件resname.txt与pepdb.sh放在同一目录下运行即可。

运行pepdb.sh,生成168000个分子。看到命令行中一个一个的多肽分子刷出来,有没有很激动。总共耗时3 min!另外,在脚本使用过程中,发现在生成很多分子后命令行有卡顿现象。查看资源监视器,发现是由于内存占用过多。于是在我的脚本中,每生成10万个多肽分子,会自动重启tleap继续操作。您可以根据您电脑上的内存使用情况进行调整。

得到这些多肽后,进行批量最小化或其他优化即可。

好运~

版权声明:本文由Seif Joe于2018/03/30原创发表

转载请注明:使用tleap制备多肽库 | Seif Joe

分享: