使用rsync下载PDB数据库
0.1062018.05.28 15:56:30字数 221阅读 2,827
2018.5.28 星期一 多云 biolearn
从PDB数据库下载复合物的结构有两种方式,一是直接通过网页检索下载,二是使用rsync从PDB ftp端下载。
下载指定ID的PDB
PDB ftp 端的文件命名格式是 pdbID.ent.gz,所以在下载指定名字的PDB文件时,需要按照ftp上的命名规则命名下载,例如,下载名为1aay的结构,下载的文件是gz格式,解压后即为PDB文件。
wget ftp://ftp.wwpdb.org/pub/pdb/data/structures/all/pdb/pdb1aay.ent.gz
gunzip pdb1aay.ent.gz
下载全部的PDB文件
不同文件格式对应的下载命令
PDB格式
rsync -rlpt -v -z --delete --port=33444 rsync.rcsb.org::ftp_data/structures/divided/pdb/ ./pdb
mmCIF格式
rsync -rlpt -v -z --delete --port=33444 rsync.rcsb.org::ftp_data/structures/divided/mmCIF/ ./mmCIF
xml格式
rsync -rlpt -v -z --delete --port=33444 rsync.rcsb.org::ftp_data/structures/divided/XML/ ./XML
解压所有文件
将下载下来的所有.gz的文件进行解压并修改为.pdb的格式并存放在文件夹pdbstructure中的shell脚本
#!/bin/sh
mkdir pdbstructure
for filename in `ls ./pdb`
do
gunzip ./pdb/$filename/*
for subfile in `ls ./pdb/$filename`
do
target_name=${subfile:3:4}.pdb
mv ./pdb/$filename/$subfile ./pdbstructure/$target_name
done
done
参考资料
原文地址:http://www.cnblogs.com/managechina/p/16918010.html
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,请务用于商业用途!
3. 如果你也有好源码或者教程,可以到用户中心发布,分享有积分奖励和额外收入!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如遇到加密压缩包,默认解压密码为"gltf",如遇到无法解压的请联系管理员!
8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载
声明:如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性