PDB (文件格式)

PDB扩展名

.pdb, .ent, .brk互联网媒体类型

chemical/x-pdb格式类型化学文件格式

PDB文件格式(PDB为蛋白质数据库英语名称“Protein Data Bank”缩写),顾名思义是一种由蛋白质数据库最先采纳,用于储存蛋白质三维结构的文件格式。这种文件格式详细记录了

蛋白质中每个原子的坐标信息、蛋白质二级结构信息,以及原子之间的相互作用等信息,同时附有简要的蛋白质的名称与生物学性质信息。

历史[编辑]

1976年,研究人员认为应该有一种人类可直接阅读的保存蛋白数据文件,将这种文件上传到数据库中将会有利于研究人员相互交流不同蛋白质的结构信息,因此发明了PDB文件格式。PDB文件固定有80列,这是因为当时早期电脑的打孔卡最多只支持在一行打80个孔[1]。此后,PDB文件经过了一些调整,截至2011年7月,最新的PDB格式版本是3.30[2]。

例子[编辑]

以下是一个人工合成的多肽的PDB文件:

HEADER EXTRACELLULAR MATRIX 22-JAN-98 1A3I

TITLE X-RAY CRYSTALLOGRAPHIC DETERMINATION OF A COLLAGEN-LIKE

TITLE 2 PEPTIDE WITH THE REPEATING SEQUENCE (PRO-PRO-GLY)

...

EXPDTA X-RAY DIFFRACTION

AUTHOR R.Z.KRAMER,L.VITAGLIANO,J.BELLA,R.BERISIO,L.MAZZARELLA,

AUTHOR 2 B.BRODSKY,A.ZAGARI,H.M.BERMAN

...

REMARK 350 BIOMOLECULE: 1

REMARK 350 APPLY THE FOLLOWING TO CHAINS: A, B, C

REMARK 350 BIOMT1 1 1.000000 0.000000 0.000000 0.00000

REMARK 350 BIOMT2 1 0.000000 1.000000 0.000000 0.00000

...

SEQRES 1 A 9 PRO PRO GLY PRO PRO GLY PRO PRO GLY

SEQRES 1 B 6 PRO PRO GLY PRO PRO GLY

SEQRES 1 C 6 PRO PRO GLY PRO PRO GLY

...

ATOM 1 N PRO A 1 8.316 21.206 21.530 1.00 17.44 N

ATOM 2 CA PRO A 1 7.608 20.729 20.336 1.00 17.44 C

ATOM 3 C PRO A 1 8.487 20.707 19.092 1.00 17.44 C

ATOM 4 O PRO A 1 9.466 21.457 19.005 1.00 17.44 O

ATOM 5 CB PRO A 1 6.460 21.723 20.211 1.00 22.26 C

...

HETATM 130 C ACY 401 3.682 22.541 11.236 1.00 21.19 C

HETATM 131 O ACY 401 2.807 23.097 10.553 1.00 21.19 O

HETATM 132 OXT ACY 401 4.306 23.101 12.291 1.00 21.19 O

...

参见[编辑]

mmCIF(英语:Crystallographic Information File)

参考资料[编辑]

^ Berman, Helen M. "The protein data bank: a historical perspective." Acta Crystallographica Section A 64.1 (2007): 88-95.

^ Atomic Coordinate Entry Format Version 3.3. wwPDB. July 2011 [2023-06-08]. (原始内容存档于2015-01-24).

这是一篇与生物信息学相关的小作品。您可以通过编辑或修订扩充其内容。查论编