Protein/ja: Difference between revisions

Protein/ja
Created page with "===タンパク質の精製=== {{Main/ja|Protein purification/ja}} ''試験管内''分析を行うには、タンパク質を他の細胞成分から分離して精製する必要がある。このプロセスは通常細胞溶解から始まり、細胞膜が破壊され、粗溶解液として知られる溶液中に細胞内内容物が放出される。得られた混合物はultracentrifugation/ja|超遠心分..."
Tags: Mobile edit Mobile web edit
FuzzyBot (talk | contribs)
Updating to match new version of source page
Tags: Mobile edit Mobile web edit
 
(12 intermediate revisions by one other user not shown)
Line 1: Line 1:
<languages />
<languages />
{{About/ja|a class of molecules/ja|protein as a nutrient/ja|Protein (nutrient)/ja}}
{{About/ja|a class of molecules/ja|protein as a nutrient/ja|Protein (nutrient)/ja}}
{{Pathnav|Dietary supplement/ja|frame=1}}
[[File:Myoglobin.png|thumb|タンパク質[[myoglobin/ja|ミオグロビン]]の3次元構造の表現で、ターコイズブルーの[[alpha helix/ja|αヘリックス]]を示す。このタンパク質は、[[X-ray crystallography/ja|X線結晶構造解析]]によって初めて構造が解明された。コイルのうち右中央には、酸素分子(赤)と結合した[[heme group/ja|ヘム基]](灰色で表示)と呼ばれる[[prosthetic group/ja|補欠基]]がある。]]
[[File:Myoglobin.png|thumb|タンパク質[[myoglobin/ja|ミオグロビン]]の3次元構造の表現で、ターコイズブルーの[[alpha helix/ja|αヘリックス]]を示す。このタンパク質は、[[X-ray crystallography/ja|X線結晶構造解析]]によって初めて構造が解明された。コイルのうち右中央には、酸素分子(赤)と結合した[[heme group/ja|ヘム基]](灰色で表示)と呼ばれる[[prosthetic group/ja|補欠基]]がある。]]


Line 65: Line 66:
平均的な大きさの[[bacteria/ja|細菌]]は、細胞あたり約200万個のタンパク質を含むと推定されている(例えば''[[Escherichia coli/ja|大腸菌]]''や''[[Staphylococcus aureus/ja|黄色ブドウ球菌]]'')。より小さな細菌、例えば''[[Mycoplasma/ja|マイコプラズマ]]''や''[[Spirochaete/ja|スピロヘータ]]''は、5万から100万のオーダーで、より少ない分子を含んでいる。対照的に、[[Eukaryote/ja|真核生物]]の細胞は大きく、そのためより多くのタンパク質を含んでいる。例えば、[[Saccharomyces cerevisiae/ja|酵母]]細胞は約5000万個のタンパク質を含み、[[human/ja|ヒト]]細胞は10億から30億個のオーダーであると推定されている。個々のタンパク質コピーの濃度は、細胞あたり数分子から2000万個に及ぶ。タンパク質をコードする遺伝子のすべてがほとんどの細胞で発現しているわけではなく、その数は例えば細胞の種類や外部からの刺激に左右される。例えば、ヒトゲノムがコードする20,000ほどのタンパク質のうち、[[lymphoblastoid/ja|リンパ芽球]]細胞で検出されるのは6,000だけである。
平均的な大きさの[[bacteria/ja|細菌]]は、細胞あたり約200万個のタンパク質を含むと推定されている(例えば''[[Escherichia coli/ja|大腸菌]]''や''[[Staphylococcus aureus/ja|黄色ブドウ球菌]]'')。より小さな細菌、例えば''[[Mycoplasma/ja|マイコプラズマ]]''や''[[Spirochaete/ja|スピロヘータ]]''は、5万から100万のオーダーで、より少ない分子を含んでいる。対照的に、[[Eukaryote/ja|真核生物]]の細胞は大きく、そのためより多くのタンパク質を含んでいる。例えば、[[Saccharomyces cerevisiae/ja|酵母]]細胞は約5000万個のタンパク質を含み、[[human/ja|ヒト]]細胞は10億から30億個のオーダーであると推定されている。個々のタンパク質コピーの濃度は、細胞あたり数分子から2000万個に及ぶ。タンパク質をコードする遺伝子のすべてがほとんどの細胞で発現しているわけではなく、その数は例えば細胞の種類や外部からの刺激に左右される。例えば、ヒトゲノムがコードする20,000ほどのタンパク質のうち、[[lymphoblastoid/ja|リンパ芽球]]細胞で検出されるのは6,000だけである。


<span id="Synthesis"></span>
==合成==
==合成==
{{Anchor|Synthesis}}
{{Anchor|Synthesis}}
Line 115: Line 117:
タンパク質のトポロジーは、骨格のもつれや折り畳まれた鎖内の接点の配置を記述する。タンパク質のトポロジーを特徴付けるために、[[Knotted protein/ja|結び目理論]]と[[Circuit topology/ja|回路トポロジー]]の2つの理論的枠組みが適用されている。タンパク質のトポロジーを記述できるようになることで、タンパク質工学や医薬品開発に新たな道が開かれ、神経筋疾患やがんなどのタンパク質のミスフォールディング疾患に対する理解が深まる。
タンパク質のトポロジーは、骨格のもつれや折り畳まれた鎖内の接点の配置を記述する。タンパク質のトポロジーを特徴付けるために、[[Knotted protein/ja|結び目理論]]と[[Circuit topology/ja|回路トポロジー]]の2つの理論的枠組みが適用されている。タンパク質のトポロジーを記述できるようになることで、タンパク質工学や医薬品開発に新たな道が開かれ、神経筋疾患やがんなどのタンパク質のミスフォールディング疾患に対する理解が深まる。


<span id="Cellular_functions"></span>
==細胞機能==
==細胞機能==
{{Anchor|Cellular functions}}
{{Anchor|Cellular functions}}
Line 147: Line 150:
[[Transmembrane protein/ja|膜貫通タンパク質]]は、[[small molecule/ja|小分子]]やイオンに対する細胞膜の[[Semipermeable membrane/ja|透過性]]を変化させるリガンド輸送タンパク質としても機能する。膜だけでは[[hydrophobic/ja|疎水性]]コアがあり、そこを[[chemical polarity/ja|極性]]分子や荷電分子は[[diffusion/ja|拡散]]できない。膜タンパク質は、そのような分子が細胞内に出入りするための内部チャネルを含んでいる。例えば、[[potassium/ja|カリウム]]チャネルと[[sodium/ja|ナトリウム]]チャネルは、しばしば2つのイオンのうち一方のみを識別する。
[[Transmembrane protein/ja|膜貫通タンパク質]]は、[[small molecule/ja|小分子]]やイオンに対する細胞膜の[[Semipermeable membrane/ja|透過性]]を変化させるリガンド輸送タンパク質としても機能する。膜だけでは[[hydrophobic/ja|疎水性]]コアがあり、そこを[[chemical polarity/ja|極性]]分子や荷電分子は[[diffusion/ja|拡散]]できない。膜タンパク質は、そのような分子が細胞内に出入りするための内部チャネルを含んでいる。例えば、[[potassium/ja|カリウム]]チャネルと[[sodium/ja|ナトリウム]]チャネルは、しばしば2つのイオンのうち一方のみを識別する。


<span id="Structural_proteins"></span>
===構造タンパク質===
===構造タンパク質===


Line 167: Line 171:
''[[in vitro/ja|試験管内]]''分析を行うには、タンパク質を他の細胞成分から分離して精製する必要がある。このプロセスは通常[[cytolysis/ja|細胞溶解]]から始まり、細胞膜が破壊され、[[crude lysate/ja|粗溶解液]]として知られる溶液中に細胞内内容物が放出される。得られた混合物は[[ultracentrifugation/ja|超遠心分離]]を用いて精製することができ、様々な細胞成分を可溶性タンパク質、膜[[lipid/ja|脂質]]およびタンパク質、細胞[[organelle/ja|オルガネラ]]、および[[nucleic acid/ja|核酸]]を含む画分に分画する。[[salting out/ja|塩析]]として知られる方法で[[Precipitation (chemistry)/ja|沈殿]]させると、この溶解液からタンパク質を濃縮することができる。次に、分子量、正味電荷、結合親和性などの特性に基づいて、目的のタンパク質またはタンパク質を単離するために、様々な種類の[[chromatography/ja|クロマトグラフィー]]が用いられる。目的のタンパク質の分子量と[[isoelectric point/ja|等電点]]が既知であれば[[gel electrophoresis/ja|ゲル電気泳動]]で、タンパク質が識別可能な分光学的特徴を有していれば[[spectroscopy/ja|分光学]]で、タンパク質が酵素活性を有していれば[[enzyme assay/ja|酵素アッセイ]]で、精製レベルをモニターすることができる。さらに、[[electrofocusing/ja|エレクトロフォーカシング]]を用いて、タンパク質をその電荷に応じて単離することもできる。
''[[in vitro/ja|試験管内]]''分析を行うには、タンパク質を他の細胞成分から分離して精製する必要がある。このプロセスは通常[[cytolysis/ja|細胞溶解]]から始まり、細胞膜が破壊され、[[crude lysate/ja|粗溶解液]]として知られる溶液中に細胞内内容物が放出される。得られた混合物は[[ultracentrifugation/ja|超遠心分離]]を用いて精製することができ、様々な細胞成分を可溶性タンパク質、膜[[lipid/ja|脂質]]およびタンパク質、細胞[[organelle/ja|オルガネラ]]、および[[nucleic acid/ja|核酸]]を含む画分に分画する。[[salting out/ja|塩析]]として知られる方法で[[Precipitation (chemistry)/ja|沈殿]]させると、この溶解液からタンパク質を濃縮することができる。次に、分子量、正味電荷、結合親和性などの特性に基づいて、目的のタンパク質またはタンパク質を単離するために、様々な種類の[[chromatography/ja|クロマトグラフィー]]が用いられる。目的のタンパク質の分子量と[[isoelectric point/ja|等電点]]が既知であれば[[gel electrophoresis/ja|ゲル電気泳動]]で、タンパク質が識別可能な分光学的特徴を有していれば[[spectroscopy/ja|分光学]]で、タンパク質が酵素活性を有していれば[[enzyme assay/ja|酵素アッセイ]]で、精製レベルをモニターすることができる。さらに、[[electrofocusing/ja|エレクトロフォーカシング]]を用いて、タンパク質をその電荷に応じて単離することもできる。


<div lang="en" dir="ltr" class="mw-content-ltr">
天然のタンパク質の場合、実験室での使用に十分な純度のタンパク質を得るためには、一連の精製工程が必要になることがある。このプロセスを簡略化するために、[[genetic engineering/ja|遺伝子工学]]はしばしば、タンパク質の構造や活性に影響を与えずに精製を容易にする化学的特徴をタンパク質に付加するために用いられる。この場合、特定のアミノ酸配列からなる「タグ」、多くの場合は一連の[[ヒスチジン]]残基(''[[His-tag/ja|His-tag]]'')がタンパク質の一方の末端に付加される。その結果、溶解液を[[nickel/ja|ニッケル]]を含むクロマトグラフィーカラムにかけると、ヒスチジン残基がニッケルに結合してカラムに付着し、溶解液中のタグのない成分はそのまま通過する。複雑な混合物から特定のタンパク質を精製するために、多くの異なるタグが開発されている。
For natural proteins, a series of purification steps may be necessary to obtain protein sufficiently pure for laboratory applications. To simplify this process, [[genetic engineering]] is often used to add chemical features to proteins that make them easier to purify without affecting their structure or activity. Here, a "tag" consisting of a specific amino acid sequence, often a series of [[histidine]] residues (a "[[His-tag]]"), is attached to one terminus of the protein. As a result, when the lysate is passed over a chromatography column containing [[nickel]], the histidine residues ligate the nickel and attach to the column while the untagged components of the lysate pass unimpeded. A number of different tags have been developed to help researchers purify specific proteins from complex mixtures.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
===細胞コンパートメント===
===Cellular localization===
[[File:Localisations02eng.jpg|thumb|right|upright=1.35|異なる[[cellular compartment/ja|細胞コンパートメント]]のタンパク質と、[[green fluorescent protein/ja|緑色蛍光タンパク質]]でタグ付けされた構造(ここでは白)。]]
[[File:Localisations02eng.jpg|thumb|right|upright=1.35|Proteins in different [[cellular compartment]]s and structures tagged with [[green fluorescent protein]] (here, white)]]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
タンパク質の''生体内''研究は、多くの場合、細胞内でのタンパク質の合成と局在に関係している。多くの細胞内タンパク質は[[cytoplasm/ja|細胞質]]で合成され、膜結合タンパク質や分泌タンパク質は[[endoplasmic reticulum/ja|小胞体]]で合成されるが、タンパク質がどのようにして特定の小器官や細胞構造に[[protein targeting/ja|標的化]]されるかの詳細は不明なことが多い。細胞局在を評価するための有用な技術は、遺伝子工学を用いて、目的の天然タンパク質と[[green fluorescent protein/ja|緑色蛍光タンパク質]](GFP)のような"[[reporter gene/ja|レポーター]]"とが結合した[[fusion protein/ja|融合タンパク質]]あるいは[[chimera (protein)/ja|キメラ]]を細胞内で発現させることである。融合タンパク質の細胞内での位置は、反対側の図に示すように、[[:en:microscopy|顕微鏡]]を使ってきれいかつ効率的に可視化することができる。
The study of proteins ''in vivo'' is often concerned with the synthesis and localization of the protein within the cell. Although many intracellular proteins are synthesized in the [[cytoplasm]] and membrane-bound or secreted proteins in the [[endoplasmic reticulum]], the specifics of how proteins are [[protein targeting|targeted]] to specific organelles or cellular structures is often unclear. A useful technique for assessing cellular localization uses genetic engineering to express in a cell a [[fusion protein]] or [[chimera (protein)|chimera]] consisting of the natural protein of interest linked to a "[[reporter gene|reporter]]" such as [[green fluorescent protein]] (GFP). The fused protein's position within the cell can then be cleanly and efficiently visualized using [[microscopy]], as shown in the figure opposite.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
タンパク質の細胞内局在を解明する他の方法では、小胞体、ゴルジ体、リソソームや液胞、ミトコンドリア、葉緑体、細胞膜などの領域について、既知のコンパートメントマーカーを使用する必要がある。これらのマーカーに蛍光タグを付けたものや、既知のマーカーに対する抗体を用いることで、目的のタンパク質の局在を同定することがより簡単になる。例えば、[[indirect immunofluorescence/ja|間接免疫蛍光法]]を用いれば、蛍光の共局在化と局在の証明が可能になる。蛍光色素は、同様の目的で細胞区画を標識するために用いられる。
Other methods for elucidating the cellular location of proteins requires the use of known compartmental markers for regions such as the ER, the Golgi, lysosomes or vacuoles, mitochondria, chloroplasts, plasma membrane, etc. With the use of fluorescently tagged versions of these markers or of antibodies to known markers, it becomes much simpler to identify the localization of a protein of interest. For example, [[indirect immunofluorescence]] will allow for fluorescence colocalization and demonstration of location. Fluorescent dyes are used to label cellular compartments for a similar purpose.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
他の可能性も存在する。例えば、[[immunohistochemistry/ja|免疫組織化学]]では通常、1つ以上の目的のタンパク質に対する抗体を使用し、酵素と結合させて発光シグナルまたは発色シグナルを得る。もう一つの適用可能な手法は、[[:en:isopycnic centrifugation|アイソピクニック遠心分離]]を用いたスクロース(または他の物質)勾配での共分離である。この技術は、既知の密度のコンパートメントと目的のタンパク質の共局在を証明するものではないが、可能性は高く、大規模な研究に適している。
Other possibilities exist, as well. For example, [[immunohistochemistry]] usually uses an antibody to one or more proteins of interest that are conjugated to enzymes yielding either luminescent or chromogenic signals that can be compared between samples, allowing for localization information. Another applicable technique is cofractionation in sucrose (or other material) gradients using [[isopycnic centrifugation]]. While this technique does not prove colocalization of a compartment of known density and the protein of interest, it does increase the likelihood, and is more amenable to large-scale studies.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
最後に、細胞局在化の最も標準的な方法は、[[:en:immunoelectron microscopy|免疫電子顕微鏡法]]である。この手法も、古典的な電子顕微鏡法とともに、目的のタンパク質に対する抗体を用いる。試料は通常の電子顕微鏡検査用に調製され、次に極めて電気密度の高い物質(通常は金)に結合した目的のタンパク質に対する抗体で処理される。これにより、超微細構造の詳細と目的タンパク質の局在の両方を観察することができる。
Finally, the gold-standard method of cellular localization is [[immunoelectron microscopy]]. This technique also uses an antibody to the protein of interest, along with classical electron microscopy techniques. The sample is prepared for normal electron microscopic examination, and then treated with an antibody to the protein of interest that is conjugated to an extremely electro-dense material, usually gold. This allows for the localization of both ultrastructural details as well as the protein of interest.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
[[site-directed mutagenesis/ja|部位特異的突然変異誘発]]として知られるもうひとつの遺伝子工学的応用によって、研究者はタンパク質の配列を変えることができ、それによってその構造、細胞局在性、制御に対する感受性を変えることができる。この技術によって、改変されたtRNAを用いて非天然アミノ酸をタンパク質に組み込むことも可能になり、新しい性質を持つタンパク質を合理的に[[protein design/ja|デザイン]]できるようになるかもしれない。
Through another genetic engineering application known as [[site-directed mutagenesis]], researchers can alter the protein sequence and hence its structure, cellular localization, and susceptibility to regulation. This technique even allows the incorporation of unnatural amino acids into proteins, using modified tRNAs, and may allow the rational [[protein design|design]] of new proteins with novel properties.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
===プロテオミクス===
===Proteomics===
{{Main/ja|Proteomics/ja}}
{{Main|Proteomics}}
このような大規模なデータセットの研究は、[[proteome/ja|プロテオミクス]]の分野を定義しており、[[genomics/ja|ゲノミクス]]の関連分野との類似から名付けられた。[[proteomics/ja|プロテオミクス]]の主要な実験技術には、多くのタンパク質の分離を可能にする[[Two-dimensional gel electrophoresis/ja|2D電気泳動]]、タンパク質の迅速なハイスループット同定とペプチドの配列決定(多くの場合[[in-gel digestion/ja|ゲル内消化]]の後)を可能にする[[mass spectrometry/ja|質量分析]]などがある、 [[protein microarray/ja|タンパク質マイクロアレイ]]は、細胞内に存在する様々なタンパク質の相対レベルの検出を可能にし、[[two-hybrid screening/ja|ツーハイブリッドスクリーニング]]は、[[protein–protein interaction/ja|タンパク質-タンパク質相互作用]]の系統的な探索を可能にする。生物学的に可能なこのような相互作用の総体は[[interactome/ja|インタラクトーム]]として知られている。あらゆる可能性のあるフォールドを代表するタンパク質の構造を決定する体系的な試みは、[[structural genomics/ja|構造ゲノム学]]として知られている。
The total complement of proteins present at a time in a cell or cell type is known as its [[proteome]], and the study of such large-scale data sets defines the field of [[proteomics]], named by analogy to the related field of [[genomics]]. Key experimental techniques in proteomics include [[Two-dimensional gel electrophoresis|2D electrophoresis]], which allows the separation of many proteins, [[mass spectrometry]], which allows rapid high-throughput identification of proteins and sequencing of peptides (most often after [[in-gel digestion]]), [[protein microarray]]s, which allow the detection of the relative levels of the various proteins present in a cell, and [[two-hybrid screening]], which allows the systematic exploration of [[protein–protein interaction]]s. The total complement of biologically possible such interactions is known as the [[interactome]]. A systematic attempt to determine the structures of proteins representing every possible fold is known as [[structural genomics]].
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
===構造決定===
===Structure determination===
タンパク質の3次構造、あるいは複合体の4次構造を発見することは、タンパク質がどのようにその機能を発揮し、どのようにその機能に影響を与えることができるのか、つまり[[Drug design/ja#Structure-based|薬物設計]]において重要な手がかりを提供することができる。タンパク質は[[:en:Diffraction-limited system|回折限界系]][[:en:Optical microscope|光学顕微鏡]]で見るには小さすぎるため、その構造を決定するには他の方法を採用しなければならない。一般的な実験手法としては、[[X-ray crystallography/ja|X線結晶構造解析]][[protein NMR/ja|NMR分光法]]があり、どちらも[[atom/ja|原子]]レベルの分解能で構造情報を得ることができる。しかし、NMR実験は、原子のペア間の距離のサブセットを推定するための情報を提供することができ、[[:en:distance geometry|距離幾何学]]問題を解くことによって、タンパク質の最終的なコンフォーメーションが決定される。[[Dual polarisation interferometry/ja|二重偏光干渉法]]は、全体的な[[protein conformation/ja|タンパク質のコンフォメーション]]や、相互作用や他の刺激による[[conformational change/ja|コンフォメーション変化]]を測定するための定量的分析法である。[[Circular dichroism/ja|円偏光二色性]]は、タンパク質の内部βシート/αヘリカル組成を決定するためのもう一つの実験技術である。[[:en:Cryoelectron microscopy|クライオ電子顕微鏡]]は、集合した[[ウイルス]]を含む非常に大きなタンパク質複合体に関する低分解能の構造情報を得るために用いられる;[[:en:electron crystallography|電子線結晶学]]と呼ばれる手法でも、特に膜タンパク質の二次元結晶の場合、高分解能の情報が得られる場合がある。解かれた構造は通常、[[Protein Data Bank/ja|Protein Data Bank]] (PDB)に寄託される。これは自由に利用できるリソースで、何千ものタンパク質に関する構造データを、タンパク質の各原子の[[:en:Cartesian coordinates|デカルト座標]]の形で得ることができる。
Discovering the tertiary structure of a protein, or the quaternary structure of its complexes, can provide important clues about how the protein performs its function and how it can be affected, i.e. in [[Drug design#Structure-based|drug design]]. As proteins are [[Diffraction-limited system|too small to be seen]] under a [[Optical microscope|light microscope]], other methods have to be employed to determine their structure. Common experimental methods include [[X-ray crystallography]] and [[protein NMR|NMR spectroscopy]], both of which can produce structural information at [[atom]]ic resolution. However, NMR experiments are able to provide information from which a subset of distances between pairs of atoms can be estimated, and the final possible conformations for a protein are determined by solving a [[distance geometry]] problem. [[Dual polarisation interferometry]] is a quantitative analytical method for measuring the overall [[protein conformation]] and [[conformational change]]s due to interactions or other stimulus. [[Circular dichroism]] is another laboratory technique for determining internal β-sheet / α-helical composition of proteins. [[Cryoelectron microscopy]] is used to produce lower-resolution structural information about very large protein complexes, including assembled [[virus]]es; a variant known as [[electron crystallography]] can also produce high-resolution information in some cases, especially for two-dimensional crystals of membrane proteins. Solved structures are usually deposited in the [[Protein Data Bank]] (PDB), a freely available resource from which structural data about thousands of proteins can be obtained in the form of [[Cartesian coordinates]] for each atom in the protein.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
遺伝子配列はタンパク質構造よりも多く知られている。さらに、解明された構造セットは、主要な構造決定手法の一つである[[X-ray crystallography/ja|X線結晶構造解析]]で必要とされる条件を容易に適用できるタンパク質に偏っている。特に、球状タンパク質は、X線結晶構造解析に向けた[[crystallize/ja|結晶化]]が比較的容易である。一方、膜タンパク質や大きなタンパク質複合体は結晶化が困難であり、PDBにはあまり登録されていない。[[Structural genomics/ja|構造ゲノミクス]]の取り組みでは、主要なフォールドクラスの代表的な構造を系統的に解くことで、これらの欠点を改善しようとしている。[[Protein structure prediction/ja|タンパク質構造予測]]法は、実験的に構造が決定されていないタンパク質に対して、もっともらしい構造を生成する手段を提供しようとするものである。
Many more gene sequences are known than protein structures. Further, the set of solved structures is biased toward proteins that can be easily subjected to the conditions required in [[X-ray crystallography]], one of the major structure determination methods. In particular, globular proteins are comparatively easy to [[crystallize]] in preparation for X-ray crystallography. Membrane proteins and large protein complexes, by contrast, are difficult to crystallize and are underrepresented in the PDB. [[Structural genomics]] initiatives have attempted to remedy these deficiencies by systematically solving representative structures of major fold classes. [[Protein structure prediction]] methods attempt to provide a means of generating a plausible structure for proteins whose structures have not been experimentally determined.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
===構造予測===
===Structure prediction===
[[File:225 Peptide Bond-01.jpg|thumb|right|upright=1.6|構成アミノ酸を分析することで、タンパク質の二次構造、三次構造、四次構造を予測することができる。
[[File:225 Peptide Bond-01.jpg|thumb|right|upright=1.6|Constituent amino-acids can be analyzed to predict secondary, tertiary and quaternary protein structure, in this case hemoglobin containing [[heme]] units]]
この場合、ヘモグロビンは[[heme/ja|ヘム]]ユニットを含む]]
{{Main|Protein structure prediction|List of protein structure prediction software}}
{{Main/ja|Protein structure prediction/ja|List of protein structure prediction software/ja}}
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
構造ゲノミクスの分野を補完するものとして、''タンパク質構造予測''は、タンパク質の効率的な[[:en:mathematical model|数学モデル]]を開発し、実験室での観察によって構造を検出する代わりに、理論的に分子形成を計算で予測する。相[[:en:homology modeling|同性モデリング]]として知られる構造予測の最も成功したタイプは、モデル化されるタンパク質と配列が類似している「鋳型」構造の存在に依存している。構造ゲノミクスの目標は、残された構造のほとんどをモデル化するために、解決された構造に十分な表現を提供することである。遠縁のテンプレート構造しか利用できない場合、正確なモデルを作成することは依然として困難であるが、[[sequence alignment/ja|配列アライメント]]がこのプロセスのボトルネックであることが示唆されている。多くの構造予測手法は、[[protein engineering/ja|タンパク質工学]]という新たな分野への情報提供に役立っており、そこではすでに新規なタンパク質フォールドが設計されている。また、タンパク質(真核生物では〜33%)には、構造化されていないが生物学的に機能する大きな部分があり、[[intrinsically disordered proteins/ja|本質的に無秩序なタンパク質]]として分類される。したがって、タンパク質の無秩序を予測・解析することは、タンパク質構造解析の重要な一部である。
Complementary to the field of structural genomics, ''protein structure prediction'' develops efficient [[mathematical model]]s of proteins to computationally predict the molecular formations in theory, instead of detecting structures with laboratory observation. The most successful type of structure prediction, known as [[homology modeling]], relies on the existence of a "template" structure with sequence similarity to the protein being modeled; structural genomics' goal is to provide sufficient representation in solved structures to model most of those that remain. Although producing accurate models remains a challenge when only distantly related template structures are available, it has been suggested that [[sequence alignment]] is the bottleneck in this process, as quite accurate models can be produced if a "perfect" sequence alignment is known. Many structure prediction methods have served to inform the emerging field of [[protein engineering]], in which novel protein folds have already been designed. Also proteins (in eukaryotes ~33%) contain large unstructured but biologically functional segments and can be classified as [[intrinsically disordered proteins]]. Predicting and analysing protein disorder is, therefore, an important part of protein structure characterisation.
</div>


===バイオインフォマティクス===
===バイオインフォマティクス===
Line 225: Line 206:
タンパク質の構造、機能、進化を解析するために、膨大な数の計算手法が開発されてきた。このようなツールの開発は、[[human genome/ja|ヒトゲノム]]を含む様々な生物について利用可能な大量のゲノムおよびプロテオミクスデータによって推進されてきた。すべてのタンパク質を実験的に研究することは不可能であるため、実験室での実験に供されるのはごく一部であり、計算ツールを用いて類似タンパク質を推定することが行われている。このような[[Sequence homology/ja|相同タンパク質]]は、[[sequence alignment/ja|配列アライメント]]によって遠縁の生物で効率的に同定することができる。ゲノムや遺伝子の配列は、ある特定の性質について様々なツールで検索することができる。[[Sequence profiling tool/ja|配列プロファイリングツール]]は[[restriction enzyme/ja|制限酵素]]部位や[[nucleotide/ja|ヌクレオチド]]配列中の[[open reading frame/ja|オープンリーディングフレーム]]を見つけ、[[secondary structure/ja|二次構造]]を予測することができる。[[Phylogenetic tree/ja|系統樹]]を構築し、[[:en:ClustalW|ClustalW]]のような特別なソフトウェアを使って、現代の生物の祖先とそれらが発現する遺伝子に関する[[evolution/ja|進化]]仮説を立てることができる。遺伝子やタンパク質の解析には、今や[[bioinformatics/ja|バイオインフォマティクス]]の分野が欠かせない。
タンパク質の構造、機能、進化を解析するために、膨大な数の計算手法が開発されてきた。このようなツールの開発は、[[human genome/ja|ヒトゲノム]]を含む様々な生物について利用可能な大量のゲノムおよびプロテオミクスデータによって推進されてきた。すべてのタンパク質を実験的に研究することは不可能であるため、実験室での実験に供されるのはごく一部であり、計算ツールを用いて類似タンパク質を推定することが行われている。このような[[Sequence homology/ja|相同タンパク質]]は、[[sequence alignment/ja|配列アライメント]]によって遠縁の生物で効率的に同定することができる。ゲノムや遺伝子の配列は、ある特定の性質について様々なツールで検索することができる。[[Sequence profiling tool/ja|配列プロファイリングツール]]は[[restriction enzyme/ja|制限酵素]]部位や[[nucleotide/ja|ヌクレオチド]]配列中の[[open reading frame/ja|オープンリーディングフレーム]]を見つけ、[[secondary structure/ja|二次構造]]を予測することができる。[[Phylogenetic tree/ja|系統樹]]を構築し、[[:en:ClustalW|ClustalW]]のような特別なソフトウェアを使って、現代の生物の祖先とそれらが発現する遺伝子に関する[[evolution/ja|進化]]仮説を立てることができる。遺伝子やタンパク質の解析には、今や[[bioinformatics/ja|バイオインフォマティクス]]の分野が欠かせない。


<span id="In_silico_simulation_of_dynamical_processes"></span>
===動的過程のインシリコシミュレーション===
===動的過程のインシリコシミュレーション===


Line 233: Line 215:
生物学的なスケールのシステムの両方の量子力学的および古典力学的なシミュレーションは非常に計算コストがかかるため、[[:en:Folding@home|Folding@home]]プロジェクトのような[[:en:distributed computing|分散コンピューティング]]イニシアティブが、[[:en:Graphics processing unit|GPU]]の並列処理や[[:en:Monte Carlo method|モンテカルロ]]技術の進展を活用して[[:en:molecular modeling|分子モデリング]]を容易にしている。
生物学的なスケールのシステムの両方の量子力学的および古典力学的なシミュレーションは非常に計算コストがかかるため、[[:en:Folding@home|Folding@home]]プロジェクトのような[[:en:distributed computing|分散コンピューティング]]イニシアティブが、[[:en:Graphics processing unit|GPU]]の並列処理や[[:en:Monte Carlo method|モンテカルロ]]技術の進展を活用して[[:en:molecular modeling|分子モデリング]]を容易にしている。


<span id="Chemical_analysis"></span>
===化学分析===
===化学分析===