Hatena::Groupbioconductor

Bioconductorノート このページをアンテナに追加 RSSフィード

 | 

2007-06-18Bioconductorチュートリアル @ NIG

Bioconductor の紹介  Bioconductor の紹介 - Bioconductorノート を含むブックマーク はてなブックマーク -  Bioconductor の紹介 - Bioconductorノート  Bioconductor の紹介 - Bioconductorノート のブックマークコメント

目次

  • Bioconductor の紹介
    • Bioconductor のゴール
    • Bioconductor の特徴
    • スクリーンショット
    • Bioconductor Task Views: BiocViews
    • Bioconductor にできること
    • Bioconductor にできないこと
    • もっと知りたいとき
      • R のヘルプ機能
      • Bioconductor ヴィネット
      • R のグラフサンプル集
      • R と Bioconductor のパッケージソースコード検索
      • 書籍やウェブサイト
      • サーチエンジンでRの話題を検索するコツ
    • Bioconductor 以外のバイオ系Rパッケージ集
      • CRAN Task Views
      • 遺伝学関連
      • 生態学関連

Bioconductor は、統計グラフィックスフリーソフトウェア環境Rのためのゲノムスケールデータの解析パッケージ集です。ゲノムスケールデータとは、マイクロアレイSAGEなどによる大規模遺伝子発現プロファイル、SNPデータ質量分析データゲノム配列遺伝子アノテーションタンパク質相互作用データなどが含まれます。

screenshot screenshot

Bioconductor は R の共同開発者である Prof. Robert Gentlman (Fred Hunchinson Cancer Research Center) を中心にして 2001 年から開発されています。

screenshot screenshot


Bioconductor のゴール

Bioconductorプロジェクトのゴールには次のようなものがあります。

  1. ゲノムスケールデータの解析のために、さまざまな統計手法や可視化手法を使用する手段を提供する
  2. 実験データの解析のために、生物学メタデータPubMedからのデータなど)の統合を容易にする
  3. 拡張可能性、大量データへの対応性そして相互運用性のあるソフトウェアの迅速な開発を可能にする
  4. 品質ドキュメントと再現性のある研究を振興する
  5. ゲノムスケールデータの解析のための計算機的手法・統計手法のトレーニングを提供する

Bioconductor の特徴

Bioconductorプロジェクトの特徴には次のようなものがあります。

  1. R を利用している
  2. 実験の再現に十分なドキュメントを提供している
  3. 統計手法と可視化手法
  4. アノテーションメタデータ
  5. ショートコース
  6. オープンソース
  7. 開かれた開発

スクリーンショット

Bioconductor パッケージスクリーンショットをいくつか紹介します。

screenshot

image(affy) 関数
Affymetrixプローブレベルインテンシティの図示。(AffyBatchクラスのメソッド)

http://bioconductor.org/whatisit/screenshots/affy-image.jpg


mva.pairs(affy) 関数
三つのチップのスキャッターMAプロットMAプロットのM軸は差の対数値、A軸は和の対数値となる。

http://bioconductor.org/whatisit/screenshots/affy-maplot.jpg


ReadAffy(affy) 関数
Affymetrix CDF、CELファイル入力ウイジット

http://bioconductor.org/whatisit/screenshots/affy-widget.jpg


matbox.start(edd) 関数
直線化した行列の箱ヒゲ

http://bioconductor.org/whatisit/screenshots/edd-boxplot.jpg


geneplotter
二群の平均発現レベルを比較する

http://bioconductor.org/whatisit/screenshots/cColor.jpg


alongChrom(geneplotter) 関数
サンプル x 遺伝子発現行列染色体に沿ったカラーイメージ。それぞれの鎖は分離してある。

http://bioconductor.org/whatisit/screenshots/chrom-image.jpg


alongChromo(geneplotter) 関数
発現測定値の染色体に沿った累積図。

http://bioconductor.org/whatisit/screenshots/chrom-plot.jpg


plotChr(geneplotter) 関数
5'から3'へのセンス/アンチセンスの平滑曲線の図示。(ここではヒト21番染色体を使用している)

http://bioconductor.org/whatisit/screenshots/plotChr.png


maImage(marrayPlots) 関数
Cy3 バックグラウンド・インテンシティの可視化

http://bioconductor.org/whatisit/screenshots/marray-image.jpg


maBoxplot(marrayPlots) 関数
プリントチップグループにおける log_2(R/G) ログ比の箱ヒゲ図。

http://bioconductor.org/whatisit/screenshots/marray-boxplot.jpg


ll.htmlpage(annotate) 関数
LocusLink へのリンク付きの遺伝子リスト HTML レポートページ。

http://www.bioconductor.org/whatisit/Screenshots/genelist.jpg


pm.getabst(annotate) 関数
R で PubMed 検索をした結果アブストラクトを表示している。

http://bioconductor.org/whatisit/screenshots/pm.jpg


widget.marrayRaw(marrayInput) 関数
cDNA 画像解析ファイル(例:GenePix、Spot)のデータ入力用のウイジェット

http://bioconductor.org/whatisit/screenshots/marray-widget.jpg


hdiffplot(hexbin) 関数
二つの六角形ビンの間の個別の細胞プロットしたもの。

http://bioconductor.org/whatisit/screenshots/hexbinDiff.jpg


graph and Rgraphviz
TAPタンパク質複合体データスポークモデルグラフ。graphパッケージで作成し、描画にはRgraphvizパッケージを用いた。

http://bioconductor.org/whatisit/screenshots/spoke.jpg


graph and Rgraphviz
相互作用タンパク質ペアのグラフ細胞周期の発現プロファイルクラスタメンバーにそって色づけされている。graphパッケージで作成し、描画にはRgraphvizパッケージを用いた。

http://bioconductor.org/whatisit/screenshots/litGnc.jpg


graph and Rgraphviz
類似発現プロファイルをもつ遺伝子クラスタリングのための完全結合サブグラフ。graphパッケージで作成し、描画にはRgraphvizパッケージを用いた。

http://bioconductor.org/whatisit/screenshots/clustGallc.jpg


graph and Rgraphviz
インテグリンの介在した細胞接着パスウェイのグラフ表現。ノードには対応する遺伝子セットの発現レベルパイチャートで付加してある。

http://bioconductor.org/whatisit/screenshots/Tcell.png


vExplorer(tkWidgets) 関数
インタラクティブヴィネットブラウザ

http://bioconductor.org/whatisit/screenshots/vExplorer.jpg


Bioconductor Task Views: BiocViews

Bioconductor パッケージを関連する作業分野ごとに階層的に分類したものです。パッケージを探すときの整理棚として利用できます。

screenshot screenshot screenshot screenshot

Bioconductor にできること

  1. Affymetrix GeneChip のデータを簡単に扱えます
  2. KEGGデータを簡単に扱えます
  3. PubMedデータを扱えます
  4. GenBankデータを扱えます
  5. 典型的な解析は非常に簡単にできる
  6. よく使われるデータパッケージ化されているので簡単に利用できる。
  7. アノテーションデータネット越しに取得できます。

Bioconductor にできないこと

  1. かんたんに扱えない遺伝子発現データ形式があります
  2. マウスで操作してグラフ作成できない
  3. ワンクリックデータ解析
  4. 典型的でない解析は簡単にできない



もっと知りたいとき

このチュートリアルが終わったあとに参照するべき機能、書籍ウェブサイトを紹介します。

  1. R のヘルプ機能
  2. Bioconductor ヴィネット
  3. R のグラフサンプル集
  4. R と Bioconductorパッケージソースコード検索
  5. 書籍ウェブサイト
  6. サーチエンジンで R の話題を検索するときのコツ

R のヘルプ機能

R のヘルプ機能を利用してメソッドの説明を引き出したり、パッケージの説明を引き出したり、キーワードでメソッドを検索することができます。

▼たとえば、plot メソッドについて知りたいときは、Rコンソールでつぎのように入力します。

help(plot)

△実行結果。plot メソッドに関するヘルプドキュメントが表示されます。R のヘルプドキュメントはすべておなじ形式になっています。つぎに plot のヘルプドキュメントを示します。

tant

「Usage:」と「Examples:」をざっとみてメソッドの使い方の雰囲気をつかみ、必要に応じて「Arguments:」や「Details:」、「See Also:」を参考しするとよい。「Examples:」の内容はRコンソールにそのままコピーペーストすれば実行可能なものです。

パッケージの内容を調べるには、library メソッドを使用します。次の例では annaffy パッケージについて調べます。

library(help=annaffy)

△実行結果


		パッケージ 'annaffy' の情報

記述:

Package:       annaffy
Version:       1.6.2
Date:          2007-02-20
Title:         Annotation tools for Affymetrix
               biological metadata
Author:        Colin A. Smith
               <annaffy@colinsmith.org>
Maintainer:    Colin A. Smith
               <annaffy@colinsmith.org>
Depends:       R (>= 2.1.0), methods, Biobase, GO (>=
               1.6.0), KEGG
Suggests:      hgu95av2, multtest, tcltk
Description:   Functions for handling data from
               Bioconductor Affymetrix annotation
               data packages. Produces compact HTML
               and text reports including
               experimental data and URL links to
               many online databases. Allows
               searching biological metadata using
               various criteria.
License:       LGPL
SaveImage:     yes
biocViews:     OneChannel, Microarray, Annotation,
               GO, Pathways, ReportWriting
Packaged:      Tue Feb 20 13:28:36 2007; biocbuild
Built:         R 2.4.1; ; 2007-02-21 06:14:43; unix

索引:

aaf.handler             Handle feching annotation data columns
aafChromLoc             Constructor for aafChromLoc objects
aafChromLoc-class       Class aafChromLoc, a class for gene chromosome
                        locations
aafChromosome           Constructor for aafChromosome objects
aafChromosome-class     Class aafChromosome, a class for gene
                        chromosome assignments
aafCytoband             Constructor for aafCytoband objects
aafCytoband-class       Class aafCytoband, a class for cytoband data
aafDescription          Constructor for aafDescription objects
aafDescription-class    Class aafDescription, a class for gene
                        descriptions
aafExpr                 Sample exprSet used for demonstration purposes
aafFunction             Constructor for aafFunction objects
aafFunction-class       Class aafFunction, a class for gene product
                        functions
aafGO                   Constructor for aafGO objects
aafGO-class             Class aafGO, a class for gene ontology ids
aafGOItem-class         Class aafGOItem, a class for gene ontology id
                        elements
aafGenBank              Constructor for aafGenBank objects
aafGenBank-class        Class aafGenBank, a class for GenBank accession
                        numbers
aafIntensity-class      Class aafIntensity, a class for gene expression
                        values
aafList-class           Class aafList, a specialized subclass of list
aafLocusLink            Constructor for aafLocusLink objects
aafLocusLink-class      Class aafLocusLink, a class for LocusLink ids
aafPathway              Constructor for aafPathway objects
aafPathway-class        Class aafPathway, a class for KEGG pathway ids
aafPathwayItem-class    Class aafPathwayItem, a class for KEGG pathway
                        id elements
aafProbe                Constructor for aafProbe objects
aafProbe-class          Class aafProbe, a class for Probe ids
aafPubMed               Constructor for aafPubMed objects
aafPubMed-class         Class aafPubMed, a class for PubMed ids
aafSearchGO             Find probe ids corresponding to GO ids
aafSearchText           Search metadata annotation text
aafSigned-class         Class aafSigned, a class for signed numerical
                        data
aafSymbol               Constructor for aafSymbol objects
aafSymbol-class         Class aafSymbol, a class for gene symbols
aafTable                Constructor for aafTable objects
aafTable-class          Class aafTable, a tabular microarray data class
aafTableAnn             Constructor for aafTable objects from
                        annotation data
aafTableFrame           Constructor for aafTable objects from data
                        frames
aafTableInt             Constructor for aafTable objects from exprSets
aafUniGene              Constructor for aafUniGene objects
aafUniGene-class        Class aafUniGene, a class for UniGene cluster
                        ids
getCSS-methods          Methods for function getCSS
getHTML-methods         Methods for function getHTML
getTD-methods           Methods for function getTD
getText-methods         Methods for function getText
getURL-methods          Methods for function getURL
is.annpkg               Determine if packages contain annotation
selectorWidget          Dialog to select items from a list

これ以上の情報はディレクトリ
'/Library/Frameworks/R.framework/Resources/library/annaffy/doc'
にある以下の vignettes 中にあります:

annaffy: annaffy Primer (source, pdf)

索引:」以下がこのパッケージに含まれるメソッドの一覧になります。


キーワードからメソッドを検索する。

help.search("MA plot")

Bioconductor ヴィネット

Bioconductor では R のヘルプドキュメントをより高品質化をおしすすめ、背景知識を含めたレポート形式のドキュメント(通称:ヴィネット、vignette)を提供しています。

ヴィネットの表示。調べたいトピック(例:grid)の文章をひらきます。

vignette("grid")

△実行結果PDF書類が表示されます。

f:id:nakao_mitsuteru:20070617155541p:image

vignette でつかえるトピックは、annaffy パッケージの場合は library(help=annaffy) の最後に書いてあります。

▼ vignette であつかっているトピックリストはつぎのようにして表示します。

vignette()

R のグラフサンプル集

no title では R のパッケージの Example にあるグラフとそのコードがすべて閲覧可能になっています。

screenshot screenshot


また、Statistics with R3.From Data to Graphics4.Customizing graphicsコードと図が豊富にあり参考になります。

screenshot screenshot screenshot


R と Bioconductorパッケージソースコード検索

すこしプログラミングに慣れてくると、ほかの人の書いたプログラムを読んで参考にすることができます。また、実際に動作する他人の書いたプログラムプログラミングの自習に最適な教材です。

バイオインフォマティクスで利用されるソフトウェアソースコード検索サーバ産業技術総合研究所CBRCサービスされています。

screenshot screenshot


Googleソースコード検索では、言語指定(lang:R)すると効果的な検索がおこなえます。

screenshot screenshot


中間さんによる R や Bioconductorソースコード検索サービス

screenshot screenshot screenshot


書籍ウェブサイト

7月出版予定の R と Bioconductor を用いたバイオインフォマティクスシュプリンガージャパン)はつぎの本の翻訳です。

プログラミング言語 R の基礎についてはつぎの本が良いです。

Rの基礎とプログラミング技法

Rの基礎とプログラミング技法

統計解析の基礎についてはつぎの本が良いです。

Rによる統計解析の基礎 (Computer in Education and Research)

Rによる統計解析の基礎 (Computer in Education and Research)

分子進化の解析にはつぎの本を読むと良いでしょう。

Analysis of Phylogenetics And Evolution With R (Use R)

Analysis of Phylogenetics And Evolution With R (Use R)

RjpWiki に幅広い話題がかかれています。ウェブで R の話題を調べるときのスタート地点にすると良いでしょう。

screenshot


サーチエンジンでRの話題を検索するコツ

R は文字列として短すぎるので、R だけでは Google などの検索エンジンでは意味のある検索結果は期待できません。

仮説:R を話題にしているページは R のオフィシャルウェブサイトリンクしている
これを期待するならば、link:www.r-project.org を検索に加えると良いでしょう。

Bioconductor 以外のバイオ系Rパッケージ

Bioconductor 以外にも生物学(遺伝学、進化系統解析など)に有用な R パッケージがあります。


CRAN Task Views

screenshot

膨大な R パッケージが代表的な研究テーマごとに整理されています。


遺伝学関連

screenshot


生態学関連

screenshot



もくじにもどる

unjgoigpbcunjgoigpbc2013/07/27 00:33mxuftcjpdpoevdups, <a href="http://www.qfdljtypod.com/">lmcioritxd</a> , [url=http://www.gzzikngyus.com/]bdfczpsmri[/url], http://www.zftisrmfht.com/ lmcioritxd

nwnmrjzdklnwnmrjzdkl2013/07/30 09:34chgdqcjpdpoevdups, <a href="http://www.dtpjtpmcwz.com/">nwnjygkzzb</a> , [url=http://www.kdfgrbwcvr.com/]bypzwjsiji[/url], http://www.igffaiytve.com/ nwnjygkzzb

cdmzgyfdmrcdmzgyfdmr2013/08/27 20:48jjpbfcjpdpoevdups, <a href="http://www.sykbutykif.com/">ukuuydefwr</a> , [url=http://www.uhpsolyxko.com/]fzsrybsnxm[/url], http://www.ltbqizswiw.com/ ukuuydefwr

rzneokixsarzneokixsa2013/12/19 06:07ojooxcjpdpoevdups, <a href="http://www.mbhcuaxduh.com/">kcoetjdwiz</a>

lfenndqlkxlfenndqlkx2013/12/21 07:18qqkzkcjpdpoevdups, http://www.ezysqwcddb.com/ ahraopcipd

rcnnhmqvoercnnhmqvoe2013/12/23 12:07bxpfacjpdpoevdups, <a href="http://www.szrshwiogp.com/">cxeugadcxs</a> , [url=http://www.zzekrrgrud.com/]dxqnzipezs[/url], http://www.dydxvalriy.com/ cxeugadcxs

gbzpsabhzdgbzpsabhzd2014/01/12 06:32svcyrcjpdpoevdups, <a href="http://www.fmvxfxjkfd.com/">tnaexwiklw</a> , [url=http://www.gtxtbpmhhq.com/]rvsokjanyr[/url], http://www.hymjvzsvzt.com/ tnaexwiklw

JasonCoofeJasonCoofe2017/01/25 04:28печать журналов http://wkrolik.com.ua/products/otkrytki

GuestAcirmGuestAcirm2017/09/06 10:27guest test post
<a href="http://googlee.te/">bbcode</a>
<a href="http://googlee.te/">html</a>
http://googlee.te/ simple

 |