佐賀大学農学部 応用生物科学科 動物資源開発学分野 和田研究室
佐賀大学農学部応用生物科学科 生物情報処理演習 講義テキスト 科目ホームページ
データベース入門
データベースとは
コンピュータ上にいろいろなデータを検索しやすい形で格納したもの。
通常はデータベース管理システム(DBMS)というソフトを通して格納したり
検索したりする。
データベースの種類
- リーレーショナルデータベース
- 表の形式でデータを格納する
- 理論的にはすべてのデータ形式は表形式で格納することができる
- データベースの構成を変更する場合でも、ユーザープログラムを変更しないですむことが多い
- 複雑な検索をする場合には計算時間がかかる
- オブジェクト指向データベース
- Java言語のようなオブジェクト思考言語のデータ形式をそのままデータベースとして格納する
- 複雑な検索でも短時間でこなせる
- オブジェクト思考言語との相性が良い
- データ形式を変更するにはユーザー側のプログラムまで変更しなければならない
どのようなデータベースがあるのか
共同で利用するデータは全てデータベース化するのが望ましい
- 文献データベース
- 図書所在情報データベース
- DNA塩基配列データベース
- ゲノムデータベース
- 在庫データベース
- 顧客データベース
検索方法
検索式の書き方は、DBMSや応用ソフトによってさまざまだが、基本的な
考え方は同じ。
- AND
- A and B でAとBが同時に含まれているものを検索する
- OR
- A or B でAもしくはBが含まれているものを両方とも検索する
- 前方一致
- サイクリン* でサイクリンAやサククリンBなどのサイクリンで始まる単語を検索する
- 後方一致
- *データベース でゲノムデータベースや在庫データベースなど最後がデータベースで終る単語を検索する
World Wide Webを用いたデータベース検索
NCBI ENtrez
分子生物学関係の文献やDNA塩基配列、マッピングデータなど広範な情報をデータベース化して、インターネット上で無料で検索できるようにしている。
ここでは文献データベースであるPubMedを検索してみよう。
- Netscapeなどでhttp://www.ncbi.nlm.nih.gov/Entrez/にアクセスする
- フォームの中にpigとタイプしてリターンキーを押す
- 検索件数が多いので絞り込みをする。pigの後にブランクとWadaをタイプしてリターンキーを押す(and検索)
- さらにWadaのあとにブランクとdatabaseをタイプしてリターンキーを押す
- 最終的に3件になったので、たとえば2番目の文献の著者名のところをクリックしてアブストラクトを読んでみましょう
次にDNA塩基配列データベースを検索しましょう。
- Netscapeなどでhttp://www.ncbi.nlm.nih.gov/Entrez/にアクセスする
- PubMedとなっているセレクトボタンをNucleotideにかえて、フォームの中にpig cyclinとタイプしてリターンキーを押す
- 14件検索されたので14番目のcyclin B mRNAをクリックして見てみましょう
最終更新年月日 2008年10月1日
佐賀大学農学部 応用生物科学科 動物資源開発学分野 和田研究室
ywada@cc.saga-u.ac.jp