吉野 輝雄
1. 各レコードのフィールド
各レコードに含まれるフィールドを、レイアウトとともに 図1に示す。
2. データ入力
いずれかのレイアウト画面にしてブラウズ・モードで順次データを入力する。
単糖であれば1個のレコードに収められるが、オリゴ糖鎖の場合には、各糖鎖にレコードを
分割して入力する。例えば、Globoside糖脂質(GalNAc-Gal-Gal-Glc-Cer)のように 四糖から成る糖鎖の場合には、まず非還元末端側の糖残基(GalNAc:糖鎖の順 4/4: 4個から成る糖鎖で還元末端から4番目の糖)から順次入力する。「糖残基」フィールド にはGalNAc(IV)のように糖の名前と( )内に順番をローマ数字で示す。
代表的な糖残基は、ポップアップ・メニューから選択するだけで簡単に入力できるように
なっている。「置換基」にも同様なポップアップ・メニューが用意されている。構造式は
他のデータとは違ってグラフィックデータなので、別途に化学構造式作画ソフト
[3]で作成
した構造式をピクチャー・フイールドにペーストする。構造式がどんなサイズでも枠に
ちょうど収まるようになっている。なお、構造式の周辺に表示されるNMRデータは、
予め入力されていれば二重に入力する必要がない。
オリゴ糖の場合には、サンプル名、文献や測定条件などの共通データを何度も入力する
ことになるが、第1のレコードをコピー&ペーストすると入力の手間が省ける。
3. データ出力
a. 画面表示
画面への出力モード(レイアウト)を5種類作成した。
● データ入力用画面
● 完全カード型データ表示(図2)
画面全体にすべてのフィールドおよび統計処理データを表示する。
● 縮小カード型データ表示(図3)
1画面に3個のレコードを3段で表示する(プレビューモードとする)。
● 構造式とNMRデータの組み合わせ表示
構造式とNMRデータを組み合わせ視覚的にデータ表示する。1画面に6個のレコードを同時表 示する。
図3 縮小カード型データ表示(サンプル:Peracetyl globoside)
オリゴ糖鎖の場合には、末端糖残基側から連続的に表示する。
● 一覧表データ表示(表1)
各レコードを一行ごとに表示するので、複数のNMRデータを比較する場合に有用である。
一覧表として表示されたデータをプレビューモードに切り替えると、統計処理の結果も
表示される。
b. 印 刷
印刷の結果は、レイアウト画面のプレビユー通りになる。なお、上記の5種類のレイアウトは、第1の完全カード型データ表示以外は、A4用紙に横書き印刷されるように設計されている。
1. ソフトの立ち上げ
データベースファイルをダブルクリックするとFMが立ち上がり、「モード選択画面」
(図4)が現われる。
2. データの表示
「モード選択画面」から希望の表示モードをクリックすると直ちにデータを表示する。
また、表示モードを切り替えるには、画面左上のレイアウト選択部分をクリックする。
なお、FMでは、レイアウトの変更・追加・削除が容易なだけでなく、文字をカラー表示に
したり、罫線や枠を付けて見やすい表示画面に設計変更することが容易にできる。
3. 検索、ソート
フィールド枠の中に検索項目を入力して「検索」を実行すると、該当項目(2個以上の
指定も可能)を含む、または含まないレコードを該当項目数とともに表示する。
「再検索」によってさらにしぼり込むこともできる。
また、FMのもつ次のような検索機能を利用することができる。
「順次検索」:テキストフィールドの部分一致検索をする。例えば、=="", ==*"", ==*""*,
==? ""などのワイルドカードが使える。""の中に検索する文字列を入れる(*は任意の
複数文字列を、?は1文字を意味する。)
「高速検索」:記号「>」, 「<」, 「≧」, 「≦」, 「…」を使って範囲を指定した
検索ができる。
ソートを利用するとさらにデータベースとしての機能性が高まる。任意のフィールド項目
(複数項目の指定も可能)についてソートすることができるが、よく用いる項目は
「スクリプト」(一種のマクロ機能)を利用すると便利である。本データベースでは、
「糖残基」と「アノマー」をソートの既定項目としてある。これによって、データ入力順とは
無関係に糖残基ごとに分類されたデータが表示されるので、構造の似た化合物のデータを
比較する場合に便利である。
さらに、検索とソートを同時に実行すると、かなり整理されたデータが表示される。
4. 統計処理
選択されたNMRデータについて、化学シフト値の平均値、最大最小値、標準偏差値が
自動的に計算され、その結果が表示される(表1)。
この情報は、構造未知の糖質スペクトルの
帰属が妥当であるかを検証する場合に役立つ。例えば、図4の場合には、
糖残基としてGal, 2位の
置換基をAcとして検索・ソートした結果であるが、ここから2位の環プロトン(H2)の化学シフト
値は5.14ppm前後と予測される。さらに多くの類縁化合物のデータを集計すれば、糖質の
環プロトンの化学シフト値を推測する経験則が導き出せるようになる。
5. データの書き出し・取り込み
入力されているデータは、任意のフィールドを選んで書き出す(EXPORT)することができる。
また、検索あるいはソートしたデータだけを書き出すことができる。書き出されたファイルは、
別のアプリケーションソフト(ワープロ、表計算、グラフ作成ソフト)から読み込んで
利用することができる。
逆に、他のアプリケーションソフトで作成したデータを取り込む(IMPORT)することもできる。
なお、以上のようにデータ交換できるファイルのタイプは以下の通りである;
●タブ区切りのテキスト(フィールドは「tab」で、レコードは「return」区切り)
●コンマ区切りのテキスト:" "で囲まれたテキスト(フィールドは「,」で、レコードは
「return」区切り)
●SYLKファイル(EXCELなどの表計算ソフト用ファイル)
●DBFファイル(dBASE用ファイル)
●WKSファイル(Lotus1-2-3用ファイル)
●BASICファイル(フィールドは「,」で、レコードは「return」区切り)
6. MS-DOSソフトとのデータ交換
a. MS-DOS阪データベースとの交換
上記4のようにして書き出されたファイルは、さらにDOSファイルにも変換可能なので
[5]、
MS-DOS上のアプリケーションソフトでも利用できる。例えば、TheCARD(アスキー社)のような
カード型データベースへの移植が可能である。但し、画像(構造式)データの移植は通信
ソフトを介すれば可能であるが操作が煩雑なので、構造式を含まないデータベースとするか、
別途MS-DOS上で構造式を作画してから取り込む方がよいだろう。
b. 糖質^1H-NMR スペクトル表示ソフト(HNMR.BAS)とのデータ交換
著者は、糖質の^1H-NMRデータを保存管理し、呼び出したデータを線スペクトルとして近似的に
表示するプログラム(HNMR.BAS, MS-DOS BASIC版)を作成している
[3b,6].
その表示例を図5に示す。
このソフトは、FMで作成した本体とNMRデータについては共通の
フィールド構造をもっている。従って、BASICファイルを用いた本体とのデータ交換が可能で
ある。例えば、本体から転送されたデータをHNMR.BASで読み込むと、図5の
ような線スペクトルがすぐに得られる。
著者は、現在までに約500個のデータを入力し、糖質の有機合成化学研究に
活用している。
特に、合成の過程では、糖質水酸基がフリーのものよりもアセチル基などで保護された
化合物のスペクトル解析や、オリゴ糖鎖の場合には、糖鎖間のグリコシド結合の位置や
アノマー配置をスペクトルから決定する場面に多く出会う。その際、本データベースが、
参照データを提供する有用な情報源となる。また、集積されたデータから化学シフト値に
ついての暫定的な経験則が導き出せる[7]。
次に、使用上の問題点をあげる。データ数が数百個を越えると検索、ソート、統計処理などの
処理速度に時間がかかる。この問題は、今後CPUの発展によって改善されると思うが、
操作性、視覚効果の方を優先した本データベースのような場合には、処理速度がある程度
犠牲になるのはやむを得ないであろう。
フラノース環構造の糖質や九炭糖であるノイラミン酸の場合には、本データベースのNMR
データの定型表示フォーマットに合わないという問題が生じる。この解決法が2つ考えられる。
1つは、フォーマットに合わないデータを「その他の置換基データ」フィールドに入力して
おき、利用者が判読する方法、第2は、データ表示と構造式部分のレイアウトだけを変えた
フラノースあるいはノイラミン酸専用のFMファイルを別途作成し、FMの「ルックアップ」
機能を利用して本データベースからデータを取り込む方法である。いずれを選ぶかは、
利用目的によって対応すればよい。
なお、糖質^{13}C-NMRデータベースも本データベースとほとんど同じ考え方で作成が可能であり、
目下データを集積中である。