Journal of Chemical Software, Vol.2, No.4, p.

『糖質研究者用・糖質 ^1H-NMRデ－タベース』

吉野輝雄

I.　はじめに

NMRデータベースを作成する場合に、何を目的とするかが第一の問題となる。広範囲の化合物を対象にすれば広く化学の研究教育に利用されることが期待されるが、データの集積方法をはじめコンピュータの容量、利用のしかたにいたる様々な問題を解決しなければならない。特に、^1H-NMRの場合には、^{13}C-NMR[1]と違ってスピンカップリングした分裂ピーク位置が必ずしも化学シフト値とは一致しないために解析後のデータを扱うか、スペクトルパターンを画像データとして扱うか等の複雑な問題がからんでくる。しかし、このような問題をふまえたNMRデータベースの研究および作成が行われ市販、頒布もされている[2]。
一方、個々の化学研究者の現場では、ある特定の化合物群を取り扱うことが多く、研究室で単離、合成した化合物や文献記載の関連化合物のスペクトルデータを何らかの形で集積し研究に利用している。ここに、ある特定の化合物を対象とした^1H-NMRデータベースの必要性が生じてくる。著者自身も糖質化学の研究分野におけるNMRデータベースの必要性を強く感じてきたが、利用可能なものは存在しない。そこで、研究活動を支援する実用的な糖質^1H-NMRパーソナルデータベース("H1-NMRGlycoDB"）を作成したのでここに報告する。

II.　操作環境

ハードウエア；: 　Macintoshコンピュータ（CPU86020以降の上位機種）、主メモリー：5MByte以上; 　ハードディスクの記憶容量：データのアクセス、保存のために大きいほどよい。; 　モニター：カラーの方がよい。表示色が変えられるためデータ識別が容易になる。
ソフトウエア；: 　ファイルメーカーpro（クラリス社）

III.　機能と特徴

1.　糖質^1H-NMRデータ（化学シフト値、スピン結合定数）を測定条件、文献とともにデータベースとして保存管理する。
2.　多くの糖質がピラノース環構造をとっているという特徴を生かし、NMRデータを定型表示するようにレイアウトされているので、データ間の比較が容易である。
3.　糖質構造式とNMRデータを組み合わせ視覚的データ表示法を考案した。
4.　パーソナルデータベースとして最適ソフトの一つであるファイルメーカーpro（以下、 FMと略す）を利用してデータベースを作成した。FMはすぐれた検索、ソート機能を持ち、かつ操作が簡単という特徴をもつ。
5.　FMのその他の特徴として、データの追加入力・削除、フィールドの追加、また表示レイアウトの変更・追加等が容易にできるので、利用者が目的に応じた改変ができる。
6.　別途に作成されたNMRデータを、本データベースに取り込んだり(EXPORT)、逆にテキストファイルとして書き出す(IMPORT)というFMの機能が利用できる。書き出されたデータは、ワープロや表計算ソフトへ簡単に転送して利用できる。
7.　検索されたデータ（化学シフト値）について、平均値、最大最小値、標準偏差値等の統計処理計算を自動的に行う。

IV.　データベースの構成とデータ入力／出力法

1. 各レコードのフィールド
　各レコードに含まれるフィールドを、レイアウトとともに図１に示す。

2. データ入力
　いずれかのレイアウト画面にしてブラウズ・モードで順次データを入力する。
単糖であれば１個のレコードに収められるが、オリゴ糖鎖の場合には、各糖鎖にレコードを分割して入力する。例えば、Globoside糖脂質(GalNAc-Gal-Gal-Glc-Cer)のように四糖から成る糖鎖の場合には、まず非還元末端側の糖残基（GalNAc：糖鎖の順 4/4: 4個から成る糖鎖で還元末端から4番目の糖）から順次入力する。「糖残基」フィールドにはGalNAc(IV)のように糖の名前と( )内に順番をローマ数字で示す。
　代表的な糖残基は、ポップアップ・メニューから選択するだけで簡単に入力できるようになっている。「置換基」にも同様なポップアップ・メニューが用意されている。構造式は他のデータとは違ってグラフィックデータなので、別途に化学構造式作画ソフト [3]で作成した構造式をピクチャー・フイールドにペーストする。構造式がどんなサイズでも枠にちょうど収まるようになっている。なお、構造式の周辺に表示されるNMRデータは、予め入力されていれば二重に入力する必要がない。
オリゴ糖の場合には、サンプル名、文献や測定条件などの共通データを何度も入力することになるが、第１のレコードをコピー&ペーストすると入力の手間が省ける。

図1　フィールド一覧

3. データ出力

a. 画面表示
　画面への出力モード（レイアウト）を５種類作成した。
● データ入力用画面
● 完全カード型データ表示（図2）
　画面全体にすべてのフィールドおよび統計処理データを表示する。
● 縮小カード型データ表示（図3）
１画面に３個のレコードを３段で表示する（プレビューモードとする）。
● 構造式とNMRデータの組み合わせ表示
構造式とNMRデータを組み合わせ視覚的にデータ表示する。１画面に6個のレコードを同時表示する。

図2　完全カード型データ表示

図3　縮小カード型データ表示（サンプル：Peracetyl globoside）オリゴ糖鎖の場合には、末端糖残基側から連続的に表示する。

● 一覧表データ表示（表1）
各レコードを一行ごとに表示するので、複数のNMRデータを比較する場合に有用である。一覧表として表示されたデータをプレビューモードに切り替えると、統計処理の結果も表示される。

表1　データ一覧表・表示と統計処理の結果

ｂ. 印刷
　印刷の結果は、レイアウト画面のプレビユー通りになる。なお、上記の５種類のレイアウトは、第１の完全カード型データ表示以外は、A4用紙に横書き印刷されるように設計されている。

V.　使い方[4]

1.　ソフトの立ち上げ
　データベースファイルをダブルクリックするとFMが立ち上がり、「モード選択画面」（図4）が現われる。

図4　初期モード選択画面　

2.　データの表示
　「モード選択画面」から希望の表示モードをクリックすると直ちにデータを表示する。また、表示モードを切り替えるには、画面左上のレイアウト選択部分をクリックする。
なお、FMでは、レイアウトの変更・追加・削除が容易なだけでなく、文字をカラー表示にしたり、罫線や枠を付けて見やすい表示画面に設計変更することが容易にできる。

3.　検索、ソート
　フィールド枠の中に検索項目を入力して「検索」を実行すると、該当項目（２個以上の指定も可能）を含む、または含まないレコードを該当項目数とともに表示する。「再検索」によってさらにしぼり込むこともできる。
また、FMのもつ次のような検索機能を利用することができる。
「順次検索」：テキストフィールドの部分一致検索をする。例えば、=="", ==*"", ==*""*, ==? ""などのワイルドカードが使える。""の中に検索する文字列を入れる（*は任意の複数文字列を、？は１文字を意味する。）
「高速検索」：記号「＞」, 「＜」, 「≧」, 「≦」, 「…」を使って範囲を指定した検索ができる。

　ソートを利用するとさらにデータベースとしての機能性が高まる。任意のフィールド項目（複数項目の指定も可能）についてソートすることができるが、よく用いる項目は「スクリプト」（一種のマクロ機能）を利用すると便利である。本データベースでは、「糖残基」と「アノマー」をソートの既定項目としてある。これによって、データ入力順とは無関係に糖残基ごとに分類されたデータが表示されるので、構造の似た化合物のデータを比較する場合に便利である。
さらに、検索とソートを同時に実行すると、かなり整理されたデータが表示される。

4.　統計処理
　選択されたNMRデータについて、化学シフト値の平均値、最大最小値、標準偏差値が自動的に計算され、その結果が表示される（表1）。この情報は、構造未知の糖質スペクトルの帰属が妥当であるかを検証する場合に役立つ。例えば、図4の場合には、糖残基としてGal, 2位の置換基をAcとして検索・ソートした結果であるが、ここから2位の環プロトン(H2)の化学シフト値は5.14ppm前後と予測される。さらに多くの類縁化合物のデータを集計すれば、糖質の環プロトンの化学シフト値を推測する経験則が導き出せるようになる。

5.　データの書き出し・取り込み
入力されているデータは、任意のフィールドを選んで書き出す(EXPORT)することができる。また、検索あるいはソートしたデータだけを書き出すことができる。書き出されたファイルは、別のアプリケーションソフト（ワープロ、表計算、グラフ作成ソフト）から読み込んで利用することができる。
逆に、他のアプリケーションソフトで作成したデータを取り込む(IMPORT)することもできる。
なお、以上のようにデータ交換できるファイルのタイプは以下の通りである；
●タブ区切りのテキスト（フィールドは「tab」で、レコードは「return」区切り）
●コンマ区切りのテキスト：" "で囲まれたテキスト（フィールドは「,」で、レコードは　「return」区切り）
●SYLKファイル（EXCELなどの表計算ソフト用ファイル）
●DBFファイル（dBASE用ファイル）
●WKSファイル（Lotus1-2-3用ファイル）
●BASICファイル（フィールドは「,」で、レコードは「return」区切り）

6.　MS-DOSソフトとのデータ交換

a. MS-DOS阪データベースとの交換
上記４のようにして書き出されたファイルは、さらにDOSファイルにも変換可能なので [5]、 MS-DOS上のアプリケーションソフトでも利用できる。例えば、TheCARD（アスキー社）のようなカード型データベースへの移植が可能である。但し、画像（構造式）データの移植は通信ソフトを介すれば可能であるが操作が煩雑なので、構造式を含まないデータベースとするか、別途MS-DOS上で構造式を作画してから取り込む方がよいだろう。

b. 糖質^1H-NMR スペクトル表示ソフト(HNMR.BAS)とのデータ交換
著者は、糖質の^1H-NMRデータを保存管理し、呼び出したデータを線スペクトルとして近似的に表示するプログラム(HNMR.BAS, MS-DOS BASIC版)を作成している [3b,6]. 　その表示例を図5に示す。このソフトは、FMで作成した本体とNMRデータについては共通のフィールド構造をもっている。従って、BASICファイルを用いた本体とのデータ交換が可能である。例えば、本体から転送されたデータをHNMR.BASで読み込むと、図5のような線スペクトルがすぐに得られる。

VI.　考　察

本データベースは、数百から数千の^1H-NMRデータを保存・管理し、構造未知の糖質をNMR スペクトルによって構造決定する場合の参照データを取り出しやすい形に設計してある点に特徴がある。換言すれば、糖質化学分野の研究に有用なパーソナルデータベースという性格をもつ。これは、糖質の多くがピラノース環構造をとるヘキソースであるため定型のデータ管理が可能であることと、FMがパーソナルデータベースとしてすぐれた機能を持ち合わせているという２つの特徴から実現されたものである。なお、現在利用可能な唯一の^1H-NMR データベースであるSDBS-NMRデータベース[1a]が広範囲の有機化合物を対象にした一般用であるのに対して、本データベースは糖質だけを対象にした個人研究者用である点で性格が異なる。

図5　糖質NMRデータの線スペクトル表示

著者は、現在までに約500個のデータを入力し、糖質の有機合成化学研究に活用している。特に、合成の過程では、糖質水酸基がフリーのものよりもアセチル基などで保護された化合物のスペクトル解析や、オリゴ糖鎖の場合には、糖鎖間のグリコシド結合の位置やアノマー配置をスペクトルから決定する場面に多く出会う。その際、本データベースが、参照データを提供する有用な情報源となる。また、集積されたデータから化学シフト値についての暫定的な経験則が導き出せる[7]。
次に、使用上の問題点をあげる。データ数が数百個を越えると検索、ソート、統計処理などの処理速度に時間がかかる。この問題は、今後CPUの発展によって改善されると思うが、操作性、視覚効果の方を優先した本データベースのような場合には、処理速度がある程度犠牲になるのはやむを得ないであろう。
フラノース環構造の糖質や九炭糖であるノイラミン酸の場合には、本データベースのNMR データの定型表示フォーマットに合わないという問題が生じる。この解決法が２つ考えられる。１つは、フォーマットに合わないデータを「その他の置換基データ」フィールドに入力しておき、利用者が判読する方法、第２は、データ表示と構造式部分のレイアウトだけを変えたフラノースあるいはノイラミン酸専用のFMファイルを別途作成し、FMの「ルックアップ」機能を利用して本データベースからデータを取り込む方法である。いずれを選ぶかは、利用目的によって対応すればよい。
なお、糖質^{13}C-NMRデータベースも本データベースとほとんど同じ考え方で作成が可能であり、目下データを集積中である。

VII.　あとがき

本報文に示したテンプレートを含むサンプルデータ（著者の研究室で測定、解析したものと Gasaら[8]の論文から引用した67個のデータ）を化学ソフトウエア学会・無償利用ソフトとする[9]。
糖質以外の分野でも特定化合物群のNMRデータベースが作成、公開されるならば、関係する研究者に歓迎されるに違いない。データベースの作成は地道なものだが、その有用性が非常に大きいことを認識し、作成への協力と公開を期待したい。

VIII. 引用文献および注

1) 現在利用可能なNMRデータベースとして、例えば、以下のものがある。a) SDBS-NMR データベース（^1H-および^{13}C-NMR), 化学技術研究所。b) POLYSPECS-1 高分子の溶液状態でのNMRデータベース（^1H-および^{13}C-NMR）, (株)クラレ。　 c) C^{13} NMR Data Bank, (株)BASF.　d) Sadtler ^{13}CNMR Spectral Search Libraries, (株)Sadtle。
2) 早水紀久子, 第４版実験化学講座第５巻, pp 426-436, 丸善, 1991.
3) 化学構造式作画ソフトとしては、a) 例えば、Macintosh用ではChemDraw(CSC社)がある。 b) 著者が作成した糖質構造式作画ソフト「Glyco-Kit」（現代化学, No. 248, 1991, pp 55-57; 化学ソフトウエア学会・無償利用ソフト登録番号 9213, 1991）はPC-9801用であるが、画像ファイルをMacintoshコンピュータに転送して利用が可能である。本データベースの頒布版には一般的な糖構造式の画像ファイル(MacPaintファイル)が収められている。
4) ファイルメーカーproの一般的な使い方については、ユーザーズマニュアル（クラリス社）、あるいは、岩谷香里, 「ファイルメーカーproパーフェクトマニュアル」, アスキー(1992) などを参照した。
5) DOSファイルへの変換には、Apple file exchangeまたはPC exchange ソフト（アップル社）を用いるか、通信ケーブルを介してテキストデータとして送信する方法を用いた。
6) 吉野輝雄, 化学ソフトウエア学会'９２研究討論会要旨集, 32-33, 1992年10月, 大阪.
7) 吉野輝雄, 未発表データ
 8) S. Gasa, M. Nakamura, A. Makita, M. Ikura, K. Hikichi, Europ. J. Biochem., 155, 603-611(1986).
9) サンプルデータ以外の^1H-NMRデータ（約450）はまだ不完全（構造式、置換基データ部分が未入力）のため公開しないが、入手希望者には個別に対応する。

Return

『 糖質研究者用・糖質 ^1H-NMRデ－タベース』

吉野 輝雄

I. はじめに

II. 操作環境

III. 機能と特徴

IV. データベースの構成とデータ入力／出力法

V. 使 い 方[4]

VI. 考 察

VII. あとがき