演題化学物質の必要にして十分な部分構造の組を用いてその物質の論理的に可能な構造異性体の構造を組み上げるBASIC簡便プログラム
発表者
(所属)
工藤喜弘 (山形大学工学部電子情報工学科)
連絡先992 山形県米沢市城南4ー3ー16 山形大学工学部
Tel 0238-26-3360 Fax 0238-26-2082
キーワード有機構造解析 構造列挙 情報同族
開発意図
適用分野
期待効果
特徴など
有機構造解析において見落としによる構造決定の間違いを防ぐために、用意した情報では2個以上の構造が可能である(すなわち、情報が十分でない)かどうかを表示するためのプログラム
環境 適応機種名NEC PC-98  シリーズ
OS 名
ソース言語N88-BASIC(86)
周辺機器
流通形態
  • その他
具体的方法
(リストは公開し、複写したい方には自由にしていただく)

1 はじめに

 有機化合物の構造決定は本来、構造不明の試料、いわゆる未知試料、の構造を明らかにすることであるが、作業仮説構造の検定という方法が踏襲されている。運悪く正解でないものを選べばいつかは矛盾が露呈する(年間数十件程度)が、正解に似るほどそれに至る道のりは長い。さて、たとえば、分子式 C2H6O という情報のみからはエタノール、ジメチルエーテルの両者が正解であり得るように、情報が不足ならば可能な構造は2個以上になり、逆も真である。そこで、所持情報が十分か否か判断できるようにする目的で可能な構造が2個以上になるかどうかを示すプログラムである。したがって望まれなければ2個で中断する。

2 構造の表現

 構造は構造異性体レベルの構造式で表現し、構造式を無向グラフに等価変換し、内部表現として正方行列(matrix)を用いる。
 この内部表現の行列の要素の内、外部表現では0でない部分のみ抜き出して表示する。(また、ここでは扱わないが、行列構造式図変換アルゴリズムを結合させれば構造式が図示できる。)
 グラフの頂点(node)は疑似原子に対応し、その価数までの多重結合以下の結合が可能であるとする。

3 可能な構造式の組み立て

 グラフの頂点の結合手が余らないように構造を作りあげる。非連結の構造個(catenane, rotaxane, and/or tanglane)を認めるかどうかはは任意である。

4 入力、出力

 入力は広義の分子式である。[C(IV) 2個、H(I) 6個、O(II) 1個] 、 [CH3(I) 2個、O(II) 2個] 、[(ベンゼン環)(VI) 1個、 C(IV) 3個、 H(I) 10個]などである。「二重結合」(II)、「大きな部分構造」(結合価を指定)などのダミーを作るのも自由である。出力は可能な構造式(と等価表現)である。

5 操作例

 例1。入力 C4H8: 分子式 [C(IV) 4個、H(I) 8個]。
    出力: No. 1.: [ C2 2個、H2 4個]; No.2: [ C2 1個、C2H2 (acetylene 相当) 1個、H2 3個] なる非連結構造を示す。利用者が全部の組み立てを指示すると最終的には 48 個追加され、計 50 個になる。
 内、連結構造はNo. 40: (isobutene相当)、No. 43: (2-butene相当)、No. 45: (1-butene相当)、 No. 49: (methylcyclopropane 相当)、No. 50: (cyclobutane相当)の5個である。もしも非連結構造不可を指示すれば、最初の2個(No. 40と No. 43 )を表示し、指示によりさらに後3個を追加する。

 例2。入力: [(ベンゼン環)(VI) 1個、 C(IV) 3個、 H(I) 10個] および 「非連結構造不可」。
 出力:[isopropylbenzene相当]、[propylbenzene 相当]の2個を示す。指示されれば [ethylmethylbenzene 相当]、[trimethylbenzene 相当] を追加できる。

6 考察

 グラフの頂点の色数は多い方が効率がよい。そこで、たとえば [CHO] の3色系を [CH3, CH2, CH, C, OH, O] など多色系に等価変換した方がよい。ただし単位を大きくすると下記のような欠点が現われるので、効率との兼ね合いとなる:
 (1)単位を [C,H, O] 系から [CH3, CH2, CH, C, OH, O] 系に替えると、 [C(IV)2個、H(I)6個、O(II)1個] なる分子式が [CH3(I) 2個、O(II)1個] および [CH3(I) 1個、CH2(II)1個、 OH(I)1個]の2個に増える、
 (2)たとえば [ethylmethylbenzene 相当] は一括式表現であり、 o-, meta-, para- の3位置異性体を包含していることなどの化学的判断が必要になる。

参考文献:

(理論、手順)
(1). 工藤喜弘、化学の領域増刊 (1972), 98, 115-134.
(2) Y. Kudo, et. al., J. Chem. Doc. (1974), 14, 200-202.
(3). Y. Kudo, et. al., J. Chem. Inf. Comput. Sci. (1976), 16, 43-49.
(実施例, 応用例)
(1). 工藤ら、分析機器 (1973), 4, 654-663. 
(2). Yoshihiro Kudo et. al., Anal. Sci. (1991), 7, Suppl. 765-768.   
(3). Yoshihiro Kudo et al., Computer Aided Innovation of New Materials II (1993), 921-924.  
(4). Yoshihiro Kudo, Bull. Yamagata Univ. (Nat. Sci.) (1991), 12, 377-381.
(構造決定の様相:専門家の意見が異なった事例)
(1)工藤喜弘、秋田大学総合科目研究紀要「情報化社会に生きる」 (1990), 33-41 .