化学ソフトウェア学会論文誌の電子出版-インターネットによるオンライン公開と印刷体雑誌出版の統合-

中野 英彦, 時田 澄男, 中田 吉郎, 吉村 忠与志, 吉田 弘, 伊藤 眞人, 一色 健司, 飯箸 泰宏


Return

1 はじめに

化学ソフトウェア学会の論文誌(The Journal of Chemical Software、以下本誌)は1992年4月に第1巻第1号を発行以来、初期には合併号あるいは欠号があったが、最近は年1巻4号の発行が定着して現在に至っている。最初は著者からのワープロ原稿からのオフセット印刷による冊子体の発行のみであったが、1995年発行の第2巻第4号からインターネットを介したWWW方式による全文のオンライン公開を試験的に開始し、さらに1996年発行の第3巻第2号以降は全発行論文についてオンライン公開を実施している。また、それ以前の既発行論文についても、著者からの電子化原稿の提供を受けたものについてはさかのぼってオンライン登録を行った。
この際、オンライン公開のためには、印刷体発行のためのワープロ原稿とは別に、著者からフロッピーディスクの提供を求め、手作業でHTML文書の作成を行っていた。そのため、著者にとっても、また発行者である学会にとっても作業が二重になり、合理化が必要とされた。そこで、論文誌のオンライン出版と印刷体の作製作業を総合的に電子化することを目的として「インターネットを利用した学術雑誌の電子出版システムの開発」の題目で文部省科学研究費補助金(基盤研究(B)(展開研究))の申請を行ったところ、1997年度より補助金の支給を受けることができたので、電子出版システムの開発を開始し、1998年より実際の刊行に一部試験的に適用を始めるとともに、システムの改良を加え、印刷体作製およびオンライン公開のためのシステムとしては、1999年12月にほぼ実用の域に達した。

2 ハードウェアおよびOS

変換プログラムの開発および電子出版工程の大部分の作業は、Compaq製のDeskpro 4000(メモリ96MB、ハードディスク3GB) 、Windows NT 4.0または富士通製のFMV(メモリ48MB)、Windows95のもとで実行した。また、TeXによる図形出力のためのEPS(Encapsulated PostScript)形式のファイル作成はSUN Microsystem製のワークステーションS-4/LX(メモリ64MB)、Solaris 2.3のもとで実行した。さらに、同ワークステーションはオンライン公開用のサーバーとしても使用している。

3 システムの基本機能

本システムの機能は、レフェリーによる審査によって本誌への掲載が決定した原稿について、フロッピーディスクまたは電子メールによって著者から提供された電子化原稿から、印刷体雑誌出版およびインターネットによる電子出版を行う過程を統一的に処理するものである。将来の課題としては、審査の過程についても電子化して、インターネットによる審査を行うことが考えられるが、現在はまだ実現されていない。
本誌の特徴としては、化学分野とコンピュータソフトウェア分野の境界領域を取り扱う関係上、単純な文章だけでなく、化学式、数式、図形(線画による図形およびイメージ図形)およびアルゴリズム記述のための疑似コードなど、多様な表現形式を必要としており、そのための処理について検討を行った。

3. 1 新旧システムの比較

Figure 1に、本システム開発以前に実施していた本誌の冊子体およびオンライン出版の方法(旧システム)および今回開発したシステムによる両方の出版方法(新システム)について示した。図に示すように、旧システムでは著者から冊子体印刷用の紙出力原稿と、電子出版用のフロッピーまたは電子メールによる電子化原稿の両方を受け取り、それぞれ別個に処理を行っていた。従って、出版過程での作業の重複等の無駄が生じるだけでなく、著者側あるいは出版側のミス等で冊子体とオンライン出版の内容に不整合が生じる可能性があった。
それに対して、新システムでは著者から提供された電子化原稿を、いったんSGML(Standard Generalized Markup Language)[1, 2]文書とした後、それよりプログラムによって冊子体印刷のためのLaTeXのソースファイルと、オンライン出版のためのHTML文書およびPDF(Portable Document Format)[3]文書へ変換することにより行う。その結果、両出版過程が合理化されると共に、上記のような両者の不整合の可能性が減少した。


Figure 1. Flow chart for publishing process of traditional and new systems.

以下に、それぞれの過程における処理の詳細について述べる。

3. 2 SGML文書の作成

SGML文書は、SGML専用エディタであるXsoft社のInContext2(FUJI Xerox社よりDocuPlantの名称で販売されている)を用いて作成した。作業は、著者から提供された電子化原稿(テキスト形式のファイル)をNotepadで開いておき、そこから論文のそれぞれの項目部分をカットし、あらかじめInContext2に本誌のDTD(文書型定義)を読み込ませる事によって画面に表示されている、論文のテンプレートの該当する構成要素部分にペーストすることにより行った。

3. 3 文書型定義(DTD)

本誌のDTDは、学術情報センター(NACSIS)によって作成された「学術論文汎用DTD」[4]を一部変更して用いた。変更した主な点は以下のとおりである。
  1. 数式および化学式のSGMLによる記述をやめた。
    NACSISのDTDでは、文章中の数式および化学式を記述するタグが用意されているが、使いこなすのが難しいので、本システムではその利用をやめ、簡単な化学式および数式については、通常の文中の上付き、下付き、イタリック等の表現機能を利用することとした。また複雑な数式について、TeXによる記述をSGML文書中に挿入可能とし、複雑な化学構造式については図形として処理することとした。
  2. 引用文献リストを論文の末尾に記述することを可能とした。
    NACSISのDTDでは、SGML文書において引用文献は論文中に最初に引用される場所に記述するようになっており、出力整形プログラムによって論文の末尾に出力されるようになっている。最初からSGMLエディタによって文書を作成する場合にはその方が合理的であるが、本システムのように、すでにテキスト形式で作成された文書が存在し、その文書には文献リストが末尾に記述されているような場合には、SGML文書においても文献リストを末尾に記述する方が作業が容易である。そこで、DTDを一部変更して文献リストを末尾に記述可能とした。
  3. 新たに必要となったタグおよび属性を追加した。
    NACSISのDTDは1994年に作成されたものであり、その後に必要とされるようになったタグを追加した。主なものは以下のとおりである。
    1. インターネットのURL
      文章中にインターネットのURLを記述するだけであれば、特に新たなタグを設ける必要はないが、URLが記述された部分には、HTML文書に変換する際に自動的にリンクを張るようにするには、タグで指定されている方が好都合であるので、URL記述のためのタグを追加した。
    2. 電子メールアドレス
      これは、著者の所属機関、住所に加えて、電子メールアドレスを記述可能としたものである。
    3. オンライン公開日付
      これは、一つの論文全体を示すタグの属性の中に、NACSISのDTDで既に定義されていた、受付および掲載決定日付に加えて、新たにオンライン公開日付を追加したものである。
  4. 実体宣言の追加
    ギリシャ文字や特殊記号などは、ISO 8879で定義された公開宣言ずみ実体集合(ISOgrk3, ISOnum, ISOlat1, ISOpub, ISOtech、これらの実体宣言集合のファイルは、InContext2に附属している)中にある実体を使用する事により、ほとんどの場合対応可能であるが、一部に本誌中で使用され、かつTeXでは印刷可能であるにもかかわらず上記公開宣言ずみ実体集合には含まれていないものがあった。これらの記号等について新たに実体宣言の追加を行った。例えば、∠(、角)、◯(、大きい円)、⊙(、中点付き円)、&dblcir;(、二重円)、≑()などである。これらの記号については、最初から必要なもの全てについて登録するのではなく、必要に応じてその都度追加することとしている。

3. 4 TeXによる出力

TeXの処理系はASCII社のpLaTex2e[6]を使用し、ドキュメントクラスは同処理系に含まれているjarticleを用いた。さらに、図形出力のためのEPSファイルを取り込むためのgraphicx、1ページを超える長い表を出力するためのlongtable、米国数学会論文誌のために開発された高度な数式記述機能および数学記号を利用可能とするためのamsmathおよびamssymbの各パッケージを取り込んでいる。

3. 5 変換プログラムの作成

Figure 1に示したように、InContext2を用いて作成されたSGMLファイルは、変換プログラムによってオンライン公開用のHTMLファイルおよび印刷出力のためのLaTeXソースファイルに変換される。変換プログラムは、Visual Basicを用いて作成した。
通常の文章中あるいはリスト(箇条書き)、タイトル、著者名、所属機関名などの項目の指定およびそれぞれの文章中における上付き、下付き、イタリック体、ボールド体などの修飾については、SGMLのタグを解析して、機能的に対応するHTMLのタグおよびTeXの命令に変換することで、比較的容易に変換が可能であった。しかし、表、数式、化学構造式については、以下に記すような工夫を必要とした。また、特殊記号に関しても、HTMLとTeXにおける表示可能な文字が異なる場合があり、その点に関しても特別な処理を必要とした。

3. 6 表の取り扱い

SGML、HTMLおよびLaTeXにはそれぞれ作表機能が存在している。しかし、LaTeXの作表機能は全二者とは少し異なっているため、複雑な表をSGMLで記述しておき、プログラムにより自動的に変換することは困難な場合がある事が分かった。したがって、比較的単純な表に関してはSGMLにおいても作表機能を使用して記述しておき、プログラムによってHTMLファイルおよびLaTeXのソースファイルに変換する(場合により、作成されたファイルを手作業で若干修正する必要がある)事とし、それが困難な複雑な表については、図形として処理することとした(Figure 2)。


Figure 2. Flow chart for processing tables.

3. 7 数式の取り扱い

3.3節の文書型定義のところでも述べたように、SGML文書中にTeXのコードを記述する事が可能となるようにDTDを変更した。従って、いわゆる別行立ての数式は直接TeXのコードとして記述される。これを印刷体作成用のLaTeXのソースファイルに変換する場合には、そのままLaTeXのソースファイル中に取り込めば良い。しかし、HTML文書に対しては、TeXのソースコードを取り込んでもブラウザで見る事はできないので、以下のような処置を採り、図形として処理する事とした。まず、HTML文書中には、該当部分にイメージ図形を取り込むタグを埋め込んでおく。そのうえで、TeXのコード部分は別のファイルとして出力しておき、そのファイルはパソコン上でTeXの処理系でコンパイルし、作成されたdviファイルを画面表示のためのソフト(dviout)を用いて表示を行い、その画面を切り取って図形ファイル(GIFファイル)として、HTMLブラウザで閲覧可能とした(Figure 3)。


Figure 3. Flow chart for processing mathematical formulae.

TeXのコードの記述は、本文中だけでなくTable や Figure として記述する事も可能としており、TeXのコードで記述可能なものであれば、数式のみならず図形やSGMLで記述が困難な表をTeXの作表機能を使って直接記述する事もできる。
一方、文章中の数式に関しては、上記3.3節に述べた公開宣言済み実体集合および新たに追加宣言した実体中の特殊記号等を用いて、本文中に通常の文書と同様に記述可能とした。

3. 8 化学構造式の取り扱い

化学式においても、オリジナルの学術論文汎用DTDでは記述可能となっていたが、使いこなすのが難しいため、本誌のDTDにおいてはその機能を削除して以下のように対応した。
本文中に記述可能な簡単なものについては、上付き、下付き機能を用いて通常の文書と同様に記述する事とした。一方、いわゆる亀の甲等の含まれた複雑な化学構造式の場合には、図形として取り扱う事とした。TeXのマクロ機能を利用して化学構造式を作成する試みもなされており、上記のように本システムにおいてもSGML文書中にTeXコードを記述する機能を利用すれば、化学構造式部分をTeXによって記述する事も可能であるが、通常は化学者が使い慣れているChemDrawによって作成されたファイルを後述の図形と同様の方法で取り込む方法を採用した。

3. 9 特殊記号の取り扱い

特殊記号については、TeXによって出力可能なものは原則としてサポートする事としている。従って、SGML文書中においては公開宣言済み実体または新たに追加された実体として記述されているものを、印刷体作成用のLaTeXのソースファイルに変換する場合には、対応するTeXのコードに変換することで対応できるが、HTML文書への変換においては一部のHTMLで取り扱い可能な記号を除いて、コードとして取り扱う事ができない。その場合には、記号の形状をGIF形式の図形ファイルとしておき、HTML文書中では該当する図形ファイルを取り込む事として対応した。
これらの記号については、予め予想されるすべての記号を登録することはせず、必要に応じて登録ファイル中に追加する事とした。

3. 10 図形の取り扱い

図形データについては、著者から個別の図形ファイルとして提供されたもの、あるいはワープロ文書中に貼り込まれた図形データにおいても、カットアンドペーストによって図形処理ソフトに取り込みが可能なものについては、その図形がイメージ図形かあるいは線画による図形かによって以下の異なる処理によってHTML文書およびLaTeXに取り込み出力を行った。著者から提供された図形が、紙出力によるもののみの場合には、イメージスキャナ(EPSON GT9500)によってビットマップファイルとして取り込み処理を行った。

3. 10. 1 イメージ図形

Figure 4にイメージ図形の処理の流れを示した。著者から提供された様々なフォーマットのイメージ図形ファイルは、Windows NTに附属しているMicrosoft PaintおよびImaging for Windows NT、 フリーウェアのLview、Micrografx社の PhotoMagic 6 などのイメージ図形処理ソフトを用いて必要な加工を行った後、LviewまたはPhotoMagicによってGIF形式のファイルとして保存した。HTML文書へは、このGIFファイルを取り込み、LaTeXによる印刷のためには、GIF形式のファイルから、さらにEPS形式のファイルへの変換を行った(Figure 4 においてはHTML用とLaTeX用のGIFファイルは1つに記述されているが、これは同じファイル形式という意味であり、HTML用は画面表示に必要な精細度の、印刷用は300dpi程度の精細度の別ファイルである)。


Figure 4. Flow chart for processing bitmapped images.

LaTeXによる出力のためには、EPS形式のファイルとしておく必要がある。上記のPhotoMagicには、保存ファイル形式としてEPSファイルも含まれているが、PhotoMagicによって保存されたEPSファイルを、アスキーのpLaTeXによって出力を行おうとしてもうまくいかなかった。その他Adobe社のPhotoshopを含めてパソコン上で動作可能な図形処理ソフトをいくつか試用してみたがいずれもうまく出力されず、やむをえずEPSファイルへの変換のみについてはSUN Microsystem社のワークステーションS-4上のSolarisに附属しているImage Toolを用いて行った。

3. 10. 2 線画による図形

Figure 5に線画による図形の処理の流れを示した。著者から提供された図形が線画によるものであっても、HTMLで提供する場合にはGIFファイルなどのイメージデータとしなければならない。著者からのデータ形式がMicrografx 社のWindows Draw 6.0で読み込み可能な形式の場合には、同ソフトに読み込みGIF形式で保存する事により実現される。また、ワープロに貼り込まれた図形で、独立した図形ファイルとして取り出せなかったもの、あるいはWindows Drawで読み込みができないものについては、パソコン画面に表示しておき、その画面をPrint Screenキーを押す事によりクリップボードに取り込み、さらにクリップボードからイメージ図形処理ソフトにペーストすることでGIFファイルとする事ができた。


Figure 5. Flow chart for processing line drawing pictures.

LaTeXによる出力のためのEPSファイル作成のためには、上述のイメージ図形ファイルの場合と同様に、パソコン上での図形処理ソフトであるWindows DrawでEPS形式で保存したファイルではLaTeXの処理系では出力されず、またワークステーション上のImage Toolは線画は処理できないので、やや迂遠な処理であるが、以下の方法で行った。
著者作成の図形ファイルあるいはワープロに貼り込まれた図形を、白紙のページにコピーし、そのページのみを指定して、EPSONのポストスクリプト対応プリンターのLP200PS2用のプリンタードライバーを使用し、かつ出力先をプリンターからファイルへの変更を行った後、当該ソフトの印刷機能を用いて印刷出力を行う。そうすれば、必要な図形部分のポストスクリプト(PS)ファイルが作成される。このPSファイルは、pLaTeXの処理系に附属しているGSView(ポストスクリプトファイルを読み込み画面に表示するソフト)で読み込み、EPSファイルに変換する事ができる。

3. 11 PDFファイルの作成

当初はインターネットによる公開はHTML文書のみで行っていた。HTML文書は検索エンジンによる全文検索が可能である事などの利点があるが、一方では出力形態はブラウザの違いあるいは設定に依存するため、印刷出力はオリジナルの論文と内容的には一致するが、見かけは一致しないという問題がある。その点を解決するために、PDF形式によるオンライン提供を並行して行う事とした。PDFファイルの作成の流れは、Figure 6に示すとおりである。基本的には印刷出力のための処理に従ってLaTeXのソースファイルを処理してdviファイルを作成する。このdviファイルをdvipsあるいはdvioutを用いて出力すれば印刷出力が得られる。dvipsによる出力の際に、出力先をプリンターからファイルに切り替えておけばPSファイルが作成される(プリンタードライバーとしてEPSONのPSプリンタドライバを使用)。このPSファイルをAdobe 社のAcrobat Distiller 3.0Jを用いて処理すればPDFファイルが生成する。


Figure 6. Flow chart for creating a PDF file.

4 電子化の効果

本システムを本格的に使用し始めて1年以上が経過したが、電子化の効果としては以下のようなものがあげられる。

5 今後の課題

本稿執筆時点(2000年2月)において、ほぼ本誌のオンライン公開と印刷体雑誌の出版過程を統一的に処理するという目的は達成されたが、著者からの電子化原稿をSGML化する過程においては、まだ手作業が中心となっている。この過程を自動化する事が出来れば、作業はさらに合理化される。しかし、その場合には著者にもある程度の負担をかける事になる。著者が現在行っている操作(ワープロによる入力と、その後の修正などの文書作成操作と、図形を処理する操作)に比較して、できるだけ負担増とならない方法を考える事が重要となる。

本研究は、文部省科学研究費補助金(基盤研究(B))(課題番号09558007)の支援のもとで行われたものである。また、学術情報センターの学術論文汎用DTDの利用にあたり、図書館情報大学の石塚英弘教授ならびに学術情報センターの根岸正光教授に大変お世話になった。ここに感謝の意を表する。

参考文献

[ 1] Martin Bryan 著, 山崎俊一 監訳, 福島 誠 訳, SGML入門, アスキー出版, 東京 (1991).
[ 2] Eric van Herwijnen 著, SGML懇話会実用化WG 監訳, 実践SGML, 財団法人 日本規格協会, 東京 (1992).
[ 3] 福田良一, PDFの完全攻略, オーム社, 東京 (1997).
[ 4] 学術情報センター, 学術論文DTDの公開要素集合, 株式会社ユニスコープ, 東京 (1993).
[ 5] SIST-14, 電子投稿規定作成のためのガイドライン(案), SISTハンドブック(科学技術情報流通技術基準), 科学技術振興事業団科学技術情報事業本部, 東京 (1998), p.383.
[ 6] 奥村晴彦, LaTeX2e美文書作成入門, 技術評論社, 東京 (1997).


Return