Field Reports 10,000ページ出力時のパフォーマンス測定

発売当初，Field Reports の性能測定を行い結果をブログで公開しました。

Field Reportsは中小規模システム向けの帳票ツールなので，元々大量ページの出力はあまり考慮していませんでした。そのため以前の性能測定では，1,000ページまでの測定にとどめています。しかし，1,000ページを超えた領域での性能については，ずっと気になっていました。

最近，10,000ページを出力したいというお客様からのお問い合わせがありましたので，この機会に1,000ページ以上を出力した時の性能測定を行いました。

性能測定 (1)

下表の環境で性能測定を行いました。

以前の測定環境とは異なりますので，ご注意ください。

図のような見積書をイメージした帳票を生成する時間を測定します。

ページ数を引数で変更できるようなスクリプトを作成し，1, 10, 100, 500, ... , 10,000 とページ数が変化した時の処理時間を測定しました。

処理時間として，timeコマンドの“real”を用いています。

測定結果を以下の表とグラフで示します。

9,000ページで約4時間20分かかり，10,000ページまで実施できませんでした。5時間を軽く超えそうです。

処理時間をページ数の二乗で割ると，1,000ページ以上ではほぼ一定値になりますので，N^2オーダーの処理になっていることがわかります。

この結果にはちょっと納得がいかなかったので，パフォーマンス・チューニングを試みました。

各処理の区切りでログを出力し，ボトルネックになっている処理を絞り込み，以下の改善を地道に行いました。

結果的には，最後のハッシュ処理への変更が一番効きました。

チューニング後の測定結果を以下の表とグラフで示します。

グラフから明らかなとおり，劇的に性能が改善しました。

チューニングの結果，N^2のオーダーから N×log Nのオーダーに下がったようです。

PDFの生成には木構造のデータを大量に扱いますので，妥当な結果になったと思われます。

このパフォーマンス・チューニングの成果は，次の1.4版には反映させたいと思います。