編集部からのお知らせ
新着記事まとめPDF「ランサムウェア」
注目の記事まとめPDF「Chrome OS」

HTMLをPDFに直接変換するpisa

jla

2008-01-08 17:21

みなさん明けましておめでとうございます。日本Linux協会の野首です。今年もよろしくお願いいたします。

このブログでは技術的な話題も書いてゆこうと思っているのですが、今回は

pisaというソフトウェアを紹介してみようと思います。

pisaはHTMLを直接PDFに変換するもので、Pythonで記述されたオープンソースソフトウェア

(QTライセンス)です。また、商用利用の為に別途リライセンスもしています。開発元は

spirito GmbHというドイツの企業です。

私がこのソフトウェアの存在を知ったのは昨年の11月7日なのですが、時系列をみるとどうやら

MOONGIFTというブログの紹介記事「

MOONGIFT: ? Python上でHTML2PDF「pisa」:オープンソースを毎日紹介

」が回りまわって伝わってきたという感じです。

残念ながらこのソフトウェアはISO-8859-1向けなのですが、試行錯誤を重ねてなんとか

日本語を表示させることができるようになりました。

といっても、pisaが使っているライブラリReportLab

HTML5lib

がどちらもCJK対応なされていたからできたようなものですけれども。

私はPerl、Rubyなどに比べるとPythonに関してはいまいち習熟度が足りません。そのため、

結構時間を費やす羽目になりました。その際に役に立ったのは、Pythonがもつ強力な

セルフドキュメントとインタラクティブ実行環境、デバッガです。

コマンドラインからpythonと入力するだけでインタラクティブモード(Rubyでいうirbのようなもの)

が動作しますし、オブジェクトのメソッド一覧はdir()で取得できます。またemacs lispの

docstringと同様の機構を持っており、help()を使うことでそれらを参照できます。

そのおかげで、ソースコードを読むことと、実行時の挙動を調べることでなんとか自分の目標

(日本語化)を達成できました。

パッチと解説はhttp://www.daionet.gr.jp/~knok/trac/trac.cgi/wiki/pisa-l10n

に記しました。次の目標はこれを開発元にコミットすることです。

新年早々、よいハックができました。今年もがんばってゆきたいと思います。

※このエントリはZDNetブロガーにより投稿されたものです。朝日インタラクティブ および ZDNet編集部の見解・意向を示すものではありません。

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    マンガでわかる―Webサイトからの情報搾取を狙うサイバー攻撃「SQLインジェクション」、どう防ぐ?

  2. 経営

    迫られる改正電子帳簿保存法対応--中小・中堅企業に最適な簡単&現実的な運用方法とは

  3. 運用管理

    AWS、GCP、Azureを中心としたクラウドネイティブ環境における5つのセキュリティ強化策

  4. 運用管理

    5G時代におけるクラウドサービスの問題点、通信の最適化・高速化を実現する「MEC」の活用事例を紹介

  5. コミュニケーション

    情報が見つからない&更新が進まないFAQページは絶対NG!効果的なFAQを作成・運用するために

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]