10月9日、Web Hypertext Application Technology Working Group(WHATWG)は、次世代のHTML仕様として策定中の「HTML5」に対応したパーサ「html5lib 0.10」をリリースした。
HTML5は、Apple、Mozilla、Operaを中心とするブラウザベンダーやウェブ開発者のコミュニティ「WHATWG」で策定中の、次世代のHTML仕様。ウェブアプリケーションの開発を容易に行えるようにすることを目的として仕様が練られており、コンテキストメニューやインラインのポップアップウィンドウを記述することが可能になっている。
html5libはそのHTML5のパーサ。RubyとPythonのバージョンが用意されており、HTMLドキュメントのパース機能のほか、文字エンコーディングの検出機能、構文ツリーのフィルタリングと直列化機能などを備えている。また、多くのウェブブラウザと同じように、妥当でないHTMLのパースもある程度行えるようになっている。