青空文庫っぽい記法のルビを解釈するよ
続きはウェブで
青空文庫工作員作業マニュアル 2.入力-1にある仕様のうち、ルビと[改ページ]
タグのみをサポートします。その他の記法(見出しや傍点など)は、何も加工しません。
実際のところ、このライブラリは青空文庫の記法に厳格に従ったものではありません。JIS漢字コード (JIS X 0201, JIS X 0208, JIS X 0213) を前提とする青空文庫に対して、入出力に Unicode を許容すると、その性質上、「文字種」の定義が煩雑になるからです。
そのため、本ライブラリでルビの始点指示|
なしで利用できるのは漢字とASCIIの範囲のアルファベットと数字、全角アルファベットと数字のみです。一部の処理系との互換性のため、ひらがなカタカナを始点指示|
なしでルビに分解することはありません。
このパーサーが保証する入力と出力はtest/parseRegExpTest.js
を参照してください。
parser = new AozoraRubyParser(input_text: string)
- パーサーオブジェクトを生成します
parser.perse()
- パース処理を実行します。
副作用としてparse.nodes
にパースされたオブジェクトの配列がセットされます
- パース処理を実行します。
parser.render(template: object): string
template
で渡されたオブジェクトに実装されたメソッドを利用してノードを文字列化して一つの文字列に結合します
パースに成功すると、オブジェクトの配列を生成します。オブジェクトはTextNode
とRubyNode
とNewpageNode
の三種類です。ノードの種類はtype
プロパティの文字列text|ruby|newline
で判定することができます。
全ての種類のノードはtext
プロパティを持ちます。また、RubyNode
はrt
プロパティを持ちます。すべてのノードのtext
プロパティを結合することで、原文からふりがなを省いたテキストを得ることができます。
node.type
と同じ名前のメソッドを持ったオブジェクト(変換器)を parser.render()
に渡してやることで、独自のフォーマットに変換することができます。
このライブラリに付属する変換器は拡張性を持たせるためにnew AozoraRubyHTMLConverter
のように初期化しますが、単純な変換器は以下のようにシンプルな実装で十分です。
var simple_converter = {
text: function(node){ return node.text; },
ruby: function(node){ return node.text + "(" + node.rt + ")"; },
newpage: function(node){ return "\n\n"; }
}
var output = parser.render(simple_converter));
bower install aozora-ruby-parser
Node.js でちゃんと動くかはよくわかんない
npm install aozora-ruby-parser
本リポジトリに含まれるファイルは以下の条件に基き配布されます。 (後述のsim2ruby.css
を除く)
aozora-ruby-parser.js
Copyright 2014 USAMI Kenta <[email protected]>
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.
sim2ruby.css
は http://roheisen.net/dl/sim2ruby.css を改変したものです。
sim2ruby.css
sim2ruby.css
= a cascading style sheet to simulate simple ruby.IE以外のブラウザでもルビタグ(振り仮名表示機能)を同じように機能させるCSSです。 “simulate simple ruby”の名前の通り、rtcやrbcなどの複雑ルビには未対応です。
- 作者 : MMZK
- 所属 : 銑鉄計画
- 拠点 : 銑鉄網
- 版 : 皇紀2671年04月26日版 ver.1.0.4
個人・法人・営利・非営利問わずご自由にお使いください。 邪魔ならここの枠を丸ごと消してしまっても結構です。 ただし、虚偽の著作主張だけはご勘弁願います。