Zend_Translate
は、さまざまなアダプタを使用して翻訳を行えます。
それぞれのアダプタによって利点や欠点があります。
以下に、翻訳の入力ファイルとしてサポートしているすべてのアダプタについてまとめます。
表167 Zend_Translate
のアダプタ
アダプタ | 説明 | 備考 |
---|---|---|
Array | PHP の配列 | 小さめのページ。簡単に使用できる。プログラマしかさわれない。 |
Csv | カンマ区切りファイル (*.csv/*.txt) | シンプルなテキスト形式。高速。Unicode 文字で問題が発生する可能性がある。 |
Gettext | gettext のバイナリファイル (*.mo) | linux における GNU の標準形式。スレッドセーフ。翻訳用ツールが必要。 |
Ini | シンプルな INI ファイル (*.ini) | シンプルなテキスト形式。高速。Unicode 文字で問題が発生する可能性がある。 |
Tbx | termbase 変換ファイル (*.tbx/*.xml) | アプリケーション間で専門用語を変換するための業界標準。XML フォーマット。 |
Tmx | tmx ファイル (*.tmx/*.xml) | アプリケーション間での翻訳の業界標準。XML フォーマット。可読形式。 |
Qt | qt 言語ファイル (*.ts) | クロスプラットフォームなアプリケーションフレームワーク。XML フォーマット。可読形式。 |
Xliff | xliff ファイル (*.xliff/*.xml) | TMX に似ているが、よりシンプル。XML フォーマット。可読形式。 |
XmlTm | xmltm ファイル (*.xml) | XML ドキュメントの翻訳メモリの業界標準。XML フォーマット。可読形式。 |
その他 | *.sql | 今後、その他さまざまなアダプタを実装する予定です。 |
Zend_Translate
でどのアダプタを使用するのかを決める必要があります。
プロジェクトの制約や顧客からの要望などの外的要因でアダプタが決まることもよくありますが、
もしあなたに決定権があるのなら、以下のヒントを参考にしてください。
注記
使用するアダプタを決めるにあたっては、
使用するエンコーディングを考慮しなければなりません。
Zend Framework では UTF-8 をデフォルトのエンコーディングとしていますが、
時には他のエンコーディングを使わなければならないこともあるでしょう。
Zend_Translate
は、
ソースファイル内で定義されているエンコーディングを変更しません。
つまり、もし Gettext のソースが ISO-8859-1 で作られている場合は、
それをそのままのエンコーディングで返します。
ただ、ひとつだけ制限があります。
TMX や XLIFF といった XML ベースのソース形式を使用する場合は、 そのエンコーディングを XML ファイルのヘッダで定義しなければなりません。 エンコーディングの定義がない XML ファイルは、 デフォルトでは UTF-8 として扱われるからです。 また、もうひとつ注意すべき点は、XML ファイルのエンコーディングとして使用できるのは PHP がサポートしているエンコーディングのみであること、 つまり UTF-8、ISO-8859-1 および US-ASCII だけであるということです。
Array アダプタは、プログラマにとっては 一番シンプルに使えるアダプタです。 しかし、翻訳する文字列が大量にある場合や 多くの言語に翻訳する必要がある場合は、別のアダプタを使うようにしましょう。 たとえば、翻訳文字列が 5000 ほどある場合は Array アダプタは選択しないほうがいいでしょう。
このアダプタを使うのは、小さめのサイトで少なめの言語を扱い、 かつプログラマ自身で翻訳も行う場合だけにしましょう。
Csv アダプタは、顧客にとっては最もシンプルに使えるアダプタです。 CSV ファイルは標準的なテキストエディタで読むことができますが、 エディタによっては utf8 文字セットをサポートしていないものもあります。
このアダプタを使うのは、 顧客が自分で翻訳を行いたいという場合だけにしましょう。
注記
Csv ファイルのエンコードがあなたの環境のロケール設定と異なる場合、 Csv アダプタで問題が発生することに注意しましょう。 これは PHP 自体のバグによるもので、このバグは PHP 6.0 で修正される予定です (http://bugs.php.net/bug.php?id=38471)。 したがって、Csv アダプタを使用する場合は (PHP の制約のせいで) それがロケール対応でないということに注意しなければなりません。
Gettext アダプタは、最もよく用いられるアダプタです。
Gettext は GNU が提供している翻訳フォーマットで、世界中で使用されています。
可読形式ではありませんが、便利なフリーウェア
(POEdit など)
が公開されています。
Zend_Translate
の Gettext アダプタは、PHP の gettext
拡張モジュールを使わずに実装しています。
PHP の gettext 拡張モジュールをインストールしていなくても
Gettext アダプタを使用することが可能です。
また、このアダプタはスレッドセーフですが、PHP の gettext
拡張モジュールは現状ではスレッドセーフでありません。
ほとんどの人たちは、このアダプタを使うことになるでしょう。 便利なツールを使用することで、高品質な翻訳が簡単に作成できます。 しかし、gettext のデータは機械が読める形式で保存されるので、 何らかのツールがないと人間が読むことはできません。
Ini アダプタは非常にシンプルなアダプタであり、 顧客が直接触ることができます。 INI ファイルは標準的なテキストエディタで読むことができますが、 エディタによっては utf8 文字セットをサポートしていないものもあります。
このアダプタを使うのは、 顧客が自分で翻訳を行いたいという場合だけにしましょう。 汎用的な翻訳ソースとしては使用しないようにしましょう。
PHP 5.3 でのリグレッション
PHP 5.3 より前のバージョンでは、parse_ini_file()
および parse_ini_string()
で
INI オプションのキーに非 ASCII 文字を問題なく使用できました。
しかし PHP 5.3 以降では、
非 ASCII 文字のキーはどちらの関数の返す配列からも黙って抜け落ちてしまいます。
UTF-8 や Latin-1 の文字をキーに使用している場合は、
INI アダプタを使うと翻訳が正しく機能しなくなってしまいました。
そのような場合は別のアダプタを使用することを推奨します。
Tbx アダプタは、内部ですでに TBX フォーマットの翻訳システムを使用している顧客などが使用します。 Tbx は標準の翻訳フォーマットではありませんが、 すでに多くの翻訳や翻訳済み文字列が存在します。 このアダプタを使用する場合は、 必要な文字列をすべて翻訳しなければならないことに気をつけましょう。 TBX は、まったく新しく作られた XML ベースのフォーマットです。 XML ファイルは人間が読むことも可能ですが、 パース速度は gettext ファイルより遅くなります。
このアダプタは、すでにこの形式の翻訳ファイルを持っている企業に最適です。 ファイルは可読形式で、システムに依存しない形式になります。
Tmx アダプタは、複数のシステムで同一の翻訳ソースを使用している顧客などが使用します。 また、翻訳ソースをシステムに依存しない形式にしたい場合にも使用します。 TMX は XML 形式のフォーマットで、業界標準になるといわれています。 XML ファイルは人間が読むことも可能ですが、 パース速度は gettext ファイルより遅くなります。
中規模から大規模の会社はこのアダプタを使用します。 ファイルは可読形式で、システムに依存しない形式になります。
Qt アダプタは、QtLinguist で作成した TS ファイル形式の翻訳を使用している顧客が使用します。 QT は XML 形式のフォーマットです。 XML ファイルは人間が読むことも可能ですが、 パース速度は gettext ファイルより遅くなります。
大手企業の中には QT フレームワークを使用したソフトウェアを作成しているところがあります。 ファイルは可読形式で、システムに依存しない形式になります。
Xliff アダプタは、XML ファイルを使用したいけれど TMX 用のツールを持っていないという顧客などが使用します。 XLIFF は XML 形式のフォーマットで、 TMX と関連していますがもうすこしシンプルです。機能も一部限定されています。 XML ファイルは人間が読むことも可能ですが、 パース速度は gettext ファイルより遅くなります。
中規模の会社はこのアダプタを使用します。 ファイルは可読形式で、システムに依存しない形式になります。
Zend_Translate
に、自作のアダプタクラスを組み込むこともできます。
これは、Zend_Translate
に組み込まれている標準のアダプタクラスと同様に使用できます。
Zend_Translate
で使用するアダプタクラスは、
Zend_Translate_Adapter
のサブクラスでなければなりません。
Zend_Translate_Adapter
は抽象クラスであり、翻訳に必要なものをすべて定義しています。
あなたがすべきことは、翻訳データの読み込み方法を定義することだけです。
名前の先頭に "Zend" をつけることができるのは Zend_Framework
内のパッケージだけです。Zend_Translate
で使うためのアダプタを自作する場合は、
その名前はたとえば "Company_Translate_Adapter_MyFormat" のようにする必要があります。
次のコードは、独自のアダプタクラスを実装する例を示すものです。
try { $translate = new Zend_Translate( array( 'adapter' => 'Company_Translate_Adapter_MyFormat', 'content' => '/path/to/translate.xx', 'locale' => 'en', 'myoption' => 'myvalue' ) ); } catch (Exception $e) { // ファイルが見つからない、アダプタクラスが存在しない、…… // などの一般的なエラー }
Zend_Translate
では、内部的に Zend_Cache
を使用して翻訳ソースの読み込みを高速化できます。
これは、多数の翻訳ソースを使用していたり
XML ベースの複雑なソース形式を使用していたりする場合に非常に便利です。
キャッシュ機能を使用するには、キャッシュオブジェクトを
Zend_Translate::setCache()
メソッドで渡します。
このメソッドの唯一のパラメータには
Zend_Cache
のインスタンスを指定します。
また、任意のアダプタを直接使用するには
setCache()
メソッドを使用します。
利便性を考慮して、静的メソッド
getCache()
、hasCache()
、clearCache()
および
removeCache()
も用意されています。
$cache = Zend_Cache::factory('Core', 'File', $frontendOptions, $backendOptions); Zend_Translate::setCache($cache); $translate = new Zend_Translate( array( 'adapter' => 'gettext', 'content' => '/path/to/translate.mo', 'locale' => 'en' ) ); // to clear the cache somewhere later in your code Zend_Translate::clearCache();
注記
キャッシュの設定は、アダプタや
Zend_Translate
のインスタンスを使用したり初期化したりする
前 に行わなければなりません。
さもないと、新たなソースを
addTranslation()
メソッドで追加するまで
翻訳ソースのキャッシュは行われません。
When the attached cache supports tagging you can set a own tag string by using the
option tag. This allows you do delete only the cache from this
single instance of Zend_Translate
. When you are not using this
option the default tag Zend_Translate
is used.
Using the option tag you must give the used tag to
clearCache()
to declare which tag you want to delete.
$cache = Zend_Cache::factory('Core', 'File', $frontendOptions, $backendOptions); Zend_Translate::setCache($cache); $translate = new Zend_Translate( array( 'adapter' => 'gettext', 'content' => '/path/to/translate.mo', 'locale' => 'en', 'tag' => 'MyTag' ) ); // somewhere later in your code Zend_Translate::clearCache('MyTag');