[Notes/Domino] 設計解析講座: リッチテキストアイテム解析の基礎
リッチテキストアイテムは、ノーツの最も特徴的なアイテムです。文書のみならず、設計の様々なところでも使用されていますので、これが解析できるようになれば、ノーツの理解がより深まると思います。
リッチテキストとは
リッチテキストは、簡単に一言で言うと「複数の構造体が集まったもの」です。リッチテキストというと何か難しそうなイメージがあるかもしれませんが、実は仕組み自体はとってもシンプルで、構造体の「集まり方」に多少の規則があるに過ぎません。
リッチテキストの中にある構造体は、ノーツでは「CDレコード」と呼びます。CDレコードは、すべて「CD~」で始まる名前となっています。
CD とは「Compound Document」あるいは「Composite Data」の略で、日本語的には「複合ドキュメント」「複合データ」となります。ここからも、構造体が「複合」されたデータであることがわかるかと思います。
リッチテキスト形式が使用されている箇所
リッチテキスト形式が使われているアイテムには、以下のようなものがあります。$BODY、$ACTIONS が特に重要ですね。
- フォーム・サブフォーム・ページのデータ($BODY、$HTMLCode、$Info)
- アクションバー・ボタン($ACTIONS、$V5ACTIONS)
- フレームセットのデータ($Frameset)
- エージェントアクション、検索条件($AssistAction、$AssistQuery)
- ナビゲータのデータ($ViewMapDataset、$ViewMapLayout、$NavImagemap)
注意したいのは、同じリッチテキスト形式のものでも、アイテム種類によって構造体の種類が違う場合があることです。たとえば、$BODY(TYPE_COMPOSITE)では、シグニチャ(IDみたいなもの)が 129 の構造体は CDPARAGRAPH ですが、$AssistQuery(TYPE_QUERY)では CDQUERYHEADER になります。
リッチテキスト形式が使われているアイテムは、以下の4種類に分類されます。この種類ごとに構造体が違うということを留意してください。
- TYPE_COMPOSITE(1)
- TYPE_QUERY(15)
- TYPE_ACTION(16)
- TYPE_VIEWMAP_DATASET(18)、TYPE_VIEWMAP_LAYOUT(19)
コールバック関数が使える言語の場合
C、C++、VB など、コールバック関数が使える言語の場合、EnumCompositeBuffer 関数を使うと、簡単にCDレコードを切り出してくれるようです。ちょうど SAX パーサのように、CDレコードが見つかるたびにコールバック関数を呼び出すのではないかと思います。(まあ、管理人は使ったことが無いので、想像ですが。)
しかし、LotusScript の場合、コールバック関数が使えないため、この関数を使うことができません……(x_x)。LotusScript ってこういうところがイケてないんですよね。せめて VB6 相当の機能はすべて入れて欲しいものです。
とまあ、愚痴っても仕方ないので、別の方法を考えましょう。
リッチテキストの構造
リッチテキストを LotusScript で読み解くには、その詳細な構造を知る必要があります。リッチテキストの構造については、APIドキュメントの「Chapter 7-1. Introduction to Rich Text」の「Low-Level Structure of Rich Text」に詳述されています。かいつまんで説明すると、
- リッチテキストは、構造体(CDレコード)が集まったものである。
- リッチテキストは、同名のアイテムが複数個になる場合がある。
- 1つのアイテムは最大64KBまでだが、概ね40KBくらいにすることが推奨される。
- CDレコードには先頭にヘッダがあり、ヘッダには BSIG、WSIG、LSIG の3タイプがある。
- CDレコードは、必ず偶数アドレスから始まる。
というような感じです。1~3 は、これまで説明してきたことですね。重要なのは、4 と 5 です。
ヘッダについては、ods.h のコメントを見るとわかりやすいです。
0 1
+---------+---------+
| Sig | Length | Byte signature(BSIG)
+---------+---------+
0 1 2 3
+---------+---------+---------+---------+
| Sig | ff | Length | Word signature(WSIG)
+---------+---------+---------+---------+
0 1 2 3 4 5
+---------+---------+---------+---------+---------+---------+
| Sig | 00 | Length | DWord signature(LSIG)
+---------+---------+---------+---------+---------+---------+
つまり、
- 先頭の1バイトは、シグニチャ(IDみたいのもの)であり、ここを見ればCDレコードの種類がわかる。
- 2バイト目が「FF」なら、3~4 バイト目の値がそのCDレコードの長さである。
- 2バイト目が「00」なら、3~6 バイト目の値がそのCDレコードの長さである。
- 2バイト目が「FF」でも「00」でもなければ、2バイト目がそのCDレコードの長さである。
というわけです。したがって、解析プログラムでは、以下 1~3 をアイテムの長さ分だけ繰り返せばよいのです。
- CDレコードのヘッダからシグニチャを取得し、読み取りたいCDレコードのシグニチャであれば、解析処理を行う。
- CDレコードのヘッダから、CDレコードの長さを取得し(長さの取得は上記参照)、長さ分アドレスをインクリメントする。
- インクリメントした結果が奇数アドレスなら、アドレスに1を加算する。
サンプル: アクションボタン名の解析
では、いよいよ実際のコードです。ここでは例として、デフォルトビューのアクションボタン名を取得する処理を書いてみます。
Const WORDLEN = 65534
Const OS_TRANSLATE_NATIVE_TO_LMBCS = 0
Const OS_TRANSLATE_LMBCS_TO_NATIVE = 1
Const NOTESDLL = "nnotes.dll"
Const SIG_CD_ACTION = 190
Type BLOCKID
hPool As Long
Block As Integer
End Type
Declare Function NSFItemInfo Lib NOTESDLL (Byval hNote As Long, Byval ItemName As Any, _
Byval NameLen As Integer, ItemBlockid As BLOCKID, ValueDatatype As Integer, _
ValueBlockid As BLOCKID, ValueLen As Long) As Integer
Declare Function NSFItemInfoNext Lib NOTESDLL (Byval hNote As Long, Byval hPool As Long, _
Byval Block As Integer, Byval ItemName As Any, Byval NameLen As Integer, ItemBlockid As BLOCKID, _
ValueDatatype As Integer, ValueBlockid As BLOCKID, ValueLen As Long) As Integer
Declare Function OSLockObject Lib NOTESDLL (Byval hHandle As Long) As Long
Declare Function OSUnlockObject Lib NOTESDLL (Byval hHandle As Long) As Integer
Declare Function OSTranslate Lib NOTESDLL (Byval TranslateMode As Integer, _
Byval InData As String, Byval InLength As Long, Byval OutData As String, _
Byval OutLength As Long) As Integer
Declare Function OSLoadString Lib NOTESDLL (Byval hModule As Long, Byval StringCode As Long, _
Byval retBuffer As String, Byval BufferLength As Integer) As Integer
Declare Sub RtlMoveMemoryString Lib "kernel32" Alias "RtlMoveMemory" (Byval hpvDest As String, _
Byval hpvSource As Long, Byval cbCopy As Long)
Declare Sub RtlMoveMemory Lib "kernel32" Alias "RtlMoveMemory" (hpvDest As Any, Byval hpvSource As Long, _
Byval cbCopy As Long)
Sub Initialize
Dim ss As New NotesSession
Dim db As NotesDatabase
Dim doc As NotesDocument
Dim ItemBlockid As BLOCKID
Dim ValueBlockid As BLOCKID
Dim strItemName As String
Dim lngLen As Long
Dim lngAddr As Long
Dim lngCnt As Long
Dim lngCDLen As Long
Dim intDataType As Integer
Dim intRet As Integer
Dim intSig As Integer
Dim intFlg As Integer
Set db = ss.CurrentDatabase
Set doc = db.GetDocumentByID("FFFF0008")
If doc Is Nothing Then
Msgbox "文書が見つかりません", 0, "エラー"
Exit Sub
End If
strItemName = "$ACTIONS"
intRet = NSFItemInfo(doc.handle, strItemName, Lenbp(strItemName), ItemBlockid, intDataType, ValueBlockid, lngLen)
If intRet <> 0 Then
Msgbox APIGetError(intRet), 0, "エラー"
Exit Sub
End If
Do
'メモリをロック
lngAddr = OSLockObject(ValueBlockid.hPool) + Val("&B" & Right(Bin$(ValueBlockid.Block), 16) & "&")
lngAddr = lngAddr + 2 '最初の2バイトはアイテムタイプなので読み飛ばす
lngLen = lngLen - 2 'アイテムタイプを除いた値のサイズ
lngCnt = 0
intFlg = 0
Do
Call RtlMoveMemory(intSig, lngAddr, 1)
Call RtlMoveMemory(intFlg, lngAddr + 1, 1)
Select Case intFlg
Case &H00 'DWORD Signature
If (lngCnt + 2 + 4) => lngLen Then Exit Do
Call RtlMoveMemory(lngCDLen, lngAddr + 2, 4)
'(↓ここに分析用の処理を記述)
Select Case intSig
Case SIG_CD_ACTION
Call ReadCDAction(lngAddr)
End Select
'(↑ここに分析用の処理を記述)
Case &HFF 'WORD Signature
If (lngCnt + 2 + 2) => lngLen Then Exit Do
Call RtlMoveMemory(lngCDLen, lngAddr + 2, 2)
'(↓ここに分析用の処理を記述)
Select Case intSig
Case SIG_CD_ACTION
Call ReadCDAction(lngAddr)
End Select
'(↑ここに分析用の処理を記述)
Case Else 'BYTE Signature
lngCDLen = intFlg
'(↓ここに分析用の処理を記述)
'(↑ここに分析用の処理を記述)
End Select
If intSig <= 0 Or lngCDLen <= 0 Then Exit Do '念のため
'CDレコードのサイズ分足す
lngAddr = lngAddr + lngCDLen
lngCnt = lngCnt + lngCDLen
'偶数アドレスにする
lngAddr = lngAddr + (lngAddr And 1&)
lngCnt = lngCnt + (lngCnt And 1&)
Loop While lngCnt < lngLen
'メモリロックを解除
Call OSUnlockObject(ValueBlockid.hPool)
Loop While NSFItemInfoNext(doc.handle, ItemBlockid.hPool, ItemBlockid.Block, strItemName, Lenbp(strItemName), _
ItemBlockid, intDataType, ValueBlockid, lngLen) = 0
End Sub
Function APITranslate(Byval intMode As Integer, Byval strBuf As String) As String
Dim strOut As String
strOut = Space$(WORDLEN)
Call OSTranslate(intMode , strBuf, Lenbp(strBuf) - 1, strOut, WORDLEN - 1)
APITranslate = Strleft(strOut & Chr(0), Chr(0))
End Function
Function APIGetError(Byval intErrCode As Integer) As String
Dim strIn As String
Dim strOut As String
Dim intCode As Integer
strIn = Space$(255)
strOut = Space$(255)
intCode = intErrCode And &h3FFF
Call OSLoadString(0, intCode, strIn, Lenbp(strIn) - 1)
strOut = APITranslate(OS_TRANSLATE_LMBCS_TO_NATIVE, strIn)
APIGetError = Trim(strOut)
End Function
Sub APIMoveMemory(varVal As Variant, lngAddr As Long, Byval lngLen As Long)
Call RtlMoveMemory(varVal, lngAddr, lngLen)
lngAddr = lngAddr + lngLen
End Sub
Sub APIMoveMemoryString(strVal As String, lngAddr As Long, Byval lngLen As Long)
strVal = Space$(lngLen + 1)
Call RtlMoveMemoryString(strVal, lngAddr, lngLen)
lngAddr = lngAddr + lngLen
End Sub
Sub ReadCDAction(Byval lngAddr As Long)
Dim strName As String
Dim intSig As Integer
Dim lngLen As Long
Dim intType As Integer
Dim intIconIndex As Integer
Dim lngFlags As Long
Dim lngTitleLen As Long
Dim lngFormulaLen As Long
Dim lngShareId As Long
On Error Goto ERR_CASE
Call APIMoveMemory(intSig, lngAddr, 2)
Call APIMoveMemory(lngLen, lngAddr, 4)
Call APIMoveMemory(intType, lngAddr, 2)
Call APIMoveMemory(intIconIndex, lngAddr, 2)
Call APIMoveMemory(lngFlags, lngAddr, 4)
Call APIMoveMemory(lngTitleLen, lngAddr, 2)
Call APIMoveMemory(lngFormulaLen, lngAddr, 2)
Call APIMoveMemory(lngShareId, lngAddr, 4)
'アクション名
If lngTitleLen > 0 Then
Call APIMoveMemoryString(strName, lngAddr, lngTitleLen)
Msgbox APITranslate(OS_TRANSLATE_LMBCS_TO_NATIVE, strName)
End If
Exit Sub
ERR_CASE:
Msgbox "Error - " & Getthreadinfo(1) & " Line:" & Cstr(Erl) & " Msg:" & Error$, 0, "Error"
Exit Sub
End Sub
キモの部分は、「Do ~ Loop While lngCnt < lngLen」の部分です。ここでリッチテキストの規則どおりに読み取っているのがおわかりいただけるでしょうか。このループ内では、CDレコードが見つかるたびにSelect文が評価されますので、解析したいCDレコードのシグネチャ(intSeg)の値が来たら、CDレコード解析処理に入ってやればよいのです。
アクションボタンは、CDACTION という構造体で定義されます。CDACTION 構造体の定義は、以下のとおりです。
typedef struct {
LSIG Header; /* Signature and Length */
WORD Type; /* Type of action (formula, script, etc.) */
WORD IconIndex; /* Index into array of icons */
DWORD Flags; /* Action flags */
WORD TitleLen; /* Length (in bytes) of action's title */
WORD FormulaLen;/* Length (in bytes) of "hide when" formula */
DWORD ShareId; /* Share ID of the Shared Action */
/* Variable portion of the record:
TitleLen bytes of action's title
Action data: (Header.Length - TitleLen - FormulaLen) bytes
of formula, script, etc.
FormulaLen bytes of "hide when" formula */
} CDACTION;
上記のとおり、構造体の後ろに、可変長でアクション名、アクションデータ(式、スクリプトなど)、非表示式が続く構造になっています。これを ReadCDAction サブルーチンで読み取っています。(今回は処理を簡単にするために、アクション名だけを取得しています。)
解析処理自体は、前回と似てますね。CDレコードさえ切り出してやれば、あとは構造体の解析と何ら変わらないということがおわかりいただけるかと思います。
以上のようにすれば、リッチテキスト内のどんなデータでも解析することが可能です(実際にはいろいろと面倒なところもありますが)。LotusScript だけでリッチテキストから自由にデータを取れると、ちょっと楽しくなりませんか?
(おまけ)LSIG って……
賢明な方は「CDACTION のヘッダは LSIG(DWORD Signature)になっているのに、なんで WORD Signature (Case &HFF)のところにも処理が書いてあるの?」というところにお気づきになったかもしれません。これは、LSIG であっても、CDレコードのサイズが64KB(WORDのサイズ)以下であれば、WSIG 扱いになるためです(Length は4バイトで変わりません)。なので、ヘッダが LSIG であっても、WSIG 用の処理も書く必要があります。
ここで1つ疑問が発生します。「アイテムのサイズは基本64KBまでなのに、LSIG になることってあるの?」
……すみません、この疑問に対する回答は、管理人は持ちあわせていませんorz 試しに、64KBを超えるスクリプトを書いてみたりしたのですが、やっぱり LSIG にはならず、スクリプト用の別のアイテムができてしまい、Designer でアクションを選択しようとすると赤い画面で不正終了する始末(R6.5.4の場合)……。う~ん、ノーツは謎が多すぎる……。

コメント
コメントはありません
※コメントは承認制となっております。管理者が承認するまで表示されません。申し訳ありませんが、投稿が表示されるまでしばらくお待ちください。