]> git.proxmox.com Git - ceph.git/blame - ceph/src/rapidjson/doc/pointer.zh-cn.md
buildsys: change download over to reef release
[ceph.git] / ceph / src / rapidjson / doc / pointer.zh-cn.md
CommitLineData
31f18b77
FG
1# Pointer
2
3(本功能于 v1.1.0 发布)
4
5JSON Pointer 是一个标准化([RFC6901])的方式去选取一个 JSON Document(DOM)中的值。这类似于 XML 的 XPath。然而,JSON Pointer 简单得多,而且每个 JSON Pointer 仅指向单个值。
6
7使用 RapidJSON 的 JSON Pointer 实现能简化一些 DOM 的操作。
8
9[TOC]
10
11# JSON Pointer {#JsonPointer}
12
13一个 JSON Pointer 由一串(零至多个)token 所组成,每个 token 都有 `/` 前缀。每个 token 可以是一个字符串或数字。例如,给定一个 JSON:
14~~~javascript
15{
16 "foo" : ["bar", "baz"],
17 "pi" : 3.1416
18}
19~~~
20
21以下的 JSON Pointer 解析为:
22
231. `"/foo"` → `[ "bar", "baz" ]`
242. `"/foo/0"` → `"bar"`
253. `"/foo/1"` → `"baz"`
264. `"/pi"` → `3.1416`
27
28要注意,一个空 JSON Pointer `""` (零个 token)解析为整个 JSON。
29
30# 基本使用方法 {#BasicUsage}
31
32以下的代码范例不解自明。
33
34~~~cpp
35#include "rapidjson/pointer.h"
36
37// ...
38Document d;
39
40// 使用 Set() 创建 DOM
41Pointer("/project").Set(d, "RapidJSON");
42Pointer("/stars").Set(d, 10);
43
44// { "project" : "RapidJSON", "stars" : 10 }
45
46// 使用 Get() 访问 DOM。若该值不存在则返回 nullptr。
47if (Value* stars = Pointer("/stars").Get(d))
48 stars->SetInt(stars->GetInt() + 1);
49
50// { "project" : "RapidJSON", "stars" : 11 }
51
52// Set() 和 Create() 自动生成父值(如果它们不存在)。
53Pointer("/a/b/0").Create(d);
54
55// { "project" : "RapidJSON", "stars" : 11, "a" : { "b" : [ null ] } }
56
57// GetWithDefault() 返回引用。若该值不存在则会深拷贝缺省值。
58Value& hello = Pointer("/hello").GetWithDefault(d, "world");
59
60// { "project" : "RapidJSON", "stars" : 11, "a" : { "b" : [ null ] }, "hello" : "world" }
61
62// Swap() 和 Set() 相似
63Value x("C++");
64Pointer("/hello").Swap(d, x);
65
66// { "project" : "RapidJSON", "stars" : 11, "a" : { "b" : [ null ] }, "hello" : "C++" }
67// x 变成 "world"
68
69// 删去一个成员或元素,若值存在返回 true
70bool success = Pointer("/a").Erase(d);
71assert(success);
72
73// { "project" : "RapidJSON", "stars" : 10 }
74~~~
75
76# 辅助函数 {#HelperFunctions}
77
78由于面向对象的调用习惯可能不符直觉,RapidJSON 也提供了一些辅助函数,它们把成员函数包装成自由函数。
79
80以下的例子与上面例子所做的事情完全相同。
81
82~~~cpp
83Document d;
84
85SetValueByPointer(d, "/project", "RapidJSON");
86SetValueByPointer(d, "/stars", 10);
87
88if (Value* stars = GetValueByPointer(d, "/stars"))
89 stars->SetInt(stars->GetInt() + 1);
90
91CreateValueByPointer(d, "/a/b/0");
92
93Value& hello = GetValueByPointerWithDefault(d, "/hello", "world");
94
95Value x("C++");
96SwapValueByPointer(d, "/hello", x);
97
98bool success = EraseValueByPointer(d, "/a");
99assert(success);
100~~~
101
102以下对比 3 种调用方式:
103
1041. `Pointer(source).<Method>(root, ...)`
1052. `<Method>ValueByPointer(root, Pointer(source), ...)`
1063. `<Method>ValueByPointer(root, source, ...)`
107
108# 解析 Pointer {#ResolvingPointer}
109
110`Pointer::Get()` 或 `GetValueByPointer()` 函数并不修改 DOM。若那些 token 不能匹配 DOM 里的值,这些函数便返回 `nullptr`。使用者可利用这个方法来检查一个值是否存在。
111
112注意,数值 token 可表示数组索引或成员名字。解析过程中会按值的类型来匹配。
113
114~~~javascript
115{
116 "0" : 123,
117 "1" : [456]
118}
119~~~
120
1211. `"/0"` → `123`
1222. `"/1/0"` → `456`
123
124Token `"0"` 在第一个 pointer 中被当作成员名字。它在第二个 pointer 中被当作成数组索引。
125
126其他函数会改变 DOM,包括 `Create()`、`GetWithDefault()`、`Set()`、`Swap()`。这些函数总是成功的。若一些父值不存在,就会创建它们。若父值类型不匹配 token,也会强行改变其类型。改变类型也意味着完全移除其 DOM 子树的内容。
127
128例如,把上面的 JSON 解译至 `d` 之后,
129
130~~~cpp
131SetValueByPointer(d, "1/a", 789); // { "0" : 123, "1" : { "a" : 789 } }
132~~~
133
134## 解析负号 token
135
136另外,[RFC6901] 定义了一个特殊 token `-` (单个负号),用于表示数组最后元素的下一个元素。 `Get()` 只会把此 token 当作成员名字 '"-"'。而其他函数则会以此解析数组,等同于对数组调用 `Value::PushBack()` 。
137
138~~~cpp
139Document d;
140d.Parse("{\"foo\":[123]}");
141SetValueByPointer(d, "/foo/-", 456); // { "foo" : [123, 456] }
142SetValueByPointer(d, "/-", 789); // { "foo" : [123, 456], "-" : 789 }
143~~~
144
145## 解析 Document 及 Value
146
147当使用 `p.Get(root)` 或 `GetValueByPointer(root, p)`,`root` 是一个(常数) `Value&`。这意味着,它也可以是 DOM 里的一个子树。
148
149其他函数有两组签名。一组使用 `Document& document` 作为参数,另一组使用 `Value& root`。第一组使用 `document.GetAllocator()` 去创建值,而第二组则需要使用者提供一个 allocator,如同 DOM 里的函数。
150
151以上例子都不需要 allocator 参数,因为它的第一个参数是 `Document&`。但如果你需要对一个子树进行解析,就需要如下面的例子般提供 allocator:
152
153~~~cpp
154class Person {
155public:
156 Person() {
157 document_ = new Document();
158 // CreateValueByPointer() here no need allocator
159 SetLocation(CreateValueByPointer(*document_, "/residence"), ...);
160 SetLocation(CreateValueByPointer(*document_, "/office"), ...);
161 };
162
163private:
164 void SetLocation(Value& location, const char* country, const char* addresses[2]) {
165 Value::Allocator& a = document_->GetAllocator();
166 // SetValueByPointer() here need allocator
167 SetValueByPointer(location, "/country", country, a);
168 SetValueByPointer(location, "/address/0", address[0], a);
169 SetValueByPointer(location, "/address/1", address[1], a);
170 }
171
172 // ...
173
174 Document* document_;
175};
176~~~
177
178`Erase()` 或 `EraseValueByPointer()` 不需要 allocator。而且它们成功删除值之后会返回 `true`。
179
180# 错误处理 {#ErrorHandling}
181
182`Pointer` 在其建构函数里会解译源字符串。若有解析错误,`Pointer::IsValid()` 返回 `false`。你可使用 `Pointer::GetParseErrorCode()` 和 `GetParseErrorOffset()` 去获取错信息。
183
184要注意的是,所有解析函数都假设 pointer 是合法的。对一个非法 pointer 解析会做成断言失败。
185
186# URI 片段表示方式 {#URIFragment}
187
188除了我们一直在使用的字符串方式表示 JSON pointer,[RFC6901] 也定义了一个 JSON Pointer 的 URI 片段(fragment)表示方式。URI 片段是定义于 [RFC3986] "Uniform Resource Identifier (URI): Generic Syntax"。
189
190URI 片段的主要分别是必然以 `#` (pound sign)开头,而一些字符也会以百分比编码成 UTF-8 序列。例如,以下的表展示了不同表示法下的 C/C++ 字符串常数。
191
192字符串表示方式 | URI 片段表示方式 | Pointer Tokens (UTF-8)
193----------------------|-----------------------------|------------------------
194`"/foo/0"` | `"#/foo/0"` | `{"foo", 0}`
195`"/a~1b"` | `"#/a~1b"` | `{"a/b"}`
196`"/m~0n"` | `"#/m~0n"` | `{"m~n"}`
197`"/ "` | `"#/%20"` | `{" "}`
198`"/\0"` | `"#/%00"` | `{"\0"}`
199`"/€"` | `"#/%E2%82%AC"` | `{"€"}`
200
201RapidJSON 完全支持 URI 片段表示方式。它在解译时会自动检测 `#` 号。
202
203# 字符串化
204
205你也可以把一个 `Pointer` 字符串化,储存于字符串或其他输出流。例如:
206
207~~~
208Pointer p(...);
209StringBuffer sb;
210p.Stringify(sb);
211std::cout << sb.GetString() << std::endl;
212~~~
213
214使用 `StringifyUriFragment()` 可以把 pointer 字符串化为 URI 片段表示法。
215
216# 使用者提供的 tokens {#UserSuppliedTokens}
217
218若一个 pointer 会用于多次解析,它应该只被创建一次,然后再施于不同的 DOM ,或在不同时间做解析。这样可以避免多次创键 `Pointer`,节省时间和内存分配。
219
220我们甚至可以再更进一步,完全消去解析过程及动态内存分配。我们可以直接生成 token 数组:
221
222~~~cpp
223#define NAME(s) { s, sizeof(s) / sizeof(s[0]) - 1, kPointerInvalidIndex }
224#define INDEX(i) { #i, sizeof(#i) - 1, i }
225
226static const Pointer::Token kTokens[] = { NAME("foo"), INDEX(123) };
227static const Pointer p(kTokens, sizeof(kTokens) / sizeof(kTokens[0]));
228// Equivalent to static const Pointer p("/foo/123");
229~~~
230
231这种做法可能适合内存受限的系统。
232
233[RFC3986]: https://tools.ietf.org/html/rfc3986
234[RFC6901]: https://tools.ietf.org/html/rfc6901