1# ArrayBuffer序列化和转移
2
3## 简介
4
5在应用开发中,为了避免主线程阻塞,提高应用性能,需要将一些耗时操作放在子线程中执行。此时,子线程就需要访问主线程中的数据。ArkTS采用了基于[消息通信的Actor并发模型](../arkts-utils/multi-thread-concurrency-overview.md#actor模型),不需要开发者去面对锁带来的一系列复杂偶发问题,同时并发度也相对较高。由于Actor并发模型具有内存隔离的特性,所以跨线程传输[普通对象](../arkts-utils/normal-object.md)时是使用拷贝的方式进行传递,就会导致这样一种现象:同一份数据,在主线程和子线程内分别占用一份内存。在数据量较小时,对应用性能不会有明显的影响;但是如果数据量较大时(比如传递一个音频或者视频数据),就可能会因为占用内存较多,内存资源不足,影响其他任务的执行。
6
7除了普通对象,ArkTS还支持在线程间传递ArrayBuffer对象。这是一种[可转移对象](../arkts-utils/transferabled-object.md),传递时不需要进行拷贝,所以不会出现同一份数据占用两份内存的情况。本篇文章将通过示例代码,对比两种数据对象在线程间传递时的性能数据,同时给出优化建议,使开发者可以更好地实现线程间大数据的传输。
8
9关于多线程的使用和原理,可参考[OpenHarmony多线程能力场景化示例实践](multi_thread_capability.md),本文将不再详细讲述。
10
11## 场景示例
12
13在应用开发中,会遇到需要进行图片处理的场景(比如需要调整一张图片的亮度、饱和度、大小等),为了避免阻塞主线程,可以将图片传递到子线程中执行这些操作。下面将分别通过拷贝和转移的方式,将图片传递到子线程中,并对比两种方式的性能数据。
14
15### 使用拷贝方式传递
16
17在ArkTS中,TaskPool传递ArrayBuffer数据时,默认使用转移的方式,通过调用task.setTransferList([])接口,可以切换成拷贝的方式。
18
19首先,实现一个需要在Task中执行的用于调整饱和度的接口。
20
21```typescript
22// code/Performance/PerformanceLibrary/feature/ThreadDataTransfer/src/main/ets/utils/TreadUtil.ets
23@Concurrent
24function adjustImageValue(arrayBuffer: ArrayBuffer, lastAdjustData: number, currentAdjustData: number): ArrayBuffer {
25  return execColorInfo(arrayBuffer, lastAdjustData, currentAdjustData);
26}
27```
28
29然后,通过拷贝的方式将图片数据传递到Task中,并在Task中将图片进行饱和度调整。
30
31```typescript
32// code/Performance/PerformanceLibrary/feature/ThreadDataTransfer/src/main/ets/utils/TreadUtil.ets
33// 创建Task,传入数据
34function createImageTask(arrayBuffer: ArrayBuffer, lastAdjustData: number, currentAdjustData: number, isParamsByTransfer: boolean): taskpool.Task {
35  let task: taskpool.Task = new taskpool.Task(adjustImageValue, arrayBuffer, lastAdjustData, currentAdjustData);
36  if (!isParamsByTransfer) { // 是否使用转移方式
37    task.setTransferList([]);
38  }
39  return task;
40}
41......
42// 创建taskNum个Task
43for (let i: number = 0; i < taskNum; i++) {
44  let arrayBufferSlice: ArrayBuffer = arrayBuffer.slice(arrayBuffer.byteLength / taskNum * i, arrayBuffer.byteLength / taskNum * (i + 1));
45  // 使用拷贝方式传入ArrayBuffer,所以isParamsByTransfer是false
46  taskPoolGroup.addTask(createImageTask(arrayBufferSlice, lastAdjustData, currentAdjustData, isParamsByTransfer));
47}
48let start: number = new Date().getTime();
49// 执行Task
50taskpool.execute(taskPoolGroup).then((data: ArrayBuffer[]) => {
51  if (callback !== undefined) {
52    let end : number = new Date().getTime();
53    AppStorage.set<String>('timeCost', util.format('%s s', ((end - start) / 60).toFixed(2).toString()));
54    callback(concatenateArrayBuffers(data));
55  }
56}).catch((e: BusinessError) => {
57  Logger.error(e.message);
58})
59......
60```
61
62最后,主线程接收到Task执行完毕后返回的ArrayBuffer数据,转换为PixelMap后在Image组件上显示。
63```typescript
64// code/Performance/PerformanceLibrary/feature/ThreadDataTransfer/src/main/ets/view/AdjustImageView.ets
65......
66// 将处理后的ArrayBuffer转换为PixelMap,并在Image组件上显示
67pixelMapProcessByTaskPool(this.pixelMap, this.lastAdjustData, this.currentAdjustData, this.currentTaskNum,
68  this.isParamsByTransfer, (data: ArrayBuffer) => {
69    if (this.pixelMap !== undefined) {
70    const newPixel: image.PixelMap = this.pixelMap;
71    newPixel.writeBufferToPixels(data).then(() => {
72      this.pixelMap = newPixel;
73      this.lastAdjustData = Math.round(value);
74      this.isPixelMapChanged = !this.isPixelMapChanged;
75      this.deviceListDialogController.close();
76      this.postState = true;
77    });
78  }
79});
80......
81```
82编译运行后,通过脚本工具抓取Trace并在SmartPerf Host中查看,如图1所示。其中,All Heap表示应用占用的内存,BeforePassParameter表示ArrayBuffer开始从主线程传递到子线程,AfterPassParameter表示子线程收到完整的ArrayBuffer数据。
83
84图1 拷贝方式Trace泳道图
85
86![image-20240702184652708](figures/thread_data_transfer_image_01.png)
87
88图1中可以看到,ArrayBuffer传递到TaskPool时,内存有2.5M的上升,耗时是19ms。
89
90### 使用转移方式传递
91
92在TaskPool中,传递ArrayBuffer数据,是默认使用转移方式的,所以在上面示例的基础上,去除task.setTransferList([])接口就可以实现。
93```typescript
94// code/Performance/PerformanceLibrary/feature/ThreadDataTransfer/src/main/ets/utils/TreadUtil.ets
95// 创建Task,传入数据
96function createImageTask(arrayBuffer: ArrayBuffer, lastAdjustData: number, currentAdjustData: number, isParamsByTransfer: boolean): taskpool.Task {
97  let task: taskpool.Task = new taskpool.Task(adjustImageValue, arrayBuffer, lastAdjustData, currentAdjustData);
98  if (!isParamsByTransfer) { // 是否使用转移方式
99    task.setTransferList([]);
100  }
101  return task;
102}
103......
104// 创建taskNum个Task
105for (let i: number = 0; i < taskNum; i++) {
106  let arrayBufferSlice: ArrayBuffer = arrayBuffer.slice(arrayBuffer.byteLength / taskNum * i, arrayBuffer.byteLength / taskNum * (i + 1));
107  // 使用转移方式传入ArrayBuffer,所以isParamsByTransfer是true
108  taskPoolGroup.addTask(createImageTask(arrayBufferSlice, lastAdjustData, currentAdjustData, isParamsByTransfer));
109}
110let start: number = new Date().getTime();
111// 执行Task
112taskpool.execute(taskPoolGroup).then((data: ArrayBuffer[]) => {
113  if (callback !== undefined) {
114    let end : number = new Date().getTime();
115    AppStorage.set<String>('timeCost', util.format('%s s', ((end - start) / 60).toFixed(2).toString()));
116    callback(concatenateArrayBuffers(data));
117  }
118}).catch((e: BusinessError) => {
119  Logger.error(e.message);
120})
121......
122```
123
124编译运行后,通过脚本工具抓取Trace并在SmartPerf Host中查看,如图2所示。
125
126图2 转移方式Trace泳道图
127
128![img](figures/thread_data_transfer_image_02.jpg)
129
130在图2中可以看到,ArrayBuffer传递到TaskPool时,内存并没有明显的变化,耗时只有5.2ms。
131
132### 性能对比
133
134通过对比上面两个场景中的Trace数据可以发现,相对于拷贝,转移的内存占用明显变少,耗时也减少了72%。
135
136使用拷贝方式传递数据时,会将ArrayBuffer对象拷贝一次。不仅会多占用了一部分内存,还会消耗一定的时间进行拷贝对象的序列化操作。而通过转移的方式传递数据时,并不需要将传递的对象拷贝一次,而是通过地址转移进行序列化,将ArrayBuffer的内存资源从原始的缓冲区分离出来,附加到子线程TaskPool创建的缓冲区对象中,也就是将ArrayBuffer的所有权从主线程移交给了子线程。
137
138所以,使用转移方式,可以减少线程间传递数据时的内存占用和CPU耗时。
139
140## 使用建议
141
142在ArkTS的多线程中传递数据时,应保证线程间的通信数据量尽可能的小,输入输出都要简单,避免传输影响耗时;而且并发任务要相对独立,不要频繁跨线程交互。上一部分的例子中,虽然将图片处理的操作放在了TaskPool子线程中,但是由于图片数据较大,处理时间还是较长,如图3所示。其中,BeforePassParameter表示ArrayBuffer开始从主线程传递到子线程,AfterPassParameter表示子线程收到完整的ArrayBuffer数据,AfterImageDarken表示计算(图片饱和度调节)结束。在图中可以看到,有5.8s的耗时,虽然在这段时间内并不会阻塞主线程中的操作,但是对于用户来说,等待时间依然较长。
143
144图3 子线程计算耗时泳道图
145
146![img](figures/thread_data_transfer_image_03.jpg)
147
148下面将通过示例代码说明如何进一步优化图片处理的时间。详细代码请参考[ThreadDataTransfer](https://gitee.com/openharmony/applications_app_samples/tree/master/code/Performance/PerformanceLibrary/feature/ThreadDataTransfer)149```typescript
150// code/Performance/PerformanceLibrary/feature/ThreadDataTransfer/src/main/ets/utils/TreadUtil.ets
151......
152// 根据传入的taskNum,创建对应数量的Task
153export async function pixelMapProcessByTaskPool(pixelMap: image.PixelMap, lastAdjustData: number, currentAdjustData: number, taskNum: number, isParamsByTransfer: boolean, callback?: Callback<ArrayBuffer>): Promise<void> {
154  let arrayBuffer: ArrayBuffer = await convertPixelMapToArrayBuffer(pixelMap);
155  let taskPoolGroup: taskpool.TaskGroup = new taskpool.TaskGroup();
156  for (let i: number = 0; i < taskNum; i++) {
157    let arrayBufferSlice: ArrayBuffer = arrayBuffer.slice(arrayBuffer.byteLength / taskNum * i, arrayBuffer.byteLength / taskNum * (i + 1));
158    taskPoolGroup.addTask(createImageTask(arrayBufferSlice, lastAdjustData, currentAdjustData, isParamsByTransfer));
159  }
160  let start: number = new Date().getTime();
161  taskpool.execute(taskPoolGroup).then((data: ArrayBuffer[]) => {
162    if (callback !== undefined) {
163      let end : number = new Date().getTime();
164      AppStorage.set<String>('timeCost', util.format('%s s', ((end - start) / 60).toFixed(2).toString()));
165      // 将Task处理完成的数据合并在一个ArrayBuffer中
166      callback(concatenateArrayBuffers(data));
167    }
168  }).catch((e: BusinessError) => {
169    Logger.error(e.message);
170  })
171}
172```
173在这段代码中,将图片转换为ArrayBuffer后,并没有直接传递到子线程中,而是先进行了切片处理,分成taskNum个独立的ArrayBuffer。之后分别传入到taskNum个Task中,并通过TaskGroup统一管理。在图片饱和度调节完成后,再将taskNum个处理结果拼接成一个ArrayBuffer,并转换为PixelMap在Image组件上显示。此示例代码也是使用了转移方式进行传递,因为上一部分的示例已经说明了转移比拷贝的方式更加高效,所以这里不再进行重复的对比。编译运行代码后,通过脚本工具抓取Trace并在SmartPerf Host中查看,如图4所示。
174
175图4 图片切成3份处理后的泳道图
176
177![image-20240702185135759](figures/thread_data_transfer_image_04.png)
178
179通过图4可以看到,将原ArrayBuffer切成3段,分别放在3个子线程中处理,图片饱和度调节的操作耗时只有3.4s,计算时间减少了44%。因为有3个线程在同时进行操作,大大减少了计算的耗时。但是,这并不代表可以随意增加Task的数量。由于在TaskPool中,并不是创建了多少个Task,就会有多少个Task在同时执行。随着Task的增多,同时执行的线程也会越多,并发执行的任务就会增多,CPU的占用率就会升高,从而影响到其他需要CPU计算的任务。虽然在硬件配置高的设备上表现不明显,但是对于低配置的设备,影响会较大。下面的表格,列出了示例中不同数量Task时的CPU耗时供开发者参考。
180
181| **任务数** | **实际子线程数** | **序列化时间(ms)** | **计算时间(s)** |
182| ---------- | ---------------- | -------------------- | ----------------- |
183| 1          | 1                | 3.30792              | 3.967             |
184| 2          | 2                | 2.62345              | 2.646             |
185| 3          | 3                | 6.11258              | 1.875             |
186| 4          | 3                | 7.25295              | 2.579             |
187| 5          | 3                | 2.7032               | 2.266             |
188| 6          | 3                | 3.213                | 1.970             |
189| 7          | 3                | 5.260                | 2.096             |
190| 8          | 3                | 2.704                | 2.067             |
191| 9          | 3                | 3.986                | 2.116             |
192| 10         | 5                | 3.811                | 1.844             |
193| 15         | 5                | 2.879                | 2.079             |
194| 20         | 5                | 3.526                | 2.015             |
195
196因此,在分段传输大数据时,需要合理调整子线程的数量和传入子线程的数据量,加快子线程处理速度,同时减少对其他功能的影响,提升用户的应用体验。
197
198## 相关示例
199
200[ArrayBuffer序列化和转移示例代码](https://gitee.com/openharmony/applications_app_samples/tree/master/code/Performance/PerformanceLibrary/feature/ThreadDataTransfer)