设计高性能无限滚动加载,了解高效页面秘密

UX Planet论坛上有过这么一篇热门文章: Infinite Scrolling Best Practices,它从UX角度分析了无限滚动加载的设计实践。

无限滚动加载在互联网上到处都有应用:
豆瓣首页是一个,Facebook的Timeline是一个,Tweeter的话题列表也是一个。当你向下滚动,新的内容就神奇的“无中生有”了。这是一个得到广泛赞扬的用户体验。

无限滚动加载背后的技术挑战其实比想象中要多不少。尤其是要考虑页面性能,需要做到极致。
本文通过代码实例,来实现一个无限滚动加载效果。更重要的是,在实现过程中,对于页面性能的分析和处理力图做到最大化,希望对读者有所启发,同时也欢迎与我讨论。

性能测量

在开启我们的代码之前,有必要先了解一下常用的性能测量手段:

1)使用window.performance

HTML5带来的performance API功能强大。我们可以使用其performance.now()精确计算程序执行时间。performance.now()与Date.now()不同的是,返回了以微秒(百万分之一秒)为单位的时间,更加精准。并且与 Date.now() 会受系统程序执行阻塞的影响不同,performance.now() 的时间是以恒定速率递增的,不受系统时间的影响(系统时间可被人为或软件调整)。
同时,也可以使用performance.mark()标记各种时间戳(就像在地图上打点),保存为各种测量值(测量地图上的点之间的距离),便可以批量地分析这些数据了。

2)使用console.time方法与console.timeEnd方法

其中console.time方法用于标记开始时间,console.timeEnd方法用于标记结束时间,并且将结束时间与开始时间之间经过的毫秒数在控制台中输出。

3)使用专业的测量工具/平台:jsPerf

这次实现中,我们使用第二种方法,因为它已经完全可以满足我们的需求,且兼容性更加全面。

整体思路和方案设计

我们要实现的页面样例如图,

它能够做到无限下拉加载内容。我把红线标出的部分叫做一个block-item,后续也都用这种命名。

1)关于设计方案,肯定第一个最基本、最朴素的思想是下拉到底部之后发送ajax异步请求,成功之后的回调里进行页面拼接。

2)但是观察页面布局,很明显图片较多,每一个block-item区块都有一张配图。当加载后的内容插入到页面中时,浏览器就开始获取图片。这意味着所有的图像同时下载,浏览器中的下载通道将被占满。同时,由于内容优先于用户浏览而加载,所以可能被迫下载底部那些永远也不会被用户浏览到的图像。
所以,我们需要设计一个懒加载效果,使得页面速度更快,并且节省用户的流量费用和延长电池寿命。

3)上一条提到的懒加载实现上,为了避免到真正的页面底部时才进行加载和渲染,而造成用户较长时间等待。我们可以设置一个合理阈值,在用户滚动到页面底部之前,先进行提前加载。

4)另外,页面滚动的事件肯定是需要监听的。同时,页面滚动问题也比较棘手,后面将专为滚动进行分析。

5)DOM操作我们知道是及其缓慢而低效的,有兴趣的同学可以研究一下jsPerf上一些经典的benchmark,比如这篇。关于造成这种缓慢的原因,社区上同样有很多文章有过分析,这里就不再深入。但我想总结并补充的是:DOM操作,光是为了找一个节点,就从本质上比简单的检索内存中的值要慢。一些DOM操作还需要重新计算样式来读取或检索一个值。更突出的问题在于:DOM操作是阻塞的,所以当有一个DOM操作在进行时,其他的什么都不能做,包括用户与页面的交互(除了滚动)。这是一个极度伤害用户体验的事实。

所以,在下面的效果实现中,我采用了大量“不可思议”的DOM缓存,甚至极端的缓存everything。当然,这样做的收益也在最后部分有所展现。

滚动问题

滚动问题不难想象在于高频率的触发滚动事件处理上。具我亲测,在极端case下,滚动及其卡顿。即使滚动不卡顿,你可以打开Chrome控制台发现,帧速率也非常慢。关于帧速率的问题,我们有著名的16.7毫秒理论。关于这个时间分析,社区上也有不少文章阐述,这里不再展开。

针对于此,有很多读者会立刻想到“截流和防抖动函数”(Throttle和Debounce)。
简单总结一下:

1)Throttle允许我们限制激活响应的数量。我们可以限制每秒回调的数量。反过来,也就是说在激活下一个回调之前要等待多少时间;

2)Debounce意味着当事件发生时,我们不会立即激活回调。相反,我们等待一定的时间并检查相同的事件是否再次触发。如果是,我们重置定时器,并再次等待。如果在等待期间没有发生相同的事件,我们就立即激活回调。

具体这里就不代码实现了。原理明白之后,应该不难写出。

但是我这里想从移动端主要浏览器处理滚动的方式入手,来思考这个问题:

1)在Android机器上,用户滚动屏幕时,滚动事件高频率发生——在Galaxy-SIII手机上,大约频率是一秒一百次。这意味着,滚动处理函数也被调用了数百次,而这些又都是成本较大的函数。

2)在Safari浏览器上,我们遇到的问题恰恰是相反的:用户每次滚动屏幕时,滚动事件只在滚动动画停止时才触发。当用户在iPhone上滚动屏幕时,不会运行更新界面的代码(滚动停止时才会运行一次)。

另外,我想也许会有读者想到rAf(requestAnimationFrame),但是据我观察,很多前端其实并不明白requestAnimationFrame技术的原理和解决的问题。只是机械地把动画性能、掉帧问题甩到这么一个名词上。在真实项目中,也没有亲自实现过,更不要说考虑requestAnimationFrame的兼容性情况了。这里场景我并不会使用rAf,因为。setTimeout的定时器值推荐最小使用16.7ms(原因请去社区上找答案,不再细讲),我们这里并不会超过这个限制,并且考虑兼容性。关于这项技术的使用,如果有问题,欢迎留言讨论。

基于以上,我的解决方案是既不同于Throttle,也不同于Debounce,但是和这两个思想,尤其是Throttle又比较类似:把滚动事件替换为一个带有计时器的滚动处理程序,每100毫秒进行简单检查,看这段时间内用户是否滚动过。如果没有,则什么都不做;如果有,就进行处理。

用户体验优化小窍门

在图像加载完成时,使用淡入(fade in)效果出现。这在实际情况上会稍微慢一下,应该慢一个过渡执行时间。但用户体验上感觉会更快。这是已经被证实且普遍应用的小“trick”。但是据我感觉,它确实有效。我们的代码实现也采用了这个小窍门。不过类似这种“社会心理学”范畴的东西,显然不是本文研究的重点。

总结一下

代码上将会采用:超前阈值的懒加载+DOM Cache和图片Cache+滚动throttle模拟+CSS fadeIn动画。
具体功能封装上和一些实现层面的东西,请您继续阅读。

代码实现

DOM结构

整体结构如下:

1
2
3
4
5
<div class="exp-list-box" id="expListBox">
<ul class="exp-list" id="expList">
</ul>
<div class="ui-refresh-down"></div>
</div>

主体内容放在id为“expListBox”的container里面,id为“expList”的ul是页面加载内容的容器。
因为每次加载并append进入HTML的内容相对较多。我使用了模版来取代传统的字符串拼接。前端模版这次选用了我的同事颜海镜大神的开源作品,模版结构为:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
<#dataList.forEach(function (v) {#>
<div id="s-<#=v.eid#>" class="slide">
<li>
<a href="<#=v.href#>">
<img class="img" src="data:image/gif;base64,R0lGODdhAQABAPAAAP%2F%2F%2FwAAACwAAAAAAQABAEACAkQBADs%3D"
data-src="<#=v.src#>">
</img>
<strong><#=v.title#></strong>
<span class="writer"><#=v.writer#></span>
<span class="good-num"><#=v.succNum#></span>
</a>
</li>
</div>
<#})#>

以上模版内容由每次ajax请求到的数据填充,并添加进入页面,构成每个block-item。
这里需要注意观察,有助于对后面逻辑的理解。页面中一个block-item下div属性存有该block-item的eid值,对应class叫做”slide”,子孙节点包含有一个image标签,src初始赋值为1px的空白图进行占位。真实图片资源位置存储在”data-src”中。
另外,请求返回的数据dataList可以理解为由9个对象构成的数组,也就是说,每次请求加载9个block-item。

样式亮点

样式方面不是这篇文章的重点,挑选最核心的一行来说明一下:

1
2
3
4
5
6
7
8
9
10
11
.slide .img{
display: inline-block;
width: 90px;
height: 90px;
margin: 0 auto;
opacity: 0;
-webkit-transition: opacity 0.25s ease-in-out;
-moz-transition: opacity 0.25s ease-in-out;
-o-transition: opacity 0.25s ease-in-out;
transition: opacity 0.25s ease-in-out;
}

唯一需要注意的是image的opacity设置为0,图片将会在成功请求并渲染后调整为1,辅助transition属性实现一个fade in效果。
对应我们上面所提到的那个“trick”

逻辑部分

我是完全按照业务需求来设计,并没有做抽象。其实这样的一个下拉加载功能完全可以抽象出来。有兴趣的读者可以下去自己进行封装和抽象。
我们先把精力集中在逻辑处理上。
下面进入我们最核心的逻辑部分,为了防止全局污染,我把它放入了一个立即执行函数中:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
(function() {
var fetching = false;
var page = 1;
var slideCache = [];
var itemMap = {};
var lastScrollY = window.pageYOffset;
var scrollY = window.pageYOffset;
var innerHeight;
var topViewPort;
var bottomViewPort;
function isVisible (id) {
// ...判断元素是否在可见区域
}
function updateItemCache (node) {
// ....更新DOM缓存
}
function fetchContent () {
// ...ajax请求数据
}
function handleDefer () {
// ...懒加载实现
}
function handleScroll (e, force) {
// ...滚动处理程序
}
window.setTimeout(handleScroll, 100);
fetchContent();
}());

我认为好的编程习惯是在程序开头部分便声明所有的变量,防止“变量提升”带来的潜在困扰,并且也有利于程序的整体把控。
我们来看一下变量设置:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
// 加载中状态锁
1var fetching = false;
// 用于加载时发送请求参数,表示第几屏内容,初始为1,以后每请求一次,递增1
2var page = 1;
// 只缓存最新一次下拉数据生成的DOM节点,即需要插入的dom缓存数组
3var slideCache = [];
// 用于已经生成的DOM节点储存,存有item的offsetTop,offsetHeight
4) var slideMap = {};
// pageYOffset设置或返回当前页面相对于窗口显示区左上角的Y位置。
5var lastScrollY = window.pageYOffset; var scrollY = window.pageYOffset;
// 浏览器窗口的视口(viewport)高度
6var innerHeight;
// isVisible的上下阈值边界
7) var topViewPort;
8) var bottomViewPort;

关于DOM cache的变量详细说明,在后文有提供。

同样,我们有5个函数。在上面的代码中,注释已经写明白了每个方法的具体作用。接下来,我们逐个分析。

滚动处理程序handleScroll

它接受两个变量,第二个是一个布尔值force,表示是否强制触发滚动程序执行。

核心思路是:如果时间间隔100毫秒内,没有发生滚动,且并未强制触发,则do nothing,间隔100毫秒之后再次查询,然后直接return。
其中,是否发生滚动由lastScrollY === window.scrollY来判断。
在100毫秒之内发生滚动或者强制触发时,需要判断是否滚动已接近页面底部。如果是,则拉取数据,调用fetchContent方法,并调用懒加载方法handleDefer。
并且在这个处理程序中,我们计算出来了isVisible区域的上下阈值。我们使用600作为浮动区间,这么做的目的是在一定范围内提前加载图片,节省用户等待时间。当然,如果我们进行抽象时,可以把这个值进行参数化。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
function handleScroll (e, force) {
// 如果时间间隔内,没有发生滚动,且并未强制触发加载,则do nothing,再次间隔100毫秒之后查询
if (!force && lastScrollY === window.scrollY) {
window.setTimeout(handleScroll, 100);
return;
}
else {
// 更新文档滚动位置
lastScrollY = window.scrollY;
}
scrollY = window.scrollY;
// 浏览器窗口的视口(viewport)高度赋值
innerHeight = window.innerHeight;
// 计算isVisible上下阈值
topViewPort = scrollY - 1000;
bottomViewPort = scrollY + innerHeight + 600;
// 判断是否需要加载
// document.body.offsetHeight;返回当前网页高度
if (window.scrollY + innerHeight + 200 > document.body.offsetHeight) {
fetchContent();
}
// 实现懒加载
handleDefer();
window.setTimeout(handleScroll, 100);
}

拉取数据

这里我用到了自己封装的ajax接口方法,它基于zepto的ajax方法,只不过又手动采用了promise包装一层。实现比较简单,当然有兴趣可以找我要一下代码,这里不再详细说了。
我们使用前端模版进行HTML渲染,同时调用updateItemCache,将此次数据拉取生成的DOM节点缓存。之后手动触发handleScroll,更新文档滚动位置和懒加载处理。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
function fetchContent () {
// 设置加载状态锁
if (fetching) {
return;
}
else {
fetching = true;
}
ajax({
url: (!location.pathname.indexOf('/m/') ? '/m' : '')
+ '/list/asyn?page=' + page + (+new Date),
timeout: 300000,
dataType: 'json'
}).then(function (data) {
if (data.errno) {
return;
}
console.time('render');
var dataList = data.data.list;
var len = dataList.length;
var ulContainer = document.getElementById('expList');
var str = '';
var frag = document.createElement('div');
var tpl = __inline('content.tmpl');
for (var i = 0; i < len; i++) {
str = tpl({dataList: dataList});
}
frag.innerHTML = str;
ulContainer.appendChild(frag);
// 更新缓存
updateItemCache(frag);
// 已经拉去完毕,设置标识为true
fetching = false;
// 强制触发
handleScroll(null, true);
page++;
console.timeEnd('render');
}, function (xhr, type) {
console.log('Refresh:Ajax Error!');
});
}

缓存对象

之前参数里提到过,一共有两个用于缓存的对象/数组:

1)slideCache:缓存最近一次加载过的数据生成的DOM内容,缓存方式为数组储存:

1
2
3
4
5
6
7
8
9
slideCache = [
{
id: "s-97r45",
img: img DOM节点,
node: 父容器DOM node,类似<div id="s-<#=v.eid#>" class="slide"></div>,
src: 图片资源地址
},
...
]

slideCache由updateItemCache函数更新,主要用于懒加载时的赋值src。这样我们做到“只写入DOM”原则,不需要再从DOM读取。

2)slideMap:缓存DOM节点的高度和offsetTop,以DOM节点的id为索引。存储方式:

1
2
3
4
5
6
7
slideMap = {
s-97r45: {
node: DOM node,类似<div id="s-<#=v.eid#>" class="slide"></div>,
offTop: 300,
offsetHeight: 90
}
}

slideMap根据isVisible方法的参数进行更新和读取。使得我们在判断是否isVisible时,大量减少读取DOM的操作。

懒加载程序

在上面的滚动处理程序中,我们调用了handleDefer函数。我们看一下这个函数的实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
function handleDefer () {
// 时间记录
console.time('defer');
// 获取dom缓存
var list = slideCache;
// 对于遍历list里的每一项,都使用一个变量,而不是在循环内部声明。节省内存,把性能高效,做到极致。
var thisImg;
for (var i = 0, len = list.length; i < len; i++) {
thisImg = list[i].img; // 这里我们都是从内存中读取,而不用读取DOM节点
var deferSrc = list[i].src; // 这里我们都是从内存中读取,而不用读取DOM节点
// 判断元素是否可见
if (isVisible(list[i].id)) {
// 这个函数是图片onload逻辑
var handler = function () {
var node = thisImg;
var src = deferSrc;
// 创建一个闭包
return function () {
node.src = src;
node.style.opacity = 1;
}
}
var img = new Image();
img.onload = handler();
img.src = list[i].src;
}
}
console.timeEnd('defer');
}

主要思路就是对DOM缓存中的每一项进行循环遍历。在循环中,判断每一项是否已经进入isVisible区域。如果进入isVisible区域,则对当前项进行真实src赋值,并设置opacity为1。

更新拉取数据生成的DOM缓存

针对每一个slide类,我们缓存对应DOM节、id、子元素img DOM节点:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
function updateItemCache (node) {
var list = node.querySelectorAll('.slide');
var len = list.length;
slideCache = [];
var obj;
for (var i=0; i < len; i++) {
obj = {
node: list[i],
id: list[i].getAttribute('id'),
img: list[i].querySelector('.img')
}
obj.src = obj.img.getAttribute('data-src');
slideCache.push(obj);
};
}

是否在isVisible区域判断

该函数接受相应DOM id,并进行判断。
如果判断条件晦涩难懂的话,你一定要手动画画图理解一下。如果你就是懒得画图,那么也没关系,我帮你画好了,只是丑一些。。。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
function isVisible (id) {
var offTop;
var offsetHeight;
var data;
var node;
// 判断此元素是否已经懒加载正确渲染,分为在屏幕之上(已经懒加载完毕)和屏幕外,已经添加到dom中,但是还未请求图片(懒加载之前)
if (itemMap[id]) {
// 直接获取offTop,offsetHeight值
offTop = itemMap[id].offTop;
offsetHeight = itemMap[id].offsetHeight;
}
else {
// 设置该节点,并且设置节点属性:node,offTop,offsetHeight
node = document.getElementById(id);
// offsetHeight是自身元素的高度
offsetHeight = parseInt(node.offsetHeight);
// 元素的上外缘距离最近采用定位父元素内壁的距离
offTop = parseInt(node.offsetTop);
}
if (offTop + offsetHeight > topViewPort && offTop < bottomViewPort) {
return true;
}
else {
return false;
}
}

性能收益

如上代码,我们主要进行了两方面的性能考量:

1)延迟加载时间

2)渲染DOM时间

整体收益如下:

优化前延迟平均值:49.2ms 中间值:43ms;

优化后延迟平均值:17.1ms 中间值:11ms;

优化前渲染平均值:2129.6ms 中间值:2153.5ms;

优化后渲染平均值:120.5ms 中间值:86ms;

继续思考

做完这些,其实也远远没有达到所谓的“极致化”性能体验。我们无非就做了各种DOM缓存、映射、懒加载。如果继续分析edge case,我们还能做的更多,比如:DOM回收、墓碑和滚动锚定。这些其实很多都是借鉴客户端开发理念,但是超前的谷歌开发者团队也都有了自己的实现。比如在去年7月份的
一篇文章:Complexities of an Infinite Scroller就都有所提及。这里从原理(非代码)层面,也给大家做个介绍。

DOM回收

它的原理是,对于需要产生的大量DOM节点(比如我们下拉加载的信息内容)不是主动用createElement的方式创建,而是回收利用那些已经移出视窗,暂时不会被需要的DOM节点。如图:

虽然DOM节点本身并非耗能大户,但是也不是一点都不消耗性能,每一个节点都会增加一些额外的内存、布局、样式和绘制。同样需要注意的一点是,在一个较大的DOM中每一次重新布局或重新应用样式(在节点上增加或删除样式所触发的过程)的系统开销都会比较昂贵。所以进行DOM回收意味着我们会保持DOM节点在一个比较低的数量上,进而加快上面提到的这些处理过程。

据我观察,在真正产品线上使用这项技术的还比较少。可能是因为实现复杂度和收益比并不很高。但是,淘宝移动端检索页面实现了类似的思想。如下图,

每加载一次数据,就生成“.page-container .J-PageContainer_页数”的div,在滚动多屏之后,早已移除视窗的div的子节点进行了remove(),并且为了保证滚动条的正确比例和防止高度塌陷,显示声明了2956px的高度。

墓碑(Tombstones)

如之前所说,如果网络延迟较大,用户又飞快地滚动,很容易就把我们渲染的DOM节点都甩在千里之外。这样就会出现极差的用户体验。针对这种情况,我们就需要一个墓碑条目占位在对应位置。等到数据取到之后,再代替墓碑。墓碑也可以有一个独立的DOM元素池。并且也可以设计出一些漂亮的过渡。这种技术在国外的一些“引领技术潮流”的网站上,早已经有了应有。比如下图取自Facebook:

我在“简书”APP客户端上,也见过类似的方案。当然,人家是native…

滚动锚定

滚动锚定的触发时机有两个:一个是墓碑被替换时,另一个是窗口大小发生改变时(在设备发生翻转时也会发生)。这两种情况,都需要调整对应的滚动位置。

总结

当你想提供一个高性能的有良好用户体验的功能时,可能技术上一个简单的问题,就会演变成复杂问题的。这篇文章便是一个例证。
随着 “Progressive Web Apps” 逐渐成为移动设备的一等公民(会吗?),高性能的良好体验会变得越来越重要。
开发者也必须持续的研究使用一些模式来应对性能约束。这些设计的基础当然都是成熟的技术为根本。

这篇文章参考了Flicker工程师,前YAHOO工程师Stephen Woods的《Building Touch Interfaces with HTML5》一书。以及王芃前辈对于《Complexities of an Infinite Scroller》一文的部分翻译。