String Primitive和String Object

网上看到下面这段代码,很有意思。

1
2
3
4
5
6
7
String.prototype.cut = function (len) {
  return this.length > len ? this.substring(0, len) + '...' : this;
};

var obj = ["Superman", "Batman", "Iron Man"];
console.log(typeof obj[1].cut(6));
console.log(obj[1].cut(6));

这段代码很简单,判断字符串的长度,如果大于给定长度(L)输出,输出字符串前L位加上“…”,否则输出字符串本身。

那么,上面的代码是不是和我们期待的一样输出下面的内容呢?

1
2
"String"
"Batman"

答案是否定的,实际的输出其实是:

1
2
"object"
<String Object>

这其实是因为String对象(String Object)和String基本类型(String Primitive)的不同导致的。字符串在JavaScript中有两种存在形式:

1
2
new String('object');// String Object
'primitive';// String Primitive

String的所有实用方法其实都是在String对象的prototype上,String基本类型是没有这些方法的。

因此当执行'primitive'.slice(0)时,JavaScript会自动将基本类型包装成对应的对象,调用对象上的方法,完成之后自动将对象销毁。因此,最上面的cut函数中this其实已经不是String Primitive而是String Object,当我们直接返回this时,返回值其实是”Batman”的String Object,所以typeof返回object

所以,这个cut函数正确写法应该用String转换函数将Object转为Primitive。

1
2
3
String.prototype.cut = function (len) {
  return this.length > len ? this.substring(0, len) + '...' : String(this);
};

Javascript中对空string调用split返回不是空数组

今天在工作中发现一个诡异的问题,理论上应该是没有元素的数组,长度居然是1。查了半天,原来是Javascript中的split和其他语言中不同,即对空string使用split会返回含有一个空string的数组,而不是一个空数组。

1
2
3
4
5
6
var str = "",
    arr = str.split("_");
 
console.log(arr.length === 1); //true
console.log(arr === []); //false
console.log(arr === [""]); //true

参考MDN,也有类似的说明。

Note: When the string is empty, split returns an array containing one empty string, rather than an empty array.

[翻译] JavaScript Scoping and Hoisting

原文链接:JavaScript Scoping and Hoisting

你知道下面的JavaScript代码执行后会alert出什么值吗?

1
2
3
4
5
6
7
8
var foo = 1;
function bar() {
    if (!foo) {
      var foo = 10;
    }
    alert(foo);
}
bar();

如果答案是"10"令你感到惊讶的话,那么下面这个会让你更加困惑:

1
2
3
4
5
6
7
8
var a = 1;
function b() {
    a = 10;
    return;
    function a() {}
}
b();
alert(a);

浏览器会alert“1”。那么,到底是怎么了?尽管这看起来有点奇怪、有点危险又有点令人困惑,但这事实上却是这门语言一个强力的具有表现力的特性。我不知道是不是有个标准来定义这种行为,但是我喜欢用”hoisting”来描述。这篇文章试着去解释这种机制,但是首先,让我们对JavaScript的scoping做一些必要的了解。

Scoping in JavaScript

对于JavaScript新手来说scoping是最令人困惑的部分之一。事实上,不仅仅是新手,我遇到或很多有经验的JavaScript程序员也不能完全理解scoping。JavaScript的scoping如此复杂的原因是它看上去非常像C系语言的成员。请看下面的C程序:

1
2
3
4
5
6
7
8
9
10
#include <stdio.h>
int main() {
    int x = 1;
    printf("%d, ", x); // 1
    if (1) {
        int x = 2;
        printf("%d, ", x); // 2
    }
    printf("%d\n", x); // 1
}

这段程序的输出是1,2,1。这是因为在C系语言有块级作用域(block-level scope),当进入到一个块时,就像if语句,在这个块级作用域中会声明新的变量,这些变量不会影响到外部作用域。但是JavaScript却不是这样。在Firebug中试试下面的代码:

1
2
3
4
5
6
7
var x = 1;
console.log(x); // 1
if (true) {
    var x = 2;
    console.log(x); // 2
}
console.log(x);// 2

在这段代码中,Firebug显示1,2,2。这是因为JavaScript是函数级作用域(function-level scope)。这和C系语言是完全不同的。块,就像if语句,并不会创建一个新的作用域。只有函数才会创建新的作用域。

对于大部分熟悉C,C++,C#或是Java的程序员来说,这是意料之外并且不被待见的。幸运的是,因为JavaScript函数的灵活性,对于这个问题我们有一个解决方案。如果你必须在函数中创建一个临时的作用域,请像下面这样做:

1
2
3
4
5
6
7
8
9
10
function foo() {
    var x = 1;
    if (x) {
        (function () {
            var x = 2;
            // some other code
        }());
    }
    // x is still 1.
}

这种方面确实非常灵活,它使用在任何需要创建一个临时作用域的地方,不仅仅是某个块中。但是,我强烈建议你花点时间好好理解下JavaScript scoping。它实在是非常强力,而且它也是我最喜欢的语言特性之一。如果你很好的理解了scoping,理解hoisting将会更加容易。

Declarations, Names, and Hoisting

在JavaScript中,一个作用域(scope)中的名称(name)有以下四种:

  1. 语言自身定义(Language-defined): 所有的作用域默认都会包含this和arguments。
  2. 函数形参(Formal parameters): 函数有名字的形参会进入到函数体的作用域中。
  3. 函数声明(Function decalrations): 通过function foo() {}的形式。
  4. 变量声明(Variable declarations): 通过var foo;的形式。

函数声明和变量声明总是被JavaScript解释器隐式地提升(hoist)到包含他们的作用域的最顶端。很明显的,语言自身定义和函数形参已经处于作用域顶端。这就像下面的代码:

1
2
3
4
function foo() {
    bar();
    var x = 1;
}

实际上被解释成像下面那样:

1
2
3
4
5
function foo() {
    var x;
    bar();
    x = 1;
}

结果是不管声明是否被执行都没有影响。下面的两段代码是等价的:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
function foo() {
    if (false) {
        var x = 1;
    }
    return;
    var y = 1;
}
function foo() {
    var x, y;
    if (false) {
        x = 1;
    }
    return;
    y = 1;
}

注意到声明的赋值部分并没有被提升(hoist)。只有声明的名称被提升了。这和函数声明不同,函数声明中,整个函数体也都会被提升。但是请记住,声明一个函数一般来说有两种方式。考虑下面的JavaScript代码:

1
2
3
4
5
6
7
8
9
10
11
function test() {
    foo(); // TypeError "foo is not a function"
    bar(); // "this will run!"
    var foo = function () { // 函数表达式被赋值给变量'foo'
        alert("this won't run!");
    }
    function bar() { // 名为'bar'的函数声明
        alert("this will run!");
    }
}
test();

在这里,只有函数声明的方式会连函数体一起提升,而函数表达式中只会提升名称,函数体只有在执行到赋值语句时才会被赋值。

以上就包括了所有关于提升(hoisting)的基础,看起来并没有那么复杂或是令人困惑对吧。但是,这是JavaScript,在某些特殊情况下,总会有那么一点复杂。

Name Resolution Order

需要记住的最最重要的特例就是名称解析顺序(name resolution order)。记住一个名称进入一个作用域一共有四种方式。我上面列出的顺序就是他们解析的顺序。总的来说,如果一个名称已经被定义了,他绝不会被另一个拥有不用属性的同名名称覆盖。这就意味着,函数声明比变量声明具有更高的优先级。但是这却不意味着对这个名称的赋值无效,仅仅是声明的部分会被忽略而已。但是有下面几个例外:

内置的名称arguments的行为有些怪异。他似乎是在形参之后,函数声明之前被声明。这就意味着名为arguments的形参会比内置的arguments具有更高的优先级,即使这个形参是undefined。这是一个不好的特性,不要使用arguments作为形参。 任何地方试图使用this作为一个标识都会引起语法错误,这是一个好的特性。 如果有多个同名形参,那位于列表最后的形参拥有最高的优先级,即使它是undefined。

Name Function Expressions

你可以在函数表达式中给函数定义名称,就像函数声明的语句一样。但这并不会使它成为一个函数声明,并且这个名称也不会被引入到作用域中,而且,函数体也不会被提升(hoist)。这里有一些代码可以说明我说的是什么意思:

1
2
3
4
5
6
7
8
9
10
11
12
13
foo(); // TypeError "foo is not a function"
bar(); // valid
baz(); // TypeError "baz is not a function"
spam(); // ReferenceError "spam is not defined"

var foo = function () {}; // 匿名函数表达式('foo'被提升)
function bar() {}; // 函数声明('bar'和函数体被提升)
var baz = function spam() {}; // 命名函数表达式(只有'baz'被提升)

foo(); // valid
bar(); // valid
baz(); // valid
spam(); // ReferenceError "spam is not defined"

How to Code With This Knowledge

现在你明白了作用域和提升,那么这对编写JavaScript代码意味着什么呢?最重要的一条是声明变量时总是使用var语句。我强烈的建议你在每个作用域中都只在最顶端使用一个var。如果你强制自己这么做,你永远也不会被提升相关的问题困扰。尽管这么做会使的跟踪当前作用域实际声明了哪些变量变得更加困难。我建议在JSLint使用onevar选项。如果你做了所有前面的建议,你的代码看起来会是下面这样:

1
2
3
4
5
6
/*jslint onevar: true [...] */
function foo(a, b, c) {
    var x = 1,
        bar,
        baz = "something";
}

What the Standard Says

我发现直接参考ECMAScript Standard (pdf)来理解这些东西是如何运作的总是很有用。下面是关于变量声明和作用域的一段摘录(section 12.2.2):

If the variable statement occurs inside a FunctionDeclaration, the variables are defined with function-local scope in that function, as described in section 10.1.3. Otherwise, they are defined with global scope (that is, they are created as members of the global object, as described in section 10.1.3) using property attributes { DontDelete }. Variables are created when the execution scope is entered. A Block does not define a new execution scope. Only Program and FunctionDeclaration produce a new scope. Variables are initialised to undefined when created. A variable with an Initialiser is assigned the value of its AssignmentExpression when the VariableStatement is executed, not when the variable is created.

我希望这篇文章能够给JavaScript程序员最容易困惑的部分一些启示。我尽力写的全面,以免引起更多的困惑。如果我写错了或是漏掉了某些重要的东西,请一定让我知道。

JavaScript中的"this"

JavaScript有自己的一套this机制,在不同情况下,this的指向也不尽相同。

全局范围

1
console.log(this); //全局变量

全局范围使用this指向的是全局变量,浏览器环境下就是window。

注:ECMAScript5的strict模式不存在全局变量,这里的this是undefined。

函数调用中

1
2
3
4
5
function foo() {
    console.log(this);
}

foo(); //全局变量

函数调用中的this也指向全局变量。

注:ECMAScript5的strict模式不存在全局变量,这里的this是undefined。

对象方法调用

1
2
3
4
5
6
7
var test = {
    foo: function () {
        console.log(this);
    }
}

test.foo(); //test对象

对象方法调用中,this指向调用者。

1
2
3
4
5
6
7
8
var test = {
    foo: function () {
        console.log(this);
    }
}

var test2 = test.foo;
test2();  //全局变量

不过由于this的晚绑定特性,在上例的情况中this将指向全局变量,相当于直接调用函数。

这点非常重要,同样的代码段,只有在运行时才能确定this指向

构造函数

1
2
3
4
5
6
function Foo() {
    console.log(this);
}

new Foo(); //新创建的对象
console.log(foo); 

在构造函数内部,this指向新创建的对象。

显式设置this

1
2
3
4
5
6
7
8
function foo(a, b) {
    console.log(this);
}

var bar = {};

foo.apply(bar, [1, 2]); //bar
foo.call(1, 2); //Number对象

使用Function.prototype的call或者apply方法是,函数内部this会被设置为传入的第一个参数。