序列化相关 | 淡定独行

2018-02-10 阅读

使用序列化类的私有方法巧妙解决部分属性持久化问题

业务场景

一个计税系统和人力资源系统（HR系统）通过RMI（Remote Method Invocation，远程方法调用）对接，计税系统需要从HR系统获得人员的姓名和基本工资，以作为纳税的依据，而HR系统的工资分为两部分：基本工资和绩效工资，基本工资没什么秘密，根据工作岗位和年限自己都可以计算出来，但绩效工资却是保密的，不能泄露到外系统

方案(1) transient关键字

在bonus前加上transient关键字,这是一个方法，但不是一个好方法，加上transient关键字就标志着Salary类失去了分布式部署的功能，它可是HR系统最核心的类了，一旦遭遇性能瓶颈，想再实现分布式部署就不可能了，此方案否定。

方案(2) 新增业务对象

增加一个Person4Tax类，完全为计税系统服务，就是说它只有两个属性：姓名和基本工资。符合开闭原则，而且对原系统也没有侵入性，只是增加了工作量而已。这是个方法，但不是最优方法。
方案(3) 请求端过滤
在计税系统获得Person对象后，过滤掉Salary的bonus属性，方案可行但不合规矩，因为HR系统中的Salary类安全性竟然让外系统（计税系统）来承担，设计严重失职。
方案(4) 变更传输契约
例如改用XML传输，或者重建一个Web Service服务。可以做，但成本太高。

优秀方案

实现了Serializable接口的类可以实现两个私有方法：writeObject和readObject，以影响和控制序列化和反序列化的过程。如下

    public class Salary implements Serializable {
        private static final long serialVersionUID = -2140234769839131214L;

        // 脚本工资
        private Double basePay;
        // 绩效工资
        private Double bonus;

        public Salary(Double basePay, Double bonus) {
            this.basePay = basePay;
            this.bonus = bonus;
        }
        // 省略 get set 方法
    }

    public class People implements Serializable {
        private static final long serialVersionUID = -2092465505451534820L;
        //姓名
        private String name;
        // 绩效
        private  Salary salary;

        public People(String name, Salary salary) {
            this.name = name;
            this.salary = salary;
        }

        //序列化委托方法
        private void writeObject(java.io.ObjectOutputStream out) throws IOException {
            out.defaultWriteObject();
            out.writeDouble(salary.getBasePay());
        }

        // 反序列化委托方法
        private void readObject(java.io.ObjectInputStream in) throws IOException,ClassNotFoundException {
            in.defaultReadObject();
            salary = new Salary(new Double(0),in.readDouble());
        }
    }

    public static void main(String[] args) {
        Salary salary = new Salary(new Double(4000),new Double(5000));
        People people = new People("zhangsan", salary);
        System.out.println(JSONObject.toJSONString(people));

        byte[] data = SerializationUtils.serialize(people);
        People result = (People)SerializationUtils.deserialize(data);
        System.out.println(JSONObject.toJSONString(result));
    }

打印结果
{“name”:”zhangsan”,”salary”:{“basePay”:4000.0,”bonus”:5000.0}}
{“name”:”zhangsan”,”salary”:{“basePay”:0.0,”bonus”:4000.0}}

使用序列化实现对象的拷贝

业务场景

如果一个项目中有大量的对象是通过拷贝生成的，那我们该如何处理？每个类都写一个clone方法，并且还要深拷贝？想想看这是何等巨大的工作量呀，是否有更好的方法呢？

其实，可以通过序列化方式来处理，在内存中通过字节流的拷贝来实现，也就是把母对象写到一个字节流中，再从字节流中将其读出来，这样就可以重建一个新对象了，该新对象与母对象之间不存在引用共享的问题，也就相当于深拷贝了一个新对象，代码如下：

public class CloneUtils {
    @SuppressWarnings("unchecked")
    public static  T clone(T obj) {
        T cloneObj = null;
        try {
            // 读取对象字节数据
            ByteArrayOutputStream bos = new ByteArrayOutputStream();
            ObjectOutputStream oos = new ObjectOutputStream(bos);
            oos.writeObject(obj);
            oos.close();
            // 分配内存   写入原始对象 生成新对象
            ByteArrayInputStream bis = new ByteArrayInputStream(bos.toByteArray());
            ObjectInputStream ois = new ObjectInputStream(bis);
            cloneObj= (T)ois.readObject();
            ois.close();
        } catch (Exception ex) {
            ex.printStackTrace();
        }
        return cloneObj;
    }
}

此工具类要求被拷贝的对象必须实现Serializable接口，否则是没办法拷贝的（当然，使用反射那是另外一种技巧）用此方法需要注意两点:

对象的内部属性都是可序列化的
如果有内部属性不可序列化，则会抛出序列化异常，这会让调试者很纳闷：生成一个对象怎么会出现序列化异常呢？从这一点来考虑，也需要把CloneUtils工具的异常进行细化处理。
注意方法和属性的特殊修饰符
比如final、static变量的序列化问题会被引入到对象拷贝中来（参考第1章），这点需要特别注意，同时transient变量（瞬态变量，不进行序列化的变量）也会影响到拷贝的效果。

当然，采用序列化方式拷贝时还有一个更简单的办法，即使用Apache下的commons工具包中的SerializationUtils类，直接使用更加简洁方便。

边界边界还是边界

    @Test
    public void 边界测试() {
        Integer intMaxNum= 2147483647;
        intMaxNum += 1;
        int limit = 10;
        // 超过边界  判断失效
        if(intMaxNum < limit) {
            System.out.println("数字"+intMaxNum+"小于" + limit);
        }
    }

输出结果
数字-2147483648小于10

莫让四舍五入亏了一方

四舍五入。四舍五入是一种近似精确的计算方法，在Java5之前，我们一般是通过使用Math.round来获得指定精度的整数或小数的，这种方法使用非常广泛，
代码如下：

    public static void main (String[] args) {
        System.out.println("10.5近似值：" + Math.round(10.5));
        System.out.println("-10.5近似值：" + Math.round(-10.5));

    }

输出结果
10.5近似值：11
-10.5近似值：-10

        这是四舍五入的经典案例，也是初级面试官很乐意选择的考题，绝对值相同的两个数字，近似值为什么就不同了呢？这是由Math.round采用的舍入规则所决定的（采用的是正无穷方向舍入规则，后面会讲解）。我们知道四舍五入是有误差的：其误差值是舍入位的一半。
我们以舍入运用最频繁的银行利息计算为例来阐述该问题。
        我们知道银行的盈利渠道主要是利息差，从储户手里收拢资金，然后放贷出去，其间的利息差额便是所获得的利润。对一个银行来说，对付给储户的利息的计算非常频繁，人民银行规定每个季度末月的20日为银行结息日，一年有4次的结息日。
        场景介绍完毕，我们回过头来看四舍五入，小于5的数字被舍去，大于等于5的数字进位后舍去，由于所有位上的数字都是自然计算出来的，按照概率计算可知，被舍入的数字均匀分布在0到9之间，下面以10笔存款利息计算作为模型，以银行家的身份来思考这个算法：

四舍。舍弃的数值：0.000、0.001、0.002、0.003、0.004，因为是舍弃的，对银行家来说，就不用付款给储户了，那每舍弃一个数字就会赚取相应的金额：0.000、0.001、0.002、0.003、0.004。
五入。进位的数值：0.005、0.006、0.007、0.008、0.009，因为是进位，对银行家来说，每进一位就会多付款给储户，也就是亏损了，那亏损部分就是其对应的10进制补数：0.005、0.004、0.003、0.002、0.001。

因为舍弃和进位的数字是在0到9之间均匀分布的，所以对于银行家来说，每10笔存款的利息因采用四舍五入而获得的盈利是：
0.000+0.001+0.002+0.003+0.004-0.005-0.004-0.003-0.002-0.001=-0.005 也就是说，每10笔的利息计算中就损失0.005元，即每笔利息计算损失0.0005元，这对一家有5千万储户的银行来说（对国内的银行来说，5千万是个很小的数字），每年仅仅因为四舍五入的误差而损失的金额是：

    public static void main (String[] args) {
        //银行账户数量，5千万
        int accountNum =5000*10000;
        //按照人行的规定，每个季度末月的20日为银行结息日
        double cost=0.0005*accountNum*4;
        System.out.println("银行每年损失的金额："+cost);
    }

输出结果
银行每年损失的金额：100000.0

即，每年因为一个算法误差就损失了10万元，事实上以上的假设条件都是非常保守的，实际情况可能损失得更多。那各位可能要说了，银行还要放贷呀，放出去这笔计算误差不就抵消掉了吗？不会抵销，银行的贷款数量是非常有限的，其数量级根本没有办法和存款相比。
这个算法误差是由美国银行家发现的（那可是私人银行，钱是自己的，白白损失了可不行），并且对此提出了一个修正算法，叫做银行家舍入（Banker’s Round）的近似算法，其规则如下：

舍去位的数值小于5时，直接舍去；
舍去位的数值大于等于6时，进位后舍去；
当舍去位的数值等于5时，分两种情况：5后面还有其他数字（非0），则进位后舍去；若5后面是0（即5是最后一个数字），则根据5前一位数的奇偶性来判断是否需要进位，奇数进位，偶数舍去。

以上规则汇总成一句话：

四舍六入五考虑，五后非零就进一，五后为零看奇偶，五前为偶应舍去，五前为奇要进一。

我们举例说明，取2位精度：

round(10.5551)=10.56
round(10.555)=10.56
round(10.545)=10.54

要在Java5以上的版本中使用银行家的舍入法则非常简单，直接使用RoundingMode类提供的Round模式即可，示例代码如下：

    public static void main (String[] args) {
        //存款
        BigDecimal d=new BigDecimal(888888);
        //月利率，乘3计算季利率
        BigDecimal r=new BigDecimal(0.001875*3);
        //计算利息
        BigDecimal i=d.multiply(r).setScale(2,RoundingMode.HALF_EVEN);
        System.out.println("季利息是："+i);
    }

输出结果
季利息是：4999.99

在上面的例子中，我们使用了BigDecimal类，并且采用setScale方法设置了精度，同时传递了一个RoundingMode.HALF_EVEN参数表示使用银行家舍入法则进行近似计算，BigDecimal和RoundingMode是一个绝配，想要采用什么舍入模式使用RoundingMode设置即可。目前Java支持以下七种舍入方式：

ROUND_UP：远离零方向舍入。
向远离0的方向舍入，也就是说，向绝对值最大的方向舍入，只要舍弃位非0即进位。
ROUND_DOWN：趋向零方向舍入。
向0方向靠拢，也就是说，向绝对值最小的方向输入，注意：所有的位都舍弃，不存在进位情况。
ROUND_CEILING：向正无穷方向舍入。
向正最大方向靠拢，如果是正数，舍入行为类似于ROUND_UP；如果为负数，则舍入行为类似于ROUND_DOWN。注意：Math.round方法使用的即为此模式。
ROUND_FLOOR：向负无穷方向舍入。
向负无穷方向靠拢，如果是正数，则舍入行为类似于ROUND_DOWN；如果是负数，则舍入行为类似于ROUND_UP。
HALF_UP：最近数字舍入（5进）。
这就是我们最最经典的四舍五入模式。
HALF_DOWN：最近数字舍入（5舍）。
在四舍五入中，5是进位的，而在HALF_DOWN中却是舍弃不进位。
HALF_EVEN：银行家算法。
在普通的项目中舍入模式不会有太多影响，可以直接使用Math.round方法，但在大量与货币数字交互的项目中，一定要选择好近似的计算模式，尽量减少因算法不同而造成的损失。