序列化相关

使用序列化类的私有方法巧妙解决部分属性持久化问题

业务场景

一个计税系统和人力资源系统(HR系统)通过RMI(Remote Method Invocation,远程方法调用)对接,计税系统需要从HR系统获得人员的姓名和基本工资,以作为纳税的依据,而HR系统的工资分为两部分:基本工资和绩效工资,基本工资没什么秘密,根据工作岗位和年限自己都可以计算出来,但绩效工资却是保密的,不能泄露到外系统

方案(1) transient关键字

  • 在bonus前加上transient关键字,这是一个方法,但不是一个好方法,加上transient关键字就标志着Salary类失去了分布式部署的功能,它可是HR系统最核心的类了,一旦遭遇性能瓶颈,想再实现分布式部署就不可能了,此方案否定

方案(2) 新增业务对象

  • 增加一个Person4Tax类,完全为计税系统服务,就是说它只有两个属性:姓名和基本工资。符合开闭原则,而且对原系统也没有侵入性,只是增加了工作量而已。这是个方法,但不是最优方法

    方案(3) 请求端过滤

  • 在计税系统获得Person对象后,过滤掉Salary的bonus属性,方案可行但不合规矩,因为HR系统中的Salary类安全性竟然让外系统(计税系统)来承担,设计严重失职

    方案(4) 变更传输契约

  • 例如改用XML传输,或者重建一个Web Service服务。可以做,但成本太高

优秀方案

  • 实现了Serializable接口的类可以实现两个私有方法:writeObject和readObject,以影响和控制序列化和反序列化的过程。 如下
    public class Salary implements Serializable {
        private static final long serialVersionUID = -2140234769839131214L;

        // 脚本工资
        private Double basePay;
        // 绩效工资
        private Double bonus;

        public Salary(Double basePay, Double bonus) {
            this.basePay = basePay;
            this.bonus = bonus;
        }
        // 省略 get set 方法
    }
    public class People implements Serializable {
        private static final long serialVersionUID = -2092465505451534820L;
        //姓名
        private String name;
        // 绩效
        private  Salary salary;

        public People(String name, Salary salary) {
            this.name = name;
            this.salary = salary;
        }

        //序列化委托方法
        private void writeObject(java.io.ObjectOutputStream out) throws IOException {
            out.defaultWriteObject();
            out.writeDouble(salary.getBasePay());
        }

        // 反序列化委托方法
        private void readObject(java.io.ObjectInputStream in) throws IOException,ClassNotFoundException {
            in.defaultReadObject();
            salary = new Salary(new Double(0),in.readDouble());
        }
    }
    public static void main(String[] args) {
        Salary salary = new Salary(new Double(4000),new Double(5000));
        People people = new People("zhangsan", salary);
        System.out.println(JSONObject.toJSONString(people));

        byte[] data = SerializationUtils.serialize(people);
        People result = (People)SerializationUtils.deserialize(data);
        System.out.println(JSONObject.toJSONString(result));
    }

打印结果
{“name”:”zhangsan”,”salary”:{“basePay”:4000.0,”bonus”:5000.0}}
{“name”:”zhangsan”,”salary”:{“basePay”:0.0,”bonus”:4000.0}}

使用序列化实现对象的拷贝

业务场景

如果一个项目中有大量的对象是通过拷贝生成的,那我们该如何处理?每个类都写一个clone方法,并且还要深拷贝?想想看这是何等巨大的工作量呀,是否有更好的方法呢?

  • 其实,可以通过序列化方式来处理,在内存中通过字节流的拷贝来实现,也就是把母对象写到一个字节流中,再从字节流中将其读出来,这样就可以重建一个新对象了,该新对象与母对象之间不存在引用共享的问题,也就相当于深拷贝了一个新对象,代码如下:
public class CloneUtils {
    @SuppressWarnings("unchecked")
    public static  T clone(T obj) {
        T cloneObj = null;
        try {
            // 读取对象字节数据
            ByteArrayOutputStream bos = new ByteArrayOutputStream();
            ObjectOutputStream oos = new ObjectOutputStream(bos);
            oos.writeObject(obj);
            oos.close();
            // 分配内存   写入原始对象 生成新对象
            ByteArrayInputStream bis = new ByteArrayInputStream(bos.toByteArray());
            ObjectInputStream ois = new ObjectInputStream(bis);
            cloneObj= (T)ois.readObject();
            ois.close();
        } catch (Exception ex) {
            ex.printStackTrace();
        }
        return cloneObj;
    }
}

此工具类要求被拷贝的对象必须实现Serializable接口,否则是没办法拷贝的(当然,使用反射那是另外一种技巧) 用此方法需要注意两点:

  • 对象的内部属性都是可序列化的
    如果有内部属性不可序列化,则会抛出序列化异常,这会让调试者很纳闷:生成一个对象怎么会出现序列化异常呢?从这一点来考虑,也需要把CloneUtils工具的异常进行细化处理。
  • 注意方法和属性的特殊修饰符
    比如final、static变量的序列化问题会被引入到对象拷贝中来(参考第1章),这点需要特别注意,同时transient变量(瞬态变量,不进行序列化的变量)也会影响到拷贝的效果。

当然,采用序列化方式拷贝时还有一个更简单的办法,即使用Apache下的commons工具包中的SerializationUtils类,直接使用更加简洁方便。

边界 边界 还是边界

    @Test
    public void 边界测试() {
        Integer intMaxNum= 2147483647;
        intMaxNum += 1;
        int limit = 10;
        // 超过边界  判断失效
        if(intMaxNum < limit) {
            System.out.println("数字"+intMaxNum+"小于" + limit);
        }
    }

输出结果
数字-2147483648小于10

莫让四舍五入亏了一方

四舍五入。四舍五入是一种近似精确的计算方法,在Java5之前,我们一般是通过使用Math.round来获得指定精度的整数或小数的,这种方法使用非常广泛,
代码如下:

    public static void main (String[] args) {
        System.out.println("10.5近似值:" + Math.round(10.5));
        System.out.println("-10.5近似值:" + Math.round(-10.5));

    }

输出结果
10.5近似值:11
-10.5近似值:-10

        这是四舍五入的经典案例,也是初级面试官很乐意选择的考题,绝对值相同的两个数字,近似值为什么就不同了呢?这是由Math.round采用的舍入规则所决定的(采用的是正无穷方向舍入规则,后面会讲解)。我们知道四舍五入是有误差的:其误差值是舍入位的一半。
我们以舍入运用最频繁的银行利息计算为例来阐述该问题。
        我们知道银行的盈利渠道主要是利息差,从储户手里收拢资金,然后放贷出去,其间的利息差额便是所获得的利润。对一个银行来说,对付给储户的利息的计算非常频繁,人民银行规定每个季度末月的20日为银行结息日,一年有4次的结息日。
        场景介绍完毕,我们回过头来看四舍五入,小于5的数字被舍去,大于等于5的数字进位后舍去,由于所有位上的数字都是自然计算出来的,按照概率计算可知,被舍入的数字均匀分布在0到9之间,下面以10笔存款利息计算作为模型,以银行家的身份来思考这个算法:

  • 四舍。舍弃的数值:0.000、0.001、0.002、0.003、0.004,因为是舍弃的,对银行家来说,就不用付款给储户了,那每舍弃一个数字就会赚取相应的金额:0.000、0.001、0.002、0.003、0.004。
  • 五入。进位的数值:0.005、0.006、0.007、0.008、0.009,因为是进位,对银行家来说,每进一位就会多付款给储户,也就是亏损了,那亏损部分就是其对应的10进制补数:0.005、0.004、0.003、0.002、0.001。

        因为舍弃和进位的数字是在0到9之间均匀分布的,所以对于银行家来说,每10笔存款的利息因采用四舍五入而获得的盈利是:
0.000+0.001+0.002+0.003+0.004-0.005-0.004-0.003-0.002-0.001=-0.005 也就是说,每10笔的利息计算中就损失0.005元,即每笔利息计算损失0.0005元,这对一家有5千万储户的银行来说(对国内的银行来说,5千万是个很小的数字),每年仅仅因为四舍五入的误差而损失的金额是:

    public static void main (String[] args) {
        //银行账户数量,5千万
        int accountNum =5000*10000;
        //按照人行的规定,每个季度末月的20日为银行结息日
        double cost=0.0005*accountNum*4;
        System.out.println("银行每年损失的金额:"+cost);
    }

输出结果
银行每年损失的金额:100000.0

    即,每年因为一个算法误差就损失了10万元,事实上以上的假设条件都是非常保守的,实际情况可能损失得更多。那各位可能要说了,银行还要放贷呀,放出去这笔计算误差不就抵消掉了吗?不会抵销,银行的贷款数量是非常有限的,其数量级根本没有办法和存款相比。
这个算法误差是由美国银行家发现的(那可是私人银行,钱是自己的,白白损失了可不行),并且对此提出了一个修正算法,叫做银行家舍入(Banker’s Round)的近似算法,其规则如下:

  • 舍去位的数值小于5时,直接舍去;
  • 舍去位的数值大于等于6时,进位后舍去;
  • 当舍去位的数值等于5时,分两种情况:5后面还有其他数字(非0),则进位后舍去;若5后面是0(即5是最后一个数字),则根据5前一位数的奇偶性来判断是否需要进位,奇数进位,偶数舍去。

以上规则汇总成一句话:

四舍六入五考虑,五后非零就进一,五后为零看奇偶,五前为偶应舍去,五前为奇要进一。

我们举例说明,取2位精度:

round(10.5551)=10.56
round(10.555)=10.56
round(10.545)=10.54

要在Java5以上的版本中使用银行家的舍入法则非常简单,直接使用RoundingMode类提供的Round模式即可,示例代码如下:

    public static void main (String[] args) {
        //存款
        BigDecimal d=new BigDecimal(888888);
        //月利率,乘3计算季利率
        BigDecimal r=new BigDecimal(0.001875*3);
        //计算利息
        BigDecimal i=d.multiply(r).setScale(2,RoundingMode.HALF_EVEN);
        System.out.println("季利息是:"+i);
    }

输出结果
季利息是:4999.99

在上面的例子中,我们使用了BigDecimal类,并且采用setScale方法设置了精度,同时传递了一个RoundingMode.HALF_EVEN参数表示使用银行家舍入法则进行近似计算,BigDecimal和RoundingMode是一个绝配,想要采用什么舍入模式使用RoundingMode设置即可。目前Java支持以下七种舍入方式:

  • ROUND_UP:远离零方向舍入。
    向远离0的方向舍入,也就是说,向绝对值最大的方向舍入,只要舍弃位非0即进位。
  • ROUND_DOWN:趋向零方向舍入。
    向0方向靠拢,也就是说,向绝对值最小的方向输入,注意:所有的位都舍弃,不存在进位情况。
  • ROUND_CEILING:向正无穷方向舍入。
    向正最大方向靠拢,如果是正数,舍入行为类似于ROUND_UP;如果为负数,则舍入行为类似于ROUND_DOWN。注意:Math.round方法使用的即为此模式。
  • ROUND_FLOOR:向负无穷方向舍入。
    向负无穷方向靠拢,如果是正数,则舍入行为类似于ROUND_DOWN;如果是负数,则舍入行为类似于ROUND_UP。
  • HALF_UP:最近数字舍入(5进)。
    这就是我们最最经典的四舍五入模式。
  • HALF_DOWN:最近数字舍入(5舍)。
    在四舍五入中,5是进位的,而在HALF_DOWN中却是舍弃不进位。
  • HALF_EVEN:银行家算法。
    在普通的项目中舍入模式不会有太多影响,可以直接使用Math.round方法,但在大量与货币数字交互的项目中,一定要选择好近似的计算模式,尽量减少因算法不同而造成的损失。

转载请注明: 淡定独行 序列化相关

上一篇
Java 8 中的 Streams API 详解 Java 8 中的 Streams API 详解
为什么需要 StreamStream 作为 Java 8 的一大亮点,它与 java.io 包里的 InputStream 和 OutputStream是完全不同的概念。它也不同于 StAX 对 XML 解析的 Stream,也不是 Ama
2018-02-12 xhlcode
本篇
序列化相关 序列化相关
使用序列化类的私有方法巧妙解决部分属性持久化问题 业务场景 一个计税系统和人力资源系统(HR系统)通过RMI(Remote Method Invocation,远程方法调用)对接,计税系统需要从HR系统获得人员的姓名和基本工资,以作为纳税
2018-02-10 xhlcode