MySQL中的UUID的性能问题

2019-01-02 19:01:50

避免主键冲突可以有多种方法,其中UUID比较方便而已。


使用UUID

涉及分布式数据库间数据共享与同步的问题

以订单为例,假设有:中心A,中心B,中心C。。。服务器,各服务器均能独立产生订单。最终汇总到中心0服务器中。如果使用自增长主键就会在数据汇聚的时候产生冲突。


UUID可以很好地解决这个问题。


JAVA生成UUID


UUID.randomUUID().toString().replaceAll("-","");


UUID的性能问题

由于MySQL的InnoDB类型表在插入数据的时候进行了逐渐排序。因此对于随机UUID在数据量大的时候会出现性能下降的情况


性能损失如图:




数据来源MySQL InnoDB Primary Key Choise


提高MySQL中UUID查询性能的方法

很多文章中都提到了将UUID以binary形式存储可以显著提高性能。


如 storing-billions-uuid-fields-mysql-innodb


这篇博文就有详细性能对比:


UUID - CHAR(36)


INSERT PERFORMANCE

--------------------------------------------------------

total_rows           chunk_size           time_taken

100000               100000               1.87230491638

200000               100000               2.42642807961

300000               100000               3.65519285202

400000               100000               4.23701429367

500000               100000               4.88455510139

600000               100000               5.57620716095

700000               100000               7.50717425346

800000               100000               9.49350070953

900000               100000               10.1547751427

1000000              100000               12.0748021603

1100000              100000               12.277310133

1200000              100000               12.2819159031

1300000              100000               16.9854588509

1400000              100000               20.3873689175

1500000              100000               21.8642649651

1600000              100000               24.4224257469

1700000              100000               29.6857917309

1800000              100000               31.5416200161

1900000              100000               35.4671728611

2000000              100000               41.4726109505


SELECT PERFORMANCE

--------------------------------------------------------

total_rows           chunk_size           time_taken

100000               10000                0.165283203125

200000               10000                0.163378000259

300000               10000                0.162928104401

400000               10000                0.164531946182

500000               10000                0.170125961304

600000               10000                0.167329072952

700000               10000                0.166491746902

800000               10000                0.174521684647

900000               10000                0.167996168137

1000000              10000                0.171768426895

1100000              10000                0.171753883362

1200000              10000                0.170397043228

1300000              10000                0.175933599472

1400000              10000                0.188637733459

1500000              10000                0.205511808395

1600000              10000                0.764106750488

1700000              10000                0.584647893906

1800000              10000                0.814380884171

1900000              10000                0.549372911453

2000000              10000                0.635137557983



UUID - BINARY(16)


INSERT PERFORMANCE

--------------------------------------------------------

total_rows           chunk_size           time_taken

100000               100000               2.35787940025

200000               100000               1.5819132328

300000               100000               2.00737380981

400000               100000               2.36268806458

500000               100000               1.95024132729

600000               100000               2.52386879921

700000               100000               2.46662926674

800000               100000               3.63739991188

900000               100000               3.62550187111

1000000              100000               4.08164095879

1100000              100000               4.74432897568

1200000              100000               6.74240970612

1300000              100000               6.22160053253

1400000              100000               8.04201221466

1500000              100000               6.05508232117

1600000              100000               6.95644521713

1700000              100000               5.36873197556

1800000              100000               7.14802789688

1900000              100000               7.14896821976

2000000              100000               9.12283611298


SELECT PERFORMANCE

--------------------------------------------------------

total_rows           chunk_size           time_taken

100000               10000                0.0722301006317

200000               10000                0.0698809623718

300000               10000                0.0726082324982

400000               10000                0.0731747150421

500000               10000                0.0735011100769

600000               10000                0.0744516849518

700000               10000                0.0759541988373

800000               10000                0.0766224861145

900000               10000                0.0773425102234

1000000              10000                0.0773928165436

1100000              10000                0.0789988040924

1200000              10000                0.0786738395691

1300000              10000                0.077996969223

1400000              10000                0.0804636478424

1500000              10000                0.0809540748596

1600000              10000                0.0811409950256

1700000              10000                0.081680059433

1800000              10000                0.0814859867096

1900000              10000                0.0813221931458

2000000              10000                0.0838458538055


可以看出性能有了极大的提升。


JPA中的具体表实体设置

参考文章Hibernate和UUID标示符


该方法缺陷在于:主键数据在数据库管理工具中显示为乱码。



    @Id

    @Column(columnDefinition = "BINARY(16)")

    private UUID uuid;

  • 2017-09-05 11:48:16

    Laravel 服务容器实例教程 —— 深入理解控制反转(IoC)和依赖注入(DI)

    容器,字面上理解就是装东西的东西。常见的变量、对象属性等都可以算是容器。一个容器能够装什么,全部取决于你对该容器的定义。当然,有这样一种容器,它存放的不是文本、数值,而是对象、对象的描述(类、接口)或者是提供对象的回调,通过这种容器,我们得以实现许多高级的功能,其中最常提到的,就是 “解耦” 、“依赖注入(DI)”。本文就从这里开始。

  • 2017-09-11 09:22:09

    nginx配置返回文本或json

     有些时候请求某些接口的时候需要返回指定的文本字符串或者json字符串,如果逻辑非常简单或者干脆是固定的字符串,那么可以使用nginx快速实现,这样就不用编写程序响应请求了,可以减少服务器资源占用并且响应性能非常快

  • 2017-09-11 11:30:09

    linux 获取经过N层Nginx转发的访问来源真实IP

    通常情况下我们使用request.getRemoteAddr()就可以获取到客户端ip,但是当我们使用了nginx作为反向代理后,由于在客户端和web服务器之间增加了中间层,因此web服务器无法直接拿到客户端的ip,通过$remote_addr变量拿到的将是反向代理服务器的ip地址。如果我们想要在web端获得用户的真实ip,就必须在nginx这里作一个赋值操作,如下:

  • 2017-09-11 16:15:11

    Nginx日志管理

    通过访问日志,你可以得到用户地域来源、跳转来源、使用终端、某个URL访问量等相关信息;通过错误日志,你可以得到系统某个服务或server的性能瓶颈等。因此,将日志好好利用,你可以得到很多有价值的信息。

  • 2017-09-11 16:34:14

    Nginx如何保留真实IP和获取前端IP

    squid,varnish以及nginx等,在做反向代理的时候,因为要代替客户端去访问服务器,所以,当请求包经过反向代理后,在代理服务器这里这个IP数据包的IP包头做了修改,最终后端web服务器得到的数据包的头部的源IP地址是代理服务器的IP地址,这样一来,后端服务器的程序给予IP的统计功能就没有任何意义,所以在做代理或集群的时候必须解决这个问题,这里,我以nginx做集群或代理的时候如何给后端web服务器保留(确切的说是传递)客户端的真实IP地址。